HiTZ zentroak hizkuntza txikiagoentzat txatbotak egiteko modu barria deskubridu dau
2025-06-18 13:01 Euskerea berbagaiEuskerazko txatbotak egiteko modu barria da.

ChatGPT lako txatboten erabilerea eten barik handitzen doa eta lanbide askotan ezinbesteko tresna bihurtu dira. Hareen gaitasunak zabaldu eta hobetzen dabiz, besteak beste, testuak laburtu, edozein gairi buruzko galderak erantzun, programau, dokumentuak sortu edo dokumentu osoak hizkuntza batetik bestera itzuli. Hizkuntza nagusietan errendimendu parekoa daben bitartean, euskerea lako hizkuntza txikiagoetara joakeran kalidadea ez da hain ona izaten, hizkuntza horreetarako dagozan testu masak hain ugariak ez diralako. Adibidez, Internet edegian dagoan dokumentu kopuruari jagokonean, ingelesez euskeraz baino 1000 aldiz dokumentu gehiago dagoz, eta gaztelaniaz euskeraz baino 100 aldiz gehiago. Zientzialarion artean galdera edegia izaten jarraitzen dau ia posible dan holako testu masa urriagaz ingelesaren pareko emoitza onak lortzea. Eneko Agirre EHUko HiTZ ikerketa zentroko zuzendariaren ustez, lan barri honegaz aurrerapen handia egin da galdera horren baiezko erantzunaren bidean, baina oraindino ezezaguna izaten jarraitzen dau.
Kontuak kontu, HiTZ zentroak orain urtebete inguru publikau eban euskerazko hizkuntza-eredu edegia egiteko metodoa eta artikulu onenaren saria irabazi eban arlo honetako kongresu entzutetsuenean. Latxa izeneko hizkuntza-ereduen familia, kodeagaz batera, libre itxi zituan, enpresa eta erakunde interesatuak erabiliteko euren garapenetan. Laborategian egindako ebaluazino estandarizatuetan orduko ChatGPTren pareko ezagutzea ebala erakutsi eben euskeraz eginez eta euskerearen ezagutzeari buruzko frogetan hobeto ebilela be. Latxa garatzen dauen lantalde zabalaren kide Oscar Sainzek dinoanez, euskerea lako hizkuntza batentzako lehen aldia izan zan holako kalidadea lortzen, azken finean milaka miloe euro dituen erraldoi teknologikoakaz lehiatzen ibili ginan eredu edegietann oinarrituta.
Naiara Pérez be garatzaileetako bat da eta kontau dauenez, orain urtebete eregitako Latxak gaitasun asko zituan, baina ez zan kapaz alkarrizketak eukiteko, ezta ataza konkretuak egiteko aginduak jarraitzeko. Hau da, galdera bat egitean, nahiz eta erantzuteko aina ezagutza jakin, ez zan konturatzen erantzuna sortu behar ebala. Gauza bera laburpenak egiteko aginduak edo beste edozein agindu emon ezkero. Modu berean, testu toxikoak edo desegokiak sortzen zituan, ez baitzeban ezelako filtrorik holakoak ez egiteko.
Edozelan be, HiTZeko kideek alkarrizketak eukiteko kapaz dan euskerazko txatbotak egiteko modua badago, antza. Artikulu zientifikoa errebisinopean dago eta onarpenaren zain dagoan bitartean eskuragarri itxi dabe. Abiapuntua Meta enpresako ikerkuntza zentroak eregitako hizkuntza-eredu edegi eleaniztuna da, Llama izenekoa. Eredu libreen artean ahaltsuenetakoa izanda be euskeraz trakets dabil eta helburua euskeraz dabilen txatbota eregitea da.
Erantzun
Erantzuteko, izena emanda egon behar duzu. Sartu komunitatera!