Lexikoaren Behatokia eguneratu dabe

Bizkaie! 2021-04-16 13:42   Euskerea berbagai

Ia ehun miloe testu-berba daukaz dagoeneko.

XXI. mendeko euskerearen corpus zabal eta eguneratua osotzea da Lexikoaren Behatokiaren asmoa, horretarako material ugaritako testuak aztertuz: egunkarietako albisteak, aldizkarietako erreportajeak, literaturako lanak, hezkuntzako eta administrazino materiala... Pixkanaka Lexikoaren Behatokiaren edukia handitzen doa, eta, dagoeneko, 98 miloe testu-berba pasautxu batzen ditu.

Euskaltzaindiak azaldu dauenez, Lexikoaren Behatokiaren azkenengo eguneratzea eskuragarri dago erabiltzaile guztientzat. Batetik, corpusa modu automatikoan lematizauta dago, hizkuntzearen gaur egungo erabilerea hurretik segitzeko. Bestetik, bilaketak errazteko hainbat tresna eskaintzen ditu: bilkaeta arrunta, aurreratua, konparazinozkoa eta gidatua.

Gaur egun, corpusak ezinbestekoak dira ikerkuntzan. Hiztegia aztertzeko eta arauak emoteko lana be era honetako corpusetan oinarritu behar da, Euskaltzaindiaren azken urteotako jardunak erakusten dauenez. Testu klasikoak Orotariko Euskal Hiztegiaren (OEH) corpusean ditu batuta; XX. mendeko lagin adierazgarria, ostera, XX. Mendeko Corpus Estatistikoan. 

XXI. mendeko beharrei erantzuteko, baina, Lexikoaren Behatokia jarri eban martxan Euskaltzaindiak 2008an, hizkuntzearen gaur egungo bilakaerea hurretik jarraitzeko. Berba eta adierazmolde barriak ezagutzeko eta arauak zenbateraino beteten diran jakiteko tresna aproposa da.

Orain egindako eguneratzeari esker, ehun miloe testu-berba izatetik hur geratu da Lexikoaren Behatokia. Kontuan izan behar da 2009ko lehenengo bersinoan 4 miloe inguru zirala. 

Amaitzen ez dan lana da Lexikoaren Behatokiarena, eta, beraz, eguneratze gehiago etorriko dira aurrerago. Euskaltzaindiaren amesa ereduzko corpus handi, orekatu, lematizatu, etiketatu eta anozino linguistikoduna izatea da.

Lexikoaren Behatokiaren proiektuan, Euskaltzaindiaren laguntzaile dira ondorengo honeek: EHUko Informatika Fakuldadeko IXA taldea, Elhuyar Fundazinoa eta UZEI. Corpusa elikatzen daben testuak eskuratzeko, barriz, Akademiak hitzarmenak sinatu ditu hainbat argitaratzailegaz.

Erantzun

Erantzuteko, izena emanda egon behar duzu. Sartu komunitatera!

»» Alta eman edo pasahitza berreskuratu