Euskerazko testuen corpusik handiena aurkeztu dau Euskara Institutuak

Dabi Piedra 2016-05-06 14:27   Euskerea berbagai

EHUren Euskara Institutuak eta Eusko Jaurlaritzeak daukien hitzarmenaren emoitzea dira Egungo Testuen Corpusa (ETC) eta Hizkuntzen Arteko Corpusa (HAC). Lehenengoa, euskerazko corpusik zabalena da, 270 miloe berba jasoten ditu. Bigarrenak, euskerazko testuetako berbak, gaztelaniazko, frantsesezko eta ingelesezko baliokideakaz erakusten ditu.

EHUren Euskara Institutuak eta Eusko Jaurlaritzeak daukien hitzarmenaren emoitzea dira Egungo Testuen Corpusa (ETC) eta Hizkuntzen Arteko Corpusa (HAC). Lehenengoa, euskerazko corpusik zabalena da, 270 miloe berba jasoten ditu. Bigarrenak, euskerazko testuetako berbak, gaztelaniazko, frantsesezko eta ingelesezko baliokideakaz erakusten ditu.

Egungo Testuen Corpusak badaukaz berezitasun batzuk, Pello Salaburu Euskara Institutuko zuzendariak azaldu dauenez. Batetik, testu aukeratuetako berbak baino ez dituela sartu. Testu txukunak baino ez doguz erabili nahi izan eta horregaitik egin dogu aukeraketa bat, dino Salaburuk.

Bestetik, 21. mendeko testuak batzen dira eta urte bakotxeko idatzi kopurua oso orekatua da, ia ez dago gorabeherarik urte batetik bestera. Mende honetan argitaratutako komunikabide, liburu eta abarretatik hartu ditue testuak, jatorrizkoak zein itzulpenak. Guztira, 270 miloe berba dagoz corpusean konsultagai. Euskeraz ez da egon horren corpus handirik orain arte.

Lan handia egin dogu, erabiltzaileari bilaketea errazteko, azaldu dau Salaburuk. Erderaz dagozan beste corpus batzuen aldean, ETCk interfaze errazagoa dauka. Ganera, aukera ugari emoten ditu bilaketetan.

Hizkuntzen Arteko Corpusa txikiagoa da, berba kopuruari jagokonez, baina informazino ugari dakar itzultzaile, irakasle, idazle eta abarrentzat aproposa, Salaburuk zehaztu dauenez. Izan be, testu baliokideak lau hizkuntzatan sartu ditue eta, holan, berba bakotxa hizkuntza bakotxean zelan erabili dan konparau leiteke. Frantsesezko, ingelesezko eta gaztelaniazko itzulpenak sartu ditue, euskerazkoakaz batera.

Hizkuntza batetik bestera, bersinoen artean dagozan aldeak ikusteko balio dau, dino Salaburuk, itzultzaileek egiten dituen aukerak garbi ikusten dira. HAC handitzeko asmoa daukiela aurreratu dau Euskara Institutuko zuzendariak.

Corpusakaz batera, ordenagailu eta eskuko telefonoetarako aplikazino bi aurkeztu ditue: Euskerazko aditz trinkoak erakusten dituana eta edozein berbak daukazan deklinazino marka guztiak batzen dituena. Biek be, modu erraz eta arin baten, papelean dozenaka orri hartuko leukean informazinoa jasoten dabe.

Patxi Baztarrika Jaurlaritzako Hizkuntza Politikako sailburuordeak azpimarratu dauenez, euskera bizia lortzeko, hizkuntzearen beraren garapena be beharrezkoa da. Era honetako corpusek euskereari indarra emoten deutsiela dino: Euskereak arlo askotako erabiltzaileak ditu eta horreen lana hobetzen laguntzeko, tresna egokiak behar dira.

Jaurlaritzak 2008an sinatu eban hitzarmena Euskara Institutuagaz. Harrezkero, alkarlan horrek fruitu asko emon dituala dino Baztarrikak, tartean corpusak. Urtero 28.000 euro emoten deutsoz Jaurlaritzeak Euskara Institutuari eta jasotako emoitzeagaz konforme dagoala nabarmendu dau sailburordeak. Alkarlanean segiduko dogu, euskaldunontzat oso errentagarria dalako.

ETC konsultagai, doban, hemen.

HAC konsultagai, doban, hemen.

Erantzun

Erantzuteko, izena emanda egon behar duzu. Sartu komunitatera!

»» Alta eman edo pasahitza berreskuratu