Zientzia eta teknologiaren corpusa interneten

Bizkaie! 2006-12-12 01:00

Elhuyar Fundazinoak eta Euskal Herriko Unibersidadeko (EHU) IXA taldeak zientzia eta teknologiaren arloko euskerea ikertzeko hizkuntza-baliabide bat garatu dabe: Zientzia eta Teknologiaren Corpusa. Corpusa, www.ztcorpusa.net webgunean dago eta eguenean, abenduak 14, aurkeztuko da Elhuyar Fundazinoaren egoitzan.

Elhuyar Fundazinoak eta Euskal Herriko Unibersidadeko (EHU) IXA taldeak zientzia eta teknologiaren arloko euskerea ikertzeko hizkuntza-baliabide bat garatu dabe: Zientzia eta Teknologiaren Corpusa. Euskerazko lehenengo corpus berezi edo espezializatua da, Elhuyar Fundazioko iturriek jakinarazo dabenez.

Corpusa osotzeko, 1990-2002 bitartean argitaratuko zientzia eta teknologia arloko obrak hartu dira kontuan. Corpus egituratua eta linguistika arloan etiketatua da, modu automatikoan prozesauta. Zortzi miloe berba ditu, horreetatik 1,6 miloe eskuz berrikusita eta zuzenduta. Corpusa, www.ztcorpusa.net webgunean dago eta eguenean, abenduak 14, aurkeztuko da Elhuyar Fundazinoaren egoitzan, Usurbilen, 18:30etatik aurrera. Bertan, EHUko Euskara erretoreorde Ludger Mees, Elhuyar Fundazinoko zuzendari nagusi Itziar Nogeras, Elhuyar Fundazinoko Antton Gurrutxaga, EHUko IXA taldeko kide Xabier Artola eta Elhuyar Fundazinoko Igor Leturia izango dira.

Corpusa kontsultetako interfaze bat antolatu da eta erabiltzaileak era askotako bilaketa bakunak eta konplejuak egiteko aukerea izango dau, horretarako parametro-multzo zabala erabilita: lemea, testu-formea, kategoria, eremua, generoa, corpus-atala (eskuz zuzendua/corpus osoa).

Emoitzak bi muetatakoak izan daitekez: batetik, bilagaiaren testuinguru laburrak (KWIC) eta testuinguru sakonak; eta, bestetik, informazino kuantitatiboa, taula eta grafikoetan emondakoa (maiztasunak, agerkidetzak, eremu edo generoaren araberako banaketa).

www.ztcorpusa.net webgunean kontsultagai egoteaz gan, 2007tik aurrera ELDAren (Hizkuntza Baliabideen Ebaluazino eta Banaketarako Agentzia Europarra) baliabideen artean egongo da, ustiapen komertzialerako eskuragarri, lizentzia bidez.

Zientzia eta Teknologiaren Corpusa proiektua Hizking21 ikerketa estrategikoko proiektuaren barruan hasi zan egiten.

Erantzun

Erantzuteko, izena emanda egon behar duzu. Sartu komunitatera!

»» Alta eman edo pasahitza berreskuratu