Opentrad-ek 'Consumer' aldizkariaren eta EiTB24-ren corpusak erabiliko ditu itzulpen automatikoa hobetzeko

Bizkaie! 2007-03-20 01:00   Euskerea berbagai

Estadu espainiarreko hizkuntza ofizialen artean (gaztelania, katalana, galegoa eta euskerea) kode edegiko itzulpen automatikorako sistema bat aurkeztu eban joan dan urtean Opentrad partzuergoak (www.opentrad.org), eta orain, barriz, Eroski Fundazinoagaz eta EiTBnet-egaz alkarlana iragarri dau, sistemea hobetzeko ahaleginean.

Estadu espainiarreko hizkuntza ofizialen artean (gaztelania, katalana, galegoa eta euskerea) kode edegiko itzulpen automatikorako sistema bat aurkeztu eban joan dan urtean Opentrad partzuergoak (www.opentrad.org), eta orain, barriz, Eroski Fundazinoagaz eta EiTBnet-egaz alkarlana iragarri dau, sistemea hobetzeko ahaleginean.

Alkarlanaren harian, Eroskik 'Consumer' aldizkariaren corpusa eta EiTBnet-ek EiTB24 webgunearen corpusak Opentrad partzuergoaren esku itxi ditue, itzulpen automatikoan egin beharreko ikerketa-proiektuetan erabil daizan.

Elhuyar Fundazinoko iturriek jakinarazo dabenez, helburua da corpus horreen informazinoa erabiltea Opentrad-en bidez egiten diran itzulpenen kalidadea hobetzeko eta itzulpen automatikoaren estaldurea areagotzeko, batez be, gaztelaniatik euskerakoena.

Transferentzia sintaktikoa dago Opentraden oinarrian, eta Estadu espainiarreko hizkuntzen arteko kode edegiko itzultzaile bakarra da. Gaztelania, katalana, galego eta euskerazko testuak edo dokumentuak itzultzen ditu, baita web-orrien edukia be.

Galego-gaztelania hizkuntza-parean bi noranzkoak (galegotik gaztelaniara eta gaztelaniatik galegora) kontuan hartzen dituan itzultzaile bakarra da. Itzulpenen kalidadea, barriz, %95,2ra heltzen da. Gaztelania-katalana parean, % 96,2ra heltzen da kalidadea.

Gaztelania-euskarazko pareari jagokonez, itzultzaile bakarra da. Halan da be, azken hori prototipo-mailako tresnea baino ez da eta, oraindino ez dau itzulpen komertzialak egiteko kalidaderik bermatzen. 'Consumer' eta EiTB24 corpusak itzultzaile horren emoitzak hobetzeko erabiliko dira.

Eten barik hobetzen ari dan sistemea da Opentrad. Proiektua garatu dabenek sistemea hobetzen jarraitzen dabe, zenbait I+G proiekturen bidez. Hizkuntza gehiago sartzeko prozesuan dabilz orain (gaztelania-frantsesa eta gaztelania-portugesa garatuz, eta gaztelania-euskera, -katalana eta -galegoaren kalidadea hobetuz).


Opentrad partzuergoa

Hiru enpresa eta lau unibersidadek osotzen dabe Opentrad partzuergoa: Euskal Herritik, Eleka Ingeniaritza Linguistikoa S.L. (www.eleka.net), Elhuyar Fundazinoa (www.elhuyar.org) eta Euskal Herriko Unibersidadeko IXA Taldea dagoz (www.ehu.es); Galiziatik, Imaxin Software (www.imaxin.com) enpresea eta Vigoko Unibersidadea (www.universidadevigo.com); Kataluniatik, UPC (www.upc.es) eta, Valentziatik, Alacanteko Unibersidadea (http://www.ua.es/).

Erantzun

Erantzuteko, izena emanda egon behar duzu. Sartu komunitatera!

»» Alta eman edo pasahitza berreskuratu