Google Researchek Eneko Agirre irakaslea saritu dau

Bizkaie! 2016-03-18 12:54   Kulturea

Eneko Agirre EHUko Informatika Fakultadeko Lengoaia eta Sistema Informatikoak Saileko irakasleak 50.000 dolar jasoko ditu Learning Interlingual Representations of Words and Concepts ikerketarako, berben eta on-line kontzeptuen hizkuntza arteko esanahia aztertzeko.

Eneko Agirrek, UPV/EHUko Informatika Fakultadeko Lengoaia eta Sistema Informatikoak Saileko irakasleak eta IXA ikertaldeko kideak, Googlek urtero emoten dituan ikerketa sarietako bat jaso dau (Google Research Awards). Agirre irakasleak, azterlana egiteko, Aitor Soroa irakaslearen, Oier López de la Calle ikertzailearen eta Josu Goikoetxea doktorego ikaslearen laguntzinoaa izan dau.

Googlek 10 sari emon ditu hizkuntza prozesamenduaren alorrean. Beraz, Agirrek ez eze, saria eroan dabe, besteak beste, Harvardeko, Berkeleyko, Edinburgoko eta Washingtoneko unibersidadeetako ikertzaileek be. Danetara, Googlek 151 proposamen saritu ditu (informatikearen 18 esparrutako 950 hautagaien artetik), 55 herrialdetako 350 unibersidadek bialdutakoak. Eneko Agirre irakasleak 50.000 dolar jasoko ditu Learning Interlingual Representations of Words and Concepts ikerketarako, berben eta on-line kontzeptuen hizkuntza arteko esanahia aztertzeko.

Gaur egun, itzulpen automatikoen edo sareko bilaketa motorren arazoa berben literaltasuna da; hau da, aplikazinoak berbaz berba itzultzen edo bilatzen dau berbea, esanahiari erreparau barik. Alabaina, Googlek saritutako lanari esker, leitekeana da hori nabarmen hobetzea.

Eneko Agirrek azaldu dauenez, ikerketa honen helburua berben esanahia irudikatzea da; hau da, jakitea bi berben esanahiak noiz dagozan lotuta hizkuntza batean edo hizkuntza desbardinetan. Hiztegi bat eskuetan euki eta zein berbek daben esanahi antzekoa eta zeinek ez jakitea bezela litzateke. Kasurako, bide emongo leuskigu jakiteko 'banku' berbearen esanahia 'aurrezki kutxa' eta 'aulki' berben antzekoa dala, zer esan nahi dan, baina 'astelehen' edo 'katu' berbenaren desbardina. Azken batean, guk berba baten esanahi desbardinak irudikatzen doguz, eta bereiztu geinkez 'banku' berbearen zentzu batek 'aurrezki kutxa'-gaz eta besteak 'aulki'-gaz dauela zerikusia, baina ez alderantziz. Ganera, gure proposamena gai da hainbat hizkuntzatako berben esanahiak espazio bakar batean irudikatzeko; horri esker, jakin ahal izango dogu 'banku' berbearen zentzu bat ingeleseko 'bank' berbearen eta euskerazko 'kutxa' berbearen antzekoa dala, eta beste zentzua 'chair' eta 'aulki' berben antzekoa, baina bi zentzu horreetako bat be ez dala 'astelehen', 'Monday', 'katu' edo 'cat' berben antzekoa.

Prozesua gauzatzeko, irudikapen hori ikasi behar da agiri pilo batean oinarrituta, adimen artifizialaren metodo matematikoak erabiliz. Irudikapena ikasitakoan, sistemeak datu basean begiratzen dau ia zein beste berben antzekoa dan guk bilatu edo itzuli nahi dogun berbea. Eta, esanahiaren arabera, berba hori daben dokumentuak erakusten ditu, nahiz eta zehatz ez izan idatzi dogun berba berbera.

Horrezaz gan, metodo hau edozein hizkuntzatan ezarri daiteke. Dana dala, ikerketan hiru hizkuntza hartu dira ardatz: gaztelania, euskerea eta ingelesa. Guk darabilgun aplikazino informatikoa erabat automatikoa da, eta, horri esker, erabilten dogun edozein hizkuntzatarako irudikapenak ikasi leikez.

Metodo mueta horreei eusten deutseen metodoak dira Eneko Agirrek UPV/EHUko Donostiako Informatika Fakultadeko Language Analysis and Processing masterrean emoten dauen ikastaroaren oinarria.

Erantzun

Erantzuteko, izena emanda egon behar duzu. Sartu komunitatera!

»» Alta eman edo pasahitza berreskuratu


Twitter ikonoa Facebook ikonoa