astekaria 2019/10/04
arrowItzuli

bizigiro

Gailuekin solasean

Iker Tubia

Gailuekin solasean

Deitu etxera». «Itzali wifia». «Piztu argiak». «Esnatu nazazu goizeko zazpietan». Agindu horiek, eta beste asko egin dakizkioke zenbait gailuri: autoan, etxean, lantokian... Azken hamarkadan asko aurreratu da ahozkotasuna teknologia berrietan, eta jende askoren eskura dago jadanik. Adituek azaldu dutenez, oraindik ere asko garatuko da, eta hor hiztun gutxiago dituzten hizkuntzek beste erronka bat izanen dute hiztun gehien dituztenek irentsi ez ditzaten.

«Ahotsa da komunikatzeko erarik naturalena; horregatik, hasieratik ikusi zen ahotsa erabiltzea interesgarria zela». Ibon Saratxaga EHUko irakaslea da, eta Aholab taldeko langilea. «Gaur egun, teknologia horiek maila dezentea dute; gizakion ulermen gaitasunetik nahiko hurbil daude, nahiz eta oraindik erronkak badauden». Zehatzago azaldurik: hitz egitean, ezagutza mailan, normalki, 100 hitzetatik 95 baino gehiago asmatzen ditu gizakiak. Gaur egun, sistema automatikoak maila horretan daudela esan du Aholabeko kideak. Aspaldikoa zen nahia, baina azken hamarkadan erdietsi dira ahozkotasunari lotutako aurrerapenak.

Ahotsa interfaze gisa erabiltzea «arazo korapilatsua» izan da. 1940tik aurrera serio heldu zioten gaiari, baina garai hartako baliabideekin eta teoriekin ezin izan zuten ahotsa erabili. «Azkenengo hamarkadan aurrerapen handiak egon dira: teknologikoak —prozesamendu eta konputazio ahalmena handia behar izan da—eta teorikoak. Gaur egun ikusten diren interfazeak oinarrituak daude sare neuronalen erabileran. Sare neuronalen erabilera zaharragoa bada ere, orain gutxi arte ezin izan zaio ahotsari aplikatu, kalkulu potentzia handia behar zelako».

Azken urteetako «eztanda» aipatu du Josu Waliño Puntueus fundazioko zuzendariak. «Paradigma aldaketa batetik dator gaia. Hizkuntzaren prozesamendu naturalaz edo hizkuntza teknologiez hitz egiten genuen orain arte, eta, azken urteetan, adimen artifizialaz hitz egiten hasi gara. Itzulpen automatikoez hitz egiten hasi, eta laguntzaile birtualez hitz egiten ari gara orain, eta hor ahotsa sartzen da ezinbestean». Ahots aginduak eman, eta erantzunak ere hitzez aditzen dira. «Gaur egun, ingurune digitalean bizi gara, eta, hor, komunikazio bidea beste bat izan behar da: ahotsa, sentsoreak... baina ez teklatu bat».

Ahotsaren aferak baditu zenbait arlo. Batetik, ASR hizketa ezagutza dago: hitz egindakotik testu bat ateratzea litzateke hori. Beste arlo bat litzateke hizkuntza naturalaren prozesaketa: konputagailuak asmatu behar du zer esan nahi duen solasean ari den pertsonak. Interfazeak normalki elkarrizketa moduan erabiltzen dira, eta, normalki, ahots bidez erantzuten du. Horretarako, ahots sintesia dago, testua ahots bihurtzen duena. Alegia: ahotsetik testura pasatu, testuko hizkuntza prozesatu eta ulertu, elkarrizketa kudeatu, eta erantzuna testutik ahotsera pasatu egiten da.

Hizkuntzaren muga

Teknologia horiek asko garatu dira autoetan eta domotikan. Gidatzean ezin da gailu elektronikorik erabili, errepideari begiratu behar zaiolako. Horregatik egin dute ahotsaren aldeko apustua alor horretan. Asier Iturralde Iametzako garatzaile eta Librezale elkarteko kideak adibide bat aipatu du: «Nire lankide batek autoa bulego gisa erabiltzen du. Ahots bidez eskatzen dio nori deitu, eta, askotan, bidaiak aprobetxatzen ditu telefono deiak egiteko». Hala ere, oztopo bat badago: hizkuntzarena. Izan ere, gailu horiek gaztelaniaz eta frantsesez hitz egiteko diseinaturik egoten dira. «Izenak esatean, adibidez, euskal fonetika ez dute ongi harrapatzen».

Teknologia horiek garatzen dituzten enpresa handiek, normalean, ez diote erreparatzen hiztun gutxi dituzten hizkuntzei. Google, Amazon, Apple eta antzekoek interes handia dute, eta inbertsio handiak egiten ari dira ahozko teknologian. «Haientzat, euskara bigarren edo hirugarren mailako hizkuntza da», ohartarazi du Saratxagak. Lehenbizi, hiztun kopururik handienak dituzten hizkuntzetan garatzen dituzte beren teknologiak. Gero, batzuetan, bi milioi eta milioi bat artean dituztenetan.

«Betiko erronka» da, Waliñoren aburuz. «Gure seme-alabek badute gailu bat, eta gaztelaniaz egin behar zaio. Erronka bikoitza dugu: lehenik, teknologikoki horra ailegatzea, eta, bigarrenik, multinazional horien esku dauden gailuetan sartzea. Euskararen garapena nahi badugu, ezin diogu horri uko egin». Horrelako gailuak geroz eta zabalduago daudela gogorarazi du Waliñok, eta geroz eta eremu gehiagotan erabiliko dela ahotsa gailu teknologikoekin aritzeko. Horregatik uste du garrantzitsua dela erronkari heltzea: «Egunerokoan euskaraz bizi nahi badugu, gailu horiekin ere euskaraz bizi beharko gara». Bide horretan, erakunde publikoek badute zer eginik, Aholabeko kidearen ustez. «Katalunian, adibidez, asko inbertitu izan dute».

Euskaraz grabatzen

Aholaben euskaraz ikertzen dute, eta erronka horren jakitun dira. «Teknologia hauetan sartzea da gure helbururik garrantzitsuenetakoa». Teknika horiek ikasi egin behar izaten dute: adibideak behar dituzte. Horretarako, grabazioak behar dira, eta euskaraz ez dago hainbeste materialik. «Ingelesez milaka ordu daude grabaturik Interneten; euskaraz, arazo bat dago horrekin». Hain zuzen ere, lagin horiek biltzen ari dira Common Voice proiektuan. Helburua, ahozko teknologiak edozein hizkuntzatan garatzea da, baita euskaraz ere, noski. Apirilean heldu zioten erronkari: 10.000 ordu grabatzea. Oraingoz, 93 ordu dituzte grabaturik, eta 596 ahots.

Bultzatzaileetako bat Iturralde da: «Gutxienez 2.000 ordu behar ditugu, eta egokiena 10.000 ordu grabatzea litzateke». Mozilla izanen da ahotsa testu bihurtzeko softwarea garatuko duena, eta jabego publikoa izanen du. «Lizentziarengatik, edozeinek erabili ahal izango ditu: ikerketarako, unibertsitatean, tresna berriak garatzeko, daudenak hobetzeko...». Beraz, gehien zabalduta dauden gailuen egileek ere aukera izanen lukete grabazio horiek erabili eta beren teknologiak euskaraz ere garatzeko. Grabaketetan parte hartu nahi duenak https://voice.mozilla.org/eu helbidean parte har dezake.

Ahozko hizkeraz arituta, ezin dira ahantzi erregistro ezberdinak, tartean, euskalkiak. Gailuek euskalkiak ulertzea zailagoa litzateke, grabaketa asko behar direlako. Aholabeko esperientzia kontatu du Saratxagak: «Euskalkiek trataera espezifikoa beharko lukete; beraz, beste urrats bat litzateke. Oraingoz, nahikoa dugu batuarekin. Guk, sintetizadore arrunta Hegoaldean erabiltzen den euskara batuan dugu, eta badaukagu Iparrahotsa ere, nafar-lapurteraz. Zubererazko eta bizkaierazko sintetizadorerik ez daukagu oraingoz».

Kezka bat ere agertu du Iturraldek gailu horiekin. «Smart diren gailuak benetan adimendunak direla uste da, baina askotan pertsonek ere entzuten dituzte elkarrizketa horiek, akatsak konpontzeko». Batzuetan, nahi gabe aktibatzen dira, eta, azken boladan jakin denez, solasaldi pribatuak grabatu izan dira. «Zerbitzua hobetzeko dela esaten dute, baina atea irekitzen zaio espioitzari edo pribatutasun galerari». Horri aurre egiteko alternatibak behar direla uste du. Hori litzateke Common Voice. «Audioak ez ditu zerbitzarira bidaliko; beraz, gailuan bertan aztertuko du. Hor arrisku bat kentzen duzu». Irailetik aurrera enpresa handiek esan dute pribatutasuna mantentzeko neurriak hartuko dituztela, baina Iturraldek uste du arriskuak jarraituko duela grabazioak zerbitzarietara ailegatzen zaizkien bitartean.

Ahotsa informazio iturri

Ahozko laguntzaileena ez da ahozko teknologiaren munduan egin den aurrerapen bakarra izan, noski. Adibidez, esataria ezagutzeko teknikak garatu dira. «Bankuarekin telefonoz hitz egitean, transferentzia bat egin behar baduzu, interesgarria litzateke jakitea zu zarela eta ez beste inor», azaldu du Saratxagak. «Segurtasunaren eta biometriaren munduan garatuko dira teknologia batzuk». Bestalde, Aholaben, lan asko egiten dute ahots arazoak dituzten lagunekin. Ahoskatzeko arazoak edo ahotsean arazoak dituztenentzat lagungarriak izan daitezke makinak.

Itzulpen automatikoa da «puri-purian» dagoen beste gai bat Aholabeko kideak azaldu duenez. Norbaitek hitz egin ahala, berak esandakoa beste hizkuntza batetara itzultzea, eta, itzulitakoa sintetizatu ahots bidez jasotzeko. «Ahal bada, norberaren ahotsarekin». Aholaben, itzulpenean ez, baina ahots sintetikoak pertsona bati moldatzen lan egiten dute. Badute ahots banku bat, eta egin liteke sintetizadore pertsonalizatu bat ere. «Aholaben webgunean, Zure TTS deitutako orrialdean, 100 esaldi grabatuta zure ahots sintetizadorea lor dezakezu».

Informazio gehiago ere jaso liteke. Gailuek emozioak detektatzen ikastea interesgarria izan daiteke, erabiltzailea makina batekin hitz egiten jartzen baduzu. Ez hori bakarrik, gaixotasun batzuk ere hauteman litezke. «Informazio asko ateratzen da ahotsetik», azaldu du Saratxagak.

Ahotsaren ulermena dezente garatu da, baina oraindik badago garatzeko bidea. «Oraintxe, adimen artifiziala garatu behar da: ahotsa ulertzea eta sortzea nahiko ondo eginda dago. Orain, behar da konputagailuak ulertzea nola hitz egiten dugun eta zer esan nahi dugun». Harremana egiteko, esandakoa ez ezik, esan nahi dena ere ulertzea litzateke. Hor ikusten du erronka Saratxagak. Solasaldi oso baterako, adimena behar baita, oraindik.

BERRIAn argitaratua (2019/09/30)


Informazio gehiago berria.eus-en

Izan zaitez berrialaguna


HASIERA