• BERRIKUNTZA
  • Euskarazko hizkuntza teknologia propioa posible al da?

Euskarazko hizkuntza teknologia propioa posible al da?

Euskarabilduaren gogoeta gunean hausnartu denez, euskarak adimen artifizialaren eta hizkuntza teknologien aroan aurrera egingo badu, ezinbestekoak izango dira ikerkuntza, elkarlana eta datuen burujabetza

Argazkia: Euskarabildua
Argazkia: Euskarabildua
Garazi Etxaniz Idarreta
EnpresaBIDEAko kazetaria
2025eko azaroaren 5a - 05:30

Euskarabilduaren aurtengo edizioak galdera zehatz bat jarri du mahai gainean: “Euskarazko hizkuntza teknologia propioa posible al da?”. Gogoeta horri helduta, adimen artifizialaren eta hizkuntza-teknologien etorkizunaz aritu dira Eli Pombo (Iametzako kudeatzaile orokorra) dinamizatzaile lanetan, Elixabete Garcia (Eusko Jaurlaritzako eraldaketa digitaleko zuzendaria) eta Aitor Soroa (EHUko Hitz Katedrako zuzendaria). Azken urteotan bizitako teknologiaren garapen azkarrak hizkuntzen trataeran ireki dituen aukerak eta arriskuak izan dituzte hizpide, bereziki, eredu komertzial handien mendekotasunak euskararentzat dakartzan mugak aztertuta.

 

Egia da, egia denez gero, ChatGPT eta Gemini bezalako eredu handiak euskaraz erabiltzeko aukera daogela, eta hori gauza txarra ez izanagatik, “euskararen garapena ezin da guztiz enpresa handien esku utzi”, azaldu du Soroak, eta zenbait arrazoi eman ditu hori argudiatzeko. Batetik, eredu handiek ez dutelako euskararen kalitatea bermatzen, eta, are gehiago, adituek ikertu dute azken bertsioek (GPT 5 eta Clauden azken bertsioak, kasu) euskaraz zertxobait okerrago egiten dutela aurreko bertsioek baino. Bestetik, hizkuntzaz harago joanda, euskal kultura ere ez dute horren ondo ezagutzen eta tribial formatuko galderak eginez gero emaitza kaskarrak ematen dituzte. “Eredu bat entrenatzean munduaren ikuspuntu espezifiko bat eta printzipio etiko batzuk erakusten zaizkio; irakasten diona nor den, emaitzak bestelakoak Izango dira”, dio Soroak.

Aritz Soroa (EHU): "Ingelesa edo gaztelania bezain ondo egiten duen eredua nahi badugu, ikerkuntza ezinbestekoa da”

Kontuan hartu beharreko arrisku asko dakartza, hortaz, modelo jeneralista horiek erabiltzeak. Hori dela eta, Garciak garrantzia berezia ematen dio “gure teknologia propio, etiko eta legalak” eraikitzeari, euskara babesteko ez ezik, Europako eraldaketa digitaleko trantsizioan euskararen lehiakortasuna bermatzeko ere.

 
Elixabete Garcia Eusko Jaurlaritzako Eraldaketa Digitaleko zuzendaria
Elixabete Garcia Eusko Jaurlaritzako Eraldaketa Digitaleko zuzendaria | Argazkia: Euskarabildua

Hizkuntza txikia izanik lehiakorrak izatea ez da, ordea, ahuntzaren gauerdiko eztula: estrategia bat behar da. Soroak argi du: “Ingelesa edo gaztelania bezain ondo egiten duen eredua nahi badugu, ikerkuntza ezinbestekoa da”. Izan ere, gaur egun erabiltzen diren teknikak baliagarriak dira baliabide asko dituzten hizkuntzentzako, baina ezin dira euskarara aplikatu, eta, ondorioz, beste modelo batzuk behar dira. “Ez dago datu nahikorik euskarazko eredu bat zerotik hasteko; horregatik, ditugun besteen baliabideak moldatu behar ditugu gure hizkuntzara egoki daitezen, jarraian gure modeloak libre uzteko, ahalik eta irekien, eta, hala beste aplikazio batzuk sor daitezen”, argitu du. Hitz zentroak sortutako Latxa adimen artifiziala jarri du adibide gisa, zeina Llama 2 hizkuntza ereduaren gainean eraiki den eta egun edonorentzat dagoen atzigarri.

Elixabete Garcia (Eusko Jaurlariza): “Oso azkar doan erronka da eta ez ditugu baliabide asko. Hori dela eta, oso garrantzitsua da uharteetan lan ez egitea”

Ildo horri helduta, Garciak argi du ez dela nahikoa tokian lortutako ezagutza libre eta irekian uztea eta AA “industrializazio prozesu batean sartzea”, baliabideak partekatzea giltzarria dela deritzolako. “Oso azkar doan erronka da eta ez ditugu baliabide asko. Hori dela eta, oso garrantzitsua da uharteetan lan ez egitea”, berretsi du. Giza baliabideak eta hardwareak nola partekatu pentsatu behar dugula azpimarratu du, horren bitartez proiektu handiagoei heltzeko eta botere handiagoa izateko. 

Datuen kontrola, gako

AA erabiltzean sarri pentsatzen da: nora iritsiko dira nire datuak? Nork dauzka? Nola erabiliko ditu eta zertarako? Burujabetza teknologikoa lortuko bada, datuen kontrola edukitzea oinarrietako bat izango da, eta horrek ardura eskatzen du, kontzientzia garatzea eta datuen gainean dugun kontrola zein den argi izatea. Hori praktikan jartzeko, Garciak eguneroko jarduera sinpleetatik hastearen alde egiten du; esaterako, enpresa batek kontratuak sinatu behar dituenean, kontuan izan dezake zein tresna erabiltzen duen eta nora iritsiko diren dokumentuak. “Gainera, horrelakoetan interfazea euskaraz eskaintzen ez duten tresnak erabiltzen ditugu. Ez dago ekintza hori burujabetzatik egiten hasterik?”, dio.

Aritz Soroa (EHU): "Ez dago datu nahikorik euskarazko eredu bat zerotik hasteko; horregatik, ditugun besteen baliabideak moldatu behar ditugu"

Burujabetzak badu beste alde on bat: komunitatea sortu eta indartu dezake. Komunitate horren parte izango lirateke datu-hornitzaileak, zeintzuek datu eta testu asko dauzkaten euskaraz. Soroak fokua jarri du hornitzaile horiengan: komunitatearen parte izatea eta haiekin akordioak lortzea beharrezkoa iritzi du. “Hornitzaileek ere etekina atera behar dute, datuak erabilita eredu askoz hobeak sortu eta beraiek erabiltzeko eskubidea izanda, esaterako”. Izan ere, eredu handiek sarri konturatu gabe “kentzen” (edo “lapurtzen”) dituzte datuak; eredu irekiek eta hornitzaileekin egindako akordioen bidez sortutako ereduek, aldiz, "aukera ematen dio ematen duenari balioa bueltan ikusteko”. 

Datuen burujabetza izateak badakar berariaz beste afera bat: azpiegituren beharra. EAE mailan, Adi Data Center lehen datu zentroa estreinatu berri da Abanton, eta bigarrena eraikitzen ari dira Arrasaten. Azpiegitura horrek datuak biltegiratzeko balioko du, bai, baina Garciak haratago joateko beharra azpimarratu du: “Erronka da datu horiekin zerbitzu aurreratuak eskaintzea, bildutako informazioarekin etekina ateratzeko, eta gure enpresak gero eta lehiakorragoak izateko; zerbitzu aurreratu horiek definitu egin behar dira”, baieztatu du. 

Aitor Soroa EHUko Adimen Artifizial eta hizkuntza teknologiako Hitz Katedrako zuzendaria | Argazkia: Euskarabildua
Aitor Soroa EHUko Adimen Artifizial eta hizkuntza teknologiako Hitz Katedrako zuzendaria | Argazkia: Euskarabildua

AAren eta hizkuntza teknologien errealitatea enpresetan

“Hizkuntza teknologiak gure enpresetan zein momentutan daude?”, galdetu die Pombok Soroa eta Garciari. Azken horrek dioenaren arabera, enpresa handi batzuk adierazi dute jada kezka, baina oraindik ere mendekotasun handia dute teknologia eredu handiekiko. Txikiei dagokionez, “hizkuntza teknologien ezagutza handirik ez dago”. Horri aurka egiteko, Jaurlaritza lanean ari da AA Plan Estrategikoa definitzen, helburu izanik enpresa guztiek haien AAren estrategia propioa definitzeko marko bat sortzea, “ahalik eta modu eraginkor, seguru, jasangarri eta legalenean”, azaldu du Garciak. 

Soroak gogorarazi du ikerkuntza dela gakoa, eta baieztatu du enpresentzako modelo handiak ez direla beti egokienak. “Enpresa txikiek behar berezi, espezifiko eta txikiak dituzte, eta horretarako aproposagoak izan ohi dira eredu txikiak, enpresen behar horiei aurre egiteko gaitasuna dutelako”, esan du. 

Elixabete García (Eusko Jaurlaritza): “Sentsibilizazioa, elkarlana, datuen transferentzia norabide berean joatea eta baliabideak norabide horietara bideratzea da garrantzitsua”

Finean, Garciak funtsezko diren gakoak laburbiltzen eman dio amaiera mahai-inguruari: “Sentsibilizazioa, elkarlana, datuen transferentzia norabide berean joatea eta baliabideak norabide horietara bideratzea da garrantzitsua”.