 
    Euskarazko adimen artifiziala urrats sendoz doa aurrera. Orai enpresak sortutako Kimu txatbotak erakutsi du, hizkuntza gutxituen arloan ere, posible dela punta-puntako teknologiak garatzea. Xabier Saralegi Oraiko NLP teknologiaren arduradunak azaldu duenez, Kimu “euskararako kimu berde bat” da hizkuntza-ereduen munduan: txikia, azkarra, energetikoki eraginkorra eta, batez ere, pribatutasuna errespetatzen duena.
Kimu Small Language Model (SLM) baten gainean eraikia dago, 9.000 milioi parametro dituen hizkuntza-eredu batean. Tamainaz txikiagoa izan arren, ChatGPT edo Claude bezalako ereduekin alderatuta, abiaduran, eraginkortasunean eta jasangarritasunean irabazten ditu. Horrek ahalbidetzen du enpresa edo erakunde batek bere zerbitzari propioetan instalatzea datuak kanpora atera gabe. “Horrela, erabiltzailearen eta erakundearen informazioaren konfidentzialtasuna bermatzen da”, azaldu du Saralegik.
Xabier Saralegi (Orai): “Gure teknikaren bidez, Gemmak ingelesez ikasi dituen ezagutza guztiak euskarari irakatsi dizkiogu. Estrategia egokiagoa da ingelesezko datuekin trebatu diren eredu horiei euskara irakastea”
Eredu txikiagoa izateak baditu bere mugak; arrazoiketa aurreratua behar duten zereginetan, handiagoek abantaila dute. Baina Oraiko arduradunak dio lan eremu gehienetan oso lehiakorra dela. Bere espezialitatea dira dokumentuen analisia, testuen berridazketa, laburpenak egitea, edukien sorkuntza, itzulpengintza edo testu zuzenketa.
Kimu ez da hutsetik sortu. Oraik Gemma (Google) eta Llama (Meta) bezalako oinarri-ereduak hartu ditu, eta bere egokitzapen linguistiko propioa aplikatu die euskarara moldatzeko. “Gure teknikaren bidez, Gemmak ingelesez ikasi dituen ezagutza guztiak euskarari irakatsi dizkiogu”, azaldu du Saralegik. “Estrategia egokiagoa da ingelesezko datuekin trebatu diren eredu horiei euskara irakastea”.
Metodologia hori beste hizkuntza gutxituetan ere erabil daiteke
Egokitzapena egiteko, Oraik Zelai Handi corpusa erabili du, 500 milioi hitz biltzen dituen euskarazko testu multzo librea. Prozesu bera swahiliarekin eta galesarekin ere probatu dute, eta emaitzak “oso positiboak” izan dira. Horrek erakusten du metodologia hori beste hizkuntza gutxituetan ere erabil daitekeela, tokian-tokiko komunitate teknologikoei hura baliatzeko aukera emanez.
Gainera, Kimu eta bestelako eredu guztiak HuggingFace plataforman jarri dituzte eskuragarri, ikerketa-zentroek eta enpresek libreki erabil ditzaten. Horri esker, euskarazko teknologiaren garapena ekosistema ireki eta kolaboratibo batean oinarrituko da.
Pribatutasuna eta pertsonalizazioa ardatz
Kimuren beste ezaugarri nagusietako bat on premise modua da, tokiko zerbitzarietan instalatu daitekeena. Horrek esan nahi du enpresek edo erakundeek ez dutela beren dokumentazioa kanpoko zerbitzuen esku utzi behar. “Pribatutasuna bermatzen da, eta hori bereziki garrantzitsua da enpresa askorentzat”, azpimarratu du Saralegik.
Eredua, gainera, erraz pertsonaliza daiteke. Enpresa batek bere datuekin treba dezake, sektore jakin batean (kazetaritzan, hezkuntzan, industrian, komunikazioan…) espezializatzeko. “Oso sektore ezberdinetako enpresek adierazi dute interesa, eta horietako enpresa batzuk tamaina handikoak dira”, gaineratu du.
Kimu eta bestelako eredu guztiak HuggingFace plataforman jarri dituzte eskuragarri, ikerketa-zentroek eta enpresek libreki erabil ditzaten
Momentuz, Oraik sektore profesionaletan jarri du fokua, baina ez dute baztertzen etorkizunean publiko orokorrari ere irekitzea. Horretarako, dagoeneko badago beta bertsio bat sarean, gonbidapen bidez eskuragarri.
Kimuren garapenean egindako lanak nazioarteko errekonozimendua jaso du: proiektua EMNLP 2025 konferentzian aurkeztuko dute, hizkuntzaren prozesamendu naturaleko ekitaldi garrantzitsuenetariko baten. Horrek berresten du Orairen ikerketa-taldearen lana maila globalean baloratua dela.
Momentuz, Oraik sektore profesionaletan jarri du fokua, baina ez dute baztertzen etorkizunean publiko orokorrari ere irekitzea
Kimu ez da soilik txatbot bat, euskarazko adimen artifizialaren etorkizunerako kimu bat baizik, hizkuntza gutxituen bidean bide berriak irekitzen dituena. Bere tamaina txikiak, energia-eraginkortasunak eta datuen pribatutasunarekiko duen jarrerak erakusten du teknologia aurreratua ez dela beti erraldoi teknologikoen kontua. Mahaigaineratzen du, halaber, posible dela hizkuntza propioaren garapena, eta, Kimuren kasuan, euskarak badu jada bere adimen artifizial propioa: sustraietatik hazten ari den kimu berdea.
