Euskarazko adimen artifizialerako eredu neuronal berria garatu du Orai NLPk

Llama-eus-8B izeneko hizkuntza-eredu neuronala diseinatu dute, euskara idatzia ulertzea eta sortzea eskatzen duten adimen artifizialeko sistemak errazago garatzeko

Xabier Saralegi eta Ander Corral proiektuaren arduradunak | Argazkia: Orai NLP Xabier Saralegi eta Ander Corral proiektuaren arduradunak | Argazkia: Orai NLP

Baliabide urriko hizkuntzek oztopo ugari dituzte hizkuntza naturalaren prozesamenduak garatzeko garaian, ez baitute hizkuntza hegemonikoen neurri berean aurrera egiteko behar adina testu edo datu bilduma eta baliabide konputazional. Hartara, bestelako estrategia batzuk erabili beharra dute hizkuntza handietan erabiltzen diren adimen artifizialeko tresnak euskarara ekartzeko.

Ikerketa esparru honetan aurrerapauso handia eman berri du Orai NLPk. Elhuyarren adimen artifizialeko zentroak Llama-eus-8B izeneko hizkuntza-eredu neuronal berri bat garatu du, euskara idatzia ulertzea eta sortzea eskatzen duten adimen artifizialeko sistemak errazago garatzeko diseinatua.

Llama-eus-8B eredu fundazional bat da, hau da, adimen artifizial sortzailearen oinarri gisa erabiltzen den eredu-mota bat. Orain NLPk azaldu duenez, eredu fundazional arinen esparruan (10 mila milioi parametro baino gutxiagokoak) euskararako dagoen eredurik aurreratuena da.

Eredu hau modu librean eskuratu daiteke, arlo akademikoan zein industrialean euskarazko teknologien garapena eta ikerketa errazteko helburuarekin. Halaber, Oraik oinarri gisa erabiliko du euskara ulertzeko eta sortzeko gaitasun sakona eskatzen duten zenbait tresna garatzeko, besteak beste, zuzentzaile gramatikalak, edukiak sortzeko sistemak, hezkuntza-materialak sortzeko sistemak, bilatzaileak, txatbotak eta itzultzaile automatikoak.

Xabier Saralegi proiektuko ikertzaile nagusiak zera adierazi du: “gaur egun entrenamendu estrategia alternatiboekin esperimentatzen ari gara, euskarazko testu bilduma handiagoen beharrik gabe emaitzak hobetu ahal izateko. Ingelesez ikasitako gaitasunak euskarara ekartzea ahalbidetuko duten estrategiak bilatzen ari gara”.  

Gaurko nabarmenduak
irakurrienaK