Adimen Artifizialaren iraultza bisuala

Adimen Artifizialak, beste gauza askoren artean, irudiak sortzeko ere balio du. Hala ere, emaitza bikainak lortzeko ez da nahikoa testu laburra idazteko botoi bat sakatzearekin: zehaztasuna, hiztegi argia eta erabiltzailearen kontrola ezinbestekoak dira. Aldi berean, aukera berriak ireki diren bitartean erronka etikoak ere ugaritu egin dira

Ezkerrean AAri emandako 'input'a; eskubian, AAk 'input' horren bitartez sortutako irudia | Argazkia: Ioritz Hontecillas
Ezkerrean AAri emandako 'input'a; eskubian, AAk 'input' horren bitartez sortutako irudia | Argazkia: Ioritz Hontecillas
Garazi Etxaniz Idarreta
EnpresaBIDEAko kazetaria
2025eko maiatzaren 27a
Eg. 2025eko maiatzaren 27a

Adimen Artifizialaren (AA) bitartez irudiak sortzea gero eta ohikoagoa da, eta ez hori bakarrik, gero eta errazagoa eta azkarragoa ere bada. Horretarako sarean erabilgarri dauden tresna kopurua pixkanaka handitzen ari da: Stable Difussion, Dall-E, Midjourney, Adobe Firefly… Chat GPT bera ere gai da marrazkiak sortzeko. Jakin badakigu, gutxi edo asko, nola funtzionatzen duten gaur egun arte irudiak sortzeko erabili diren prozesuek (marrazkiak egitea ala argazkilaritza, kasu), baina, nola sortzen da irudia AA erabilita? Zer egiten dute aurrez aipatutako tresna horiek?

 

Bada, labur-labur eta era errazean azalduta, lehenik eta behin bi eratako AAk bereizi behar dira: testuak sortzeko LLMak (Large Language Model, euskaraz hizkuntza-eredu handiak litzatekeena) eta irudi edo bideoak sortzeko difusio-ereduak. Lehenengoaren adibide argiena Chat GPT litzateke: hizkuntza sakon aztertzen dute, ohiko jokabideak zein diren jakiteko eta hurrengo hitz egokiena zein den asmatzeko. Irudiaren zein bideoen sorkuntzarako, ordea, difusio-ereduak dira ohikoenak (Stable Difussion edo Midjourney, besteak beste): AA horiei inputa ematen zaie (izan testua, izan irudia, edo edozein eratako informazioa) eta datu horrekin irudia “berreraikitzen” hasten dira. Alegia, argi ulertzeko, eskultorearen lana egiten du AAk: hasieran ukitu gabeko harri blokea dauka, eta eskatzen diozunaren arabera, materiala kentzen joango da atzean dagoen irudia kanpora atera arte.

Ezkerrean, AAri emandako inputa; eskubian, AAk input horren bitartez sortutako irudia | Irudiaren egilea: Ioritz Hontecillas
Ezkerrean, AAri emandako 'input'-a; eskubian, AAk 'input' horren bitartez sortutako irudia | Irudiaren egilea: Ioritz Hontecillas

Haatik, ez da horren erraza izaten AAren bitartez zehazki erabiltzaileak nahi duen emaitza lortzea, sarri tresna digitalek eskatu ez diren bestelako fruituak ematen baitituzte. “Teknika zehatzak ezagutu behar dira erabiltzaileak ahalik eta kontrol gehien eduki dezan, AAren esku gauza gutxi utzita emaitzarik onena eskuratzeko” dio Ioritz Hontecillas Ascasibar ingeniariak. Industria diseinua eta produktuen garapenean lizentziatu zen Hontecillas, eta pare bat aste barru SPRIk Enpresa Digitalaren baitan, ikastaroa eskainiko du Donostia, AAk lagundutako kontroldun irudiak sortzeari buruz. Ekainaren 9an eta 10ean, goizeko 09:30etik 13:30era bitartean arituko da gaia lantzen, garrantzitsua deritzolako irudiak nola sortzen diren jakiteari: “AAk irudiak nola eraikitzen dituen ulertzen baduzu, kontrol gehiago duzu erabiltzaile gisa, eta tresna hobeto erabiltzen ikasten duzu” gaineratu du. 

 

Emaitza onak lortzeko ingeniariari zer egin behar den galdetzean, azpimarratu du bereziki garrantzitsua dela AAri prompt ona ematea (prompta esaten zaio AAri idazten zaion galderari, eskaerari, edo abiapuntuari), eta, horretarako, detaileek garrantzia berezia omen dute. Adibidez, katu baten irudia eskatu nahi bada testu baten bitartez, ez litzateke nahikoa izango “marraztu katu bat” esatearekin; aldiz, katuaren ile kolorea, argiztapena eta posizioa zein den zehazten bada, emaitza egokiagoa lortuko litzateke.

Ioritz Hontecillas: "Gaur egun edozeinek sor ditzake irudiak AA bitartez, difusio-ereduak asko demokratizatu baitira”

Horrez gain, tresna bakoitzak bere funtzionamendua du, eta askok denei berdin hitz egiteko ohitura badute ere, komeni da erreminta bakoitzaren espezialitatea ezagutzea, prompta era batera edo bestera emateko. Bestalde, kontuan izanda AA gehienak ingelesez sortu direla, ulertu behar da emaitza hobeak lortuko direla hizkuntza horretan eginez gero eskaera. Hontecillasen esanetan sinonimoak ere ekidin egin behar dira: “Laranja hitzak, adibidez, bi esanahi ditu, kolorea eta fruitua, eta hori AAri zehaztu ezean nahastu egin daiteke”. Hortaz, komenigarria da hitz argiak erabiltzea, hau da, sinonimorik ez dutenak.

Detaile horiek guztiak kontuan izatea garrantzitsua da, gaur egun horiek baitira AAek dituzten muga handienak. Oraindik ere ez dira gai argiztapena guztiz ondo fintzeko, kolore zehatzak asmatzeko… Pertsonen irudiak eskatzean ohikoak dira akats txiki horiek. Nork ez du ikusi sei edo zazpi behatzeko eskua duen pertsonen irudirik? Hala ere, ingeniariak argi du asko garatu dela sektorea azken urtebetean, eta lehen egin ezin zitekeena gaur egun egingarria dela. Esaterako, berak sortu berri duen Neexis Render enpresak irudiak sortzen ditu 3D modeloetatik abiatuta, ingeniaria konturatu baitzen orain arte oso zaila zela AAk irudi berriak sortzea diseinatzaileek prestatutako 3D modeloak erabilita, AAek ez baitzuten lortzen berdin mantentzea modelo horien tamaina, koloreak edota testurak.

Sei behatz dituen emakumea kafea edaten | Irudia: AAk sortutakoa
Sei behatz dituen emakumea kafea edaten | Irudia: AAk sortutakoa

Gauzak horrela, argi dago teknologiek aldaketa asko ekarri dituztela jada, eta limite asko gainditu dituztela: “Difusio-ereduak duela asko existitzen ziren arren, jende gutxik erabil zitzakeen. Gaur egun edozeinek sor ditzake irudiak AA bitartez, difusio-ereduak asko demokratizatu baitira”, baieztatu du Hontecillasek.

Ioritz Hontecillas: “AAk irudiak nola eraikitzen dituen ulertzen baduzu, kontrol gehiago duzu erabiltzaile gisa, eta tresna hobeto erabiltzen ikasten duzu”

Erronka etikoak

Irudiak sortzeko prozesua azkartu eta erraztu den arren, AAk erronka etiko berriak ere ekarri ditu. Teknologia berri horiek sarritan aurrez existitzen diren datuak erabili eta moldatu egiten dituztenez, copyright eta egile eskubide arazoak sortu izan dituzte. Hain zuzen, Sarah Andersen, Kelly McKernan eta Karla Ortiz artistek 2023. urtean salatu zituzten Stable Difussion eta Midjourney negozioak, AAk entrenatzeko helburuarekin haien obrak “lapurtu” izanagatik. Urtebete lehenago ere Stability AI (Stable Difussionen sortzailea) salatu zuen Getty Images irudien plataformak, arrazoi berberagatik. Salaketaren arabera, AA hori lantzeko plataformako milioika irudi erabili zituzten, inongo lizentziarik eta baimenik gabe; gainera, Getty Imagesek argudiatu zuenez, beraien irudien oso antzerakoak sortzen zituen AAk, kasu batzuetan enpresaren ur-marka bera ere erreproduzituta.

Ezkerrean Getty Imagesen irudia; eskubian, Stable DIfussionek sortutakoa, Getty Imagesen ur-marka eta guzti | Argazkia: Getty Images
Ezkerrean Getty Imagesen irudia; eskubian, Stable DIfussionek sortutakoa, Getty Imagesen ur-marka eta guzti | Argazkia: Getty Images

Hontecillasen ustetan, horrelako arazoak ekiditeko soilik baimena eman duten autoreen iruditeria erabili beharko litzateke AAk entrenatzeko, hau da, erregularizatuta dauden irudiak. Errealitatean, ordea, oso zaila da hori horrela izatea, tresna bakoitza bere erara entrenatu baita. Oso ohikoa da, adibidez, AAk entrenatzeko Googleko irudiak erabiltzea, itsuentzako duten testu alternatiboa deritzona interpretatuta. Hala ere, badaude baimendutako irudiak soilik erabiltzen dituzten tresnak, eta horietako bat da Adobe Firefly irudiak sortzeko AA, Adobek erregularizatuta dituen Adobe Stock-eko iruditeria soilik erabiltzen baitu marrazki berriak sortzeko. Enpresa bakoitzak hartu ditzakeen erabaki propioez haratago, gobernuak legez gero eta gehiago erregularizatzen ari dira, eta ingeniariaren aburuz, alde onak dituen arren, alde txarrak ere baditu: “Erregularizazioa ona da, baina sektorea geldiarazi ere egiten du, eta horrek bere arriskuak dakartza. AEBn eta Txinan Europan baino askoz ere lege gutxiago daude gai honi dagokionez, eta Europa da, hain zuzen, sektorean atzeratuen dioana”.

Interneta erabiltzen duen edozein erabiltzailek ere pairatu ditzake zenbait arazo, sarean partekatzen den edozein irudi erabil dezaketelako, hain zuzen, AAek. Horri aurre egiteko, irudiak babesteko ekimenak sortu dira, besteak beste, Fawkes. Chicagoko unibertsitatean 2022an sortutako softwareak irudiak eraldatzen ditu data poisoning izeneko prozesuaren bitartez: sareetara aurpegi bat agertzen den argazkia igo baino lehen, tresnak argazkia eraldatzen du barrutik, erabiltzaileak kanpotik ikusten duen irudia berdin mantentzen badu ere. Funtsean, argazkia "pozoitzen” du, eta, hala, argazki hori AA entrenatzeko erabiltzen bada, aurpegiari buruzko datu okerrak ikasiko ditu, ez baitu aurpegia guztiz ezagutuko.

Ildo beretik, Better images of AI izeneko irabazi asmorik gabeko proiektu kolaboratiboak AAren bitartez eginiko irudiak sortu eta partekatzen ditu, helburu izanik ahalik eta irudi errealistenak eskuratzea; aldi berean, estereotipoetatik urruntzen saiatzen dira, eta azalpen argiak eskaintzen dituzte AA erabilita sortutako iruditeriari buruz.

Enpleguaren paradigma aldaketa eta euskara

Argazki kamerak sortzean gertatu zen: marrazkilari batzuek gutxietsi egin zuten tresna berria, argazkiak ateratzea klik eginda "errazegia" zelako. Photoshopa sortzean ere hautsak harrotu ziren, argazkien ediziorako horren tresna erabilerraza arriskutsua zelakoan. Arrisku horiek existitzen diren arren, jada mundu guztiarentzako da ohikoa aldizkarietako argazkiak editatuta argitaratzea; are gehiago, sarri arraroa izaten da editatu gabeko argazkiak ikustea.

Ioritz Hontecillas: “AA erabiltzea menderatzen dutenek mantenduko dute berritzaileak izateko gaitasuna; tresnari uko egiten diotenek, aldiz, haien lanpostua mehatxupean jarriko dute”

AAren erabilerarekin eta hazkundearekin antzerakoa gertatzen ari dela uste du Hontecillasek. Prozesu asko automatizatzeko aukera agertu da, eta errepikakorrak diren ekintzak inoiz baino azkarrago egin daitezke. Horregatik, Hontecillasek AA erabiltzen jakiteari oso garrantzitsua dela deritzo: “AA erabiltzea menderatzen dutenek mantenduko dute berritzaileak izateko gaitasuna; tresnari uko egiten diotenek, aldiz, haien lanpostua mehatxupean jarriko dute”.

Izan ere, gutxienez irudiekin zer ikusia duten lanpostuetan AA gero eta gehiago erabiliko da; “are gehiago, lehen irudiak erabiltzen ez ziren sektoreetan, orain AA dela-eta irudiak erabiltzen hasi dira”, gaineratu du. Horrenbestez, enpresek eta erakundeek eskatzen duten langile profila ere eraldatu egingo da: “Bestelako profil profesionalak eskatuko dira gehiago. Esaterako, AArekin irudiak sortzen dakien pertsona eskatuko da, erreminta berriak erabiltzen dakiena, ilustratzailea edo diseinatzailea eskatu beharrean”.

Detaileetan akats egiteko ohitura dute AAek, esaterako, aurpegietan | Irudia: AAk sortutakoa
Detaileetan akats egiteko ohitura dute AAek, esaterako, aurpegietan | Irudia: AAk sortutakoa

Euskaraz irudiak sortzeari dagokionez, Hontecillasek uste du etorkizunean ez dela arazo handirik izango. Arestian aipatu bezala, AAk ingelesa erabilita landu, entrenatu eta sortu dira, eta irudiak sortzeko difusio-ereduek oraindik ez dute euskara ikasi, nahiz eta beste hizkuntzak gero eta gehiago ezagutzen dituzten. Hala ere, ingeniariaren aburuz, aldaketa ez da difusio-eredu horietan egon behar, baizik eta LLMetan. Alegia, erosoagoa eta errazagoa iruditzen zaio irudiak sortzeko plataformei euskara irakasten jarri beharrean, testua lantzen duten AAei (Chat GPT, adibidez) itzulpen onak egiten erakustea. Horrela, itzulitako testu on horiek zuzenean irudiak sortzeko AAri pasatzearekin nahikoa izango litzateke.