Ikusi, entzun eta hitz egiten du

ChatGPT atera zenetik, bizitza pertsonal edo profesionalean aplikagarritasun errealik topatu al diozu? Astean zenbatetan erabiltzen duzu? Bizitza zenbatean erraztu dizu? ChatGPT inoiz erabili ez baduzu edota horri buruz ezer jakin nahi ez baduzu, gaurko zutabe hau ez da zuretzat, lagun. Lehenengo proba egiteko eskatuko dizut, aste honetan bi-hiru bider erabiltzeko eskatu, eta ondoren, datozen lerroak irakurtzera gonbidatu. Egin al duzu?

Ez dakit orain artekoan asko gogatu zaituen erremintak, baina dagoeneko milioika erabiltzaile ditu mundu osoan zehar eta haren jabeek ez dute adimen artifizialaren aferan atzera pausoak egiteko inongo intentziorik, itxuraz. Aurreko astean “ChatGPTk ikusi, entzun eta hitz egiteko gaitasuna izango duela” aurreratu zuen OpenAI enpresak. Komunikatuaren arabera, ahots- eta irudi-gaitasun berriak garatzen hasi direla aitortu dute, eta urriaren erdialdean izango dela martxan. “Interfaze intuitiboago bat bermatuko du: alde batetik, ahots-elkarrizketa bat izateko aukera emango du, eta bestetik, ChatGPTri hitz egiten ari zarenaren berri emango diote”.

Idatziak, ahotsak, irudiak uztartzeko gaitasuna izango du hemendik aurrera ChatGPTk, eta orain arte ikusi gabeko aukera berriak eskainiko ditu aplikazioak: eraikuntza bati argazki bat atera eta haren historiaren laburpena egiteko eskatu; irratian entzuten ari zaren abesti bat entzun eta detektatzeko eskatu; etxeko hozkailuari argazkia atera, eta bertan dauden produktuekin afari bat prestatzeko errezeta eskatu; edota afaldu ondoren, alabari matematika-problemaren argazki bat egin eta ebazteko prozesua esplikatzeko eskatzeko aukera emango digu.

Hilabete gutxiren buruan etengabeko aurrerapenak ikusten ari gara merkatuan, baina ​ChatGPT bezalako adimen artifizialeko eredu bat entrenatzea ez da batere erraza, eta oso garestia da, gainera. Sistema horien atzean dagoen teknologia datu-kopuru handiak prozesatzean oinarritzen da, ereduak detektatzeko eta emaitza bat lortzeko. Emaitza hori aurreko esperientzien azterketan oinarritutako erabaki automatikoa da, etorkizunean zer gerta daitekeen aurreikustea edota eduki berri bat sortzea. Hau egiteko OpenAIk Interneteko eduki ugari aztertu behar izan du, haietatik ikasi eta guk egiten dizkiogun prompt edo eskaerei ondo erantzuteko. Testu kopuru ikaragarri hori prozesatzeko, izugarrizko konputazio-gaitasun handia behar izan dute, eta horregatik sartu zuten Microsoft haien kide gisa, 1.000 milioi dolarreko inbertsioa jasoaz.

Oraingoan, azken berri horrekin Google edota Midjourney bezalako enpresei aurrez aurre begiratzeko mehatxua egin die, adimen artifiziala hiru disziplinatan aplikatzeko gaitasuna bermatuz. Zoritxarrez, adimen artifizialaren erregulatzeko debatea ondu eta oraindik sakontzeke dagoen honetan, irudia eta ahotsaren inputak sartu dituzte koktelean epe motzeko erabakiak asko konplejizatuz.

Erraminta erabiltzen jarraitzeko intentzioa dut, aipatutako berrikuntza berrien aplikazio erreala zein den esploratu eta bere muga berriak ezagutzera ausartu. Hilabete batzuen buruan gaia berrartu, esperimentatutakoa kontatu eta AAk izan ditzakeen aukera eta mehatxu berriak kontatzera etortzeko konpromezua hartzen dut.

Gaurko nabarmenduak
irakurrienaK