Adimen artifizial sortzailea (AAS)adimen artifizialaren azpimultzo bat da,[1] eta eredu sortzaileak erabiltzen ditu testuak, irudiak, bideoak edo bestelako datu-formak ekoizteko.[2] Eredu horiek, askotan, idatzizko prompt batzuei erantzuten diete.[3][4] AASek euren prestakuntza-modeloen azpian dauden ereduak eta egiturak ikasten dituzte, eta, horri esker, datu berriak sor ditzakete.[5][6]
Transformadoreetan oinarritutako neurona sare sakoneko hobekuntzek, bereziki hizkuntza-eredu handiek (edo Lengoaia-eredu handiak) LLM[7], AAen sorkuntza-sistemen biderkatzea ahalbidetu zuten 2020ko lehen urteetan.
AASak industria-mota askotan ditu erabilerak, hala nola softwarearen garapenean, osasunean, finantzetan, entretenimenduan, bezeroarentzako zerbitzuan, salmentetan eta marketinean, artean, idazketan, modan eta produktuen diseinuan.[13][14][15][16][17] Hala ere, AA sortzailearen balizko erabilera bidegabeari buruzko kezkak plazaratu dituzte: besteak beste, ziberkrimena, albiste faltsuak edo deepfakeak erabiltzea pertsonak engainatzeko edo manipulatzeko, eta giza lanpostuen galeran eragina izan dezaketelako.[18][19]Jabetza intelektualaren eskubideari dagokionez ere badira kezkak, egile-eskubideak dituzten artelanetan trebatutako eta emulatutako sorkuntza-ereduen inguruan.[20]
Modalitateak
Adimen artifizial sortzailea azaltzen duen bideo laburra (azpitituluak euskaraz).
AAS sistema bat, gainbegiratu gabeko ikasketa automatikoa (adibidez, GANs, VAE, Transformer, ... bezalako neurona-sareen arkitekturak aipatuz) edo autogainbegiratutako ikasketa automatikoa datu-multzo bati aplikatuz eraikitzen da. AA sistema sortzaile baten gaitasunak erabilitako datu-multzoaren modalitate edo motaren araberakoak dira.
AAS unimodala edo multimodala izan daiteke; sistema unimodalek sarrera mota bakarra hartzen dute, eta sistema multimodalek, berriz, sarrera mota bat baino gehiago har dezakete.[21] Adibidez, OpenAI-ren GPT-4ren bertsioak testu- eta irudi-sarrerak onartzen ditu.[22]
Testua
Hitzen fitxetan edo hitzetan eratutako AAren sistema sortzaileek GPT-3, GPT-4, GPT-4o, LaMDA, LLaMA, BLOOM, Gemini eta beste batzuk dituzte (ikus Hizkuntza eredu handien zerrenda). Hizkuntza naturala, itzulpen automatikoa eta hizkuntza naturalaren sorkuntza prozesatzeko gai dira, eta beste zeregin batzuetarako oinarrizko eredu gisa erabil daitezke. Datu-multzoak BookCorpus, Wikipedia eta beste batzuk dira.
Kodea
Lengoaia naturaleko testuaz gain, lengoaia-eredu handiak programazio-lengoaiako testuan trebatu daitezke, eta, horri esker, programa informatiko berrietarako iturburu-kodea sor dezakete. Adibide batzuk OpenAI Kodea dira.
Kalitate handiko arte bisuala ekoizteko gaitasuna du AASak.[23] Testua ere baduten irudiekin entrenatutako modeloetan oinarritzen diren AAS tresnak dira: Imagen, DALL-E, Midjourney, Adobe Firefly, Stable Diffusion eta abar.
Audioa
AASa ere zabal entrenatu daiteke audio-klipetan, hizketaren sintesia soinu naturalarekin eta adierazpen-gaitasunekin sortzeko. Adibidez, ElevenLabs tresnetan edo Meta Platform-en Voicebox-ean.[24]
MusiLM eta MusiGen bezalako AAren sortze-sistemak grabatutako musikaren audio-uhinetan ere trebatu daitezke testu-oharrekin batera, testu-deskribapenetan oinarritutako musika-lagin berriak sortzeko, hala nola biolin-melodia lasaigarri bat, gitarra distortsionatuko riff batek babestua.[25]
Bideoa
Sorak sortutako bideoa, Kinabatangan ibaian Borneoko basabizitza azkarra erakusten duena.
Bideo idatzian trebatutako AASak bideoklip koherenteak sor ditzake, zehatzak eta errealistak. Horren adibide dira OpenAIren Sora, Runwayren Gen-1 eta Gen-2, eta Meta Plataformen Make-A-Video.[10][26][27]
Kezkak
AASaren garapenak gobernuen, enpresen eta norbanakoen kezkak piztu ditu, eta protestak, ekintza legalak, AAren esperimentuak gelditzeko deiak izan dira. Nazio Batuen Segurtasun Kontseiluaren 2023ko uztaileko informazio-saio batean, António Guterresidazkari nagusiak adierazi zuen "AASak ongirako eta gaizkirako ahalmen izugarria duel eskala handian", AAk "garapen globala azeleratu" dezakeela eta 2030erako $10 eta $15 bilioi bitartean munduko ekonomiari lagundu, baina haren erabilera maltzurrak "heriotza psikologikoa" eragin dezakeela.[28]
Enplegu galerak
"AA sortzailearen erabileraren inguruko erregulazioa" eskatzen duen manifestari bat.
Adimen artifizialak ordezka ditzakeen lanpostuak kezkatzen dituenak daude. Diseinu grafikoan, adibidez: Ilustratzaileak, maketatzaileak, grafistak… euren lana arriskuan ikusten dute. Makinak fabriketara heldu zireneko mugimendu luddistarekin ere alderatu izan da garapena.[29]
Arraza, kultura gutxitu eta genero alborapena
AASak azpiko datuetan dagoen edozein joera kultural islatu eta anplifikatu dezakete. Adibidez, eredu batek aztertutako irudi guztietan medikuak eta epaileak gizonezkoak badira, eta idazkariak edo erizainak emakumezkoak, alborapen horiek komunak badira formakuntza datuetan, emaitzetan ere alborapen hori anplifikatuko da.[30] Era berean, "CEO baten argazkia" testuarekin bultzatutako irudi eredu batek gizonezko CEO zurien irudiak sor litzake, arraza joera duen datu multzo batean trebatuz gero.[31] Zenbait metodo erabili dira alborapenak arintzeko, hala nola sarrerako bulkadak aldatzea eta entrenamenduko datuak berriz kalkulatzea.[32][33]
Hizkuntza gutxiagotuak
Adimen artifizial sortzaileak hobe funtzionatzen dute datu-modelo handietan trebatuak izan ondoren. Aztertutako testu eta eduki gehienak hizkuntza hegemonikoetakoak badira, emaitzak ere hobeak izango dira hizkuntza horietarako. Urte gutxitan gero eta emaitza hobea lortu da hizkuntza gutxiagotu batzuetan, hala nola, euskarazko emaitzetan, baina gaur-gaurkoz, oraindik, hizkuntza nagusietako emaitzak dira aurreratuenak.[34]
Deepfakeak
Deepfakeak (ikaskuntza sakoneko sormen faltsuak) AAk sortutako bitartekoak dira, pertsona bat irudi edo bideo batean hartzen dute eta beste pertsona baten antzekotasunaz ordezkatzen dituzte sare neuronal artifizialak erabiliz.[35][36] Deepfakesek arreta eta kezka orokorrak piztu dituzte, ospe handiko bideo pornografikoetan, mendeku-pornoetan, albiste faltsuetan, osasun-desinformazioan, finantza-iruzurrean eta atzerriko hauteskundeen interferentzia ezkutatzeko erabiltzen direlako.[37][38][39][40][41][42][43] Horrek industriaren zein gobernuaren erantzunak piztu ditu, erabilera antzeman eta mugatzeko.[44][45]
Ziberdelinkuentzia
AASak eduki faltsu errealista sortzeko duen gaitasuna ziberdelinkuentzia mota askotan ustiatu da, phishing iruzurrak barne.[46] Bideoa eta deepfake audioa desinformazioa eta iruzurra sortzeko erabili dituzte.[47] Hizkuntza-eredu handiak eta testuak sortzeko beste AA forma batzuk eskala handikoak izan dira merkataritza elektronikoko webguneetan iruzkin faltsuak sortzeko, produktuen kalifikazioak handitzeko helburuarekin.[48] Iruzurra ardatz duten hizkuntza eredu handiak sortu dituzte zibergaizkileek, besteak beste, Apokalipsia GPT eta Sonora GPT.[49] Bada teknologia honekin segurtasun aukera berriak ere heldu daitezkeela pentsatzen duenik.[50]
Energia eta ingurumena
AAS teknologiak eragin handia izan dezake energia kontsumoan eta ingurumen-kalteetan. AASek eragindako energia-beharrak handiak dira, datu-prozesamendu masiboak eta entrenamendu-algoritmo konplexuak eskatzen baititu, sarritan karbono aztarna handia utziz. Horrez gain, energia-iturri fosilak erabiltzen jarraitzeak ingurumenean inpaktu negatiboa du.[51]
Arautu
Legediarik gabe garatu da orain arte, eta horrek prozesuen gardentasun falta ekarri du, kutxa beltz izaera izanik bere ezaugarria. [52] Hau da, AASen funtzionamendua askotan ulertzea zaila izan da, batez ere erabakiak hartzeko prozesuetan. Horrek erronka etiko eta juridiko ugari sortu ditu, hala nola diskriminazioa edo pribatutasunaren urraketa. Europan, legeak eta arauak ezartzeko lehen urratsak eman dira, AASen erabilera erregulatzeko eta gardentasuna sustatzeko, adibidez, Europar Batasunaren Adimen Artifizialaren Legea (AI Act) [53]
Zelatatze masiboa
Zelatatze masiboaren esparruan arrisku handia dago, batez ere datu pertsonalen bilketa eta erabilera automatizatua dela eta. AASen bidez egindako datuen azterketak pribatutasuna urratzeko arriskua areagotzen du, identitateak, joerak eta jokabideak modu masiboan jarraitu eta prozesatzen direlako. Horrek kontrol soziala, diskriminazioa eta askatasun zibilen murrizketa eragin ditzake, batik bat erregulazio falta dagoen inguruneetan. Beharrezkoa da neurri juridiko eta etiko sendoak ezartzea, teknologiaren erabilera arduratsua bermatzeko.[54]
Edukiaren kalitatea
Edukien kalitateari ere kalte egin diezaioke, batez ere entrenamenduan erabiltzen diren datuak kalitate eskasekoak badira. Fenomeno horri datuen okertzea (ingelesez, garbage in, garbage out / zaborra sartu, zaborra atera) esaeraz ezagutzen da, eta datu okerrak edo distortsionatuak erabiltzen direnean, emaitza desegokiak edo kaxkarrak sortzen dira. Horrek AASen fidagarritasuna eta erabilgarritasuna murriztu dezake, eta desinformazioa edo akatsak zabaltzeko arriskua areagotu. Edukien kalitatea bermatzeko, funtsezkoa da datu-iturri sendo eta fidagarriak erabiltzea.[55]
Erabilera okerra kazetaritzan
Kazetaritzan kalteak eragin ditzake, batez ere edukien kantitatea kalitatearen gainetik jartzen denean.[56] AA tresnek mezu eta artikulu kopuru handiak sor ditzakete, baina askotan clickbait estrategietan oinarritzen dira edo SEO posizionamendurako zentzurik gabeko edukiak ekoizten dituzte. Horrek desinformazioa eta eduki hutsalak zabaltzea dakar, kazetaritzaren sinesgarritasuna eta kalitate informatiboa murriztuz.[57]
Euskara, Latxa eta beste hizkuntza ereduak
2024ko Informatikari Euskaldunen Bilkuraren barruan sei hizkuntza-eredu handi jarri zuten lehian euskarazko elkarrizketetan. Helburua EHUkoHitz zentroan garatzen den Latxa eredua «sistema komertzial hoberenen kontra» lehian jartzea izan zen, eta horra ondorioetako bat: GPT-4o eredu ezagunaren parean geratu zen ia. Dema horretan ikusi zen euskaraz «hobekien» zekien sistema Claude Sonnet 3.5 sistema komertziala zela, bigarren GPT-4o sistema geratu zen, eta haren «ia parean» geratu zen Latxa. Beherago geratu zen Gemini Flash 1.5, eta «askoz beherago» Command R+ eta LLama 3.1. Azken hori Latxa eredu berriaren «oinarria» da.[58][59]