Unatoč intenzivnoj utrci u naoružanju umjetne inteligencije, očekuje nas multimodalna budućnost

Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj o AI pokrivenosti vodećoj u industriji. Saznajte više

Svaki tjedan – ponekad i svaki dan – svijetu se rađa novi najsuvremeniji AI model. Kako ulazimo u 2025., tempo kojim se novi modeli objavljuju je vrtoglav, ako ne i iscrpljujući. Krivulja rollercoastera nastavlja eksponencijalno rasti, a umor i čuđenje postali su stalni pratioci. Svako izdanje naglašava zašto ovaj određeni model bolji je od svih ostalih, s beskonačnim zbirkama mjerila i stupčastih dijagrama koji ispunjavaju naše sažetke sadržaja dok pokušavamo održati korak.

Broj velikih modela temelja koji se izdaju svake godine eksplodira od 2020. godine
Charlie Giattino, Edouard Mathieu, Veronika Samborska i Max Roser (2023.) – “Umjetna inteligencija” Objavljeno online na OurWorldinData.org.

Prije osamnaest mjeseci, velika većina programera i tvrtki koristila je jedan model umjetne inteligencije. Danas je suprotno. Rijetko je pronaći posao značajnog opsega koji se ograničava na mogućnosti jednog modela. Tvrtke su oprezne vezanosti za dobavljače, osobito za tehnologiju koja je brzo postala temeljni dio dugoročne korporativne strategije i kratkoročnog konačnog prihoda. Za timove je sve riskantnije staviti sve svoje oklade na jedan veliki jezični model (LLM).

No unatoč toj fragmentaciji, mnogi pružatelji modela još uvijek zagovaraju mišljenje da će AI biti tržište na kojem pobjednik uzima sve. Tvrde da su stručnost i računalstvo potrebni za treniranje modela najboljih u klasi rijetki, obranjivi i samoojačavajući. Iz njihove perspektive, hype balon za izgradnju AI modela na kraju će se srušiti, ostavljajući iza sebe jedan, divovski model umjetne opće inteligencije (AGI) koji će se koristiti za sve i svašta. Ekskluzivno posjedovati takav model značilo bi biti najmoćnija tvrtka na svijetu. Veličina ove nagrade pokrenula je utrku u naoružanju za sve više GPU-ova, s novom nulom koja se dodaje broju parametara obuke svakih nekoliko mjeseci.

Duboka misao, monolitni AGI iz Vodiča kroz svemir za autostopere
BBC, Vodič kroz galaksiju za autostopere, televizijska serija (1981.). Slika preuzeta u svrhu komentara.

Vjerujemo da je ovo gledište pogrešno. Neće biti jedinstvenog modela koji će vladati svemirom, ni sljedeće godine ni sljedećeg desetljeća. Umjesto toga, budućnost umjetne inteligencije bit će višemodelna.

Sadržaj objave

1 Jezični modeli su nejasna roba
2 Multimodalna orkestracija i usmjeravanje
- 2.1 Povezani sadržaji

Jezični modeli su nejasna roba

The Oxfordski rječnik ekonomije definira robu kao “standardiziranu robu koja se kupuje i prodaje na veliko i čije su jedinice međusobno zamjenjive”. Jezični modeli su roba u dva važna smisla:

Sami modeli postaju sve više međusobno zamjenjivi na širem skupu zadataka;
Istraživačka stručnost potrebna za izradu ovih modela postaje sve više distribuirana i pristupačna, s graničnim laboratorijima koji jedva nadmašuju jedni druge, a neovisni istraživači u zajednici otvorenog izvornog koda hvataju ih za petama.

Roba koja opisuje robu (zasluga: nije dijamant)

No iako se jezični modeli komodiziraju, oni to čine nejednako. Postoji velika jezgra mogućnosti za koje je svaki model, od GPT-4 pa sve do Mistral Smalla, savršeno prikladan. U isto vrijeme, kako se krećemo prema marginama i rubnim slučajevima, vidimo sve veću i veću diferencijaciju, s nekim pružateljima modela koji su se eksplicitno specijalizirali za generiranje koda, razmišljanje, generiranje proširenog dohvaćanja (RAG) ili matematiku. To dovodi do beskrajnog rada, pretraživanja reddita, procjene i finog podešavanja kako bi se pronašao pravi model za svaki posao.

AI modeli komodiziraju oko temeljnih mogućnosti i specijaliziraju se na rubovima. Zasluge: Nije dijamant

Iako su jezični modeli roba, točnije ih je opisati kao nejasna roba. Za mnoge slučajeve upotrebe, modeli umjetne inteligencije bit će gotovo međusobno zamjenjivi, s mjernim podacima poput cijene i latencije koji određuju koji model koristiti. Ali na rubu mogućnosti dogodit će se suprotno: modeli će se nastaviti specijalizirati, postajući sve više diferencirani. Na primjer, Deepseek-V2.5 je jači od GPT-4o u kodiranju u C#, unatoč tome što je djelić veličine i 50 puta jeftiniji.

Obje ove dinamike — komoditizacija i specijalizacija — iskorjenjuju tezu da će jedan model biti najprikladniji za rješavanje svih mogućih slučajeva upotrebe. Umjesto toga, oni ukazuju na progresivno fragmentirani krajolik za AI.

Postoji prikladna analogija za tržišnu dinamiku jezičnih modela: ljudski mozak. Struktura našeg mozga ostala je nepromijenjena 100 000 godina, a mozgovi su mnogo sličniji nego što su različiti. Tijekom velike većine našeg vremena na Zemlji većina je ljudi učila iste stvari i imala slične sposobnosti.

Ali onda se nešto promijenilo. Razvili smo sposobnost komuniciranja jezikom — prvo govorom, a potom i pisanjem. Komunikacijski protokoli olakšavaju mreže, a kako su se ljudi počeli umrežavati jedni s drugima, počeli smo se sve više i više specijalizirati. Oslobodili smo se tereta potrebe da budemo generalisti u svim domenama, da budemo samodostatni otoci. Paradoksalno, kolektivno bogatstvo specijalizacije također je značilo da je prosječan čovjek danas daleko jači generalist od svih naših predaka.

Na dovoljno širokom ulaznom prostoru, svemir uvijek teži specijalizaciji. To vrijedi za sve od molekularne kemije, preko biologije, do ljudskog društva. Uz dovoljnu raznolikost, distribuirani sustavi uvijek će biti računalno učinkovitiji od monolita. Vjerujemo da će isto biti i s umjetnom inteligencijom. Što više možemo iskoristiti prednosti više modela umjesto da se oslanjamo samo na jedan, to se ti modeli više mogu specijalizirati, proširujući granice mogućnosti.

Sustavi s više modela mogu omogućiti veću specijalizaciju, sposobnost i učinkovitost. Izvor: Not Diamond

Sve važniji obrazac za iskorištavanje prednosti različitih modela je usmjeravanje — dinamičko slanje upita najprikladnijem modelu, dok se također iskorištavaju jeftiniji, brži modeli kada to ne umanjuje kvalitetu. Usmjeravanje nam omogućuje da iskoristimo sve prednosti specijalizacije — veću točnost s nižim troškovima i latencijom — bez odricanja od robusnosti generalizacije.

Jednostavna demonstracija moći usmjeravanja može se vidjeti u činjenici da su većina vrhunskih svjetskih modela i sami usmjerivači: izgrađeni su pomoću Mješavina Expert arhitekture koje usmjeravaju svaku sljedeću generaciju tokena na nekoliko desetaka stručnih pod-modela. Ako je istina da LLM eksponencijalno proliferiraju nejasne robe, tada usmjeravanje mora postati bitan dio svakog skupa umjetne inteligencije.

Postoji gledište da će se LLM-ovi zaustaviti kako dosegnu ljudsku inteligenciju — da ćemo se, kako u potpunosti zasitimo sposobnosti, udružiti oko jednog općeg modela na isti način na koji smo se udružili oko AWS-a ili iPhonea. Niti jedna od tih platformi (ili njihovi konkurenti) nije deseterostruko povećala svoje mogućnosti u proteklih nekoliko godina — pa bismo se mogli osjećati ugodno u njihovim ekosustavima. Vjerujemo, međutim, da AI neće stati na ljudskoj razini inteligencije; nastavit će se daleko preko svih granica koje bismo mogli i zamisliti. Dok bude tako, postat će sve više fragmentiran i specijaliziran, baš kao što bi to učinio bilo koji drugi prirodni sustav.

Ne možemo precijeniti koliko je fragmentacija AI modela vrlo dobra stvar. Fragmentirana tržišta su učinkovita tržišta: ona daju moć kupcima, povećavaju inovacije i minimiziraju troškove. I u onoj mjeri u kojoj možemo iskoristiti mreže manjih, specijaliziranijih modela umjesto da sve šaljemo kroz unutrašnjost jednog divovskog modela, idemo prema mnogo sigurnijoj, razumljivijoj i upravljivijoj budućnosti za AI.

Najveći izumi nemaju vlasnika. Nasljednici Bena Franklina nemaju struju. Turingovo imanje ne posjeduje sva računala. AI je nedvojbeno jedan od najvećih izuma čovječanstva; vjerujemo da će njegova budućnost biti – i trebala bi biti – multi-model.

Zack Kass je bivši voditelj go-to-market tvrtke OpenAI.

Tomás Hernando Kofman je suosnivač i izvršni direktor Ne Diamond.

DataDecisionMakers

Dobrodošli u VentureBeat zajednicu!

DataDecisionMakers je mjesto gdje stručnjaci, uključujući tehničke osobe koje rade s podacima, mogu dijeliti uvide i inovacije u vezi s podacima.

Ako želite čitati o vrhunskim idejama i najnovijim informacijama, najboljim praksama i budućnosti podataka i podatkovne tehnologije, pridružite nam se na DataDecisionMakers.

Možete čak razmisliti o doprinosu vlastitom članku!

Pročitajte više od DataDecisionMakers

Web izvor