Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Unatoč intenzivnoj utrci u naoružanju umjetne inteligencije, očekuje nas multimodalna budućnost

Novosti

Unatoč intenzivnoj utrci u naoružanju umjetne inteligencije, očekuje nas multimodalna budućnost

Tomšić Damjan 30. prosinca 2024


Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj o AI pokrivenosti vodećoj u industriji. Saznajte više


Svaki tjedan – ponekad i svaki dan – svijetu se rađa novi najsuvremeniji AI model. Kako ulazimo u 2025., tempo kojim se novi modeli objavljuju je vrtoglav, ako ne i iscrpljujući. Krivulja rollercoastera nastavlja eksponencijalno rasti, a umor i čuđenje postali su stalni pratioci. Svako izdanje naglašava zašto ovaj određeni model bolji je od svih ostalih, s beskonačnim zbirkama mjerila i stupčastih dijagrama koji ispunjavaju naše sažetke sadržaja dok pokušavamo održati korak.

Broj velikih modela temelja koji se izdaju svake godine eksplodira od 2020. godine
Charlie Giattino, Edouard Mathieu, Veronika Samborska i Max Roser (2023.) – “Umjetna inteligencija” Objavljeno online na OurWorldinData.org.

Prije osamnaest mjeseci, velika većina programera i tvrtki koristila je jedan model umjetne inteligencije. Danas je suprotno. Rijetko je pronaći posao značajnog opsega koji se ograničava na mogućnosti jednog modela. Tvrtke su oprezne vezanosti za dobavljače, osobito za tehnologiju koja je brzo postala temeljni dio dugoročne korporativne strategije i kratkoročnog konačnog prihoda. Za timove je sve riskantnije staviti sve svoje oklade na jedan veliki jezični model (LLM).

No unatoč toj fragmentaciji, mnogi pružatelji modela još uvijek zagovaraju mišljenje da će AI biti tržište na kojem pobjednik uzima sve. Tvrde da su stručnost i računalstvo potrebni za treniranje modela najboljih u klasi rijetki, obranjivi i samoojačavajući. Iz njihove perspektive, hype balon za izgradnju AI modela na kraju će se srušiti, ostavljajući iza sebe jedan, divovski model umjetne opće inteligencije (AGI) koji će se koristiti za sve i svašta. Ekskluzivno posjedovati takav model značilo bi biti najmoćnija tvrtka na svijetu. Veličina ove nagrade pokrenula je utrku u naoružanju za sve više GPU-ova, s novom nulom koja se dodaje broju parametara obuke svakih nekoliko mjeseci.

Duboka misao, monolitni AGI iz Vodiča kroz svemir za autostopere
BBC, Vodič kroz galaksiju za autostopere, televizijska serija (1981.). Slika preuzeta u svrhu komentara.

Vjerujemo da je ovo gledište pogrešno. Neće biti jedinstvenog modela koji će vladati svemirom, ni sljedeće godine ni sljedećeg desetljeća. Umjesto toga, budućnost umjetne inteligencije bit će višemodelna.

Sadržaj objave

  • 1 Jezični modeli su nejasna roba
  • 2 Multimodalna orkestracija i usmjeravanje
    • 2.1 Povezani sadržaji

Jezični modeli su nejasna roba

The Oxfordski rječnik ekonomije definira robu kao “standardiziranu robu koja se kupuje i prodaje na veliko i čije su jedinice međusobno zamjenjive”. Jezični modeli su roba u dva važna smisla:

  1. Sami modeli postaju sve više međusobno zamjenjivi na širem skupu zadataka;
  2. Istraživačka stručnost potrebna za izradu ovih modela postaje sve više distribuirana i pristupačna, s graničnim laboratorijima koji jedva nadmašuju jedni druge, a neovisni istraživači u zajednici otvorenog izvornog koda hvataju ih za petama.
Roba koja opisuje robu (zasluga: nije dijamant)

No iako se jezični modeli komodiziraju, oni to čine nejednako. Postoji velika jezgra mogućnosti za koje je svaki model, od GPT-4 pa sve do Mistral Smalla, savršeno prikladan. U isto vrijeme, kako se krećemo prema marginama i rubnim slučajevima, vidimo sve veću i veću diferencijaciju, s nekim pružateljima modela koji su se eksplicitno specijalizirali za generiranje koda, razmišljanje, generiranje proširenog dohvaćanja (RAG) ili matematiku. To dovodi do beskrajnog rada, pretraživanja reddita, procjene i finog podešavanja kako bi se pronašao pravi model za svaki posao.

AI modeli komodiziraju oko temeljnih mogućnosti i specijaliziraju se na rubovima. Zasluge: Nije dijamant

Iako su jezični modeli roba, točnije ih je opisati kao nejasna roba. Za mnoge slučajeve upotrebe, modeli umjetne inteligencije bit će gotovo međusobno zamjenjivi, s mjernim podacima poput cijene i latencije koji određuju koji model koristiti. Ali na rubu mogućnosti dogodit će se suprotno: modeli će se nastaviti specijalizirati, postajući sve više diferencirani. Na primjer, Deepseek-V2.5 je jači od GPT-4o u kodiranju u C#, unatoč tome što je djelić veličine i 50 puta jeftiniji.

Obje ove dinamike — komoditizacija i specijalizacija — iskorjenjuju tezu da će jedan model biti najprikladniji za rješavanje svih mogućih slučajeva upotrebe. Umjesto toga, oni ukazuju na progresivno fragmentirani krajolik za AI.

Multimodalna orkestracija i usmjeravanje

Postoji prikladna analogija za tržišnu dinamiku jezičnih modela: ljudski mozak. Struktura našeg mozga ostala je nepromijenjena 100 000 godina, a mozgovi su mnogo sličniji nego što su različiti. Tijekom velike većine našeg vremena na Zemlji većina je ljudi učila iste stvari i imala slične sposobnosti.

Ali onda se nešto promijenilo. Razvili smo sposobnost komuniciranja jezikom — prvo govorom, a potom i pisanjem. Komunikacijski protokoli olakšavaju mreže, a kako su se ljudi počeli umrežavati jedni s drugima, počeli smo se sve više i više specijalizirati. Oslobodili smo se tereta potrebe da budemo generalisti u svim domenama, da budemo samodostatni otoci. Paradoksalno, kolektivno bogatstvo specijalizacije također je značilo da je prosječan čovjek danas daleko jači generalist od svih naših predaka.

Na dovoljno širokom ulaznom prostoru, svemir uvijek teži specijalizaciji. To vrijedi za sve od molekularne kemije, preko biologije, do ljudskog društva. Uz dovoljnu raznolikost, distribuirani sustavi uvijek će biti računalno učinkovitiji od monolita. Vjerujemo da će isto biti i s umjetnom inteligencijom. Što više možemo iskoristiti prednosti više modela umjesto da se oslanjamo samo na jedan, to se ti modeli više mogu specijalizirati, proširujući granice mogućnosti.

Sustavi s više modela mogu omogućiti veću specijalizaciju, sposobnost i učinkovitost. Izvor: Not Diamond

Sve važniji obrazac za iskorištavanje prednosti različitih modela je usmjeravanje — dinamičko slanje upita najprikladnijem modelu, dok se također iskorištavaju jeftiniji, brži modeli kada to ne umanjuje kvalitetu. Usmjeravanje nam omogućuje da iskoristimo sve prednosti specijalizacije — veću točnost s nižim troškovima i latencijom — bez odricanja od robusnosti generalizacije.

Jednostavna demonstracija moći usmjeravanja može se vidjeti u činjenici da su većina vrhunskih svjetskih modela i sami usmjerivači: izgrađeni su pomoću Mješavina Expert arhitekture koje usmjeravaju svaku sljedeću generaciju tokena na nekoliko desetaka stručnih pod-modela. Ako je istina da LLM eksponencijalno proliferiraju nejasne robe, tada usmjeravanje mora postati bitan dio svakog skupa umjetne inteligencije.

Postoji gledište da će se LLM-ovi zaustaviti kako dosegnu ljudsku inteligenciju — da ćemo se, kako u potpunosti zasitimo sposobnosti, udružiti oko jednog općeg modela na isti način na koji smo se udružili oko AWS-a ili iPhonea. Niti jedna od tih platformi (ili njihovi konkurenti) nije deseterostruko povećala svoje mogućnosti u proteklih nekoliko godina — pa bismo se mogli osjećati ugodno u njihovim ekosustavima. Vjerujemo, međutim, da AI neće stati na ljudskoj razini inteligencije; nastavit će se daleko preko svih granica koje bismo mogli i zamisliti. Dok bude tako, postat će sve više fragmentiran i specijaliziran, baš kao što bi to učinio bilo koji drugi prirodni sustav.

Ne možemo precijeniti koliko je fragmentacija AI modela vrlo dobra stvar. Fragmentirana tržišta su učinkovita tržišta: ona daju moć kupcima, povećavaju inovacije i minimiziraju troškove. I u onoj mjeri u kojoj možemo iskoristiti mreže manjih, specijaliziranijih modela umjesto da sve šaljemo kroz unutrašnjost jednog divovskog modela, idemo prema mnogo sigurnijoj, razumljivijoj i upravljivijoj budućnosti za AI.

Najveći izumi nemaju vlasnika. Nasljednici Bena Franklina nemaju struju. Turingovo imanje ne posjeduje sva računala. AI je nedvojbeno jedan od najvećih izuma čovječanstva; vjerujemo da će njegova budućnost biti – i trebala bi biti – multi-model.

Zack Kass je bivši voditelj go-to-market tvrtke OpenAI.

Tomás Hernando Kofman je suosnivač i izvršni direktor Ne Diamond.

DataDecisionMakers

Dobrodošli u VentureBeat zajednicu!

DataDecisionMakers je mjesto gdje stručnjaci, uključujući tehničke osobe koje rade s podacima, mogu dijeliti uvide i inovacije u vezi s podacima.

Ako želite čitati o vrhunskim idejama i najnovijim informacijama, najboljim praksama i budućnosti podataka i podatkovne tehnologije, pridružite nam se na DataDecisionMakers.

Možete čak razmisliti o doprinosu vlastitom članku!

Pročitajte više od DataDecisionMakers



Web izvor

Povezani sadržaji

  • Instagram lansira novu aplikaciju za uređivanje videozapisa ‘Uredi’
  • Dosadi se AI koji strugava vaš sadržaj? Ovaj blokator otvorenog koda može pomoći – evo kakoDosadi se AI koji strugava vaš sadržaj? Ovaj blokator otvorenog koda može pomoći – evo kako
  • Obnova Alexa: Kako Amazon miješa modele, agente i upotrebu preglednika za pametnije AIObnova Alexa: Kako Amazon miješa modele, agente i upotrebu preglednika za pametnije AI
  • Kako je jedno pokus keto krenuo u novi rat u svijetu prehraneKako je jedno pokus keto krenuo u novi rat u svijetu prehrane
  • Kako računalo crta krivulje | Bézierova krivuljaKako računalo crta krivulje | Bézierova krivulja
  • Novi dokazi proširuju granice onoga što se ne može znatiNovi dokazi proširuju granice onoga što se ne može znati

Previous Article

Još uvijek ima vremena da dočekamo sljedeću globalnu pandemiju

Next Article

Naoe iz Assassin's Creed Shadows ima svoj brzi "Naruto run"

Posljednje objave

Njemačka država zamjenjuje Microsoft Exchange i Outlook e-poštom otvorenog koda

Samsung nudi 100 dolara trenutačne ponude novim korisnicima XR slušalica prije nego što je Upakiran

Google fotografije stvaranje kolaža dobiva velika poboljšanja

Google fotografije stvaranje kolaža dobiva velika poboljšanja

Sadržaj

  • 1 Jezični modeli su nejasna roba
  • 2 Multimodalna orkestracija i usmjeravanje

Novosti

  • Njemačka država zamjenjuje Microsoft Exchange i Outlook e-poštom otvorenog koda 15. listopada 2025
  • Samsung nudi 100 dolara trenutačne ponude novim korisnicima XR slušalica prije nego što je Upakiran 15. listopada 2025
  • Google fotografije stvaranje kolaža dobiva velika poboljšanja 14. listopada 2025
  • Assassin’s Creed Franchise olovo ostavlja Ubisoft nakon formiranja podružnice Tencent 14. listopada 2025
  • Sita otkriva prevlake za vlaknastim optičkim aerodromima 14. listopada 2025
  • Jezični modeli koji se samo usavršavaju postaju stvarnost s MIT-ovom ažuriranom tehnikom pečata 14. listopada 2025
  • Kako učiniti STEM smiješnim – i idi virusno radeći 14. listopada 2025
  • 10 Windows aplikacija otvorenog koda ne mogu živjeti – i svi su besplatni 14. listopada 2025
  • Isprobao sam pametne naočale s XMEMS zvučnicima i aktivnim hlađenjem – i puni su obećanja 13. listopada 2025
  • Moramo se približiti pokretanju Galaxy XR 13. listopada 2025

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice