Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj o AI pokrivenosti vodećoj u industriji. Saznajte više
Kraj 2024. godine donio je obračune za umjetnu inteligenciju, budući da su se stručnjaci u industriji bojali da napredak prema još inteligentnijoj umjetnoj inteligenciji usporava. Ali OpenAI-jev o3 model, najavljen prošli tjedan, izazvao je novi val uzbuđenja i rasprave, te sugerira da velika poboljšanja tek dolaze 2025. godine i kasnije.
Ovaj model, najavljen za ispitivanje sigurnosti među istraživačima, ali još nije javno objavljen, postigao impresivan rezultat na važnoj metrici ARC. Referentnu vrijednost izradio je François Chollet, poznati istraživač umjetne inteligencije i tvorac okvira za duboko učenje Keras, a posebno je dizajniran za mjerenje sposobnosti modela da se nosi s novim, inteligentnim zadacima. Kao takav, pruža smislenu mjeru napretka prema istinski inteligentnim sustavima umjetne inteligencije.
Značajno je da je o3 postigao 75,7% na referentnoj vrijednosti ARC-a u standardnim računalnim uvjetima i 87,5% koristeći visoke računalne zahtjeve, značajno nadmašujući prethodne vrhunske rezultate, kao što su 53% koje je postigao Claude 3,5.
Ovo postignuće o3 predstavlja iznenađujući napredak, prema Cholletu, koji je imao bio kritičar sposobnosti velikih jezičnih modela (LLM) da postignu ovu vrstu inteligencije. Naglašava inovacije koje bi mogle ubrzati napredak prema superiornoj inteligenciji, bez obzira na to zovemo li je opća umjetna inteligencija (AGI) ili ne.
AGI je razvikani pojam i loše definiran, ali signalizira cilj: inteligencija sposobna prilagoditi se novim izazovima ili pitanjima na načine koji nadilaze ljudske sposobnosti.
OpenAI-jev o3 rješava specifične prepreke u razmišljanju i prilagodljivosti koje su dugo onemogućavale velike jezične modele. U isto vrijeme, otkriva izazove, uključujući visoke troškove i uska grla u učinkovitosti svojstvena guranju ovih sustava do njihovih granica. Ovaj će članak istražiti pet ključnih inovacija iza modela o3, od kojih su mnoge poduprte napretkom u učenju s potkrepljenjem (RL). Temeljit će se na uvidima vodećih u industriji, OpenAI-jeve tvrdnjei iznad svega Cholletova važna analizakako bismo otkrili što ovaj napredak znači za budućnost umjetne inteligencije dok ulazimo u 2025.
Pet temeljnih inovacija o3
1. “Programska sinteza” za prilagodbu zadataka
OpenAI-jev o3 model uvodi novu mogućnost nazvanu “programska sinteza”, koja mu omogućuje dinamičko kombiniranje stvari koje je naučio tijekom prethodne obuke – specifičnih obrazaca, algoritama ili metoda – u nove konfiguracije. Te stvari mogu uključivati matematičke operacije, isječke koda ili logičke postupke s kojima se model susreo i generalizirao tijekom svoje opsežne obuke na različitim skupovima podataka. Što je najvažnije, sinteza programa omogućuje o3 rješavanje zadataka koje nikada nije izravno vidio u obuci, kao što je rješavanje naprednih izazova kodiranja ili rješavanje novih logičkih zagonetki koje zahtijevaju razmišljanje izvan naučene primjene naučenih informacija. François Chollet opisuje sintezu programa kao sposobnost sustava da rekombinira poznate alate na inovativne načine – poput kuhara koji spravlja jedinstveno jelo koristeći poznate sastojke. Ova značajka označava odmak od ranijih modela, koji primarno dohvaćaju i primjenjuju unaprijed naučeno znanje bez rekonfiguracije — a također je i ona koju je Chollet zagovarao prije nekoliko mjeseci kao jedini održivi put naprijed prema boljoj inteligenciji.
2. Pretraživanje programa na prirodnom jeziku
Srž prilagodljivosti o3 je njegova upotreba lanaca misli (CoTs) i sofisticiranog procesa pretraživanja koji se odvija tijekom zaključivanja—kada model aktivno generira odgovore u stvarnom ili postavljenom okruženju. Ovi CoT-ovi su korak-po-korak upute prirodnog jezika koje model generira za istraživanje rješenja. Vođen modelom evaluatora, o3 aktivno generira više putova rješenja i ocjenjuje ih kako bi odredio opciju koja najviše obećava. Ovaj pristup odražava ljudsko rješavanje problema, gdje razmišljamo o različitim metodama prije nego što odaberemo najbolju. Na primjer, u zadacima matematičkog zaključivanja, o3 generira i procjenjuje alternativne strategije kako bi došao do točnih rješenja. Konkurenti poput Anthropica i Googlea eksperimentirali su sa sličnim pristupima, ali implementacija OpenAI-ja postavlja novi standard.
3. Model ocjenjivača: Nova vrsta razmišljanja
O3 aktivno generira više putova rješenja tijekom zaključivanja, ocjenjujući svaki uz pomoć integriranog modela evaluatora kako bi odredio opciju koja najviše obećava. Obučavanjem evaluatora na stručnim podacima, OpenAI osigurava da o3 razvije snažnu sposobnost zaključivanja kroz složene probleme u više koraka. Ova značajka omogućuje modelu da djeluje kao sudac vlastitog razmišljanja, približavajući velike jezične modele mogućnosti “razmišljanja”, a ne jednostavnog odgovora.
4. Izvršavanje vlastitih programa
Jedna od najrevolucionarnijih značajki o3 je njegova sposobnost izvršavanja vlastitih lanaca misli (CoT) kao alata za prilagodljivo rješavanje problema. Tradicionalno, CoT-ovi su korišteni kao okviri za zaključivanje korak po korak za rješavanje specifičnih problema. OpenAI-jev o3 proširuje ovaj koncept iskorištavanjem CoT-ova kao građevnih blokova za višekratnu upotrebu, omogućujući modelu pristup novim izazovima s većom prilagodljivošću. S vremenom ti CoT-ovi postaju strukturirani zapisi strategija rješavanja problema, slično načinu na koji ljudi dokumentiraju i usavršavaju svoje učenje kroz iskustvo. Ova sposobnost pokazuje kako o3 pomiče granice u prilagodljivom razmišljanju. Prema OpenAI inženjer Nat McAleeseizvedba o3 u neviđenim programerskim izazovima, kao što je postizanje CodeForces ocjene iznad 2700, prikazuje njegovu inovativnu upotrebu CoT-ova u natjecanju s vrhunskim konkurentnim programerima. Ova ocjena 2700 svrstava model na razinu “Grandmaster”, među najboljim svjetskim ešalonom konkurentnih programera.
5. Pretraživanje programa vođeno dubokim učenjem
O3 koristi pristup temeljen na dubokom učenju tijekom zaključivanja kako bi procijenio i precizirao potencijalna rješenja za složene probleme. Ovaj proces uključuje generiranje više putova rješenja i korištenje obrazaca naučenih tijekom obuke za procjenu njihove održivosti. François Chollet i drugi stručnjaci primijetili su da ovo oslanjanje na ‘neizravne evaluacije’—gdje se rješenja procjenjuju na temelju internih metrika, a ne testiranih u scenarijima stvarnog svijeta—može ograničiti robusnost modela kada se primjenjuje na nepredvidive kontekste ili kontekste specifične za poduzeće.
Osim toga, ovisnost o3 o skupovima podataka označenih stručnjacima za obuku svog modela evaluatora izaziva zabrinutost oko skalabilnosti. Iako ovi skupovi podataka povećavaju preciznost, oni također zahtijevaju značajan ljudski nadzor, što može ograničiti prilagodljivost i isplativost sustava. Chollet naglašava da ovi kompromisi ilustriraju izazove skaliranja sustava razmišljanja izvan kontroliranih referentnih vrijednosti kao što je ARC-AGI.
U konačnici, ovaj pristup pokazuje i potencijal i ograničenja integriranja tehnika dubokog učenja s programskim rješavanjem problema. Iako o3 inovacije prikazuju napredak, one također naglašavaju složenost izgradnje istinski generaliziranih AI sustava.
Veliki izazov za o3
OpenAI-jev o3 model postiže impresivne rezultate, ali uz značajne računalne troškove, trošeći milijune tokena po zadatku — a ovaj skupi pristup najveći je izazov modela. François Chollet, Nat McAleese i drugi ističu zabrinutost zbog ekonomske izvedivosti takvih modela, naglašavajući potrebu za inovacijama koje balansiraju performanse i pristupačnost.
Izdanje o3 izazvalo je pozornost cijele AI zajednice. Konkurenti poput Googlea s Geminijem 2 i kineskih tvrtki poput DeepSeek 3 također napreduju, čineći izravne usporedbe izazovnim sve dok se ovi modeli ne testiraju šire.
Mišljenja o o3 su podijeljena: neki hvale njegove tehničke napretke, dok drugi navode visoke troškove i nedostatak transparentnosti, sugerirajući da će njegova stvarna vrijednost postati jasna tek opširnijim testiranjem. Jedna od najvećih kritika došla je od Dennyja Zhoua iz Google DeepMinda, koji je implicitno napao oslanjanje modela na skaliranje i mehanizme pretraživanja učenjem potkrepljenja (RL). kao potencijalna „slijepa ulica”, tvrdeći umjesto toga da bi model trebao moći naučiti razmišljati iz jednostavnije fino podešavanje procesima.
Što to znači za AI poduzeća
Bez obzira na to predstavlja li savršen smjer za daljnje inovacije, za poduzeća, novootkrivena prilagodljivost o3 pokazuje da će umjetna inteligencija na ovaj ili onaj način nastaviti transformirati industrije, od korisničke službe do znanstvenog istraživanja, u budućnosti.
Igračima u industriji trebat će neko vrijeme da probave što je o3 ovdje isporučio. Za poduzeća koja su zabrinuta zbog visokih računalnih troškova o3, OpenAI-jevo nadolazeće izdanje smanjene “o3-mini” verzije modela predstavlja potencijalnu alternativu. Iako žrtvuje neke od potpunih mogućnosti modela, o3-mini obećava pristupačniju opciju za tvrtke s kojima mogu eksperimentirati — zadržavajući velik dio temeljnih inovacija uz značajno smanjenje zahtjeva za računanjem vremena testiranja.
Možda će proći neko vrijeme prije nego što se poslovne tvrtke dočepaju modela o3. OpenAI kaže da se o3-mini očekuje do kraja siječnja. Puno izdanje o3 uslijedit će nakon toga, iako rokovi ovise o povratnim informacijama i uvidima stečenim tijekom trenutne faze testiranja sigurnosti. Poduzećima je dobro savjetovati da ga testiraju. Htjet će utemeljiti model sa svojim podacima i slučajevima korištenja i vidjeti kako to stvarno funkcionira.
Ali u međuvremenu, oni već mogu koristiti mnoge druge kompetentne modele koji su već dostupni i dobro testirani, uključujući vodeći model o4 i druge konkurentske modele — od kojih su mnogi već dovoljno robusni za izgradnju inteligentnih, prilagođenih aplikacija koje daju praktičnu vrijednost .
Doista, sljedeće godine ćemo raditi u dvije brzine. Prvi je u postizanju praktične vrijednosti iz AI aplikacija i razradi onoga što modeli mogu učiniti s AI agentima i drugim već postignutim inovacijama. Drugi će sjediti s kokicama i gledati kako se odvija utrka inteligencije — a svaki napredak bit će samo šlag na torti koja je već isporučena.
Za više o inovacijama o3, pogledajte cijelu raspravu na YouTubeu između mene i Sama Witteveena u nastavku i pratite VentureBeat za kontinuirano izvještavanje o napretku umjetne inteligencije.
Web izvor
