Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj o AI pokrivenosti vodećoj u industriji. Saznajte više
Devetog dana niza najava proizvoda s temom blagdana poznatih kao “12 dana OpenAI-ja”, OpenAI izbacuje svoj najnapredniji model, o1, programerima trećih strana kroz svoje aplikacijsko programsko sučelje (API).
Ovo označava veliki korak naprijed za razvojne programere koji žele izgraditi nove napredne AI aplikacije ili integrirati najnapredniju OpenAI tehnologiju u svoje postojeće aplikacije i tijekove rada, bilo da su okrenuti poduzećima ili potrošačima.
Ako još niste upoznati s OpenAI-jevom serijom o1, evo kratkog pregleda: najavljena je još u rujnu 2024., prva u novoj “obitelji” modela tvrtke ChatGPT, koja prelazi okvire velikih jezičnih modela (LLM-ova) GPT-obiteljska serija i nudi mogućnosti “rezoniranja”.
U osnovi, obitelji modela o1 — o1 i o1 mini — treba više vremena da odgovore na upite korisnika s odgovorima, ali sami provjeravaju dok formuliraju odgovor vidjeti jesu li točni i izbjeći halucinacije. U to je vrijeme OpenAI rekao da o1 može riješiti složenije probleme na razini doktora znanosti – nešto potvrđuju i korisnici iz stvarnog svijeta.
Dok su programeri ranije imali pristup pretpreglednoj verziji o1 na temelju koje su mogli izraditi vlastite aplikacije – recimo, doktorski savjetnik ili asistent u laboratoriju – izdanje potpunog o1 modela spremno za proizvodnju putem API-ja donosi poboljšanu izvedbu, manju latenciju , i nove značajke koje olakšavaju integraciju u aplikacije iz stvarnog svijeta.
OpenAI je već učinio o1 dostupnim potrošačima kroz svoje ChatGPT Plus i Pro planove prije otprilike dva i pol tjedna, te dodao mogućnost da modeli analiziraju i reagiraju na slike i datoteke koje su prenijeli korisnici.
Uz današnje lansiranje, OpenAI je najavio značajna ažuriranja svog Realtime API-ja, zajedno sa smanjenjem cijena i novom metodom finog podešavanja koja programerima daje veću kontrolu nad njihovim modelima.
Sadržaj objave
Puni o1 model sada je dostupan programerima putem OpenAI API-ja
Novi model o1, dostupan kao o1-2024-12-17, osmišljen je za izvrsnost u složenim zadacima zaključivanja u više koraka. U usporedbi s ranijom verzijom o1-preview, ovo izdanje poboljšava točnost, učinkovitost i fleksibilnost.
OpenAI izvješćuje o značajnim poboljšanjima u nizu mjerila, uključujući zadatke kodiranja, matematike i vizualnog razmišljanja.
Na primjer, rezultati kodiranja na SWE-bench Verified porasli su s 41,3 na 48,9, dok je izvedba na AIME testu usmjerenom na matematiku skočila s 42 na 79,2. Ova poboljšanja čine o1 prikladnim za izradu alata koji pojednostavljuju korisničku podršku, optimiziraju logistiku ili rješavaju izazovne analitičke probleme.
Nekoliko novih značajki poboljšavaju funkcionalnost o1 za programere. Strukturirani izlazi omogućuju pouzdano podudaranje odgovora s prilagođenim formatima kao što su JSON sheme, osiguravajući dosljednost u interakciji s vanjskim sustavima. Pozivanje funkcija pojednostavljuje proces povezivanja o1 s API-jima i bazama podataka. A sposobnost razmišljanja o vizualnim unosima otvara slučajeve upotrebe u proizvodnji, znanosti i kodiranju.
Programeri također mogu fino podesiti ponašanje o1 pomoću novog parametra reasoning_effort, koji kontrolira koliko dugo model troši na zadatak kako bi uravnotežio performanse i vrijeme odziva.
OpenAI-jev Realtime API dobiva poticaj za napajanje inteligentnih glasovnih/audio AI pomoćnika za razgovor
OpenAI je također najavio ažuriranja svog Realtime API-ja, dizajniranog za pokretanje prirodnih razgovora s niskom latencijom kao što su glasovni pomoćnici, alati za prevođenje uživo ili virtualni učitelji.
Nova WebRTC integracija pojednostavljuje izradu aplikacija temeljenih na glasu pružajući izravnu podršku za strujanje zvuka, potiskivanje buke i kontrolu zagušenja. Programeri sada mogu integrirati mogućnosti u stvarnom vremenu uz minimalno postavljanje, čak i u promjenjivim mrežnim uvjetima.
OpenAI također uvodi nove cijene za svoj Realtime API, smanjujući troškove za 60% za GPT-4o audio na 40 USD za jedan milijun ulaznih tokena i 80 USD za jedan milijun izlaznih tokena.
Troškovi predmemoriranog audio ulaza smanjeni su za 87,5%, sada po cijeni od 2,50 USD za milijun ulaznih tokena. Kako bi dodatno poboljšao pristupačnost, OpenAI dodaje GPT-4o mini, manji, troškovno učinkovit model čija je cijena 10 USD za jedan milijun ulaznih tokena i 20 USD za jedan milijun izlaznih tokena.
Cijene tekstualnih tokena za GPT-4o mini također su znatno niže, počevši od 0,60 USD za ulazne tokene i 2,40 USD za izlazne tokene.
Osim cijena, OpenAI daje programerima veću kontrolu nad odgovorima u Realtime API-ju. Značajke poput istodobnih izvanpojasnih odgovora omogućuju izvođenje pozadinskih zadataka, poput moderiranja sadržaja, bez prekidanja korisničkog iskustva. Programeri također mogu prilagoditi kontekste unosa kako bi se usredotočili na određene dijelove razgovora i kontrolirali kada se glasovni odgovori pokreću za točnije i besprijekornije interakcije.
Fino podešavanje preferencija nudi nove mogućnosti prilagodbe
Drugi veliki dodatak je fino podešavanje preferencijametoda za prilagodbu modela na temelju preferencija korisnika i programera.
Za razliku od nadziranog finog ugađanja, koje se oslanja na točne ulazno-izlazne parove, fino ugađanje preferencija koristi usporedbe parova kako bi naučilo model koji su odgovori preferirani. Ovaj je pristup posebno učinkovit za subjektivne zadatke, kao što je sažimanje, kreativno pisanje ili scenariji u kojima su ton i stil važni.
Rano testiranje s partnerima kao što je Rogo AI, koji izrađuje pomoćnike za financijske analitičare, pokazuje obećavajuće rezultate. Rogo je izvijestio da je fino podešavanje preferencija pomoglo njihovom modelu da bolje obrađuje složene upite izvan distribucije od tradicionalnog finog podešavanja, poboljšavajući točnost zadatka za više od 5%. Značajka je sada dostupna za gpt-4o-2024-08-06 i gpt-4o-mini-2024-07-18, s planovima za proširenje podrške na novije modele početkom sljedeće godine.
Novi SDK-ovi za Go i Java programere
Kako bi pojednostavio integraciju, OpenAI proširuje svoju službenu ponudu SDK-a beta izdanjima za Go i Javu. Ovi SDK-ovi pridružuju se postojećim bibliotekama Python, Node.js i .NET, olakšavajući programerima interakciju s OpenAI modelima u više programskih okruženja. Go SDK posebno je koristan za izgradnju skalabilnih pozadinskih sustava, dok je Java SDK prilagođen za poslovne aplikacije koje se oslanjaju na snažno tipkanje i robusne ekosustave.
S ovim ažuriranjima, OpenAI nudi programerima prošireni alat za izradu naprednih, prilagodljivih aplikacija koje pokreće AI. Bilo kroz poboljšane sposobnosti razmišljanja o1, poboljšanja API-ja u stvarnom vremenu ili opcije finog podešavanja, najnovije ponude OpenAI-ja imaju za cilj isporučiti i poboljšanu izvedbu i isplativost za tvrtke koje pomiču granice integracije umjetne inteligencije.
Web izvor