Želite pametnije uvide u vašu pristiglu poštu? Prijavite se za naše tjedne biltene kako biste dobili samo ono što je važno za vođe AI, podataka i sigurnosti. Pretplatite se sada
Evo analogije: autoceste nisu postojale u SAD -u tek nakon 1956. godine, kada predviđen Autor administracije predsjednika Dwighta D. Eisenhowera – Ipak super brzi, moćni automobili poput Porschea, BMW -a, Jaguara, Ferrarija i drugih postojali su već desetljećima.
Mogli biste reći da je AI na istoj točki okretaja: iako modeli postaju sve sposobniji, izvedbeni i sofisticiraniji, kritična infrastruktura koja im je potrebna da bi se stvorila istinska inovacija u stvarnom svijetu tek treba u potpunosti izgraditi.
“Sve što smo učinili je stvoriti vrlo dobre motore za automobil, a mi se super uzbuđujemo, kao da imamo ovaj potpuno funkcionalni sustav autocesta”, rekao je za VentureBeat Arun Chandrasekaran, Gartner, razlikovao VP analitičar.
To dovodi do svojevrsnog platoa, u modelnim mogućnostima kao što je OpenAi’s GPT-5: Iako je važan korak naprijed, on sadrži samo slabe blještave uistinu agencije AI.
AI skaliranje pogađa svoje granice
Power ograničenja, rastući troškovi tokena i kašnjenja zaključivanja preoblikovaju Enterprise AI. Pridružite se našem ekskluzivnom salonu kako biste otkrili kako su vrhunski timovi:
- Pretvaranje energije u stratešku prednost
- Arhitekturiste učinkovite zaključke za stvarne propusne dobitke
- Otključavanje natjecateljskog ROI -a s održivim AI sustavima
Osigurajte svoje mjesto da ostanete naprijed:: https://bit.ly/4mwgngo
“To je vrlo sposoban model, to je vrlo svestran model, postigao je vrlo dobar napredak u određenim domenama”, rekao je Chandrasekaran. “Ali moje mišljenje je da je to više inkrementalni napredak, a ne radikalan napredak ili radikalno poboljšanje, s obzirom na sva visoka očekivanja koja su otvorena postavljena u prošlosti.”
Sadržaj objave
GPT-5 se poboljšava u tri ključna područja
Da budemo jasni, OpenAi je postigao napredak s GPT-5, prema Gartneru, uključujući i zadatke kodiranja i multi-modalne mogućnosti.
Chandrasekaran je istaknuo da se OpenAi okrenuo kako bi GPT-5 bio “vrlo dobar” u kodiranju, jasno osjetivši ogromnu priliku Gen AI-ja u inženjerskom inženjerstvu poduzeća i ciljajući na vodstvo konkurentskog Anthropica u tom području.
U međuvremenu, napredak GPT-5 u modalitetima izvan teksta, posebno u govoru i slikama, pruža nove mogućnosti integracije za poduzeća, napomenuo je Chandrasekaran.
GPT-5 također, ako suptilno, napreduje AI agent i dizajn orkestracije, zahvaljujući poboljšanoj upotrebi alata; Model može nazvati API-je i alate treće strane i obavljati paralelno pozivanje alata (istovremeno obraditi više zadataka). Međutim, to znači da poduzetni sustavi moraju imati kapacitet za rješavanje istodobnih zahtjeva API -ja u jednoj sesiji, ističe Chandrasekaran.
Planiranje s više koraka u GPT-5 omogućava veću poslovnu logiku da se prebiva unutar samog modela, smanjujući potrebu za vanjskim motorima tijeka rada i njegovim većim kontekstnim prozorima (8K za besplatne korisnike, 32K za plus 20 USD mjesečno i 128 tisuća za Pro u iznosu od 200 USD mjesečno) može “preusmjeriti obrasce AI arhitekture”, rekao je.
To znači da aplikacije koje su se prethodno oslanjale na složene cjevovode za generaciju (RAG) za proizvodnju (RAG) za rad oko ograničenja konteksta sada mogu prenijeti mnogo veće skupove podataka izravno na modele i pojednostaviti neke tijekove rada. Ali to ne znači da je krpa nebitna; “Dohvaćanje samo najrelevantnijih podataka i dalje je brže i isplativije nego što je uvijek slanje ogromnih ulaza”, istaknuo je Chandrasekaran.
Gartner vidi prelazak na hibridni pristup s manje strogog pretraživanja, a devci koriste GPT-5 za obradu “većih, mesier konteksta”, istovremeno poboljšavajući učinkovitost.
Na prednjoj strani troškova, GPT-5 “značajno” smanjuje naknade za upotrebu API-ja; Troškovi najviše razine iznose 1,25 USD na milijun ulaznih tokena i 10 USD na 1 milijuna izlaznih tokena, što ga čini usporedivim s modelima poput GEMINI 2.5, ali ozbiljno podcjenjivanje Clauda Opusa. Međutim, omjer ulazne/izlazne cijene GTP-5 viši je od ranijih modela, koje bi čelnici AI trebali uzeti u obzir prilikom razmatranja GTP-5 za scenarije visoke upotrebe, savjetovao je Chandrasekaran.
Bye-bye Prethodne GPT verzije (vrsta)
U konačnici, GPT-5 je dizajniran tako da na kraju zamijeni GPT-4O i O-seriju (oni su u početku bili zalazak sunca, a zatim su neki ponovno uvedeni od Openaia zbog neslaganja korisnika). Tri veličine modela (PRO, MINI, Nano) omogućit će arhitektima da razine usluge na temelju troškova i kašnjenja; Jednostavni upiti mogu se baviti manjim modelima i složenim zadacima po cijelom modelu, napominje Gartner.
Međutim, razlike u izlaznim formatima, ponašanju memorije i poziva na funkciju mogu zahtijevati pregled koda i prilagođavanje, a budući da GPT-5 može učiniti da su prethodna rješenja zastarjela, Devs bi trebali revidirati svoje brze predloške i upute za sustav.
Na kraju sunčanim prethodnim verzijama, “Mislim da ono što OpenAi pokušava učiniti je apstraktno ta razina složenosti daleko od korisnika”, rekao je Chandrasekaran. “Često nismo najbolji ljudi koji donose te odluke, a ponekad čak i donosimo pogrešne odluke, tvrdio bih.”
Još jedna činjenica koja stoji iza faza: “Svi znamo da Openai ima problem s kapacitetom”, rekao je, i tako je sklopio partnerstva s Microsoftom, Oracle (Project Stargate), Googleom i drugima kako bi osigurali izračunavanje kapaciteta. Izvođenje više generacija modela zahtijevalo bi više generacija infrastrukture, stvarajući nove posljedice troškova i fizička ograničenja.
Novi rizici, savjet za usvajanje GPT-5
OpenAI tvrdi da je smanjio stopu halucinacije do 65% u GPT-5 u usporedbi s prethodnim modelima; To može pomoći u smanjenju rizika od usklađenosti i učiniti model prikladnijim za slučajeve upotrebe poduzeća, a objašnjenja njegova lanaca (COT) podržavaju reviziju i usklađivanje regulacije, napominje Gartner.
Istodobno, ove niže stope halucinacije, kao i napredno obrazloženje GPT-5 i multimodalna obrada, mogli bi pojačati zlouporabu poput napredne prevare i generiranja krađe identiteta. Analitičari savjetuju da kritični tijekovi rada ostaju pod ljudskim pregledom, čak i ako s manje uzorkovanja.
Tvrtka također savjetuje da vođe poduzeća:
- Pilot i referentni GPT-5 u slučajevima kritične uporabe misije, izvodeći bočne procjene protiv drugih modela kako bi se utvrdile razlike u točnosti, brzini i korisničkom iskustvu.
- Pratite prakse poput vibE kodiranja tog izlaganja podataka o riziku (ali bez uvredljive u vezi s tim ili riskirajući nedostatke ili kvarove zaštitnika).
- Revidirati politike i smjernice upravljanja za rješavanje novih ponašanja u modelu, proširenih prozora konteksta i sigurnih dovršetka i kalibriranja mehanizama nadzora.
- Eksperimentirajte s integracijama alata, parametrima obrazloženja, predmemoriranjem i dimenzioniranjem modela kako biste optimizirali performanse i koristili ugrađeno dinamičko usmjeravanje kako biste odredili pravi model za pravi zadatak.
- Planovi revizije i nadogradnje za proširene mogućnosti GPT-5. To uključuje potvrđivanje kvota API -ja, revizijske staze i multimodalne cjevovode za podršku novim značajkama i povećanu propusnost. Važno je i rigorozno ispitivanje integracije.
Agenti ne trebaju samo više računanja; Potrebna im je infrastruktura
Nema sumnje, agentički AI je “super vruća tema danas”, primijetio je Chandrasekaran i jedno je od najboljih područja za ulaganje u Gartnerove 2025. hipe ciklus za gen ai. Istodobno, tehnologija je pogodila Gartnerov “vrhunac napuhanih očekivanja”, što znači da je doživjela široku publicitet zbog ranih priča o uspjehu, zauzvrat gradeći nerealna očekivanja.
Ovaj trend obično slijedi ono što Gartner naziva “korito razočaranja”, kada se kamate, uzbuđenje i ulaganje hlade jer eksperimenti i implementacije ne dostavljaju (zapamtite: postojale su dvije zapažene AI zime od 1980 -ih).
“Mnogo dobavljača je prekrivanje proizvoda izvan onoga za što su proizvodi sposobni”, rekao je Chandrasekaran. “Gotovo je kao da ih pozicioniraju kao da su spremni za proizvodnju, spremna za poduzeće i isporučit će poslovnu vrijednost u zaista kratkom vremenu.”
Međutim, u stvarnosti je progon između kvalitete proizvoda u odnosu na očekivanje širok, napomenuo je. Gartner ne vidi agencijske implementacije na cijelom poduzeću; Oni koje vide nalaze se u “malim, uskim džepovima” i specifičnim domenama poput softverskog inženjerstva ili nabave.
“Ali čak ni ti tijekovi rada nisu u potpunosti autonomni; oni su često ili ljudsko ili poluautonomne prirode”, objasnio je Chandrasekaran.
Jedan od ključnih krivca je nedostatak infrastrukture; Agenti zahtijevaju pristup širokom nizu poslovnih alata i moraju imati mogućnost komuniciranja s podacima i SaaS aplikacijama. Istodobno, mora postojati odgovarajući sustavi upravljanja identitetom i pristupom za kontrolu ponašanja i pristupa agensa, kao i nadzor nad vrstama podataka kojima mogu pristupiti (nisu osobno prepoznatljive ili osjetljive), napomenuo je.
I na kraju, poduzeća moraju biti sigurna da su informacije koje agenti proizvode pouzdane, što znači da nisu pristranosti i ne sadrže halucinacije ili lažne podatke.
Da bi stigli tamo, dobavljači moraju surađivati i usvojiti otvorenije standarde za komunikaciju s agentom-unošenjem i agentom za agente, savjetovao je.
“Iako agenti ili temeljne tehnologije mogu napredovati, ova orkestracija, upravljanje i podatkovni sloj još uvijek čeka da budu izgrađeni kako bi agenti uspjeli”, rekao je Chandrasekaran. “Tu danas vidimo puno trenja.”
Da, industrija napreduje s AI rezonovanjem, ali se još uvijek bori da AI shvati kako funkcionira fizički svijet. AI uglavnom djeluje u digitalnom svijetu; Nema snažna sučelja u fizičkom svijetu, iako se poboljšavaju u prostornoj robotici.
Ali, “Mi smo vrlo, vrlo, vrlo, vrlo rana faza za takve vrste okruženja”, rekao je Chandrasekaran.
Da bi se istinski postigao značajni napredak, zahtijeva “revoluciju” u arhitekturi modela ili obrazloženja. “Ne možete biti na trenutnoj krivulji i samo očekujete više podataka, više računanja i nadamo se da ćete doći do AGI -a”, rekla je.
To je vidljivo u dugo očekivanom rotovu GPT-5: krajnji cilj koji je OpenAi definirao za sebe bio je AGI, ali “zaista je očito da nismo ni blizu toga”, rekao je Chandrasekaran. U konačnici, “Još uvijek smo jako, jako daleko od AGI -ja.”
Web izvor