Želite pametnije uvide u vašu pristiglu poštu? Prijavite se za naše tjedne biltene kako biste dobili samo ono što je važno za vođe AI, podataka i sigurnosti. Pretplatite se sada
Pokretanje OpenAi-ovog dugo očekivanog novog modela, GPT-5, jest odlazi na stjenovit početak najmanje reći.
Čak opraštajući pogreške u ljestvicama i glasovni demonstracije Tijekom jučerašnjeg prezentacija novog modela (zapravo četiri odvojena modela i način rada “razmišljanja” koji se može angažirati za tri), a Broj korisničkih izvještaja pojavio se nakon puštanja GPT-5 koji pokazuje da loše griješi Pri rješavanju relativno jednostavnih problema koji prethode otvorenim modelima – i suparnici iz konkurencije AI laboratorija – odgovaraju pravilno.
Na primjer, znanstvenik podataka Colin Fraser objavio snimke zaslona prikazivanje GPT-5 Pogrešan je matematički dokaz (bilo da je 8,888 ponavljanje jednako 9-to je, naravno, ne).
Također nije uspio na jednoj aritmetici algebre problem Ti bi osnovni školci vjerojatno mogli zabiti, 5,9 = x + 5,11.
AI skaliranje pogađa svoje granice
Power ograničenja, rastući troškovi tokena i kašnjenja zaključivanja preoblikovaju Enterprise AI. Pridružite se našem ekskluzivnom salonu kako biste otkrili kako su vrhunski timovi:
- Pretvaranje energije u stratešku prednost
- Arhitekturiste učinkovite zaključke za stvarne propusne dobitke
- Otključavanje natjecateljskog ROI -a s održivim AI sustavima
Osigurajte svoje mjesto da ostanete naprijed:: https://bit.ly/4mwgngo
Korištenje GPT-5 za sudeći OpenAijeve vlastite grafikone prezentacije također nisu donijele korisne ili ispravne odgovore.
Također nije uspio na Ovaj zamršeniji problem matematičke riječi u nastavku (što je, da budemo fer, u početku zapeli ovog čovjeka …Iako je Elon Musk Grok 4 Ai odgovarao ispravno. Za nagovještaj, razmislite o činjenici da se kamena za zastave u ovom slučaju ne mogu podijeliti na manje dijelove. Moraju ostati u taktu kao 80 zasebnih jedinica, tako da nema polovica ili četvrti).
Izvršen stariji model 4o bolje za mene na barem jednom od ovih matematičkih problema. Nažalost, OpenAi polako omalovažava one starije modele-uključujući bivši zadani GPT-4O i moćan model rasuđivanja o3 – Za korisnike chatgpt -a, iako će u doglednoj budućnosti nastaviti biti dostupni u programerima za programere za programere za programere (API).
Sadržaj objave
Nije tako dobar u kodiranju kao što pokazuju referentne vrijednosti
Iako su OpenAi-ova unutarnja mjerila i neki vanjski treće strane pokazali GPT-5 da nadmaši sve ostale modele na kodiranju,, Čini se da se u stvarnom svijetu čini da je Anthropic nedavno ažurirani Claude Opus 4.1 obavljao bolji posao u „jednom snimku“ određenih zadatakato jest, dovršavanje korisnikove željene aplikacije ili softvera u njihovim specifikacijama. Vidjeti Primjer u nastavku od programera Justin Sun objavljen na x ::
Osim toga, AReport od sigurnosne tvrtke SPLX utvrdio je da je OpenAi -ov unutarnji sigurnosni sloj ostavio velike praznine u područjima poput poslovnih poravnanja i ranjivosti na ubrzanje injekcije i zamućenih logičkih napada.
Iako je anegdotski, provjeravanje temperature o tome kako model djeluje s ranim AI usvajačima ukazuje na hladan prijem.
AI influencer i bivši Googler Bilawal Sidhu objavio je anketu na x tražeći “provjeru vibracije” od svojih sljedbenika i šire baze korisnika, i do sada, sa 172 glasova u, Oprodan odgovor je “nekako sredina”.
I kao Pseudonimni ai propuštanja i novinski račun napisao je,, “Preveliki konsenzus o GPT-5 i iz X i Reddit AMA-e su pretežno negativni.”
Tibor Blaho, vodeći inženjer na AIPRM -u i popularni AI Propuštanje i plakat vijesti na X, sažeo je brojne probleme s Chatgpt-5 rocout u izvrsnom postuističući da je jedna od novih obilježja obilježja -Automatski „usmjerivač“ u chatgpt koji bira način razmišljanja ili ne razmišljanja za temeljni model GPT-5, ovisno o poteškoćama upita-postao je jedna od glavnih pritužbi, S obzirom na to da se činilo da je model za mnoge korisnike zadano ne razmišljanje.
Natjecanje koje čeka u krilima
Dakle, Osjećaj prema chatgpt-5 daleko je od univerzalno pozitivnog, ističući glavni problem za Openai Kako se suočava s sve većom konkurencijom glavnih američkih rivala poput Googlea i Anthropic -a, te sve veći popis besplatnih, otvorenog koda i moćnih kineskih LLM -ova koji nude značajke koje nedostaju mnogim američkim modelima.
Uzeti Alibaba Qwen tim istraživača AI, WHO Upravo su danas ažurirali svoj visoko izvedbeni Qwen 3 model u kontekstu od milijun tokena – Davanje korisnicima mogućnost razmjene gotovo 4x toliko informacija s modelom u jednoj interakciji straga/naprijed kao što nudi GPT-5.
S obzirom na drugo veliko veliko izdanje ovog tjedna-onim novih modela otvorenog koda GPT-OSS-također je primio mješoviti prijem od ranih korisnika, stvari ne traže u sadašnjoj AI kompaniji broj jedan od strane korisnika (700 milijuna tjednih aktivnih korisnika chatgpta od ovog mjeseca).
Doista, to je također primjer Korisnici PolyMarket na tržištu klađenja neodoljivo odlučujući nakon oslobađanja GPT-5 koji Google bi vjerojatno imao najbolji AI model do kraja ovog mjeseca, kolovoz 2025. godine.
Ostali korisnici napajanja vole Suosnivač i izvršni direktor Matt Schumer AIkoji je dobio rani pristup GPT-5 i Blogirao o tome povoljno u recenziji ovdje,, smatrao da će se prikazi mijenjati kako je više ljudi smislilo najbolje načine korištenja novog modela i prilagodili svoje integracijske pristupe::
Iako su još uvijek rani dani za GPT-5-i osjećaji bi se mogli dramatično promijeniti jer više korisnika dobiva ruke i isprobajte za različite zadatke- Rane indikacije ne izgledaju kao da je ovo “kućno trčanje” za Openai Na isti način na koji su bila prethodna izdanja kao što su GPT-4, ili čak noviji 4O i O3. I to je važni pokazatelj za tvrtka koja je upravo prikupila još jedan krug financiranjaipak, ostaje neprofitni zbog visokih troškova istraživanja i razvoja.
Web izvor

