Openi’s GPT-5 Rollout ne ide glatko

Želite pametnije uvide u vašu pristiglu poštu? Prijavite se za naše tjedne biltene kako biste dobili samo ono što je važno za vođe AI, podataka i sigurnosti. Pretplatite se sada

Pokretanje OpenAi-ovog dugo očekivanog novog modela, GPT-5, jest odlazi na stjenovit početak najmanje reći.

Čak opraštajući pogreške u ljestvicama i glasovni demonstracije Tijekom jučerašnjeg prezentacija novog modela (zapravo četiri odvojena modela i način rada “razmišljanja” koji se može angažirati za tri), a Broj korisničkih izvještaja pojavio se nakon puštanja GPT-5 koji pokazuje da loše griješi Pri rješavanju relativno jednostavnih problema koji prethode otvorenim modelima – i suparnici iz konkurencije AI laboratorija – odgovaraju pravilno.

Na primjer, znanstvenik podataka Colin Fraser objavio snimke zaslona prikazivanje GPT-5 Pogrešan je matematički dokaz (bilo da je 8,888 ponavljanje jednako 9-to je, naravno, ne).

Također nije uspio na jednoj aritmetici algebre problem Ti bi osnovni školci vjerojatno mogli zabiti, 5,9 = x + 5,11.

AI skaliranje pogađa svoje granice

Power ograničenja, rastući troškovi tokena i kašnjenja zaključivanja preoblikovaju Enterprise AI. Pridružite se našem ekskluzivnom salonu kako biste otkrili kako su vrhunski timovi:

Pretvaranje energije u stratešku prednost

Arhitekturiste učinkovite zaključke za stvarne propusne dobitke

Otključavanje natjecateljskog ROI -a s održivim AI sustavima

Osigurajte svoje mjesto da ostanete naprijed:: https://bit.ly/4mwgngo

Korištenje GPT-5 za sudeći OpenAijeve vlastite grafikone prezentacije također nisu donijele korisne ili ispravne odgovore.

Također nije uspio na Ovaj zamršeniji problem matematičke riječi u nastavku (što je, da budemo fer, u početku zapeli ovog čovjeka …Iako je Elon Musk Grok 4 Ai odgovarao ispravno. Za nagovještaj, razmislite o činjenici da se kamena za zastave u ovom slučaju ne mogu podijeliti na manje dijelove. Moraju ostati u taktu kao 80 zasebnih jedinica, tako da nema polovica ili četvrti).

Izvršen stariji model 4o bolje za mene na barem jednom od ovih matematičkih problema. Nažalost, OpenAi polako omalovažava one starije modele-uključujući bivši zadani GPT-4O i moćan model rasuđivanja o3 – Za korisnike chatgpt -a, iako će u doglednoj budućnosti nastaviti biti dostupni u programerima za programere za programere za programere (API).

Sadržaj objave
1 Nije tako dobar u kodiranju kao što pokazuju referentne vrijednosti
2 Natjecanje koje čeka u krilima

Nije tako dobar u kodiranju kao što pokazuju referentne vrijednosti

Iako su OpenAi-ova unutarnja mjerila i neki vanjski treće strane pokazali GPT-5 da nadmaši sve ostale modele na kodiranju,, Čini se da se u stvarnom svijetu čini da je Anthropic nedavno ažurirani Claude Opus 4.1 obavljao bolji posao u „jednom snimku“ određenih zadatakato jest, dovršavanje korisnikove željene aplikacije ili softvera u njihovim specifikacijama. Vidjeti Primjer u nastavku od programera Justin Sun objavljen na x ::

OPUS 4.1 pokušaj jednog pucanja “Stvori 3D Capybara Petting Zoo”-ukupno 8 minuta
Ovo je bilo iskreno prilično suludo, ne samo da su Capybaras Way Cuter i kreću se, postoje pojedinačne razine afiniteta kućnih ljubimaca, preklopnik za dan/noć, hranjenje, pa čak i značajka snimke zaslona pic.twitter.com/fikto3fkk4
– Justin (@JustinSunyt) 7. kolovoza 2025

Osim toga, AReport od sigurnosne tvrtke SPLX utvrdio je da je OpenAi -ov unutarnji sigurnosni sloj ostavio velike praznine u područjima poput poslovnih poravnanja i ranjivosti na ubrzanje injekcije i zamućenih logičkih napada.

Iako je anegdotski, provjeravanje temperature o tome kako model djeluje s ranim AI usvajačima ukazuje na hladan prijem.

AI influencer i bivši Googler Bilawal Sidhu objavio je anketu na x tražeći “provjeru vibracije” od svojih sljedbenika i šire baze korisnika, i do sada, sa 172 glasova u, Oprodan odgovor je “nekako sredina”.

U redu, GPT-5 Vibe Provjerite
– Bilawal Sidhu (@BilaWalsIdhu) 7. kolovoza 2025

I kao Pseudonimni ai propuštanja i novinski račun napisao je,, “Preveliki konsenzus o GPT-5 i iz X i Reddit AMA-e su pretežno negativni.”

Preveliki konsenzus o GPT-5 od X i Reddit AMA su pretežno negativni
Većina korisnika nezadovoljna je da pokvareni birač modela i korisnici koji nisu imali pristup nemaju pristup naslijeđenim modelima
Koje su vaše početne misli o GPT-5?
– AI curenja i vijesti (@ialeaksandnews) 8. kolovoza 2025

Tibor Blaho, vodeći inženjer na AIPRM -u i popularni AI Propuštanje i plakat vijesti na X, sažeo je brojne probleme s Chatgpt-5 rocout u izvrsnom postuističući da je jedna od novih obilježja obilježja -Automatski „usmjerivač“ u chatgpt koji bira način razmišljanja ili ne razmišljanja za temeljni model GPT-5, ovisno o poteškoćama upita-postao je jedna od glavnih pritužbi, S obzirom na to da se činilo da je model za mnoge korisnike zadano ne razmišljanje.

Pomalo tužno kako je pokretanje GPT-5 tako daleko, pogotovo nakon dugog čekanja i visokih očekivanja
– Čini se da je automatsko prebacivanje između modela (usmjerivač) djelomično slomljeno/nepouzdano
– Nejasno je točno s kojim modelom zapravo komunicirate (Standard ili Mini, …
– Tibor Blaho (@btibor91) 8. kolovoza 2025

Natjecanje koje čeka u krilima

Dakle, Osjećaj prema chatgpt-5 daleko je od univerzalno pozitivnog, ističući glavni problem za Openai Kako se suočava s sve većom konkurencijom glavnih američkih rivala poput Googlea i Anthropic -a, te sve veći popis besplatnih, otvorenog koda i moćnih kineskih LLM -ova koji nude značajke koje nedostaju mnogim američkim modelima.

Uzeti Alibaba Qwen tim istraživača AI, WHO Upravo su danas ažurirali svoj visoko izvedbeni Qwen 3 model u kontekstu od milijun tokena – Davanje korisnicima mogućnost razmjene gotovo 4x toliko informacija s modelom u jednoj interakciji straga/naprijed kao što nudi GPT-5.

S obzirom na drugo veliko veliko izdanje ovog tjedna-onim novih modela otvorenog koda GPT-OSS-također je primio mješoviti prijem od ranih korisnika, stvari ne traže u sadašnjoj AI kompaniji broj jedan od strane korisnika (700 milijuna tjednih aktivnih korisnika chatgpta od ovog mjeseca).

Doista, to je također primjer Korisnici PolyMarket na tržištu klađenja neodoljivo odlučujući nakon oslobađanja GPT-5 koji Google bi vjerojatno imao najbolji AI model do kraja ovog mjeseca, kolovoz 2025. godine.

Ostali korisnici napajanja vole Suosnivač i izvršni direktor Matt Schumer AIkoji je dobio rani pristup GPT-5 i Blogirao o tome povoljno u recenziji ovdje,, smatrao da će se prikazi mijenjati kako je više ljudi smislilo najbolje načine korištenja novog modela i prilagodili svoje integracijske pristupe::

Mnogi ljudi koji imaju loše iskustvo koriste GPT-5 u kabelskim kabelima koji još nisu optimizirani za to.
Za svako novo izdanje modela, postoji vremenski zaostajanje između izdanja + kada tvrtke koje integriraju model doista dobro funkcioniraju.
Agentske tvrtke žure u…
– Matt Shumer (@mattshumer_) 8. kolovoza 2025

Iako su još uvijek rani dani za GPT-5-i osjećaji bi se mogli dramatično promijeniti jer više korisnika dobiva ruke i isprobajte za različite zadatke- Rane indikacije ne izgledaju kao da je ovo “kućno trčanje” za Openai Na isti način na koji su bila prethodna izdanja kao što su GPT-4, ili čak noviji 4O i O3. I to je važni pokazatelj za tvrtka koja je upravo prikupila još jedan krug financiranjaipak, ostaje neprofitni zbog visokih troškova istraživanja i razvoja.

Dnevni uvidi u slučajeve poslovne uporabe s VB dnevno

Ako želite impresionirati svog šefa, VB Daily vas je pokrivao. Dajemo vam unutarnju lopaticu o tome što tvrtke rade s generativnim AI, od regulatornih pomaka do praktičnih razmještaja, tako da možete dijeliti uvide za maksimalni ROI.

Pročitajte našu politiku privatnosti

Hvala na pretplati. Pogledajte više VB biltena ovdje.

Došlo je do pogreške.

Web izvor

Navigacija objava

Zašto se SAD trkuju za izgradnju nuklearnog reaktora na Mjesecu
Prorail Modernize GSM-Railway Core Network u Nizozemskoj

Openi’s GPT-5 Rollout ne ide glatko

ByTomšić Damjan

Nije tako dobar u kodiranju kao što pokazuju referentne vrijednosti

Natjecanje koje čeka u krilima

By Tomšić Damjan

Kanada je propustila priliku pregledati Titan prije fatalne implozije

Napravio sam 7 promjena u svojim postavkama za Android Auto za bolju funkcionalnost dok vozim

Više Galaxy satova Preuzmite najnoviju sigurnosnu zakrpu

You missed

Kanada je propustila priliku pregledati Titan prije fatalne implozije

Napravio sam 7 promjena u svojim postavkama za Android Auto za bolju funkcionalnost dok vozim

Više Galaxy satova Preuzmite najnoviju sigurnosnu zakrpu

Bivši šef Take-Twoa kaže da generativna umjetna inteligencija “truje bunar” i da bi mogla spriječiti svu upotrebu tradicionalne umjetne inteligencije u budućnosti

Openi’s GPT-5 Rollout ne ide glatko

ByTomšić Damjan

Nije tako dobar u kodiranju kao što pokazuju referentne vrijednosti

Natjecanje koje čeka u krilima

By Tomšić Damjan

Related Post

Kanada je propustila priliku pregledati Titan prije fatalne implozije

Napravio sam 7 promjena u svojim postavkama za Android Auto za bolju funkcionalnost dok vozim

Više Galaxy satova Preuzmite najnoviju sigurnosnu zakrpu

You missed

Kanada je propustila priliku pregledati Titan prije fatalne implozije

Napravio sam 7 promjena u svojim postavkama za Android Auto za bolju funkcionalnost dok vozim

Više Galaxy satova Preuzmite najnoviju sigurnosnu zakrpu

Bivši šef Take-Twoa kaže da generativna umjetna inteligencija “truje bunar” i da bi mogla spriječiti svu upotrebu tradicionalne umjetne inteligencije u budućnosti