Misterij riješen: Anthropic otkriva promjene na Claudeovim pojasevima i uputama za uporabu koje su vjerojatno uzrokovale degradaciju

Nekoliko je tjedana sve veći zbor programera i naprednih korisnika umjetne inteligencije tvrdio da Anthropicovi vodeći modeli gube prednost. Korisnici diljem GitHuba, X-a i Reddita prijavili su fenomen koji su opisali kao "AI skupljanje"— percipirana degradacija u kojoj se činilo da je Claude manje sposoban za trajno zaključivanje, skloniji halucinacijama i sve rastrošniji s žetonima.

Kritičari su ukazali na mjerljivu promjenu u ponašanju, navodeći da se model pomaknuo s "istraživanje-prvo" pristup ljenijima, "prvo uredi" stil kojem se više nije moglo vjerovati za složeno inženjerstvo.

Dok je tvrtka u početku odbijala tvrdnje o "nerviranje" model za upravljanje potražnjom, sve više dokaza od visokoprofiliranih korisnika i referentnih vrijednosti trećih strana stvorilo je značajan jaz u povjerenju.

Danas se Anthropic izravno pozabavio ovim problemima, objavljujući tehničku obdukciju koja je identificirala tri odvojene promjene sloja proizvoda odgovorne za prijavljene probleme s kvalitetom.

"Prijave o degradaciji shvaćamo vrlo ozbiljno," glasi Anthropicov blog post o tome. "Nikada namjerno ne degradiramo svoje modele i mogli smo odmah potvrditi da naš API i sloj zaključivanja nisu pogođeni."

Anthropic tvrdi da je riješio probleme poništavanjem promjene napora obrazloženja i upita za opširnost, dok je popravio pogrešku predmemoriranja u verziji v2.1.116.

Sadržaj objave

1 Sve više dokaza degradacije
2 Uzroci
3 Utjecaj i buduće zaštite

Sve više dokaza degradacije

Kontroverza je dobila zamah početkom travnja 2026., potaknuta detaljnim tehničkim analizama zajednice programera. Stella Laurenzo, viša direktorica u AMD-ovoj AI grupi, objavio iscrpnu reviziju 6852 datoteke sesije Claude Code i više od 234 000 poziva alata na Githubu pokazujući pad performansi zbog njezine upotrebe prije.

Njezina otkrića upućuju na to da je Claudeova dubina razmišljanja naglo pala, što je dovelo do petlji razmišljanja i sklonosti odabiru "najjednostavniji popravak" nego onaj ispravan.

Ovu anegdotalnu frustraciju naizgled su potvrdile referentne vrijednosti treće strane. BridgeMind je izvijestio da je točnost Claude Opusa 4.6 pala s 83,3% na 68,3% u njihovim testovima, uzrokujući da mu je rangiranje palo s 2. na 10. mjesto.

Iako su neki istraživači tvrdili da su ove specifične usporedbe referentnih vrijednosti bile pogrešne zbog nedosljednih opsega testiranja, narativ koji je Claude postao "gluplji" postala viralna tema za razgovor. Korisnici su također izvijestili da se ograničenja upotrebe troše brže od očekivanog, što dovodi do sumnje da Anthropic namjerno smanjuje performanse kako bi upravljao rastućom potražnjom.

Uzroci

U svom post-morem bog postu, Anthropic je pojasnio da, iako osnovne težine modela nisu regresirale, tri specifične promjene u "uprtač" okruženje modela nenamjerno je ometalo njihovu izvedbu:

Zadani napor rasuđivanja: Dana 4. ožujka Anthropic je promijenio zadano razmišljanje iz high do medium za Claude Code za rješavanje problema kašnjenja korisničkog sučelja. Ova je promjena trebala spriječiti pojavljivanje sučelja "smrznuti" dok je model mislio, ali to je rezultiralo primjetnim padom inteligencije za složene zadatke.
Logička pogreška predmemoriranja: Otpremljena 26. ožujka, optimizacija predmemoriranja namijenjena uklanjanju starog "razmišljanje" iz neaktivnih sesija sadržavao je kritičnu pogrešku. Umjesto brisanja povijesti razmišljanja jednom nakon sat vremena neaktivnosti, brisao ju je pri svakom sljedećem potezu, uzrokujući da model izgubi "kratkoročno pamćenje" i postati ponavljajući ili zaboravni.
Ograničenja opširnosti upita sustava: Dana 16. travnja, Anthropic je dodao upute u odzivnik sustava da zadrži tekst između poziva alata ispod 25 riječi i konačnih odgovora ispod 100 riječi. Ovaj pokušaj da se smanji opširnost u Opusu 4.7 nije uspio, uzrokujući pad od 3% u procjenama kvalitete kodiranja.

Utjecaj i buduće zaštite

Problemi s kvalitetom proširili su se izvan CLI-ja Claude Codea, utječući na Claude Agent SDK i Claude Coworkiako je Claude API nije utjecalo.

Anthropic je priznao da je zbog ovih promjena model izgledao kao da jest "manje inteligencije," za koje su priznali da nije iskustvo koje bi korisnici trebali očekivati.

Kako bi ponovno zadobio povjerenje korisnika i spriječio buduće regresije, Anthropic provodi nekoliko operativnih promjena:

Interna probna probna verzija: Bit će potreban veći udio internog osoblja za korištenje točnih javnih verzija Claude Codea kako bi se osiguralo da proizvod doživljavaju kao korisnici.
Enhanced Evaluation Suites: Tvrtka će sada pokrenuti širi paket evaluacija po modelu i "ablacije" za svaku promptnu promjenu sustava kako bi se izolirao utjecaj određenih uputa.
Strože kontrole: Izgrađen je novi alat za lakšu reviziju brzih promjena, a promjene specifične za model bit će strogo usklađene s predviđenim ciljevima.
Naknada za pretplatnike: Kako bi objasnio rasipanje tokena i probleme u izvedbi uzrokovane ovim greškama, Anthropic je poništio ograničenja upotrebe za sve pretplatnike od 23. travnja.

Tvrtka namjerava koristiti svoj novi @ClaudeDevs račun na X i GitHub niti za pružanje dubljeg obrazloženja iza budućih odluka o proizvodima i održavanje transparentnijeg dijaloga sa svojom bazom programera.

Web izvor

Misterij riješen: Anthropic otkriva promjene na Claudeovim pojasevima i uputama za uporabu koje su vjerojatno uzrokovale degradaciju

ByTomšić Damjan

Sve više dokaza degradacije

Uzroci

Utjecaj i buduće zaštite

By Tomšić Damjan

7,000 Langflow servers are under attack. LangGraph and LangChain have the same holes

Kanada je propustila priliku pregledati Titan prije fatalne implozije

Napravio sam 7 promjena u svojim postavkama za Android Auto za bolju funkcionalnost dok vozim

You missed

7,000 Langflow servers are under attack. LangGraph and LangChain have the same holes

Kanada je propustila priliku pregledati Titan prije fatalne implozije

Napravio sam 7 promjena u svojim postavkama za Android Auto za bolju funkcionalnost dok vozim

Više Galaxy satova Preuzmite najnoviju sigurnosnu zakrpu

Misterij riješen: Anthropic otkriva promjene na Claudeovim pojasevima i uputama za uporabu koje su vjerojatno uzrokovale degradaciju

ByTomšić Damjan

Sve više dokaza degradacije

Uzroci

Utjecaj i buduće zaštite

By Tomšić Damjan

Related Post

7,000 Langflow servers are under attack. LangGraph and LangChain have the same holes

Kanada je propustila priliku pregledati Titan prije fatalne implozije

Napravio sam 7 promjena u svojim postavkama za Android Auto za bolju funkcionalnost dok vozim

You missed

7,000 Langflow servers are under attack. LangGraph and LangChain have the same holes

Kanada je propustila priliku pregledati Titan prije fatalne implozije

Napravio sam 7 promjena u svojim postavkama za Android Auto za bolju funkcionalnost dok vozim

Više Galaxy satova Preuzmite najnoviju sigurnosnu zakrpu