Anthropicov Claude Opus 4.5 je ovdje: Jeftiniji AI, beskonačni chatovi i vještine kodiranja koje pobjeđuju ljude

antropski objavio je u ponedjeljak svoj najsposobniji model umjetne inteligencije do sada, snizivši cijene za otprilike dvije trećine, dok je tvrdio da ima najsuvremeniju izvedbu u zadacima softverskog inženjeringa – strateški potez koji pojačava konkurenciju AI startupa s konkurentima s dubokim džepom OpenAI i Google.

Novi model, Claude Opus 4.5dobio je više bodova na Anthropicovoj najizazovnijoj internoj inženjerskoj procjeni od bilo kojeg kandidata za ljudski posao u povijesti tvrtke, prema materijalima koje je pregledao VentureBeat. Rezultat naglašava i brzo napredovanje sposobnosti sustava umjetne inteligencije i rastuća pitanja o tome kako će tehnologija preoblikovati profesije bijelih ovratnika.

Tvrtka koju podržava Amazon određuje cijenu Claudea Opusa 4.5 5 dolara za milijun ulaznih tokena i 25 dolara za milijun izlaznih tokena — dramatično smanjenje u odnosu na stope od 15 USD i 75 USD za svog prethodnika, Claude Opus 4.1objavljen ranije ove godine. Ovaj potez čini napredne AI mogućnosti dostupnima širem krugu programera i poduzeća, istovremeno vršeći pritisak na konkurente da usklade performanse i cijene.

"Želimo biti sigurni da ovo stvarno funkcionira za ljude koji žele raditi s ovim modelima," rekao je Alex Albert, Anthropicov voditelj odnosa s programerima, u ekskluzivnom intervjuu za VentureBeat. "To je zapravo naš fokus: Kako možemo omogućiti Claudeu da vam bude bolji u pomaganju u obavljanju stvari koje ne želite nužno raditi u svom poslu?"

Ova najava dolazi dok se Anthropic bori da zadrži svoju poziciju u sve gušćem polju. Nedavno objavljen OpenAI GPT-5.1 te specijalizirani model kodiranja tzv Codex Max koji može raditi autonomno dulje vrijeme. Google predstavio Blizanci 3 samo prošli tjedan, izazivajući zabrinutost čak i kod OpenAI-ja o napretku pretraživačkog diva, prema nedavnom izvješću The Informationa.

Sadržaj objave

1 Opus 4.5 pokazuje bolje prosuđivanje zadataka iz stvarnog svijeta, kažu programeri
2 Opus 4.5 nadmašuje sve ljudske kandidate na najtežem inženjerskom testu tvrtke
3 Dramatična poboljšanja učinkovitosti smanjuju upotrebu tokena do 76% na ključnim mjerilima
4 Prvi klijenti izvještavaju o AI agentima koji uče iz iskustva i usavršavaju vlastite vještine
5 Nove značajke ciljaju na korisnike Excela, tijekove rada u Chromeu i uklanjaju ograničenja duljine razgovora
6 Tržište se zahuktava dok se OpenAI i Google utrkuju kako bi uskladili performanse i cijene

Opus 4.5 pokazuje bolje prosuđivanje zadataka iz stvarnog svijeta, kažu programeri

Anthropicovo interno testiranje otkrilo je ono što tvrtka opisuje kao kvalitativni skok u sposobnostima razmišljanja Claude Opusa 4.5. Model je postigao 80,9% točnosti na SWE-klupa Provjerenoreferentna vrijednost koja mjeri zadatke softverskog inženjeringa u stvarnom svijetu, premašivši OpenAI-jev GPT-5.1-Codex-Max (77,9%), Anthropicov vlastiti Sonnet 4.5 (77,2%) i Googleov Gemini 3 Pro (76,2%), prema podacima tvrtke. Rezultat označava značajan napredak u odnosu na OpenAI-jev trenutni vrhunski model, koji je objavljen samo pet dana ranije.

Ali tehnička mjerila govore samo dio priče. Albert je rekao da su zaposlenici koji su testirali dosljedno izvještavali da model pokazuje poboljšanu prosudbu i intuiciju u različitim zadacima – pomak koji je opisao kao model koji razvija osjećaj za ono što je važno u kontekstu stvarnog svijeta.

"Model to na neki način shvaća," rekao je Albert. "Samo je razvio takvu vrstu intuicije i prosudbe o mnogim stvarnim stvarima u stvarnom svijetu koje se kvalitativno čine kao veliki skok u odnosu na prošle modele."

Kao primjer je naveo svoj tijek rada. Prethodno je, rekao je Albert, tražio od AI modela da prikupe informacije, ali je oklijevao vjerovati njihovoj sintezi ili prioritizaciji. Uz Opus 4.5, on delegira potpunije zadatke, povezujući ih sa Slackom i internim dokumentima za izradu koherentnih sažetaka koji odgovaraju njegovim prioritetima.

Opus 4.5 nadmašuje sve ljudske kandidate na najtežem inženjerskom testu tvrtke

Izvedba modela na Anthropicovoj internoj inženjerskoj procjeni predstavlja značajnu prekretnicu. Ispit za polaganje kod kuće, osmišljen za potencijalne kandidate za inženjere performansi, namijenjen je procjeni tehničke sposobnosti i prosudbe pod vremenskim pritiskom unutar propisanog ograničenja od dva sata.

Upotrebom tehnike koja se zove paralelno izračunavanje vremena testiranja — koja agregira više pokušaja iz modela i odabire najbolji rezultat — Opus 4.5 dobio više bodova od bilo kojeg ljudskog kandidata koji je pristupio testu, prema tvrtki. Bez vremenskog ograničenja, model je odgovarao performansama najboljeg ljudskog kandidata kada se koristi unutar Claude Codea, okruženja za kodiranje tvrtke Anthropic.

Tvrtka je priznala da test ne mjeri druge ključne profesionalne vještine kao što su suradnja, komunikacija ili instinkti koji se razvijaju tijekom godina iskustva. Ipak, Anthropic je rekao rezultat "postavlja pitanja o tome kako će umjetna inteligencija promijeniti inženjerstvo kao profesiju."

Albert je istaknuo značaj otkrića. "Mislim da je ovo na neki način znak, možda, onoga što će se dogoditi koliko ovi modeli zapravo mogu biti korisni u kontekstu rada i za naše poslove," rekao je. "Naravno, ovo je bio inženjerski zadatak i rekao bih da su modeli relativno ispred u inženjerstvu u usporedbi s drugim područjima, ali mislim da je to stvarno važan signal na koji treba obratiti pozornost."

Dramatična poboljšanja učinkovitosti smanjuju upotrebu tokena do 76% na ključnim mjerilima

Osim sirovih performansi, Anthropic se kladi da će se poboljšanja učinkovitosti razlikovati Claude Opus 4.5 na tržištu. Tvrtka kaže da model koristi dramatično manje tokena – jedinica teksta koje AI sustavi obrađuju – za postizanje sličnih ili boljih rezultata u usporedbi s prethodnicima.

Na razini srednjeg napora, Opus 4.5 odgovara prethodnom Sonet 4,5 najbolji rezultat modela na SWE-klupa Provjereno koristeći 76% manje izlaznih tokena, prema Anthropicu. Na najvišoj razini napora, Opus 4.5 nadmašuje izvedbu Sonneta 4.5 za 4,3 postotna boda dok još uvijek koristi 48% manje tokena.

Kako bi programerima dao veću kontrolu, Anthropic je predstavio "parametar napora" koji omogućuje korisnicima da prilagode koliko računalnog rada model primjenjuje na svaki zadatak — balansirajući performanse s latencijom i troškovima.

Poslovni korisnici su rano potvrdili tvrdnje o učinkovitosti. "Opus 4.5 pobjeđuje Sonnet 4.5 i konkurenciju na našim internim mjerilima, koristeći manje tokena za rješavanje istih problema," rekao je Michele Catasta, predsjednik Replita, platforme za kodiranje temeljene na oblaku, u izjavi za VentureBeat. "Na razini, ta se učinkovitost povećava."

GitHubov glavni proizvodni direktor, Mario Rodriguez, rekao je da rano testiranje pokazuje Opus 4.5 "nadmašuje interna mjerila kodiranja dok prepolovljuje korištenje tokena, a posebno je pogodan za zadatke poput migracije koda i refaktoriranja koda."

Prvi klijenti izvještavaju o AI agentima koji uče iz iskustva i usavršavaju vlastite vještine

Jedna od najupečatljivijih mogućnosti koju su demonstrirali rani kupci uključuje ono što Anthropic naziva "sredstva za samopoboljšanje" — Sustavi umjetne inteligencije koji mogu poboljšati vlastitu izvedbu kroz iterativno učenje.

Rakutenjapanska tvrtka za e-trgovinu i internet, testirala je Claude Opus 4.5 na automatizaciji uredskih zadataka. "Naši su agenti mogli autonomno poboljšati vlastite mogućnosti — postižući vrhunske performanse u 4 iteracije, dok drugi modeli nisu mogli dostići tu kvalitetu nakon 10," rekao je Yusuke Kaji, Rakutenov generalni direktor za AI za poslovanje.

Albert je objasnio da model ne ažurira vlastite težine — temeljne parametre koji definiraju ponašanje AI sustava — već iterativno poboljšava alate i pristupe koje koristi za rješavanje problema. "Iterativno je usavršavao vještinu za zadatak i vidio da pokušava optimizirati vještinu kako bi dobio bolju izvedbu kako bi mogao izvršiti ovaj zadatak," rekao je.

Sposobnost se proteže izvan kodiranja. Albert je rekao da je Anthropic primijetio značajna poboljšanja u izradi profesionalnih dokumenata, proračunskih tablica i prezentacija. "Kažu da je ovo najveći skok između generacija modela koji su vidjeli," rekao je Albert. "Dakle, čak i od Sonneta 4.5 do Opusa 4.5, veći skok od bilo koja dva modela unazad u prošlosti."

Laboratorij za temeljna istraživanjatvrtka za financijski model, izvijestila je to "točnost naših internih procjena poboljšana je za 20%, učinkovitost je porasla za 15%, a složeni zadaci koji su se nekada činili nedostižnima postali su ostvarivi," prema riječima suosnivača Nica Christieja.

Nove značajke ciljaju na korisnike Excela, tijekove rada u Chromeu i uklanjaju ograničenja duljine razgovora

Uz izdanje modela, Anthropic je izbacio paket ažuriranja proizvoda namijenjenih poslovnim korisnicima. Claude za Excel postao je općenito dostupan za Max, Team i Enterprise korisnike s novom podrškom za zaokretne tablice, grafikone i učitavanje datoteka. Proširenje preglednika Chrome sada je dostupno svim Max korisnicima.

Možda najvažnije, predstavio je Anthropic "beskonačni razgovori" — značajka koja uklanja ograničenja prozora konteksta automatskim sažimanjem ranijih dijelova razgovora kako oni rastu. "Unutar Claude AI, unutar samog proizvoda, učinkovito dobivate ovu vrstu beskonačnog kontekstnog prozora zbog sažimanja, plus neke memorijske stvari koje radimo," Albert je objasnio.

Za programere, izdao Anthropic "pozivanje programskog alata," što omogućuje Claudeu pisanje i izvršavanje koda koji izravno poziva funkcije. Claude Code je ažuriran "Način planiranja" i postao je dostupan na radnoj površini u pretpregledu istraživanja, omogućujući programerima paralelno pokretanje više sesija AI agenta.

Tržište se zahuktava dok se OpenAI i Google utrkuju kako bi uskladili performanse i cijene

Antropički dosegnut 2 milijarde dolara godišnjeg prihoda tijekom prvog tromjesečja 2025., više nego udvostručenje u odnosu na 1 milijardu dolara u prethodnom razdoblju. Broj kupaca koji troše više od 100.000 dolara godišnje porastao je osam puta u odnosu na prethodnu godinu.

Brzo oslobađanje Opus 4.5 — samo nekoliko tjedana nakon Haiku 4.5 u listopadu i Sonet 4,5 u rujnu — odražava širu dinamiku industrije. OpenAI je objavio više GPT-5 varijanti tijekom 2025., uključujući specijaliziranu Codex Max model u studenom koji može raditi autonomno do 24 sata. Google je isporučio Gemini 3 sredinom studenog nakon mjeseci razvoja.

Albert je ubrzani tempo Anthropica djelomično pripisao korištenju Claudea za ubrzavanje vlastitog razvoja. "Vidimo puno pomoći i ubrzanja samog Claudea, bilo na strani stvarne izgradnje proizvoda ili na strani istraživanja modela," rekao je.

Smanjenje cijena za Opus 4.5 moglo bi utjecati na marže dok bi potencijalno proširilo adresno tržište. "Očekujem da će puno startupa početi to više uključivati u svoje proizvode i istaknuti to," rekao je Albert.

Ipak, profitabilnost ostaje nedostižna za vodeće laboratorije umjetne inteligencije jer ulažu velika sredstva u računalnu infrastrukturu i istraživački talent. The Predviđa se da će tržište umjetne inteligencije ostvariti prihod od 1 bilijun dolara unutar jednog desetljeća, ali niti jedan pružatelj nije uspostavio dominantnu tržišnu poziciju – čak i kada modeli dosegnu prag na kojem mogu smisleno automatizirati složen rad znanja.

Michael Truell, izvršni direktor Cursora, uređivača koda koji pokreće AI, pod nazivom Opus 4.5 "značajno poboljšanje u odnosu na prethodne modele Claude unutar Cursora, s poboljšanim cijenama i inteligencijom kod teških zadataka kodiranja." Scott Wu, izvršni direktor Cognitiona, startupa za kodiranje umjetne inteligencije, rekao je da model daje rezultate "snažnije rezultate na našim najtežim procjenama i dosljednu izvedbu kroz 30-minutne sesije autonomnog kodiranja."

Za poduzeća i programere, konkurencija se prevodi u brzo poboljšanje mogućnosti po padajućim cijenama. No kako se performanse umjetne inteligencije na tehničkim zadacima približavaju, a ponekad i premašuju razine ljudskih stručnjaka, utjecaj tehnologije na profesionalni rad postaje manje teoretski.

Na pitanje o rezultatima inženjerskog ispita i što oni govore o putanji umjetne inteligencije, Albert je bio izravan: "Mislim da je to jako važan signal na koji treba obratiti pozornost."

Web izvor

Anthropicov Claude Opus 4.5 je ovdje: Jeftiniji AI, beskonačni chatovi i vještine kodiranja koje pobjeđuju ljude

ByTomšić Damjan

Opus 4.5 pokazuje bolje prosuđivanje zadataka iz stvarnog svijeta, kažu programeri

Opus 4.5 nadmašuje sve ljudske kandidate na najtežem inženjerskom testu tvrtke

Dramatična poboljšanja učinkovitosti smanjuju upotrebu tokena do 76% na ključnim mjerilima

Prvi klijenti izvještavaju o AI agentima koji uče iz iskustva i usavršavaju vlastite vještine

Nove značajke ciljaju na korisnike Excela, tijekove rada u Chromeu i uklanjaju ograničenja duljine razgovora

Tržište se zahuktava dok se OpenAI i Google utrkuju kako bi uskladili performanse i cijene

By Tomšić Damjan

Znanost koja stoji iza toga zašto nogometaši na Svjetskom prvenstvu 2026. režu svoje čarape

Kako sam izbrisao stotine starih fotografija na svom Androidu u nekoliko sekundi pomoću aplikacije Sponge – besplatno

Najbolji paket Verizon Unlimited 2026

You missed

Znanost koja stoji iza toga zašto nogometaši na Svjetskom prvenstvu 2026. režu svoje čarape

Kako sam izbrisao stotine starih fotografija na svom Androidu u nekoliko sekundi pomoću aplikacije Sponge – besplatno

Najbolji paket Verizon Unlimited 2026

Prvo pogledajte izvješće o korištenju SharePoint API-ja

Anthropicov Claude Opus 4.5 je ovdje: Jeftiniji AI, beskonačni chatovi i vještine kodiranja koje pobjeđuju ljude

ByTomšić Damjan

Opus 4.5 pokazuje bolje prosuđivanje zadataka iz stvarnog svijeta, kažu programeri

Opus 4.5 nadmašuje sve ljudske kandidate na najtežem inženjerskom testu tvrtke

Dramatična poboljšanja učinkovitosti smanjuju upotrebu tokena do 76% na ključnim mjerilima

Prvi klijenti izvještavaju o AI agentima koji uče iz iskustva i usavršavaju vlastite vještine

Nove značajke ciljaju na korisnike Excela, tijekove rada u Chromeu i uklanjaju ograničenja duljine razgovora

Tržište se zahuktava dok se OpenAI i Google utrkuju kako bi uskladili performanse i cijene

By Tomšić Damjan

Related Post

Znanost koja stoji iza toga zašto nogometaši na Svjetskom prvenstvu 2026. režu svoje čarape

Kako sam izbrisao stotine starih fotografija na svom Androidu u nekoliko sekundi pomoću aplikacije Sponge – besplatno

Najbolji paket Verizon Unlimited 2026

You missed

Znanost koja stoji iza toga zašto nogometaši na Svjetskom prvenstvu 2026. režu svoje čarape

Kako sam izbrisao stotine starih fotografija na svom Androidu u nekoliko sekundi pomoću aplikacije Sponge – besplatno

Najbolji paket Verizon Unlimited 2026

Prvo pogledajte izvješće o korištenju SharePoint API-ja