z.ai GLM-5 otvorenog koda postiže rekordno nisku stopu halucinacija i koristi novu RL ‘slime’ tehniku

Kineski AI startup Zhupai aka z.ai vraća se ovaj tjedan s novim graničnim modelom velikog jezika koji bode oči: GLM-5.

Najnoviji u z.ai-evoj kontinuirano impresivnoj GLM seriji, zadržava MIT licencu otvorenog koda — savršenu za primjenu u poduzećima — i, u jednom od nekoliko značajnih postignuća, postiže rekordno nisku stopu halucinacija na neovisnim Indeks inteligencije umjetne analize v4.0.

S ocjenom -1 na AA-Omniscience Indexu—što predstavlja ogromno poboljšanje od 35 bodova u odnosu na svog prethodnika—GLM-5 sada predvodi cijelu industriju umjetne inteligencije, uključujući američke konkurente poput Googlea, OpenAI i Anthropica, u pouzdanosti znanja znajući kada se suzdržati, a ne izmišljati informacije.

Osim sposobnosti rasuđivanja, GLM-5 je napravljen za visokokorisni rad znanja. Ima native "Način rada agenta" mogućnosti koje mu omogućuju pretvaranje sirovih upita ili izvornih materijala izravno u profesionalne uredske dokumente, uključujući spremne za upotrebu .docx, .pdfi .xlsx datoteke.

Bilo da generira detaljna financijska izvješća, prijedloge sponzorstva za srednju školu ili složene proračunske tablice, GLM-5 daje rezultate u formatima stvarnog svijeta koji se izravno integriraju u tijekove rada poduzeća.

Također ima razornu cijenu od otprilike 0,80 USD za milijun ulaznih tokena i 2,56 USD za milijun izlaznih tokena, približno 6 puta jeftinije od vlasničkih konkurenata poput Claude Opusa 4.6, što najsuvremeniji agentski inženjering čini isplativijim nego ikad prije. Evo što bi još donositelji poslovnih odluka trebali znati o modelu i njegovoj obuci.

Sadržaj objave

1 Tehnologija: skaliranje za agentsku učinkovitost
2 Rad znanja od kraja do kraja
3 Visoke performanse
4 Treba li vaše poduzeće usvojiti GLM-5?

Tehnologija: skaliranje za agentsku učinkovitost

U srcu GLM-5 je ogroman skok u sirovim parametrima. Model se kreće od 355B parametara GLM-4.5 do nevjerojatnih 744B parametara, s 40B aktivnih po tokenu u svojoj Mixture-of-Experts (MoE) arhitekturi. Ovaj rast je podržan povećanjem podataka prije obuke na 28,5T tokena.

Za rješavanje neučinkovitosti treninga ove veličine, Zai je razvio "sluz," nova infrastruktura asinkronog učenja s pojačanjem (RL).

Tradicionalni RL često pati od "dugorepi" uska grla; Slime razbija ovu blokadu dopuštajući neovisno generiranje putanja, omogućujući fino zrnate iteracije potrebne za složeno ponašanje agenata.

Integracijom optimizacija na razini sustava kao što su Active Partial Rollouts (TRAVANJ), slime rješava uska grla u generaciji koja obično troše više od 90% vremena RL obuke, značajno ubrzavajući ciklus ponavljanja za složene agentske zadatke.

Dizajn okvira usredotočen je na tripartitni modularni sustav: modul za obuku visokih performansi koji pokreće Megatron-LM, modul za uvođenje koji koristi SGLang i prilagođene usmjerivače za generiranje podataka visoke propusnosti i centralizirani podatkovni međuspremnik koji upravlja brzom inicijalizacijom i pohranom za uvođenje.

Omogućujući prilagodljiva provjerljiva okruženja i petlje povratnih informacija višestruke kompilacije, sluz pruža robusnu osnovu visoke propusnosti koja je potrebna za prijelaz AI s jednostavnih interakcija chata prema rigoroznom inženjeringu sustava dugog horizonta.

Kako bi implementacija bila upravljiva, GLM-5 integrira DeepSeek Sparse Attention (DSA), čuvajući kapacitet konteksta od 200K uz drastično smanjenje troškova.

Rad znanja od kraja do kraja

Zai postavlja GLM-5 kao "ured" alat za AGI eru. Dok su prethodni modeli bili usredotočeni na isječke, GLM-5 je napravljen za isporuku dokumenata spremnih za korištenje.

Može autonomno transformirati upite u formatirane .docx, .pdf i .xlsx datoteke—od financijskih izvješća do prijedloga za sponzorstva.

U praksi to znači da model može rastaviti ciljeve visoke razine na djelotvorne podzadatke i izvesti "Agentski inženjering," gdje ljudi definiraju vrata kvalitete dok AI upravlja izvršenjem.

Visoke performanse

Mjerila GLM-5 čine ga novim najsnažnijim modelom otvorenog koda na svijetu, prema Umjetna analizanadmašujući novi Kimi K2.5 kineskog rivala Moonshota objavljen prije samo dva tjedna, pokazujući da su kineske AI tvrtke gotovo sustigle zapadnjačke konkurente s daleko boljim resursima.

Prema vlastitim materijalima koje je z.ai podijelio danas, GLM-5 je blizu najsuvremenijeg na nekoliko ključnih mjerila:

SWE-klupa potvrđena: GLM-5 postigao je rezultat od 77,8, nadmašivši Gemini 3 Pro (76,2) i približivši se Claude Opus 4,6 (80,9).

Prodajna klupa 2: U simulaciji vođenja poslovanja, GLM-5 je zauzeo prvo mjesto među modelima otvorenog koda s konačnim stanjem od 4432,12 USD.

Osim performansi, GLM-5 agresivno potkopava tržište. Uživo na OpenRouteru od 11. veljače 2026., cijena mu je približno 0,80–1,00 USD za milijun ulaznih tokena i 2,56–3,20 USD za milijun izlaznih tokena. Spada u srednji rang u usporedbi s drugim vodećim LLM-ovima, ali na temelju njegovih vrhunskih performansi u usporedbi, to je ono što bi se moglo nazvati "ukrasti."

Model	Unos (po 1M tokena)	Izlaz (po 1M tokena)	Ukupni trošak (1M in + 1M out)	Izvor
Qwen 3 Turbo	0,05 dolara	0,20 dolara	0,25 dolara	Alibaba Cloud
Grok 4.1 Fast (obrazloženje)	0,20 dolara	0,50 dolara	0,70 dolara	xAI
Grok 4.1 Brzi (bez rasuđivanja)	0,20 dolara	0,50 dolara	0,70 dolara	xAI
deepseek-chat (V3.2-Exp)	0,28 dolara	0,42 dolara	0,70 dolara	DeepSeek
deepseek-reasoner (V3.2-Exp)	0,28 dolara	0,42 dolara	0,70 dolara	DeepSeek
Gemini 3 Flash pregled	0,50 dolara	3,00 dolara	3,50 dolara	Google
Kimi-k2.5	0,60 dolara	3,00 dolara	3,60 dolara	snimka mjeseca
GLM-5	1,00 dolara	3,20 dolara	4,20 dolara	Z.ai
ERNIE 5.0	0,85 dolara	3,40 dolara	4,25 dolara	Qianfan
Claude Haiku 4.5	1,00 dolara	5,00 USD	6,00 dolara	antropski
Qwen3-Max (2026-01-23)	1,20 dolara	6,00 dolara	7,20 dolara	Alibaba Cloud
Gemini 3 Pro (≤200K)	2,00 dolara	12,00 dolara	14,00 dolara	Google
GPT-5.2	1,75 dolara	14,00 dolara	15,75 dolara	OpenAI
Claude Sonet 4.5	3,00 dolara	15,00 dolara	18,00 dolara	antropski
Gemini 3 Pro (>200K)	4,00 dolara	18,00 dolara	22,00 dolara	Google
Claude Opus 4.6	5,00 USD	25,00 dolara	30,00 dolara	antropski
GPT-5.2 Pro	21,00 dolara	168,00 dolara	189,00 dolara	OpenAI

Ovo je otprilike 6x jeftinije na ulazu i gotovo 10x jeftinije na izlazu od Claude Opusa 4.6 ($5/$25). Ovo izdanje potvrđuje glasine da Zhipu AI stoji iza "poni alfa," stealth model koji je prethodno srušio referentne vrijednosti kodiranja na OpenRouteru.

Međutim, unatoč visokim mjerilima i niskim cijenama, nisu svi rani korisnici oduševljeni modelom, primjećujući da njegove visoke performanse ne govore cijelu priču.

Lukas Petersson, suosnivač startupa za autonomne AI protokole Andon Labs usmjerenog na sigurnost, primijetio na X: "Nakon sati čitanja tragova GLM-5: nevjerojatno učinkovit model, ali daleko manje svjestan situacije. Postiže ciljeve agresivnom taktikom, ali ne razmišlja o svojoj situaciji niti koristi iskustvo. Ovo je strašno. Ovako ćete dobiti maksimizator spajalice."

The "spajalica za povećanje" odnosi se na hipotetičku situaciju opisao oksfordski filozof Nick Bostrom još 2003. godineu kojem umjetna inteligencija ili druga autonomna tvorevina slučajno dovodi do apokaliptičnog scenarija ili ljudskog izumiranja slijedeći naizgled benigne upute — poput maksimiziranja broja proizvedenih spajalica — do ekstremnog stupnja, preusmjeravajući sve resurse potrebne za ljudski (ili drugi život) ili na drugi način čineći život nemogućim svojom predanošću ispunjavanju naizgled benignog cilja.

Treba li vaše poduzeće usvojiti GLM-5?

Poduzeća koja žele pobjeći od vezanosti dobavljača smatrat će GLM-5 licencu MIT i dostupnost otvorenih težina značajnom strateškom prednošću. Za razliku od konkurenata zatvorenog koda koji čuvaju inteligenciju iza vlasničkih zidova, GLM-5 omogućuje organizacijama da ugoste vlastitu inteligenciju na graničnoj razini.

Usvajanje nije bez trvenja. Sama skala parametara GLM-5—744B—zahtijeva masivan hardverski pod koji može biti nedostupan manjim tvrtkama bez značajnog oblaka ili lokalnih GPU klastera.

Sigurnosni čelnici moraju odvagnuti geopolitičke implikacije vodećeg modela iz laboratorija sa sjedištem u Kini, posebno u reguliranim industrijama gdje se rezidencija podataka i porijeklo strogo revidiraju.

Nadalje, pomak prema autonomnijim agentima umjetne inteligencije uvodi nove rizike upravljanja. Kako se modeli kreću iz "razgovor" do "raditi," počinju samostalno raditi u aplikacijama i datotekama. Bez robusnih dopuštenja specifičnih za agente i pristupnih vrata kvalitete koje su uspostavili voditelji podataka u poduzećima, rizik od autonomne pogreške raste eksponencijalno.

U konačnici, GLM-5 je "kupiti" za organizacije koje su prerasle jednostavne kopilote i spremne su izgraditi istinski autonomni ured.

Namijenjen je inženjerima koji trebaju refaktorirati naslijeđenu pozadinu ili zahtijevaju "samoizlječenje" cjevovod koji ne spava.

Dok zapadni laboratoriji nastavljaju optimizirati za "Razmišljanje" i dubinu razmišljanja, Zai optimizira za izvršenje i razmjer.

Poduzeća koja danas usvoje GLM-5 ne kupuju samo jeftiniji model; oni se klade na budućnost u kojoj je najvrjednija umjetna inteligencija ona koja može završiti projekt bez dvaput pitanja.

Web izvor

z.ai GLM-5 otvorenog koda postiže rekordno nisku stopu halucinacija i koristi novu RL ‘slime’ tehniku

Tehnologija: skaliranje za agentsku učinkovitost

Rad znanja od kraja do kraja

Visoke performanse

Treba li vaše poduzeće usvojiti GLM-5?

Previous Article

Next Article

Posljednje objave

OCSF je objasnio: nedostaju timovi za sigurnost jezika dijeljenih podataka

Uvod u Microsoft Tenant Governance 1. dio: osnove i uspostavljanje odnosa

Znanstvenici su napravili pomak u proizvodnji pomfrita

O nama