Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

z.ai predstavlja brži, jeftiniji GLM-5 Turbo model za agente i ‘kanđe’ — ali nije otvorenog koda

Novosti

z.ai predstavlja brži, jeftiniji GLM-5 Turbo model za agente i ‘kanđe’ — ali nije otvorenog koda

Tomšić Damjan 16. ožujka 2026

Kineski AI startup Z.ai, poznat po svojoj snažnoj GLM obitelji otvorenog koda velikih jezičnih modela (LLM), predstavio GLM-5-Turbo, novu, vlasničku varijantu svog modela GLM-5 otvorenog koda usmjerenog na tijekove rada vođene agentima, a tvrtka ga pozicionira kao brži model prilagođen za zadatke u stilu OpenClaw kao što su korištenje alata, dugolančano izvršavanje i trajna automatizacija.

Sada je dostupan putem Z.ai sučelja za programiranje aplikacija (API) na pružatelju treće strane OpenRouter s okvirnim prozorom konteksta od 202,8 K-tokena, maksimalnim izlazom od 131,1 K i navedenom cijenom od 0,96 USD za milijun ulaznih tokena i 3,20 USD za milijun izlaznih tokena. To ga čini oko 0,04 dolara jeftinijim po ukupnom ulaznom i izlaznom trošku (uz 1 milijun tokena) od njegovog prethodnika, prema našim izračunima.

Model

Ulazni

Izlaz

Ukupni trošak

Izvor

Grok 4.1 Brzi

0,20 dolara

0,50 dolara

0,70 dolara

xAI

Blizanac 3

0,50 dolara

3,00 dolara

3,50 dolara

Google

Kimi-K2.5

0,60 dolara

3,00 dolara

3,60 dolara

snimka mjeseca

GLM-5-Turbo

0,96 dolara

3,20 dolara

4,16 dolara

OpenRouter

GLM-5

1,00 dolara

3,20 dolara

4,20 dolara

Z.ai

Claude Haiku 4.5

1,00 dolara

5,00 USD

6,00 dolara

antropski

Qwen3-Max

1,20 dolara

6,00 dolara

7,20 dolara

Alibaba Cloud

Gemini 3 Pro

2,00 dolara

12,00 dolara

14,00 dolara

Google

GPT-5.2

1,75 dolara

14,00 dolara

15,75 dolara

OpenAI

GPT-5.4

2,50 dolara

15,00 dolara

17,50 dolara

OpenAI

Claude Sonet 4.5

3,00 dolara

15,00 dolara

18,00 dolara

antropski

Claude Opus 4.6

5,00 USD

25,00 dolara

30,00 dolara

antropski

GPT-5.4 Pro

30,00 dolara

180,00 dolara

210,00 dolara

OpenAI

Drugo, Z.ai također dodaje model svom GLM Coding pretplatničkom proizvodu, koji je njegova paketna usluga pomoćnika kodiranja. Ta usluga ima tri razine: Lite od 27 USD po kvartalu, Pro od 81 USD po kvartalu i Max od 216 USD po kvartalu.

Z.ai-jeva bilješka o predstavljanju od 15. ožujka kaže da Pro pretplatnici dobivaju GLM-5-Turbo u ožujku, dok Lite pretplatnici dobivaju osnovni GLM-5 u ožujku i moraju čekati do travnja za GLM-5-Turbo. Tvrtka također uzima aplikacije za rani pristup za poduzeća putem Google obrascašto sugerira da bi neki korisnici mogli dobiti pristup prije tog rasporeda, ovisno o kapacitetu.

z.ai opisuje GLM-5-Turbo kao dizajniran za “brzo zaključivanje” i “duboko optimiziran za tijekove rada agenata u stvarnom svijetu koji uključuju duge lance izvršavanja”, s poboljšanjima u složenoj dekompoziciji instrukcija, korištenju alata, planiranom i postojanom izvršavanju i stabilnosti u proširenim zadacima.

Izdanje programerima nudi novu opciju za izgradnju autonomnih AI agenata u stilu OpenClaw i služi kao signal o tome kamo proizvođači modela misle da ide potražnja poduzeća: dalje od sučelja za chat prema sustavima koji mogu pouzdano izvršavati rad u više koraka.

Tu se sada seli i velik dio konkurencije, posebno među dobavljačima koji pokušavaju pridobiti programere i poslovne timove koji grade interne pomoćnike, orkestratore tijeka rada i agente za kodiranje.

Sadržaj objave

  • 1 Stvoren za izvršenje, a ne samo za razgovor
  • 2 Pozadina: z.ai i GLM-5 postavili su pozornicu za Turbo
  • 3 Značajke programera i pakiranje modela
  • 4 Benchmarking i cijene
  • 5 Nijansiraniji signal licenciranja
  • 6 Kinesko tržište umjetne inteligencije možda se vraća u ravnotežu od otvorenog koda
    • 6.1 Povezani sadržaji

Stvoren za izvršenje, a ne samo za razgovor

Z.ai materijali uokviruju GLM-5-Turbo kao model za ponašanje agenta slično proizvodnom, a ne statičnu upotrebu brzog odgovora.

Predstavljanje se usredotočuje na pouzdanost u praktičnim tokovima zadataka: bolje praćenje naredbi, jače pozivanje alata, poboljšano rukovanje zakazanim i trajnim zadacima i brže izvršenje kroz dulje logičke lance. To pozicioniranje stavlja model izravno na tržište za agente koji rade više od odgovora na pitanja.

Usmjeren je na sustave koji mogu prikupljati informacije, pozivati ​​alate, raščlanjivati ​​upute i nastaviti raditi kroz složene nizove zadataka uz manje nadzora.

Umjesto izravnog nasljednika GLM-5, čini se da je GLM-5-Turbo varijanta koja je više usmjerena na izvršenje: podešena za brzinu, upotrebu alata i stabilnost agenata dugog lanca, dok osnovni GLM-5 ostaje vodeći Z.ai širi open-source.

GLM-5-Turbo čini se posebno konkurentnim u OpenClaw scenarijima kao što su pretraživanje i prikupljanje informacija, uredski i dnevni zadaci, analiza podataka, razvoj i operacije te automatizacija. To su materijali koje isporučuje tvrtka, a ne neovisna provjera valjanosti, ali jasno pokazuju namjeravano pozicioniranje proizvoda.

Pozadina: z.ai i GLM-5 postavili su pozornicu za Turbo

Osnovan 2019. kao spinoff Sveučilišta Tsinghua u Pekingu, Z.ai — bivši Zhipu AI — sada je jedna od najpoznatijih kineskih tvrtki za modeliranje temelja. Sjedište tvrtke ostaje u Pekingu, a vodi je CEO Zhang Peng

Z.ai je uvršten na burzu u Hong Kongu 8. siječnja 2026., s dionicama po cijeni od 116,20 HK$ i početnom cijenom od 120 HK$, s navedenom tržišnom kapitalizacijom od 52,83 milijarde HK$, što ga čini najvećim kineskim neovisnim razvijačem modela velikog jezika.

Do 30. rujna 2025. njegove je modele navodno koristilo više od 12 000 poslovnih korisnika, više od 80 milijuna uređaja krajnjih korisnika i više od 45 milijuna programera diljem svijeta.

Posljednje veliko izdanje Z.aija, GLM-5, koje je debitiralo u veljači 2026., daje koristan kontekst za ono što tvrtka sada pokušava učiniti s GLM-5-Turbo.

GLM-5 je vodeći model otvorenog koda koji nosi licencu MIT-a, bilježi rekordno nisku ocjenu halucinacija na AA-Omniscience Indexu i debitirao je s izvornim “Agent Mode” koji može pretvoriti upute ili izvorne materijale u .docx, .pdf i .xlsx datoteke spremne za korištenje.

To ranije izdanje također je uokvireno kao veliki tehnički korak naprijed za tvrtku. GLM-5 skaliran je na 744 milijarde parametara s 40 milijardi aktivnih po tokenu u arhitekturi mješavine stručnjaka, koristio je 28,5 trilijuna tokena za prethodnu obuku i oslanjao se na novu asinkronu infrastrukturu za učenje pojačanja nazvanu “sluz” za smanjenje uskih grla u obuci i podršku složenijem agentskom ponašanju.

U tom svjetlu, GLM-5-Turbo manje izgleda kao zamjena za GLM-5 nego kao uži komercijalni izdanak: varijanta koja zadržava dugotrajni kontekst, agentsku orijentaciju vodeće linije, ali naglašava brzinu, stabilnost i izvršenje u lancima agenata u stvarnom svijetu.

Značajke programera i pakiranje modela

S tehničke strane, Z.ai je pakirao GLM-5 obitelj s vrstama mogućnosti koje programeri sada očekuju od ozbiljnih modela okrenutih prema agentima, uključujući rukovanje dugim kontekstom, alate, podršku za razmišljanje i strukturirane integracije.

OpenRouter GLM-5-Turbo stranica navodi podršku za alate, izbor alata i oblikovanje odgovora, dok također prikazuje podatke o performansama uživo uključujući prosječnu propusnost i latenciju.

OpenRouterova telemetrija pružatelja usluga dodaje korisnu usporedbu na razini implementacije između GLM-5 i GLM-5-Turbo, iako podaci nisu savršeno jabuke jabukama jer se GLM-5 pojavljuje kod nekoliko pružatelja usluga, dok se GLM-5-Turbo prikazuje samo kroz Z.ai.

Što se tiče propusnosti, GLM-5-Turbo ima prosjek od 48 tokena u sekundi na OpenRouteru, što ga stavlja ispod najbržih GLM-5 krajnjih točaka prikazanih na snimkama zaslona, ​​uključujući Fireworks od 70 tok/s i Friendli od 58 tok/s, ali iznad Togetherovih 40 tok/s.

Na sirovoj latenciji prvog tokena, GLM-5-Turbo je sporiji u dostupnim podacima, objavljujući 2,92 sekunde naspram 0,41 sekunde za Friendlijevu krajnju točku GLM-5, 1,00 sekunde za Parasail i 1,08 sekundi za DeepInfra.

Ali slika se poboljšava u vremenu završetka od kraja do kraja: GLM-5-Turbo se prikazuje na 8,16 sekundi, brže od krajnjih točaka GLM-5, koje se kreću od 9,34 sekunde na Fireworksu do 11,23 sekunde na DeepInfri.

Najznačajnija operativna prednost je u pouzdanosti alata. GLM-5-Turbo pokazuje stopu pogreške pozivanja alata od 0,67%, značajno nižu od prikazanih pružatelja GLM-5, gdje se stope pogreške kreću od 2,33% do 6,41%.

Za poslovne timove, to sugerira model koji možda neće pobijediti na početnoj odzivnosti u svom trenutnom OpenRouter usmjeravanju, ali bi još uvijek mogao biti prikladniji za duža izvođenja agenta gdje su stabilnost dovršetka i manji kvar alata važniji od najbržeg prvog tokena.

Benchmarking i cijene

ZClawBench radarska karta koju je objavio z.ai pokazuje GLM-5-Turbo kao posebno konkurentnog u OpenClaw scenarijima kao što su pretraživanje i prikupljanje informacija, uredski i dnevni zadaci, analiza podataka, razvoj i operacije te automatizacija.

To su referentni vizualni prikazi koje je dostavila tvrtka, a ne neovisna provjera valjanosti, ali oni pomažu objasniti kako Z.ai želi da se razumiju dva modela: GLM-5 kao šire kodiranje i otvoreni vodeći model te Turbo kao ciljanija varijanta izvršavanja agenta.

Nijansiraniji signal licenciranja

Jedno značajno upozorenje je licenciranje. Z.ai kaže da je GLM-5-Turbo trenutno zatvorenog koda, ali također kaže da će mogućnosti i otkrića modela biti uključeni u sljedeće izdanje modela otvorenog koda. To je važna razlika. Tvrtka jasno ne obećava otvoren izvor GLM-5-Turbo.

Umjesto toga, kaže se da će lekcije, tehnike i poboljšanja iz ovog izdanja informirati budući otvoreni model. Zbog toga je lansiranje više nijansirano nego čisti prekid otvorenosti.

Z.aijeva ranija GLM strategija uvelike se oslanjala na otvorena izdanja i distribuciju otvorene težine, što mu je pomoglo u izgradnji vidljivosti među programerima.

Kinesko tržište umjetne inteligencije možda se vraća u ravnotežu od otvorenog koda

Stanje licenciranja GLM-5-Turbo također se odnosi na širi kontekst kineskog tržišta što čini lansiranje značajnijim od jednostavnog ažuriranja proizvoda.

Posljednjih tjedana, izvještavanje o Alibabinoj jedinici Qwen pokrenulo je nova pitanja o tome kako će vodeći kineski laboratoriji za umjetnu inteligenciju uravnotežiti otvorena izdanja s komercijalnim pritiskom.

Ranije ovog mjeseca, voditelj odjela Qwen Lin Junyang odstupio je, postavši treći viši rukovoditelj Qwena koji je otišao 2026., iako je Alibabina obitelj Qwen i dalje jedno od najplodnijih otvorenih modela bilo gdje, s više od 400 modela otvorenog koda objavljenih od 2023. i više od 1 milijarde preuzimanja.

Reuters je tada izvijestio 16. ožujka da će izvršni direktor Alibabe Eddie Wu preuzeti izravnu kontrolu novoformirane poslovne grupe usmjerene na umjetnu inteligenciju koja konsolidira Qwen i druge jedinice, usred nadzora nad strategijom, profitabilnošću i brutalnom cjenovnom konkurencijom koja okružuje ponudu otvorenog modela u Kini.

Čak i bez preuveličavanja tih razvoja, oni pomažu postaviti šire pitanje koje visi nad sektorom: počinje li ekonomija granične umjetne inteligencije tjerati čak i povijesno otvorene kineske laboratorije prema više segmentiranoj strategiji.

To ne znači da kineski laboratoriji napuštaju otvoreni kod. Ali obrazac je sve teže ignorirati: otvoreni modeli pomažu u usvajanju, dobroj volji programera i dosegu ekosustava, dok određene varijante visoke vrijednosti namijenjene poslovnim agentima, tijekove rada kodiranja i druge komercijalno atraktivne slučajeve upotrebe mogu sve češće dolaziti prve kao vlasnički proizvodi.

U tom smislu, GLM-5-Turbo odgovara većem mogućem pomaku na kineskom tržištu umjetne inteligencije, onom koji izgleda sve sličnije priručniku koji koriste OpenAI, Anthropic i Google u SAD-u: otvorenost kao distribucija, vlasnički sustavi kao posao.

Gledano u tom svjetlu, GLM-5-Turbo izgleda više od ažuriranja proizvoda usmjerenog na brzinu. To može biti još jedan znak da se dijelovi kineskog AI sektora kreću prema istom hibridnom modelu koji je već uobičajen u SAD-u: otvorenost kao distribucija, vlasnički sustavi kao posao.

To ne bi označilo kraj AI-ja otvorenog koda iz kineskih laboratorija, ali bi moglo značiti da će se njihove strateški najvažnije ponude usmjerene na agente prvo pojaviti iza zatvorenog pristupa, čak i ako neki od njihovih temeljnih napredaka kasnije dospiju u otvorena izdanja.

Za programere koji procjenjuju agentske platforme, to čini GLM-5-Turbo i lansiranjem proizvoda i korisnim signalom. Z.ai još uvijek govori jezikom otvorenih modela. Ali s ovim izdanjem, također pokazuje da bi neki od njegovih komercijalno najrelevantnijih radova mogli prvo stići kao vlasnička infrastruktura za agentske sustave poslovne razine.

Web izvor

Povezani sadržaji

  • Taj ‘jeftini’ AI model otvorenog koda zapravo gori kroz vaš računalni proračunTaj ‘jeftini’ AI model otvorenog koda zapravo gori kroz vaš računalni proračun
  • Popravak za neuredne ekosustave AI agenata mogao bi konačno biti ovdje – i otvorenog je kodaPopravak za neuredne ekosustave AI agenata mogao bi konačno biti ovdje – i otvorenog je koda
  • Događaj Fortnite Remix Finale oborio je rekord od 14 milijuna svih vremenaDogađaj Fortnite Remix Finale oborio je rekord od 14 milijuna svih vremena
  • Što je web poslužitelj i kako radi?Što je web poslužitelj i kako radi?
  • Nova značajka Gmail -a gotovo čini život potpunimNova značajka Gmail -a gotovo čini život potpunim
  • Označavanje Powerpoint prezentacije uz pomoć olovke

Previous Article

Japan odobrio prvi tretman na svijetu napravljen reprogramiranim ljudskim stanicama

Posljednje objave

z.ai predstavlja brži, jeftiniji GLM-5 Turbo model za agente i ‘kanđe’ — ali nije otvorenog koda

z.ai predstavlja brži, jeftiniji GLM-5 Turbo model za agente i ‘kanđe’ — ali nije otvorenog koda

Japan odobrio prvi tretman na svijetu napravljen reprogramiranim ljudskim stanicama

Japan odobrio prvi tretman na svijetu napravljen reprogramiranim ljudskim stanicama

Kako očistiti Roku TV predmemoriju (i zašto je to važno)

Sadržaj

  • 1 Stvoren za izvršenje, a ne samo za razgovor
  • 2 Pozadina: z.ai i GLM-5 postavili su pozornicu za Turbo
  • 3 Značajke programera i pakiranje modela
  • 4 Benchmarking i cijene
  • 5 Nijansiraniji signal licenciranja
  • 6 Kinesko tržište umjetne inteligencije možda se vraća u ravnotežu od otvorenog koda

Novosti

  • z.ai predstavlja brži, jeftiniji GLM-5 Turbo model za agente i ‘kanđe’ — ali nije otvorenog koda 16. ožujka 2026
  • Japan odobrio prvi tretman na svijetu napravljen reprogramiranim ljudskim stanicama 16. ožujka 2026
  • Kako očistiti Roku TV predmemoriju (i zašto je to važno) 16. ožujka 2026
  • Vlasnici Galaxy Z Fold 7, preuzmite ovo ogromno ažuriranje korisničkog sučelja 8.5 Beta 16. ožujka 2026
  • Razvojni inženjeri Warner Bros. Montréala izvješćuju o otpuštanjima 16. ožujka 2026
  • CES 2026: Connected vehicles accelerate the pace of AI 16. ožujka 2026
  • Rješavanje kvara umjetne inteligencije: tri promjene koje poduzeća trebaju napraviti sada 15. ožujka 2026
  • Nova studija detaljno opisuje kako mačke gotovo uvijek slijeću na noge 15. ožujka 2026
  • The best external hard drives of 2026: Expert tested 15. ožujka 2026
  • AT&T-ovi novi neograničeni planovi izgledaju solidno 15. ožujka 2026

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice