Industrija umjetne inteligencije u potpunosti je ušla u "doba agenta," paradigma u kojoj modeli umjetne inteligencije čine mnogo više od generiranja teksta – oni sada aktivno planiraju, izvršavaju i ispravljaju složene zadatke tijekom dana, a ne sekundi.
Stoga možda nije iznenađujuće vidjeti kako kineski div e-trgovine Alibaba, poznati tim istraživača AI-ja Qwen, izdaje model sposoban za obavljanje autonomnog agentskog rada AI-ja tijekom više dana: taj je model stigao u obliku Qwen3.7-Max koji izvješćuje tvrtka u objavi na blogu postignuto "~35 sati kontinuiranog autonomnog rada" — doduše, u vlasničkom, a ne otvorenom formatu, kao što su bila prethodna izdanja Qwen Teama.
To je također za očekivati — to je ono čega su se mnogi analitičari i industrijski stručnjaci bojali nakon odlaska nekoliko ključnih voditelja Qwen tima ranije ove godine. Ali financijski to ima smisla za Alibabu, barem kratkoročno: obuka modela umjetne inteligencije, osobito onih moćnih kao što je Qwen3.7-Max, skupa je, a njihovo besplatno davanje, kao što su modeli otvorenog koda, ne pomaže odmah nadoknaditi sve troškove.
U tom smislu, Alibaba jednostavno usklađuje svoje napore s američkim divovima umjetne inteligencije kao što su OpenAI i Google nudeći najnovije i najbolje modele samo putem plaćenih API-ja i pretplate ili paketa plaćenih web planova, te nešto manje učinkovite putem otvorenog koda.
Ipak, dolazak Qwen3.7-Max nudi daljnje opcije za poduzeća i pojedinačne korisnike, te veću konkurenciju za američke laboratorije umjetne inteligencije — rijetko loša stvar za potrošače na svim razinama proračuna. Ipak, činjenica da je model dostupan samo s krajnjih točaka sa sjedištem u Kini znači da bi mogao biti ograničen u svojoj privlačnosti američkim i europskim poduzećima koja žele maksimalno povećati usklađenost i sigurnost pri ispunjavanju državnih ugovora ili čak samo pokušavaju poštivati sve relevantne državne, lokalne i nacionalne propise o suverenitetu podataka.
Sadržaj objave
Era maratonske umjetne inteligencije
Da bismo razumjeli zašto je Qwen3.7-Max odmak od prethodnih modela, moramo pogledati kako je obučen i kako radi u praksi.
Jezični modeli obično se degradiraju kada su prisiljeni održavati jedan tok misli tijekom tisuća razgovora; zaborave upute, haluciniraju varijable ili jednostavno zapnu u logičkim petljama. Qwen3.7-Max je posebno dizajniran kao "svestran agent temelj" sposoban za "razmišljanje dugog horizonta" kako bi se prevladalo upravo ovo usko grlo.
Najupečatljivija demonstracija ove sposobnosti je zadatak autonomnog inženjeringa koji je detaljno opisao Qwen tim. Model je dobio pristup izoliranom poslužitelju opremljenom T-Head ZW-M890 PPU-om – hardverskom arhitekturom s kojom se model nikada nije susreo tijekom svoje obuke. Njegov je zadatak bio optimizirati jezgru pažnje.
Tijekom 35 uzastopnih sati Qwen3.7-Max radio je potpuno autonomno. Izvršio je 1158 različitih poziva alata, izvršio 432 evaluacije kernela, dijagnosticirao greške kompilacije i iterativno poboljšavao kod kako bi postigao 10,0x geometrijsku sredinu ubrzanja.
Za usporedbu, kineski konkurentski modeli poput z.ai-jevog GLM-5.1 i Moonshotovog Kimi K2.6 ograničeni su na 7,3x odnosno 5,0x ubrzanja, često dobrovoljno prekidajući svoje sesije kada ne postignu napredak. Međutim, oba su dostupna otvorenog koda.
Ova izdržljivost se postiže kroz ono što Alibaba zove "skaliranje okruženja". Baš kao što su rani LLM-ovi postajali pametniji unošenjem raznovrsnijeg teksta, Qwen3.7-Max je bio obučen u golemom, skaliranom nizu dinamičkih agentskih okruženja.
Sposoban je simulirati jednogodišnji životni ciklus startupa u "YC-klupa" evaluacija, navigacija kroz stotine krugova donošenja odluka koji obuhvaćaju upravljanje osobljem i pregled ugovora. U ovoj simulaciji, model je uspio generirati 2,08 milijuna dolara virtualnog prihoda, gotovo udvostručivši performanse prethodne generacije, Qwen3.6-Plus.
Nadalje, model ima ugrađeno samonadzor za hakiranje nagrada, autonomno detektira kada pokuša prevariti okruženje za treniranje i dodaje heuristička pravila za ispravljanje vlastitog ponašanja.
Mozak za svaku skelu
Iz perspektive proizvoda, Qwen3.7-Max je dizajniran da bude kognitivni motor za moderni razvoj softvera i automatizaciju poduzeća.
Model nudi golemi kontekstni prozor od 1 milijun tokena i maksimalno izlazno ograničenje od 64K, pružajući goleme troškove za obradu razgranatih baza koda ili dugih tehničkih dokumenata.
Jedna od njegovih najuvjerljivijih značajki je "cross-harness generalizacija". Umjesto da bude tvrdo kodiran da najbolje radi unutar specifičnog vlasničkog sučelja, Qwen3.7-Max je izgrađen da djeluje kao ulazni sloj inteligencije za različite agentske okvire. To izvorno podržava Anthropic API protokol, omogućujući programerima da uključite ga izravno u postojeće alate kao što su Claude Code ili OpenClaw.
Referentni podaci koje je pružila Alibaba pokazuju da je ovaj generalizirani pristup imao goleme koristi.
Na mjerilu Apex Math ReasoningQwen3.7-Max postigao je 44,5, nadmašivši rezultat Claudea Opus-4.6 Maxa od 34,5 i DeepSeek V4-Pro Max’s 38.3. Također je objavljeno dominantne rezultate na Humanity’s Last Exam (41,4) i realističnu referentnu vrijednost agenta kodiranja MCP-Atlas (76,4).
To se pretvara u opipljivu korisnost za krajnje korisnike. Putem integracija Open Source Model Context Protocol (MCP), model može raditi kao autonomni uredski pomoćnik, sposoban čitati sveučilišne specifikacije za formatiranje i automatski preformatirati neuredan Word dokument putem alata naredbenog retka bez ljudske intervencije.
Vođenje ove razine inteligencije ima posebnu cijenu. Razvojni programeri koji pristupe API-ju putem Alibaba Cloud Model Studio platit će 2,50 USD za 1 milijun ulaznih tokena i 7,50 USD za 1 milijun izlaznih tokena. Platforma također nudi eksplicitno stvaranje predmemorije i cijene čitanja, kao i naknadu od 10 USD za 1000 poziva za integrirana web pretraživanja, iako alati za tumačenje koda ostaju besplatni ograničeno vrijeme.
Qwen3.7-Max zauzima stratešku sredinu u trenutnoj API ekonomiji. Iako zahtijeva primjetnu premiju u odnosu na domaće rivale po agresivnim cijenama – koštajući gotovo dvostruko više od DeepSeek V4 Pro (5,22 USD) i Z.ai GLM-5.1 (5,80 USD) – drastično potkopava gigante sa zapadne granice s kojima se rutinski mjeri u mjerilima.
Za kontekst, pokretanje teških agentskih radnih procesa kroz OpenAI-jev GPT-5.4 ili Anthropicov Claude Opus 4.7 će programerima naplatiti 17,50 USD odnosno 30,00 USD za milijun tokena. Pogledajte tablicu cijena VentureBeata u nastavku:
VentureBeat Frontier AI Model API pregled cijena
|
Model |
Ulazni |
Izlaz |
Ukupni trošak |
Izvor |
|
MiMo-V2.5 Flash |
0,10 dolara |
0,30 dolara |
0,40 dolara |
|
|
MiniMax M2.7 |
0,30 dolara |
1,20 dolara |
1,50 dolara |
|
|
Gemini 3.1 Flash-Lite |
0,25 dolara |
1,50 dolara |
1,75 dolara |
|
|
MiMo-V2.5 |
0,40 dolara |
2,00 dolara |
2,40 dolara |
|
|
Kimi-K2.6 |
0,95 dolara |
4,00 dolara |
4,95 dolara |
|
|
GLM-5 |
1,00 dolara |
3,20 dolara |
4,20 dolara |
|
|
Grok 4.3 (niski kontekst) |
1,25 dolara |
2,50 dolara |
3,75 dolara |
|
|
DeepSeek V4 Pro |
1,74 dolara |
3,48 dolara |
5,22 dolara |
|
|
GLM-5.1 |
1,40 dolara |
4,40 dolara |
5,80 dolara |
|
|
Claude Haiku 4.5 |
1,00 dolara |
5,00 USD |
6,00 dolara |
|
|
Grok 4.3 (visoki kontekst) |
2,50 dolara |
5,00 USD |
7,50 dolara |
|
|
Qwen3.7-Maks |
2,50 dolara |
7,50 dolara |
10,00 dolara |
|
|
Gemini 3.5 Flash |
1,50 dolara |
9,00 dolara |
10,50 dolara |
|
|
Pregled Gemini 3.1 Pro (≤200K) |
2,00 dolara |
12,00 dolara |
14,00 dolara |
|
|
GPT-5.4 |
2,50 dolara |
15,00 dolara |
17,50 dolara |
|
|
Gemini 3.1 Pro Pregled (>200K) |
4,00 dolara |
18,00 dolara |
22,00 dolara |
|
|
Claude Opus 4.7 |
5,00 USD |
25,00 dolara |
30,00 dolara |
|
|
GPT-5.5 |
5,00 USD |
30,00 dolara |
35,00 dolara |
Pozicioniranjem Qwen3.7-Max odmah ispod Googleovog Gemini 3.5 Flasha (10,50 USD), ali znatno iznad proračunskih modela, Alibaba signalizira da ovo nije robno izdanje; to je vodeći mehanizam za rasuđivanje čija je cijena namjera odvući radna opterećenja poduzeća od najskupljih ponuda Silicijske doline.
Licenciranje za sada ostaje vlasništvo
Uz svu njegovu tehničku briljantnost, najkontroverzniji aspekt Qwen3.7-Maxa je kako se distribuira. Qwen naplaćuje izdanje kao "vlasnički model". To je striktno samo API.
Povijesno gledano, Alibabin Qwen bio je heroj za open-source i lokalne LLM zajednice. Prethodne iteracije, poput Qwen 2.5 i Qwen 3.6, javno su objavile svoje težine. Otvorene težine omogućuju programerima, istraživačima i tvrtkama da preuzmu model, pokreću ga na vlastitom hardveru i fino ga prilagode za vrlo specifične ili podatkovno osjetljive slučajeve upotrebe bez slanja vlasničkih informacija poslužitelju treće strane.
Zaključavanjem Qwen3.7-Max iza API-ja, Alibaba se okreće standardnom komercijalnom priručniku koji koriste OpenAI (s GPT-4) i Anthropic (s Claudeom). Za poslovne korisnike to znači da korištenje Qwen3.7-Max zahtijeva povjerenje Alibaba Cloudu u njihove tokove podataka i potpuno oslanjanje na internetsku vezu za pokretanje njihovih agentskih radnih procesa. Za zajednicu otvorenog koda to znači gubitak pristupa onome što je trenutno jedan od najsposobnijih modela na planetu.
Reakcije zajednice podijeljene su između strahopoštovanja i razočaranja
Reakcija zajednice programera bila je brza, karakterizirana mješavinom dubokog poštovanja prema inženjerskom postignuću i frustracije zbog modela licenciranja.
Istaknuti AI komentator Sudo su (@sudoingX) uhvatio prevladavajući osjećaj na X (bivši Twitter). "qwen je nestvarna," napisali su. "upravo su pali 3,7 max i pobjeđuje opus 4,6 max na većini mjerila koja su izvodili".
Tehničke metrike, posebice izdržljivost modela, ostavile su mnoge na terenu zapanjene. "vršni matematički broj, 44,5 u odnosu na opus 34,5, to nije mala praznina," Sudo su primijetili. "35 sati neprekidno na zadatku optimizacije kernela s 1000+ poziva alata je dio koji stalno iznova čitam. to je stvar agentske ere koja se zapravo događa, a ne slajd".
Brzina Alibabine iteracije također privlači pozornost. Uz Qwen 3.6 koji je objavljen prošlog mjeseca, skok na 3.7-Max naglašava nemilosrdnu razvojnu kadencu. Kao što je Sudo su primijetio, "nitko drugi se ne kreće ovako".
Ipak, pohvale su uvelike oslabljene zbog prelaska na zatvoreni ekosustav. Gubitak težine modela smatra se udarcem lokaliziranom pokretu umjetne inteligencije, koji se oslanja na najsuvremenije otvorene modele kako bi pomaknuo granice onoga što se može učiniti na potrošačkom hardveru ili klasterima privatnih poduzeća.
"jedna stvar ipak, molim te otvori izvorni kod i ovo," Sudo su se izjasnili u svom postu. "3.6 dense poboljšao je cijeli lokalni llm ekosustav. API za maksimalnu razinu samo bi zatvorio vrata koja smo držali otvorenima. daj nam utege na kraju".
Qwen3.7-Max dokazuje da era autonomnog agenta više nije teorijska projekcija; to je sadašnja stvarnost sposobna za izvođenje složenih inženjerskih pothvata dok ljudi spavaju. Sada je jedino pitanje hoće li ova nova granica AI biti demokratizirani resurs koji možete preuzeti na svoje prijenosno računalo ili uslužni program za obavještavanje koji se iznajmljuje isključivo iz oblaka. Za sada, s Qwen3.7-Maxom, nedvojbeno je ovo drugo.
