• Sri. lip 3rd, 2026

Oblak Znanja

informatička edukacija i vijesti

Alibabin Qwen3.7-Plus podržava unos teksta, videa i slika po niskoj cijeni od 0,4 USD/1,6 USD po 1M tokenu — ali je vlasnički

ByTomšić Damjan

lip 3, 2026

Alibaba ovaj tjedan objavio Qwen3.7-Plusnajnoviji AI veliki jezični model (LLM) u svojoj globalno omiljenoj i sve ekspanzivnijoj obitelji Qwen, koji se može pohvaliti više multimodalnih mogućnosti i 60% nižom cijenom od prethodnog modela Qwen3.7-Max samo s tekstom koji je objavljen prije samo nekoliko tjedana.

Međutim, poput svog neposrednog prethodnika Qwen3.7-Plus dostupan je samo pod a "Zatvoreno" komercijalna licenca putem vlasnička sučelja za programiranje aplikacija (API) i Qwen Chat.

To označava veliko odstupanje od dosadašnje Qwen strategije, koja je uglavnom bila usmjerena na izdavanje moćnih, gotovo najsuvremenijih modela otvorenog koda. One tvrtke i korisnici koji su se oslanjali na Qwen modele otvorenog koda — među njima, Američki divovi kao što je Airbnb — bez sumnje će biti razočarani kada vide da se Alibaba zatvara zbog svojih novih izdanja.

Ipak, model je vrijedan pažnje zbog njegove niske cijene i visokih performansi na multimodalnim zadacima kao što je stvaranje vizualnih sadržaja poslovne razine ili analiza videa, slika i snimaka zaslona, ​​što Qwen3.7-Max ne može (samo je tekst). Među jeftinijim je moćnim AI modelima koji su sada dostupni, a cijenom je malo iznad novog MiniMax-M3 kineskog rivala s vremenski ograničenim popustom.

VentureBeat Frontier AI Model API pregled cijena

Model

Ulazni

Izlaz

Ukupni trošak

Izvor

MiMo-V2.5 Flash

0,10 dolara

0,30 dolara

0,40 dolara

Xiaomi MiMo

deepseek-v4-flash

0,14 dolara

0,28 dolara

0,42 dolara

DeepSeek

deepseek-v4-pro

0,435 dolara

0,87 dolara

1305 dolara

DeepSeek

MiniMax-M3

0,30 dolara

1,20 dolara

1,50 dolara

MiniMax

Qwen3.7-Plus

0,40 dolara

1,60 dolara

2,00 dolara

Alibaba Cloud

Gemini 3.1 Flash-Lite

0,25 dolara

1,50 dolara

1,75 dolara

Google

MiMo-V2.5

0,40 dolara

2,00 dolara

2,40 dolara

Xiaomi MiMo

Grok 4.3 niski kontekst

1,25 dolara

2,50 dolara

3,75 dolara

xAI

GLM-5

1,00 dolara

3,20 dolara

4,20 dolara

Z.ai

Kimi-K2.6

0,95 dolara

4,00 dolara

4,95 dolara

Snimak mjeseca/Kimi

GLM-5.1

1,40 dolara

4,40 dolara

5,80 dolara

Z.ai

Grok 4.3 visoki kontekst

2,50 dolara

5,00 USD

7,50 dolara

xAI

Qwen3.7-Maks

2,50 dolara

7,50 dolara

10,00 dolara

Alibaba Cloud

Gemini 3.5 Flash

1,50 dolara

9,00 dolara

10,50 dolara

Google

Gemini 3.1 Pro Pregled ≤200K

2,00 dolara

12,00 dolara

14,00 dolara

Google

GPT-5.4

2,50 dolara

15,00 dolara

17,50 dolara

OpenAI

Gemini 3.1 Pro Pregled >200K

4,00 dolara

18,00 dolara

22,00 dolara

Google

Claude Opus 4.8

5,00 USD

25,00 dolara

30,00 dolara

antropski

GPT-5.5

5,00 USD

30,00 dolara

35,00 dolara

OpenAI

Održavanje kontinuiteta tijekom složenih petlji izvršavanja alata

Za tehničke donositelje odluka koji postavljaju autonomne agente, primarno usko grlo rijetko je bila početna inteligencija modela. Umjesto toga, jest propadanje države— tendencija agentskog okvira da izgubi svoju analitičku putanju tijekom zadataka koji se sastoje od više koraka i dugih horizonta.

Qwen3.7-Plus rješava ovu arhitektonsku ranjivost kombiniranim pristupom upravljanju kontekstom i očuvanjem stanja obrazloženja.

Model se isporučuje s a Prozor konteksta od 1 milijun tokena i dodjeljuje do 256K tokena posebno za internu obradu lanca misli. Da biste kontekstualizirali ovaj kapacitet, zamislite automatiziranog agenta za migraciju u oblak: on može unijeti cijelu bazu koda, mapirati ovisnosti i potrošiti tisuće tokena tiho procjenjujući rubne slučajeve prije nego što izvrši jedan redak bash skripte.

Ključno, API izlaže parametar pod nazivom ‘preserve_thinking.’ U cijelom Alibabinom ekosustavu ova mogućnost služi kao standardizirani arhitektonski most, a ne višeslojna prednost. Alibaba je uvela značajku tijekom prethodne generacije Qwen 3.6, integrirajući je u oba Qwen3.6-27B i vlasnički Max modeli.

U svojoj srži, parametar radi na razini API-ja i predloška kako bi zadržao interno <think> blokovi kroz kontinuirane konverzacijske skretanja.

Ovaj strukturni kontinuitet rješava kritično usko grlo za programere koji razvijaju dugoročne zadatke. Održavajući te unutarnje logičke petlje netaknutima, značajka sprječava da model ispusti svoj kontekst ili nepotrebno ponovno izračuna svoju predmemoriranu povijest usred operacije.

Kada model izvršava složene dodjele agentskog kodiranja u više koraka, ovo zadržavanje omogućuje sustavu da zadrži svoj izvorni tok misli bez gubljenja zapleta ili zaboravljanja temeljne logike svojih prethodnih radnji.

Alibaba nije usamljena u prepoznavanju ove tehničke nužnosti, budući da temeljni koncept sada diktira arhitekturu gotovo svih velikih laboratorija umjetne inteligencije.

Anthropic koristi upravo ovu sposobnost pod nadimkom "Prošireno razmišljanje" za svoje napredne modele, uključujući najnoviji Claude Opus 4.8. Ovaj okvir zahtijeva od razvojnih programera da nemodificirane blokove razmišljanja vraćaju izravno natrag u API u sljedećim okretajima kako bi održali neprekinuti lanac razmišljanja.

OpenAI se nosi s istim izazovom kroz šifrirani mehanizam povratnog razmišljanja za modele poput GPT-5.5. Unutar ekosustava OpenAI, programeri moraju vratiti specifične stavke razmišljanja generirane uz prethodne pozive funkcija, osiguravajući da model eksplicitno pamti obrazloženje iza izvršavanja svojih alata.

U konačnici, preserve_thinking jednostavno predstavlja Alibabinu terminologiju za ono što je brzo postalo neosporan stolni ulog za moderno višestruko zaključivanje.

Referentne vrijednosti pokazuju konkurentan, ali ipak ispod najsuvremenijeg modela

Na sirovoj metrici sposobnosti, ova arhitektura dubokog promišljanja prevodi se u strukturne dobitke u multimodalnim i agentskim mjerilima. Međutim, još uvijek je ispod mnogih vodećih i prethodnih generacija američkih vlasničkih modela kao što su Anthropicov Claude Opus 4.6 i OpenAI-jev GPT-5.4.

Na Terminal Bench 2.0-Terminuskoji mjeri sposobnost modela da sigurno i iterativno pokrene stvarni kod na razini terminala, Qwen3.7-Plus je postigao 70.3nadmašivši DeepSeek-V4-Pro Max (67,9) i Gemini-3.1 Pro (63,5).

Na mjerilima računalnog vida koja zahtijevaju razumijevanje lokaliziranog sučelja, kao što je ScreenSpot Propogodila je manekenka 79.0značajno nadmašujući naslijeđene istaknute igrače u industriji kao što su GPT-5.4 (xhigh) na 67.4 i Claude-Opus-4.6 na 49.5. Mjerni podaci o procjeni agenata (odabrane referentne vrijednosti)

Za što bi poduzeća trebala razmotriti Qwen3.7-Plus?

Za poslovnog arhitekta, ključno pitanje pri analizi Qwen3.7-Plus je jasno: Što ovo zamjenjuje u našem trenutnom tehnološkom nizu?

Model je dizajniran da uđe kao izravna zamjena za vrhunske granične modele (kao što su GPT-5-tier ili Claude-Max-tier modeli) unutar visokofrekventnih tijekova rada programera, robotske automatizacije procesa (RPA) i cjevovoda inženjeringa podataka.

Umjesto postavljanja skupog, vodećeg modela opće namjene za rukovanje ponavljajućim operacijama sustava, tehnički timovi mogu usmjeriti ove zadatke na Qwen3.7-Plus. Istovremeno upravlja interpretacijom vizualnog sučelja, izvršavanjem naredbi i generiranjem koda.

Alibaba je strukturirao svoju isporuku API-ja kako bi se uskladio s postojećim open-source i vlasničkim poslovnim okvirima. Krajnje točke su u potpunosti kompatibilne s OpenAI-jem, što znači da zamjena postojećih ovisnosti zahtijeva minimalnu prilagodbu infrastrukture. Za grupe koje koriste autonomne okvire terminala, integracija je izvorno podržana u više okruženja.

Inženjeri mogu pokrenuti Qwen3.7-Plus izravno kroz svoje lokalne postavke terminala mijenjanjem ciljeva osnovnog okruženja.

Iz perspektive čistog troška, ​​pokretanje okvira agenta koji se stalno poziva na velika spremišta koda ili povijesti vizualnog izgleda može brzo postati previsoka cijena.

Alibaba to rješava izlažući cjenovne točke granularnog predmemoriranja.

Standardna obrada unosa iznosi 0,40 USD po milijunu tokena, ali ako agent čita iz eksplicitno stvorene predmemorije (npr. ogromnog osnovnog repozitorija ili standardnog poslovnog UI kompleta koji ostaje statičan tijekom stotina automatiziranih petlji), cijena naglo pada na 0,04 USD po 1 milijunu tokena za naknadna čitanja.

Ova razina čini visokofrekventne, multi-turn agent iteracije ekonomski praktičnima na razini poduzeća.

Nikakva licenca otvorenog koda ili otvorene težine ne postavljaju pitanje usklađenosti za poduzeća

Prilikom ocjenjivanja bilo kojeg modela u ekosustavu Qwen, primarna briga za pravne i sigurnosne timove je okvir licenciranja i operativna granica cjevovoda podataka.

Dok su prethodne iteracije obitelji Qwen dobile značajnu privlačnost za poduzeća putem dostupnosti težine u potpunosti otvorenog koda pod Apache 2.0 ili prilagođenim licencama za otvorenu upotrebu, Qwen3.7-Plus isporučuje se isključivo kao upravljani, komercijalni API u oblaku putem Alibaba Cloud Model Studio. Za upravljanje rizikom poduzeća, ova razlika nosi specifične implikacije:

  • Nema raspoređivanja lokalne težine: Organizacije ne mogu preuzeti, sandbox ili lokalno ugostiti težine Qwen3.7-Plus unutar svojih potpuno zatvorenih internih podatkovnih centara. Sve provjere podataka, vizualna obrada i pozivi izvršenja moraju proći kroz međunarodne krajnje točke Alibaba Clouda (npr. instanca Singapura istaknuta u dokumentaciji za razvojne programere).

  • Sukladnost i suverenitet: Budući da model zahtijeva zaključivanje temeljeno na oblaku, tvrtke koje rade pod strogim suverenim granicama podataka (kao što su zdravstveni subjekti koji podliježu lokalnim ograničenjima HIPAA/GDPR-a ili obrambeni izvođači) moraju izričito procijeniti je li usmjeravanje vanjskog API-ja u skladu s njihovim specifičnim obvezama rezidentnosti podataka.

  • Upravljano smanjenje rizika: Nasuprot tome, struktura upravljanog API-ja uklanja teret interne infrastrukture za pružanje, optimiziranje i održavanje klastera s više GPU-a (kao što su namjenski nizovi Nvidia H100) jednostavno za ugošćavanje interne agentske mreže.

Ipak, Qwen3.7-Plus nudi visoku inteligenciju u svim modalitetima po niskoj cijeni

Početni prijem od strane zajednica programera i tehničkog rizičnog kapitala naglašava promjenjivu ekonomiju implementacije agenata.

Istaknuti glas industrije i Web3 rizični kapitalist @Boxmining istaknuo stratešku troškovnu prednost, navodeći:

"Budući da je Qwen 3.7 Plus 40% jeftiniji od Maxa, mijenja se razgovor. Ako je izlaz dovoljno sličan za većinu kodiranja i mnogo jači za vizualne tijekove rada, trebate li Max stvarno svaki dan ili samo za teške poslove samo na terminalu?"

Ova perspektiva usklađena je s trenutačnim trendom optimiziranja operativnih proračuna poduzeća: pomak od sirovog, neograničenog računanja prema ciljanoj automatizaciji zadataka. U isto vrijeme, specijalizirani istraživači duboko unutar ekosustava ističu da ovo nije samo inkrementalna optimizacija generiranja teksta.

Dunjie Lu, istraživač pripravnik u Alibabi Qwen, primijetio je:

"Pokazuje jasne dobitke u odnosu na Qwen3.6-Plus u mogućnostima korištenja računala, s jačom generalizacijom izvan općih zadataka stolnih računala u profesionalne tijekove rada kao što su inženjering podataka i znanstveno istraživanje."

U konačnici, za poslovne kupce koji odlučuju o svojoj sljedećoj infrastrukturnoj karti, Qwen3.7-Plus predstavlja praktičnu alternativu. Ako je primarni cilj vaše organizacije izgradnja otpornih, vizualno sposobnih autonomnih softverskih petlji koje su u izravnoj interakciji s razvojnim okruženjima i konzolama u oblaku—bez trošenja proračuna za zaključivanje—model pruža uvjerljiv razlog za pomicanje izvršenja od skupljih graničnih alternativa.

Web izvor

By Tomšić Damjan

Pozdrav, ja sam Damjan Tomšić, osnivatelj i urednik informatičko edukativnog bloga Oblak Znanja. Za Vas ću se potruditi da dobijete edukativne članke, savjete i recenzije vezane uz osnovno i napredno korištenje računala i interneta. Kontak: Google+, Gmail.