Želite pametnije uvide u vašu pristiglu poštu? Prijavite se za naše tjedne biltene kako biste dobili samo ono što je važno za vođe AI, podataka i sigurnosti. Pretplatite se sada
Da je AI industrija imala ekvivalent „Pjesma ljeta“ u industriji snimanja – hit koji se hvata u toplijim mjesecima ovdje na sjevernoj hemisferi i čuje se kako igra svuda – jasni počasti za taj naslov otišao bi u Alibaba Qwen tim.
Tijekom prošlog tjedna, Frontier Model AI istraživački odjel kineske e-trgovine Behemoth objavio je ne jedan, a ne dva, ne triali Četiri (!!) Novi generativni AI modeli otvorenog koda koji nude rekordne referentne vrijednosti, najbolje što su čak i neke vodeće vlasničke mogućnosti.
Sinoć, Qwen tim ga je ograničio izdavanjem QWEN3-235B-A22B-THINKINK-2507Ažurirano je obrazloženje velikog jezičnog modela (LLM), koji treba duže od reagiranja nego neraspoloživanje ili “upućivanje” LLM-a, uključivši se u “lance promišljene” ili samo-refleksija i samoprovjeri, što nadamo se da će rezultirati ispravnijim i sveobuhvatnim odgovorima na teže zadatke.
Doista, novi QWEN3-Thinking-2507, kako ćemo ga nazvati kratko, sada vodi ili usko prati vrhunske modele u nekoliko glavnih referentnih vrijednosti.
Serija AI Impact vraća se u San Francisco – 5. kolovoza
Sljedeća faza AI je ovdje – jeste li spremni? Pridružite se vođama iz Block, GSK i SAP-a za ekskluzivni pogled na to kako autonomni agenti preoblikovaju radne tokove poduzeća-od odlučivanja u stvarnom vremenu do automatizacije krajnjeg do kraja.
Osigurajte svoje mjesto odmah – prostor je ograničen: https://bit.ly/3guuplf
Kao AI influencer i agregator vijesti Andrew Curran napisao je na X: “Stigao je Qwen -ov najjači model obrazloženja i to je na granici.”
U Aime25 Benchmark-dizajnirano za procjenu sposobnosti rješavanja problema u matematičkim i logičkim kontekstima- QWEN3-Thinking-2507 vodi sve prijavljene modele s ocjenom 92.3usko nadmašujući i Open-Mini OpenAi (92.7) i Gemini-2.5 Pro (88.0).
Model također prikazuje naredbene performanse na LiveCodebench v6,, Bodovanje 74.1, ispred Google Gemini-2.5 Pro (72.5), Openai O4-Mini (71.8)i značajno nadmašujući svoju raniju verziju, koja je objavila 55.7.
U GPQAreferentna vrijednost za pitanja s više izbora na diplomskoj razini, model postiže 81.1gotovo podudaranje DeepSeek-R1-0528 (81.0) i zaostajanje glavne oznake Gemini-2.5 Pro 86.4.
Na Arena-hard v2što ocjenjuje usklađivanje i subjektivne preferencije kroz stope pobjede, rezultate QWEN3-Thinking-2507 79.7postavljanje ispred svih konkurenata.
Rezultati pokazuju da ovaj model ne samo da nadmašuje svog prethodnika u svakoj glavnoj kategoriji, već također postavlja novi standard za koji modeli otvorenog koda, modeli usmjereni na rasuđivanje.
Sadržaj objave
Odmak od ‘hibridnog obrazloženja’
Oslobađanje QWEN3-Thinking-2507 odražava širi strateški pomak Alibaba-ovog QWEN tima: odmicanje od hibridnih modela obrazloženja koji su zahtijevali da se korisnici ručno prebacuju između načina “razmišljanja” i “ne razmišljanja”.
Umjesto toga, tim sada trenira zasebne modele za rasuđivanje i zadatke podučavanja. Ovo razdvajanje omogućava da se svaki model optimizira za svoju predviđenu svrhu – što se kontrolira u poboljšanoj konzistenciji, jasnoći i performansama referentnih vrijednosti. Novi model QWEN3-razmišljanja u potpunosti utjelovljuje ovu filozofiju dizajna.
Pored nje, Qwen je lansirala Qwen3-Coder-480B-A35Bmodel parametara od 480B izgrađen za složene tokove rada kodiranja. Podržava 1 milijuna token kontekstnih prozora i nadmašuje GPT-44.1 i GEMINI 2.5 PRO na SWE-Bench Provjereno.
Također najavljeno je Qwen3-mtvišejezični model prijevoda obučen na trilijune tokena na 92+ jezika. Podržava prilagodbu domene, kontrolu terminologije i zaključivanje od samo 0,50 USD na milijun tokena.
Ranije u tjednu, tim je objavio QWEN3-235B-A22B-instruct-2507model koji nije ometao koji je na nekoliko referentnih vrijednosti nadmašio Clauda Opusa 4 i uveo laganu varijantu FP8 za učinkovitiji zaključak o ograničenom hardveru.
Svi su modeli licencirani pod Apache 2.0 i dostupni su putem zagrljaja Face, ModelsCope i QWEN API -ja.
Licenciranje: Apache 2.0 i njegova poduzeća
Qwen3-235b-a22b-think-2507 se oslobađa pod Licenca Apache 2.0vrlo permisivna i komercijalno prijateljska licenca koja omogućava poduzećima da preuzimaju, mijenjaju, mijenjaju samopouzdanje, fino podešavanje i integriraju model u vlasničke sustave bez ograničenja.
To stoji u suprotnosti s vlasničkim modelima ili otvorenim izdanjima samo za istraživanje, koja često zahtijevaju pristup API-ju, nametanje ograničenja upotrebe ili zabranjuje komercijalnu implementaciju. Za organizacije i timove svjesnih usklađenosti koji žele kontrolirati troškove, latencije i privatnost podataka, Licenciranje APACHE 2.0 omogućava potpunu fleksibilnost i vlasništvo.
Dostupnost i cijene
QWEN3-235B-A22B-THINKING-250 je sada dostupan za besplatno preuzimanje Zagrljaj lica i Modelscope.
Za ona poduzeća koja ne žele ili nemaju resurse i mogućnost ugostiti model zaključivanja na vlastitom hardveru ili virtualnom privatnom oblaku putem API -ja, VLLM -a i SGLANG -a Alibaba Cloud.
- Ulazna cijena: 0,70 USD na milijun tokena
- Izlazna cijena: 8,40 USD na milijun tokena
- Besplatni sloj: 1 milijun tokena, koji vrijede 180 dana
Model je kompatibilan s Agentic okvirima putem Agensi podržava napredno implementaciju putem API-ja kompatibilnih s OpenAI.
Također se može izvoditi lokalno pomoću okvira transformatora ili integrirati u dev hrpe putem Node.js, CLI alata ili strukturiranih sučelja za poticaj.
Postavke uzorkovanja za najbolje performanse uključuju Temperatura = 0,6,, top_p = 0,95i Maksimalna duljina izlaza od 81.920 tokena Za složene zadatke.
Poduzetne prijave i budući izgledi
Svojim snažnim referentnim performansama, dugom kontekstom sposobnosti i dopuštenim licenciranjem, QWEN3-Thinking-2507 posebno je prikladan za upotrebu u AI sustavima poduzeća koji uključuju obrazloženje, planiranje i podršku odlučivanju.
Širi Ekosustav QWEN3 – uključujući modele kodiranja, upute i prijevoda – Further proširuje apel na tehničke timove i poslovne jedinice koje žele uključiti AI u vertikalama poput inženjerstva, lokalizacije, korisničke podrške i istraživanja.
Odluka Qwen tima da pusti specijalizirane modele za različite slučajeve uporabe, potpomognute tehničkom transparentnošću i podrškom u zajednici, signalizira namjerni pomak prema izgradnji Otvorena, izvođačka i proizvodna AI infrastruktura.
Budući da više poduzeća traži alternative API-Gind-u, modelima crnih kutija, Alibaba serija Qwen sve više pozicionira kao održiv temelj otvorenog koda za inteligentne sustave-koji prikupljaju kontrolu i sposobnost u skali.
Web izvor



