Ljeto je Qwen: QWEN3-235B-A22B-Thinking-2507 Tops ljestvice

Želite pametnije uvide u vašu pristiglu poštu? Prijavite se za naše tjedne biltene kako biste dobili samo ono što je važno za vođe AI, podataka i sigurnosti. Pretplatite se sada

Da je AI industrija imala ekvivalent „Pjesma ljeta“ u industriji snimanja – hit koji se hvata u toplijim mjesecima ovdje na sjevernoj hemisferi i čuje se kako igra svuda – jasni počasti za taj naslov otišao bi u Alibaba Qwen tim.

Tijekom prošlog tjedna, Frontier Model AI istraživački odjel kineske e-trgovine Behemoth objavio je ne jedan, a ne dva, ne triali Četiri (!!) Novi generativni AI modeli otvorenog koda koji nude rekordne referentne vrijednosti, najbolje što su čak i neke vodeće vlasničke mogućnosti.

Sinoć, Qwen tim ga je ograničio izdavanjem QWEN3-235B-A22B-THINKINK-2507Ažurirano je obrazloženje velikog jezičnog modela (LLM), koji treba duže od reagiranja nego neraspoloživanje ili “upućivanje” LLM-a, uključivši se u “lance promišljene” ili samo-refleksija i samoprovjeri, što nadamo se da će rezultirati ispravnijim i sveobuhvatnim odgovorima na teže zadatke.

Doista, novi QWEN3-Thinking-2507, kako ćemo ga nazvati kratko, sada vodi ili usko prati vrhunske modele u nekoliko glavnih referentnih vrijednosti.

Serija AI Impact vraća se u San Francisco – 5. kolovoza

Sljedeća faza AI je ovdje – jeste li spremni? Pridružite se vođama iz Block, GSK i SAP-a za ekskluzivni pogled na to kako autonomni agenti preoblikovaju radne tokove poduzeća-od odlučivanja u stvarnom vremenu do automatizacije krajnjeg do kraja.

Osigurajte svoje mjesto odmah – prostor je ograničen: https://bit.ly/3guuplf

Kao AI influencer i agregator vijesti Andrew Curran napisao je na X: “Stigao je Qwen -ov najjači model obrazloženja i to je na granici.”

U Aime25 Benchmark-dizajnirano za procjenu sposobnosti rješavanja problema u matematičkim i logičkim kontekstima- QWEN3-Thinking-2507 vodi sve prijavljene modele s ocjenom 92.3usko nadmašujući i Open-Mini OpenAi (92.7) i Gemini-2.5 Pro (88.0).

Model također prikazuje naredbene performanse na LiveCodebench v6,, Bodovanje 74.1, ispred Google Gemini-2.5 Pro (72.5), Openai O4-Mini (71.8)i značajno nadmašujući svoju raniju verziju, koja je objavila 55.7.

U GPQAreferentna vrijednost za pitanja s više izbora na diplomskoj razini, model postiže 81.1gotovo podudaranje DeepSeek-R1-0528 (81.0) i zaostajanje glavne oznake Gemini-2.5 Pro 86.4.

Na Arena-hard v2što ocjenjuje usklađivanje i subjektivne preferencije kroz stope pobjede, rezultate QWEN3-Thinking-2507 79.7postavljanje ispred svih konkurenata.

Rezultati pokazuju da ovaj model ne samo da nadmašuje svog prethodnika u svakoj glavnoj kategoriji, već također postavlja novi standard za koji modeli otvorenog koda, modeli usmjereni na rasuđivanje.

Sadržaj objave

1 Odmak od ‘hibridnog obrazloženja’
2 Licenciranje: Apache 2.0 i njegova poduzeća
3 Dostupnost i cijene
4 Poduzetne prijave i budući izgledi

Odmak od ‘hibridnog obrazloženja’

Oslobađanje QWEN3-Thinking-2507 odražava širi strateški pomak Alibaba-ovog QWEN tima: odmicanje od hibridnih modela obrazloženja koji su zahtijevali da se korisnici ručno prebacuju između načina “razmišljanja” i “ne razmišljanja”.

Umjesto toga, tim sada trenira zasebne modele za rasuđivanje i zadatke podučavanja. Ovo razdvajanje omogućava da se svaki model optimizira za svoju predviđenu svrhu – što se kontrolira u poboljšanoj konzistenciji, jasnoći i performansama referentnih vrijednosti. Novi model QWEN3-razmišljanja u potpunosti utjelovljuje ovu filozofiju dizajna.

Pored nje, Qwen je lansirala Qwen3-Coder-480B-A35Bmodel parametara od 480B izgrađen za složene tokove rada kodiranja. Podržava 1 milijuna token kontekstnih prozora i nadmašuje GPT-44.1 i GEMINI 2.5 PRO na SWE-Bench Provjereno.

Također najavljeno je Qwen3-mtvišejezični model prijevoda obučen na trilijune tokena na 92+ jezika. Podržava prilagodbu domene, kontrolu terminologije i zaključivanje od samo 0,50 USD na milijun tokena.

Ranije u tjednu, tim je objavio QWEN3-235B-A22B-instruct-2507model koji nije ometao koji je na nekoliko referentnih vrijednosti nadmašio Clauda Opusa 4 i uveo laganu varijantu FP8 za učinkovitiji zaključak o ograničenom hardveru.

Svi su modeli licencirani pod Apache 2.0 i dostupni su putem zagrljaja Face, ModelsCope i QWEN API -ja.

Licenciranje: Apache 2.0 i njegova poduzeća

Qwen3-235b-a22b-think-2507 se oslobađa pod Licenca Apache 2.0vrlo permisivna i komercijalno prijateljska licenca koja omogućava poduzećima da preuzimaju, mijenjaju, mijenjaju samopouzdanje, fino podešavanje i integriraju model u vlasničke sustave bez ograničenja.

To stoji u suprotnosti s vlasničkim modelima ili otvorenim izdanjima samo za istraživanje, koja često zahtijevaju pristup API-ju, nametanje ograničenja upotrebe ili zabranjuje komercijalnu implementaciju. Za organizacije i timove svjesnih usklađenosti koji žele kontrolirati troškove, latencije i privatnost podataka, Licenciranje APACHE 2.0 omogućava potpunu fleksibilnost i vlasništvo.

Dostupnost i cijene

QWEN3-235B-A22B-THINKING-250 je sada dostupan za besplatno preuzimanje Zagrljaj lica i Modelscope.

Za ona poduzeća koja ne žele ili nemaju resurse i mogućnost ugostiti model zaključivanja na vlastitom hardveru ili virtualnom privatnom oblaku putem API -ja, VLLM -a i SGLANG -a Alibaba Cloud.

Ulazna cijena: 0,70 USD na milijun tokena
Izlazna cijena: 8,40 USD na milijun tokena
Besplatni sloj: 1 milijun tokena, koji vrijede 180 dana

Model je kompatibilan s Agentic okvirima putem Agensi podržava napredno implementaciju putem API-ja kompatibilnih s OpenAI.

Također se može izvoditi lokalno pomoću okvira transformatora ili integrirati u dev hrpe putem Node.js, CLI alata ili strukturiranih sučelja za poticaj.

Postavke uzorkovanja za najbolje performanse uključuju Temperatura = 0,6,, top_p = 0,95i Maksimalna duljina izlaza od 81.920 tokena Za složene zadatke.

Poduzetne prijave i budući izgledi

Svojim snažnim referentnim performansama, dugom kontekstom sposobnosti i dopuštenim licenciranjem, QWEN3-Thinking-2507 posebno je prikladan za upotrebu u AI sustavima poduzeća koji uključuju obrazloženje, planiranje i podršku odlučivanju.

Širi Ekosustav QWEN3 – uključujući modele kodiranja, upute i prijevoda – Further proširuje apel na tehničke timove i poslovne jedinice koje žele uključiti AI u vertikalama poput inženjerstva, lokalizacije, korisničke podrške i istraživanja.

Odluka Qwen tima da pusti specijalizirane modele za različite slučajeve uporabe, potpomognute tehničkom transparentnošću i podrškom u zajednici, signalizira namjerni pomak prema izgradnji Otvorena, izvođačka i proizvodna AI infrastruktura.

Budući da više poduzeća traži alternative API-Gind-u, modelima crnih kutija, Alibaba serija Qwen sve više pozicionira kao održiv temelj otvorenog koda za inteligentne sustave-koji prikupljaju kontrolu i sposobnost u skali.

Dnevni uvidi u slučajeve poslovne uporabe s VB dnevno

Ako želite impresionirati svog šefa, VB Daily vas je pokrivao. Dajemo vam unutarnju lopaticu o tome što tvrtke rade s generativnim AI, od regulatornih pomaka do praktičnih razmještaja, tako da možete dijeliti uvide za maksimalni ROI.

Pročitajte našu politiku privatnosti

Hvala na pretplati. Pogledajte više VB biltena ovdje.

Došlo je do pogreške.

Web izvor

Ljeto je Qwen: QWEN3-235B-A22B-Thinking-2507 Tops ljestvice

ByTomšić Damjan

Odmak od ‘hibridnog obrazloženja’

Licenciranje: Apache 2.0 i njegova poduzeća

Dostupnost i cijene

Poduzetne prijave i budući izgledi

By Tomšić Damjan

Čini se da vlasnici Pixela nisu impresionirani ažuriranjem Androida 17

Zahuktalo otkriće Guild Wars 3, dugovječna MMO serija dobiva svoj prvi CCG u igri Mistbound

CMA postavlja pravedne mjere rangiranja na Google pretraživanju

You missed

Čini se da vlasnici Pixela nisu impresionirani ažuriranjem Androida 17

Zahuktalo otkriće Guild Wars 3, dugovječna MMO serija dobiva svoj prvi CCG u igri Mistbound

CMA postavlja pravedne mjere rangiranja na Google pretraživanju

7,000 Langflow servers are under attack. LangGraph and LangChain have the same holes

Ljeto je Qwen: QWEN3-235B-A22B-Thinking-2507 Tops ljestvice

ByTomšić Damjan

Odmak od ‘hibridnog obrazloženja’

Licenciranje: Apache 2.0 i njegova poduzeća

Dostupnost i cijene

Poduzetne prijave i budući izgledi

By Tomšić Damjan

Related Post

Čini se da vlasnici Pixela nisu impresionirani ažuriranjem Androida 17

Zahuktalo otkriće Guild Wars 3, dugovječna MMO serija dobiva svoj prvi CCG u igri Mistbound

CMA postavlja pravedne mjere rangiranja na Google pretraživanju

You missed

Čini se da vlasnici Pixela nisu impresionirani ažuriranjem Androida 17

Zahuktalo otkriće Guild Wars 3, dugovječna MMO serija dobiva svoj prvi CCG u igri Mistbound

CMA postavlja pravedne mjere rangiranja na Google pretraživanju

7,000 Langflow servers are under attack. LangGraph and LangChain have the same holes