Čak i kao zabrinutost i skepticizam raste u odnosu na strategiju izgradnje američkog AI startup-a OpenAI i visoke obveze potrošnje, kineski pružatelji AI otvorenog koda eskaliraju svoju konkurenciju, a jedan je čak sustigao OpenAI-jev vodeći, plaćeni vlasnički model GPT-5 u ključnim mjerilima performansi treće strane s novim, besplatnim modelom.
Kineski AI startup Moonshot AI novi model Kimi K2 Thinkingobjavljen danas, nadmašio je i vlasničke i otvorene konkurente kako bi zauzeo prvo mjesto u rezoniranju, kodiranju i referentnim vrijednostima agentskih alata.
Unatoč tome što je potpuno otvorenog koda, model sada nadmašuje OpenAI-jev GPT-5, Anthropicov Claude Sonnet 4.5 (Thinking mode) i xAI-jev Grok-4 na nekoliko standardnih procjena — točka preokreta za konkurentnost otvorenih AI sustava.
Programeri mogu pristupiti modelu putem platforma.moonshot.ai i kimi.com; utezi i kôd nalaze se na Lice koje grli. Otvoreno izdanje uključuje API-je za chat, rezoniranje i tijek rada s više alata.
Korisnici mogu isprobati Kimi K2 Thinking izravno putem vlastitog Konkurencija web stranice nalik ChatGPT-u i dalje prostor Hugging Face također.
Sadržaj objave
- 1 Modificirana standardna licenca otvorenog koda
- 2 Novi voditelj mjerila
- 3 Otvoreni model nadmašuje vlasničke sustave
- 4 Nadmašio MiniMax-M2: Prethodno mjerilo otvorenog koda
- 5 Agentsko rasuđivanje i korištenje alata
- 6 Učinkovitost i pristup
- 7 Usporedni kontekst: Ubrzanje otvorene težine
- 8 Tehnički izgledi
- 9 Ogromne implikacije za ekosustav umjetne inteligencije
- 10 Što to znači za poduzeća koja idu naprijed
- 11 Povezani sadržaji
Modificirana standardna licenca otvorenog koda
Moonshot AI službeno je objavio Kimi K2 Thinking pod a Izmijenjena MIT licenca na Hugging Face.
Licenca daje puna komercijalna i izvedena prava — što znači da joj pojedinačni istraživači i programeri koji rade u ime poslovnih klijenata mogu slobodno pristupiti i koristiti je u komercijalnim aplikacijama — ali dodaje jedno ograničenje:
"Ako softver ili bilo koji izvedeni proizvod služi više od 100 milijuna aktivnih korisnika mjesečno ili generira više od 20 milijuna USD mjesečnog prihoda, implementator mora istaknuti ‘Kimi K2’ na korisničkom sučelju proizvoda."
Za većinu istraživačkih i poslovnih aplikacija, ova klauzula funkcionira kao lagani zahtjev za atribucijom uz očuvanje sloboda standardnog MIT licenciranja.
To čini K2 Thinking jednim od trenutno dostupnih modela granične klase s najpopuštenijom licencom.
Novi voditelj mjerila
Kimi K2 Thinking je model Mixture-of-Experts (MoE) izgrađen oko trilijuna parametara, od kojih se 32 milijarde aktivira po zaključku.
Kombinira razmišljanje dugog horizonta sa strukturiranim korištenjem alata, izvršavajući do 200-300 uzastopnih poziva alata bez ljudske intervencije.
Prema rezultatima testiranja koje je objavio Moonshot, K2 Thinking postigao je:
-
44,9 % na Posljednji ispit čovječanstva (HLE)vrhunska partitura;
-
60,2 % na BrowseCompagentsko web-pretraživanje i test rasuđivanja;
-
71,3 % na SWE-Bench potvrđeno i 83,1 % na LiveCodeBench v6ključne procjene kodiranja;
-
56,3 % na Pečat-0mjerilo za pronalaženje informacija u stvarnom svijetu.
U svim ovim zadacima, K2 Thinking dosljedno nadmašuje odgovarajuće rezultate GPT-5 i prethodnog lidera u otvorenoj težini MiniMax-M2—koji je samo nekoliko tjedana ranije objavio kineski konkurent MiniMax AI.
Otvoreni model nadmašuje vlasničke sustave
GPT-5 i Claude Sonnet 4.5 Thinking ostaju vodeći vlasnički modeli “razmišljanja”.
Ipak, u istom paketu referentnih vrijednosti, Rezultati agencijskog rezoniranja K2 Thinkinga premašuju oboje: na primjer, na BrowseCompu otvoreni model sa 60,2 % odlučno vodi u odnosu na GPT-5 s 54,9 % i Claude 4.5 s 24,1 %.
K2 Thinking također nadmašuje GPT-5 GPQA Dijamant (85,7 % naspram 84,5 %) i slaže se s njim u zadacima matematičkog zaključivanja kao što su AIME 2025 i HMMT 2025.
Samo u određenim konfiguracijama teškog načina rada—gdje GPT-5 agregira više putanja—vlasnički model ponovno dobiva paritet.
To što Moonshotovo potpuno otvoreno izdanje može dostići ili premašiti rezultate GPT-5 označava prekretnicu. Jaz između zatvorenih graničnih sustava i javno dostupnih modela učinkovito se urušio za visokokvalitetno razmišljanje i kodiranje.
Nadmašio MiniMax-M2: Prethodno mjerilo otvorenog koda
Kada je VentureBeat profilirao MiniMax-M2 prije samo tjedan i pol dana, hvaljen je kao “novi kralj LLM-a otvorenog koda”, postigavši najbolje rezultate među otvorenim sustavima:
-
τ²-Klupa 77.2
-
BrowseComp 44.0
-
FinSearchComp-global 65.5
-
SWE-Bench Verified 69.4
Ti su rezultati postavili MiniMax-M2 blizu GPT-5 razine sposobnosti u korištenju agentskog alata. Još Kimi K2 Thinking sada ih zasjenjuje velikom razlikom.
Njegov BrowseComp rezultat od 60,2 % premašuje M2-ovih 44,0 %, a njegov SWE-Bench Verified 71,3 % nadmašuje M2-ovih 69,4 %. Čak i na zadacima financijskog rezoniranja kao što je FinSearchComp-T3 (47,4 %), K2 Thinking ima usporedivu izvedbu dok zadržava superiorno rezoniranje opće namjene.
Tehnički, oba modela usvajaju oskudnu arhitekturu Mixture-of-Experts za učinkovitost računanja, ali Moonshotova mreža aktivira više stručnjaka i implementira naprednu obuku svjesnu kvantizacije (INT4 QAT).
Ovaj dizajn udvostručuje brzinu zaključivanja u odnosu na standardnu preciznost bez degradiranja točnosti – kritično za duge sesije “thinking-tokena” koje dosežu 256 k kontekstnih prozora.
Agentsko rasuđivanje i korištenje alata
Definirajuća sposobnost K2 Thinkinga leži u njegovom eksplicitnom tragu razmišljanja. Model daje pomoćno polje, reasoning_content, otkrivajući posrednu logiku prije svakog konačnog odgovora. Ova transparentnost čuva koherentnost u dugim višestrukim zadacima i višestrukim pozivima alata.
Referentna implementacija koju je objavio Moonshot demonstrira kako model autonomno provodi tijek rada “izvješća dnevnih vijesti”: pozivanje alata za datum i web-pretraživanje, analiziranje dohvaćenog sadržaja i sastavljanje strukturiranog izlaza—sve uz održavanje internog stanja razmišljanja.
Ova autonomija od kraja do kraja omogućuje modelu planiranje, pretraživanje, izvršavanje i sintetiziranje dokaza kroz stotine koraka, odražavajući klasu “agentskih AI” sustava u nastajanju koji rade uz minimalan nadzor.
Učinkovitost i pristup
Unatoč svojoj skali od trilijuna parametara, troškovi rada K2 Thinkinga ostaju skromni. Moonshot navodi korištenje na:
-
0,15 USD / 1 milijun tokena (pogodak u predmemoriju)
-
0,60 USD / 1 milijun tokena (promašaj predmemorije)
-
2,50 USD / 1 milijun tokena
Ove stope su konkurentne čak i u odnosu na MiniMax-M2 ulaznu cijenu od 0,30 $ / 1,20 $ izlaznu cijenu—i red veličine ispod GPT-5 (1,25 $ ulaz / 10 $ izlaz).
Usporedni kontekst: Ubrzanje otvorene težine
Brzo smjenjivanje M2 i K2 razmišljanja ilustrira koliko brzo istraživanje otvorenog koda zahvaća granične sustave. MiniMax-M2 pokazao je da se otvoreni modeli mogu približiti agentskim sposobnostima klase GPT-5 uz djelić troškova računanja. Moonshot je sada još više pomaknuo tu granicu, gurajući otvorene težine iznad pariteta u izravno vodstvo.
Oba modela oslanjaju se na oskudnu aktivaciju za učinkovitost, ali veći broj aktivacija K2 Thinkinga (32 B u odnosu na 10 B aktivnih parametara) daje jaču vjernost rasuđivanja u svim domenama. Njegovo skaliranje vremena testiranja—proširivanje “žetona za razmišljanje” i zaokreta pozivanja alata—omogućuje mjerljive dobitke u performansama bez ponovne obuke, značajka koja još nije primijećena u MiniMax-M2.
Tehnički izgledi
Moonshot izvještava da K2 Thinking podržava izvorni INT4 zaključak i 256 konteksta k-tokena uz minimalnu degradaciju performansi. Njegova arhitektura integrira kvantizaciju, agregaciju paralelne putanje (“teški način”) i usmjeravanje mješavine stručnjaka prilagođeno za zadatke zaključivanja.
U praksi, te optimizacije omogućuju K2 Thinkingu da održi složene petlje planiranja—kompilacija koda–testiranje—popravak, pretraživanje—analiza—sažetak—preko stotina poziva alata. Ova mogućnost podupire njegove vrhunske rezultate na BrowseCompu i SWE-Benchu, gdje je kontinuitet rasuđivanja presudan.
Ogromne implikacije za ekosustav umjetne inteligencije
Konvergencija otvorenih i zatvorenih modela na visokoj razini signalizira strukturnu promjenu u AI krajoliku. Poduzeća koja su se nekoć oslanjala isključivo na vlasničke API-je sada mogu implementirati otvorene alternative koje odgovaraju obrazloženju na razini GPT-5, zadržavajući potpunu kontrolu nad težinama, podacima i usklađenošću.
Moonshotova strategija otvorenog objavljivanja slijedi presedan koji su postavili DeepSeek R1, Qwen3, GLM-4.6 i MiniMax-M2, ali je proširuje na potpuno agentsko razmišljanje.
Za akademske i poslovne programere, K2 Thinking pruža i transparentnost i interoperabilnost—mogućnost provjere tragova razmišljanja i finog podešavanja performansi za agente specifične za domenu.
Dolazak K2 Thinking signalizira da Moonshot — a mladi startup osnovan 2023 s ulaganjima nekih od najvećih kineskih kompanija za aplikacije i tehnologiju — ovdje je da igra u sve intenzivnijoj konkurenciji, a dolazi usred sve većeg nadzora financijske održivosti najvećih igrača AI-a.
Prije samo dan, financijska direktorica OpenAI-ja Sarah Friar izazvala je kontroverzu nakon sugerirajući na WSJ Tech Live u slučaju da bi američka vlada eventualno trebala osigurati “zaštitnu stopu” za više od 1,4 trilijuna dolara kompanijske obveze vezane uz računalne i podatkovne centre — komentar koji se naširoko tumači kao poziv na jamstva za kredite koje podupiru porezni obveznici.
Iako Fratar je kasnije pojasnio da OpenAI nije tražio izravnu federalnu potporu, epizoda je ponovno pokrenula raspravu o opsegu i koncentraciji kapitalne potrošnje AI.
Uz OpenAI, Microsoft, Meta i Google koji se utrkuju kako bi osigurali dugoročnu opskrbu čipovima, kritičari upozoravaju na neodrživ investicijski balon i “utrku u naoružanju umjetne inteligencije” vođenu više strateškim strahom nego komercijalnim povratom – koji bi mogao "dići u zrak" i srušiti cijelo globalno gospodarstvo ako postoji oklijevanje ili tržišna nesigurnost, budući da je sada napravljeno toliko mnogo trgovina i procjena u iščekivanju kontinuiranog velikog ulaganja u umjetnu inteligenciju i golemih povrata.
U tom kontekstu, Moonshot AI i MiniMaxova otvorena izdanja stavljaju veći pritisak na američke vlasničke AI tvrtke i njihove podupiratelje da opravdaju veličinu ulaganja i putove do profitabilnosti.
Ako poslovni korisnik može jednako lako dobiti usporedive ili bolje performanse od besplatnog kineskog AI modela otvorenog koda nego što to može učiniti s plaćenim, vlasničkim AI rješenjima kao što su OpenAI GPT-5, Anthropicov Claude Sonnet 4.5 ili Googleov Gemini 2.5 Pro — zašto bi i dalje plaćali za pristup vlasničkim modelima? Već su ljudi iz Silicijske doline poput Airbnba podigli obrve zbog priznanja da koristeći kineske alternative otvorenog koda kao što je Alibabin Qwen umjesto OpenAI-jevih vlasničkih ponuda.
Za ulagače i poduzeća, ovaj razvoj sugerira da vrhunska AI sposobnost više nije sinonim za vrhunsku kapitalnu potrošnju. Najnapredniji sustavi razmišljanja možda sada ne dolaze od tvrtki koje grade podatkovne centre gigarazmjera, već od istraživačkih grupa koje optimiziraju arhitekture i kvantizaciju za učinkovitost.
U tom smislu, referentna dominacija K2 Thinkinga nije samo tehnička prekretnica – ona je strateška, dolazi u trenutku kada se najveće pitanje AI tržišta pomaknulo s koliko moćni modeli mogu postati do tko si može priuštiti njihovo uzdržavanje.
Što to znači za poduzeća koja idu naprijed
Unutar tjedana nakon uspona MiniMax-M2, Kimi K2 Thinking ga je prestigao—zajedno s GPT-5 i Claude 4.5—u gotovo svim rezonantnim i agentskim mjerilima.
Model pokazuje da sustavi otvorene težine mogu sada zadovoljavaju ili nadmašuju vlasničke granične modele i u sposobnosti i u učinkovitosti.
Za istraživačku zajednicu AI, K2 Thinking predstavlja više od još jednog otvorenog modela: to je dokaz da je granica postala suradnička.
Najbolji model rasuđivanja koji je danas dostupan nije zatvoreni komercijalni proizvod, već sustav otvorenog koda koji je dostupan svima.




