• Uto. svi 19th, 2026

Oblak Znanja

informatička edukacija i vijesti

Groq je samo brže zagrlio lice – i dolazi za AWS i Google

ByTomšić Damjan

lip 17, 2025

Pridružite se događaju kojima vjeruje čelnici poduzeća gotovo dva desetljeća. VB Transform okuplja ljude koji grade pravu strategiju Enterprise AI. Saznati više


Žbukapokretanje zaključivanja umjetne inteligencije, stvara agresivnu igru ​​kako bi izazvao uspostavljene pružatelje usluga u oblaku poput Amazonske web usluge i Google S dvije glavne najave koje bi mogle preoblikovati kako programeri pristupaju AI modelima visokih performansi.

Tvrtka je u ponedjeljak objavila da sada podržava Alibaba qwen3 32b jezični model Sa svojim punim kontekstnim prozorom od 131 000 tok-tehnička sposobnost tvrdi da nijedan drugi pružatelj brzog zaključivanja ne može odgovarati. Istovremeno, Groq je postao službeni davatelj zaključaka na Platforma zagrljaja licapotencijalno izlažući svoju tehnologiju milijunima programera širom svijeta.

Taj je potez najhrabriji pokušaj da se još uvijek izrekne tržišni udio na brzo širenom tržištu AI zaključivanja, gdje tvrtke poput AWS podloga,, Google Vertex AIi Microsoft Azure dominirali su nudeći prikladan pristup vodećim jezičnim modelima.

“Integracija zagrljaja lica proširuje Ekosustav Groq -a koji pruža izbor programera i dodatno smanjuje prepreke za ulazak u prihvaćanje Groqovog brzog i učinkovitog AI zaključivanja”, rekao je glasnogovornik Groq -a za VentureBeat. “Groq je jedini davatelj zaključivanja koji omogućava cijeli prozor od 131K konteksta, omogućavajući programerima da izgrade aplikacije na skali.”

Kako tvrdi da se Groqov prozor konteksta od 131K uspoređuje protiv natjecatelja AI zaključivanja

Groqova tvrdnja o kontekstnim prozorima – količini teksta koji AI model može obraditi odjednom – udara u ograničenje jezgre koje je ugasilo praktične AI aplikacije. Većina davatelja zaključaka bori se za održavanje brzine i isplativosti pri rukovanju velikim kontekstnim prozorima, koji su ključni za zadatke poput analize čitavih dokumenata ili održavanja dugih razgovora.

Neovisna tvrtka za usporedbu Umjetna analiza Izmjereno Groqovo implementaciju QWEN3 32B radi na približno 535 tokena u sekundi, što bi omogućila obradu dugih dokumenata u stvarnom vremenu ili složene zadatke obrazloženja. Tvrtka cijeni uslugu na 0,29 USD na milijun ulazni tokeni i 0,59 USD na milijun izlaznih tokena – stope koje podcjenjuju mnoge uspostavljene pružatelje usluga.

Groq i Alibaba Cloud jedini su pružatelji usluga koji podržavaju QWEN3 32B puni kontekstni prozor od 131.000 tokena, prema neovisnim mjerilima iz umjetne analize. Većina konkurenata nudi znatno manja granica. (Kredit: Groq)

“Groq nudi potpuno integrirani snop, isporučujući računanje zaključivanja koji je izgrađen za razmjere, što znači da smo u mogućnosti nastaviti poboljšati troškove zaključivanja, a istovremeno osiguravajući performanse koje programeri trebaju izgraditi stvarne AI rješenja”, objasnio je glasnogovornik na pitanje o ekonomskoj održivosti podržavanja masovnih kontekstnih prozora.

Tehnička prednost proizlazi iz Groqovog običaja Jedinica za obradu jezika (LPU) arhitekturadizajniran posebno za AI zaključivanje, a ne za grafičke jedinice za obradu opće namjene (GPU) na koje se većina konkurenata oslanja. Ovaj specijalizirani hardverski pristup omogućava Groq-u da učinkovitije upravlja memorijskim operacijama poput velikih kontekstnih prozora.

Zašto bi Groqova integracija zagrljaja lica mogla otključati milijune novih AI programera

A Integracija s zagrljajem lica predstavlja možda značajniji dugoročni strateški potez. Zagrljaj lica postalo je de facto platforma za razvoj AI-a otvorenog koda, domaćin stotinama tisuća modela i svakodnevno poslužuje milijune programera. Postajući službeni pružatelj zaključaka, Groq dobiva pristup ovom ogromnom ekosustavu programera s pojednostavljenim naplatom i objedinjenim pristupom.

Programeri sada mogu odabrati Groq kao pružatelja usluga izravno unutar Zagrljaj igralište za lice ili Apikats korištenjem naplaćenih njihovim računima zagrljaja. Integracija podržava niz popularnih modela, uključujući Meta Serija lamaGoogleov Gemma modelii novo dodano Qwen3 32b.

“Ova suradnja između zagrljaja lica i Groq-a značajan je korak naprijed u tome što AI zaključivanje visokih performansi čini pristupačnijim i učinkovitijim”, navodi se u zajedničkoj izjavi.

Partnerstvo bi moglo dramatično povećati Groqovu korisničku bazu i količinu transakcija, ali također postavlja pitanja o sposobnosti tvrtke da održava performanse u razmjeru.

Može li se Groqova infrastruktura natjecati s AWS Bedrock i Google Vertex AI na skali

Kada se pritisne o proširenju infrastrukture planira se nositi s potencijalno značajnim novim prometom Zagrljaj licaGlasnogovornik GROQ -a otkrio je trenutni globalni trag tvrtke: “Trenutno Groqova globalna infrastruktura uključuje lokacije podatkovnih centra širom SAD -a, Kanade i Bliskog Istoka, koje opslužuju preko 20 m tokena u sekundi.”

Tvrtka planira nastaviti međunarodno širenje, iako određeni detalji nisu pruženi. Ovaj globalni napor skaliranja bit će presudan jer se Groq suočava s povećanim pritiskom dobro financiranih konkurenata s dubljim infrastrukturnim resursima.

Amazon Servisna primjer, koristi AWS -ovu ogromnu globalnu oblačnu infrastrukturu, dok Google Vertex ai Prednosti od mreže svjetskog podatkovnog centra za pretraživanje. Microsoftov Azure OpenAi usluga ima sličnu duboku infrastrukturu.

Međutim, glasnogovornik Groqa izrazio je povjerenje u diferencirani pristup tvrtke: „Kao industrija, tek počinjemo vidjeti početak stvarne potražnje za zaključivanjem. Čak i ako bi Groq ove godine rasporedilo dvostruko više od planirane količine infrastrukture, danas još uvijek ne bi bilo dovoljno kapaciteta za ispunjavanje zahtjeva.“

Kako bi agresivne cijene zaključivanja AI mogle utjecati na Groqov poslovni model

Tržište zaključivanja AI karakteriziralo je agresivne cijene i marže tanke britvice dok se pružatelji usluga natječu za tržišni udio. Groqove konkurentne cijene postavljaju pitanja o dugoročnoj profitabilnosti, posebno s obzirom na kapitalnu prirodu specijaliziranog razvoja i raspoređivanja hardvera.

“Kao što vidimo više i nova AI rješenja koja dolaze na tržište i usvojena, zahtjev za zaključivanje nastavit će rasti eksponencijalnom stopom”, rekao je glasnogovornik na pitanje o putu do profitabilnosti. “Naš krajnji cilj je povećati te potražnje, iskorištavajući našu infrastrukturu kako bi potaknuli troškove zaključivanja što je moguće niže i omogućilo buduću ekonomiju AI.”

Ova strategija – klađenje na ogromni rast volumena kako bi se postigla profitabilnost unatoč niskim marginama – ogledalo pristupa koje su uzeli drugi pružatelji infrastrukture, iako je uspjeh daleko od zajamčenog.

Što usvajanje poduzeća AI znači za tržište zaključivanja od 154 milijarde dolara

Najave dolaze jer tržište AI zaključivanja doživljava eksplozivni rast. Istraživačka tvrtka Grand View Research procjenjuje da će globalno tržište AI zaključivanja do 2030. doseći 154,9 milijardi USD, vođeno povećanjem primjene AI aplikacija u industrijama.

Za donositelje odluka poduzeća, Groqovi potezi predstavljaju i priliku i rizik. Tvrdstva tvrtke tvrde da bi, ako su potvrđene na skali, značajno smanjile troškove za AI teške aplikacije. Međutim, oslanjanje na manjeg pružatelja usluga također unosi potencijalni rizik opskrbe i kontinuiteta u usporedbi s utvrđenim divovima u oblaku.

Tehnička sposobnost za rješavanje punog kontekstnog prozora mogla bi se pokazati posebno vrijednom za poslovne aplikacije koje uključuju analizu dokumenata, pravna istraživanja ili složene zadatke obrazloženja gdje je održavanje konteksta u dugim interakcijama presudno.

Groqova dvostruka najava predstavlja izračunatu kocku koju specijalizirani hardver i agresivne cijene mogu prevladati infrastrukturne prednosti tehnoloških divova. Hoće li ova strategija uspjeti vjerovatno će ovisiti o sposobnosti tvrtke da održava prednosti performansi tijekom skaliranja na globalnoj razini – izazov koji se pokazao teškim za mnoge startupe infrastrukture.

Za sada, programeri dobivaju još jednu opciju visoke performanse na sve konkurentnijem tržištu, dok poduzeća gledaju da li Groqova tehnička obećanja prevode u pouzdanu uslugu proizvodnje na mjeri.



Web izvor

By Tomšić Damjan

Pozdrav, ja sam Damjan Tomšić, osnivatelj i urednik informatičko edukativnog bloga Oblak Znanja. Za Vas ću se potruditi da dobijete edukativne članke, savjete i recenzije vezane uz osnovno i napredno korištenje računala i interneta. Kontak: Google+, Gmail.