Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Meta Unleasses Llama API trči 18x brže od OpenAi: Cerebras Partnership isporučuje 2.600 tokena u sekundi

Novosti

Meta Unleasses Llama API trči 18x brže od OpenAi: Cerebras Partnership isporučuje 2.600 tokena u sekundi

Tomšić Damjan 29. travnja 2025


Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj na vodećim AI pokrivenosti. Saznati više


Meta najavio danas partnerstvo s Cerebrani sustavi da napadne svoj novi Apijenudeći programerima pristup brzini zaključivanja do 18 puta brže od tradicionalnih rješenja temeljenih na GPU-u.

Najava, objavljena na Inauguralnoj Meta Llalacon Konferencija programera u parku Menlo, pozicionira tvrtku da se izravno natječe Open,, Antropskii Google Na brzo rastućem tržištu usluga AI zaključivanja, gdje programeri kupuju žetone za milijarde kako bi napajali svoje prijave.

“Meta je odabrala cerebre za suradnju kako bi iznijela ultra brzi zaključak koji im je potreban da služe programerima putem svog novog LLAMA API-ja”, rekla je Julie Shin Choi, direktorica marketinga u cerebrasu, tijekom brifinga za novinare. “Mi u cerebrama zaista smo, jako uzbuđeni što smo najavili naše prvo CSP HyperScaler partnerstvo za pružanje ultra brzih zaključivanja svim programerima.”

Partnerstvo označava Meta-ov formalni ulazak u posao prodaje AI računanja, pretvarajući svoje popularne modele LLAMA otvorenog koda u komercijalnu uslugu. Dok su se metali llama akumulirali Milijarda preuzimanjaDo sada tvrtka nije ponudila oblačnu infrastrukturu prve strane za programere za izgradnju aplikacija s njima.

“Ovo je vrlo uzbudljivo, čak i bez posebno govora o cerebrima”, rekao je James Wang, viši izvršni direktor Cerebrasa. “OpenAi, antropski, Google – izgradili su cijeli novi AI posao ispočetka, što je posao AI zaključivanja. Programeri koji grade AI aplikacije kupit će tokene od milijardi, a to su poput novih izračunanih uputa koje ljudi trebaju izgraditi AI aplikacije.”

Referentni grafikon prikazuje cerebras za obradu llama 4 na 2.648 tokena u sekundi, dramatično nadmašivši konkurente Sambanova (747), Groq (600) i usluge sa sjedištem u GPU-u od Googlea i drugih-objašnjavajući Meta-ov hardverski izbor za svoj novi API. (Kredit: cerebri)

Sadržaj objave

  • 1 Razbijanje barijere za brzinu: kako su moždani modeli LLAMA modeli
    • 1.1 Povezani sadržaji

Razbijanje barijere za brzinu: kako su moždani modeli LLAMA modeli

Ono što Meta nudi izdvojeno je dramatično povećanje brzine koje pruža Cerebras ‘Specijalizirani AI čips. Sustav cerebrasa isporučuje 2.600 tokena u sekundi Za Llama 4 izviđača, u usporedbi s oko 130 tokena u sekundi za chatgpt i oko 25 tokena u sekundi za Deepseek, prema mjerilo Umjetna analiza.

“Ako samo uspoređujete na API-API osnovi, Blizanci i GPT, svi su oni sjajni modeli, ali svi oni trče brzinom GPU-a, što je otprilike 100 tokena u sekundi”, objasnio je Wang. “A 100 tokena u sekundi u redu je za chat, ali vrlo je sporo za rasuđivanje. Za agente je vrlo sporo. I ljudi se danas bore s tim.”

Ova prednost u brzini omogućava potpuno nove kategorije aplikacija koje su prethodno bile nepraktične, uključujući agente u stvarnom vremenu, razgovorne glasovne sustave s niskom kašnjenjem, interaktivno stvaranje koda i instant multi-step rezoniranje-za sve to zahtijevaju vezanje višestrukih poziva velikih jezičnih modela koji se sada mogu dovršiti u sekundi, a ne za nekoliko minuta.

A Apije Predstavlja značajan pomak u Meta AI strategiji, prelazeći iz prvenstveno davatelja modela postaje AI infrastrukturna kompanija s punom uslugom. Nudeći uslugu API -ja, Meta stvara tok prihoda od svojih AI ulaganja, zadržavajući svoju opredijeljenost za otvaranje modela.

“Meta se sada bavi prodajom tokena, a izvrstan je za američku vrstu AI ekosustava”, primijetio je Wang tijekom konferencije za novinare. “Donose puno na stol.”

API će ponuditi alate za precizno prilagođavanje i procjenu, počevši od LLAMA 3.3 8B modelomogućujući programerima da generiraju podatke, treniraju na njemu i testiraju kvalitetu svojih prilagođenih modela. Meta naglašava da neće koristiti podatke o klijentima za obuku vlastitih modela, a modeli izgrađeni pomoću LLAMA API -ja mogu se prenijeti na druge domaćine – jasnu razliku od zatvorenih pristupa nekih konkurenata.

Cerebras će napajati novu uslugu Meta putem svoje mreže podatkovnih centara koji se nalaze u cijeloj Sjevernoj Americi, uključujući objekte u Dallasu, Oklahomi, Minnesoti, Montrealu i Kaliforniji.

“Svi naši podatkovni centri koji služe zaključivanju su u ovom trenutku u Sjevernoj Americi”, objasnio je Choi. “Mi ćemo poslužiti meta s punim kapacitetom cerebri. Radno opterećenje će biti uravnoteženo u svim tim različitim podatkovnim centrima.”

Poslovni aranžman slijedi ono što je Choi opisao kao “klasični davatelj računala na hiperscaler” model, slično kao što NVIDIA pruža hardver glavnim pružateljima usluga u oblaku. “Oni rezerviraju blokove našeg računanja da mogu služiti svojoj populaciji programera”, rekla je.

Iza cerebrasa, Meta je također najavila partnerstvo s Groqom Da biste pružili brze mogućnosti zaključivanja, davanje programerima višestrukih alternativa visokih performansi izvan tradicionalnog zaključka utemeljenog na GPU-u.

Meta ulazak na tržište zaključivanja API -ja s superiornim mjernim podacima mogao bi potencijalno poremetiti utvrđeni red u kojem dominira Open,, Googlei Antropski. Kombinirajući popularnost svojih modela otvorenog koda s dramatično bržim mogućnostima zaključivanja, Meta se pozicionira kao nevjerojatan konkurent u komercijalnom AI prostoru.

“Meta je u jedinstvenom položaju s 3 milijarde korisnika, hiper-razmjera podataka i ogromnim ekosustavima programera”, prema cerebrasnim prezentacijskim materijalima. Integracija cerebras tehnologije “pomaže Meta LeapFrog OpenAi i Google u performansama otprilike 20x.”

Za cerebre, ovo partnerstvo predstavlja veliku prekretnicu i validaciju svog specijaliziranog AI hardverskog pristupa. “Godinama gradimo ovaj motor s vafelom i uvijek smo znali da je prva cijena tehnologije, ali na kraju to mora završiti kao dio tuđeg hiperskalenog oblaka. To je bila konačna meta iz perspektive komercijalne strategije i konačno smo postigli tu prekretnicu”, rekao je Wang.

A Apije trenutno je dostupan kao ograničen pregled, a Meta planira širi uvođenje u narednim tjednima i mjesecima. Programeri zainteresirani za pristup ultra-brzim zaključcima LLAMA 4 mogu zatražiti rani pristup odabirom cerebri iz opcija modela unutar LLAMA API-ja.

“Ako zamislite programera koji ne zna ništa o cerebrima jer smo relativno mala tvrtka, oni mogu samo kliknuti dva gumba na standardnom softveru SDK-a Meta, generirati API ključ, odabrati zastavu cerebrasa, a onda se odjednom, njihovi tokeni obrađuju na divovskom motoru s vafom”, objasnio je Wang. “Takva vrsta da budemo na stražnjem kraju Meta cijelog ekosustava za razvojne programere samo su za nas.”

Meta izbor specijaliziranih silicija signalizira nešto duboko: U sljedećoj fazi AI -ja nije samo ono što vaši modeli znaju, već i koliko brzo mogu to misliti. U toj budućnosti brzina nije samo značajka – to je cijela poanta.

Dnevni uvidi u slučajeve poslovne uporabe s VB dnevno

Ako želite impresionirati svog šefa, VB Daily vas je pokrivao. Dajemo vam unutarnju lopaticu o tome što tvrtke rade s generativnim AI, od regulatornih pomaka do praktičnih razmještaja, tako da možete dijeliti uvide za maksimalni ROI.

Pročitajte našu politiku privatnosti

Hvala na pretplati. Pogledajte više VB biltena ovdje.

Došlo je do pogreške.



Web izvor

Povezani sadržaji

  • 5 načina da dobijete najbolju podršku za Linux, bez obzira na razinu vaše vještine
  • Com4 odabire Nokia 5g samostalnu jezgru za napajanje Global IoT -aCom4 odabire Nokia 5g samostalnu jezgru za napajanje Global IoT -a
  • Što Linus Torvalds stvarno misli o umjetnoj inteligenciji i razvoju softvera moglo bi vas iznenaditiŠto Linus Torvalds stvarno misli o umjetnoj inteligenciji i razvoju softvera moglo bi vas iznenaditi
  • Podesite i ubrzajte Windows OS | Simple Performance BoostPodesite i ubrzajte Windows OS | Simple Performance Boost
  • Ovaj termovizijski senzor uštedio mi je stotine popravaka (plus radi s iOS-om i Androidom)Ovaj termovizijski senzor uštedio mi je stotine popravaka (plus radi s iOS-om i Androidom)
  • Struktura leda u prostoru nije ni red ni kaos – oboje jeStruktura leda u prostoru nije ni red ni kaos – oboje je

Previous Article

Države i startupi tuže američku komisiju za nuklearnu regulaciju

Next Article

Glavni izazovi marketinga influencera i njihova rješenja

Posljednje objave

Obožavatelji Fortnitea kažu “ne AI pomazi” nakon što su uočili ono za što vjeruju da su slike generirane umjetnom inteligencijom u igri

Obožavatelji Fortnitea kažu “ne AI pomazi” nakon što su uočili ono za što vjeruju da su slike generirane umjetnom inteligencijom u igri

Microsoft stvara okvir za sigurnu arhitekturu optičke mreže

Microsoft stvara okvir za sigurnu arhitekturu optičke mreže

Zašto je vidljiva umjetna inteligencija SRE sloj koji nedostaje tvrtkama za pouzdane LLM-ove

Zašto je vidljiva umjetna inteligencija SRE sloj koji nedostaje tvrtkama za pouzdane LLM-ove

Novosti

  • Obožavatelji Fortnitea kažu “ne AI pomazi” nakon što su uočili ono za što vjeruju da su slike generirane umjetnom inteligencijom u igri 30. studenoga 2025
  • Microsoft stvara okvir za sigurnu arhitekturu optičke mreže 30. studenoga 2025
  • Zašto je vidljiva umjetna inteligencija SRE sloj koji nedostaje tvrtkama za pouzdane LLM-ove 30. studenoga 2025
  • Lijek za mršavljenje Zepbound testira se kao lijek za dugi Covid 30. studenoga 2025
  • Koliko RAM-a vaše računalo zapravo treba 2025. godine? Stručnjak za Windows i Mac računa 30. studenoga 2025
  • Samsung daje 71% popusta na Galaxy Watch 8 30. studenoga 2025
  • Hollow Knight: Silksong dev misli da će Clair Obscur: Expedition 33 osvojiti igru ​​godine: “Iznimna je i široko ukusna” 29. studenoga 2025
  • RailTel modernizira međugradske optičke mreže metroa diljem Indije 29. studenoga 2025
  • Anthropic kaže da je riješio dugogodišnji problem AI agenta s novim Claude SDK-om za više sesija 29. studenoga 2025
  • Kako izmjeriti polumjer Zemlje pomoću Lego kockica 29. studenoga 2025

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice