Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Google’s Alphaevolve: AI agent koji je povratio 0,7% Googleovog računanja – i kako ga kopirati

Novosti

Google’s Alphaevolve: AI agent koji je povratio 0,7% Googleovog računanja – i kako ga kopirati

Tomšić Damjan 17. svibnja 2025


Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj na vodećim AI pokrivenosti. Saznati više


GoogleNovi Alphaevolve pokazuje što se događa kada AI agent diplomira iz laboratorijskog demo -a do proizvodnih radova, a imate jednu od najtalentiranijih tehnoloških tvrtki koje ga pokreću.

Izgradio Googleov DeepMind, sustav autonomno prepisuje kritični kôd i već se plaća unutar Googlea. To razbio 56-godišnji rekord U matrici množenje (jezgra mnogih opterećenja strojnog učenja) i Povratio je 0,7% izračunavanja kapaciteta u globalnim podatkovnim centrima tvrtke.

Ti naslovni podvizi važni su, ali dublja lekcija za vođe poduzeća je kako Alphaevolve ih povlači. Njegova arhitektura-kontroler, modeli brzog nacrta, modeli dubokog razmišljanja, automatizirani evaluatori i verzija memorije-ilustrira vrstu vodovoda proizvodnje koji čini autonomne agense sigurnim za raspoređivanje na skali.

Googleova AI tehnologija vjerojatno nije druga. Dakle, trik je shvatiti kako naučiti iz njega ili čak koristiti ga izravno. Google kaže da je program ranog pristupa dolazak za akademske partnere i „širu dostupnost”Istražuje se, ali detalji su tanki. Do tada je Alphaevolve predložak najbolje prakse: ako želite da agenti koji dodiruju radno opterećenje visoke vrijednosti, trebat će vam usporediva orkestracija, testiranje i zaštitne ograde.

Razmotrite samo Pobjeda podatkovnog centra. Google neće staviti cijenu na povratio 0,7%, ali njegov godišnji kapeks radi deseci milijardi dolara. Čak i gruba procjena uštede u stotinama milijuna godišnje –Dosta, kao što je neovisni programer Sam Witteveen napomenuo na našem nedavnom podcastza plaćanje obuke jedan od vodećih modela Blizanca, za koji se procjenjuje da će koštati 191 milijuna dolara Za verziju poput Blizanca Ultra.

VentureBeat je prvi izvijestio o NewsAevolve News početkom ovog tjedna. Sada ćemo ići dublje: kako sustav funkcionira, gdje inženjerska traka stvarno sjedi i poduzeća s betonskim stepenicama mogu poduzeti da izgrade (ili kupuju) nešto usporedivo.

Sadržaj objave

  • 1 1. Osim jednostavnih skripti: porast “operativnog sustava agenta”
  • 2 2. Evaluator motor: napredak u vožnji s automatiziranim, objektivnim povratnim informacijama
  • 3 3. Pametna upotreba modela, iterativno usavršavanje koda
  • 4 4. Mjera za upravljanje: ciljanje agensa AI za demonstran ROI
  • 5 5. Postavljanje temelja: Bitni preduvjeti za uspjeh u poslovnim agentima
  • 6 Agentna budućnost je projektirana, a ne samo pozvana
    • 6.1 Povezani sadržaji

1. Osim jednostavnih skripti: porast “operativnog sustava agenta”

Alphaevolve radi na onome što se najbolje opisuje kao operativni sustav agenta – distribuirani, asinhroni cjevovod izgrađen za kontinuirano poboljšanje u skali. Njegovi su temeljni komadi kontroler, par velikih jezičnih modela (Blizanci bljeskalica za širinu; GEMINI PRO za dubinu), verzija baza podataka programa memorije i flota radnika evaluatora, a svi su podešeni za visoku propusnost, a ne samo nisku kašnjenju.

Pregled visoke razine strukture Alphaevolve agensa. Izvor: Alphaevolve papir.

Ova arhitektura nije konceptualno nova, ali izvršenje je. “To je samo nevjerojatno dobro izvršenje”, kaže Witteveen.

Alfavolve papir opisuje orkestrator kao “Evolucijski algoritam koji postupno razvija programe koji poboljšavaju rezultat na metrikama automatiziranih evaluacija” (str. 3); Ukratko, an “Autonomni cjevovod LLMS -a čiji je zadatak poboljšati algoritam izravnim promjenama koda” (str. 1).

Polaz za poduzeća: Ako planovi vašeg agenta uključuju nenadzirane pokrete na zadacima visoke vrijednosti, planirajte sličnu infrastrukturu: redovi za posao, verziju memorijske trgovine, praćenje servisnih mreža i sigurno snuling za bilo koji kod koji agent proizvodi.

2. Evaluator motor: napredak u vožnji s automatiziranim, objektivnim povratnim informacijama

Ključni element AlpAevolve je njegov strogi okvir za ocjenjivanje. Svaka iteracija koju je predložio par LLMS-a prihvaća se ili odbacuje na temelju funkcije „Procjenjivanje“ koja je pribavljena korisnikom koja vraća metrike koje se mogu pokupiti. Ovaj sustav evaluacije započinje s ultra brzim provjerama jediničnog ispitivanja na svakoj predloženoj promjeni koda-jednostavnim, automatskim testovima (slično kao što programeri testova već pišu) koji provjeravaju isječak i dalje sastavljaju i stvaraju prave odgovore na pregršt mikro-ulaza-prije nego što preživjele preživjele na teže referentne oznake. To se paralelno pokreće, tako da pretraga ostaje brzo i sigurno.

Ukratko: neka modeli predlažu ispravke, a zatim provjerite svaki protiv testova u koje vjerujete. Alphaevolve također podržava više objektivne optimizacije (optimiziranje kašnjenja i Točnost istovremeno), razvijajući se programi koji su pogodili nekoliko mjernih podataka odjednom. Suprotno intuitivno, uravnoteženje više ciljeva može poboljšati jedinstvenu ciljanu metriku potičući raznovrsnija rješenja.

Polaz za poduzeća: Proizvodni agenti trebaju determinirane ocjene. Bilo da su to jedinični testovi, puni simulatori ili analiza kanarinskog prometa. Automatizirani evaluatori su i vaša sigurnosna mreža i vaš motor za rast. Prije nego što pokrenete agentički projekt, pitajte: “Imamo li metriku protiv koje agent može postići rezultat?”

3. Pametna upotreba modela, iterativno usavršavanje koda

Alphaevolve se bavi svim problemom kodiranja s ritmom s dva modela. Prvo, Blizanci Flash otpušta brze nacrte, dajući sustavu širok skup ideja za istraživanje. Tada Blizanci Pro proučava te nacrte dublje i vraća manji skup jačih kandidata. Hranjenje oba modela lagan je „brzi graditelj“, pomoćni skripta koja sastavlja pitanje koje svaki model vidi. Spoje tri vrste konteksta: raniji pokušaji koda spremljeni u bazi podataka projekta, bilo koji zaštitnici ili pravila koja je inženjerski tim napisao i relevantni vanjski materijal, poput istraživačkih radova ili bilješki programera. S tom bogatijom pozadinom, Blizanci Flash može široko lutati dok Blizanci pro nule u kvaliteti.

Za razliku od mnogih demonstracija agenata koji prilagođavaju jednu funkciju istovremeno, Alphaevolve uređuje čitava spremišta. Svaku promjenu opisuje kao standardni razlika – isti inženjeri formata zakrpa guraju na GitHub – tako da može dodirnuti desetke datoteka bez gubitka traga. Nakon toga, automatizirani testovi odlučuju hoće li se zakrpa zalijepiti. Tijekom ponovljenih ciklusa raste memorija agenta o uspjehu i neuspjehu, tako da predlaže bolje zakrpe i troši manje izračunavanja na mrtvim krajevima.

Polaz za poduzeća: Neka jeftiniji, brži modeli upravljaju brainstormingom, a zatim pozovite sposobniji model da usavrši najbolje ideje. Očuvajte svako suđenje u povijesti koje se može pretraživati, jer ta memorija ubrzava kasnije i može se ponovo upotrijebiti u timovima. Prema tome, dobavljači žure kako bi programerima pružili novi alat oko stvari poput memorije. Proizvodi poput OpenMemory MCPkoja pruža prijenosnu memorijsku trgovinu i Novi dugoročni i kratkoročni memorijski API-ji u Llamaindexu čine ovakav trajni kontekst gotovo jednako jednostavnim za priključenje kao i evidentiranje.

OpenAi-ov agent Codex-1 softver-inženjering, također objavljen danas, naglašava isti uzorak. Isključuje paralelne zadatke unutar sigurnog pješčanog okvira, pokreće jedinice testova i vraća nacrte za preusmjeravanje-učinkovito odjek šire petlje za pretraživanje i procjenu pretraživanja i procjene koda.

4. Mjera za upravljanje: ciljanje agensa AI za demonstran ROI

Alphaevolveove opipljive pobjede – povrat 0,7%kapaciteta podatkovnog centra, rezanje treninga BEMINI trening jezgara 23%, ubrzavanje flashAtvence 32%i pojednostaviti TPU dizajn – dijele jednu osobinu: ciljaju domene sa zračnim mjernim podacima.

Za zakazivanje podatkovnog centra, AlpAevolve je evoluirao heuristiku koja je ocijenjena pomoću simulatora Googleovih podatkovnih centara na temelju povijesnih radnih opterećenja. Za optimizaciju jezgre, cilj je bio minimizirati stvarno vrijeme izvođenja na TPU akceleratorima u skupu podataka realističnih ulaznih oblika kernela.

Polaz za poduzeća: Kada započinjete svoje Agentic AI putovanje, pogledajte prvo tijekove rada gdje je “bolji” mjerljiv broj koji vaš sustav može izračunati – bilo da je to latencija, trošak, brzina pogreške ili propusnost. Ovaj fokus omogućava automatizirano implementaciju pretraživanja i riskira jer izlaz agenta (često ljudski čitljivi kôd, kao u slučaju Alphaevolve) može se integrirati u postojeće cjevovode za pregled i validaciju.

Ova jasnoća omogućava agentima da se usavrši i pokaže nedvosmislenu vrijednost.

5. Postavljanje temelja: Bitni preduvjeti za uspjeh u poslovnim agentima

Iako su postignuća Alphaevolve nadahnjujuća, Googleov je papir također jasan o njegovom opsegu i zahtjevima.

Primarno ograničenje je potreba za automatiziranim evaluatorom; Problemi koji zahtijevaju ručno eksperimentiranje ili povratne informacije „mokrog laboratorija“ trenutno su izvan opsega za ovaj specifični pristup. Sustav može konzumirati značajno računanje-„po redoslijedu od 100 računalnih sati za procjenu bilo kojeg novog rješenja“ (AlpAevolve Paper, Stranica 8), zahtijeva paralelizaciju i pažljivo planiranje kapaciteta.

Prije nego što dodijele značajan proračun složenim agentnim sustavima, tehnički čelnici moraju postaviti kritična pitanja:

  • Problem koji se može pokupiti? Imamo li jasnu, automatsku metriku protiv koje agent može postići vlastiti učinak?
  • Izračunati kapacitet? Možemo li si priuštiti potencijalno izračunatu unutarnju petlju generacije, evaluacije i usavršavanja, posebno tijekom faze razvoja i treninga?
  • Koda baza i spremnost za pamćenje? Je li vaša baza kodova strukturirana za iterativne, moguće mijenjanja utemeljene na razliku? I možete li implementirati instrumentirane memorijske sustave od vitalnog značaja da agent nauči iz njegove evolucijske povijesti?

Polaz za poduzeća: Sve veća usredotočenost na robusni identitet agenta i upravljanje pristupom, kao što se vidi s platformama poput FromegG, AUTH0 i drugi, također ukazuje na sazrijevajuću infrastrukturu potrebnu za raspoređivanje agenata koji sigurno komuniciraju s više poslovnih sustava.

Agentna budućnost je projektirana, a ne samo pozvana

Alphaevolve poruka za poduzetničke timove je mnogostruka. Prvo, vaš operativni sustav oko agenata sada je daleko važniji od Model Intelligence. Googleov nacrt prikazuje tri stupa koji se ne mogu preskočiti:

  • Determinirani evaluatori koji agentu daju nedvosmislenu ocjenu svaki put kad napravi promjenu.
  • Dugotrajna orkestracija koja može brzo žonglirati modelima “nacrta” poput Blizanca s sporijim, strožim modelima-bilo da je to Googleov hrpa ili okvir poput Langchainovog Langgrapha.
  • Uporno pamćenje, tako da svaka iteracija gradi na posljednjem, umjesto da se preispita ispočetka.

Poduzeća koja već imaju evidentiranje, testne kabelske kabel i spremišta koda su bliža nego što misle. Sljedeći je korak usmjeriti tu imovinu u petlju za procjenu samoposluživanja kako bi se više rješenja za generiranu agentu mogla natjecati, a samo s najvišim brodovima zakrpa.

Kako je Ciscov Anurag Dhingra, VP i GM iz Enterprise povezanosti i suradnje, rekao je za VentureBeat u intervjuu ovog tjedna: “To se događa, to je vrlo, vrlo stvarno”, rekao je o poduzećima koji su koristili AI agente u proizvodnji, skladištima, kontaktnim centrima kupaca. “To nije nešto u budućnosti. To se danas događa.” Upozorio je da će, kako ti agenti postaju prožimajući, radeći “ljudski rad”, napor na postojećim sustavima bit će neizmjeran: “Mrežni promet će proći kroz krov”, rekao je Dhingra. Vaša mreža, proračun i konkurentni rub vjerojatno će osjetiti taj naprezanje prije nego što se hipe ciklus slegne. Počnite dokazivati ​​sadržanu, metričku upotrebu u ovom tromjesečju-a zatim razmjerite ono što funkcionira.

Pogledajte video podcast koji sam napravio s programerom Sam Witteveen, gdje idemo duboko u agente produkcije i kako Alphaevolve pokazuje put:

https://www.youtube.com/watch?v=g5n13jjaing

Dnevni uvidi u slučajeve poslovne uporabe s VB dnevno

Ako želite impresionirati svog šefa, VB Daily vas je pokrivao. Dajemo vam unutarnju lopaticu o tome što tvrtke rade s generativnim AI, od regulatornih pomaka do praktičnih razmještaja, tako da možete dijeliti uvide za maksimalni ROI.

Pročitajte našu politiku privatnosti

Hvala na pretplati. Pogledajte više VB biltena ovdje.

Došlo je do pogreške.



Web izvor

Povezani sadržaji

  • Morate zahvaliti NASA-i za bežične slušalice i usisavače
  • Uber je samo izmislio autobus … opetUber je samo izmislio autobus … opet
  • Youtube tipkovnicke kraticeYoutube tipkovničke kratice [SAVJET]
  • Znanstvenici prvi put promatraju ugljični dioksid na planetima izvan Sunčevog sustavaZnanstvenici prvi put promatraju ugljični dioksid na planetima izvan Sunčevog sustava
  • Mašta otkriva E-serije GPU-a za grafiku i AI na rubuMašta otkriva E-serije GPU-a za grafiku i AI na rubu
  • Prvi rašireni lijek za HIV mogao bi biti kod djecePrvi rašireni lijek za HIV mogao bi biti kod djece

Previous Article

Blokiran od prodaje osempic-a, startupa telehezima prihvaćaju manje učinkovit lijek

Next Article

Bt donijeti Gigabit širokopojasnu mrežu u teško dostupan područja zaljeva Swansea

Posljednje objave

Pixel 9 Pro rasprodaja zaliha stiže s cijenama niskim od 500 USD

Pixel 9 Pro rasprodaja zaliha stiže s cijenama niskim od 500 USD

Obožavatelji Fortnitea kažu “ne AI pomazi” nakon što su uočili ono za što vjeruju da su slike generirane umjetnom inteligencijom u igri

Obožavatelji Fortnitea kažu “ne AI pomazi” nakon što su uočili ono za što vjeruju da su slike generirane umjetnom inteligencijom u igri

Microsoft stvara okvir za sigurnu arhitekturu optičke mreže

Microsoft stvara okvir za sigurnu arhitekturu optičke mreže

Sadržaj

  • 1 1. Osim jednostavnih skripti: porast “operativnog sustava agenta”
  • 2 2. Evaluator motor: napredak u vožnji s automatiziranim, objektivnim povratnim informacijama
  • 3 3. Pametna upotreba modela, iterativno usavršavanje koda
  • 4 4. Mjera za upravljanje: ciljanje agensa AI za demonstran ROI
  • 5 5. Postavljanje temelja: Bitni preduvjeti za uspjeh u poslovnim agentima
  • 6 Agentna budućnost je projektirana, a ne samo pozvana

Novosti

  • Pixel 9 Pro rasprodaja zaliha stiže s cijenama niskim od 500 USD 1. prosinca 2025
  • Obožavatelji Fortnitea kažu “ne AI pomazi” nakon što su uočili ono za što vjeruju da su slike generirane umjetnom inteligencijom u igri 30. studenoga 2025
  • Microsoft stvara okvir za sigurnu arhitekturu optičke mreže 30. studenoga 2025
  • Zašto je vidljiva umjetna inteligencija SRE sloj koji nedostaje tvrtkama za pouzdane LLM-ove 30. studenoga 2025
  • Lijek za mršavljenje Zepbound testira se kao lijek za dugi Covid 30. studenoga 2025
  • Koliko RAM-a vaše računalo zapravo treba 2025. godine? Stručnjak za Windows i Mac računa 30. studenoga 2025
  • Samsung daje 71% popusta na Galaxy Watch 8 30. studenoga 2025
  • Hollow Knight: Silksong dev misli da će Clair Obscur: Expedition 33 osvojiti igru ​​godine: “Iznimna je i široko ukusna” 29. studenoga 2025
  • RailTel modernizira međugradske optičke mreže metroa diljem Indije 29. studenoga 2025
  • Anthropic kaže da je riješio dugogodišnji problem AI agenta s novim Claude SDK-om za više sesija 29. studenoga 2025

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice