Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

8 milijardi tokena dnevno natjeralo je AT&T da preispita AI orkestraciju — i smanji troškove za 90%

Novosti

8 milijardi tokena dnevno natjeralo je AT&T da preispita AI orkestraciju — i smanji troškove za 90%

Tomšić Damjan 26. veljače 2026

Kada je vaša prosječna dnevna upotreba tokena 8 milijardi dnevno, imate veliki problem s razmjerom. To je bio slučaj u AT&T-u, a voditelj podataka Andy Markus i njegov tim shvatili su da jednostavno nije izvedivo (ili ekonomično) progurati sve kroz velike modele rezoniranja. Dakle, prilikom izgradnje internog Ask AT&T osobnog asistenta, rekonstruirali su sloj orkestracije. Rezultat: višeagentski skup izgrađen na LangChainu gdje “super agenti” velikog jezičnog modela usmjeravaju manje, temeljne “radničke” agente koji obavljaju sažetiji, svrhovito usmjereni posao. Ovaj fleksibilni sloj orkestracije dramatično je poboljšao kašnjenje, brzinu i vrijeme odziva, rekao je Markus za VentureBeat. Što je najvažnije, njegov tim je zabilježio uštede do 90% troškova. “Vjerujem da je budućnost agentske umjetne inteligencije mnogo, mnogo, mnogo malih jezičnih modela (SLM)”, rekao je. “Smatramo da su mali jezični modeli jednako točni, ako ne i točni, kao veliki jezični model na određenom području domene.”

Nedavno su Markus i njegov tim koristili ovaj re-arhiktirani skup zajedno s Microsoft Azureom za izgradnju i implementaciju Ask AT&T Workflows, grafičkog alata za izradu agenata povuci i ispusti za zaposlenike za automatizaciju zadataka.

Agenti koriste paket vlasničkih alata AT&T koji upravljaju obradom dokumenata, konverzijom prirodnog jezika u SQL i analizom slike. “Dok se tijek rada izvršava, podaci AT&T-a zapravo pokreću odluke”, rekao je Markus. Umjesto da postavljamo općenita pitanja, “mi postavljamo pitanja o našim podacima, a svoje podatke koristimo kako bismo bili sigurni da se fokusiraju na naše informacije dok donose odluke.” Ipak, čovjek uvijek nadgleda “lančanu reakciju” agenata. Sve radnje agenata se bilježe, podaci su izolirani tijekom procesa, a pristup temeljen na ulogama se provodi kada agenti prenose radna opterećenja jedni drugima. “Stvari se doista događaju autonomno, ali čovjek u petlji i dalje osigurava provjeru i ravnotežu cijelog procesa”, rekao je Markus.

Sadržaj objave

  • 1 Bez pretjerane gradnje, korištenjem ‘zamjenjivih i biranih’ modela
  • 2 Kako ga zapravo koristi 100.000 zaposlenika
  • 3 Kodiranje temeljeno na umjetnoj inteligenciji je budućnost
    • 3.1 Povezani sadržaji

Bez pretjerane gradnje, korištenjem ‘zamjenjivih i biranih’ modela

AT&T ne uzima a "izgraditi sve od nule" način razmišljanja, primijetio je Markus; više se oslanja na modele koji su “zamjenjivi i birani” i “nikada ne obnavljaju robu”. Kako funkcionalnost sazrijeva u cijeloj industriji, oni će odbaciti domaće alate umjesto uobičajenih opcija, objasnio je. “Zato što se u ovom prostoru stvari mijenjaju svaki tjedan, ako imamo sreće, ponekad i više puta tjedno”, rekao je. “Moramo biti u stanju pilotirati, priključivati ​​i isključivati ​​različite komponente.” Oni rade “stvarno rigorozne” procjene dostupnih opcija kao i svojih vlastitih; na primjer, njihov Ask Data with Relational Knowledge Graph bio je na vrhu Spider 2.0 točnosti teksta u SQL, a drugi su alati visoko ocijenjeni na BERT SQL mjerilu. U slučaju domaćih agentskih alata, njegov tim koristi LangChain kao temeljni okvir, fino podešava modele sa standardnim dohvaćanjem-augmentiranim generiranjem (RAG) i drugim internim algoritmima, te blisko surađuje s Microsoftom, koristeći funkciju pretraživanja tehnološkog diva za njihovu vektorsku pohranu. U konačnici, međutim, važno je ne samo spojiti agentsku umjetnu inteligenciju ili druge napredne alate u sve samo radi sebe, savjetuje Markus. “Ponekad previše kompliciramo stvari”, rekao je. “Ponekad sam vidio rješenje pretjerano projektirano.” Umjesto toga, graditelji bi se trebali zapitati treba li dati alat zapravo biti agent. To bi moglo uključivati ​​pitanja poput: Koja bi se razina točnosti mogla postići da je to jednostavnije generativno rješenje s jednim okretom? Kako su ga mogli rastaviti na manje komade gdje bi se svaki komad mogao isporučiti “mnogo točnije”?, kako je rekao Markus. Točnost, cijena i odzivnost alata trebali bi biti temeljni principi. “Čak i kad su rješenja postala kompliciranija, ta tri prilično osnovna načela i dalje nam daju dosta smjernica”, rekao je.

Kako ga zapravo koristi 100.000 zaposlenika

Ask AT&T Workflows je uveden za više od 100.000 zaposlenika. Više od polovice kaže da ga koristi svaki dan, a aktivni korisnici prijavljuju povećanje produktivnosti čak do 90%, rekao je Markus. “Provjeravamo, koriste li sustav opetovano? Jer ljepljivost je dobar pokazatelj uspjeha”, rekao je. Agent builder nudi “dva putovanja” za zaposlenike. Jedan je pro-code, gdje korisnici mogu programirati Python iza kulisa, diktirajući pravila kako bi agenti trebali raditi. Drugi je bez koda, s vizualnim sučeljem povuci i ispusti za “prilično lagano korisničko iskustvo”, rekao je Markus. Zanimljivo je da čak i iskusni korisnici gravitiraju potonjoj opciji. Na nedavnom hackathonu namijenjenom tehničkoj publici, sudionici su mogli birati između oba, a više od polovice odabralo je niski kod. “Ovo je bilo iznenađenje za nas, jer su svi ti ljudi bili vrlo kompetentni u programskom aspektu”, rekao je Markus. Zaposlenici koriste agente za razne funkcije; na primjer, mrežni inženjer može izgraditi niz njih za rješavanje upozorenja i ponovno povezivanje korisnika kada izgube vezu. U ovom scenariju, jedan agent može povezati telemetriju kako bi identificirao mrežni problem i njegovu lokaciju, izvukao zapise promjena i provjerio postoje li poznati problemi. Zatim, može otvoriti kartu problema. Drugi bi agent tada mogao smisliti načine za rješavanje problema, pa čak i napisati novi kod da ga zakrpi. Nakon što se problem riješi, treći agent može napisati sažetak s preventivnim mjerama za budućnost. “The [human] inženjer bi nadgledao sve to, pazeći da agenti rade prema očekivanjima i poduzimaju prave radnje,” rekao je Markus.

Kodiranje temeljeno na umjetnoj inteligenciji je budućnost

Ta ista inženjerska disciplina — razbijanje posla na manje, namjenski građene dijelove — sada preoblikuje način na koji AT&T sam piše kod, kroz ono što Markus naziva "Kodiranje potaknuto umjetnom inteligencijom."

Usporedio je proces s RAG-om; razvojni programeri koriste agilne metode kodiranja u integriranom razvojnom okruženju (IDE) zajedno s arhetipovima izrade “specifičnim za funkcije” koji određuju kako bi kod trebao komunicirati. Izlaz nije labav kod; kod je “vrlo blizu proizvodnog stupnja”, i mogao bi postići tu kvalitetu u jednom krugu. “Svi smo radili s vibe kodiranjem, gdje imamo agentsku vrstu uređivača koda”, primijetio je Markus. Ali kodiranje potaknuto umjetnom inteligencijom “eliminira puno ponavljanja naprijed-natrag koje biste mogli vidjeti u vibe kodiranju.” On ovu tehniku ​​kodiranja vidi kao “opipljivo redefiniranje” ciklusa razvoja softvera, u konačnici skraćujući vremenske rokove razvoja i povećavajući izlaz koda proizvodne razine. Netehnički timovi također se mogu uključiti u akciju, koristeći upute jednostavnim jezikom za izradu softverskih prototipova. Njegov je tim, na primjer, upotrijebio tehniku ​​za izradu internog odabranog podatkovnog proizvoda u 20 minuta; bez umjetne inteligencije, izgradnja bi trajala šest tjedana. “Razvijamo softver s njim, modificiramo softver s njim, bavimo se znanošću podataka s njim, radimo analitiku podataka s njim, radimo podatkovni inženjering s njim”, rekao je Markus. “Dakle, to je promjena igre.”

Web izvor

Povezani sadržaji

  • When progress doesn’t feel like home: Why many are hesitant to join the AI migrationWhen progress doesn’t feel like home: Why many are hesitant to join the AI migration
  • Vidljivi problemi 5 USD kredita za prekid rada, čak i bez većeg prekida radaVidljivi problemi 5 USD kredita za prekid rada, čak i bez većeg prekida rada
  • Zašto ukloniti ruske održavatelje Linux kernela? Evo što kaže TorvaldsZašto ukloniti ruske održavatelje Linux kernela? Evo što kaže Torvalds
  • Znanstvenici su identificirali podrijetlo izuzetno moćnog svemirskog radio valaZnanstvenici su identificirali podrijetlo izuzetno moćnog svemirskog radio vala
  • Sutnautica 2 prikazuje prve snimke u igri kao ljestvice programera “Put do ranog pristupa”Sutnautica 2 prikazuje prve snimke u igri kao ljestvice programera “Put do ranog pristupa”
  • BT: Sljedeća faza kvantnog napretka UK-a ovisi o izgradnji mrežeBT: Sljedeća faza kvantnog napretka UK-a ovisi o izgradnji mreže

Previous Article

Ovo je najgora stvar koja se mogla dogoditi Međunarodnoj svemirskoj stanici

Posljednje objave

8 milijardi tokena dnevno natjeralo je AT&T da preispita AI orkestraciju — i smanji troškove za 90%

8 milijardi tokena dnevno natjeralo je AT&T da preispita AI orkestraciju — i smanji troškove za 90%

Ovo je najgora stvar koja se mogla dogoditi Međunarodnoj svemirskoj stanici

Ovo je najgora stvar koja se mogla dogoditi Međunarodnoj svemirskoj stanici

GNOME 50 je briljantno izdanje – ali morao sam dva puta pogledati zašto

Sadržaj

  • 1 Bez pretjerane gradnje, korištenjem ‘zamjenjivih i biranih’ modela
  • 2 Kako ga zapravo koristi 100.000 zaposlenika
  • 3 Kodiranje temeljeno na umjetnoj inteligenciji je budućnost

Novosti

  • 8 milijardi tokena dnevno natjeralo je AT&T da preispita AI orkestraciju — i smanji troškove za 90% 26. veljače 2026
  • Ovo je najgora stvar koja se mogla dogoditi Međunarodnoj svemirskoj stanici 26. veljače 2026
  • GNOME 50 je briljantno izdanje – ali morao sam dva puta pogledati zašto 26. veljače 2026
  • Samsung Galaxy S26 Ultra naspram S24 Ultra: Kako odlučiti isplati li se dvogodišnja nadogradnja 26. veljače 2026
  • Arc Pulse donosi svoju Crazy Case na Galaxy S26 Ultra 25. veljače 2026
  • Politika privatnosti Genshin Impacta naznačila je da se glasovni podaci igrača mogu koristiti za treniranje AI modela 25. veljače 2026
  • Aeris, Verizon Business imaju za cilj pojednostaviti globalno širenje IoT-a 25. veljače 2026
  • Anthropic je upravo objavio mobilnu verziju Claude Codea pod nazivom Remote Control 25. veljače 2026
  • Posljednja misterija antarktičkih ‘krvavih slapova’ konačno je riješena 25. veljače 2026
  • Ažuriranja uživo za Samsung Unpacked 2026: Galaxy S26 Ultra specifikacije, Buds 4 Pro, Bixby, više 24. veljače 2026

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice