Memorija agenta ostaje problem koji poduzeća žele riješiti jer agenti zaboravljaju neke upute ili razgovore što dulje rade.
antropski vjeruje da je riješio ovaj problem za svoje Claude Agent SDKrazvijajući dvostruko rješenje koje agentu omogućuje rad u različitim kontekstnim prozorima.
“Glavni izazov dugotrajnih agenata je da moraju raditi u diskretnim sesijama, a svaka nova sesija počinje bez sjećanja na ono što je bilo prije”, napisao je Anthropic u post na blogu. “Budući da su kontekstni prozori ograničeni i budući da se većina složenih projekata ne može dovršiti unutar jednog prozora, agenti trebaju način premošćivanja jaza između sesija kodiranja.”
Inženjeri tvrtke Anthropic predložili su dvostruki pristup za svoj Agent SDK: agenta za inicijalizaciju za postavljanje okruženja i agenta za kodiranje za inkrementalni napredak u svakoj sesiji i ostavljanje artefakata za sljedeću.
Problem s memorijom agenta
Budući da su agenti izgrađeni na temeljnim modelima, oni ostaju ograničeni ograničenim, iako kontinuirano rastućim prozorima konteksta. Za dugotrajne agente to bi moglo stvoriti veći problem, navodeći agenta da zaboravi upute i neuobičajeno se ponaša tijekom obavljanja zadatka. Poboljšanje memorije agenta postaje ključno za dosljednu, poslovno sigurnu izvedbu.
Tijekom prošle godine pojavilo se nekoliko metoda, sve pokušavajući premostiti jaz između prozora konteksta i memorije agenta. LangChainLangMem SDK, Memobase i OpenAI‘s Swarm primjeri su tvrtki koje nude memorijska rješenja. Nedavno je eksplodiralo istraživanje agentskog pamćenja, s predloženim okviri poput Memp i Paradigma ugniježđenog učenja iz Google nudeći nove alternative za poboljšanje pamćenja.
Mnogi od trenutnih memorijskih okvira su otvorenog koda i mogu se idealno prilagoditi različitim velikim jezičnim modelima (LLM-ovi) koji pokreću agente. Anthropicov pristup poboljšava njegov Claude Agent SDK.
Kako radi
Anthropic je utvrdio da iako Claude Agent SDK ima mogućnosti upravljanja kontekstom i “trebao bi omogućiti agentu da nastavi obavljati koristan posao proizvoljno dugo vremena”, to nije dovoljno. Tvrtka je u svom postu na blogu rekla da model poput Opusa 4.5 pokretanje Claude Agent SDK-a može “ne uspjeti izgraditi web-aplikaciju proizvodne kvalitete ako joj se samo da upit visoke razine, kao što je ‘izgradite klon claude.ai’.”
Neuspjesi su se očitovali u dva obrasca, rekao je Anthropic. Prvo, agent je pokušao učiniti previše, zbog čega je model ostao van konteksta u sredini. Agent tada mora pogoditi što se dogodilo i ne može prenijeti jasne upute sljedećem agentu. Drugi kvar se javlja kasnije, nakon što su neke značajke već izgrađene. Agent vidi da je postignut napredak i samo izjavljuje da je posao obavljen.
Antropički istraživači razbili su rješenje: postavljanje početne okoline za postavljanje temelja za značajke i poticanje svakog agenta da postupno napreduje prema cilju, a da na kraju još uvijek ostane čista ploča.
Ovdje dolazi dvodijelno rješenje Anthropic agenta. Agent za inicijalizaciju postavlja okruženje, bilježi što su agenti učinili i koje su datoteke dodane. Agent za kodiranje će zatim tražiti od modela da postupno napreduju i ostave strukturirana ažuriranja.
“Inspiracija za ove prakse došla je iz saznanja što učinkoviti softverski inženjeri rade svaki dan”, rekao je Anthropic.
Istraživači su rekli da su agentu za kodiranje dodali alate za testiranje, poboljšavajući njegovu sposobnost identificiranja i ispravljanja grešaka koje nisu bile očite samo iz koda.
Buduća istraživanja
Anthropic je primijetio da je njegov pristup “jedan mogući skup rješenja u dugotrajnom povezivanju agenata.” Međutim, ovo je tek početna faza onoga što bi moglo postati šire područje istraživanja za mnoge u prostoru umjetne inteligencije.
Tvrtka je rekla da njezini eksperimenti za jačanje dugoročne memorije za agente nisu pokazali radi li jedan agent za kodiranje opće namjene najbolje u različitim kontekstima ili strukturi s više agenata.
Njegova se demonstracija također usredotočila na razvoj web-aplikacija s punim nizom, tako da bi se drugi eksperimenti trebali usredotočiti na generaliziranje rezultata za različite zadatke.
“Vjerojatno je da se neke ili sve ove lekcije mogu primijeniti na tipove dugotrajnih agencijskih zadataka koji su potrebni u, primjerice, znanstvenom istraživanju ili financijskom modeliranju”, rekao je Anthropic.


