Kada agentski tijek rada zakaže, programeri često pretpostavljaju da problem leži u sposobnostima rasuđivanja temeljnog modela. U stvarnosti, ograničene informacije koje pruža sučelje za dohvaćanje često su primarni ograničavajući faktor.
Istraživači na više sveučilišta predlažu tehniku tzv izravna interakcija korpusa (DCI) koji agentima omogućuje potpuno zaobilaženje modela ugradnje, pretražujući sirove korpuse izravno pomoću standardnih alata naredbenog retka.
Sadržaj objave
Granice klasičnog pronalaska
U klasičnim sustavima za pretraživanje kao što je RAG, dokumenti se dijele, pretvaraju u vektorske prikaze (ili ugradnje) i indeksiraju offline u vektorskoj bazi podataka. Kada AI sustav obradi upit, retriver filtrira cijelu bazu podataka kako bi vratio rang "vrh-k" popis isječaka dokumenta koji odgovaraju upitu. Svi dokazi moraju proći kroz ovaj mehanizam bodovanja prije nego što dođe do bilo kakvog razmišljanja.
Ali moderne agentske aplikacije zahtijevaju puno više. "Gusto pronalaženje je vrlo korisno za široko semantičko prisjećanje, ali kada agent mora riješiti zadatak u više koraka, često treba tražiti točne nizove, brojeve, verzije, kodove pogrešaka, staze datoteka ili rijetke kombinacije tragova," autori DCI rada rekli su u komentarima danim VentureBeatu. "Ovi dugački detalji su upravo ono gdje semantička sličnost može biti krhka."
Za razliku od statične pretrage, agenti također moraju dinamički revidirati svoje planove pretrage nakon promatranja djelomičnih ili lokaliziranih dokaza. Točna leksička ograničenja i pročišćavanje hipoteza u više koraka teško je izvršiti sa semantičkim retriverima. Budući da retriver sažima pristup u jedan korak, bilo koji kritični dokaz filtriran pretragom sličnosti ne može se kasnije vratiti, bez obzira na to koliko su napredne agentove mogućnosti rasuđivanja. Kako objašnjavaju autori, trenutni cjevovodi za dohvaćanje mogu postati usko grlo jer "prerano odlučuju što agent smije vidjeti."
Izravna interakcija korpusa
Ovaj izravan pristup rješava ključni problem u poslovnim okruženjima: zastarjelost podataka. Indeksi za ugrađivanje uvijek su snimka određenog trenutka u vremenu, a izgradnja i održavanje zahtijevaju dosta vremena i vremena.
"U mnogim poslovnim postavkama podaci nisu stabilna zbirka dokumenata. To su dnevna financijska izvješća, zapisi uživo, tiketi, obveze koda, konfiguracijske datoteke, vremenske crte incidenata i interni dokumenti koji se stalno mijenjaju," rekli su autori. DCI dopušta agentu da razmišlja o trenutnom stanju radnog prostora umjesto o jučerašnjem vektorskom indeksu.
Agent radi u okruženju sličnom terminalu gdje su njegova opažanja neobrađeni izlazi alata kao što su staze datoteka, podudarni rasponi teksta i okolne linije. Osnovnih alata koje nudi DCI je malo, ali vrlo izražajni. Agenti koriste naredbe poput “find” i “glob” za navigaciju strukturama direktorija i lociranje datoteka. Za točno podudaranje koriste “grep” i “rg” za lociranje određenih ključnih riječi, uzoraka regularnih izraza i točnih nizova. Kada je potrebna lokalna inspekcija, alati poput “head”, “tail”, “sed”, “cat” i lagane Python skripte omogućuju agentu da zaviri u kontekst koji okružuje podudaranje ili pročita određene odjeljke datoteke.
Agent može kombinirati ove alate putem shell cjevovoda kako bi izvršio složenu logiku pretraživanja u jednom koraku. Agent može propuštati naredbe za provođenje strogih leksičkih ograničenja, kao što je pretraživanje datoteke za jedan pojam i slanje izlaza za traženje drugog pojma. Može kombinirati više slabih tragova u korpusu pronalaženjem određene vrste datoteke, pretraživanjem ključne riječi kao što je "izvješće," i filtriranje za godinu dana kao "2024." Također može odmah potvrditi hipotezu pregledom točnih linija oko podudaranja ključne riječi.
DCI delegira semantičku interpretaciju izravno agentu umjesto da se oslanja na pretraživanje sličnosti temeljeno na ugrađivanju. Agent može formulirati hipoteze, testirati točne leksičke obrasce i izvući detaljne informacije koje bi tradicionalni semantički retriver mogli propustiti.
Istraživači predlažu dvije verzije ovog sustava. DCI-Agent-Lite dizajniran je kao lagana, jeftina instalacija izgrađena na GPT-5.4 nano modelu i ograničena isključivo na sirove terminalske interakcije poput bash naredbi i osnovnog čitanja datoteka. Budući da čitanje neobrađenih datoteka može brzo popuniti memoriju manjeg modela, ova se verzija oslanja na lagane strategije upravljanja kontekstom za vrijeme izvođenja kako bi se održalo istraživanje dugog horizonta.
DCI-Agent-CC je verzija s višim performansama, dizajnirana za timove s većim računalnim proračunom. Radi na Claude Code koji pokreće Claude Sonnet 4.6. Claude Code pruža jače upute, robusniju orkestraciju alata i superiorno ugrađeno rukovanje kontekstom, što poboljšava stabilnost agenta tijekom složenih pretraživanja u više koraka kroz heterogene skupove podataka.
DCI na djelu
Istraživači su testirali obje verzije DCI-ja preko referentnih vrijednosti agentskog pretraživanja kao što je BrowseComp-Plus, QA koji temelji na znanju s rezoniranjem s jednim i više skokova i rangiranjem pronalaženja informacija u zadacima koji zahtijevaju obrazloženje specifično za domenu i znanstvenu provjeru činjenica.
Testirali su DCI u odnosu na tri osnovne vrijednosti. Prvi je uključivao otvorene agente za dohvaćanje kao što je Search-R1 i vlasničke agente pokretane graničnim modelima kao što su GPT-5 i Claude Sonnet 4.6, uparene sa standardnim dohvatima. Druga osnovna linija uključivala je klasične rijetke retrivere kao što je BM25 i guste retrivere kao što su OpenAI’s text-embedding-3-large i Qwen3-Embedding-8B. Treća osnovna linija sastojala se od visokoučinkovitih rerankera usmjerenih na rezoniranje kao što su ReasonRank-32B i Rank-R1.
DCI je sustavno nadmašivao osnovne vrijednosti, prema istraživačima. Na složenoj referentnoj točki BrowseComp-Plus, zamjena tradicionalnog Qwen3 semantičkog retrivera za DCI na Claude Sonnet 4.6 okosnici poboljšala je točnost sa 69,0% na 80,0% dok je cijena API-ja smanjena sa 1440 USD na 1016 USD. Povrat ulaganja za laka sredstva također je bio primjetan. DCI-Agent-Lite s GPT-5.4 nano natjecao se s modelom OpenAI o3 koristeći tradicionalno dohvaćanje dok je smanjio troškove za više od 600 USD.
Na multi-hop QA benchmarkovima, DCI-Agent-CC dosegao je 83,0% prosječne točnosti, poboljšavajući najjaču osnovnu liniju za pronalaženje otvorene težine za 30,7 bodova, prema istraživačima.
Podaci pokazuju da DCI ima niži ukupni opoziv dokumenata od modela gustog ugrađivanja, ali nakon što pronađe relevantan dokument, iz njega izvlači znatno više vrijednosti.
"Kad bi voditelj umjetne inteligencije u poduzeću pitao gdje je DCI najkorisniji, ukazao bih na zadatke koji zahtijevaju točnu lokalizaciju dokaza u dinamičnom radnom prostoru: otklanjanje grešaka u proizvodnim incidentima, pretraživanje velikih baza koda, analiza dnevnika, istraživanje usklađenosti, revizijski tragovi ili analiza temeljnih uzroka s više dokumenata," napominju istraživači.
U jednom složenom zadatku dubinskog istraživanja, agent je morao identificirati određenu nogometnu utakmicu na temelju 12 međusobno povezanih tragova, uključujući točnu prisutnost, žute kartone i datume rođenja igrača. Tradicionalni retriver ne bi uspio izbacivanjem kratkih nepovezanih isječaka. Umjesto toga, DCI agent istražio je direktorij datoteka, pročitao određene retke izvješća utakmice Engleske protiv Belgije iz 1990. kako bi potvrdio točan broj zamjena, izvukao određeni citat iz datoteke intervjua i potvrdio točne datume rođenja dvojice igrača zavirujući u njihove tekstualne datoteke na Wikipediji. Ulančavanjem ovih jednostavnih naredbi, DCI osigurava da nijedan dokaz nije trajno izgubljen iza pogrešnog algoritma semantičkog pretraživanja.
Ograničenja i praktična primjena DCI-ja
DCI ima jasnu radnu omotnicu gdje se izvrsno skalira u dubini pretraživanja, ali ima problema sa širinom pretraživanja. Kada je eksperimentalni korpus proširen sa 100.000 na 400.000 dokumenata, točnost sustava značajno je pala, a prosječan broj poziva alata je porastao. Iako je DCI moćan kada se pronađe obećavajući dokument, trošak lociranja tog početnog korisnog sidrenog dokumenta naglo raste kako se povećava veličina prostora kandidata.
DCI također ima manje široko pamćenje dokumenata u usporedbi s modelima gustog ugrađivanja. Zamjenjuje iscrpan opoziv za lokalnu preciznost visoke razlučivosti. Ako tijek rada poduzeća striktno zahtijeva pronalaženje svakog pojedinog relevantnog dokumenta u velikom skupu podataka, DCI možda nije pravi alat.
Dodjela ekspresivnih alata agentu kao što je neograničena bash ljuska povećava kašnjenje i troškove izračuna zbog velike količine iterativnih poziva alata potrebnih za dovršenje pretraživanja. Također stvara značajne izazove upravljanja kontekstom i sigurnosti za IT odjele.
"Pozivi alata mogu vratiti velike rezultate; duge putanje mogu ispuniti kontekstni prozor; a sirovi terminalski pristup zahtijeva sandboxing, kontrolu dopuštenja i pažljivo projektiranje," rekli su autori. Kako bi upravljali prozorom konteksta, istraživači su otkrili da umjereno skraćivanje i sažimanje pomaže agentu da održi duža pretraživanja, dok pretjerano agresivno sažimanje ima tendenciju odbacivanja korisnih dokaza.
Zbog ove operativne realnosti, DCI nije zamišljen kao obvezna zamjena za postojeću vektorsku infrastrukturu. Umjesto toga, služi kao komplementarna.
"Za inženjere orkestracije i arhitekte podataka, naše je mišljenje da je najpraktičniji kratkoročni obrazac implementacije hibridni," rekli su autori. Semantičko pronalaženje još uvijek može omogućiti otkrivanje kandidata koji se dobro prisjećaju kada je korisnička namjera široka ili nedovoljno određena. "DCI tada može djelovati kao sloj preciznosti i verifikacije: agent može pretraživati unutar preuzetih dokumenata, proširiti ih u susjedne datoteke, provjeriti točna ograničenja i kombinirati slabe signale u dokumentima."
Istraživači su objavili kod za DCI pod dopuštenom licencom MIT-a.
"Dugoročno, DCI mijenja način na koji razmišljamo o poslovnim podacima. Podatke neće trebati samo pohranjivati za ljude ili indeksirati za tražilice; morat će se organizirati za agente koji mogu pregledavati, uspoređivati, grep, pratiti i verificirati," zaključuju autori. "Nazivi datoteka, vremenske oznake, stabilni identifikatori, metapodaci, povijest verzija i strojno čitljiva struktura postaju dio sučelja za dohvaćanje."
