Tijekom posljednja dva desetljeća tehnički dug značio je zastarjelu arhitekturu, neuredan kod i loše održavanu dokumentaciju. Ta definicija više nije dovoljna u eri umjetne inteligencije, gdje su načini kvarova suptilniji i često nelinearni. Sustavi umjetne inteligencije uvode nove slojeve tehničkog duga koji žive preko upita, modela i ovisnosti o podacima — čineći te slojeve manje vidljivima, težima za mjerenje i često opasnijim od tradicionalnog duga.
Sadržaj objave
Kriza koja se skriva naočigled
Složenost AI sustava i s njima povezani kvarovi dobro su dokumentirani. To je pokazalo istraživanje MIT-a iz 2025 95% AI projekata ne uspije postići proizvodnju ili isporučiti vrijednost. Slično istraživanje S&P Global Market Intelligence pokazalo je da 42% poduzeća odustalo je od više inicijativa umjetne inteligencije u 2025. — naglo povećanje u odnosu na 17% prethodne godine. Za te kvarove navode se različiti razlozi, ali većina njih ukazuje na loše dizajnirane i implementirane sustave kojima je složeno upravljati i imaju više točaka kvarova koje je teško pratiti, što dovodi do brzog gomilanja duga AI.
Tradicionalni tehnički dug bio je lokaliziran u bazu koda, a pogreške su se obično lako reproducirale. Posljedično, pogreške su se mogle lako identificirati tijekom testiranja i popraviti restrukturiranjem baze koda. Međutim, AI dug je mnogo više raspodijeljen, očitujući se kroz upite, modele, podatkovne kanale i svu povezanu infrastrukturu. Također je isprekidan: Zbog probabilističke prirode umjetne inteligencije, sustavi ne reagiraju uvijek na isti način, što dovodi do povremenih kvarova. Zbog toga je mnogo teže identificirati rizike tijekom testiranja, a također stvara potrebu za kontinuiranijim praćenjem čak i nakon postavljanja kako bi se spriječilo postupno odstupanje i pogoršanje performansi.
Novi oblici AI duga
AI dug se obično manifestira u četiri nova oblika, od kojih svaki dolazi sa svojim skupom rizika.
Brzi dug je najvidljiviji od njih. Moderna verzija “špageti koda”, to može uključivati nedokumentirana podešavanja upita, nagomilane upite za “brze popravke” koji dovode do nedosljednosti, zanemarenu kontrolu verzije upita i “natrpavanje upita” (trpanje suvišnih podataka ili konteksta izravno u upite umjetne inteligencije). Sve to u kombinaciji čini upite oblikom netipiziranog, neprovjerenog koda bez ikakve kontrole verzije, što dovodi do povećane osjetljivosti i ranjivosti.
Model duga ovisnosti je još jedan sve češći oblik AI duga. Većina poduzeća sada ovisi o mješavini vanjskih modela koje su razvili vodeći pružatelji temeljnih modela; aplikacije i agenti izgrađeni su na temelju API poziva tim modelima. Posljedično, logika aplikacije sada ovisi o modelima koji su vanjski u odnosu na jezgru sustava i koji se ne mogu jasno kontrolirati. Kako se modeli ažuriraju, izvedba varira i ponovljivost se gubi — upita podešeni za jedan model mogu biti neuspješni ili loše raditi kada se prebace na drugi model, bez obzira radi li se o ažuriranju istog ili drugog pružatelja.
Većina današnjih implementacija umjetne inteligencije u poduzećima koristi generiranje proširenog dohvaćanja (RAG), koje izvlači dodatni kontekst iz repozitorija poslovnih podataka. Povrat duga je posljedica toga što ta spremišta imaju neuredne podatke, duplicirane dokumente i zastarjele informacije. Zbog toga umjetna inteligencija vraća tehnički točne odgovore koji su zastarjeli i više nisu relevantni, uzrokujući nizvodne pogreške. Za razliku od halucinacija, ove je teže otkriti jer su bile točne, možda čak i donedavno, pa stoga svakom ispitivaču izgledaju ispravno.
Procjena duga odražava nedostatak standardizacije u testiranju i praćenju AI modela i aplikacija. Iako postoje referentne vrijednosti umjetne inteligencije, one se uglavnom fokusiraju na uske testove i odražavaju rezultate u određenom trenutku. Većini poduzeća nedostaju dosljedni standardi testiranja, skupovi temeljnih istinitih podataka i praćenje implementacije u stvarnom vremenu; još uvijek ne postoji ekvivalent kontinuiranoj integraciji/kontinuiranoj isporuci (CI/CD) za upite. Kao posljedica toga, CIO i CTO nemaju jasnu vidljivost izvedbe modela i ne mogu pratiti poboljšanja ili pogoršanja modela.
Sve je to dodatak tradicionalnim oblicima tehničkog duga, koji se još uvijek očituje u alatima i sustavima s kojima AI aplikacije i agenti komuniciraju, čitaju ili im pišu. Brzo povećanje prihvaćanja koda generiranog umjetnom inteligencijom (često raspoređenog bez neadekvatnog testiranja) dodatno pogoršava nedosljednosti unutar tradicionalnih baza koda i njihovu lošu mogućnost održavanja.
Novi oblici AI duga kombiniraju se s ovim ranijim oblicima tehničkog duga kako bi se brzo povećali i stvorili rizike velikih razmjera koji mogu prouzročiti katastrofalne neuspjehe cjelokupnih implementacija poduzeća. Rješavanje ovih rizika još je izazovnije zbog distribuirane prirode vlasništva umjetne inteligencije – većina sustava obuhvaća inženjering, proizvode, podatke i poslovne timove, što dovodi do nejasne odgovornosti kada se identificira pogreška.
Kao rezultat toga, ti se rizici očituju u obliku eskalacije računalnih troškova, netočnosti u rezultatima umjetne inteligencije i sve većim iznimkama koje moraju rješavati ljudi — što dovodi do toga da projekti često zastaju i propadaju zbog nejasnih priča o povratu ulaganja i nedostatka povjerenja korisnika.
Kako poduzeća mogu spriječiti dug AI
Dug AI neće se riješiti ‘boljim’ modelima — stope kvarova ostaju visoke unatoč tome što modeli već imaju visoku točnost. Rješenje duga umjetne inteligencije zahtijeva bolji dizajn sustava, integraciju, kontrole i promjene u organizacijskoj kulturi.
Prvo, upite treba tretirati kao kod. To uključuje pažljivu kontrolu verzija, dokumentaciju i rigorozno testiranje prije i nakon implementacije za sve moguće brze konfiguracije. Najbolje prakse iz tradicionalnog svijeta kodiranja – kao što je upotreba manjih blokova s uputama umjesto velikih zidova napunjenih s uputama ili smanjenje upotrebe tvrdo kodiranih parametara – također mogu pomoći u ublažavanju duga umjetne inteligencije.
Drugo, evaluacija mora biti ugrađena u cjelokupnu infrastrukturu umjetne inteligencije. Potrebno je uspostaviti kontinuirane kanale za evaluaciju i oni moraju odražavati široku paletu metrika mjereći tehničke i poslovne metrike. Osim toga, sustavi za promatranje AI trebali bi biti integrirani za praćenje kvalitete izlaza, stope kvarova, odstupanja modela i odstupanja podataka.
Treće, mogućnost objašnjenja trebala bi biti uključena prema zadanim postavkama u sve rezultate umjetne inteligencije kako bi se nadoknadila ograničena ponovljivost. Podrijetlo podataka, korišteni modeli i koraci koji se slijede trebaju biti jasno sljedivi kako bi se omogućila revizija rezultata i ispravak u slučaju bilo kakvih sistemskih grešaka.
To zahtijeva eksplicitne programe smanjenja dugova AI i povezane proračune, slično ranijim valovima ulaganja u sigurnost ili u modernizaciju oblaka. Njih treba voditi na razini CXO-a od strane ključnih vođa kako bi se spriječile kasnije skupe prerade.
Zaključak: ubod na vrijeme
Implementacije umjetne inteligencije u poduzećima nisu samo statični kod; oni su živi sustavi koji su u interakciji s cijelim nizom poduzeća. Kao rezultat toga, ključni izazov u agentskom poduzeću neće biti izgradnja ili implementacija inteligentnih sustava, nego održavanje tih sustava kako bi se osigurala kontinuirana pouzdanost tijekom rada u stvarnom svijetu.
Poduzeća koja nastoje proaktivno identificirati i ublažiti dug AI-ja od same faze dizajna najvjerojatnije će izgraditi održive AI platforme koje donose značajna dugoročna povećanja produktivnosti u cijeloj organizaciji.
Vikram je direktor tvrtke Cota Capital, gdje ulaže u poduzeća u ranoj fazi razvoja tehnologije i duboke tehnologije.
