Fino podešavanje zaboravlja. RAG propušta kontekst. Hipermreže grade model koji vaš agent treba na zahtjev.

Timovi poduzeća stalno promatraju kako se događa ista stvar. Agent umjetne inteligencije lijepo demonstrira, ide u proizvodnju i staje: radi kratko vrijeme, zatim treba čovjeka da dopuni njegov kontekst i provjeri njegov rezultat, a obećana učinkovitost odlazi u nadzor. Agent je obavio posao; ti si gledao. To je jedan od razloga zašto se toliko pilot-agenta nikad ne pretvori u proizvodne sustave.

Pitch s druge strane tog zida je ono u što svaki tim želi vjerovati: agent koji sam obavlja dug posao, preko noći ako mora, i prepušta osobi da potvrdi samo zadnjih 10%. Je li to moguće postići predstavlja problem koji razgovor o orkestraciji uglavnom preskače. Kad je AI tvrtka Chroma testirala 18 vodećih modela, svaki je izgubio točnost kako je njegov unos rastaosvojstvo kako pažnja funkcionira, a ne praznina koju jači model zatvara. Agent koji hrani sve više i više vašeg poslovanja dok ono radi ne postaje stabilnije. Postaje drhtavije.

Ovo je sloj ispod utrke orkestracije. Usmjeravanje, trajno izvršenje i mogućnost promatranja pretpostavljaju da je svaki agent već dovoljno kompetentan za koordinaciju. Dublje pitanje je koliko dugo agent može raditi prije nego što čovjek mora uskočiti, a to se svodi na to gdje znanje vaše tvrtke živi u odnosu na model. Oba standardna popravka ostavljaju čovjeka u petlji.

Sadržaj objave

1 Zašto vas podučavanje modela vaše tvrtke drži u toku
2 Treći put: generirajte specijalistički model na zahtjev
3 Usporedba ova tri pristupa
4 Zašto model izgrađen na hipermreži podiže gornju granicu autonomije
5 Gdje se treći put lomi
6 Što graditi i što pitati prije kupnje

Zašto vas podučavanje modela vaše tvrtke drži u toku

Frontier modeli postaju sve sposobniji, a jaz se ne smanjuje, jer to nije problem sposobnosti. Radi se o tome gdje se vaše znanje nalazi u odnosu na model, a poduzeća su imala dva načina da ga tamo smjeste.

Prvi je fino ugađanje, koje stavlja znanje u težine. Ostaje podložan katastrofalnom zaboravu, problemu identificiranom 1980-ih i još uvijek neriješeno u 2026: podučavanje modela nečemu novom ima tendenciju potkopavanja onoga što je već znao. Timovi to zaobilaze izoliranjem svakog zadatka u vlastitom fino podešenom modelu ili adapteru, što proizvodi veliki broj modela koji povećava troškove i režijske troškove upravljanja. A fino podešeni model je snimka, ustajala onog dana kada se politika promijeni, kada skupi, spori ciklus prekvalifikacije počne ispočetka.

Drugo je učenje u kontekstu, koje preskače ponovnu obuku postavljanjem relevantnih pravila u upit za vrijeme izvođenja. Ovdje grize trulež konteksta. Dohvaćanje sužava ono što ulazi u prompt, ali promašaj dohvaćanja izgleda identično pouzdanom odgovoru, a i cijena i latencija rastu sa svakim dodanim tokenom.

Dva se neuspjeha rimuju. Uz fino podešavanje, model može pouzdano raditi u skladu s politikom iz prošlog kvartala. Uz učenje u kontekstu, može pouzdano raditi na detaljima koje je izgubio usred dugog odziva. U svakom slučaju izlaz izgleda jednako siguran, tako da ne možete reći koji su dijelovi pogrešni bez provjere svih. Zato čovjek nikada ne može otići. Neki timovi često pokreću oboje odjednom, fino podešavajući stabilno znanje i vraćajući ostatak. To ublažava svaki kvar, ali ne uklanja nijedan: na bilo kojem izlazu još uvijek ne možete biti sigurni da je model aktualan i radi iz pravog konteksta, pa ga i dalje provjeravate.

Treći put: generirajte specijalistički model na zahtjev

Treći pristup je prelazak s istraživanja na rane proizvode. Umjesto ponovne obuke jednog modela ili punjenja njegovog prompta, generator gradi mali model specifičan za zadatak na zahtjev vaših pravila, u vrijeme zaključivanja. Generator je hipermreža: mreža čiji su izlaz težine druge mreže.

Ideja je bila imenovan 2016; njegova primjena za izradu specijaliziranih jezičnih modela iz teksta ili dokumenata nedavno je i aktivna. Sakana AI Text-to-LoRApredstavljen na ICML 2025, generira model adaptera iz opisa jednostavnog jezika u jednom prolazu, a 2026 sustav nazvan SHINE poziva hipermrežnu adaptaciju nova granica koja obećavaupravo zato što zaobilazi i trošak prekvalifikacije finog podešavanja i ograničenja konteksta sumptinga.

Svrha generiranja adaptera umjesto njihovog obučavanja i pohranjivanja je sažimanje velike knjižnice LoRA-ova po zadatku u jednu mrežu koja ih može proizvesti na zahtjev, uključujući i zadatke koje nije vidjela.

Elegantno je kako se ovim zatvara petlja gore navedenog problema: timovi adaptera za svaki zadatak ručno izrađuju kako bi izbjegli katastrofalno zaboravljanje da je isti objekt koji hipermreža proizvodi automatski. Model zoološkog vrta prestaje biti glavobolja upravljanja i postaje generirani rezultat.

Argument za skraćivanje ispod svega ovoga najizravnije je stavljen u dokument iz 2025 Nvidijini istraživači: za uske, repetitivne zadatke koji ispunjavaju tijekove rada agenata, mali modeli su dovoljno sposobni i 10 do 30 puta jeftiniji za pokretanje od graničnih generalista. Nace.AI, tvrtka iz Palo Alta koja je podigla a Početni krug od 21,5 milijuna dolara u svibnjunajjasniji je komercijalni primjer. Njegova temeljna tehnologija, generator koji naziva MetaModel, proizvodi prilagodbe parametara za model u vrijeme zaključivanja iz politika poduzeća, usmjerenih na regulirani rad: revizija, sukladnost, procjena rizika. Tvrtka kaže da njezini agenti obrađuju većinu tijeka rada dok ljudski stručnjaci potvrđuju rezultate, što je podijeljeno na tržište kao 90/10.

Usporedba ova tri pristupa

	Fino podešavanje	U kontekstu / RAG	Model generiran hipermrežom
Tamo gdje živi poslovno znanje	U težini modela	U upitu, ponovno isporučen svaki rad	U težinama generiranim na zahtjev
Trošak ažuriranja promjene pravila	Visoka: prekvalifikacija	Nisko: uredite izvor	Nisko: regenerirati
Pretreniranost	Visoko: snimka	Niska	Nisko: obnovljeno iz trenutne politike
Trošak i kašnjenje po pozivu	Niska	Visoko, raste s kontekstom	Nizak tijekom rada
Dominantni način kvara	Zaboravljanje; model-zoo sprawl	Truljenje konteksta; silent retrieval miss	Kvaliteta generatora; kalibriranje
Tko je vlasnik imovine koja se poboljšava	Tko god trenira model	Tko god drži pohranu podataka	Ovisi gdje se generator i povratna informacija nalaze

Zašto model izgrađen na hipermreži podiže gornju granicu autonomije

Model koji je uzak, aktualan i malen ima manju površinu na kojoj se može griješiti. Manje pogrešaka, ograničenih na poznatu domenu, znači manje izlaza koje agent mora eskalirati osobi, što je stvarna osnova za svaku tvrdnju o visokoj autonomiji. Odatle dolazi i broj poput 90/10: ne unaprijed postavljen brojčanik, već rezultat toga koliko malo sustav treba vratiti. Prijavljene udjele autonomije najbolje je čitati kao mjerenje arhitekture, a ne kao postavke.

Dva izbora dizajna odlučuju je li ta autonomija pouzdana ili samo brza. Prvi je uzemljenje: povezivanje svakog izlaza s njegovim izvorom kako bi recenzent mogao provjeriti, a ne ponoviti. Istraživački modeli izgrađeni upravo za to, kao što su HalluGuardoznačiti svaku tvrdnju kao potkrijepljenu ili ne i citirati odlomak na koji su se oslanjali. Nace svojim agentima šalje modele uzemljenja i tragove razmišljanja iz istog razloga. Pregled od 10% znači nešto samo ako čovjek može potvrditi porijeklo u nekoliko sekundi.

Drugi je krug povratnih informacija i nameće pitanje koje bi svaki kupac trebao postaviti: kada vaši stručnjaci potvrde rezultate, čiji se model poboljšava i gdje živi? To odlučuje hoće li složena imovina pripada dobavljaču ili vama. Aranžmani se razlikuju. Nace, na primjer, koristi vanjsku mrežu certificiranih stručnjaka za neke angažmane i, za izravnu implementaciju poduzeća, vlastito osoblje korisnika, s rezultirajućim modelom koji se čuva unutar klijentovog oblaka. Svaki izbor usmjerava učenje i vlasništvo negdje drugdje.

Gdje se treći put lomi

Pristup je još rano, a nekoliko pitanja će odlučiti koliko daleko ide. Kalibracija je okosnica: vrijednost počiva na modelu koji zna kada nije siguran. I doista je nesigurno, nedavni rad na generiranju ovih adaptera otkrio je da oni ne poboljšavaju automatski kalibraciju u odnosu na obično fino podešavanje, s dobicima koji se pojavljuju samo pod određenim ograničenjima.

Kvaliteta generiranog modela također uvelike ovisi o podacima o politici iz kojih je izgrađen, što stavlja premiju na upravljanje podacima. A opseg je otvorena granica istraživanja, hipermreže koje su do sada prikazane u objavljenim radovima bile su male. Ovdje Naceov vlastiti rad postaje zanimljiv: u našem intervjuu tvrtka je rekla da je skalirala svoj generator daleko iznad onih objavljenih veličina i izvela zakon skaliranja za to kako izvedba raste, rezultate je počela javno dijeliti i sada ih provjerava. Ako izdrži, pomoglo bi odgovoriti na jedno od središnjih otvorenih pitanja u tom području, a to je rad vrijedan pažnje.

Koji god pristup pobijedi, posao i dalje završava na čovjeku, a ta primopredaja je vlastiti problem dizajna. Kad je Deloitte Australia dostavio vladino izvješće vrijedno otprilike 440.000 australskih dolara, to je isporučen s izmišljenim citatima i izmišljenim sudskim citatom nakon što je prošao viši pregled, jer su recenzenti provjeravali zaključke, koji su bili valjani, a ne provenijenciju, koja nije bila. Kontrolirana istraživanja sugeriraju da je obrazac općenit: stručnjaci rjeđe ispravljao identičnu pogrešnu preporuku kada je označena kao generirana umjetnom inteligencijom.

EU AI Act’s Članak 14 sada imenuje ovu pristranost automatizacije. Lekcija se ne odnosi ni na jednog dobavljača: visok udio autonomije koncentrira ljudsku pozornost na tanki, kasni dio posla, tako da vrijednost tog pregleda u potpunosti ovisi o tome može li čovjek brzo provjeriti porijeklo, što se vraća na uzemljenje.

Što graditi i što pitati prije kupnje

Iskreni zaključak: ono što sputava vaše agente obično nije orkestracija ili veličina modela, već poznaje li model vaš posao dovoljno dobro da ga ostavite na miru, a pravo rješenje ovisi o poslu. Za automatizaciju dugog, ponavljajućeg, opsežnog procesa od kraja do kraja, pokretanje većine interne revizije preko noći i davanje vlastitim stručnjacima da provjere konačni isječak, model generiran hipermrežom je pristup koji će najvjerojatnije učiniti jeftino i trajati dovoljno dugo da bude važan. Za kratki zadatak koji se završava u nekoliko koraka i koji nikada ne mora raditi bez nadzora, jaz između ovog i dobro upućenog graničnog modela smanjuje se gotovo na nulu i nije vrijedan troškova integracije.

Kada dobavljač predstavlja autonomne ili specijalizirane agente, četiri pitanja ga presijecaju.

Gdje živi poslovno znanje: u težinama, brzo ili generirano na zahtjev?
Što dolazi sa svakim izlazom, tako da ga recenzent može provjeriti umjesto da ga ponovno radi?
Što odlučuje koji će posao eskalirati na čovjeka?
I čiji se model poboljšava iz te povratne informacije i gdje se izvodi?

Odgovori, a ne omjer naslova, govore vam što kupujete.

Hipermrežni pristup dosad je najvjerodostojniji pokušaj da se mali model upozna s određenim poslom, a da ga ne zaboravi i bez ponovnog objašnjavanja pri svakom pokretanju. Također je najmanje dokazan, a dijelovi koji su najvažniji, kalibracija i ljestvica, još uvijek su u recenziji. Za pravi posao, pilotirajte sada. Za pogrešnog, cijenom integracije dobivate malo što dobro upućeni granični model ne bi.

Web izvor

Fino podešavanje zaboravlja. RAG propušta kontekst. Hipermreže grade model koji vaš agent treba na zahtjev.

ByTomšić Damjan

Zašto vas podučavanje modela vaše tvrtke drži u toku

Treći put: generirajte specijalistički model na zahtjev

Usporedba ova tri pristupa

Zašto model izgrađen na hipermreži podiže gornju granicu autonomije

Gdje se treći put lomi

Što graditi i što pitati prije kupnje

By Tomšić Damjan

Cjepivo protiv ebole koje najviše obećava stoji na polici već 15 godina

Korisnici Linuxa suočavaju se s glavoboljom Microsoft Secure Boot – evo lijeka protiv bolova

Google Home Speaker naspram Amazon Echo Dot Max: Usporedio sam pametna čvorišta od 99 USD prema specifikacijama

You missed

Fino podešavanje zaboravlja. RAG propušta kontekst. Hipermreže grade model koji vaš agent treba na zahtjev.

Cjepivo protiv ebole koje najviše obećava stoji na polici već 15 godina

Korisnici Linuxa suočavaju se s glavoboljom Microsoft Secure Boot – evo lijeka protiv bolova

Google Home Speaker naspram Amazon Echo Dot Max: Usporedio sam pametna čvorišta od 99 USD prema specifikacijama

Fino podešavanje zaboravlja. RAG propušta kontekst. Hipermreže grade model koji vaš agent treba na zahtjev.

ByTomšić Damjan

Zašto vas podučavanje modela vaše tvrtke drži u toku

Treći put: generirajte specijalistički model na zahtjev

Usporedba ova tri pristupa

Zašto model izgrađen na hipermreži podiže gornju granicu autonomije

Gdje se treći put lomi

Što graditi i što pitati prije kupnje

By Tomšić Damjan

Related Post

Cjepivo protiv ebole koje najviše obećava stoji na polici već 15 godina

Korisnici Linuxa suočavaju se s glavoboljom Microsoft Secure Boot – evo lijeka protiv bolova

Google Home Speaker naspram Amazon Echo Dot Max: Usporedio sam pametna čvorišta od 99 USD prema specifikacijama

You missed

Fino podešavanje zaboravlja. RAG propušta kontekst. Hipermreže grade model koji vaš agent treba na zahtjev.

Cjepivo protiv ebole koje najviše obećava stoji na polici već 15 godina

Korisnici Linuxa suočavaju se s glavoboljom Microsoft Secure Boot – evo lijeka protiv bolova

Google Home Speaker naspram Amazon Echo Dot Max: Usporedio sam pametna čvorišta od 99 USD prema specifikacijama