Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Zašto je vidljiva umjetna inteligencija SRE sloj koji nedostaje tvrtkama za pouzdane LLM-ove

Novosti

Zašto je vidljiva umjetna inteligencija SRE sloj koji nedostaje tvrtkama za pouzdane LLM-ove

Tomšić Damjan 30. studenoga 2025

Kako AI sustavi ulaze u proizvodnju, pouzdanost i upravljanje ne mogu ovisiti o priželjkivanim željama. Evo kako sposobnost promatranja pretvara velike jezične modele (LLM) u poslovne sustave koji se mogu revidirati i pouzdani.

Sadržaj objave

  • 1 Zašto vidljivost osigurava budućnost umjetne inteligencije poduzeća
  • 2 Počnite s ishodima, a ne s modelima
  • 3 Troslojni telemetrijski model za LLM promatranje
  • 4 Primijenite SRE disciplinu: SLO i proračuni pogrešaka za AI
  • 5 Izgradite tanki sloj vidljivosti u dva agilna sprinta
  • 6 Make evaluacije kontinuirane (i dosadne)
  • 7 Primijeniti hljudski nadzor tamo gdje je to važno
  • 8 Cost kontrolu kroz dizajn, a ne nadu
  • 9 Knjiga od 90 dana
  • 10 Skaliranje povjerenja kroz vidljivost
  • 11 Povezani sadržaji

Zašto vidljivost osigurava budućnost umjetne inteligencije poduzeća

Utrka poduzeća za implementaciju LLM sustava odražava rane dane usvajanja oblaka. Rukovoditelji vole obećanja; usklađenost zahtjeva odgovornost; inženjeri samo žele asfaltiranu cestu.

Ipak, ispod uzbuđenja, većina čelnika priznaje da ne mogu pratiti kako se donose odluke umjetne inteligencije, jesu li pomogle poslu ili su prekršile neko pravilo.

Uzmimo jednu banku s popisa Fortune 100 koja je postavila LLM za klasificiranje zahtjeva za kredit. Referentna točnost izgledala je sjajno. Ipak, 6 mjeseci kasnije, revizori su otkrili da je 18% kritičnih slučajeva pogrešno usmjereno, bez ijednog upozorenja ili traga. Osnovni uzrok nije bila pristranost ili loši podaci. Bilo je nevidljivo. Nema promatranja, nema odgovornosti.

Ako to ne možete promatrati, ne možete joj vjerovati. I neopažena umjetna inteligencija neće uspjeti u tišini.

Vidljivost nije luksuz; to je temelj povjerenja. Bez nje, umjetnom inteligencijom se ne može upravljati.

Počnite s ishodima, a ne s modelima

Većina korporativnih projekata umjetne inteligencije počinje tako što tehnološki čelnici odaberu model i, kasnije, definiraju metriku uspjeha. To je unatrag.

Preokreni redoslijed:

  • Najprije definirajte ishod. Koji je mjerljivi poslovni cilj?

    • Odbijte 15 % poziva koji se naplaćuju

    • Skratite vrijeme pregleda dokumenata za 60 %

    • Skratite vrijeme obrade predmeta za dvije minute

  • Dizajnirajte telemetriju oko tog ishoda, ne oko “preciznosti” ili “BLEU rezultata”.

  • Odaberite upite, metode dohvaćanja i modele koji dokazivo pomiču te KPI-ove.

Na primjer, u jednom globalnom osiguravatelju, preoblikovanje uspjeha u “ušteđene minute po zahtjevu” umjesto u “preciznost modela” pretvorilo je izolirani pilot u plan puta za cijelu tvrtku.

Troslojni telemetrijski model za LLM promatranje

Baš kao što se mikroservisi oslanjaju na zapise, metriku i tragove, AI sustavi trebaju strukturirani stog vidljivosti:

a) Upute i kontekst: Što je ušlo

  • Zabilježite svaki predložak upita, varijablu i dohvaćeni dokument.

  • Zabilježite ID modela, verziju, kašnjenje i broj tokena (vaši vodeći pokazatelji troškova).

  • Održavajte dnevnik redakcije koji se može revidirati i prikazuje koji su podaci maskirani, kada i prema kojem pravilu.

b) Politike i kontrole: zaštitne ograde

  • Zabilježite ishode sigurnosnog filtra (toksičnost, PII), prisutnost citata i okidače pravila.

  • Razlozi pravila trgovine i razina rizika za svaku implementaciju.

  • Povežite izlaze s karticom upravljačkog modela radi transparentnosti.

c) Ishodi i povratne informacije: Je li uspjelo?

  • Prikupite ljudske ocjene i uredite udaljenosti od prihvaćenih odgovora.

  • Pratite nizvodne poslovne događaje, slučaj zatvoren, dokument odobren, problem riješen.

  • Izmjerite KPI delte, vrijeme poziva, zaostatke, stopu ponovnog otvaranja.

Sva tri sloja povezuju se putem zajedničkog ID-a praćenja, omogućujući da se svaka odluka ponovi, revidira ili poboljša.

Dijagram © SaiKrishna Koorapati (2025). Stvoren posebno za ovaj članak; licenciran od strane VentureBeata za objavljivanje.

Primijenite SRE disciplinu: SLO i proračuni pogrešaka za AI

Inženjering pouzdanosti usluge (SRE) transformirao softverske operacije; sada je red na AI.

Definirajte tri “zlatna signala” za svaki kritični tijek rada:

Signal

Ciljani SLO

Kada se prekrši

Faktičnost

≥ 95 % potvrđeno prema izvoru zapisa

Povratak na provjereni predložak

Sigurnost

≥ 99,9 % prolazi filtre toksičnosti/PII

Karantena i ljudski pregled

Korisnost

≥ 80 % prihvaćeno pri prvom prolazu

Upit/model za ponovno uvježbavanje ili vraćanje

Ako halucinacije ili odbijanje premašuju proračun, sustav automatski usmjerava na sigurnije upite ili ljudski pregled baš kao što preusmjerava promet tijekom prekida usluge.

Ovo nije birokracija; to je pouzdanost primijenjena na rasuđivanje.

Izgradite tanki sloj vidljivosti u dva agilna sprinta

Ne treba vam šestomjesečni plan, samo fokus i dva kratka sprinta.

Sprint 1 (tjedni 1-3): Temelji

  • Promptni registar kontroliran verzijom

  • Srednji softver za uređivanje povezan s politikom

  • Zapisivanje zahtjeva/odgovora s ID-ovima praćenja

  • Osnovne evaluacije (provjere PII, prisutnost citata)

  • Jednostavno ljudsko korisničko sučelje (HITL).

Sprint 2 (tjedni 4-6): Zaštitne ograde i KPI

  • Offline setovi testova (100-300 pravih primjera)

  • Vrata politike za činjeničnost i sigurnost

  • Lagana nadzorna ploča koja prati SLO i troškove

  • Automatizirano praćenje tokena i latencije

Za 6 tjedana imat ćete tanki sloj koji odgovara na 90% pitanja o upravljanju i proizvodima.

Make evaluacije kontinuirane (i dosadne)

Evaluacije ne bi trebale biti herojske jednokratne; trebali bi biti rutinski.

  • Pripremite ispitne setove iz stvarnih slučajeva; osvježavanje 10–20 % mjesečno.

  • Definirajte jasne kriterije prihvaćanja koje dijele timovi za proizvode i rizike.

  • Pokrenite paket na svaki upit/promjenu modela/politike i tjedno za provjere promjene.

  • Svaki tjedan objavite jedinstvenu tablicu rezultata koja pokriva činjeničnost, sigurnost, korisnost i cijenu.

Kada su procjene dio CI/CD-a, one prestaju biti kazalište usklađenosti i postaju operativne provjere pulsa.

Primijeniti hljudski nadzor tamo gdje je to važno

Potpuna automatizacija nije ni realna ni odgovorna. Visokorizični ili dvosmisleni slučajevi trebali bi eskalirati ljudskom pregledu.

  • Usmjerite odgovore niske pouzdanosti ili odgovore označene pravilima stručnjacima.

  • Zabilježite svako uređivanje i razlog kao podatke o obuci i revizijski dokaz.

  • Vratite povratne informacije recenzenta u upite i pravila za kontinuirano poboljšanje.

U jednoj zdravstveno-tehnološkoj tvrtki ovaj je pristup smanjio lažno pozitivne rezultate za 22 % i proizveo skup podataka koji se može ponovno uvježbavati i koji je spreman za usklađenost u nekoliko tjedana.

Cost kontrolu kroz dizajn, a ne nadu

Troškovi LLM-a rastu nelinearno. Proračuni vas neće spasiti, arhitektura će.

  • Struktura traži tako da se deterministički odjeljci pokreću prije generativnih.

  • Komprimirajte i ponovno rangirajte kontekst umjesto izbacivanja cijelih dokumenata.

  • Predmemorirajte česte upite i pamtite izlaze alata pomoću TTL-a.

  • Pratite kašnjenje, propusnost i korištenje tokena po značajci.

Kada vidljivost pokriva tokene i kašnjenje, trošak postaje kontrolirana varijabla, a ne iznenađenje.

Knjiga od 90 dana

U roku od 3 mjeseca od usvajanja vidljivih načela umjetne inteligencije, poduzeća bi trebala vidjeti:

  • 1–2 proizvodna umjetna inteligencija pomaže s HITL-om za rubne slučajeve

  • Automatizirani paket za procjenu za rad prije postavljanja i noćna izvođenja

  • Tjedna tablica rezultata podijeljena na SRE, proizvod i rizik

  • Tragovi spremni za reviziju povezuju upite, politike i ishode

Kod klijenta s popisa Fortune 100 ova je struktura smanjila vrijeme incidenta za 40 % i uskladila planove proizvoda i sukladnosti.

Skaliranje povjerenja kroz vidljivost

Observable AI je način na koji AI pretvarate iz eksperimenta u infrastrukturu.

S jasnom telemetrijom, SLO-ovima i ljudskim povratnim informacijama:

  • Rukovoditelji stječu povjerenje potkrijepljeno dokazima.

  • Timovi za usklađenost dobivaju reproduktivne revizijske lance.

  • Inženjeri ponavljaju brže i šalju sigurno.

  • Korisnici doživljavaju pouzdanu, objašnjivu AI.

Opservabilnost nije dodatni sloj, to je temelj za povjerenje na razini.

SaiKrishna Koorapati je voditelj softverskog inženjeringa.

Pročitajte više od naših gostujućih pisaca. Ili razmislite o slanju vlastitog posta! Ovdje pogledajte naše smjernice.

Web izvor

Povezani sadržaji

  • Izvješće bežičnih operatera u SAD-u pokazuje da jedan operater apsolutno dominiraIzvješće bežičnih operatera u SAD-u pokazuje da jedan operater apsolutno dominira
  • Bt donijeti Gigabit širokopojasnu mrežu u teško dostupan područja zaljeva SwanseaBt donijeti Gigabit širokopojasnu mrežu u teško dostupan područja zaljeva Swansea
  • Samsung kriške 720 USD OFF Galaxy Z Flip 7Samsung kriške 720 USD OFF Galaxy Z Flip 7
  • Preispitivanje AI: DeepSeekova knjiga za reprodukciju trese visoko-potrošnju, visoko-kompovijetnu paradigmuPreispitivanje AI: DeepSeekova knjiga za reprodukciju trese visoko-potrošnju, visoko-kompovijetnu paradigmu
  • Samsung udara 1.140 dolara Off Galaxy S25 Ultra najbolja verzijaSamsung udara 1.140 dolara Off Galaxy S25 Ultra najbolja verzija
  • Sada živi 20+ najboljih radnih dana: Posljednja prilika za uštedu na Roborocku, Boseu i još mnogo togaSada živi 20+ najboljih radnih dana: Posljednja prilika za uštedu na Roborocku, Boseu i još mnogo toga

Previous Article

Lijek za mršavljenje Zepbound testira se kao lijek za dugi Covid

Next Article

Microsoft stvara okvir za sigurnu arhitekturu optičke mreže

Posljednje objave

Obožavatelji Fortnitea kažu “ne AI pomazi” nakon što su uočili ono za što vjeruju da su slike generirane umjetnom inteligencijom u igri

Obožavatelji Fortnitea kažu “ne AI pomazi” nakon što su uočili ono za što vjeruju da su slike generirane umjetnom inteligencijom u igri

Microsoft stvara okvir za sigurnu arhitekturu optičke mreže

Microsoft stvara okvir za sigurnu arhitekturu optičke mreže

Zašto je vidljiva umjetna inteligencija SRE sloj koji nedostaje tvrtkama za pouzdane LLM-ove

Zašto je vidljiva umjetna inteligencija SRE sloj koji nedostaje tvrtkama za pouzdane LLM-ove

Sadržaj

  • 1 Zašto vidljivost osigurava budućnost umjetne inteligencije poduzeća
  • 2 Počnite s ishodima, a ne s modelima
  • 3 Troslojni telemetrijski model za LLM promatranje
  • 4 Primijenite SRE disciplinu: SLO i proračuni pogrešaka za AI
  • 5 Izgradite tanki sloj vidljivosti u dva agilna sprinta
  • 6 Make evaluacije kontinuirane (i dosadne)
  • 7 Primijeniti hljudski nadzor tamo gdje je to važno
  • 8 Cost kontrolu kroz dizajn, a ne nadu
  • 9 Knjiga od 90 dana
  • 10 Skaliranje povjerenja kroz vidljivost

Novosti

  • Obožavatelji Fortnitea kažu “ne AI pomazi” nakon što su uočili ono za što vjeruju da su slike generirane umjetnom inteligencijom u igri 30. studenoga 2025
  • Microsoft stvara okvir za sigurnu arhitekturu optičke mreže 30. studenoga 2025
  • Zašto je vidljiva umjetna inteligencija SRE sloj koji nedostaje tvrtkama za pouzdane LLM-ove 30. studenoga 2025
  • Lijek za mršavljenje Zepbound testira se kao lijek za dugi Covid 30. studenoga 2025
  • Koliko RAM-a vaše računalo zapravo treba 2025. godine? Stručnjak za Windows i Mac računa 30. studenoga 2025
  • Samsung daje 71% popusta na Galaxy Watch 8 30. studenoga 2025
  • Hollow Knight: Silksong dev misli da će Clair Obscur: Expedition 33 osvojiti igru ​​godine: “Iznimna je i široko ukusna” 29. studenoga 2025
  • RailTel modernizira međugradske optičke mreže metroa diljem Indije 29. studenoga 2025
  • Anthropic kaže da je riješio dugogodišnji problem AI agenta s novim Claude SDK-om za više sesija 29. studenoga 2025
  • Kako izmjeriti polumjer Zemlje pomoću Lego kockica 29. studenoga 2025

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice