Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Izvorno računalstvo u oblaku spremno je eksplodirati, zahvaljujući AI inferenciji

Novosti

Tomšić Damjan 18. studenoga 2025

dem10/iStock/Getty Images Plus

Pratite ZDNET: Dodajte nas kao željeni izvor na Googleu.


Sadržaj objave

  • 1 Ključni podaci ZDNET-a za van
  • 2 Povezani sadržaji

Ključni podaci ZDNET-a za van

  • CNCF je optimističan kada je u pitanju računalstvo u oblaku koje radi ruku pod ruku s umjetnom inteligencijom.
  • AI zaključivanje je tehnologija koja će zaraditi stotine milijardi za tvrtke koje su izvorne u oblaku.
  • Nove vrste AI-prvih oblaka, kao što su neooblaci, već se pojavljuju.

Na KubeCon Sjeverna Amerika 2025 u Atlanti, Cloud Native Computing Foundation (CNCF)Čelnici su predvidjeli ogroman porast računalstva u oblaku, potaknut eksplozivnim rastom radnih opterećenja zaključivanja umjetne inteligencije. Koliki rast? Predviđaju stotine milijardi dolara potrošnje u sljedećih 18 mjeseci.

AI zaključivanje je proces kojim obučeni veliki jezični model (LLM) primjenjuje ono što je naučio na nove podatke kako bi donosio predviđanja, odluke ili klasifikacije. U praksi, proces ide ovako. Nakon što je model obučen, recimo novi GPT 5.1, koristimo ga tijekom faze zaključivanja, gdje analizira podatke (poput nove slike) i proizvodi izlaz (identificirajući što je na slici) bez eksplicitnog programiranja za svaku novu sliku. Ova radna opterećenja zaključivanja premošćuju jaz između LLM-a i AI chatbota i agenata.

Također: Kubernetes, motor računalstva izvornog u oblaku, postaje turbopunjen za AI

Izvršni direktor CNCF-a Jonathan Bryce objasnio je na tiskovnoj konferenciji KubeCona da je AI zaključivanje “faza u kojoj uzimate taj model, služite modelu i odgovarate na pitanja, dajete predviđanja, unosite to u sustave kako biste preuzeli tu inteligenciju i povezali je sa svijetom.” Naglasio je da zaključivanje uključuje transformaciju obučenog AI modela u uslugu koja može odgovoriti na nova pitanja ili situacije.

Stvaranje LLM-a je nevjerojatno skupo. Prema Bryceu, Sam Altman, izvršni direktor OpenAI-ja, rekao je da GPT-5 trening može koštati i do milijardu dolara. Srećom, većina tvrtki, rekao je Bryce, ne trebaju, niti bi trebale čak pokušavati, izgraditi ogromne LLM-ove. Umjesto toga, trebali bi koristiti “stotine manjih, fino podešenih modela otvorenog koda za specifične zadatke, kao što su analiza raspoloženja, generiranje koda i pregled ugovora.” Osim toga, trebali bi koristiti zaključivanje kako bi maksimalno iskoristili prednosti svojih LLM-ova i manjih modela.

Bryce je nastavio da postoje deseci mehanizama za zaključivanje. Konkretno, pojavljuje se novi val mehanizama za zaključivanje u oblaku. Ovi motori uključuju KServe, NVIDIA NIM, Parasail.io, AIBrixi llm-d. Ono što im je svima zajedničko je da te platforme implementiraju, upravljaju i skaliraju AI u proizvodnji koristeći spremnike i Kubernetes.

Također: zašto čak i američki tehnološki div sada pokreće ‘suverenu potporu’ Europi

Prema CNCF-u, ovi specijalizirani modeli smetnji korisnicima nude višestruke prednosti. To uključuje:

  • Isplativost: znatno jeftiniji za rad i fino podešavanje.
  • Performanse: Brže i često preciznije za određenu domenu.
  • Jeftiniji hardver: Ne zahtijevaju najveće, najnovije i najoskudnije GPU-ove za zaključivanje.
  • Sigurnost i privatnost: Mogu biti hostirani sami, on-prem ili u oblaku.

Tamo gdje se računalstvo izvorno u oblaku i zaključivanje umjetne inteligencije spajaju kada AI više nije odvojena staza od računarstva izvorno u oblaku. Umjesto toga, radna opterećenja umjetne inteligencije, posebice zadaci zaključivanja, potiču novu eru u kojoj inteligentne aplikacije zahtijevaju skalabilnu i pouzdanu infrastrukturu.

Ta se era odvija jer, rekao je Bryce, “AI prelazi s nekoliko ‘superračunala za obuku’ na rašireno ‘Enterprise Inference’. Ovo je u osnovi problem izvorni za oblak. Vi, inženjeri platforme, ste ti koji ćete izgraditi platforme otvorenog koda koje otključavaju umjetnu inteligenciju poduzeća.”

Također: Kodiranje s AI? Mojih 5 najboljih savjeta za provjeru rezultata – i izbjegavanje problema

“Urođeni razvoj u oblaku i izvorni razvoj umjetne inteligencije stapaju se i trenutno se nalazimo na nevjerojatnom mjestu”, rekao je tehnički direktor CNCF-a Chris Aniszczyk. Podaci podupiru ovo mišljenje. Na primjer, Google je izvijestio da su njegovi interni poslovi zaključivanja nedavno obradili 1,33 kvadrilijuna tokena mjesečno, u odnosu na 980 trilijuna samo nekoliko mjeseci prije.

Doista, postoji nova vrsta oblaka, poznata kao neooblaciposvećen umjetnoj inteligenciji. Neoclouds se gotovo isključivo usredotočuje na isporuku GPU-a kao usluge (GPUaaS), gole performanse i infrastrukturu eksplicitno optimiziranu za obuku umjetne inteligencije i, što je najvažnije, zaključivanje.

Aniszczyk je dodao da se projekti izvorni u oblaku, posebno Kubernetes, prilagođavaju kako bi opsluživali radna opterećenja zaključivanja na razini: “Kubernetes je očito jedan od vodećih primjera od zadnjeg izdanja … značajka dinamičke dodjele resursa omogućuje GPU i TPU hardversku apstrakciju u kontekstu Kubernetesa.”

Kako bi bolje zadovoljio potražnju, CNCF je najavio Certified Kubernetes AI Conformance Program, čiji je cilj učiniti AI radna opterećenja jednako prenosivim i pouzdanim kao tradicionalne aplikacije u oblaku.

Također: poduzeća nisu spremna za svijet zlonamjernih AI agenata

“Kako umjetna inteligencija ulazi u proizvodnju, timovi trebaju konzistentnu infrastrukturu na koju se mogu osloniti”, rekao je Aniszczyk tijekom svog govora. “Ova će inicijativa stvoriti zajedničke zaštitne ograde kako bi se osiguralo da se radna opterećenja umjetne inteligencije ponašaju predvidljivo u svim okruženjima. Nadovezuje se na isti proces standarda vođen zajednicom koji smo koristili s Kubernetesom kako bismo pomogli u postizanju dosljednosti pri usvajanju umjetne inteligencije.”

Ono što svi ovi napori znače za poslovanje jest da će potrošnja AI zaključivanja na infrastrukturu i usluge izvorne u oblaku dosegnuti stotine milijardi u sljedećih 18 mjeseci. To je ulaganje zato što čelnici CNCF-a predviđaju da će se poduzeća utrkivati ​​u postavljanju pouzdanih, isplativih usluga umjetne inteligencije. Nisu oni jedini koji vide ovaj trend. Dominic Wilde, viši potpredsjednik distribucijske tvrtke Kubernetes Mirantisrekao je u intervjuu da će uskoro postojati usluge u oblaku Inference-as-a-Service.

Mislim da su ti stručnjaci u pravu. Postoji prirodna sinergija između umjetne inteligencije i izvornog računalstva u oblaku. Ova veza zauzvrat znači da tvrtke koje mogu najbolje iskoristiti uparivanje mogu očekivati ​​profit bilo da nude usluge izvorne u oblaku/AI ili ih koriste za poboljšanje vlastitih poslovnih planova.

Web izvor

Povezani sadržaji

  • Moja rutina Samsung sata od 30 sekundi omogućuje da sustav radi kao nov (i radi na većini modela)Moja rutina Samsung sata od 30 sekundi omogućuje da sustav radi kao nov (i radi na većini modela)
  • Jednostavna matematika iza kriptografije javnog ključaJednostavna matematika iza kriptografije javnog ključa
  • Nećete pronaći bolju ponudu za Galaxy Z Fold 7 od oveNećete pronaći bolju ponudu za Galaxy Z Fold 7 od ove
  • 10 najvažnijih priča o umrežavanju 202410 najvažnijih priča o umrežavanju 2024
  • Nintendo navijači sastavljaju glavni popis kojih igara se bolje odvija – ili još gore – na Switch 2Nintendo navijači sastavljaju glavni popis kojih igara se bolje odvija – ili još gore – na Switch 2
  • Twitter pticaŠto je Twitter?

Previous Article

Mučite se s praćenjem AI agenata? Ovaj alat otvorenog koda daje vam jedan izvor istine

Next Article

Sudar sa svemirskim otpadom ostavio 3 kineska astronauta zaglavljena u orbiti

Posljednje objave

Awesome Games Done Quick 2026 završava s 1,8 milijuna funti prikupljenih za Prevent Cancer Foundation i štafetom od 70 igrača u Super Mario 64 Replay

Awesome Games Done Quick 2026 završava s 1,8 milijuna funti prikupljenih za Prevent Cancer Foundation i štafetom od 70 igrača u Super Mario 64 Replay

Hutchison Ports dovršava privatnu 5G mrežu u britanskom čvorištu

Zašto vaš LLM račun eksplodira — i kako ga semantičko predmemoriranje može smanjiti za 73%

Zašto vaš LLM račun eksplodira — i kako ga semantičko predmemoriranje može smanjiti za 73%

Novosti

  • Awesome Games Done Quick 2026 završava s 1,8 milijuna funti prikupljenih za Prevent Cancer Foundation i štafetom od 70 igrača u Super Mario 64 Replay 12. siječnja 2026
  • Hutchison Ports dovršava privatnu 5G mrežu u britanskom čvorištu 11. siječnja 2026
  • Zašto vaš LLM račun eksplodira — i kako ga semantičko predmemoriranje može smanjiti za 73% 11. siječnja 2026
  • Crispr Pioneer pokreće startup za izradu prilagođenih tretmana uređivanja gena 11. siječnja 2026
  • Isključivanje ovih 7 uobičajenih kućanskih uređaja pomoglo mi je smanjiti račune za struju 11. siječnja 2026
  • Bixby se vratio, dušo 11. siječnja 2026
  • Poppy Playtime: Chapter 5 – Broken Things dobiva podnaslov i datum izlaska za PC, no igrači na konzoli morat će pričekati još malo 11. siječnja 2026
  • Ofcom postavlja planove za mobilni, Wi-Fi za dijeljenje gornjeg pojasa spektra od 6 GHz 10. siječnja 2026
  • Anthropic se bori protiv neovlaštene upotrebe Claudea od strane trećih proizvođača i rivala 10. siječnja 2026
  • Meta se veliko kladi na nuklearnu energiju s Okloom 10. siječnja 2026

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice