Izvorno računalstvo u oblaku spremno je eksplodirati, zahvaljujući AI inferenciji

dem10/iStock/Getty Images Plus

Pratite ZDNET: Dodajte nas kao željeni izvor na Googleu.

Ključni podaci ZDNET-a za van

CNCF je optimističan kada je u pitanju računalstvo u oblaku koje radi ruku pod ruku s umjetnom inteligencijom.
AI zaključivanje je tehnologija koja će zaraditi stotine milijardi za tvrtke koje su izvorne u oblaku.
Nove vrste AI-prvih oblaka, kao što su neooblaci, već se pojavljuju.

Na KubeCon Sjeverna Amerika 2025 u Atlanti, Cloud Native Computing Foundation (CNCF)Čelnici su predvidjeli ogroman porast računalstva u oblaku, potaknut eksplozivnim rastom radnih opterećenja zaključivanja umjetne inteligencije. Koliki rast? Predviđaju stotine milijardi dolara potrošnje u sljedećih 18 mjeseci.

AI zaključivanje je proces kojim obučeni veliki jezični model (LLM) primjenjuje ono što je naučio na nove podatke kako bi donosio predviđanja, odluke ili klasifikacije. U praksi, proces ide ovako. Nakon što je model obučen, recimo novi GPT 5.1, koristimo ga tijekom faze zaključivanja, gdje analizira podatke (poput nove slike) i proizvodi izlaz (identificirajući što je na slici) bez eksplicitnog programiranja za svaku novu sliku. Ova radna opterećenja zaključivanja premošćuju jaz između LLM-a i AI chatbota i agenata.

Također: Kubernetes, motor računalstva izvornog u oblaku, postaje turbopunjen za AI

Izvršni direktor CNCF-a Jonathan Bryce objasnio je na tiskovnoj konferenciji KubeCona da je AI zaključivanje “faza u kojoj uzimate taj model, služite modelu i odgovarate na pitanja, dajete predviđanja, unosite to u sustave kako biste preuzeli tu inteligenciju i povezali je sa svijetom.” Naglasio je da zaključivanje uključuje transformaciju obučenog AI modela u uslugu koja može odgovoriti na nova pitanja ili situacije.

Stvaranje LLM-a je nevjerojatno skupo. Prema Bryceu, Sam Altman, izvršni direktor OpenAI-ja, rekao je da GPT-5 trening može koštati i do milijardu dolara. Srećom, većina tvrtki, rekao je Bryce, ne trebaju, niti bi trebale čak pokušavati, izgraditi ogromne LLM-ove. Umjesto toga, trebali bi koristiti “stotine manjih, fino podešenih modela otvorenog koda za specifične zadatke, kao što su analiza raspoloženja, generiranje koda i pregled ugovora.” Osim toga, trebali bi koristiti zaključivanje kako bi maksimalno iskoristili prednosti svojih LLM-ova i manjih modela.

Bryce je nastavio da postoje deseci mehanizama za zaključivanje. Konkretno, pojavljuje se novi val mehanizama za zaključivanje u oblaku. Ovi motori uključuju KServe, NVIDIA NIM, Parasail.io, AIBrixi llm-d. Ono što im je svima zajedničko je da te platforme implementiraju, upravljaju i skaliraju AI u proizvodnji koristeći spremnike i Kubernetes.

Također: zašto čak i američki tehnološki div sada pokreće ‘suverenu potporu’ Europi

Prema CNCF-u, ovi specijalizirani modeli smetnji korisnicima nude višestruke prednosti. To uključuje:

Isplativost: znatno jeftiniji za rad i fino podešavanje.
Performanse: Brže i često preciznije za određenu domenu.
Jeftiniji hardver: Ne zahtijevaju najveće, najnovije i najoskudnije GPU-ove za zaključivanje.
Sigurnost i privatnost: Mogu biti hostirani sami, on-prem ili u oblaku.

Tamo gdje se računalstvo izvorno u oblaku i zaključivanje umjetne inteligencije spajaju kada AI više nije odvojena staza od računarstva izvorno u oblaku. Umjesto toga, radna opterećenja umjetne inteligencije, posebice zadaci zaključivanja, potiču novu eru u kojoj inteligentne aplikacije zahtijevaju skalabilnu i pouzdanu infrastrukturu.

Ta se era odvija jer, rekao je Bryce, “AI prelazi s nekoliko ‘superračunala za obuku’ na rašireno ‘Enterprise Inference’. Ovo je u osnovi problem izvorni za oblak. Vi, inženjeri platforme, ste ti koji ćete izgraditi platforme otvorenog koda koje otključavaju umjetnu inteligenciju poduzeća.”

Također: Kodiranje s AI? Mojih 5 najboljih savjeta za provjeru rezultata – i izbjegavanje problema

“Urođeni razvoj u oblaku i izvorni razvoj umjetne inteligencije stapaju se i trenutno se nalazimo na nevjerojatnom mjestu”, rekao je tehnički direktor CNCF-a Chris Aniszczyk. Podaci podupiru ovo mišljenje. Na primjer, Google je izvijestio da su njegovi interni poslovi zaključivanja nedavno obradili 1,33 kvadrilijuna tokena mjesečno, u odnosu na 980 trilijuna samo nekoliko mjeseci prije.

Doista, postoji nova vrsta oblaka, poznata kao neooblaciposvećen umjetnoj inteligenciji. Neoclouds se gotovo isključivo usredotočuje na isporuku GPU-a kao usluge (GPUaaS), gole performanse i infrastrukturu eksplicitno optimiziranu za obuku umjetne inteligencije i, što je najvažnije, zaključivanje.

Aniszczyk je dodao da se projekti izvorni u oblaku, posebno Kubernetes, prilagođavaju kako bi opsluživali radna opterećenja zaključivanja na razini: “Kubernetes je očito jedan od vodećih primjera od zadnjeg izdanja … značajka dinamičke dodjele resursa omogućuje GPU i TPU hardversku apstrakciju u kontekstu Kubernetesa.”

Kako bi bolje zadovoljio potražnju, CNCF je najavio Certified Kubernetes AI Conformance Program, čiji je cilj učiniti AI radna opterećenja jednako prenosivim i pouzdanim kao tradicionalne aplikacije u oblaku.

Također: poduzeća nisu spremna za svijet zlonamjernih AI agenata

“Kako umjetna inteligencija ulazi u proizvodnju, timovi trebaju konzistentnu infrastrukturu na koju se mogu osloniti”, rekao je Aniszczyk tijekom svog govora. “Ova će inicijativa stvoriti zajedničke zaštitne ograde kako bi se osiguralo da se radna opterećenja umjetne inteligencije ponašaju predvidljivo u svim okruženjima. Nadovezuje se na isti proces standarda vođen zajednicom koji smo koristili s Kubernetesom kako bismo pomogli u postizanju dosljednosti pri usvajanju umjetne inteligencije.”

Ono što svi ovi napori znače za poslovanje jest da će potrošnja AI zaključivanja na infrastrukturu i usluge izvorne u oblaku dosegnuti stotine milijardi u sljedećih 18 mjeseci. To je ulaganje zato što čelnici CNCF-a predviđaju da će se poduzeća utrkivati u postavljanju pouzdanih, isplativih usluga umjetne inteligencije. Nisu oni jedini koji vide ovaj trend. Dominic Wilde, viši potpredsjednik distribucijske tvrtke Kubernetes Mirantisrekao je u intervjuu da će uskoro postojati usluge u oblaku Inference-as-a-Service.

Mislim da su ti stručnjaci u pravu. Postoji prirodna sinergija između umjetne inteligencije i izvornog računalstva u oblaku. Ova veza zauzvrat znači da tvrtke koje mogu najbolje iskoristiti uparivanje mogu očekivati profit bilo da nude usluge izvorne u oblaku/AI ili ih koriste za poboljšanje vlastitih poslovnih planova.

Web izvor

Izvorno računalstvo u oblaku spremno je eksplodirati, zahvaljujući AI inferenciji

ByTomšić Damjan

Ključni podaci ZDNET-a za van

By Tomšić Damjan

30 godina kasnije, vratio sam se Enlightenment Linuxu da testiram Elive beta – i puno je bolja

Android ima tajni izbornik za ažuriranje za koji vjerojatno niste znali

Razvojni programer GTA 6 Rockstar Games ponovno je hakiran, ali inzistira na tome da je ovaj put kompromitirana samo “ograničena količina nematerijalnih informacija o tvrtki”

You missed

30 godina kasnije, vratio sam se Enlightenment Linuxu da testiram Elive beta – i puno je bolja

Android ima tajni izbornik za ažuriranje za koji vjerojatno niste znali

Razvojni programer GTA 6 Rockstar Games ponovno je hakiran, ali inzistira na tome da je ovaj put kompromitirana samo “ograničena količina nematerijalnih informacija o tvrtki”

Starlink preoblikuje satelitske komunikacije dok industrija ulazi u terabitnu eru

Izvorno računalstvo u oblaku spremno je eksplodirati, zahvaljujući AI inferenciji

ByTomšić Damjan

Ključni podaci ZDNET-a za van

By Tomšić Damjan

Related Post

30 godina kasnije, vratio sam se Enlightenment Linuxu da testiram Elive beta – i puno je bolja

Android ima tajni izbornik za ažuriranje za koji vjerojatno niste znali

Razvojni programer GTA 6 Rockstar Games ponovno je hakiran, ali inzistira na tome da je ovaj put kompromitirana samo “ograničena količina nematerijalnih informacija o tvrtki”

You missed

30 godina kasnije, vratio sam se Enlightenment Linuxu da testiram Elive beta – i puno je bolja

Android ima tajni izbornik za ažuriranje za koji vjerojatno niste znali

Razvojni programer GTA 6 Rockstar Games ponovno je hakiran, ali inzistira na tome da je ovaj put kompromitirana samo “ograničena količina nematerijalnih informacija o tvrtki”

Starlink preoblikuje satelitske komunikacije dok industrija ulazi u terabitnu eru