Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Od sjajnog predmeta do trezvene stvarnosti: priča o vektorskoj bazi podataka, dvije godine kasnije

Novosti

Od sjajnog predmeta do trezvene stvarnosti: priča o vektorskoj bazi podataka, dvije godine kasnije

Tomšić Damjan 17. studenoga 2025

Kad sam prvi put napisao “Vektorske baze podataka: Sindrom sjajnog predmeta i slučaj nestalog jednoroga” u ožujku 2024. industrija je bila preplavljena pompom. Vektorske baze podataka pozicionirane su kao sljedeća velika stvar — sloj infrastrukture koji morate imati za eru gen AI. Milijarde poduzetničkih dolara su tekle, programeri su požurili integrirati ugradnje u svoje projekte, a analitičari su bez daha pratili runde financiranja za Šišarka, Tkati, Chroma, Milvus i desetak drugih.

Obećanje je bilo opojno: konačno, način pretraživanja po značenju, a ne po krhkim ključnim riječima. Samo prebacite svoje poslovno znanje u vektorsku trgovinu, povežite LLM i gledajte kako se događa magija.

Osim što se magija nikada nije u potpunosti ostvarila.

Dvije godine kasnije, provjera stvarnosti je stigao: 95% organizacija koje su uložile u inicijative gen AI ne bilježe nulti mjerljivi povrat. I mnoga upozorenja koja sam tada iznio – o ograničenjima vektora, prenatrpanom krajoliku dobavljača i rizicima tretiranja vektorskih baza podataka kao srebrnih metaka – odigrala su se gotovo točno kako je predviđeno.

Sadržaj objave

  • 1 Predviđanje 1: Nestali jednorog
  • 2 Predviđanje 2: Vektori sami po sebi neće uspjeti
  • 3 Predviđanje 3: Prepuno polje postaje roba
  • 4 Nova stvarnost: Hybrid i GraphRAG
  • 5 Mjerila i dokazi
  • 6 Što ovo znači naprijed
  • 7 Gledajući unaprijed: Što je sljedeće
  • 8 Od sjajnih objekata do bitne infrastrukture
    • 8.1 Povezani sadržaji

Predviđanje 1: Nestali jednorog

Tada sam se zapitao hoće li Pinecone — poster dijete ove kategorije — postići status jednoroga ili će postati “jednorog koji nedostaje” u svijetu baza podataka. Danas je na to pitanje odgovoreno na najrječitiji mogući način: Šišarka je navodno istražuje prodajukoji se bori za proboj usred oštre konkurencije i odljeva kupaca.

Da, Pinecone je podigao velike krugove i potpisao šatorske logotipe. Ali u praksi, diferencijacija je bila tanka. Igrači otvorenog koda kao što su Milvus, Qdrant i Chroma potkopavaju ih po pitanju troškova. Postojeći proizvođači poput Postgresa (sa pgVektor) i Elasticsearch su jednostavno dodali vektorsku podršku kao značajku. A kupci su sve češće pitali: “Zašto uvoditi potpuno novu bazu podataka kada moj postojeći stog već radi dovoljno dobro s vektorima?”

Rezultat: Šišarka, nekoć procijenjena na milijardu dolara, sada traži dom. Zaista nestali jednorog. U rujnu 2025. Pinecon je imenovao Asha Ashutosha kao izvršni direktor, a osnivač Edo Liberty prelazi na mjesto glavnog znanstvenika. Tajming govori: Promjena vodstva dolazi usred sve većeg pritiska i pitanja vezanih uz njegovu dugoročnu neovisnost.

Predviđanje 2: Vektori sami po sebi neće uspjeti

Također sam tvrdio da vektorske baze podataka same po sebi nisu konačno rješenje. Ako vaš slučaj upotrebe zahtijeva točnost – poput traženja “pogreške 221” u priručniku – čisto vektorsko pretraživanje radosno bi poslužilo “pogrešku 222” kao “dovoljno blizu”. Sladak u demou, katastrofalan u produkciji.

Ta napetost između sličnosti i relevantnosti pokazala se kobnom za mit o vektorskim bazama podataka kao višenamjenskim strojevima.

“Poduzeća su na teži način otkrila da je semantika ≠ točna.”

Programeri koji su radosno zamijenili leksičko pretraživanje vektorima brzo su ponovno uveli… leksičko pretraživanje u kombinaciji s vektorima. Timovi koji su očekivali da vektori “samo rade” završili su na filtriranju metapodataka, rerankeri i ručno podešena pravila. Do 2025. konsenzus je jasan: Vektori su moćni, ali samo kao dio hibridnog skupa.

Predviđanje 3: Prepuno polje postaje roba

Eksplozija pokretanja vektorskih baza podataka nikad nije bila održiva. Weaviate, Milvus (preko Zilliza), Chroma, Vespa, Qdrant — svaki je tvrdio da ima suptilne diferencijatore, ali većini kupaca svi su činili istu stvar: pohranjivali vektore i dohvaćali najbliže susjede.

Danas se vrlo malo tih igrača probija. Tržište je rascjepkano, komodificirano i na mnoge načine progutano od strane postojećih kompanija. Pretraživanje vektora sada je značajka potvrdnog okvira u podatkovnim platformama u oblaku, a ne samostalni jarak.

Kao što sam tada napisao: razlikovanje jednog vektorskog DB-a od drugog predstavljat će sve veći izazov. Taj je izazov samo postao teži. Vald, Marko, LanceDB, PostgresSQL, MySQL HeatWave, Oracle 23c, Azure SQL, Kasandra, Redis, Neo4j, SingleStore, ElasticSearch, OpenSearch, Apahce Solr… popis se nastavlja.

Nova stvarnost: Hybrid i GraphRAG

Ali ovo nije samo priča o padu – to je priča o evoluciji. Iz pepela vektorskog hypea pojavljuju se nove paradigme koje kombiniraju najbolje od višestrukih pristupa.

Hibridno pretraživanje: ključna riječ + vektor sada je zadana postavka za ozbiljne aplikacije. Tvrtke su naučile da trebate i preciznost i nejasnoću, točnost i semantiku. Alati kao što su Apache Solr, Elasticsearch, pgVector i vlastito “kaskadno dohvaćanje” Pineconea prihvaćaju ovo.

GraphRAG: Najpopularnija riječ kasne 2024./2025. je GraphRAG — proširena generacija dohvaćanja s poboljšanim grafikonima. Spajajući vektore s grafovima znanja, GraphRAG kodira odnose između entiteta koje samo ugrađivanje izravnava. Isplata je dramatična.

Mjerila i dokazi

  • Amazonov AI blog navodi mjerila iz Lettriagdje je hibridni GraphRAG povećao točnost odgovora s ~50% na više od 80% u testnim skupovima podataka u financijama, zdravstvu, industriji i pravu.

  • The GraphRAG-Bench benchmark (objavljen u svibnju 2025.) pruža rigoroznu procjenu GraphRAG-a u odnosu na vanilla RAG kroz zadatke rasuđivanja, upite s više skokova i izazove domene.

  • An OpenReview procjena RAG-a u odnosu na GraphRAG otkrili da svaki pristup ima prednosti ovisno o zadatku – ali hibridne kombinacije često imaju najbolje rezultate.

  • FalkorDB blog izvještava da kada je preciznost sheme važna (strukturirane domene), GraphRAG može nadmašiti dohvaćanje vektora za faktor ~3,4x na određenim referentnim vrijednostima.

Uspon GraphRAG-a naglašava veću poantu: Retrieval se ne odnosi ni na jedan sjajni predmet. Radi se o izgradnji sustavi za pronalaženje — slojeviti, hibridni cjevovodi svjesni konteksta koji daju LLM-ima prave informacije, s pravom preciznošću, u pravo vrijeme.

Što ovo znači naprijed

Presuda glasi: vektorske baze podataka nikad nisu bile čudo. Oni su bili korak – važan – u evoluciji traženja i pronalaženja. Ali oni nisu, i nikada nisu bili, kraj igre.

Pobjednici u ovom prostoru neće biti oni koji vektore prodaju kao samostalnu bazu podataka. Oni će biti ti koji ugrađuju vektorsko pretraživanje u šire ekosustave — integrirajući grafikone, metapodatke, pravila i inženjering konteksta u kohezivne platforme.

Drugim riječima: jednorog nije vektorska baza podataka. Jednorog je hrpa za preuzimanje.

Gledajući unaprijed: Što je sljedeće

  • Objedinjene podatkovne platforme uključit će vektor + graf: Očekujte da će veliki dobavljači baza podataka i oblaka ponuditi integrirane skupove za dohvaćanje (vektor + grafikon + cijeli tekst) kao ugrađene mogućnosti.

  • “Inženjering pronalaska” pojavit će se kao zasebna disciplina: Kao što su MLO-ovi sazrijevali, tako će i praksa oko ugrađivanja podešavanja, hibridnog rangiranja i konstrukcije grafikona.

  • Meta-modeli uče bolje postavljati upite: Budući LLM-i mogu naučiti kako biste odredili koju metodu dohvaćanja koristiti po upitu, dinamički prilagođavajući ponderiranje.

  • Vremenski i multimodalni GraphRAG: Istraživači već proširuju GraphRAG kako bi bio svjestan vremena (T-GRAG) i multimodalno unificirani (npr. povezivanje slika, teksta, videa).

  • Otvorene referentne vrijednosti i slojevi apstrakcije: Alati poput BenchmarkQED (za RAG benchmarking) i GraphRAG-Bench će gurnuti zajednicu prema pravednijim, usporedivo mjerenim sustavima.

Od sjajnih objekata do bitne infrastrukture

Krug priče o vektorskoj bazi podataka slijedio je klasičan put: sveprisutni ciklus hype, praćen introspekcijom, ispravljanjem i sazrijevanjem. U 2025. vektorska pretraga više nije sjajni objekt za kojim svi slijepo tragaju — sada je kritični sastavni dio unutar sofisticiranije, višestruke arhitekture pretraživanja.

Prvotna upozorenja bila su točna. Čiste vektorske nade često se ruše na plićacima preciznosti, relacijske složenosti i ograničenja poduzeća. Pa ipak, tehnologija nikada nije uzalud potrošena: natjerala je industriju da preispita pronalaženje, miješajući semantičke, leksičke i relacijske strategije.

Kad bih 2027. napisao nastavak, pretpostavljam da ne bi uokvirio vektorske baze podataka ne kao jednoroge, već kao naslijeđenu infrastrukturu — temeljnu, ali zasjenjenu pametnijim slojevima orkestracije, prilagodljivim kontrolerima za dohvaćanje i AI sustavima koji dinamički biraju koji alat za pronalaženje odgovara upitu.

Od sada, prava bitka nije vektor protiv ključne riječi — to je posrednost, miješanje i disciplina u izgradnji cjevovoda za dohvaćanje koji pouzdano temelje gen AI na činjenicama i znanju domene. To je jednorog kojeg sada trebamo loviti.

Amit Verma je voditelj inženjeringa i AI Labsa u Neuron7.

Pročitajte više iz našeg gostujući pisci. Ili razmislite o slanju vlastitog posta! Pogledajte naše smjernice ovdje.

Web izvor

Povezani sadržaji

  • Evo zahtjeva za računalo za umiranje svjetla: ZvijerEvo zahtjeva za računalo za umiranje svjetla: Zvijer
  • Još jedna europska vlada je Microsoft za Linux – evo zaštoJoš jedna europska vlada je Microsoft za Linux – evo zašto
  • Hoće li Velika Britanija dobiti Super Nintendo svijet u novom tematskom parku Universal?Hoće li Velika Britanija dobiti Super Nintendo svijet u novom tematskom parku Universal?
  • Napokon, pametni prsten koji ne moram svake večeri puniti (i bez pretplate)Napokon, pametni prsten koji ne moram svake večeri puniti (i bez pretplate)
  • Kada koristiti koji – Nate Chamberlain, Microsoft MCTKada koristiti koji – Nate Chamberlain, Microsoft MCT
  • TorrentroverTorrentrover | Potražite, automatizirajte i organizirajte preuzimanje torrenta

Previous Article

Kako su geni iskoristili fiziku za uzgoj živih bića

Next Article

Call of Duty: Black Ops 7 ima najniži Metacritic korisnički rezultat ikada za Call of Duty igru

Posljednje objave

Awesome Games Done Quick 2026 završava s 1,8 milijuna funti prikupljenih za Prevent Cancer Foundation i štafetom od 70 igrača u Super Mario 64 Replay

Awesome Games Done Quick 2026 završava s 1,8 milijuna funti prikupljenih za Prevent Cancer Foundation i štafetom od 70 igrača u Super Mario 64 Replay

Hutchison Ports dovršava privatnu 5G mrežu u britanskom čvorištu

Zašto vaš LLM račun eksplodira — i kako ga semantičko predmemoriranje može smanjiti za 73%

Zašto vaš LLM račun eksplodira — i kako ga semantičko predmemoriranje može smanjiti za 73%

Sadržaj

  • 1 Predviđanje 1: Nestali jednorog
  • 2 Predviđanje 2: Vektori sami po sebi neće uspjeti
  • 3 Predviđanje 3: Prepuno polje postaje roba
  • 4 Nova stvarnost: Hybrid i GraphRAG
  • 5 Mjerila i dokazi
  • 6 Što ovo znači naprijed
  • 7 Gledajući unaprijed: Što je sljedeće
  • 8 Od sjajnih objekata do bitne infrastrukture

Novosti

  • Awesome Games Done Quick 2026 završava s 1,8 milijuna funti prikupljenih za Prevent Cancer Foundation i štafetom od 70 igrača u Super Mario 64 Replay 12. siječnja 2026
  • Hutchison Ports dovršava privatnu 5G mrežu u britanskom čvorištu 11. siječnja 2026
  • Zašto vaš LLM račun eksplodira — i kako ga semantičko predmemoriranje može smanjiti za 73% 11. siječnja 2026
  • Crispr Pioneer pokreće startup za izradu prilagođenih tretmana uređivanja gena 11. siječnja 2026
  • Isključivanje ovih 7 uobičajenih kućanskih uređaja pomoglo mi je smanjiti račune za struju 11. siječnja 2026
  • Bixby se vratio, dušo 11. siječnja 2026
  • Poppy Playtime: Chapter 5 – Broken Things dobiva podnaslov i datum izlaska za PC, no igrači na konzoli morat će pričekati još malo 11. siječnja 2026
  • Ofcom postavlja planove za mobilni, Wi-Fi za dijeljenje gornjeg pojasa spektra od 6 GHz 10. siječnja 2026
  • Anthropic se bori protiv neovlaštene upotrebe Claudea od strane trećih proizvođača i rivala 10. siječnja 2026
  • Meta se veliko kladi na nuklearnu energiju s Okloom 10. siječnja 2026

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice