Kad sam prvi put napisao “Vektorske baze podataka: Sindrom sjajnog predmeta i slučaj nestalog jednoroga” u ožujku 2024. industrija je bila preplavljena pompom. Vektorske baze podataka pozicionirane su kao sljedeća velika stvar — sloj infrastrukture koji morate imati za eru gen AI. Milijarde poduzetničkih dolara su tekle, programeri su požurili integrirati ugradnje u svoje projekte, a analitičari su bez daha pratili runde financiranja za Šišarka, Tkati, Chroma, Milvus i desetak drugih.
Obećanje je bilo opojno: konačno, način pretraživanja po značenju, a ne po krhkim ključnim riječima. Samo prebacite svoje poslovno znanje u vektorsku trgovinu, povežite LLM i gledajte kako se događa magija.
Osim što se magija nikada nije u potpunosti ostvarila.
Dvije godine kasnije, provjera stvarnosti je stigao: 95% organizacija koje su uložile u inicijative gen AI ne bilježe nulti mjerljivi povrat. I mnoga upozorenja koja sam tada iznio – o ograničenjima vektora, prenatrpanom krajoliku dobavljača i rizicima tretiranja vektorskih baza podataka kao srebrnih metaka – odigrala su se gotovo točno kako je predviđeno.
Sadržaj objave
Predviđanje 1: Nestali jednorog
Tada sam se zapitao hoće li Pinecone — poster dijete ove kategorije — postići status jednoroga ili će postati “jednorog koji nedostaje” u svijetu baza podataka. Danas je na to pitanje odgovoreno na najrječitiji mogući način: Šišarka je navodno istražuje prodajukoji se bori za proboj usred oštre konkurencije i odljeva kupaca.
Da, Pinecone je podigao velike krugove i potpisao šatorske logotipe. Ali u praksi, diferencijacija je bila tanka. Igrači otvorenog koda kao što su Milvus, Qdrant i Chroma potkopavaju ih po pitanju troškova. Postojeći proizvođači poput Postgresa (sa pgVektor) i Elasticsearch su jednostavno dodali vektorsku podršku kao značajku. A kupci su sve češće pitali: “Zašto uvoditi potpuno novu bazu podataka kada moj postojeći stog već radi dovoljno dobro s vektorima?”
Rezultat: Šišarka, nekoć procijenjena na milijardu dolara, sada traži dom. Zaista nestali jednorog. U rujnu 2025. Pinecon je imenovao Asha Ashutosha kao izvršni direktor, a osnivač Edo Liberty prelazi na mjesto glavnog znanstvenika. Tajming govori: Promjena vodstva dolazi usred sve većeg pritiska i pitanja vezanih uz njegovu dugoročnu neovisnost.
Predviđanje 2: Vektori sami po sebi neće uspjeti
Također sam tvrdio da vektorske baze podataka same po sebi nisu konačno rješenje. Ako vaš slučaj upotrebe zahtijeva točnost – poput traženja “pogreške 221” u priručniku – čisto vektorsko pretraživanje radosno bi poslužilo “pogrešku 222” kao “dovoljno blizu”. Sladak u demou, katastrofalan u produkciji.
Ta napetost između sličnosti i relevantnosti pokazala se kobnom za mit o vektorskim bazama podataka kao višenamjenskim strojevima.
“Poduzeća su na teži način otkrila da je semantika ≠ točna.”
Programeri koji su radosno zamijenili leksičko pretraživanje vektorima brzo su ponovno uveli… leksičko pretraživanje u kombinaciji s vektorima. Timovi koji su očekivali da vektori “samo rade” završili su na filtriranju metapodataka, rerankeri i ručno podešena pravila. Do 2025. konsenzus je jasan: Vektori su moćni, ali samo kao dio hibridnog skupa.
Predviđanje 3: Prepuno polje postaje roba
Eksplozija pokretanja vektorskih baza podataka nikad nije bila održiva. Weaviate, Milvus (preko Zilliza), Chroma, Vespa, Qdrant — svaki je tvrdio da ima suptilne diferencijatore, ali većini kupaca svi su činili istu stvar: pohranjivali vektore i dohvaćali najbliže susjede.
Danas se vrlo malo tih igrača probija. Tržište je rascjepkano, komodificirano i na mnoge načine progutano od strane postojećih kompanija. Pretraživanje vektora sada je značajka potvrdnog okvira u podatkovnim platformama u oblaku, a ne samostalni jarak.
Kao što sam tada napisao: razlikovanje jednog vektorskog DB-a od drugog predstavljat će sve veći izazov. Taj je izazov samo postao teži. Vald, Marko, LanceDB, PostgresSQL, MySQL HeatWave, Oracle 23c, Azure SQL, Kasandra, Redis, Neo4j, SingleStore, ElasticSearch, OpenSearch, Apahce Solr… popis se nastavlja.
Nova stvarnost: Hybrid i GraphRAG
Ali ovo nije samo priča o padu – to je priča o evoluciji. Iz pepela vektorskog hypea pojavljuju se nove paradigme koje kombiniraju najbolje od višestrukih pristupa.
Hibridno pretraživanje: ključna riječ + vektor sada je zadana postavka za ozbiljne aplikacije. Tvrtke su naučile da trebate i preciznost i nejasnoću, točnost i semantiku. Alati kao što su Apache Solr, Elasticsearch, pgVector i vlastito “kaskadno dohvaćanje” Pineconea prihvaćaju ovo.
GraphRAG: Najpopularnija riječ kasne 2024./2025. je GraphRAG — proširena generacija dohvaćanja s poboljšanim grafikonima. Spajajući vektore s grafovima znanja, GraphRAG kodira odnose između entiteta koje samo ugrađivanje izravnava. Isplata je dramatična.
Mjerila i dokazi
-
Amazonov AI blog navodi mjerila iz Lettriagdje je hibridni GraphRAG povećao točnost odgovora s ~50% na više od 80% u testnim skupovima podataka u financijama, zdravstvu, industriji i pravu.
-
The GraphRAG-Bench benchmark (objavljen u svibnju 2025.) pruža rigoroznu procjenu GraphRAG-a u odnosu na vanilla RAG kroz zadatke rasuđivanja, upite s više skokova i izazove domene.
-
An OpenReview procjena RAG-a u odnosu na GraphRAG otkrili da svaki pristup ima prednosti ovisno o zadatku – ali hibridne kombinacije često imaju najbolje rezultate.
-
FalkorDB blog izvještava da kada je preciznost sheme važna (strukturirane domene), GraphRAG može nadmašiti dohvaćanje vektora za faktor ~3,4x na određenim referentnim vrijednostima.
Uspon GraphRAG-a naglašava veću poantu: Retrieval se ne odnosi ni na jedan sjajni predmet. Radi se o izgradnji sustavi za pronalaženje — slojeviti, hibridni cjevovodi svjesni konteksta koji daju LLM-ima prave informacije, s pravom preciznošću, u pravo vrijeme.
Što ovo znači naprijed
Presuda glasi: vektorske baze podataka nikad nisu bile čudo. Oni su bili korak – važan – u evoluciji traženja i pronalaženja. Ali oni nisu, i nikada nisu bili, kraj igre.
Pobjednici u ovom prostoru neće biti oni koji vektore prodaju kao samostalnu bazu podataka. Oni će biti ti koji ugrađuju vektorsko pretraživanje u šire ekosustave — integrirajući grafikone, metapodatke, pravila i inženjering konteksta u kohezivne platforme.
Drugim riječima: jednorog nije vektorska baza podataka. Jednorog je hrpa za preuzimanje.
Gledajući unaprijed: Što je sljedeće
-
Objedinjene podatkovne platforme uključit će vektor + graf: Očekujte da će veliki dobavljači baza podataka i oblaka ponuditi integrirane skupove za dohvaćanje (vektor + grafikon + cijeli tekst) kao ugrađene mogućnosti.
-
“Inženjering pronalaska” pojavit će se kao zasebna disciplina: Kao što su MLO-ovi sazrijevali, tako će i praksa oko ugrađivanja podešavanja, hibridnog rangiranja i konstrukcije grafikona.
-
Meta-modeli uče bolje postavljati upite: Budući LLM-i mogu naučiti kako biste odredili koju metodu dohvaćanja koristiti po upitu, dinamički prilagođavajući ponderiranje.
-
Vremenski i multimodalni GraphRAG: Istraživači već proširuju GraphRAG kako bi bio svjestan vremena (T-GRAG) i multimodalno unificirani (npr. povezivanje slika, teksta, videa).
-
Otvorene referentne vrijednosti i slojevi apstrakcije: Alati poput BenchmarkQED (za RAG benchmarking) i GraphRAG-Bench će gurnuti zajednicu prema pravednijim, usporedivo mjerenim sustavima.
Od sjajnih objekata do bitne infrastrukture
Krug priče o vektorskoj bazi podataka slijedio je klasičan put: sveprisutni ciklus hype, praćen introspekcijom, ispravljanjem i sazrijevanjem. U 2025. vektorska pretraga više nije sjajni objekt za kojim svi slijepo tragaju — sada je kritični sastavni dio unutar sofisticiranije, višestruke arhitekture pretraživanja.
Prvotna upozorenja bila su točna. Čiste vektorske nade često se ruše na plićacima preciznosti, relacijske složenosti i ograničenja poduzeća. Pa ipak, tehnologija nikada nije uzalud potrošena: natjerala je industriju da preispita pronalaženje, miješajući semantičke, leksičke i relacijske strategije.
Kad bih 2027. napisao nastavak, pretpostavljam da ne bi uokvirio vektorske baze podataka ne kao jednoroge, već kao naslijeđenu infrastrukturu — temeljnu, ali zasjenjenu pametnijim slojevima orkestracije, prilagodljivim kontrolerima za dohvaćanje i AI sustavima koji dinamički biraju koji alat za pronalaženje odgovara upitu.
Od sada, prava bitka nije vektor protiv ključne riječi — to je posrednost, miješanje i disciplina u izgradnji cjevovoda za dohvaćanje koji pouzdano temelje gen AI na činjenicama i znanju domene. To je jednorog kojeg sada trebamo loviti.
Amit Verma je voditelj inženjeringa i AI Labsa u Neuron7.
Pročitajte više iz našeg gostujući pisci. Ili razmislite o slanju vlastitog posta! Pogledajte naše smjernice ovdje.


