Želite pametnije uvide u vašu pristiglu poštu? Prijavite se za naše tjedne biltene kako biste dobili samo ono što je važno za vođe AI, podataka i sigurnosti. Pretplatite se sada
Google službeno je premjestio svoj novi, visoki učinak Model ugradnje Blizanca do opće dostupnosti, trenutno ukupno rangirajući broj jedan na visoko cijenjenom Masivni tekst ugradnja referentnih vrijednosti (MTEB). Model (Gemini-umetding-001) sada je temeljni dio Blizanca API-ja i Vertex AI, omogućavajući programerima da izgrade aplikacije kao što su semantička pretraživanja i pronalaska generacije (RAG).
Iako je rangiranje broja jedan snažan debi, krajolik modela ugradnje vrlo je konkurentan. Googleov vlasnički model izravno izaziva snažne alternative otvorenog koda. To postavlja novi strateški izbor za poduzeća: Usvojite vrhunski vlasnički model ili gotovo kao dobar izazivač otvorenog koda koji nudi veću kontrolu.
Sadržaj objave
Što je pod haubom Googleovog modela ugradnje Blizanca
U svojoj srži, ugradnje pretvaraju tekst (ili druge vrste podataka) u numeričke popise koji bilježe ključne značajke ulaza. Podaci sa sličnim semantičkim značenjem ugrađuju vrijednosti koje su bliže u ovom numeričkom prostoru. To omogućava snažne aplikacije koje nadilaze jednostavne podudaranje ključnih riječi, poput izgradnje inteligentnih sustava za pronalaženje generacije (RAG) koji hrane relevantne informacije LLMS-u.
Ugradnje se također mogu primijeniti i na druge modalitete kao što su slike, video i zvuk. Na primjer, tvrtka za e-trgovinu može koristiti multimodalni model ugradnje za generiranje jedinstvenog numeričkog prikaza za proizvod koji uključuje i tekstualne opise i slike.
Serija AI Impact vraća se u San Francisco – 5. kolovoza
Sljedeća faza AI je ovdje – jeste li spremni? Pridružite se vođama iz Block, GSK i SAP-a za ekskluzivni pogled na to kako autonomni agenti preoblikovaju radne tokove poduzeća-od odlučivanja u stvarnom vremenu do automatizacije krajnjeg do kraja.
Osigurajte svoje mjesto odmah – prostor je ograničen: https://bit.ly/3guuplf
Za poduzeća, ugradnja modela mogu napajati preciznije interne tražilice, sofisticirano grupiranje dokumenata, klasifikacijske zadatke, analizu osjećaja i otkrivanje anomalije. Ugradnje također postaju važan dio Agentic aplikacija, gdje AI agenti moraju dohvatiti i uskladiti različite vrste dokumenata i uputa.
Jedna od ključnih značajki ugradnje Blizanca je njegova ugrađena fleksibilnost. Osposobljena je tehnikom poznatom kao Matryoshka Reprezentation Learning (MRL), koja programerima omogućava da dobiju vrlo detaljno ugradnju 3072-dimenzija, ali i skraćuju je u manjim veličinama poput 1536 ili 768, istovremeno očuvajući svoje najrelevantnije značajke. Ova fleksibilnost omogućava poduzeću da uspostavi ravnotežu između točnosti modela, troškova performansi i skladištenja, što je ključno za učinkovito skaliranje aplikacija.
Google pozicionira Blizance ugrađujući se kao objedinjeni model namijenjen učinkovitoj da djeluje “izvan okvira” u različitim domenama poput financija, pravnog i inženjerstva bez potrebe za finim podešavanjem. To pojednostavljuje razvoj za timove kojima je potrebno rješenje opće namjene. Podržavajući više od 100 jezika i konkurentno po cijeni od 0,15 USD na milijun ulaznih tokena, dizajniran je za široku pristupačnost.
Konkurentni krajolik vlasničkih i otvorenih izazivača
MTEB ploča pokazuje da je, dok Blizanci vodi, jaz uzak. Suočava se s etabliranim modelima iz OpenAi -a, čiji se modeli ugradnje široko koriste, i specijalizirani izazivači poput Mistrala, koji nudi model posebno za pretraživanje koda. Pojava ovih specijaliziranih modela sugerira da za određene zadatke ciljani alat može nadmašiti generalist.
Drugi ključni igrač, Cohere, usmjerava poduzeće izravno sa svojim ugrađenim 4 modelom. Dok se drugi modeli natječu na općim mjerilima, Cohere naglašava sposobnost njegovog modela da se nosi s “bučnim podacima u stvarnom svijetu” koji se često nalaze u dokumentima poduzeća, poput pravopisnih pogrešaka, pitanja formatiranja, pa čak i skeniranog rukopisa. Također nudi implementaciju na virtualnim privatnim oblacima ili lokalnim prostorima, pružajući razinu sigurnosti podataka koja se izravno žali na regulirane industrije poput financija i zdravstvene zaštite.
Najizravnija prijetnja vlasničkoj dominaciji dolazi iz zajednice otvorenog koda. Alibaba Qwen3-umetding Model se nalazi odmah iza Blizanca na MTEB -u i dostupan je pod dopuštenom licencom Apache 2.0 (dostupno u komercijalne svrhe). Za poduzeća usredotočena na razvoj softvera, QODO-ov Qodo-namebed-1-1.5b predstavlja još jednu uvjerljivu alternativu otvorenog koda, dizajniranu posebno za kod i tvrdeći da nadmašuju veće modele na referentnim vrijednostima specifičnim za domenu.
Za tvrtke koje već grade na Google Cloud-u i obitelji Blizanca modela, prihvaćanje izvornog modela ugradnje može imati nekoliko prednosti, uključujući bešavnu integraciju, pojednostavljeni MLOP-ov cjevovod i jamstvo korištenja najbolje rangiranog modela opće namjene.
Međutim, Blizanci su zatvoreni, samo AP-samo model. Poduzeća koja daju prioritet suverenitetu podataka, kontrola troškova ili mogućnost pokretanja modela na vlastitoj infrastrukturi sada imaju vjerodostojnu, vrhunsku opciju otvorenog koda u QWEN3-Edbindingu ili mogu koristiti jedan od modela ugradnje specifičnih za zadatak.
Web izvor