• Pet. lip 26th, 2026

Oblak Znanja

informatička edukacija i vijesti

Najmanji model Liquid AI-a LFM2.5-230M nadmašuje modele 4X svoje veličine u ekstrakciji podataka, može raditi ‘bilo gdje’

ByTomšić Damjan

lip 26, 2026

Liquid AI, koji su osnovali bivši računalni znanstvenici MIT-a, danas je objavio svoj najmanji jezični model umjetne inteligencije dosad, LFM2.5-230Ma poduzeća bi bilo dobro da ga razmotre za svoju upotrebu u ekstrakciji podataka i lokalnoj implementaciji na pametnim telefonima, prijenosnim računalima i robotici.

Ovo je temeljni model od 230 milijuna parametara izričito dizajniran za agentske tijekove rada na uređaju, a kao što Liquid navodi u svom izdanju na blogu, ta mala veličina omogućuje pokretanje gotovo "bilo gdje." Prema Liquidu, također nadmašuje modele koji su više od 4 puta veći od svoje veličine na odabranim referentnim vrijednostima, konkretno bolji je u ekstrakciji podataka od Alibaba Qwen3.5-0.8B (Instruct) s 800 milijuna parametara i Google Gemma 3 1B s 1 milijardom parametara.

Model je namijenjen programerima i inženjerima koji grade lagane cjevovode za ekstrakciju podataka i autonomne rubne sustave.

Radeći pod komercijalnom licencom za dvostruku namjenu, model ostaje besplatan za pojedince i tvrtke koji generiraju manje od 10 milijuna dolara godišnjeg prihoda, dok za veće korporacije zahtijeva plaćeni poslovni ugovor.

Ovo se izdanje razlikuje od ostalih malih AI modela korištenjem LFM2 arhitekture za postizanje visokih brzina zaključivanja bez masivnog opterećenja memorije tipičnog za transformatore s velikim brojem parametara.

Dok velike AI tvrtke Anthropic, OpenAI, Google, Microsoft, Meta i druge guraju parametre u stotine milijardi ili trilijuna kako bi postigle vrhunske performanse, paralelna utrka u potpunosti se fokusira na rubne i lokalne implementacije.

Liquid AI lansiranje LFM2.5-230M signalizira ključni pomak prema arhitektonskoj učinkovitosti u odnosu na brute-force skaliranje. Sažimanjem 19 trilijuna tokena pred-obuke u otisak od 230 milijuna parametara, tvrtka pokazuje da rubnim uređajima nije potrebna ogromna računalna snaga ili stalne veze s oblakom za izvođenje složenih agentskih radnih procesa u više koraka.

Kako radi LFM2.5-230M

Model LFM2.5-230M razlikuje se od standardnih transformatorskih arhitektura, oslanjajući se umjesto toga na okvir LFM2. Ova arhitektura funkcionira kao hibridni sustav, ispreplićući zatvorene konvolucije kratkog dometa s pažnjom grupiranih upita za učinkovitu obradu informacija.

Za one koji prate evoluciju učinkovitih arhitektura, Liquidov pristup dijeli sličan konceptualni cilj: učinkovito upravljanje dugim kontekstima i sekvencijalnim podacima na rubnom hardveru bez kvadratnih troškova memorije mehanizama čiste pažnje. Model podržava ekspanzivan kontekstni prozor od 32K, što mu omogućuje unos značajnih dokumenata ili kontinuiranih tokova robotske telemetrije.

Prilikom analize tablica performansi navedenih u izdanju, arhitektonska učinkovitost postaje vizualno očita. Model zadržava memorijski otisak ispod 400 MB dok postiže brzine predispunjavanja i dekodiranja koje nadmašuju usporedive modele kao što su Gemma 3 1B IT i Granite 4.0-H-350M.

Na Samsung Galaxy S25 Ultra opremljenom Qualcomm Snapdragon Gen4 CPU-om, model postiže brzinu dekodiranja od 213 tokena u sekundi. Čak i na vrlo ograničenom Raspberry Pi 5, model održava brzinu dekodiranja od 42 tokena u sekundi. Nadalje, interna usporedna analiza pokazuje da skup zaključaka GPU-a pruža nižu latenciju od kraja do kraja od konkurentskih malih modela na svim razinama konkurentnosti.

Zašto je to važno za poduzeća

Da bismo razumjeli zašto je potreban model od 230 milijuna parametara, moramo pogledati kako poduzeća trenutno upravljaju podacima.

Organizacije su se tradicionalno oslanjale na krute skripte za izdvajanje, transformiranje, učitavanje (ETL) temeljene na pravilima za premještanje i obradu podataka. Međutim, ti su naslijeđeni sustavi notorno krhki; jednostavna promjena u izgledu dokumenta ili ažuriranje sheme može prekinuti cijeli cjevovod.

Kako bi to riješila, industrija se pomiče prema "AI ETL," gdje strojno učenje izvodi preslikavanja, detektira pomicanje sheme i automatski se prilagođava promjenama. U modernom laganom cjevovodu za ekstrakciju podataka, AI model povezuje se s nestrukturiranim izvorima — kao što su PDF-ovi, e-pošta ili web-obrasci — i strukturira podatke u formate kao što je JSON bez potrebe za tvrdo kodiranim pravilima.

Za poduzeća je korištenje masivnog vodećeg modela kao što je Claude Opus 4.6 (koji košta 5,00 USD po milijunu ulaznih tokena) za analizu rutinskih faktura, formatiranje adresa ili usmjeravanje telemetrijskih podataka ekonomski neodrživo.

Ovdje modeli poput LFM2.5-230M postaju kritični. Dizajniran izričito kao lagani mehanizam za ekstrakciju, omogućuje tvrtkama da automatiziraju ponavljajuće formatiranje i raščlanjivanje podataka uz djelić troškova računanja i latencije, radeći izravno na lokalnom hardveru umjesto da se oslanjaju na skupe, kontinuirane API pozive u oblaku.

Mjerila za male modele: LFM u odnosu na klasu 3B

Industrija umjetne inteligencije sredinom 2026. doživljava renesansu "mali" modeli, ali definicija "mali" jako varira.

Nedavno je zajednica otvorenih modela bila zapanjena Weibo VibeThinker-3B, modelom od 3 milijarde parametara izgrađenim na okosnici u stilu Qwen2 koji je postigao golemih 94,3 na matematičkom mjerilu AIME 2026, nadmećući se s divovima od 600 milijardi parametara kroz agresivno praćenje podataka i učenje pojačanja.

Slično tome, Googleova obitelj Gemma 4 — koja je nedavno prešla 200 milijuna preuzimanja — gura prednji AI do ruba, uključujući E2B (2 milijarde parametara) dizajniran posebno za mobilne i IoT implementacije.

Nasuprot tome, LFM2.5-230M tvrtke Liquid AI radi u potpuno drugoj težinskoj kategoriji. Sa samo 230 milijuna parametara, otprilike je jedna desetina veličine najmanjeg Googleovog modela Gemma 4 i VibeThinker-3B.

Zbog svog mikroskopskog otiska, LFM2.5-230M nije dizajniran da se natječe s teškim radnim opterećenjima kao što su napredna matematika, kodiranje ili kreativno pisanje – ograničenje koje Liquid AI izričito priznaje.

Međutim, u predviđenim domenama ekstrakcije podataka i pozivanja alata, model je znatno iznad svoje težine.

Referentne vrijednosti koje je objavio Liquid AI pokazuju da LFM2.5-230M postiže ocjenu 43,26 na BFCLv3 referentnoj vrijednosti za korištenje alata, dominirajući nad IBM-ovim Granite 4.0-350M (39,58) i potpuno nadmašujući veće modele s 1 milijardom parametara poput Googleove Gemma 3 1B IT (16,61).

Na CaseReportBenchu ​​za ekstrakciju podataka postiže ocjenu 22,51, desetkujući Qwen3,5-0,8B (Instruct).

LFM2.5-230M dokazuje da dok modeli s 3 milijarde parametara kao što je VibeThinker rješavaju naprednu računicu, model s 230 milijuna parametara je superioran, visoko optimiziran izbor za izvršavanje strukturiranih poziva alata i održavanje učinkovitog rada agencijskih cjevovoda na ograničenom hardveru.

Napredna istraživanja koriste

Budući da je izvrstan u pozivanju alata, LFM2.5-230M prvenstveno funkcionira kao sloj za odabir vještina. Liquid AI demonstrirao je ovu sposobnost postavljanjem modela na Unitree G1 humanoidnog robota.

Pokrećući se u potpunosti na uređaju putem ugrađenog računalnog modula NVIDIA Jetson Orin robota, model uspješno obrađuje složene naredbe okruženja.

Kao što je navedeno u tehničkom blogu tvrtke, model ima upute u slobodnom obliku, poput, *"Ostanite mirni 2 sekunde, zatim hodajte naprijed brzinom od 1 metar u sekundi 3 metra, držite klečeći s jednom nogom naprijed 5 sekundi i hodajte unatrag brzinom od 0,5 metara u sekundi 3 metra,"* i automatski ga prevodi u strukturirani plan u više koraka koji poziva na prethodno obučene vještine niske razine koje pruža NVIDIA-in okvir SONIC.

Osnovni i naknadno obučeni modeli dostupni su odmah na Hugging Faceu, s izvornom podrškom od prvog dana u cijelom ekosustavu zaključivanja za llama.cpp (GGUF), MLX, vLLM, SGLang i ONNX.

Dvostruka namjena, prilagođena LFM otvorena licenca

Liquid AI isporučuje LFM2.5-230M pod LFM otvorenom licencom v1.0. Usprkos riječi "otvoriti" u naslovu, ovo nije licenca usklađena s Open Source Initiative (OSI); djeluje kao ograničeni komercijalni okvir s dvostrukom namjenom.

Za neovisne programere, istraživače i početnike, licenca funkcionira identično kao softver otvorenog koda.

Korisnici dobivaju trajnu, svjetsku, besplatnu licencu za reprodukciju, modificiranje i distribuciju modela, pod uvjetom da zadrže izvorne obavijesti o autorskim pravima i jasno navedu sve izmjene.

Međutim, licenca uključuje strogu "Ograničenje komercijalne uporabe". Svaka pravna osoba koja ostvaruje godišnji prihod od 10 milijuna dolara ili više gubi pravo na komercijalnu upotrebu modela prema ovom ugovoru.

Velika poduzeća koja prelaze ovaj financijski prag moraju pregovarati o zasebnom, plaćenom komercijalnom ugovoru s Liquid AI-jem za implementaciju modela u proizvodnju.

Ova strategija štiti tvrtku od besplatnog preuzimanja njenog intelektualnog vlasništva od strane velikih tehnoloških konglomerata, dok još uvijek razvija model na razini osnovnog programera.

Web izvor

By Tomšić Damjan

Pozdrav, ja sam Damjan Tomšić, osnivatelj i urednik informatičko edukativnog bloga Oblak Znanja. Za Vas ću se potruditi da dobijete edukativne članke, savjete i recenzije vezane uz osnovno i napredno korištenje računala i interneta. Kontak: Google+, Gmail.