Abu Dhabi je napravio korak prema globalnoj umjetnoj inteligenciji (AI) s Falcon Perception, multimodalnim modelom koji omogućuje strojevima da učinkovito vide, čitaju i interpretiraju fizički svijet.
Razvijen od strane Instituta za tehnološke inovacije (TII), ogranka za primijenjena istraživanja emiratskog Vijeća za napredna tehnološka istraživanja, Falcon Perception proširuje ekosustav umjetne inteligencije UAE kombinirajući vid i jezične sposobnosti.
Kako se globalno AI natjecanje pojačava, Ujedinjeni Arapski Emirati se nadaju da će se pozicionirati među nacijama koje su sposobne za napredne multimodalne sustave u velikim razmjerima, čineći Falcon Perception središnjim dijelom ove ambicije. S približno 600 milijuna parametara, Falcon Perception je znatno kompaktniji od mnogih istaknutih multimodalnih modela, koji često koriste nekoliko milijardi parametara.
“Naš cilj s Falcon Perceptionom bio je osporiti prevladavajuću pretpostavku da se vizualni sustavi moraju oslanjati na složene višestupanjske arhitekture. Demonstrirajući da se jedan gusti transformator može učinkovito nositi sa zadacima percepcije, otvaramo vrata novoj generaciji skalabilnih multimodalnih sustava”, rekao je Hakim Hacid, glavni istraživač u TII-jevom Centru za umjetnu inteligenciju i digitalna istraživanja.
Ova ravnoteža između učinkovitosti i performansi pokazuje širi trend umjetne inteligencije: umjesto povećanja broja parametara ili zahtijevanja opsežnih računalnih resursa, istraživači naglašavaju optimizaciju dizajna modela, kao što su učinkovite varijante transformatora, kako bi se postigli snažni rezultati čak i na hardveru s ograničenim resursima.
Multimodalna umjetna inteligencija se općenito smatra sljedećom granicom umjetne inteligencije. Dok veliki jezični modeli (LLM) dominiraju nedavnim napretkom, sposobnost strojeva za tumačenje i interakciju s fizičkim svijetom postaje kritična kako se AI širi na robotiku, proizvodnju i inteligentnu infrastrukturu.
Falcon Perception koristi unificiranu arhitekturu temeljenu na transformatorima, omogućujući end-to-end integraciju vizualnih i jezičnih značajki na razini unosa modela. Za razliku od tradicionalnih cjevovoda koji spajaju odvojeno obučeni računalni vid i NLP module, Falcon Perception obrađuje i razmišlja preko modaliteta izravno u svojoj zajedničkoj mreži, smanjujući kašnjenje zaključivanja i složenost implementacije.
Posljedično, sustav tumači složene vizualne scene s više objekata koristeći upute prirodnog jezika. Korisnici mogu uputiti model da identificira, prebroji ili segmentira određene objekte na slici, a Falcon Perception vraća granične okvire, segmentacijske maske ili tekstualne izlaze, čak i u prepunim, zamršenim okruženjima.
Takve sposobnosti imaju jasne implikacije za industriju. U proizvodnji bi model mogao omogućiti automatizirani pregled i otkrivanje nedostataka. U robotici, omogućuje strojevima da slijede upute prirodnog jezika u dinamičnim okruženjima. U postavkama poduzeća može pojednostaviti obradu dokumenata velikih razmjera i vizualno označavanje podataka.
Za TII lansiranje predstavlja ne samo tehničku prekretnicu već i korak u široj nacionalnoj strategiji. Od početka svog programa umjetne inteligencije, UAE su dali prioritet izgradnji suverenih sposobnosti, osiguravanju domaćeg razvoja, odgovornog upravljanja i usklađivanja s dugoročnim ekonomskim ciljevima za kritične tehnologije.
“Falcon Perception odražava TII-jevu predanost unaprjeđenju AI sposobnosti koje su vrhunske i praktične. Preispitivanjem načina na koji se grade vizija i jezični modeli, omogućujemo učinkovitije multimodalne sustave koji se mogu primijeniti u industrijama stvarnog svijeta dok istovremeno jačamo suverene AI sposobnosti”, rekao je Najwa Aaraj, izvršni direktor TII-ja.
TII-jev rad obuhvaća sigurnosne okvire za AI, evaluaciju i implementaciju te opsežne istraživačke programe. Glavni rezultat ovog napora je Falcon, domaći LLM u Ujedinjenim Arapskim Emiratima, koji je prvi pokrenuo TII 2023. Falcon je brzo privukao međunarodnu pozornost zbog svoje izvedbe i zbog toga što je objavljen kao model otvorenog koda, odražavajući uvjerenje Abu Dhabija da otvorenost i upravljanje mogu koegzistirati.
Falcon se ne postavlja samo kao tehničko dostignuće, već kao dio šireg nacionalnog sustava razvoja umjetne inteligencije. Kombinacijom znanstvenog istraživanja s agilnim donošenjem odluka na vladinoj razini, Abu Dhabi ima za cilj ubrzati usvajanje uz zadržavanje nadzora i povjerenja.