Pridružite se događaju kojima vjeruje čelnici poduzeća gotovo dva desetljeća. VB Transform okuplja ljude koji grade pravu strategiju Enterprise AI. Saznati više
Jabukas Istraživanje strojnog učenja Tim je razvio proboj AI sustava za generiranje slika visoke rezolucije koje bi mogle izazvati dominaciju difuzijskih modela, tehnologija koja pokreće popularne generatore slika poput Dall-E i Midjourney.
Napredak, detaljan u istraživačkom radu objavljenom prošlog tjedna, uvodi “Tok zvijezda„Sustav koji su istraživači Apple-a razvili u suradnji s akademskim partnerima koji kombinira normalizaciju protoka s autoregresivnim transformatorima kako bi postigao ono što tim naziva„ konkurentnim performansama “s najsuvremenijim modelima difuzije.
Proboj dolazi u kritičnom trenutku za Apple, s kojim se suočio Montaža kritika Tijekom svoje borbe s umjetnom inteligencijom. U ponedjeljak Svjetska konferencija programeratvrtka je otkrila samo skromna AI ažuriranja na njegov Apple Intelligence Platforma, istaknuvši konkurentski pritisak s kojim se suočava tvrtka za koju mnogi vide kako zaostaje u utrci AI oružja.
“Našim saznanjima, ovaj je rad prva uspješna demonstracija normalizacije tokova koji djeluju učinkovito na ovoj razmjeri i rezoluciji”, napisao je istraživački tim, koji uključuje istraživače Apple strojnog učenja Jiatao Gu, Joshua M. Susskind i Shuangfei Zhai, zajedno s akademskim suradnicima iz institucija, uključujući uključivanje UC Berkeley i Georgia Tech.
Sadržaj objave
Kako se Apple bori protiv Openai -a i Googlea u AI ratovima
A Tok zvijezda Istraživanje predstavlja Appleov širi napor za razvijanje karakterističnih AI mogućnosti koje bi mogle razlikovati njegove proizvode od konkurenata. Dok tvrtke vole Google i Open Dominirali su naslovima svojim generativnim AI napretkom, Apple je radio na alternativnim pristupima koji bi mogli ponuditi jedinstvene prednosti.
Istraživački tim riješio je temeljni izazov u stvaranju slike AI: skaliranje normalizacije protoka radi učinkovitog rada sa slikama visoke rezolucije. Normaliziranje tokova, vrsta generativnog modela koji uči transformirati jednostavne distribucije u složene, tradicionalno je zasjenjena difuzijskim modelima i generativnim protivničkim mrežama u aplikacijama za sintezu slike.
“Starflow postiže konkurentne performanse i u zadacima generiranja slika i tekstualnog i tekstualnog, pristupajući najsuvremenijim difuzijskim modelima u kvaliteti uzoraka”, napisali su istraživači, pokazujući svestranost sustava u različitim vrstama izazova sinteze slike.
Unutar matematičkog proboja koji pokreće Appleov novi AI sustav
Appleov istraživački tim uveo je nekoliko ključnih inovacija kako bi prevladao ograničenja postojećih pristupa normalizaciji protoka. Sustav koristi ono što istraživači nazivaju “dizajnom dubokog tresenja”, koristeći “duboki transformatorski blok [that] bilježi većinu reprezentativnog kapaciteta modela, nadopunjeno s nekoliko plitkih blokova transformatora koji su računski učinkoviti, a opet u velikoj mjeri korisno. “
Proboj također uključuje rad u “latentnom prostoru unaprijed raspoređenih autoenkodera, koji se pokazao učinkovitijim od izravnog modeliranja na razini piksela”, navodi se u radu. Ovaj pristup omogućuje modelu da radi s komprimiranim prikazima slika, a ne sirovim podacima o pikselu, značajno poboljšavajući učinkovitost.
Za razliku od difuzijskih modela, koji se oslanjaju na iterativne procese za označavanje, Tok zvijezda Održava matematička svojstva normalizacije tokova, omogućujući “točan trening maksimalne vjerojatnosti u kontinuiranim prostorima bez diskretizacije.”
Što Zvjezdani tok znači za Appleove buduće iPhone i Mac proizvode
Istraživanje dolazi s obzirom na to da se Apple suočava s povećanim pritiskom kako bi se pokazao smisleni napredak u umjetnoj inteligenciji. Nedavni Analiza Bloomberga Istaknuli su kako su se Apple Intelligence i Siri borili da se natječu sa suparnicima, dok su Appleove skromne najave na WWDC -u ovog tjedna podvlačele izazove tvrtke u AI prostoru.
Za Apple, Starflow-ova točna vjerojatnost treninga mogla bi ponuditi prednosti u aplikacijama koje zahtijevaju preciznu kontrolu nad generiranim sadržajem ili u scenarijima u kojima je razumijevanje nesigurnosti modela presudno za donošenje odluka-potencijalno vrijedno za poslovne aplikacije i mogućnosti AI-a na uređaju koje je Apple naglasio.
Istraživanje pokazuje da alternativni pristupi difuzijskim modelima mogu postići usporedive rezultate, potencijalno otvaranje novih načina za inovacije koji bi se mogli igrati s Appleovim snagama u integraciji hardverskog softvera i obradi na uređaju.
Zašto se Apple kladi na sveučilišna partnerstva kako bi riješio svoj AI problem
Istraživanje primjer je Appleove strategije suradnje s vodećim akademskim institucijama za unapređenje svojih AI mogućnosti. Ko-autor Tianrong Chendoktorat u Georgia Tech -u koji je internirao s Appleovim istraživačkim timom za strojno učenje, donosi stručnost u stohastičkoj optimalnoj kontroli i generativnom modeliranju.
Suradnja također uključuje Ruixiang Zhang iz odjela za matematiku UC Berkeley i Laurent Dinh, istraživač strojnog učenja poznatog po pionirskom radu na modelima koji se temelje na protoku, za vrijeme njegovog vremena Google mozak i Dubinski.
“Ono što je presudno, naš model ostaje krajnji normalizirajući tok”, naglasili su istraživači, razlikujući njihov pristup od hibridnih metoda koje žrtvuju matematičku traktabilnost za poboljšane performanse.
A Potpuni istraživački rad je dostupan na ARXIVpružajući tehničke detalje za istraživače i inženjere koji žele nadograditi ovaj rad u konkurentnom polju generativnog AI. Iako StarFlow predstavlja značajno tehničko postignuće, pravi test bit će može li Apple prevesti takve istraživačke proboje u vrstu AI značajki koje su okrenute potrošačima koje su natjerale konkurente poput imena kućanstava chatgpt. Za tvrtku koja je jednom revolucionirala čitavu industriju s proizvodima poput iPhonea, pitanje nije može li Apple inovirati u AI – to može li to učiniti dovoljno brzo.
Web izvor