Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj na vodećim AI pokrivenosti. Saznati više
Pejzaž AI agenta opće namjene iznenada je mnogo gužvi i ambiciozniji.
Ovaj tjedan startup sa sjedištem u Palo Altu Genpark Objavio ono što zove Super agentbrzi autonomni sustav dizajniran za rješavanje zadataka u stvarnom svijetu u širokom rasponu domena-uključujući neke koji podižu obrve, poput upućivanja telefonskih poziva u restorane pomoću realističnog sintetičkog glasa.
Pokretanje dodaje gorivo onome što se oblikuje kao važan novi front u AI natjecanju: Tko će izgraditi prvi pouzdan, fleksibilan i uistinu koristan agent opće namjene? Možda hitnije, što to znači za poduzeća?
Genspark-ovo lansiranje Super Agenta dolazi samo tri tjedna nakon drugog startupa utemeljenog na Kinezu, Manusprivukla je pažnju zbog svoje sposobnosti koordiniranja alata i izvora podataka za dovršavanje asinhronih zadataka u oblaku poput putovanja, nastavak probira i analize zaliha-sve bez držanja ručnog tipičnog za većinu trenutnih sredstava.
Genspark sada tvrdi da ide još dalje. Prema suosnivaču Ericu Jing-u, Super Agent je izgrađen na tri stupa: koncert od devet različitih LLM-ova, više od 80 alata i preko 10 vlasničkih skupova podataka-svi zajedno rade u koordiniranom toku. Prelazi daleko izvan tradicionalnih chatbota, rukovanja složenim tijekovima rada i vraćajući se u potpunosti izvršene ishode.
U a demoGenspark-ov agent planirao je kompletno petodnevno putovanje u San Diego, izračunao je hodanje udaljenosti između atrakcija, preslikao opcije javnog prijevoza, a zatim je koristio agent za glasovno pozivanje za rezervaciju restorana, uključujući rukovanje alergijama na hranu i sklonosti sjedenja. Drugi demo pokazao je agentu koji stvara video kolut za kuhanje generirajući korake recepta, video scene i audio prekrivače. U trećem je pisao i proizveo animiranu epizodu u stilu South Park-a, riffing na nedavnom političkom skandalu Signalgate koji je uključivao dijeljenje ratnih planova s političkim novinarom.
Oni mogu zvučati usredotočeni na potrošače, ali oni prikazuju gdje se tehnologija kreće-prema multi-modalnoj automatizaciji zadataka s više koraka koja zamagljuje liniju između kreativne generacije i izvršenja.
“Rješavanje ovih problema u stvarnom svijetu mnogo je teže nego što smo mislili”, kaže Jing u videu, “ali uzbuđeni smo zbog napretka koji smo postigli.”
Jedna od uvjerljivih značajki: Super Agent jasno vizualizira svoj misaoni proces, prateći način na koji je to razložio kroz svaki korak, a koje alate priziva i zašto. Gledanje te logike igra se u stvarnom vremenu čini da se sustav osjeća manje poput crne kutije i više kao suradnički partner. To bi također moglo potaknuti programere Enterprise da izgrade slične staze za sljedive obrazloženja u svoje AI sustave, čineći aplikacije transparentnijim i pouzdanijim.
Super Agent je također bio impresivno lako isprobati. Sučelje se glatko lansiralo u pregledniku bez potrebnog tehničkog postavljanja. Genspark omogućuje korisnicima da započnu testiranje bez potrebe za osobnim vjerodajnicama. Suprotno tome, Manus i dalje zahtijeva od podnositelja zahtjeva da se pridruže listi čekanja i otkriju društvene račune i druge privatne podatke, dodajući trenje eksperimentiranju.
O GENSPARK-u smo prvi put pisali u studenom, kada je pokrenula financijska izvješća koja se pokreću Claude. Ima prikupio najmanje 160 milijuna dolara u dva rundea podržani su od nas i ulagača sa sjedištem u Singapuru.
Pogledajte najnovije Video rasprava između programera AI agenta Sam Witteveen i mene ovdje Za dublje zaron u način na koji se Gensparkov pristup uspoređuje s ostalim okvirima agenata i zašto je to važno za Enterprise AI timove.
Sadržaj objave
Kako Genspark to povlači?
Pristup Gensparka ističe se jer kreće u dugogodišnji AI inženjerski izazov: orkestracija alata na skali.
Većina trenutnih agenata raspada se prilikom žongliranja više od nekolicine vanjskih API -ja ili alata. Čini se da Genspark-ov Super Agent upravlja tim boljem, vjerojatno koristeći model usmjeravanja i odabira temeljenog na pronalaženju za odabir alata i podmodela dinamički na temelju zadatka.
Ova strategija odjekuje u nastajanju istraživanja oko Cotools -a, novog okvira sa Sveučilišta Soochow u Kini koji poboljšava način na koji LLM -ovi koriste opsežne i razvijajuće se skupove alata. Za razliku od starijih pristupa koji se u velikoj mjeri oslanjaju na brzo inženjering ili kruto prilagođavanje, Cotools održava osnovni model “smrznutom” dok obučava manje komponente za prosudbu, dohvaćanje i učinkovito pozivanje alata.
Drugi pokretač je protokol konteksta modela (MCP)manje poznati, ali sve više prihvatljiviji standard koji omogućava agentima da nose bogatiji alat i memorijski kontekst kroz korake. U kombinaciji s Gensparkovim vlasničkim skupovima podataka, MCP može biti jedan od razloga što se njihov agent pojavljuje više “upravljani” od alternativa.
Kako se to uspoređuje s Manusom?
Genspark nije prvi startup koji je promovirao opće agente. Manuskoju je prošlog mjeseca pokrenula kineska tvrtka Monica, napravila valove sa svojim sustavom s više agenata, koji autonomno pokreće alate poput web preglednika, uređivača koda ili motora proračunskih tablica za ispunjavanje zadataka s više koraka.
Manusova učinkovita integracija dijelova otvorenog koda, uključujući web alate i LLM-ove poput Claudea iz Antropskog, bila je iznenađujuća. Unatoč tome što nije izgradio vlasnički model, on je i dalje nadmašio OpenAi na referentnoj vrijednosti Gaia-sintetički test namijenjen procjeni automatizacije zadataka u stvarnom svijetu od strane agenata.
Genspark, međutim, tvrdi da je Leapfrogged Manus postigao 87,8% na Gaiji – uspio je Manusov izvijestio o 86% – i to s arhitekturom koja uključuje vlasničke komponente i opsežniju pokrivenost alata.
Veliki tehnološki igrači: još uvijek igraju sigurno?
U međuvremenu, najveće američke tvrtke AI sa sjedištem u SAD-u bile su oprezne.
MicrosoftGlavna ponuda AI agenta, Copilot Studio, usredotočena je na fino podešene vertikalne agense koji se usko usklađuju s Enterprise aplikacijama poput Excel i Outlook. OpenAgent SDK pruža građevne blokove, ali zaustavlja se od isporuke vlastitim punim opsegom, agent opće namjene. AmazonNedavno je najavio NOVA ACT pristupa pristupu za razvoj programera, nudeći akcije temeljene na atomskom pregledniku putem SDK-a, ali čvrsto vezane za svoju Nova LLM i Cloud Infrastrukturu.
Ovi su pristupi modularniji, sigurniji i jasno usmjereni prema upotrebi poduzeća. Ali nedostaju im ambicija – ili autonomija – u demonstraciji Gensparka.
Jedan od razloga može biti odbojnost na rizik. Trošak reputacije mogao bi biti visok ako opći agent iz Googlea ili Microsoftove rezervira pogrešan let ili kaže nešto neobično u glasovnom pozivu. Te su tvrtke također zatvorene u vlastiti model ekosustava, ograničavajući njihovu fleksibilnost za eksperimentiranje s multi-modelom orkestracijom.
Startupi poput Gensparka, nasuprot tome, imaju slobodu miješanja i podudaranja LLMS -a – i brzo se kretati.
Treba li poduzeća brinuti?
To je strateško pitanje. Većini poduzeća ne treba agent opće namjene za izradu rezervacije večere ili proizvodnju satiričnih crtanih filmova. Ali uskoro će im možda trebati agenti koji mogu podnijeti zadatke s više koraka specifičnih za domenu, poput podataka o narastu i oblikovanja, orkestriranja kupca ili stvaranja sadržaja u više formata.
U tom kontekstu, rad Gensparka postaje sve relevantniji. Što više i autonomni opći agenti postaju – i to više integriraju glas, memoriju i vanjske alate – to bi se više mogli početi natjecati s naslijeđenim SaaS aplikacijama i RPA platformama.
I to rade s lakšom infrastrukturom. Genspark, na primjer, tvrdi da je njegov agent “super upravljan” i upotrebljava se od strane trgovca, nastavnika, regrutaca, dizajnera i analitičara – sve s minimalnim postavljanjem.
Era općeg agenta više nije hipotetička. Ovdje je – i kreće se brzo.
Pogledajte ovdje glumačku ulogu:
Web izvor