Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

CycleQD tvrtke Sakana AI nadmašuje tradicionalne metode finog podešavanja za jezične modele s više vještina

Novosti

CycleQD tvrtke Sakana AI nadmašuje tradicionalne metode finog podešavanja za jezične modele s više vještina

Tomšić Damjan 7. prosinca 2024


Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj o AI pokrivenosti vodećoj u industriji. Saznajte više


Istraživači na Sakana AI razvili su resursno učinkovit okvir koji može stvoriti stotine jezičnih modela specijaliziranih za različite zadatke. Nazvana CiklusQDtehnika koristi evolucijske algoritme za kombiniranje vještina različitih modela bez potrebe za skupim i sporim procesima obuke.

CycleQD može stvoriti rojeve agenata specifičnih za zadatak koji nude održiviju alternativu trenutnoj paradigmi povećanja veličine modela.

Sadržaj objave

  • 1 Ponovno promišljanje modela obuke
  • 2 CiklusQD
  • 3 Procjena performansi CycleQD-a
    • 3.1 Povezani sadržaji

Ponovno promišljanje modela obuke

Veliki jezični modeli (LLM) pokazali su izvanredne sposobnosti u različitim zadacima. Međutim, osposobljavanje LLM-a za svladavanje više vještina ostaje izazov. Prilikom finog podešavanja modela, inženjeri moraju uravnotežiti podatke iz različitih vještina i osigurati da jedna vještina ne dominira nad drugom. Sadašnji pristupi često uključuju obuku sve većih modela, što dovodi do povećanja računalnih zahtjeva i zahtjeva za resursima.

“Vjerujemo da umjesto cilja razvoja jednog velikog modela koji će dobro obavljati sve zadatke, populacijski pristupi za razvoj raznolikog roja nišnih modela mogu ponuditi alternativni, održiviji put za povećanje razvoja AI agenata s naprednim mogućnostima. ”, pišu istraživači Sakane u postu na blogu.

Kako bi stvorili populacije modela, istraživači su uzeli inspiraciju iz raznolikosti kvalitete (QD), evolucijske računalne paradigme koja se fokusira na otkrivanje raznolikog skupa rješenja iz početnog uzorka populacije. QD ima za cilj stvaranje uzoraka s različitim “karakteristikama ponašanja” (BC), koje predstavljaju različite domene vještina. To postiže putem evolucijskih algoritama (EA) koji odabiru roditeljske primjere i koriste operacije križanja i mutacije za stvaranje novih uzoraka.

Kvalitetna raznolikost (izvor: Sakana AI)

CiklusQD

CycleQD uključuje QD u proces post-treninga LLM-a kako bi im pomogao u učenju novih, složenih vještina. CycleQD je koristan kada imate više malih modela koji su fino podešeni za vrlo specifične vještine, kao što je kodiranje ili izvođenje operacija baze podataka i operacijskog sustava, a želite stvoriti nove varijante koje imaju različite kombinacije tih vještina.

U okviru CycleQD, svaka od ovih vještina smatra se karakteristikom ponašanja ili kvalitetom za koju je optimizirana sljedeća generacija modela. U svakoj generaciji, algoritam se usredotočuje na jednu specifičnu vještinu kao svoju metriku kvalitete dok druge vještine koristi kao BC.

“Ovo osigurava da svaka vještina dobije svoj trenutak u središtu pozornosti, omogućujući LLM-ima da budu sveukupno uravnoteženiji i sposobniji”, objašnjavaju istraživači.

CycleQD (izvor: Sakana AI)

CycleQD počinje sa skupom stručnjaka LLM-a, od kojih je svaki specijaliziran za jednu vještinu. Algoritam zatim primjenjuje operacije “križanja” i “mutacije” kako bi populaciji dodao nove modele više kvalitete. Crossover kombinira karakteristike dva roditeljska modela za stvaranje novog modela, dok mutacija čini nasumične promjene u modelu kako bi se istražile nove mogućnosti.

Operacija križanja temelji se na spajanju modela, tehnici koja kombinira parametre dva LLM-a kako bi se stvorio novi model s kombiniranim vještinama. Ovo je ekonomična i brza metoda za razvoj dobro zaokruženih modela bez potrebe za njihovim finim podešavanjem.

Operacija mutacije koristi dekompozicija singularne vrijednosti (SVD), metoda faktorizacije koja rastavlja bilo koju matricu na jednostavnije komponente, olakšavajući razumijevanje i manipuliranje njezinim elementima. CycleQD koristi SVD za rastavljanje vještina modela na temeljne komponente ili podvještine. Ugađanjem ovih pod-vještina, proces mutacije stvara modele koji istražuju nove mogućnosti izvan onih svojih roditeljskih modela. To pomaže modelima da izbjegnu zaglavljivanje u predvidljivim uzorcima i smanjuje rizik od prekomjernog opremanja.

Procjena performansi CycleQD-a

Istraživači su primijenili CycleQD na skup Llama 3-8B stručnih modela fino podešenih za kodiranje, operacije baze podataka i operacije operativnog sustava. Cilj je bio vidjeti može li evolucijska metoda kombinirati vještine triju modela za stvaranje superiornog modela.

Rezultati su pokazali da je CycleQD nadmašio tradicionalne metode finog podešavanja i spajanja modela u svim ocjenjivanim zadacima. Naime, model fino podešen na svim skupovima podataka u kombinaciji imao je samo neznatno bolje rezultate od modela stručnjaka s jednom vještinom, unatoč tome što je obučen na više podataka. Štoviše, tradicionalni proces treninga puno je sporiji i skuplji. CycleQD je također bio u mogućnosti stvoriti različite modele s različitim razinama izvedbe na ciljnim zadacima.

“Ovi rezultati jasno pokazuju da CycleQD nadmašuje tradicionalne metode, dokazujući njegovu učinkovitost u osposobljavanju LLM-a za postizanje višestrukih vještina”, pišu istraživači.

CycleQD u odnosu na druge metode finog podešavanja (izvor: Sakana AI)

Istraživači vjeruju da CycleQD ima potencijal omogućiti cjeloživotno učenje u sustavima umjetne inteligencije, omogućujući im kontinuirani rast, prilagodbu i akumulaciju znanja tijekom vremena. To može imati izravne implikacije za aplikacije u stvarnom svijetu. Na primjer, CycleQD se može koristiti za kontinuirano spajanje vještina stručnih modela umjesto treniranja velikog modela od nule.

Još jedan uzbudljiv smjer je razvoj sustava s više agenata, gdje rojevi specijaliziranih agenata razvijenih kroz CycleQD mogu surađivati, natjecati se i učiti jedni od drugih.

“Od znanstvenih otkrića do rješavanja problema u stvarnom svijetu, rojevi specijaliziranih agenata mogli bi redefinirati granice umjetne inteligencije”, pišu istraživači.

VB Dnevnik

Budite u toku! Svakodnevno primajte najnovije vijesti u svoju pristiglu poštu

Pretplatom se slažete s Uvjetima pružanja usluge VentureBeata.

Hvala što ste se pretplatili. Više VB biltena pogledajte ovdje.

Došlo je do pogreške.



Web izvor

Povezani sadržaji

  • Epske igre izvlače pobjedu u najnovijoj presudi sudske presude u slučaju Apple AntiTtrust
  • Vodafone Idea izgleda kako bi poboljšala Enterprise Comms s optičkom nadogradnjomVodafone Idea izgleda kako bi poboljšala Enterprise Comms s optičkom nadogradnjom
  • RFK Jr. je spakirao panel o autizmu s kretenima i teoretičarima zavjereRFK Jr. je spakirao panel o autizmu s kretenima i teoretičarima zavjere
  • “Scenariji su nevjerojatni i vrlo smiješni” – Sigourney Weaver potvrđuje da će glumiti Wallacea u akcijskoj seriji Tomb Raider uživo“Scenariji su nevjerojatni i vrlo smiješni” – Sigourney Weaver potvrđuje da će glumiti Wallacea u akcijskoj seriji Tomb Raider uživo
  • Osnovna tehnologija za optičke podatkovne komunikacije, senzore i umjetnu inteligenciju udara u vjetarOsnovna tehnologija za optičke podatkovne komunikacije, senzore i umjetnu inteligenciju udara u vjetar
  • Kako još uvijek možete pristupiti GPT-4O, O3 i drugim starijim modelima u chatgptKako još uvijek možete pristupiti GPT-4O, O3 i drugim starijim modelima u chatgpt

Previous Article

Tajanstvena respiratorna bolest stavila je Demokratsku Republiku Kongo u stanje pripravnosti

Next Article

Zabrana TikToka u SAD-u je neizbježna nakon neuspjeha žalbe

Posljednje objave

Dok se vrte glasine o Witcher 3 DLC-u, CD Projekt Red želi da znate da Cyberpunk 2077 više neće dobivati ​​nikakav ‘tajni’ sadržaj

Dok se vrte glasine o Witcher 3 DLC-u, CD Projekt Red želi da znate da Cyberpunk 2077 više neće dobivati ​​nikakav ‘tajni’ sadržaj

Altneti ‘na koje se mora računati’ u širokopojasnom pristupu u Velikoj Britaniji

Random Labs koji podržava Y Combinator lansira Slate V1, tvrdeći da je prvi ‘swarm-native’ agent za kodiranje

Random Labs koji podržava Y Combinator lansira Slate V1, tvrdeći da je prvi ‘swarm-native’ agent za kodiranje

Sadržaj

  • 1 Ponovno promišljanje modela obuke
  • 2 CiklusQD
  • 3 Procjena performansi CycleQD-a

Novosti

  • Dok se vrte glasine o Witcher 3 DLC-u, CD Projekt Red želi da znate da Cyberpunk 2077 više neće dobivati ​​nikakav ‘tajni’ sadržaj 15. ožujka 2026
  • Altneti ‘na koje se mora računati’ u širokopojasnom pristupu u Velikoj Britaniji 15. ožujka 2026
  • Random Labs koji podržava Y Combinator lansira Slate V1, tvrdeći da je prvi ‘swarm-native’ agent za kodiranje 14. ožujka 2026
  • Pi možete približno izračunati bacanjem igala na pod 14. ožujka 2026
  • Zašto koristim Appleove i Googleove upravitelje lozinkama – i ne obaziri se na kaos 14. ožujka 2026
  • T-Mobile izbacuje 2TB + neograničene korisnike Google fotografija na Google tamo gdje njihov plan ne postoji 14. ožujka 2026
  • “Ljudi jednostavno nisu bili spremni za” Starfield, kaže skladatelj igre dok govori o “vizionaru” Toddu Howardu 14. ožujka 2026
  • Openreach testira ‘pionirsko’ otkrivanje curenja vode optičkim vlaknima 14. ožujka 2026
  • NanoClaw i Docker su partneri kako bi napravili sandboxove najsigurnijim načinom za poduzeća da implementiraju AI agente 13. ožujka 2026
  • Virus herpesa može vas brže stariti 13. ožujka 2026

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice