Pristupi otvorenog koda i dalje obećavaju u demokratizaciji umjetne inteligencije (AI).
Sadržaj objave
NovaSky Sky-T1-32B-Preview
U petak je istraživački tim NovaSky na UC Berkeley pušten na slobodu novi model rezoniranja, Sky-T1-32B-Preview, koji se može usporediti s OpenAI-jevim o1-previewom — samo što je otvorenog koda i napravljen je u samo 19 sati za manje od 450 USD koristeći osam Nvidia H100 GPU-a.
Također: Najbolji modeli AI otvorenog koda: Objašnjene su sve vaše besplatne opcije
Tim je razvio Sky-T1 finim podešavanjem Alibabinog Qwen2.5-32-Instructa i trenirao ga na podacima generiranim s QwQ-32B-Preview, još jednim modelom otvorenog koda usporedivim s o1-previewom. Korištenje sintetičkih podataka o obuci može pomoći u smanjenju troškova.
“Pripremamo mješavinu podataka kako bismo pokrili različite domene koje zahtijevaju obrazloženje i proceduru odbijanja uzorkovanja kako bismo poboljšali kvalitetu podataka. Zatim prepisujemo QwQ tragove s GPT-4o-mini u dobro formatiranu verziju, nadahnutu Ipak-2kako bismo poboljšali kvalitetu podataka i olakšali raščlanjivanje”, kaže tim o svom procesu pripreme podataka na blogu.
Nadmašuje OpenAI-jev o1-preview
Model je bio na ili iznad razine o1-preview na referentnim vrijednostima matematike i kodiranja, ali nije premašio o1 na referentnoj vrijednosti na diplomskoj razini GPQA-dijamantkoji uključuje naprednija pitanja vezana uz fiziku. NovaSky je otvorio sve dijelove modela, uključujući težine, podatke, infrastrukturu i tehničke detalje.
Također: OpenAI-jev o1 laže više od bilo kojeg većeg AI modela. Zašto je to važno
o1 je sada izvan pregleda i stoga je sposobniji od svog početnog izdanja. Plus, OpenAI se već priprema lansirati o3, za koji tvrtka kaže da može nadmašiti o1. Ali kako NovaSky tim ističe u svom blogu, činjenica da se Sky-T1 može izgraditi tako brzo još uvijek “pokazuje[es] da je moguće jeftino i učinkovito replicirati sposobnosti rasuđivanja na visokoj razini.”
Pristupačniji model rezoniranja
Relativno kratko vrijeme obuke od 19 sati znači da je izgradnja Sky-T1 koštala samo 450 dolara, prema cijenama Lambda Clouda, pojašnjava tim u objavi na blogu. Uzimajući u obzir da je GPT-4 koristio navodnih 78 milijuna dolara u računanju, nije mali podvig predstaviti primjer pristupačnijeg modela razmišljanja koji mogu replicirati akademske grupe i grupe otvorenog koda koje nemaju financiranje OpenAI-ja.
Gotovo polovica onih koji prihvaćaju generativnu umjetnu inteligenciju želi da ona bude otvorenog koda, navodeći zabrinutost zbog troškova i povjerenja. Nastavak otkrića u umjetnoj inteligenciji otvorenog koda mogao bi stvoriti ravnopravnije uvjete za manje laboratorije, neprofitne organizacije i druge subjekte za razvoj konkurentskih modela — osvježenje za novo područje kojim već dominiraju tehnološki divovi.




