OpenAi se vraća korijenima otvorenog koda s novim AI modelima otvorene težine, a to je velika stvar

Beata Zawrzel/Nurphoto putem Getty Images

Sadržaj objave

1 ZDNET -ovi ključni poduhvat
2 Povezani sadržaji

ZDNET -ovi ključni poduhvat

OpenAi objavljuje svoje prve LLM-ove otvorenog koda u šest godina.
OpenAi -ov najmanji AI model može se pokrenuti na prijenosnom računalu.
Rana izvješća pokazuju da ovi novi modeli mogu imati problema s halucinacijama.

Svi znamo da se AI oslanja na softver otvorenog koda, ali većina tvrtki za velike umjetne inteligencije (AI) izbjegava otvaranje utega koda ili velikog jezičnog modela (LLM). Sada su se stvari promijenile. OpenAi, AI Titan iza chatgpt-a, najavio je značajan povratak u svoje podrijetlo otvorenog koda.

Tvrtka ima Otkrili dva nova modela jezika otvorene težineGPT-OSS-120B i GPT-OSS-20B, označavajući prvo javno izdanje tvrtke Freely Alleased AI model utega od GPT-2 2019. godine, mnogo prije nego što je AI Hype preuzeo tehnološki svijet.

Također: OpenAi bi sada mogao lansirati GPT -5 bilo kojim minutom – što očekivati

Modeli otvorene težine omogućuju bilo kome da preuzme, ispita, pokreće ili fino podešava LLM. Ovi modeli eliminiraju potrebu za oslobađanjem na API-u udaljenih oblaka ili izlažu unutarnjim osjetljivim podacima vanjskim uslugama.

OpenAi, međutim, nije objavio podatke o treningu koji se koriste za ove modele zbog pravnih i sigurnosnih problema. Ta situacija neće ugoditi AI puristima otvorenog koda, ali programeri širom svijeta već testiraju dva modela.

Također: Google ugrađuje AI agente duboko u svoj skup podataka – evo što mogu učiniti za vas

Ova promjena u suprotnosti je s OpenAijevim pristupom u posljednjih pet godina. Posao je prioritetno odredio vlasnička izdanja potaknuta masivnim Microsoftovim ulaganjima i unosnim API -jevim ugovorima.

Uostalom, ne možete se nadati da ćete postati AI tvrtka za trilijun dolara bez maksimiziranja profita. S druge strane, Open Source je dosljedno pokazao da kada se kod otvoreno razvija, svi, uključujući tvrtku koja objavljuje Kodeks, koristi.

A GPT-OSS-120B Model cilja na poslužitelje visokih performansi i radne površine s pojačanim specifikacijama, uključujući 60 GB VRAM-a i više GPU-a, dok GPT-OSS-20B Verzija je dovoljno kompaktna za većinu prijenosnih računala.

Možete preuzeti modele iz Zagrljaj lica ili Ždrijeb. U oba slučaja, vaš hardver mora posebno pokrenuti macOS ili Linux, s MacOS 11 Big Sur ili kasnije, ili Linuxom s Ubuntu 18.04 ili kasnije za pokretanje programa. Modeli bi se također mogli pokrenuti na Windows podsustavu za Linux (WSL) 2.0 na jakim Windows sustavima.

Također: ljudi koriste chatgpt za pisanje svojih tekstualnih poruka – evo kako možete reći

OpenAi je rekao: ” GPT-OSS-120B model postiže blizu pariteta s OpenAi O4-Mini na referentnim vrijednostima jezgre, dok se učinkovito trči na jednom GPU od 80 GB. GPT-OSS-20B model daje slične rezultate OpenAi O3-Mini na uobičajenim mjerilima i može se pokretati na rubnim uređajima sa samo 16 GB memorije. “

Pa, koliko su dobri modeli? Stručnjak za AI Nate Jones udario je gume i izvještavao: “Ovaj je posebno usmjeren Povratak američke dominacije u modelima otvorenog koda Sad kad je Llama ispustila loptu. Rani testovi ukazuju na veći od uobičajenog rizika halucinacijaali snaga modela je stvarna i nastavlja naglasiti kako brzo AI napreduje. Promatrat ću kako se brzo ovi modeli pokupe na zagrljaj lica od strane programera (koje je teško vrtjeti). “

Modeli su licencirani u okviru Apache 2.0, jedne od najpremsivnijih otvorenih licenci. To omogućava poduzećima i programerima da koriste, mijenjaju i unovčavaju tehnologiju bez restriktivnih pojmova, za razliku od Meta ne stvarnog otvorenog koda Llama LLMS.

Također: Antropin moćan model Opus 4.1 je ovdje – kako mu pristupiti (i zašto ćete htjeti)

Oba modela koriste arhitekturu mješavine prelaznih (MOE), koja ima snažne mogućnosti rasuđivanja, a pritom je optimiziran za učinkovitost i korištenje alata.

Programeri će biti zainteresirani za mogućnosti izvršavanja koda, dok će pisci i istraživači smatrati uključivanjem web pretraživanja kao dijela misaonog procesa zanimljivim. S druge strane, pokazuju rani izvještaji Vrlo visoke razine halucinacija. Uz to, oba su modela ograničena na obradu teksta.

Također: moj alat za go-to llm upravo je bacio super jednostavnu mac i pc aplikaciju za lokalni AI

Zašto je Openai napravio ovaj potez? Tvrtka je izričito izjavila da ta otvorena izdanja imaju za cilj smanjiti prepreke na tržištima u nastajanju i među manjim organizacijama.

Posao je također primijetio da je kineski model otvorenog koda Deepseek, koji je objavljen u siječnju, napravio valove zahvaljujući brzini, snazi i činjenici da je otvoreni izvor. Kao što je Altman rekao ubrzo nakon što je Deepseek privukao svačiju pažnju u Redditu “Pitajte me bilo što”, vjerovao je OpenAi je bio “na pogrešnoj strani povijesti” o ne otvorenom izvoru svog softvera.

Sada, uoči izdanja chatgpt 5, Openai je opet na desnoj strani.

Web izvor