Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Ai2-ov novi Olmo 3.1 proširuje obuku učenja za pojačanje za snažnija mjerila zaključivanja

Novosti

Ai2-ov novi Olmo 3.1 proširuje obuku učenja za pojačanje za snažnija mjerila zaključivanja

Tomšić Damjan 13. prosinca 2025

Allenov institut za umjetnu inteligenciju (Ai2) nedavno je objavio ono što naziva svojim najmoćnijim obitelj modela još uvijek, Olmo 3. Ali tvrtka je nastavila ponavljati modele, proširujući svoja izvođenja učenja s pojačanjem (RL), kako bi stvorila Olmo 3.1.

Novi modeli Olmo 3.1 usmjereni su na učinkovitost, transparentnost i kontrolu za poduzeća.

Ai2 je ažurirao dvije od tri verzije Olma 2: Olmo 3.1 Think 32B, vodeći model optimiziran za napredna istraživanja, i Olmo 3.1 Instruct 32B, dizajniran za praćenje uputa, višestruki dijalog i korištenje alata.

Olmo 3 ima treću verziju, Olmo 3-Base za programiranje, razumijevanje i matematiku. Također dobro radi za nastavak finog podešavanja.

Ai2 je rekao da su za nadogradnju Olmo 3 Think 32B na Olmo 3.1, njegovi istraživači produžili njegov najbolji RL rad s dužim rasporedom obuke.

“Nakon originalnog pokretanja Olmo 3, nastavili smo s našim RL treningom za Olmo 3 32B Think, trenirajući dodatnih 21 dan na 224 GPU-a s dodatnim epohama preko našeg skupa podataka Dolci-Think-RL”, rekao je Ai2 u post na blogu. “Ovo je donijelo Olmo 3.1 32B Think, koji donosi značajna poboljšanja u mjerilima matematike, rezoniranja i praćenja uputa: poboljšanja od 5+ bodova na AIME-u, 4+ bodova na ZebraLogicu, 4+ bodova na IFEval-u i 20+ bodova na IFBench-u, uz bolju izvedbu kodiranja i složenih zadataka u više koraka.”

Kako bi došli do Olmo 3.1 Instruct, Ai2 je rekao da su njegovi istraživači primijenili recept koji stoji iza manje veličine Instructa, 7B, na veći model.

Olmo 3.1 Instruct 32B je "optimiziran za chat, korištenje alata i višestruki dijalog—što ga čini mnogo učinkovitijim bratom Olmo 3 Instruct 7B i spremnim za aplikacije u stvarnom svijetu,” rekao je Ai2 u objavite na X.

Za sada su nove kontrolne točke dostupne na Ai2 Playground ili Hugging Face, a pristup API-ju uskoro dolazi.

Sadržaj objave

  • 1 Bolji učinak na mjerilima
  • 2 Predanost transparentnosti i otvorenom kodu
    • 2.1 Povezani sadržaji

Bolji učinak na mjerilima

Modeli Olmo 3.1 pokazali su se dobro na benchmark testovima, predvidljivo pobijedivši modele Olmo 3.

Olmo 3.1 Think nadmašio je modele Qwen 3 32B u AIME 2025 benchmarku i pokazao se blizu Gemma 27B.

Olmo 3.1 Instruct pokazao se snažno u usporedbi s konkurentima otvorenog koda, čak je nadmašio modele poput Gemme 3 na mjerilu Math.

“Što se tiče Olmo 3.1 32B Instruct, to je opsežniji model prilagođen uputama izgrađen za chat, korištenje alata i višestruki dijalog. Olmo 3.1 32B Instruct je naš najsposobniji potpuno otvoreni chat model do sada i – prema našim procjenama – najjači potpuno otvoreni model uputa na skali 32B,” rekla je tvrtka.

Ai2 je također nadogradio svoje modele RL-Zero 7B za matematiku i kodiranje. Tvrtka je na X izjavila da su oba modela imala koristi od dužih i stabilnijih treninga.

Predanost transparentnosti i otvorenom kodu

Ai2 je ranije rekao za VentureBeat da je dizajnirao Olmo 3 obitelj modela kako bi poduzećima i istraživačkim laboratorijima ponudio više kontrole i razumijevanja podataka i obuke koja je ušla u model.

Organizacije bi mogle dodati u kombinaciju podataka modela i ponovno je uvježbati da također uče iz onoga što je dodano.

Ovo je dugo bila obveza za Ai2, koji također nudi alat pod nazivom OlmoTrace koji prati kako rezultati LLM-a odgovaraju podacima o obuci.

“Zajedno, Olmo 3.1 Think 32B i Olmo 3.1 Instruct 32B pokazuju da otvorenost i izvedba mogu napredovati zajedno. Proširujući isti tijek modela, nastavljamo poboljšavati mogućnosti zadržavajući end-to-end transparentnost nad podacima, kodom i odlukama o obuci,” rekao je Ai2.

Web izvor

Povezani sadržaji

  • Google Gemini 3.1 Pro prvi dojmovi: ‘Deep Think Mini’ s prilagodljivim razmišljanjem na zahtjevGoogle Gemini 3.1 Pro prvi dojmovi: ‘Deep Think Mini’ s prilagodljivim razmišljanjem na zahtjev
  • Što je Microsoft Word?
  • Nizovi podataka ExcelAutomatski nizovi podataka u Excelu
  • Kako postaviti i koristiti Google Family Link za kontrolu dječjeg mobitelaKako postaviti i koristiti Google Family Link za kontrolu dječjeg mobitela
  • Nedostatak automatizacije ometa britansku industriju vlakanaNedostatak automatizacije ometa britansku industriju vlakana
  • Ništa ažuriranje OS 4.0 zadirkivano je osvježenim dizajnom, nadograđenom kamerom, višeNišta ažuriranje OS 4.0 zadirkivano je osvježenim dizajnom, nadograđenom kamerom, više

Previous Article

Ljudi već uzimaju ovaj neodobreni novi lijek za mršavljenje

Next Article

AI i digitalni blizanci: moćno partnerstvo za urbano upravljanje

Posljednje objave

The best external hard drives of 2026: Expert tested

AT&T-ovi novi neograničeni planovi izgledaju solidno

AT&T-ovi novi neograničeni planovi izgledaju solidno

Dok se vrte glasine o Witcher 3 DLC-u, CD Projekt Red želi da znate da Cyberpunk 2077 više neće dobivati ​​nikakav ‘tajni’ sadržaj

Dok se vrte glasine o Witcher 3 DLC-u, CD Projekt Red želi da znate da Cyberpunk 2077 više neće dobivati ​​nikakav ‘tajni’ sadržaj

Sadržaj

  • 1 Bolji učinak na mjerilima
  • 2 Predanost transparentnosti i otvorenom kodu

Novosti

  • The best external hard drives of 2026: Expert tested 15. ožujka 2026
  • AT&T-ovi novi neograničeni planovi izgledaju solidno 15. ožujka 2026
  • Dok se vrte glasine o Witcher 3 DLC-u, CD Projekt Red želi da znate da Cyberpunk 2077 više neće dobivati ​​nikakav ‘tajni’ sadržaj 15. ožujka 2026
  • Altneti ‘na koje se mora računati’ u širokopojasnom pristupu u Velikoj Britaniji 15. ožujka 2026
  • Random Labs koji podržava Y Combinator lansira Slate V1, tvrdeći da je prvi ‘swarm-native’ agent za kodiranje 14. ožujka 2026
  • Pi možete približno izračunati bacanjem igala na pod 14. ožujka 2026
  • Zašto koristim Appleove i Googleove upravitelje lozinkama – i ne obaziri se na kaos 14. ožujka 2026
  • T-Mobile izbacuje 2TB + neograničene korisnike Google fotografija na Google tamo gdje njihov plan ne postoji 14. ožujka 2026
  • “Ljudi jednostavno nisu bili spremni za” Starfield, kaže skladatelj igre dok govori o “vizionaru” Toddu Howardu 14. ožujka 2026
  • Openreach testira ‘pionirsko’ otkrivanje curenja vode optičkim vlaknima 14. ožujka 2026

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice