Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Ai2-ov novi Olmo 3.1 proširuje obuku učenja za pojačanje za snažnija mjerila zaključivanja

Novosti

Ai2-ov novi Olmo 3.1 proširuje obuku učenja za pojačanje za snažnija mjerila zaključivanja

Tomšić Damjan 13. prosinca 2025

Allenov institut za umjetnu inteligenciju (Ai2) nedavno je objavio ono što naziva svojim najmoćnijim obitelj modela još uvijek, Olmo 3. Ali tvrtka je nastavila ponavljati modele, proširujući svoja izvođenja učenja s pojačanjem (RL), kako bi stvorila Olmo 3.1.

Novi modeli Olmo 3.1 usmjereni su na učinkovitost, transparentnost i kontrolu za poduzeća.

Ai2 je ažurirao dvije od tri verzije Olma 2: Olmo 3.1 Think 32B, vodeći model optimiziran za napredna istraživanja, i Olmo 3.1 Instruct 32B, dizajniran za praćenje uputa, višestruki dijalog i korištenje alata.

Olmo 3 ima treću verziju, Olmo 3-Base za programiranje, razumijevanje i matematiku. Također dobro radi za nastavak finog podešavanja.

Ai2 je rekao da su za nadogradnju Olmo 3 Think 32B na Olmo 3.1, njegovi istraživači produžili njegov najbolji RL rad s dužim rasporedom obuke.

“Nakon originalnog pokretanja Olmo 3, nastavili smo s našim RL treningom za Olmo 3 32B Think, trenirajući dodatnih 21 dan na 224 GPU-a s dodatnim epohama preko našeg skupa podataka Dolci-Think-RL”, rekao je Ai2 u post na blogu. “Ovo je donijelo Olmo 3.1 32B Think, koji donosi značajna poboljšanja u mjerilima matematike, rezoniranja i praćenja uputa: poboljšanja od 5+ bodova na AIME-u, 4+ bodova na ZebraLogicu, 4+ bodova na IFEval-u i 20+ bodova na IFBench-u, uz bolju izvedbu kodiranja i složenih zadataka u više koraka.”

Kako bi došli do Olmo 3.1 Instruct, Ai2 je rekao da su njegovi istraživači primijenili recept koji stoji iza manje veličine Instructa, 7B, na veći model.

Olmo 3.1 Instruct 32B je "optimiziran za chat, korištenje alata i višestruki dijalog—što ga čini mnogo učinkovitijim bratom Olmo 3 Instruct 7B i spremnim za aplikacije u stvarnom svijetu,” rekao je Ai2 u objavite na X.

Za sada su nove kontrolne točke dostupne na Ai2 Playground ili Hugging Face, a pristup API-ju uskoro dolazi.

Sadržaj objave

  • 1 Bolji učinak na mjerilima
  • 2 Predanost transparentnosti i otvorenom kodu
    • 2.1 Povezani sadržaji

Bolji učinak na mjerilima

Modeli Olmo 3.1 pokazali su se dobro na benchmark testovima, predvidljivo pobijedivši modele Olmo 3.

Olmo 3.1 Think nadmašio je modele Qwen 3 32B u AIME 2025 benchmarku i pokazao se blizu Gemma 27B.

Olmo 3.1 Instruct pokazao se snažno u usporedbi s konkurentima otvorenog koda, čak je nadmašio modele poput Gemme 3 na mjerilu Math.

“Što se tiče Olmo 3.1 32B Instruct, to je opsežniji model prilagođen uputama izgrađen za chat, korištenje alata i višestruki dijalog. Olmo 3.1 32B Instruct je naš najsposobniji potpuno otvoreni chat model do sada i – prema našim procjenama – najjači potpuno otvoreni model uputa na skali 32B,” rekla je tvrtka.

Ai2 je također nadogradio svoje modele RL-Zero 7B za matematiku i kodiranje. Tvrtka je na X izjavila da su oba modela imala koristi od dužih i stabilnijih treninga.

Predanost transparentnosti i otvorenom kodu

Ai2 je ranije rekao za VentureBeat da je dizajnirao Olmo 3 obitelj modela kako bi poduzećima i istraživačkim laboratorijima ponudio više kontrole i razumijevanja podataka i obuke koja je ušla u model.

Organizacije bi mogle dodati u kombinaciju podataka modela i ponovno je uvježbati da također uče iz onoga što je dodano.

Ovo je dugo bila obveza za Ai2, koji također nudi alat pod nazivom OlmoTrace koji prati kako rezultati LLM-a odgovaraju podacima o obuci.

“Zajedno, Olmo 3.1 Think 32B i Olmo 3.1 Instruct 32B pokazuju da otvorenost i izvedba mogu napredovati zajedno. Proširujući isti tijek modela, nastavljamo poboljšavati mogućnosti zadržavajući end-to-end transparentnost nad podacima, kodom i odlukama o obuci,” rekao je Ai2.

Web izvor

Povezani sadržaji

  • Ožičeni zdravstveni sažetak: cjepiva protiv raka, proboji CRISPR -a i još mnogo togaOžičeni zdravstveni sažetak: cjepiva protiv raka, proboji CRISPR -a i još mnogo toga
  • Kako koristiti Tor za privatno pregledavanje weba – lakše je nego što misliteKako koristiti Tor za privatno pregledavanje weba – lakše je nego što mislite
  • Autor Witchera Andrzej Sapkowski kaže da je “rijetkost” da CD Projekt Red sada traži dodatne detaljeAutor Witchera Andrzej Sapkowski kaže da je “rijetkost” da CD Projekt Red sada traži dodatne detalje
  • Utjecaj posjedovanja psa na klimuUtjecaj posjedovanja psa na klimu
  • Kako pregledati svoje SSH ključeve u Linuxu, macOS-u i WindowsimaKako pregledati svoje SSH ključeve u Linuxu, macOS-u i Windowsima
  • Nakon 9 mjeseci u svemiru, nasukani NASA astronauti vraćaju se kućiNakon 9 mjeseci u svemiru, nasukani NASA astronauti vraćaju se kući

Previous Article

Ljudi već uzimaju ovaj neodobreni novi lijek za mršavljenje

Next Article

AI i digitalni blizanci: moćno partnerstvo za urbano upravljanje

Posljednje objave

Kako astronomi pronalaze planete u drugim Sunčevim sustavima?

Kako astronomi pronalaze planete u drugim Sunčevim sustavima?

Ova nova Linux platforma omogućit će vam ažuriranje vašeg sljedećeg automobila kod kuće – već 2027. godine

20+ useful Roku shortcuts and menus that every user should know about (and how to access them)

Sadržaj

  • 1 Bolji učinak na mjerilima
  • 2 Predanost transparentnosti i otvorenom kodu

Novosti

  • Kako astronomi pronalaze planete u drugim Sunčevim sustavima? 15. prosinca 2025
  • Ova nova Linux platforma omogućit će vam ažuriranje vašeg sljedećeg automobila kod kuće – već 2027. godine 15. prosinca 2025
  • 20+ useful Roku shortcuts and menus that every user should know about (and how to access them) 15. prosinca 2025
  • Google prevoditelj dobiva svježi AI model, beta verziju prijevoda uživo za slušalice 14. prosinca 2025
  • Osnivač Sledgehammera razmišlja o “gorkim” promjenama u EA i Activisionu: “Gledati ih kako blijede pogađa jače od očekivanog” 14. prosinca 2025
  • ESA obećava pametnije letove za ITA Airways putem satelitskih komunikacija 14. prosinca 2025
  • Zašto većina pilot projekata AI kodiranja u poduzećima nije uspješna (savjet: to nije model) 14. prosinca 2025
  • Google podatkovni centri vraćaju nuklearnu energiju u Zemlju tornada 14. prosinca 2025
  • Linus Torvalds ‘jako vjeruje’ u korištenje umjetne inteligencije za održavanje koda – samo nemojte to zvati revolucijom 14. prosinca 2025
  • Kako instalirati i konfigurirati Claude Code, korak po korak 13. prosinca 2025

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice