Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Korejski AI startup Motif otkriva 4 velike lekcije za obuku LLM-a za poduzeća

Novosti

Korejski AI startup Motif otkriva 4 velike lekcije za obuku LLM-a za poduzeća

Tomšić Damjan 16. prosinca 2025

Čuli smo (i napisali, ovdje na VentureBeatu) puno o generativnoj AI utrci između SAD-a i Kine, budući da su to bile zemlje s grupama koje su bile najaktivnije u predstavljanju novih modela (uz pohvale Cohereu u Kanadi i Mistralu u Francuskoj).

Ali sada korejski startup pravi valove: prošli tjedan, tvrtka poznata kao Motif Technologies pušten na slobodu Motiv-2-12.7B-Razumovanjejoš jedan model otvorene težine s malim parametrima koji se može pohvaliti impresivnim referentnim rezultatima, brzo postavši najučinkovitiji model iz te zemlje prema neovisni benchmarking laboratorij Umjetna analiza (pobijedivši čak i uobičajeni GPT-5.1 američkog vodećeg OpenAI-ja).

Ali što je još važnije za poslovne timove AI, tvrtka ima objavio bijelu knjigu na arxiv.org s konkretnim, ponovljivim receptom za obuku koji otkriva odakle zapravo dolazi izvedba rasuđivanja – i gdje uobičajeni interni napori LLM-a obično propadaju.

Za organizacije koje grade ili fino podešavaju svoje vlastite modele iza vatrozida, rad nudi niz praktičnih lekcija o usklađivanju podataka, infrastrukturi dugog konteksta i stabilnosti učenja pojačanja koje su izravno primjenjive na okruženja poduzeća. Evo ih:

Sadržaj objave

  • 1 1. Dobici u rasuđivanju proizlaze iz distribucije podataka, a ne veličine modela
  • 2 2. Obuka s dugim kontekstom najprije je problem infrastrukture
  • 3 3. RL fino podešavanje ne uspijeva bez filtriranja i ponovne upotrebe podataka
  • 4 4. Optimizacija memorije određuje što je uopće moguće
  • 5 Zašto je to važno za poslovne timove za umjetnu inteligenciju
    • 5.1 Povezani sadržaji

1. Dobici u rasuđivanju proizlaze iz distribucije podataka, a ne veličine modela

Jedno od Motifovih najrelevantnijih otkrića za poslovne timove jest to podaci sintetičkog zaključivanja pomaže samo kada njegova struktura šibice the stil razmišljanja ciljanog modela.

Rad pokazuje mjerljive razlike u performansama nizvodnog kodiranja ovisno o tome koji je model “učitelja” generirao tragove razmišljanja korištene tijekom nadziranog finog podešavanja.

Za poduzeća to potkopava uobičajeni prečac: generiranje velikih količina sintetičkih podataka lanca misli iz graničnog modela i pretpostavka da će se oni prenijeti čisto. Motifovi rezultati sugeriraju da neusklađeni tragovi razmišljanja mogu aktivno utjecati na izvedbu, čak i ako izgledaju visoke kvalitete.

Zaključak je operativan, a ne akademski: timovi bi trebali potvrditi da njihovi sintetički podaci odražavaju format, opširnost i granularnost koraka žele u vrijeme zaključivanja. Unutarnje evaluacijske petlje važnije su od kopiranja vanjskih skupova podataka.

2. Obuka s dugim kontekstom najprije je problem infrastrukture

Motif trenira u kontekstu od 64K, ali dokument jasno pokazuje da ovo nije samo tokenizator ili podešavanje kontrolnih točaka.

Model se oslanja na hibridni paralelizam, pažljive strategije dijeljenja i agresivno određivanje kontrolnih točaka aktivacije kako bi obuka dugog konteksta bila izvediva na hardveru klase Nvidia H100.

Za graditelje poduzeća poruka je otrežnjujuća, ali korisna: mogućnost dugog konteksta ne može se kasno uključiti.

Ako su tijekovi rada s velikim brojem dohvaćanja ili agenti ključni za slučaj poslovne upotrebe, duljina konteksta mora biti dizajnirana u skupu za obuku od samog početka. U protivnom, timovi riskiraju skupe cikluse prekvalifikacije ili nestabilna fina podešavanja.

3. RL fino podešavanje ne uspijeva bez filtriranja i ponovne upotrebe podataka

Motifov cjevovod za fino podešavanje učenja za pojačanje (RLFT) naglašava filtriranje s obzirom na poteškoće – zadržavanje zadataka čije su stope prolaznosti unutar definiranog raspona – umjesto neselektivnog skaliranja nagradne obuke.

Ovo izravno rješava bolnu točku s kojom se susreću mnogi poslovni timovi kada eksperimentiraju s RL-om: regresije izvedbe, kolaps načina rada ili krhki dobici koji nestaju izvan referentnih vrijednosti. Motif također ponovno koristi putanje kroz politike i proširuje raspone rezanja, mijenjajući teoretsku čistoću za stabilnost treninga.

Lekcija poduzeća je jasna: RL je problem sustava, a ne samo problem modela nagrađivanja. Bez pažljivog filtriranja, ponovne upotrebe i balansiranja više zadataka, RL može destabilizirati modele koji su inače spremni za proizvodnju.

4. Optimizacija memorije određuje što je uopće moguće

Motifova upotreba optimizacija na razini jezgre za smanjenje pritiska RL memorije naglašava često zanemarena ograničenja u postavkama poduzeća: memorija, a ne računanje, često je usko grlo. Tehnike poput optimizacije na razini funkcije gubitka određuju jesu li napredne faze obuke uopće održive.

Za organizacije koje pokreću zajedničke klastere ili regulirana okruženja, ovo pojačava potrebu za niskim inženjerskim ulaganjem, a ne samo eksperimentiranjem s arhitekturom modela.

Zašto je to važno za poslovne timove za umjetnu inteligenciju

Motif-2-12.7B-Reasoning se postavlja kao konkurentan mnogo većim modelima, ali njegova prava vrijednost leži u transparentnosti načina na koji su ti rezultati postignuti. Rad tvrdi – implicitno, ali uvjerljivo – da se sposobnost zaključivanja postiže discipliniranim dizajnom obuke, a ne samo modelom.

Za poduzeća koja grade vlasničke LLM-ove, lekcija je pragmatična: uložite rano u usklađivanje podataka, infrastrukturu i stabilnost obuke ili riskirajte trošenje milijuna na fino ugađanje modela koji nikad ne razumiju pouzdano u proizvodnji.

Web izvor

Povezani sadržaji

  • Vaša radna površina KDE Plasma uskoro će dobiti veliku nadogradnju s verzijom 6.6 – što je unutraVaša radna površina KDE Plasma uskoro će dobiti veliku nadogradnju s verzijom 6.6 – što je unutra
  • Zašto je Googleov novi API za interakcije tako važan za AI programereZašto je Googleov novi API za interakcije tako važan za AI programere
  • Najbolje besplatne Windows aplikacije 2.dio
  • TorrentroverTorrentrover | Potražite, automatizirajte i organizirajte preuzimanje torrenta
  • Ništa OS 4.0 ne postaje otvorena beta verzija s osnovnim aplikacijama koje napravite s AINišta OS 4.0 ne postaje otvorena beta verzija s osnovnim aplikacijama koje napravite s AI
  • Nakon što je radio svoju magiju na Zeldi i Splatoonu, ispada da je Monolith Soft također pomogao u razvoju Mario Kart WorldaNakon što je radio svoju magiju na Zeldi i Splatoonu, ispada da je Monolith Soft također pomogao u razvoju Mario Kart Worlda

Previous Article

Sustavi za detekciju zračenja tiho rade u pozadini svuda oko vas

Next Article

Zoom pokreće AI Companion 3.0 s agentskim tijekovima rada

Posljednje objave

Isprobao sam alternativu Claude Code koja je lokalna, otvorenog koda i potpuno besplatna – kako funkcionira

Pixel 10 Pro nasmijan profitnim maržama s popustom od 250 USD

Pixel 10 Pro nasmijan profitnim maržama s popustom od 250 USD

Vodeći tim Ashes of Creation dao je otkaz “u znak prosvjeda” jer direktor optužuje upravni odbor za odluke s kojima se “nije mogao etički složiti ili provesti”

Vodeći tim Ashes of Creation dao je otkaz “u znak prosvjeda” jer direktor optužuje upravni odbor za odluke s kojima se “nije mogao etički složiti ili provesti”

Sadržaj

  • 1 1. Dobici u rasuđivanju proizlaze iz distribucije podataka, a ne veličine modela
  • 2 2. Obuka s dugim kontekstom najprije je problem infrastrukture
  • 3 3. RL fino podešavanje ne uspijeva bez filtriranja i ponovne upotrebe podataka
  • 4 4. Optimizacija memorije određuje što je uopće moguće
  • 5 Zašto je to važno za poslovne timove za umjetnu inteligenciju

Novosti

  • Isprobao sam alternativu Claude Code koja je lokalna, otvorenog koda i potpuno besplatna – kako funkcionira 2. veljače 2026
  • Pixel 10 Pro nasmijan profitnim maržama s popustom od 250 USD 2. veljače 2026
  • Vodeći tim Ashes of Creation dao je otkaz “u znak prosvjeda” jer direktor optužuje upravni odbor za odluke s kojima se “nije mogao etički složiti ili provesti” 2. veljače 2026
  • Saudijskoj Arabiji naloženo da plati 3 milijuna funti disidentu iz Ujedinjenog Kraljevstva napadnutom špijunskim softverom Pegasus 2. veljače 2026
  • Većina RAG sustava ne razumije sofisticirane dokumente — oni ih uništavaju 2. veljače 2026
  • Comcast će platiti 117 milijuna dolara u nagodbi za kršenje sigurnosti 1. veljače 2026
  • Kako koristiti fiziku za bijeg iz ledene zdjele 1. veljače 2026
  • 7 aplikacija otvorenog koda koje bih rado platio – jer su tako dobre 1. veljače 2026
  • 5 Windows aplikacija koje uvijek instaliram na nova računala i zašto ih ne mogu dovoljno preporučiti 1. veljače 2026
  • Verizonova luda rasprodaja dodatne opreme nudi navlake za Pixel 10 i iPhone za 5 USD 1. veljače 2026

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice