Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Korejski AI startup Motif otkriva 4 velike lekcije za obuku LLM-a za poduzeća

Novosti

Korejski AI startup Motif otkriva 4 velike lekcije za obuku LLM-a za poduzeća

Tomšić Damjan 16. prosinca 2025

Čuli smo (i napisali, ovdje na VentureBeatu) puno o generativnoj AI utrci između SAD-a i Kine, budući da su to bile zemlje s grupama koje su bile najaktivnije u predstavljanju novih modela (uz pohvale Cohereu u Kanadi i Mistralu u Francuskoj).

Ali sada korejski startup pravi valove: prošli tjedan, tvrtka poznata kao Motif Technologies pušten na slobodu Motiv-2-12.7B-Razumovanjejoš jedan model otvorene težine s malim parametrima koji se može pohvaliti impresivnim referentnim rezultatima, brzo postavši najučinkovitiji model iz te zemlje prema neovisni benchmarking laboratorij Umjetna analiza (pobijedivši čak i uobičajeni GPT-5.1 američkog vodećeg OpenAI-ja).

Ali što je još važnije za poslovne timove AI, tvrtka ima objavio bijelu knjigu na arxiv.org s konkretnim, ponovljivim receptom za obuku koji otkriva odakle zapravo dolazi izvedba rasuđivanja – i gdje uobičajeni interni napori LLM-a obično propadaju.

Za organizacije koje grade ili fino podešavaju svoje vlastite modele iza vatrozida, rad nudi niz praktičnih lekcija o usklađivanju podataka, infrastrukturi dugog konteksta i stabilnosti učenja pojačanja koje su izravno primjenjive na okruženja poduzeća. Evo ih:

Sadržaj objave

  • 1 1. Dobici u rasuđivanju proizlaze iz distribucije podataka, a ne veličine modela
  • 2 2. Obuka s dugim kontekstom najprije je problem infrastrukture
  • 3 3. RL fino podešavanje ne uspijeva bez filtriranja i ponovne upotrebe podataka
  • 4 4. Optimizacija memorije određuje što je uopće moguće
  • 5 Zašto je to važno za poslovne timove za umjetnu inteligenciju
    • 5.1 Povezani sadržaji

1. Dobici u rasuđivanju proizlaze iz distribucije podataka, a ne veličine modela

Jedno od Motifovih najrelevantnijih otkrića za poslovne timove jest to podaci sintetičkog zaključivanja pomaže samo kada njegova struktura šibice the stil razmišljanja ciljanog modela.

Rad pokazuje mjerljive razlike u performansama nizvodnog kodiranja ovisno o tome koji je model “učitelja” generirao tragove razmišljanja korištene tijekom nadziranog finog podešavanja.

Za poduzeća to potkopava uobičajeni prečac: generiranje velikih količina sintetičkih podataka lanca misli iz graničnog modela i pretpostavka da će se oni prenijeti čisto. Motifovi rezultati sugeriraju da neusklađeni tragovi razmišljanja mogu aktivno utjecati na izvedbu, čak i ako izgledaju visoke kvalitete.

Zaključak je operativan, a ne akademski: timovi bi trebali potvrditi da njihovi sintetički podaci odražavaju format, opširnost i granularnost koraka žele u vrijeme zaključivanja. Unutarnje evaluacijske petlje važnije su od kopiranja vanjskih skupova podataka.

2. Obuka s dugim kontekstom najprije je problem infrastrukture

Motif trenira u kontekstu od 64K, ali dokument jasno pokazuje da ovo nije samo tokenizator ili podešavanje kontrolnih točaka.

Model se oslanja na hibridni paralelizam, pažljive strategije dijeljenja i agresivno određivanje kontrolnih točaka aktivacije kako bi obuka dugog konteksta bila izvediva na hardveru klase Nvidia H100.

Za graditelje poduzeća poruka je otrežnjujuća, ali korisna: mogućnost dugog konteksta ne može se kasno uključiti.

Ako su tijekovi rada s velikim brojem dohvaćanja ili agenti ključni za slučaj poslovne upotrebe, duljina konteksta mora biti dizajnirana u skupu za obuku od samog početka. U protivnom, timovi riskiraju skupe cikluse prekvalifikacije ili nestabilna fina podešavanja.

3. RL fino podešavanje ne uspijeva bez filtriranja i ponovne upotrebe podataka

Motifov cjevovod za fino podešavanje učenja za pojačanje (RLFT) naglašava filtriranje s obzirom na poteškoće – zadržavanje zadataka čije su stope prolaznosti unutar definiranog raspona – umjesto neselektivnog skaliranja nagradne obuke.

Ovo izravno rješava bolnu točku s kojom se susreću mnogi poslovni timovi kada eksperimentiraju s RL-om: regresije izvedbe, kolaps načina rada ili krhki dobici koji nestaju izvan referentnih vrijednosti. Motif također ponovno koristi putanje kroz politike i proširuje raspone rezanja, mijenjajući teoretsku čistoću za stabilnost treninga.

Lekcija poduzeća je jasna: RL je problem sustava, a ne samo problem modela nagrađivanja. Bez pažljivog filtriranja, ponovne upotrebe i balansiranja više zadataka, RL može destabilizirati modele koji su inače spremni za proizvodnju.

4. Optimizacija memorije određuje što je uopće moguće

Motifova upotreba optimizacija na razini jezgre za smanjenje pritiska RL memorije naglašava često zanemarena ograničenja u postavkama poduzeća: memorija, a ne računanje, često je usko grlo. Tehnike poput optimizacije na razini funkcije gubitka određuju jesu li napredne faze obuke uopće održive.

Za organizacije koje pokreću zajedničke klastere ili regulirana okruženja, ovo pojačava potrebu za niskim inženjerskim ulaganjem, a ne samo eksperimentiranjem s arhitekturom modela.

Zašto je to važno za poslovne timove za umjetnu inteligenciju

Motif-2-12.7B-Reasoning se postavlja kao konkurentan mnogo većim modelima, ali njegova prava vrijednost leži u transparentnosti načina na koji su ti rezultati postignuti. Rad tvrdi – implicitno, ali uvjerljivo – da se sposobnost zaključivanja postiže discipliniranim dizajnom obuke, a ne samo modelom.

Za poduzeća koja grade vlasničke LLM-ove, lekcija je pragmatična: uložite rano u usklađivanje podataka, infrastrukturu i stabilnost obuke ili riskirajte trošenje milijuna na fino ugađanje modela koji nikad ne razumiju pouzdano u proizvodnji.

Web izvor

Povezani sadržaji

  • Urbani digitalni blizanci – dijelovi koji nedostaju i podjele u nastajanjuUrbani digitalni blizanci – dijelovi koji nedostaju i podjele u nastajanju
  • Elon Musk proziva NASA-ine ambicije oko Mjeseca: ‘Idemo ravno na Mars’Elon Musk proziva NASA-ine ambicije oko Mjeseca: ‘Idemo ravno na Mars’
  • Ubuntu Server Installation Checklist | TechRepublicUbuntu Server Installation Checklist | TechRepublic
  • Beam Ventures pokreće fond od 150 milijuna dolara za pretvaranje Abu Dhabija u globalno središte igaraBeam Ventures pokreće fond od 150 milijuna dolara za pretvaranje Abu Dhabija u globalno središte igara
  • Izvlačenje ovih 50 predmeta iz orbite smanjilo bi opasnost od svemirskog smeća na polaIzvlačenje ovih 50 predmeta iz orbite smanjilo bi opasnost od svemirskog smeća na pola
  • Antrop lansira Claude za Chrome u ograničenoj beta verziji, ali napadi brzog ubrizgavanja ostaju glavna brigaAntrop lansira Claude za Chrome u ograničenoj beta verziji, ali napadi brzog ubrizgavanja ostaju glavna briga

Previous Article

Sustavi za detekciju zračenja tiho rade u pozadini svuda oko vas

Next Article

Zoom pokreće AI Companion 3.0 s agentskim tijekovima rada

Posljednje objave

ESRB neće slijediti PEGI-jeve promjene dobne ocjene u SAD-u

ESRB neće slijediti PEGI-jeve promjene dobne ocjene u SAD-u

Postavljena pitanja o obilježavanju sjećanja na Instagramu u istrazi Noaha Donohoea

Postavljena pitanja o obilježavanju sjećanja na Instagramu u istrazi Noaha Donohoea

Zašto poduzeća zamjenjuju generičku umjetnu inteligenciju alatima koji poznaju svoje korisnike

Zašto poduzeća zamjenjuju generičku umjetnu inteligenciju alatima koji poznaju svoje korisnike

Sadržaj

  • 1 1. Dobici u rasuđivanju proizlaze iz distribucije podataka, a ne veličine modela
  • 2 2. Obuka s dugim kontekstom najprije je problem infrastrukture
  • 3 3. RL fino podešavanje ne uspijeva bez filtriranja i ponovne upotrebe podataka
  • 4 4. Optimizacija memorije određuje što je uopće moguće
  • 5 Zašto je to važno za poslovne timove za umjetnu inteligenciju

Novosti

  • ESRB neće slijediti PEGI-jeve promjene dobne ocjene u SAD-u 20. ožujka 2026
  • Postavljena pitanja o obilježavanju sjećanja na Instagramu u istrazi Noaha Donohoea 20. ožujka 2026
  • Zašto poduzeća zamjenjuju generičku umjetnu inteligenciju alatima koji poznaju svoje korisnike 19. ožujka 2026
  • Pripremite se za godinu kaotičnog vremena u SAD-u 19. ožujka 2026
  • Best Buy već prodaje MacBook Neo po sniženju – a kvaka i nije tako loša 19. ožujka 2026
  • AT&T lansira novu aplikaciju s AI podrškom koju stalno tražite 19. ožujka 2026
  • Igra obrane tornja Tangy TD zaradila je više od 250 tisuća dolara od lansiranja početkom ožujka na Steamu, zbog čega je njen solo razvijač već dva puta briznuo u plač 19. ožujka 2026
  • Ofcom postavlja propise za guranje gigabitnog širokopojasnog interneta u Velikoj Britaniji u ‘završnu fazu’ 19. ožujka 2026
  • Novi MiniMax M2.7 vlasnički AI model se ‘samorazvija’ i može izvesti 30-50% tijeka istraživanja učenja za potkrepljivanje 18. ožujka 2026
  • Kvantni skok za Turingovu nagradu 18. ožujka 2026

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice