Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

MiniMax otkriva LLM otvorenog koda s kontekstom nevjerojatnih 4 milijuna tokena

Novosti

MiniMax otkriva LLM otvorenog koda s kontekstom nevjerojatnih 4 milijuna tokena

Tomšić Damjan 15. siječnja 2025


Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj o AI pokrivenosti vodećoj u industriji. Saznajte više


MiniMax je danas možda najpoznatiji ovdje u SAD-u kao singapurska tvrtka koja stoji iza Hailuoa, realističnog generativnog AI video modela visoke rezolucije koji se natječe s Runwayom, OpenAI-jevom Sorom i Luma AI Dream Machineom.

No tvrtka ima mnogo više trikova u rukavu: danas je, na primjer, najavila izdavanje i otvoren izvor Serija MiniMax-01nova obitelj modela izgrađena za rukovanje ultradugim kontekstima i poboljšanje razvoja AI agenata.

Serija uključuje MiniMax-Text-01, temeljni model velikog jezika (LLM) i MiniMax-VL-01, vizualni multimodalni model.

Sadržaj objave

  • 1 Ogroman kontekstni prozor
  • 2 Upečatljivo novo tlo uz Lightning Attention Architecture
  • 3 Izvedba i mjerila
  • 4 Otvoreni za suradnju
    • 4.1 Povezani sadržaji

Ogroman kontekstni prozor

MiniMax-Text-o1 je od posebne važnosti jer omogućuje do 4 milijuna tokena u svom prozoru konteksta — što je ekvivalentno knjiga u vrijednosti male knjižnice. Kontekstni prozor predstavlja koliko informacija LLM može obraditi jedna ulazno/izlazna razmjenas riječima i konceptima predstavljenim kao numerički “tokeni”, interna matematička apstrakcija LLM-a podataka na kojima se obučavao.

I dok je Google prethodno vodio skupinu sa svojim modelom Gemini 1.5 Pro i Prozor konteksta od 2 milijuna tokenaMiniMax je to nevjerojatno udvostručio.

Kao MiniMax objavljeno danas na svom službenom X računu: “MiniMax-01 učinkovito obrađuje do 4 milijuna tokena — 20 do 32 puta više od kapaciteta drugih vodećih modela. Vjerujemo da je MiniMax-01 spreman podržati očekivani porast aplikacija povezanih s agentima u nadolazećoj godini, jer agenti sve više zahtijevaju proširene mogućnosti rukovanja kontekstom i održivu memoriju.”

Modeli su sada dostupni za preuzimanje na Lice koje grli i Github pod a prilagođena MiniMax licencakoje korisnici mogu izravno isprobati Hailuo AI Chat (konkurent ChatGPT/Gemini/Claude) i putem MiniMaxa sučelje za programiranje aplikacija (API)gdje programeri trećih strana mogu s njima povezati svoje jedinstvene aplikacije.

MiniMax nudi API-je za tekstualnu i multimodalnu obradu po konkurentnim cijenama:

  • 0,2 USD za 1 milijun ulaznih tokena
  • 1,1 USD za 1 milijun izlaznih tokena

Za usporedbu, OpenAI-jev GPT-4o košta 2,50 USD za 1 milijun ulaznih tokena putem svog API-ja, nevjerojatnih 12,5X skuplji.

MiniMax je također integrirao okvir mješavine stručnjaka (MoE) s 32 stručnjaka za optimizaciju skalabilnosti. Ovaj dizajn uravnotežuje računalnu i memorijsku učinkovitost dok zadržava konkurentne performanse na ključnim mjerilima.

Upečatljivo novo tlo uz Lightning Attention Architecture

U srcu MiniMax-01 je Lightning Attention mehanizam, inovativna alternativa transformatorskoj arhitekturi.

Ovaj dizajn značajno smanjuje složenost računanja. Modeli se sastoje od 456 milijardi parametara, s 45,9 milijardi aktiviranih po zaključku.

Za razliku od ranijih arhitektura, Lightning Attention koristi kombinaciju linearnih i tradicionalnih SoftMax slojeva, postižući gotovo linearnu složenost za duge ulaze. SoftMaxza one poput mene koji su novi u konceptu, su transformacija ulaznih brojeva u vjerojatnosti koje zbrajaju 1, tako da LLM može približno odrediti koje je značenje unosa najvjerojatnije.

MiniMax je ponovno izgradio svoje okvire za obuku i zaključivanje kako bi podržao arhitekturu Lightning Attention. Ključna poboljšanja uključuju:

  • MOE optimizacija komunikacije svih prema svima: Smanjuje opterećenje komunikacije između GPU-a.
  • Varlen prsten pozornost: Minimizira gubitak računanja za dugotrajnu obradu.
  • Učinkovite implementacije kernela: Prilagođene CUDA kernele poboljšavaju performanse Lightning Attention.

Ova poboljšanja čine modele MiniMax-01 dostupnima za stvarne primjene, uz zadržavanje pristupačnosti.

Izvedba i mjerila

Na glavnim tekstualnim i multimodalnim referentnim vrijednostima, MiniMax-01 konkurira vrhunskim modelima kao što su GPT-4 i Claude-3.5, s posebno dobrim rezultatima na procjenama dugog konteksta. Treba napomenuti da je MiniMax-Text-01 postigao 100% točnost na Zadatak “Igla u plastu sijena”. s kontekstom od 4 milijuna tokena.

Modeli također pokazuju minimalnu degradaciju performansi kako se ulazna duljina povećava.

MiniMax planira redovita ažuriranja kako bi proširio mogućnosti modela, uključujući kod i multimodalna poboljšanja.

Tvrtka gleda na open-source kao na korak prema izgradnji temeljnih AI sposobnosti za evoluirajući AI agent krajolik.

Budući da se predviđa da će 2025. biti godina transformacije za agente umjetne inteligencije, potreba za održivom memorijom i učinkovitom komunikacijom među agentima raste. MiniMaxove inovacije osmišljene su da odgovore na te izazove.

Otvoreni za suradnju

MiniMax poziva programere i istraživače da istraže mogućnosti MiniMax-01. Osim otvorenog izvora, njegov tim pozdravlja tehničke prijedloge i upite o suradnji na model@minimaxi.com.

Sa svojom predanošću isplativoj i skalabilnoj umjetnoj inteligenciji, MiniMax se pozicionira kao ključni igrač u oblikovanju ere agenta umjetne inteligencije. Serija MiniMax-01 nudi uzbudljivu priliku programerima da pomaknu granice onoga što AI može postići u dugom kontekstu.

Dnevni uvidi u slučajeve poslovne upotrebe uz VB Daily

Ako želite impresionirati svog šefa, VB Daily vas pokriva. Dajemo vam uvid u to što tvrtke rade s generativnom umjetnom inteligencijom, od regulatornih promjena do praktičnih implementacija, tako da možete podijeliti uvide za maksimalni ROI.

Pročitajte našu Politiku privatnosti

Hvala što ste se pretplatili. Više VB biltena pogledajte ovdje.

Došlo je do pogreške.



Web izvor

Povezani sadržaji

  • Naši su mozgovi vektorske baze podataka, a evo zašto je to korisno kada se koristi AI
  • Korejski AI startup Motif otkriva 4 velike lekcije za obuku LLM-a za poduzećaKorejski AI startup Motif otkriva 4 velike lekcije za obuku LLM-a za poduzeća
  • Povjernici zaklade Linux Fondacije imaju za cilj boriti se protiv rastućih sigurnosnih prijetnji otvorenog kodaPovjernici zaklade Linux Fondacije imaju za cilj boriti se protiv rastućih sigurnosnih prijetnji otvorenog koda
  • Disco Elysium se “preispituje” za mobilne uređaje da “očaraju korisnika Tiktoka”Disco Elysium se “preispituje” za mobilne uređaje da “očaraju korisnika Tiktoka”
  • UK širokopojasni cilj 2025. cilja s jakim prvim tromjesečjemUK širokopojasni cilj 2025. cilja s jakim prvim tromjesečjem
  • Oakleyeve nove meta naočale začinjuju stil za 399 dolara ovog ljetaOakleyeve nove meta naočale začinjuju stil za 399 dolara ovog ljeta

Previous Article

Morate zahvaliti NASA-i za bežične slušalice i usisavače

Next Article

Povezivost je odmah iza lokacije u odlukama o najmu nekretnina

Posljednje objave

Masivni prekid rada Verizona donosi korisnicima 20 USD kredita

Masivni prekid rada Verizona donosi korisnicima 20 USD kredita

Sve više dokaza koji sugeriraju da se Ubisoft doista sprema najaviti remake Assassin’s Creed 4: Black Flag

Sve više dokaza koji sugeriraju da se Ubisoft doista sprema najaviti remake Assassin’s Creed 4: Black Flag

Teksaški sudac odbacuje drugu tužbu zbog prekida rada CrowdStrikea

Teksaški sudac odbacuje drugu tužbu zbog prekida rada CrowdStrikea

Sadržaj

  • 1 Ogroman kontekstni prozor
  • 2 Upečatljivo novo tlo uz Lightning Attention Architecture
  • 3 Izvedba i mjerila
  • 4 Otvoreni za suradnju

Novosti

  • Masivni prekid rada Verizona donosi korisnicima 20 USD kredita 15. siječnja 2026
  • Sve više dokaza koji sugeriraju da se Ubisoft doista sprema najaviti remake Assassin’s Creed 4: Black Flag 15. siječnja 2026
  • Teksaški sudac odbacuje drugu tužbu zbog prekida rada CrowdStrikea 15. siječnja 2026
  • Z.ai GLM-Image otvorenog koda pobjeđuje Googleov Nano Banana Pro u složenom prikazivanju teksta, ali ne i u estetici 15. siječnja 2026
  • Neuroznanstvenici dešifriraju odugovlačenje: moždani mehanizam objašnjava zašto ljudi ostavljaju određene zadatke za kasnije 15. siječnja 2026
  • Ovaj popularni Bose zvučnik izgubit će softversku podršku 2026. – ali sada ima spas 14. siječnja 2026
  • Google Photos “Ask” pretraga još uvijek ima puno mrzitelja 14. siječnja 2026
  • Battlefield 6, 2. sezona odgođena je za veljaču, ali još sadržaja za 1. sezonu i događaja je na putu 14. siječnja 2026
  • Širokopojasna revolucija u Velikoj Britaniji ne pokazuje znakove usporavanja 14. siječnja 2026
  • Zašto Egnyte nastavlja zapošljavati mlađe inženjere unatoč porastu AI alata za kodiranje 14. siječnja 2026

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice