Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

MiniMax otkriva LLM otvorenog koda s kontekstom nevjerojatnih 4 milijuna tokena

Novosti

MiniMax otkriva LLM otvorenog koda s kontekstom nevjerojatnih 4 milijuna tokena

Tomšić Damjan 15. siječnja 2025


Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj o AI pokrivenosti vodećoj u industriji. Saznajte više


MiniMax je danas možda najpoznatiji ovdje u SAD-u kao singapurska tvrtka koja stoji iza Hailuoa, realističnog generativnog AI video modela visoke rezolucije koji se natječe s Runwayom, OpenAI-jevom Sorom i Luma AI Dream Machineom.

No tvrtka ima mnogo više trikova u rukavu: danas je, na primjer, najavila izdavanje i otvoren izvor Serija MiniMax-01nova obitelj modela izgrađena za rukovanje ultradugim kontekstima i poboljšanje razvoja AI agenata.

Serija uključuje MiniMax-Text-01, temeljni model velikog jezika (LLM) i MiniMax-VL-01, vizualni multimodalni model.

Sadržaj objave

  • 1 Ogroman kontekstni prozor
  • 2 Upečatljivo novo tlo uz Lightning Attention Architecture
  • 3 Izvedba i mjerila
  • 4 Otvoreni za suradnju
    • 4.1 Povezani sadržaji

Ogroman kontekstni prozor

MiniMax-Text-o1 je od posebne važnosti jer omogućuje do 4 milijuna tokena u svom prozoru konteksta — što je ekvivalentno knjiga u vrijednosti male knjižnice. Kontekstni prozor predstavlja koliko informacija LLM može obraditi jedna ulazno/izlazna razmjenas riječima i konceptima predstavljenim kao numerički “tokeni”, interna matematička apstrakcija LLM-a podataka na kojima se obučavao.

I dok je Google prethodno vodio skupinu sa svojim modelom Gemini 1.5 Pro i Prozor konteksta od 2 milijuna tokenaMiniMax je to nevjerojatno udvostručio.

Kao MiniMax objavljeno danas na svom službenom X računu: “MiniMax-01 učinkovito obrađuje do 4 milijuna tokena — 20 do 32 puta više od kapaciteta drugih vodećih modela. Vjerujemo da je MiniMax-01 spreman podržati očekivani porast aplikacija povezanih s agentima u nadolazećoj godini, jer agenti sve više zahtijevaju proširene mogućnosti rukovanja kontekstom i održivu memoriju.”

Modeli su sada dostupni za preuzimanje na Lice koje grli i Github pod a prilagođena MiniMax licencakoje korisnici mogu izravno isprobati Hailuo AI Chat (konkurent ChatGPT/Gemini/Claude) i putem MiniMaxa sučelje za programiranje aplikacija (API)gdje programeri trećih strana mogu s njima povezati svoje jedinstvene aplikacije.

MiniMax nudi API-je za tekstualnu i multimodalnu obradu po konkurentnim cijenama:

  • 0,2 USD za 1 milijun ulaznih tokena
  • 1,1 USD za 1 milijun izlaznih tokena

Za usporedbu, OpenAI-jev GPT-4o košta 2,50 USD za 1 milijun ulaznih tokena putem svog API-ja, nevjerojatnih 12,5X skuplji.

MiniMax je također integrirao okvir mješavine stručnjaka (MoE) s 32 stručnjaka za optimizaciju skalabilnosti. Ovaj dizajn uravnotežuje računalnu i memorijsku učinkovitost dok zadržava konkurentne performanse na ključnim mjerilima.

Upečatljivo novo tlo uz Lightning Attention Architecture

U srcu MiniMax-01 je Lightning Attention mehanizam, inovativna alternativa transformatorskoj arhitekturi.

Ovaj dizajn značajno smanjuje složenost računanja. Modeli se sastoje od 456 milijardi parametara, s 45,9 milijardi aktiviranih po zaključku.

Za razliku od ranijih arhitektura, Lightning Attention koristi kombinaciju linearnih i tradicionalnih SoftMax slojeva, postižući gotovo linearnu složenost za duge ulaze. SoftMaxza one poput mene koji su novi u konceptu, su transformacija ulaznih brojeva u vjerojatnosti koje zbrajaju 1, tako da LLM može približno odrediti koje je značenje unosa najvjerojatnije.

MiniMax je ponovno izgradio svoje okvire za obuku i zaključivanje kako bi podržao arhitekturu Lightning Attention. Ključna poboljšanja uključuju:

  • MOE optimizacija komunikacije svih prema svima: Smanjuje opterećenje komunikacije između GPU-a.
  • Varlen prsten pozornost: Minimizira gubitak računanja za dugotrajnu obradu.
  • Učinkovite implementacije kernela: Prilagođene CUDA kernele poboljšavaju performanse Lightning Attention.

Ova poboljšanja čine modele MiniMax-01 dostupnima za stvarne primjene, uz zadržavanje pristupačnosti.

Izvedba i mjerila

Na glavnim tekstualnim i multimodalnim referentnim vrijednostima, MiniMax-01 konkurira vrhunskim modelima kao što su GPT-4 i Claude-3.5, s posebno dobrim rezultatima na procjenama dugog konteksta. Treba napomenuti da je MiniMax-Text-01 postigao 100% točnost na Zadatak “Igla u plastu sijena”. s kontekstom od 4 milijuna tokena.

Modeli također pokazuju minimalnu degradaciju performansi kako se ulazna duljina povećava.

MiniMax planira redovita ažuriranja kako bi proširio mogućnosti modela, uključujući kod i multimodalna poboljšanja.

Tvrtka gleda na open-source kao na korak prema izgradnji temeljnih AI sposobnosti za evoluirajući AI agent krajolik.

Budući da se predviđa da će 2025. biti godina transformacije za agente umjetne inteligencije, potreba za održivom memorijom i učinkovitom komunikacijom među agentima raste. MiniMaxove inovacije osmišljene su da odgovore na te izazove.

Otvoreni za suradnju

MiniMax poziva programere i istraživače da istraže mogućnosti MiniMax-01. Osim otvorenog izvora, njegov tim pozdravlja tehničke prijedloge i upite o suradnji na model@minimaxi.com.

Sa svojom predanošću isplativoj i skalabilnoj umjetnoj inteligenciji, MiniMax se pozicionira kao ključni igrač u oblikovanju ere agenta umjetne inteligencije. Serija MiniMax-01 nudi uzbudljivu priliku programerima da pomaknu granice onoga što AI može postići u dugom kontekstu.

Dnevni uvidi u slučajeve poslovne upotrebe uz VB Daily

Ako želite impresionirati svog šefa, VB Daily vas pokriva. Dajemo vam uvid u to što tvrtke rade s generativnom umjetnom inteligencijom, od regulatornih promjena do praktičnih implementacija, tako da možete podijeliti uvide za maksimalni ROI.

Pročitajte našu Politiku privatnosti

Hvala što ste se pretplatili. Više VB biltena pogledajte ovdje.

Došlo je do pogreške.



Web izvor

Povezani sadržaji

  • Wilmot Works it Out je ultimativna video igra za ljubitelje slagalica
  • Pozornica je spremna za pravne bitke oko dominacije Big Tech-aPozornica je spremna za pravne bitke oko dominacije Big Tech-a
  • Galaxy S25 LineUp dobiva travanj sigurnosnu zakrpuGalaxy S25 LineUp dobiva travanj sigurnosnu zakrpu
  • Terminal-Bench 2.0 lansira se uz Harbor, novi okvir za testiranje agenata u spremnicimaTerminal-Bench 2.0 lansira se uz Harbor, novi okvir za testiranje agenata u spremnicima
  • Brzi i jednostavan način za spajanje više Word dokumenata
  • Opencua-ovi otvoreni koferni agenti suparnički modeli iz OpenAi-a i AnthropicOpencua-ovi otvoreni koferni agenti suparnički modeli iz OpenAi-a i Anthropic

Previous Article

Morate zahvaliti NASA-i za bežične slušalice i usisavače

Next Article

Povezivost je odmah iza lokacije u odlukama o najmu nekretnina

Posljednje objave

CDC ima krizu vodstva

CDC ima krizu vodstva

Najbolje od MWC 2026: ažuriranja uživo o telefonima, konceptima i robotima koje vidimo

Android se pridružuje modernim vremenima s prilagođenim naljepnicama u Google fotografijama

Android se pridružuje modernim vremenima s prilagođenim naljepnicama u Google fotografijama

Sadržaj

  • 1 Ogroman kontekstni prozor
  • 2 Upečatljivo novo tlo uz Lightning Attention Architecture
  • 3 Izvedba i mjerila
  • 4 Otvoreni za suradnju

Novosti

  • CDC ima krizu vodstva 2. ožujka 2026
  • Najbolje od MWC 2026: ažuriranja uživo o telefonima, konceptima i robotima koje vidimo 1. ožujka 2026
  • Android se pridružuje modernim vremenima s prilagođenim naljepnicama u Google fotografijama 1. ožujka 2026
  • Bivši dizajner razine Highguarda sugerira da je “znojna” natjecateljska 3v3 igra “bila najveća stvar koja je odbila mnoge igrače” 1. ožujka 2026
  • NTT Data, Ericssonov tim za skaliranje privatne 5G, fizičke umjetne inteligencije za poduzeća 1. ožujka 2026
  • Vibe coding with overeager AI: Lessons learned from treating Google AI Studio like a teammate 1. ožujka 2026
  • NASA radi velike promjene kako bi ubrzala program Artemis 28. veljače 2026
  • Upoznajte svog AI revizora: Kako ova nova radna uloga prati ponašanje modela 28. veljače 2026
  • Samsungova ažuriranja za veljaču napokon stižu na sve ove uređaje 28. veljače 2026
  • Od Atic Atac do Banjo-Kazooie, Evercade je sakupio 14 rijetkih klasika u simpatično malo ručno računalo koje izlazi ovog lipnja 28. veljače 2026

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice