IBM-ovi novi poslovni modeli AI-a moćniji su od bilo čega iz OpenAI-ja ili Googlea

ZDNET

IBM zumira zajedno s novim izdanjima Granite Large Language Models (LLM) otvorenog koda svakih nekoliko mjeseci. Granit 3.1 je najnovija generacija modela, koja se temelji na uspjehu Granite 3.0. Model nudi poboljšane mogućnosti i performanse optimizirane za poslovne aplikacije.

Također: Gemini Advanced korisnici sada mogu pristupiti Googleovom najeksperimentalnijem modelu

Obitelj modela Granite 3.1 može se pohvaliti impresivnim kontekstnim prozorom tokena od 128K, što je značajno povećanje u odnosu na njihove prethodnike. Ovo proširenje omogućuje modelima obradu i razumijevanje puno većih količina teksta — što je ekvivalentno približno 85.000 engleskih riječi — što omogućuje sveobuhvatniju analizu i zadatke generiranja. Za usporedbu, OpenAI-jev ChatGPT 3, koji je pokrenuo AI revoluciju, mogao je obraditi samo 2000 tokena.

Sadržaj objave

1 Nadmašiti konkurenciju
2 Poboljšane grafičke i jezične mogućnosti
3 Moćan, pouzdan AI za poduzeća
- 3.1 Povezani sadržaji

Nadmašiti konkurenciju

Big Blue tvrdi da je novi Granite 8B Instruct model nadmašuje svoje rivale, kao što su Google Gemma 2, Meta Llama 3.1 i Qwen 2.5, na HuggingFace‘s OpenLLM Leaderboard mjerila.

Također: želite generativne AI LLM-ove integrirane s vašim poslovnim podacima? Trebate RAG

Obitelj Granite 3.1 uključuje guste modele i varijante Mixture of Experts (MoE). IBM navodi da su njegovi Granite 2B i 8B modeli LLM-ovi samo s gustim tekstom obučeni na više od 12 trilijuna podatkovnih tokena. Gusti modeli dizajnirani su za podršku slučajevima upotrebe temeljenim na alatima i za prošireno generiranje dohvaćanja (RAG), pojednostavljeno generiranje koda, prijevod i ispravljanje grešaka.

MoE modeli treniraju se na više od 10 bilijuna tokena podataka. IBM tvrdi da su ovi modeli idealni za implementaciju u aplikacijama na uređaju s malom latencijom.

Poboljšane grafičke i jezične mogućnosti

Novo izdanje također uvodi funkcionalnost slike u/teksta, proširujući primjenjivost modela za tvrtke koje rade s grafikom.

Granite 3.1 također nudi poboljšano znanje stranih jezika. Uz engleski, sada može raditi s desetak jezika, uključujući njemački, španjolski, francuski, japanski, portugalski, arapski, češki, talijanski, korejski, nizozemski i pojednostavljeni kineski. Ukratko, ako imate međunarodno poslovanje, IBM ima LLM koji možete koristiti.

Kao i prije, novi Granite LLM licencirani su pod licencom otvorenog koda Apache 2. IBM također održava svoju predanost otvorenosti otkrivanjem skupova podataka za obuku i pružanjem sveobuhvatne dokumentacije o razvoju modela i izvedbi.

Također: Generativna umjetna inteligencija svima donosi nove rizike. Evo kako možete ostati sigurni

Ako ste zabrinuti zbog pitanja intelektualnog vlasništva i umjetne inteligencije, IBM nudi neograničenu odštetu za potraživanja IP-a trećih strana koja se odnose na korištenje njegovih modela. Možda još niste zabrinuti zbog takvih potencijalnih pravnih problema, ali uvjeravam vas da hoćete.

Moćan, pouzdan AI za poduzeća

Modeli Granite 3.1 dostupni su na IBM-ovoj platformi Watsonx; pružatelji usluga u oblaku poput Google Vertex Aja; i AI platforme uključujući Hugging Face, NVIDIA (kao NIM mikroservis), Ollamai Ponoviti.

Izdanje Granite 3.1 spremno je ubrzati usvajanje umjetne inteligencije u poslovnim postavkama. Kombiniranjem ovih modela s vlasničkim podacima korištenjem tehnika kao što su IBM-ov InstructLabtvrtke potencijalno mogu postići izvedbu specifičnu za zadatak koja se može mjeriti s većim modelima uz djelić cijene.

Kako se AI krajolik brzo razvija, IBM-ov Granite 3.1 predstavlja značajan korak naprijed u pružanju poduzećima moćnih, učinkovitih i pouzdanih AI alata za poticanje inovacija i rješavanje složenih poslovnih izazova.

Web izvor