Cohereov najmanji, najbrži model R-serije briljira u RAG-u, obrazlažući na 23 jezika

Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj o AI pokrivenosti vodećoj u industriji. Saznajte više

Dokazujući svoju namjeru da podrži širok raspon slučajeva korištenja u poduzećima — uključujući one koji ne zahtijevaju skupe modele velikih jezika (LLM) koji zahtijevaju velike resurse — pokretanje AI-ja Cohere izbacio je Command R7B, najmanji i najbrži u svojoj seriji R modela.

Command R7B izgrađen je za podršku brze izrade prototipova i ponavljanja i koristi generiranje proširenog dohvaćanja (RAG) za poboljšanje svoje točnosti. Model ima duljinu konteksta od 128K i podržava 23 jezika. Nadmašuje druge u svojoj klasi otvorenih modela – Googleovu Gemmu, Metinu Llamu, Mistralov Ministral – u zadacima uključujući matematiku i kodiranje, kaže Cohere.

“Model je dizajniran za programere i tvrtke koje trebaju optimizirati brzinu, isplativost i računalne resurse svojih slučajeva upotrebe”, suosnivač i izvršni direktor Cohere Aidan Gomez piše u objavi na blogu najavljujući novi model.

Sadržaj objave

1 Nadmašiti konkurente u matematici, kodiranju, RAG-u
2 Uklanjanje nepotrebnih funkcija poziva

Nadmašiti konkurente u matematici, kodiranju, RAG-u

Cohere je strateški usmjeren na poduzeća i njihove jedinstvene slučajeve upotrebe. Predstavljena tvrtka Command-R u ožujku i moćni Command R+ u travnju, te je napravio nadogradnje tijekom cijele godine za podršku brzini i učinkovitosti. Zadirkivali su Command R7B kao “konačni” model u svojoj R seriji i kažu da će objaviti težine modela istraživačkoj zajednici AI.

Cohere je primijetio da je kritično područje fokusa pri razvoju Command R7B bilo poboljšanje izvedbe u matematici, razmišljanju, kodu i prijevodu. Čini se da je tvrtka uspjela u tim područjima, s novim manjim modelom na vrhu HuggingFace Open LLM Leaderboard protiv otvorenih modela slične veličine uključujući Gemma 2 9B, Ministral 8B i Llama 3.1 8B.

Nadalje, najmanji model u seriji R nadmašuje konkurentske modele u područjima uključujući AI agente, korištenje alata i RAG, što pomaže u poboljšanju točnosti uzemljenjem izlaza modela u vanjskim podacima. Cohere kaže da se Command R7B ističe u razgovornim zadacima, uključujući pomoć u tehničkom radnom mjestu i upravljanju rizicima u poduzeću (ERM); tehničke činjenice; medijsko radno mjesto i podrška korisničkoj službi; HR česta pitanja; i sažimanje. Cohere također napominje da je model “iznimno dobar” u dohvaćanju i manipuliranju numeričkim informacijama u financijskim postavkama.

Sve u svemu, Command R7B zauzeo je prvo mjesto u prosjeku u važnim mjerilima uključujući evaluaciju praćenja uputa (IFeval); velika klupa tvrda (BBH); na diplomskoj razini Google-proof Q&A (GPQA); meko zaključivanje u više koraka (MuSR); i masovno razumijevanje jezika s više zadataka (MMLU).

Uklanjanje nepotrebnih funkcija poziva

Command R7B može koristiti alate uključujući tražilice, API-je i vektorske baze podataka za proširenje svoje funkcionalnosti. Cohere izvješćuje da korištenje alata modela ima snažne rezultate u odnosu na konkurente na Berkeley Function-Calling Leaderboard, koji ocjenjuje točnost modela u pozivanju funkcija (povezivanje s vanjskim podacima i sustavima).

Gomez ističe da to dokazuje njegovu učinkovitost u “stvarnom svijetu, raznolikim i dinamičnim okruženjima” i uklanja potrebu za nepotrebnim funkcijama poziva. To ga može učiniti dobrim izborom za izgradnju “brzih i sposobnih” AI agenata. Na primjer, ističe Cohere, kada funkcionira kao internetski prošireni agent za pretraživanje, Command R7B može složena pitanja rastaviti na podciljeve, dok također dobro funkcionira s naprednim razmišljanjem i pronalaženjem informacija.

Budući da je malen, Command R7B može se implementirati na nižim i potrošačkim CPU-ima, GPU-ovima i MacBookovima, omogućujući zaključivanje na uređaju. Model je sada dostupan na platformi Cohere i HuggingFace. Cijena je 0,0375 USD za 1 milijun ulaznih tokena i 0,15 USD za 1 milijun izlaznih tokena.

“To je idealan izbor za poduzeća koja traže troškovno učinkovit model utemeljen na njihovim internim dokumentima i podacima”, piše Gomez.

Dnevni uvidi u slučajeve poslovne upotrebe uz VB Daily

Ako želite impresionirati svog šefa, VB Daily vas pokriva. Dajemo vam uvid u to što tvrtke rade s generativnom umjetnom inteligencijom, od regulatornih promjena do praktičnih implementacija, tako da možete podijeliti uvide za maksimalni ROI.

Pročitajte našu Politiku privatnosti

Hvala što ste se pretplatili. Više VB biltena pogledajte ovdje.

Došlo je do pogreške.

Web izvor

Cohereov najmanji, najbrži model R-serije briljira u RAG-u, obrazlažući na 23 jezika

ByTomšić Damjan

Nadmašiti konkurente u matematici, kodiranju, RAG-u

Uklanjanje nepotrebnih funkcija poziva

By Tomšić Damjan

Testirao sam COSMIC-ov novi Frosted Glass efekt i puno je bolji od MacOS-ovog tekućeg stakla

Obitelj Galaxy S26 dobiva najnoviju softversku zakrpu

Halo Studios navodno otkazuje Halo multiplayer projekt Ekur, koji je imao prilagodljive Spartance i Elite te bitke velikih igrača

You missed

Testirao sam COSMIC-ov novi Frosted Glass efekt i puno je bolji od MacOS-ovog tekućeg stakla

Obitelj Galaxy S26 dobiva najnoviju softversku zakrpu

Halo Studios navodno otkazuje Halo multiplayer projekt Ekur, koji je imao prilagodljive Spartance i Elite te bitke velikih igrača

CW@60: Očuvanje čuda života u tehnologiji

Cohereov najmanji, najbrži model R-serije briljira u RAG-u, obrazlažući na 23 jezika

ByTomšić Damjan

Nadmašiti konkurente u matematici, kodiranju, RAG-u

Uklanjanje nepotrebnih funkcija poziva

By Tomšić Damjan

Related Post

Testirao sam COSMIC-ov novi Frosted Glass efekt i puno je bolji od MacOS-ovog tekućeg stakla

Obitelj Galaxy S26 dobiva najnoviju softversku zakrpu

Halo Studios navodno otkazuje Halo multiplayer projekt Ekur, koji je imao prilagodljive Spartance i Elite te bitke velikih igrača

You missed

Testirao sam COSMIC-ov novi Frosted Glass efekt i puno je bolji od MacOS-ovog tekućeg stakla

Obitelj Galaxy S26 dobiva najnoviju softversku zakrpu

Halo Studios navodno otkazuje Halo multiplayer projekt Ekur, koji je imao prilagodljive Spartance i Elite te bitke velikih igrača

CW@60: Očuvanje čuda života u tehnologiji