U svom najnovijem dodatku svojoj granitnoj obitelji velikih jezičnih modela (LLMS), IBM je otkrio granit 3.2. Ovo novo izdanje usredotočeno je na isporuku malih, učinkovitih, praktičnih rješenja za umjetnu inteligenciju (AI) za tvrtke.
IBM je nastavio brzo ažurirati svoju granitnu LLMS liniju. Njegovo posljednje izdanje, Granit 3.1, pojavilo se krajem 2024. godine. Ta je verzija bila u osnovi ažuriranje. Ovaj novi model, međutim, dodaje eksperimentalno Lanac razmišljanja (COT) Mogućnosti obrazloženja u vrećici trikova.
Također: većina američkih radnika još ne koristi AI na poslu. Ova studija sugerira razlog zašto
Obrazloženje COT -a je napredna AI tehnika koja omogućuje LLMS -u da razgrade složene probleme na logične korake. Ovaj postupak je namijenjen oponašanju ljudskih procesa obrazloženja. Teoretski, ovaj pristup značajno poboljšava sposobnost LLM-a da postupa s zadacima koji zahtijevaju više koraka obrazloženje, izračun i odlučivanje.
Konkretno, IBM COT koristi a Optimizacija misaonih preferencija Okvir koji poboljšava rasuđivanje u širokom spektru zadataka praćenja uputa. Za razliku od tradicionalnih pristupa za učenje pojačanja usredotočenih uglavnom na zadatke usmjerene na logike, TPO omogućava poboljšanu uspješnost obrazloženja bez žrtvovanja učinkovitosti opće zadatke. Ovaj pristup pomaže ublažavanju zajedničkih kompromisa performansi viđenih u drugim modelima koji su specijalizirani za rasuđivanje.
Dakle, što ovaj napredak znači za vas i mene? IBM je objasnio da ako razmišljate o davanju AI chatbotu upita, postupak nazvan “Brzo vezanje“, dobivate određeni odgovor. Na primjer, s brzom vezom pitanja” Koja je boja nebo? “, Trebali biste dobiti odgovor” Plava “.
“Međutim, ako se zatraži da objasni “Zašto je nebo plavo?” Korištenje poticanja krevetićaAI bi prvo definirao što ‘plava’ znači (primarna boja), a zatim zaključi da se nebo čini plavim zbog apsorpcije drugih boja u atmosferi. Ovaj odgovor pokazuje sposobnost AI -ja da konstruira logički argument, “ili pojavu da LLM obraća svoj put do odgovora.
Također: 15 načina AI mi je uštedio vrijeme na poslu – i kako ga sada planiram koristiti
COT je dostupan u verzijama granita 8B i 2B. Programeri mogu programeri uključiti ili isključiti programe. Ova opcija omogućuje tvrtkama da optimiziraju računalne resurse na temelju složenosti zadataka. Uostalom, ponekad želite znati kakav je nebo bez ikakvih znanstvenih detalja. Ovaj pristup, tvrdi IBM, omogućuje modelu 8B da suparuje performansama mnogo većih modela, poput Claude 3.5 soneta i GPT-4O na složenim zadacima matematičkog rezonovanja.
IBM je također uveo novi model vida s dva milijardi parametara (VLM), posebno dizajniran za zadatke razumijevanja dokumenata. Ovaj razvoj nije, kao što ste prvo mogli misliti, grafička funkcija. Umjesto toga, VLM je namijenjen poboljšanju Graniteovih sposobnosti razumijevanja dokumenata. IBM je koristio svoj otvoreni koz Alati za docling Za obradu 85 milijuna PDF-a i generiralo 26 milijuna sintetskih parova za odgovor i odgovora kako bi se poboljšala sposobnost VLM-a za rješavanje složenih tijekova rada teških dokumenata
Dok se čini da druge tvrtke AI zavijaju sigurnosne probleme, IBM i dalje smatra sigurnost vrhunskom funkcijom. Granitni čuvar 3.2najnoviji u IBM -ovom paketu AI sigurnosnih modela, nudi poboljšano otkrivanje rizika u uputama i odgovorima. Ova ažurirana verzija održava performanse uz smanjenje veličine modela za 30%, uvodeći novu značajku “verbaliziranog povjerenja” za više nijansiranu procjenu rizika.
Također: OpenAi napokon otkriva GPT-4.5. Evo što može učiniti
Poduzeća bi također mogla biti zainteresirana za napredne mogućnosti prognoze Granita. Novi TinyTimeMixers (TTM) Modeli s parametrima pod-10M mogu dugoročno prognozirati do dvije godine u budućnost. Ovi su modeli korisni za analizu trendova u upravljanju financijama, ekonomijom i lancem opskrbe. Ovi vam modeli možda još neće pomoći da sastavite svoj popis fantastičnih bejzbol tima, ali daju im vremena.
Kao i prije, IBM je najprikladnija AI tvrtka. Svi modeli granita 3.2 dostupni su pod licencom Apache 2.0 na Zagrljaj lica. Neki su modeli dostupni na platformama, uključujući IBM Watsonx.ai,, Ollama,, Ponovitii LM Studio. Ovaj otvoreni pristup usklađuje se s IBM-ovom strategijom kako bi AI bio pristupačniji i isplativiji za poduzeća.
Kao Sriram Raghavan, IBM AI Research VP, naglasio je: “Sljedeće AI odnosi se na učinkovitost, integraciju i utjecaj u stvarnom svijetu-gdje poduzeća mogu postići snažne ishode bez pretjerane potrošnje na računanje.”