Tijekom vikenda, kineska AI Company Deepseek objavila je aplikaciju AI chat, uključujući AI model “rezonovanja” usporedivom s OpenAi -jevim O1, što je izazvalo miješanje među američkim AI kompanijama kao Deepseek Rose do vrha Appleove App Store -a.
DeepSeek je Hangzhou, kineska tvrtka koja pruža generativne AI modele i AI integraciju. Njegovi prvi proizvodi za izradu valova na američkom tržištu su GPT-4 DeepSeek-V3 i R1, napredni “model rasuđivanja”. Poput chatgpt-a, DeepSeek-V3 i R1 brzo odgovaraju na upute na prirodnom jeziku.
Nvidia i Microsoft Stock pale su u ponedjeljak nakon zujanja. Sve u svemu, tržište dionica odražavalo je nagli pad povjerenja u američke proizvođače AI. Deepseekov uspjeh izazvao je razgovor o Bilo da su američka ograničenja na kineskom pristupu AI čipovima ograničena ili ohrabrena konkurencija.
Za tehnološke profesionalce DeepSeek nudi još jednu opciju za pisanje koda ili poboljšanje učinkovitosti oko svakodnevnih zadataka. Uz DeepSeekov R1 model koji može objasniti svoje obrazloženje, temelji se na obitelji otvorenog koda modela kojima se može pristupiti na GitHubu.
Što je izvanredno kod Deepseeka?
Kao i OpenAi -ov O1 (ranije poznat kao jagoda), model obrazloženja usporava svoje mogućnosti predviđanja da “razluči” svoj rad, što mu pomaže da pruži točnije odgovore. Konkretno, modeli rasuđivanja dobro su postigli referentne vrijednosti za matematiku i kodiranje.
Deepseek je rekao Deepseek-V3 postigao više nego GPT-4O na MMLU i Humaneval testovima, dvije baterije evaluacija koje uspoređuju AI odgovore.
Deepseek je rekao da je jedan od njegovih modela koštao 5,6 milijuna dolara za treniranjedjelić novca često se troši na slične projekte u Silicijskoj dolini.
DeepSeek-V3 i R1 može se pristupiti putem App Store-a ili u pregledniku. Posjetitelji web mjesta DeepSeek mogu odabrati model R1 za sporije odgovore na složenija pitanja. Kad je odabran, R1 model stvara dugotrajne odgovore koji u razgovornoj stilu objašnjavaju kako je došao do svojih zaključaka.
Od ponedjeljka ujutro, web mjesto DeepSeek chat upozorio je da se usluga može poremetiti, iako je chatbot normalno funkcionirao.
Deepseek također nudi APII, koji djeluje putem Openai SDK ili softvera kompatibilnog s Openai SDK -om.
Što znači DeepSeekovo V3 i R1 lansiranje za AI industriju?
“Možemo u potpunosti očekivati da će ekosustav aplikacija biti izgrađen na R1, kao i na nekoliko globalnih pružatelja usluga oblaka koji nude njegove modele kao potrošnog API -ja”, rekao je Gartner u raznim VP analitičaru Arun Chandrasekaran u e -poruci u TechRepublic. “Budući uspjeh Deepseeka temelji se na njegovoj sposobnosti da kontinuirano inovira (umjesto da je jednokratni uspjeh), izgradite ekosustav programera na svojim proizvodima i prevladavaju kulturne barijere, s obzirom na svoju zemlju podrijetla.”
Chandrasekaran je rekao da Deepseekov niski troškovi, učinkovitost, referentni rezultati i otvorene utege čine ga izvanrednim.
DeepSeek-V3 obučen je na 2.048 NVIDIA H800 GPU-a. Američki proizvođači nisu, prema izvoznim pravilima koje je utvrdila administracija Biden, dopuštena prodaju čipova visokih performansi AI za obuku tvrtkama sa sjedištem u Kini.
“Potencijalna snaga i jeftini razvoj DeepSeeka dovodi u pitanje stotine milijardi dolara počinjenih u SAD-u”, rekao je Ivan Feinseth, tržišni analitičar tvrtke Tigress Financial, navodi se u bilješci klijentima koji su stekli ABC News.
Deepseek se dalje razlikuje tako što je bio otvoreni izvorProjekt vođen istraživanjem, dok se OpenAi sve više fokusira na komercijalne napore.
“DeepSeek R1 jedan je od najnevjerovatnijih i impresivnijih proboja koje sam ikad vidio – i kao otvoreni izvor, dubok poklon svijetu.”, Insider Silicijske doline i rizični kapitalist Marc Andreessen objavio je na X u petak.
Gartner je rekao da će globalna industrija AI poluvodiča dostići 114.048 dolara u 2025. godine. Gartner je predvidio da će snaga potrebna za podatkovne centre za pokretanje novo dodanih AI poslužitelja do 2027. doseći 500 teravata.
Deepseek uvodi multimodalne modele
U ponedjeljak je Deepseek slijedio svoj uspjeh s još jednim iznenađenjem: Janus-pro Obitelj multimodalnih modela. Ovi modeli mogu analizirati i generirati slike.