Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Baidu otkriva vlasnički ERNIE 5 koji nadmašuje performanse GPT-5 na grafikonima, razumijevanju dokumenata i više

Novosti

Baidu otkriva vlasnički ERNIE 5 koji nadmašuje performanse GPT-5 na grafikonima, razumijevanju dokumenata i više

Tomšić Damjan 14. studenoga 2025

Samo nekoliko sati nakon što je OpenAI ažurirao svoj vodeći temeljni model GPT-5 na GPT-5.1, obećavajući sveukupno smanjenu upotrebu tokena i ugodniju osobnost s više unaprijed postavljenih opcija, kineski pretraživački div Baidu je predstavio svoj temeljni model sljedeće generacije, ERNIE 5.0, zajedno s paketom nadogradnji proizvoda umjetne inteligencije i strateških međunarodnih ekspanzija.

Cilj: pozicionirati se kao globalni konkurent na sve konkurentnijem tržištu AI za poduzeća.

Najavljen na događaju tvrtke Baidu World 2025, ERNIE 5.0 je vlasnički, nativno omni-modalni model dizajniran za zajedničku obradu i generiranje sadržaja preko teksta, slika, zvuka i videa.

Za razliku od Baiduovog nedavno objavljenog ERNIE-4.5-VL-28B-A3B-Thinking, koji je otvorenog koda pod licencom Apache 2.0 pogodnom za poduzeća, ERNIE 5.0 je vlasnički model i dostupan je samo putem Baiduov ERNIE Bot web-mjesto (trebao sam ga ručno odabrati iz padajućeg izbornika za odabir modela) i Qianfan platforma za oblak aplikacijsko programsko sučelje (API) za poslovne korisnike.

Usporedo s lansiranjem modela, Baidu je predstavio velika ažuriranja svoje digitalne ljudske platforme, alata bez kodiranja i AI agenata opće namjene — sve s ciljem širenja svog AI traga izvan Kine.

Tvrtka je također predstavila ERNIE 5.0 Preview 1022, varijantu optimiziranu za tekstualno intenzivne zadatke, uz opći model pregleda koji balansira između modaliteta.

Baidu je naglasio da ERNIE 5.0 predstavlja pomak u načinu na koji se inteligencija primjenjuje na razmjeru, a izvršni direktor Robin Li izjavio je: “Kada internalizirate umjetnu inteligenciju, ona postaje izvorna sposobnost i transformira inteligenciju iz troška u izvor produktivnosti.”

Sadržaj objave

  • 1 Gdje ERNIE 5.0 nadmašuje GPT-5 i Gemini 2.5 Pro
  • 2 Strategija cijena poduzeća
  • 3 Globalno širenje: proizvodi i platforme
  • 4 Open-Source Vision-Language Model privlači pažnju industrije
  • 5 Povratne informacije zajednice i Baiduov odgovor
  • 6 Outlook za Baidu i njegovu ERNIE temeljnu LLM obitelj
  • 7 Povezani sadržaji

Gdje ERNIE 5.0 nadmašuje GPT-5 i Gemini 2.5 Pro

ERNIE 5.0 benchmark rezultati sugeriraju da je Baidu postigao paritet – ili skoro paritet – s vrhunskim zapadnim modelima temelja u širokom spektru zadataka.

U javnim referentnim slajdovima podijeljenim tijekom događaja Baidu World 2025, ERNIE 5.0 Preview nadmašio je ili se poklopio s OpenAI-jevim GPT-5-High i Googleovim Gemini 2.5 Pro u multimodalno razmišljanje, razumijevanje dokumenata i osiguranje kvalitete temeljeno na slikamadok također demonstrirajući jake sposobnosti jezičnog modeliranja i izvođenja koda.

Tvrtka je naglasila svoju sposobnost rukovanja zajedničkim ulazima i izlazima preko modaliteta, umjesto da se oslanja na post-hoc fuziju modaliteta, koju je uokvirila kao tehničku razliku.

Na vizualnim zadacima, ERNIE 5.0 postigao je vodeće rezultate na OCRBench, DocVQA i ChartQA, tri mjerila koja testiraju prepoznavanje dokumenata, razumijevanje i rezoniranje strukturiranih podataka.

Baidu tvrdi da je model nadmašio i GPT-5-High i Gemini 2.5 Pro na ovim referentnim vrijednostima temeljenim na dokumentima i grafikonima, područjima koja opisuje kao ključna za poslovne aplikacije poput automatizirane obrade dokumenata i financijske analize.

U generiranju slika, ERNIE 5.0 je izjednačio ili premašio Googleov Veo3 u kategorijama uključujući semantičko usklađivanje i kvalitetu slike, prema Baiduovoj internoj procjeni temeljenoj na GenEvalu. Baidu je tvrdio da mu multimodalna integracija modela omogućuje generiranje i tumačenje vizualnog sadržaja s većom kontekstualnom sviješću od modela koji se oslanjaju na kodere specifične za modalitet.

Za audio i govorne zadatke, ERNIE 5.0 pokazao je konkurentne rezultate na MM-AU i TUT2017 referentnim vrijednostima razumijevanja zvuka, kao i odgovaranje na pitanja iz unosa govornog jezika. Njegova audio izvedba, iako nije tako jako naglašena kao vizija ili tekst, sugerira širok otisak mogućnosti namijenjen podržavanju multimodalnih aplikacija punog spektra.

U jezičnim zadacima, model je pokazao snažne rezultate u praćenju instrukcija, odgovaranju na činjenična pitanja i matematičkom zaključivanju – temeljnim područjima koja definiraju poslovnu korisnost velikih jezičnih modela.

Preview 1022 varijanta ERNIE 5.0, skrojena za tekstualne performanse, pokazala je još bolje rezultate specifične za jezik u ranom pristupu razvojnih programera. Iako Baidu ne tvrdi da je superioran u općem jezičnom razmišljanju, njegove interne procjene sugeriraju da ERNIE 5.0 Preview 1022 zatvara jaz s vrhunskim modelima na engleskom jeziku i nadmašuje ih u performansama na kineskom jeziku.

Iako Baidu nije javno objavio potpune pojedinosti o usporedbi ili sirove rezultate, njegovo pozicioniranje performansi sugerira namjerni pokušaj da se ERNIE 5.0 uobliči ne kao nišni multimodalni sustav, već kao vodeći model konkurentan najvećim zatvorenim modelima u rasuđivanju opće namjene.

Tamo gdje Baidu tvrdi da je jasno vodstvo u razumijevanju strukturiranog dokumenta, obrazloženju vizualnih dijagrama i integraciji višestrukih modaliteta u jednu, izvornu arhitekturu modeliranja. Neovisna provjera ovih rezultata ostaje u tijeku, ali širina navedenih mogućnosti pozicionira ERNIE 5.0 kao ozbiljnu alternativu u krajoliku modela multimodalnih temelja.

Strategija cijena poduzeća

ERNIE 5.0 pozicioniran je na vrhunski kraj Baiduove strukture cijena modela. Tvrtka je objavila posebne cijene za korištenje API-ja na svojoj platformi Qianfan, usklađujući cijenu s ostalim vrhunskim ponudama kineskih konkurenata poput Alibabe.

Model

Ulazni trošak (po 1K tokena)

Izlazni trošak (po 1K tokena)

Izvor

ERNIE 5.0

0,00085 USD (0,006 JPY)

0,0034 USD (0,024 JPY)

Qianfan

ERNIE 4.5 Turbo (ex.)

0,00011 USD (0,0008 JPY)

0,00045 USD (0,0032 JPY)

Qwen3 (bivši koder)

0,00085 USD (0,006 JPY)

0,0034 USD (0,024 JPY)

Qianfan

Kontrast u cijeni između ERNIE 5.0 i ranijih modela kao što je ERNIE 4.5 Turbo naglašava Baiduovu strategiju da napravi razliku između modela velike količine, niske cijene i modela visokih mogućnosti dizajniranih za složene zadatke i multimodalno razmišljanje.

U usporedbi s drugim američkim alternativama, ostaje srednjeg ranga cijena:

Model

Unos (/1 M tokena)

Izlaz (/1 M tokena)

Izvor

GPT-5.1

1,25 dolara

10,00 dolara

OpenAI

ERNIE 5.0

0,85 dolara

3,40 dolara

Qianfan

ERNIE 4.5 Turbo (ex.)

0,11 dolara

0,45 dolara

Qianfan

Claude Opus 4.1

15,00 dolara

75,00 dolara

antropski

Gemini 2.5 Pro

1,25 USD (≤200 tisuća) / 2,50 USD (>200 tisuća)

10,00 USD (≤200 tisuća) / 15,00 USD (>200 tisuća)

Cijene Google Vertex AI

Grok 4 (grok-4-0709)

3,00 dolara

15,00 dolara

xAI API

Globalno širenje: proizvodi i platforme

U tandemu s izdavanjem modela, Baidu se širi međunarodno:

  • GenFlow 3.0sada s više od 20 milijuna korisnika, najveći je tvrtkin AI agent opće namjene i ima poboljšanu memoriju i multimodalno rukovanje zadacima.

  • Famousamorazvijajući agent sposoban za dinamičko rješavanje složenih problema, sada je komercijalno dostupan putem pozivnice.

  • MeDomeđunarodna verzija Baiduovog alata za izgradnju bez koda Miaoda, dostupna je globalno putem medo.dev.

  • Oreateradni prostor za produktivnost s podrškom za dokumente, slajdove, slike, videozapise i podcaste, dosegao je preko 1,2 milijuna korisnika diljem svijeta.

Baiduova digitalna ljudska platforma, koja je već pokrenuta u Brazilu, također je dio globalnog pokreta. Prema podacima tvrtke, 83% livestreamera tijekom ovogodišnjeg shopping događaja “Double 11” u Kini koristilo je Baiduovu digitalnu ljudsku tehnologiju, što je pridonijelo povećanju GMV-a od 91%.

U međuvremenu, Baiduova autonomna usluga pozivanja prijevoza Apollo Go premašila je 17 milijuna vožnji, upravljajući flotama bez vozača u 22 grada i polažući titulu najveće svjetske robotaxi mreže.

Open-Source Vision-Language Model privlači pažnju industrije

Dva dana prije vodećeg događaja ERNIE 5.0, Baidu je također objavio multimodalni model otvorenog koda pod licencom Apache 2.0: ERNIE-4.5-VL-28B-A3B-Thinking.

Kao što je izvijestio moj kolega Michael Nuñez iz VentureBeata, model aktivira samo 3 milijarde parametara dok zadržava ukupno 28 milijardi, koristeći Mixture-of-Experts (MoE) arhitekturu za učinkovito zaključivanje.

Ključne tehničke inovacije uključuju:

  • “Thinking with Images”, koji omogućuje vizualnu analizu temeljenu na dinamičkom zumiranju

  • Podrška za tumačenje grafikona, razumijevanje dokumenata, vizualno uzemljenje i vremensku svijest u videu

  • Vrijeme rada na jednom GPU-u od 80 GB, što ga čini dostupnim organizacijama srednje veličine

  • Potpuna kompatibilnost s alatima Transformers, vLLM i Baidu FastDeploy

Ovo izdanje povećava pritisak na konkurente zatvorenog koda. Uz licenciranje Apache 2.0, ERNIE-4.5-VL-28B-A3B-Thinking postaje održiv temeljni model za komercijalne aplikacije bez ograničenja licenciranja – nešto što nudi nekoliko modela visokih performansi u ovoj klasi.

Povratne informacije zajednice i Baiduov odgovor

Nakon lansiranja ERNIE 5.0, programer i vještački evaluator Lisan al Gaib (@scaling01) objavio mješovitu recenziju na X. Iako su u početku bili impresionirani referentnim performansama modela, izvijestili su o postojanom problemu pri kojem bi ERNIE 5.0 opetovano pozivao alate – čak i kada im je izričito naloženo da to ne čine – tijekom zadataka generiranja SVG-a.

“ERNIE 5.0 benchmarks izgledao je suludo dok ga nisam testirao… nažalost, RL ima oštećen mozak ili imaju ozbiljan problem sa svojom platformom za chat/sustavom,” napisao je Lisan.

Za nekoliko sati, Baiduov račun za podršku usmjeren na razvojne programere, @ErnieforDevs, odgovorio:

“Hvala na povratnim informacijama! To je poznata pogreška — određena sintaksa je može dosljedno pokrenuti. Radimo na ispravku. Možete pokušati preformulirati ili promijeniti upit kako biste ga za sada izbjegli.”

Brzi preokret odražava Baiduov sve veći naglasak na komunikaciji programera, posebno jer se dopada međunarodnim korisnicima putem vlasničkih i otvorenih ponuda.

Outlook za Baidu i njegovu ERNIE temeljnu LLM obitelj

Baiduov ERNIE 5.0 označava stratešku eskalaciju u globalnoj utrci temeljnih modela. S tvrdnjama o performansama koje ga stavljaju u rang s najnaprednijim sustavima OpenAI-ja i Googlea, te kombinacijom vrhunskih cijena i alternativa otvorenom pristupu, Baidu signalizira svoju ambiciju da postane ne samo domaći vodeći AI, već i vjerodostojan pružatelj globalne infrastrukture.

U vrijeme kada korisnici umjetne inteligencije u poduzećima sve više zahtijevaju multimodalnu izvedbu, fleksibilno licenciranje i učinkovitost implementacije, Baiduov pristup na dva kolosijeka – premium hostirani API-ji i izdanja otvorenog koda – može proširiti svoju privlačnost u korporativnoj i razvojnoj zajednici.

Ostaje za vidjeti hoće li se tvrdnje o performansama tvrtke održati prema testiranju treće strane. Ali u krajoliku oblikovanom rastućim troškovima, složenošću modela i računalnim uskim grlima, ERNIE 5.0 i njegov prateći ekosustav daju Baidu konkurentnu poziciju u sljedećem valu implementacije umjetne inteligencije.

Web izvor

Povezani sadržaji

  • Call of Duty: Black Ops 7 ima najniži Metacritic korisnički rezultat ikada za Call of Duty igruCall of Duty: Black Ops 7 ima najniži Metacritic korisnički rezultat ikada za Call of Duty igru
  • Google otkriva nove Kubernetes i GKE poboljšanja za AI inovacijeGoogle otkriva nove Kubernetes i GKE poboljšanja za AI inovacije
  • Najbolje mobilne aplikacije za poduzetnike 1. dio [2011]
  • Reaky Music Pokreće aplikaciju pjevačkog dobrobitiReaky Music Pokreće aplikaciju pjevačkog dobrobiti
  • Wubuntu distribucija Linuxa toliko je slična Windowsu da čak dolazi s Microsoftovim aplikacijamaWubuntu distribucija Linuxa toliko je slična Windowsu da čak dolazi s Microsoftovim aplikacijama
  • Elden Ring bio je toliko uspješan prošle godine da Kadokawa i dalje očekuje pad dobiti od 60% unatoč Nightreign i Switch 2Elden Ring bio je toliko uspješan prošle godine da Kadokawa i dalje očekuje pad dobiti od 60% unatoč Nightreign i Switch 2

Previous Article

Britanske crkve polažu svoju vjeru u toplinske pumpe

Next Article

Ubisoft izdaje rijetku odgodu objave zarade u zadnji čas, 15 minuta prije zakazanog razgovora s investitorima

Posljednje objave

Vaping je ‘posvuda’ u školama—pokreće bum nadzora kupaonica

Vaping je ‘posvuda’ u školama—pokreće bum nadzora kupaonica

Nextcloud Office u odnosu na OnlyOffice: testirao sam oba kako bih pronašao najbolju Microsoft 365 alternativu

Najbolje Dell ponude za crni petak 2025.: 15 prijenosnih računala rasprodano je sada

Sadržaj

  • 1 Gdje ERNIE 5.0 nadmašuje GPT-5 i Gemini 2.5 Pro
  • 2 Strategija cijena poduzeća
  • 3 Globalno širenje: proizvodi i platforme
  • 4 Open-Source Vision-Language Model privlači pažnju industrije
  • 5 Povratne informacije zajednice i Baiduov odgovor
  • 6 Outlook za Baidu i njegovu ERNIE temeljnu LLM obitelj

Novosti

  • Vaping je ‘posvuda’ u školama—pokreće bum nadzora kupaonica 26. studenoga 2025
  • Nextcloud Office u odnosu na OnlyOffice: testirao sam oba kako bih pronašao najbolju Microsoft 365 alternativu 25. studenoga 2025
  • Najbolje Dell ponude za crni petak 2025.: 15 prijenosnih računala rasprodano je sada 25. studenoga 2025
  • Samsung daje 60% popusta na Galaxy Watch 8 Classic 25. studenoga 2025
  • Ne mogu vjerovati da trenutačno možete kupiti PS5 za samo £20 više od Xbox Series S – i dobivate više prostora za pohranu 25. studenoga 2025
  • IBM i Cisco otvaraju kvantnu mrežnu suradnju 25. studenoga 2025
  • Anthropicov Claude Opus 4.5 je ovdje: Jeftiniji AI, beskonačni chatovi i vještine kodiranja koje pobjeđuju ljude 25. studenoga 2025
  • Dno zdjelice je problem 24. studenoga 2025
  • 7 aplikacija otvorenog koda koje bih pošteno platio jer su tako dobre 24. studenoga 2025
  • Najbolje rane ponude monitora za Crni petak 2025.: 39 rano rasprodano 24. studenoga 2025

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice