Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

Alibabin model razmišljanja Qwen s pitanjima nadmašuje o1-preview

Novosti

Alibabin model razmišljanja Qwen s pitanjima nadmašuje o1-preview

Tomšić Damjan 29. studenoga 2024


Pridružite se našim dnevnim i tjednim biltenima za najnovija ažuriranja i ekskluzivni sadržaj o AI pokrivenosti vodećoj u industriji. Saznajte više


Kineski div e-trgovine Alibaba izbacio je najnoviji model u svojoj obitelji Qwen koja se neprestano širi. Ovaj je poznat kao Qwen s pitanjima (QwQ) i služi kao najnoviji open source konkurent OpenAI-jevom o1 modelu razmišljanja.

Kao i drugi veliki modeli rasuđivanja (LRM), QwQ koristi dodatne računske cikluse tijekom zaključivanja za pregled svojih odgovora i ispravljanje pogrešaka, što ga čini prikladnijim za zadatke koji zahtijevaju logično rasuđivanje i planiranje poput matematike i kodiranja.

Sadržaj objave

  • 1 Što je Qwen s pitanjima (OwQ?) i može li se koristiti u komercijalne svrhe?
  • 2 ‘Otkrili smo nešto dubokoumno’
  • 3 Doba LLM-a ustupa mjesto LRM-ovima: Veliki modeli rasuđivanja
    • 3.1 Povezani sadržaji

Što je Qwen s pitanjima (OwQ?) i može li se koristiti u komercijalne svrhe?

Alibaba je izdala verziju QwQ-a s 32 milijarde parametara s kontekstom od 32.000 tokena. Model je trenutno u fazi pregleda, što znači da će vjerojatno uslijediti verzija s boljim performansama.

Prema Alibabinim testovima, QwQ nadmašuje o1-preview na mjerilima AIME i MATH, koji ocjenjuju sposobnosti rješavanja matematičkih problema. Također nadmašuje o1-mini na GPQA, mjerilu za znanstveno zaključivanje. QwQ je inferioran u odnosu na o1 na mjerilima kodiranja LiveCodeBench, ali još uvijek nadmašuje druge granične modele kao što su GPT-4o i Claude 3.5 Sonnet.

Primjer izlaza Qwena s pitanjima

QwQ ne dolazi s pratećim dokumentom koji opisuje podatke ili proces korišten za treniranje modela, što otežava reproduciranje rezultata modela. Međutim, budući da je model otvoren, za razliku od OpenAI o1, njegov “proces razmišljanja” nije skriven i može se koristiti za razumijevanje načina na koji model razmišlja pri rješavanju problema.

Alibaba je također izdala model pod licencom Apache 2.0, što znači da se može koristiti u komercijalne svrhe.

‘Otkrili smo nešto dubokoumno’

Prema a post na blogu koji je objavljen zajedno s objavom modela, “Kroz duboko istraživanje i bezbrojna ispitivanja, otkrili smo nešto duboko: kada dobijemo vremena za razmišljanje, preispitivanje i promišljanje, modelovo razumijevanje matematike i programiranja procvjeta poput cvijeta koji se otvara suncu. … Ovaj proces pažljivog promišljanja i samoispitivanja vodi do izvanrednih pomaka u rješavanju složenih problema.”

Ovo je vrlo slično onome što znamo o tome kako funkcioniraju modeli rasuđivanja. Generiranjem više tokena i pregledom njihovih prethodnih odgovora, veća je vjerojatnost da će modeli ispraviti potencijalne pogreške. Marco-o1, još jedan model rezoniranja koji je nedavno objavila Alibaba također bi mogao sadržavati naznake o tome kako bi QwQ mogao funkcionirati. Marco-o1 koristi Pretraga stabla u Monte Carlu (MCTS) i samorefleksija u vrijeme zaključivanja za stvaranje različitih grana zaključivanja i odabir najboljih odgovora. Model je treniran na mješavini primjera lanca mišljenja (CoT) i sintetičkih podataka generiranih MCTS algoritmima.

Alibaba ističe da QwQ još uvijek ima ograničenja kao što je miješanje jezika ili zaglavljivanje u kružnim petljama razmišljanja. Model je dostupan za preuzimanje na Lice koje grli a online demo može se pronaći na Prostori za grljenje lica.

Doba LLM-a ustupa mjesto LRM-ovima: Veliki modeli rasuđivanja

Izdanje o1 potaknulo je rastući interes za stvaranje LRM-ova, iako se ne zna mnogo o tome kako model radi ispod haube osim korištenja vremenske skale zaključivanja za poboljšanje odgovora modela.

Sada postoji nekoliko kineskih konkurenata o1. Kineski AI laboratorij DeepSeek nedavno je izdao R1-Lite-Preview, svog o1 konkurenta, koji je trenutno dostupan samo putem mrežnog sučelja za chat tvrtke. R1-Lite-Preview navodno je bolji od o1 na nekoliko ključnih mjerila.

Još jedan nedavno objavljeni model je LLaVA-o1, koji su razvili istraživači s više sveučilišta u Kini, a koji donosi paradigmu zaključivanja vremena zaključivanja u modele jezika vizije otvorenog koda (VLM).

Fokus na LRM-ove dolazi u vrijeme neizvjesnosti o budućnosti zakona o skaliranju modela. izvješća pokazuju da laboratoriji umjetne inteligencije kao što su OpenAI, Google DeepMind i Anthropic ostvaruju sve manje povrate na obuku većih modela. A stvaranje većih količina kvalitetnih podataka za obuku postaje sve teže jer se modeli već obučavaju na trilijunima tokena prikupljenih s interneta.

U međuvremenu, vremenska skala zaključivanja nudi alternativu koja bi mogla pružiti sljedeći napredak u poboljšanju sposobnosti sljedeće generacije AI modela. Postoje izvješća da je OpenAI koristeći o1 za generiranje podataka o sintetičkom razmišljanju osposobiti sljedeću generaciju svojih LLM-a. Objavljivanje modela otvorenog razmišljanja vjerojatno će potaknuti napredak i učiniti prostor konkurentnijim.

VB Dnevnik

Budite u toku! Svakodnevno primajte najnovije vijesti u svoju pristiglu poštu

Pretplatom se slažete s Uvjetima pružanja usluge VentureBeata.

Hvala što ste se pretplatili. Više VB biltena pogledajte ovdje.

Došlo je do pogreške.



Web izvor

Povezani sadržaji

  • Što je Doomscrolling?
  • Kontrola chata: EU da odluči o zahtjevu da tehnološke tvrtke skeniraju šifrirane porukeKontrola chata: EU da odluči o zahtjevu da tehnološke tvrtke skeniraju šifrirane poruke
  • Nvidia Project Digits: Radna površina s Linuxom za AI programereNvidia Project Digits: Radna površina s Linuxom za AI programere
  • Death Stray Stray 2 26. lipnja na PlaystationDeath Stray Stray 2 26. lipnja na Playstation
  • Strateški veleprodajni sporazum o vlaknima u zajednici s VodafoneThreeStrateški veleprodajni sporazum o vlaknima u zajednici s VodafoneThree
  • Evo zahtjeva za računalo za umiranje svjetla: ZvijerEvo zahtjeva za računalo za umiranje svjetla: Zvijer

Previous Article

Vraćanje amazonske prašume njezinim pravim skrbnicima

Next Article

Može li generativna umjetna inteligencija pomoći popuniti prazninu u vještinama u inženjerstvu?

Posljednje objave

Njemačka država zamjenjuje Microsoft Exchange i Outlook e-poštom otvorenog koda

Samsung nudi 100 dolara trenutačne ponude novim korisnicima XR slušalica prije nego što je Upakiran

Google fotografije stvaranje kolaža dobiva velika poboljšanja

Google fotografije stvaranje kolaža dobiva velika poboljšanja

Sadržaj

  • 1 Što je Qwen s pitanjima (OwQ?) i može li se koristiti u komercijalne svrhe?
  • 2 ‘Otkrili smo nešto dubokoumno’
  • 3 Doba LLM-a ustupa mjesto LRM-ovima: Veliki modeli rasuđivanja

Novosti

  • Njemačka država zamjenjuje Microsoft Exchange i Outlook e-poštom otvorenog koda 15. listopada 2025
  • Samsung nudi 100 dolara trenutačne ponude novim korisnicima XR slušalica prije nego što je Upakiran 15. listopada 2025
  • Google fotografije stvaranje kolaža dobiva velika poboljšanja 14. listopada 2025
  • Assassin’s Creed Franchise olovo ostavlja Ubisoft nakon formiranja podružnice Tencent 14. listopada 2025
  • Sita otkriva prevlake za vlaknastim optičkim aerodromima 14. listopada 2025
  • Jezični modeli koji se samo usavršavaju postaju stvarnost s MIT-ovom ažuriranom tehnikom pečata 14. listopada 2025
  • Kako učiniti STEM smiješnim – i idi virusno radeći 14. listopada 2025
  • 10 Windows aplikacija otvorenog koda ne mogu živjeti – i svi su besplatni 14. listopada 2025
  • Isprobao sam pametne naočale s XMEMS zvučnicima i aktivnim hlađenjem – i puni su obećanja 13. listopada 2025
  • Moramo se približiti pokretanju Galaxy XR 13. listopada 2025

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice