Oblak Znanja

  • Home
  • Novosti
  • Učionica
    • Informatika 5
    • Informatika 6
    • Informatika 7
    • Informatika 8
    • Logo jezik
    • WordPress
    • Microsoft Office
  • Vodiči
    • Online vodiči
    • Kratki savjeti
    • Korisne aplikacije
    • Društvene mreže
    • Multimedija
    • Zanimljivosti
✕

U prepunom glasu AI tržište, OpenAi se kladi u pranje uputa i izražajni govor za osvajanje poslovnih usvajanja

Novosti

U prepunom glasu AI tržište, OpenAi se kladi u pranje uputa i izražajni govor za osvajanje poslovnih usvajanja

Tomšić Damjan 29. kolovoza 2025


Želite pametnije uvide u vašu pristiglu poštu? Prijavite se za naše tjedne biltene kako biste dobili samo ono što je važno za vođe AI, podataka i sigurnosti. Pretplatite se sada


Open dodaje sve konkurentnije AI glasovno tržište za poduzeća sa svojim Novi model, GPT-Realtimeto slijedi složene upute i s glasovima “koji zvuče prirodnije i izražajnije.”

Kako glas AI nastavlja rasti, a kupci pronalaze slučajeve upotrebe kao što su pozivi za korisnike ili prijevod u stvarnom vremenu, tržište za realno zvučni AI glasovi koji također nude sigurnost u poduzeću se zagrijavaju. OpenAi tvrdi da njegov novi model pruža više ljudski glas, ali još uvijek se mora natjecati protiv tvrtki poput jedanaestlaba.

Model će biti dostupan na API -u u stvarnom vremenu, koji je tvrtka također općenito učinila dostupnom. Zajedno s modelom GPT-REALTIME, Openai je objavio i nove glasove na API-ju, koje naziva Cedar i Marin, te je ažurirao ostale glasove za rad s najnovijim modelom.

OpenAi je u Livestreamu rekao da je surađivao sa svojim kupcima koji grade glasovne aplikacije za obuku GPT-REALTIME i “pažljivo su usklađivali model s evalima koje su izgrađene na scenarijima u stvarnom svijetu poput korisničke podrške i akademskog podučavanja.”


AI skaliranje pogađa svoje granice

Power ograničenja, rastući troškovi tokena i kašnjenja zaključivanja preoblikovaju Enterprise AI. Pridružite se našem ekskluzivnom salonu kako biste otkrili kako su vrhunski timovi:

  • Pretvaranje energije u stratešku prednost
  • Arhitekturiste učinkovite zaključke za stvarne propusne dobitke
  • Otključavanje natjecateljskog ROI -a s održivim AI sustavima

Osigurajte svoje mjesto da ostanete naprijed:: https://bit.ly/4mwgngo


https://www.youtube.com/watch?v=nfbmtmjhx0

Tvrtka je reklamirala sposobnost modela da stvori emotivne, prirodno zvučne glasove koji se također usklađuju s načinom na koji se programeri grade s tehnologijom.

Sadržaj objave

  • 1 Modeli govora u govor
  • 2 Bolje upute slijedeći
  • 3 Ažuriranja API u stvarnom vremenu
    • 3.1 Povezani sadržaji

Modeli govora u govor

Model djeluje u okviru govora u govoru, omogućujući mu da razumije govorne upute i glasno reagira. Modeli govora u govoru idealno su prikladni za odgovore u stvarnom vremenu, gdje osoba, obično kupac, komunicira s aplikacijom.

Na primjer, kupac želi vratiti neke proizvode i poziva platformu za korisničku uslugu. Mogli bi razgovarati s AI glasovnim asistentom koji odgovara na pitanja i zahtijeva kao da razgovaraju s čovjekom.

U live stream -u, Openai kupci T-Mobile Prikazao je agent AI-a koji pomaže ljudima da pronađu nove telefone. Drugi kupac, platforma za pretraživanje nekretnina Zillowizložio je agenta koji pomaže nekome suziti susjedstvo kako bi pronašao savršeno mjesto.

OpenAi je rekao da je GPT-REALTIME njegov “najnapredniji, produkcijski glasovni model”. Kao i drugi glasovni modeli, on može prebaciti jezike usred rečenice. Međutim, istraživači OpenAi-a primijetili su da GPT-REALTIME može slijediti složenije upute poput “Izgovarano govorite u francuskom naglasku.”

No, GPT-Realtime se suočava s konkurencijom drugih modela koje mnoge marke već koriste. Jedanaest Objavljen razgovor AI 2.0 u svibnju. Zvuk Partneri s franšizama brze hrane za AI glasovni pogon. Naglašeni AI pokretanje Hume lansirao je svoj EVI 3 model, koji korisnicima omogućuje generiranje AI verzija vlastitog glasa.

Budući da poduzeća otkrivaju različite slučajeve upotrebe za glasovni AI, još općenitiji pružatelji modela koji nude multimodalne LLM -ove čine slučaj za sebe. Mistral Objavio je svoj novi Voxtral model, navodeći da će dobro funkcionirati s prijevodom u stvarnom vremenu. Google poboljšava svoje audio mogućnosti i stječe popularnost pomoću audio značajke na NotebookLM -u koji istraživačke bilješke pretvara u podcast.

Bolje upute slijedeći

OpenAi je rekao da je GPT-Realtime pametniji i bolje razumije izvorni zvuk, uključujući mogućnost hvatanja neverbalnih znakova poput smijeha ili uzdaha.

Benchmarking koristeći audio Eval s velikim klupama pokazalo je da je model postigao 82,8% u točnosti, u usporedbi s prethodnim modelom, koji je postigao 65,6%. OpenAi nije pružio brojeve testiranja GPT-REALTIME protiv modela svojih konkurenata.

OpenAi se fokusirao na poboljšanje mogućnosti praćenja uputa modela, osiguravajući da se model učinkovitije pridržava uputa. Novi model postiže ocjenu od 30,5% na multichallenge zvučnoj mjeri. Inženjeri su također pojačali funkciju poziva kako bi GPT-REALTIME mogao pristupiti ispravnim alatima.

Ažuriranja API u stvarnom vremenu

Kako bi podržao novi model i poboljšao kako poduzeća integriraju AI mogućnosti u stvarnom vremenu u svoje aplikacije, Openai je u API u stvarnom vremenu dodao nekoliko novih značajki.

Sada može podržati MCP i prepoznati unose slike, omogućavajući mu da obavijesti korisnike o onome što vidi u stvarnom vremenu. Ovo je značajka koju je Google snažno naglasio tijekom prezentacije Projekta ASTRA prošle godine.

API u stvarnom vremenu također može podnijeti protokol inicijacije sesije (SIP). SIP povezuje aplikacije s telefonima poput javne telefonske mreže ili stolnih telefona, otvarajući više slučajeva uporabe kontakta. Korisnici također mogu uštedjeti i ponovo upotrijebiti upute na API -ju.

Do sada su ljudi impresionirani modelom, iako su to još uvijek početni testovi modela koji je nedavno objavljen.

TBH, značajke MCP i SIP prava su priča ovdje, a ne samo još jedan model.

Mogućnost povezivanja s vanjskim alatima i sustavima neprimjetno je ono što će konačno premjestiti ove modele od impresivnih demonstracija do integriranja u stvarne tokove rada.

Aspekt u stvarnom vremenu …

– jk (@_JUnaidkhalid1) 28. kolovoza 2025

Testiranje GPT-REALTIME

Početni pregled:
– Ne primjereno poboljšanje zvuka
– To je naljepnica za upute (vrlo dobre)
– osjeća se brzo pic.twitter.com/ltycs0qlxv

– Jake Colling (@JacobColling) 28. kolovoza 2025

Pa, GPT-REALTIME je dobio livestream ne zato što je većina korisnika zainteresirana, već iz strateških poslovnih razloga

Pozivni centri su glavni cilj za pružatelje usluga LLM -a, a prva tvrtka koja je postigla pravi proboj dobit će ogroman prihod

– Anko (@anko_979) 28. kolovoza 2025

Prednosti i nedostaci od @Openai Ažuriranje u stvarnom vremenu od nekoga tko gradi u AI Audio:

Pro: Bolje pozivanje funkcija, više emocija, 20% jeftinije, bolja kontrola, slika je cool, ali neće koristiti

CON: Nema prilagođenih glasova (kreativno iskustvo mora imati), još uvijek * skupo * vs tts-llm-STT cjevovodi

– Gavin Purcell (@GavinpurCell) 28. kolovoza 2025

OpenAi je smanjio cijene za GPT-REALTIME za 20% na 32 USD na milijun tokena za audio ulaz i 64 USD za audio izlazne tokene.

Dnevni uvidi u slučajeve poslovne uporabe s VB dnevno

Ako želite impresionirati svog šefa, VB Daily vas je pokrivao. Dajemo vam unutarnju lopaticu o tome što tvrtke rade s generativnim AI, od regulatornih pomaka do praktičnih razmještaja, tako da možete dijeliti uvide za maksimalni ROI.

Pročitajte našu politiku privatnosti

Hvala na pretplati. Pogledajte više VB biltena ovdje.

Došlo je do pogreške.



Web izvor

Povezani sadržaji

  • Volim vlasnike Pixel telefona koji odgovaraju na pitanje o termometru na svom telefonu
  • Beba je u rekordnom vremenu dobila prilagođeni CRISPR tretmanBeba je u rekordnom vremenu dobila prilagođeni CRISPR tretman
  • SEO vs. SEM: Koja je razlika?SEO vs. SEM: Koja je razlika?
  • Astro Bot, Final Fantasy 7 Rebirth vode u ovogodišnjim nominacijama za The Game AwardsAstro Bot, Final Fantasy 7 Rebirth vode u ovogodišnjim nominacijama za The Game Awards
  • Platforma za e-trgovinu eBay nudi besplatan chatgpt trening i alatiPlatforma za e-trgovinu eBay nudi besplatan chatgpt trening i alati
  • Klimatske promjene učinile su uragan Melissa 4 puta vjerojatnijim, sugerira studijaKlimatske promjene učinile su uragan Melissa 4 puta vjerojatnijim, sugerira studija

Previous Article

Kako vidjeti ukupnu pomrčinu lunara i krvi 7. rujna

Next Article

Potrošnja za biljke kabela za neprestano rast, otvoreno trčanje stabilizirajući

Posljednje objave

Sve više dokaza koji sugeriraju da se Ubisoft doista sprema najaviti remake Assassin’s Creed 4: Black Flag

Sve više dokaza koji sugeriraju da se Ubisoft doista sprema najaviti remake Assassin’s Creed 4: Black Flag

Teksaški sudac odbacuje drugu tužbu zbog prekida rada CrowdStrikea

Teksaški sudac odbacuje drugu tužbu zbog prekida rada CrowdStrikea

Z.ai GLM-Image otvorenog koda pobjeđuje Googleov Nano Banana Pro u složenom prikazivanju teksta, ali ne i u estetici

Z.ai GLM-Image otvorenog koda pobjeđuje Googleov Nano Banana Pro u složenom prikazivanju teksta, ali ne i u estetici

Sadržaj

  • 1 Modeli govora u govor
  • 2 Bolje upute slijedeći
  • 3 Ažuriranja API u stvarnom vremenu

Novosti

  • Sve više dokaza koji sugeriraju da se Ubisoft doista sprema najaviti remake Assassin’s Creed 4: Black Flag 15. siječnja 2026
  • Teksaški sudac odbacuje drugu tužbu zbog prekida rada CrowdStrikea 15. siječnja 2026
  • Z.ai GLM-Image otvorenog koda pobjeđuje Googleov Nano Banana Pro u složenom prikazivanju teksta, ali ne i u estetici 15. siječnja 2026
  • Neuroznanstvenici dešifriraju odugovlačenje: moždani mehanizam objašnjava zašto ljudi ostavljaju određene zadatke za kasnije 15. siječnja 2026
  • Ovaj popularni Bose zvučnik izgubit će softversku podršku 2026. – ali sada ima spas 14. siječnja 2026
  • Google Photos “Ask” pretraga još uvijek ima puno mrzitelja 14. siječnja 2026
  • Battlefield 6, 2. sezona odgođena je za veljaču, ali još sadržaja za 1. sezonu i događaja je na putu 14. siječnja 2026
  • Širokopojasna revolucija u Velikoj Britaniji ne pokazuje znakove usporavanja 14. siječnja 2026
  • Zašto Egnyte nastavlja zapošljavati mlađe inženjere unatoč porastu AI alata za kodiranje 14. siječnja 2026
  • Microsoft popušta pod pritiskom: Podatkovni centri trebali bi plaćati skuplju struju 14. siječnja 2026

O nama

Oblak Znanja je blog edukativnog karaktera i namijenjen je svima koji žele unaprijediti svoje znanje iz područja računala i interneta.

Naš cilj je edukacija i pisanje zanimljivih objava kojima ćemo zajedno učiti i informirati se o svijetu informatike.

Na ovom blogu zabranjeno je svako kopiranje sadržaja bez dozvole autora.

Oblak Znanja

Oznake

besplatni powerpoint predlošci društvene mreže excel facebook firefox gmail google+ Google Chrome halloween halloween walpapers internet kartice linkedin profil linux microsoft Mozilla Firefox ms powerpoint oblak znanja office 2007 office savjeti online kupovina pick powerpoint powerpoint predložak powerpoint savjeti rastući niz savjet slike za radnu površinu spremanje datoteka strani jezik tipkovnicke kratice twitter twitter alati uređivanje slika wallpaper clock web preglednik windows windows 7 windows aplikacije windows vista word word 2007 word savjeti youtube savjeti youtube tipkovničke kratice