AI je možda uzrokovao krizu u kreativnim umjetnostima, velike probleme s dezinformacijama i dodatne zahtjeve za našim posrnulim energetskim sustavima, ali nedvojbeno postoji jedno područje gdje je život učinio mnogo lakšim: mogućnost interpretacije onoga što je rečeno u audio isječcima.
Snimke intervjua, sastanaka, predavanja i glasovnih bilješki sada se mogu pretvoriti u digitalni tekst u sekundama, umjesto satima. AI također pokreće značajke pristupačnosti poput Live Captions, koje prikazuju titlove u stvarnom vremenu na ekranu, čak i ako nisu bili uključeni u izvorni video isječak.
Sav taj proces zahtijeva vrijeme i resurse, pa su besplatne opcije rijetke. Međutim, ovdje smo identificirali pet usluga koje su besplatne, ali imaju ograničenja, tako da možete procijeniti koliko dobro odgovaraju vašim potrebama.
Google Recorder
Aplikacija Google Recorder za Android potpuno je besplatna za korištenje. Nedostaci su što radi samo s uživo audiozapisima, a ne sa snimljenim isječcima, i što trebate imati Google Pixel uređaj za korištenje (postoji web sučelje kojem možete pristupiti, ali samo za reprodukciju datoteka, a ne za njihovo stvaranje).
Ako imate Pixel telefon i trebate raditi samo s uživo audiozapisima, ovo je idealno rješenje. Možete čak spojiti vanjski mikrofon na uređaj ako je potrebno, a tekst transkripcije pojavljuje se na ekranu gotovo istovremeno s audiozapisom koji se snima.
Pretraživanje transkripata je jednostavno—možete čak tražiti zvukove poput “smijeha” ili “glazbe”—i audiozapis se može urediti jednostavnim podešavanjem teksta. Također dobivate AI-generirani sažetak transkripta. Ako imate Samsung telefon, Voice Recorder i Galaxy AI nude slične značajke, a Apple dodaje usporedive funkcije u iOS 18.
Whisper
OpenAI omogućava svakome da koristi njegovu Whisper AI tehnologiju za pretvaranje zvuka u tekst besplatno. Ipak, potrebno je ili koristiti web aplikaciju na Hugging Faceu (prikladna, ali često zauzeta i spora) ili instalirati lokalnu verziju na računalo (brza i privatna opcija, ali vaš uređaj mora postići pristojan nivo performansi).
Web sučelje je vrlo jednostavno za korištenje: možete ili učitati datoteku s diska ili govoriti izravno u mikrofon računala. Nakon nekoliko minuta obrade, tekst se pojavljuje na drugoj strani prozora. Možete čak koristiti AI za prevođenje zvuka na različite jezike.
Ako ne želite čekati u redu, možete instalirati Whisper lokalno ako je vaše računalo dovoljno snažno. Proces nije najjednostavniji, ali ako ste spremni na izazov, ovdje postoje detaljne upute. Nakon toga imate lokalnu AI uslugu transkripcije koju možete koristiti koliko god želite, bez naknade.
Otter
Otter je usluga transkripcije profesionalne razine za tvrtke i pojedince. Nudi uglađeno iskustvo i mnoštvo značajki—može transkribirati audio u tekst te stvarati sažetke, akcijske stavke i još mnogo toga.
Na webu i mobilnim aplikacijama, sve je intuitivno raspoređeno i lako za navigaciju, a korisne dodatke možete pronaći svuda, od integracije s brojnim aplikacijama trećih strana do načina na koji se različiti govornici mogu identificirati u audiozapisima.
Kao što možete očekivati, ova funkcionalnost dolazi po odgovarajućoj cijeni, a plaćeni planovi počinju od 16,99 USD mjesečno. Ako ostanete na besplatnoj razini, ograničeni ste na 300 minuta transkripcije mjesečno, 30 minuta po razgovoru i tri audio ili datotečne učitavanja dok ne nadogradite.
Happy Scribe
Happy Scribe sličan je Otteru po tome što može zadovoljiti potrebe velikih tvrtki, ali i pojedinaca. Također ima osnovni besplatni plan: ograničeni ste na 10 minuta audiozapisa u svojim datotekama, a postoje i razne druge restrikcije (poput nemogućnosti izvoza datoteka). Ako smatrate da je usluga korisna, cijene počinju od 17 USD mjesečno.
Jedna od najboljih karakteristika Happy Scribea je elegantno i pojednostavljeno sučelje—većina izgleda kao blago prilagođena stranica Google Docs, što znači da je sve lako za navigaciju. Vaše transkripcije dolaze s oznakama govornika i vremenskim oznakama, a alati za pregled također su jednostavni za korištenje.
Datoteke koje generirate mogu se označiti i sortirati u mape prema potrebi, a korisne značajke su raspoređene svuda: Na primjer, ugrađeni alat za prevođenje i prilagođeni rječnik u kojem možete dodavati riječi koje AI možda ne očekuje. Još jedna zanimljiva značajka je da možete platiti i za ljudsku transkripciju, ako želite.
MeetGeek
Posjetite MeetGeek stranicu, koja obećava da će se baviti svime, od intervjua i sastanaka do korisničkih poziva i online nastave. Ova usluga transkripcije može obraditi gotovo sve što joj želite poslati. Mnoge njezine značajke usmjerene su na sastanke (otuda i ime), ali je možete koristiti s bilo kojim audiozapisom koji želite.
Sučelje modernog izgleda omogućuje brzi pristup različitim područjima MeetGeeka, uključujući vaš kalendar i prethodne snimke. Dobro funkcionira ako je u vašim snimkama više ljudi—na primjer, svi mogu primiti kopiju transkripta putem e-pošte uz nekoliko klikova.
Nije teško započeti s MeetGeekom besplatno. Plaćeni planovi počinju od 19 USD mjesečno, ali čak i bez plaćanja, možete obraditi pet sati transkripcije mjesečno, a također dobivate tri mjeseca pohrane transkripata i jedan mjesec pohrane audiozapisa. Besplatni plan uključuje značajke poput učitavanja i AI sažetaka sastanaka.
Izvor: Gizmodo