Il miglior software (gratuito) di sintesi vocale per Windows

Il miglior software (gratuito) di sintesi vocale per Windows / finestre

Cerchi il meglio gratuito Software di sintesi vocale di Windows? Il più ripetuto pagato la raccomandazione è Dragon Naturally Speaking (DNS). Ma alcuni potrebbero beffarsi di pagare soldi per il software. Fortunatamente, ci sono molti ottimi programmi gratuiti come Google Docs Voice Typing (GDVT) e Windows Speech Recognition (WSR).

Dragon NaturallySpeaking Basics 13 Dragon NaturallySpeaking Nozioni di base 13 Acquista ora ad Amazon $ 11,00

Potresti chiederti come si confrontano questi due prodotti rispetto al DNS e se il DNS soddisfi o meno le tue esigenze. Per questo articolo, ho identificato tre tipi di utenti: quelli che hanno bisogno della trascrizione vocale in testo scrivere romanzi, quelli che hanno bisogno trascrizione accademica, e quelli che scrivono documenti aziendali, come i promemoria. A tal fine, ho testato tre programmi di trascrizione vocale (DNS, GDVT e WSR).

Impostazione trascrizione vocale

Prima di entrare nel test, esaminiamo prima la configurazione hardware e software consigliata.

Requisiti hardware e software

La digitazione vocale di Google Docs richiede il browser Chrome e un microfono. E ha anche bisogno di una connessione internet persistente (che non è menzionata nei requisiti). In caso contrario, questo è probabilmente il metodo più semplice per iniziare con la trascrizione del discorso.

DNS richiede un processore realizzato nel 2001 o successivo, Windows 7 o successivo e circa 4 GB di spazio di archiviazione gratuito. Il suo requisito più severo è di 2 GB di RAM. Ecco un elenco completo dei requisiti hardware del DNS.

Riconoscimento vocale Windows Attiva riconoscimento vocale e controllo vocale mediante l'impostazione del riconoscimento vocale in Windows Attiva riconoscimento vocale e controllo vocale mediante l'impostazione del riconoscimento vocale in Windows Il riconoscimento vocale rimane più potente di Cortana. Spinge il parlato in testo e controllo vocale. Questo articolo ti mostrerà cosa può fare il riconoscimento vocale, come configurarlo, addestrarlo e usarlo. Leggi di più, noto anche come Speech Platform Runtime (download WSR), non costa nulla e richiede solo un sistema operativo Windows 7 o successivo.

Considerazioni sul microfono

Uso un microfono dinamico (miglior microfono per podcasting Il miglior microfono per podcast per il tuo denaro nel 2017 Il miglior microfono per podcast per il tuo denaro nel 2017 I microfoni sono importanti quando si effettua un podcast. I costi iniziali sono piuttosto bassi: software di registrazione, desktop o laptop e, naturalmente, un microfono, quindi qual è il miglior microfono per podcast? Ulteriori informazioni) e un processore Intel Core i7 relativamente veloce. Se si desidera un microfono di alta qualità, non è necessario. Anche così, i risultati miglioreranno con una migliore qualità del suono e un rumore di sottofondo ridotto.

Il microfono più economico che consiglio per registrazioni di alta qualità è Audio-Technica ATR-2100. Tuttavia, la differenza di accuratezza tra il microfono da $ 5 e il dispositivo da $ 200 è piuttosto ridotta.

Audio-Technica ATR2100-USB Microfono dinamico USB / XLR cardioide Audio-Technica ATR2100-USB Microfono dinamico USB / XLR cardioide Acquista ora ad Amazon $ 66,95

D'altra parte, i requisiti minimi per Microsoft Speech sono praticamente tutti i computer remoti moderni (la maggior parte dei computer realizzati negli ultimi dieci anni) e un microfono. Se possiedi un laptop o un tablet realizzato negli ultimi cinque anni, dovrebbe avere quello che ti serve per impostazione predefinita.

Configurazione dei programmi di trascrizione vocale

Ecco come utilizzare Google Voice Typing:

Ecco come iniziare con Windows Speech Recognition:

E, infine, ecco come iniziare con Dragon Naturally Speaking:

Metodologia di prova

Voglio trovare il meglio gratuito Discorso basato su Windows per l'applicazione di testo. Poiché diversi consumatori potrebbero aver bisogno di un prodotto diverso, ho ideato un semplice test. Ho letto tre diversi passaggi di testi senza copyright: uno di Charles Darwin Sulla tendenza delle specie a formare varietà. Uno di H.P. Lovecraft Chiamata di Cthulu. L'ultimo saluta dal discorso sullo stato dell'Unione del 2017 di Jerry Brown. La mia metodologia non è affatto perfetta, ma dà un'idea delle precisioni di ciascuna suite di riconoscimento vocale.

Esempio di scrittura di finzione (da H.P. Lovecraft's Chiamata di Cthulu)

“La cosa più misericordiosa del mondo, penso, è l'incapacità della mente umana di correlare tutti i suoi contenuti. Viviamo su una placida isola di ignoranza in mezzo a mari neri dell'infinito, e non è stato pensato che dovremmo viaggiare lontano. Le scienze, ognuna tesa nella sua stessa direzione, ci hanno finora danneggiato poco; ma un giorno il mettere insieme la conoscenza dissociata aprirà così terrificanti visioni della realtà e della nostra terrificante posizione in essa, che saremo impazziti dalla rivelazione o fuggiremo dalla luce mortale nella pace e nella sicurezza di una nuova era oscura.”

Esempio di scrittura aziendale (discorso sullo stato dell'Unione di Jerry Brown 2017)

“In un'occasione come questa è consuetudine definire un programma specifico per l'anno a venire. Sei volte prima da questo podio, l'ho fatto, e in alcuni dettagli. E, rileggendo quelle proposte esposte in precedenti discorsi sullo Stato, mi sono stupito di vedere quanto abbiamo realizzato insieme.”

Esempio di scrittura accademica (Charles Darwin's Sulla tendenza delle specie a formare varietà)

“Ora, quando una varietà di un tale animale si verifica, avendo aumentato il potere o la capacità in qualsiasi organo o senso, tale aumento è totalmente inutile, non viene mai chiamato in azione, e può persino esistere senza che l'animale se ne accorga. Nell'animale selvatico, al contrario, tutte le sue facoltà e il suo potere sono portati in piena azione per le necessità dell'esistenza, qualsiasi aumento diventa immediatamente disponibile, è rafforzato dall'esercizio e deve anche modificare leggermente il cibo, le abitudini e l'intero economia della gara.”

3 suite di trascrizione vocale testate

È sorprendente il riconoscimento vocale gratuito Le migliori app per la creazione di elenchi per comandi vocali Le migliori app per la creazione di elenchi per comandi vocali Molti strumenti di produttività gratuiti supportano la voce in testo per gli elenchi. Ti mostreremo le migliori app per la creazione di elenchi con riconoscimento vocale e comandi da provare. Leggi altri test eseguiti contro il software a pagamento. Ma alla fine della giornata, l'app più accurata è Dragon Naturally Speaking. Tuttavia, sia Google Voice Typing che Windows Speech Recognition non costano nulla e offrono una precisione superiore al 90%. Ma ognuno ha i suoi punti di forza e di debolezza e potresti preferire uno all'altro.

H.P. Lovecraft (test di scrittura di fiction)

Lovecraft amava scrivere in una prosa lunga, ininterrotta, intensamente genetica. Mentre tutte e tre le suite fanno un ottimo lavoro di trascrivere accuratamente il testo vocalizzato di Lovecraft, Il DNS esce prima dei suoi concorrenti. Include sia la maiuscola che la punteggiatura (che è completamente folle).

DNS: DNS ha eliminato solo una singola parola dal testo. Complessivamente, ha ottenuto 107 errori su 108 parole. Ha inchiodato anche diverse frasi lunghe e senza sosta.

WSR: Windows ha fatto un ottimo lavoro - ma non eccezionale - di trascrivere Lovecraft. Ha ottenuto circa 97 di circa 108 parole corrette. Anche se ciò non è sufficiente sia per GDVT che per DNS, è comunque valido per un programma di sintesi vocale gratuito che non richiede l'accesso online.

GDVT: Non sono sicuro di cosa sia successo perché Google ha inchiodato la trascrizione per gli altri estratti. GDVT ha ottenuto solo 103 punti su 108, lasciando cadere due parole e ne ha trascritte tre. E 'stato scritto anche una volta “punto e virgola” invece di inserire la punteggiatura corretta. Ha anche capitalizzato alcune parole, trasformandole in nomi propri (ma non li penalizzo poiché è la precisione e non la maiuscola che conta).

Sono abbastanza sicuro che se rileggo il documento una seconda volta, non avrebbe alcun errore.

Charles Darwin (test di scrittura scientifica o accademica)

Darwin scrive, come Lovecraft, frasi lunghe caricate con informazioni parentali. Tuttavia, il suo uso del linguaggio è molto chiaro e non usa quasi alcun gergo, che differisce dalla scrittura scientifica quasi incomprensibile oggi.

DNS: Il testo di Darwin esce quasi perfetto in Dragon Naturally Speaking. DNS ha digitato erroneamente una sola parola (“in”) e altrimenti completamente inchiodato il test con 87 parole proprio su 88.

WSR: Microsoft ha fatto un ottimo lavoro, facendo corrispondere 82 parole su 88. Ha fatto alcuni errori relativamente bizzarri, però, come l'ortografia “senso” come “centesimi”.

GDVT: Google ha fatto un ottimo lavoro con l'estratto di Darwin. GDVT ha emesso solo due parole, su 88. Nel complesso, per un'applicazione gratuita, non è possibile trovare un'alternativa più accurata.

Jerry Brown Stato dell'indirizzo dello stato 2016 (test di scrittura aziendale)

Il discorso di Brown non usa molte frasi complicate o vocaboli (a parte la parola “rostro”). Nel complesso, la maggior parte dei servizi di trascrizione è stata eseguita in modo sorprendente. Più o meno, se hai bisogno di un servizio che gestisca frasi semplici e un vocabolario limitato, ognuno di questi funziona alla grande.

DNS: DNS inchiodò Brown Stato dell'indirizzo dello stato. Mentre lasciava cadere un periodo, in caso contrario, riceveva ogni parola perfettamente. Nota, tuttavia, che i discorsi politici spesso non hanno quel tipo di linguaggio complesso che potresti vedere nella finzione o nel mondo accademico. Un memo o un discorso è diretto e al punto. Questo è qualcosa che un client di riconoscimento vocale non dovrebbe avere problemi nella gestione.

WSR: Windows Speech Recognition ha fatto un ottimo lavoro - sebbene non bello come DNS o Google - nel trascrivere il discorso di Brown. Ha segnato 55 su 58 parole. Ha persino riconosciuto la parola “rostro,” che non sapevo nemmeno fosse una parola, né sapevo come pronunciarlo. Apparentemente, o ho capito bene o la tecnologia di riconoscimento vocale può anche prendere errori di pronuncia.

GDVT: Il software di trascrizione di Google ha completamente inchiodato la trascrizione, con una precisione del 100%. È persino riuscito a capitalizzare correttamente “Stato dello stato”, senza bisogno di input da parte dell'utente. Ha usato stranamente il numero, piuttosto che l'ortografia, per la parola “sei”. Che ha provocato un errore stilistico.

Sono servizi di trascrizione gratuiti che vale la pena utilizzare?

C'è una differenza tra Dragon Naturally Speaking, Google Voice Typing e Microsoft Speech Recognition di Windows. Dragon è più preciso dei suoi concorrenti. Tuttavia, il miglior programma gratuito in termini di precisione è - con un margine ristretto - Google Voice Typing. Sebbene sia i servizi di trascrizione di Microsoft sia quelli di Google si confrontino in modo meno che favorevole con il DNS, non costano $ 30.

Contrariamente ai due servizi gratuiti l'uno contro l'altro, Google offre una migliore precisione di riconoscimento vocale, punteggiatura e astensione, richiede una connessione Internet. Google cattura anche molto che tu non intendi, come la punteggiatura e le maiuscole.

Tuttavia, se si desidera un programma di trascrizione gratuito che non sia necessario utilizzare una connessione Internet, Windows Speech Recognition è compatibile con Windows Può fare QUESTO? 15 caratteristiche sorprendenti che non avevi idea di Windows può fare questo? 15 Funzionalità sorprendenti che non avevi la minima idea su Windows può fare molto più di quanto tu possa pensare. Anche se sei un utente veterano di Windows, scommetto che scoprirai una funzionalità nella nostra lista che non hai mai saputo esistesse. Leggi di più . Non è affatto male e offre il 90% di ciò che Dragon Naturally Speaking offre. Fai un tentativo se non l'hai già fatto.

E per farlo sul tuo telefono Android, controlla le migliori app Android per il parlato a testo 7 Le migliori app di dettatura Android per un facile discorso vocale 7 Le migliori app di dettatura Android per un discorso facile sul testo alla ricerca del miglior speech- app di testo per Android? Queste app di dettatura Android ti consentono di prendere appunti e altro ancora. Leggi di più .

Qual è il tuo servizio di trascrizione preferito? Per favore fateci sapere nei commenti!

Scopri di più su: Riconoscimento vocale, Discorso al testo.