Testo-to-speech (TTS) trasforma le parole scritte in file audio per l'output, con input dalla digitazione su una tastiera di computer o dalla lettura da documenti. File wave generati sinteticamente, digitalizzati e utilizzati per registrazioni vocali. Possono essere digitati in o da documenti.
TTS è una forma di sintesi vocale, che converte il testo scritto in un output vocale udibile, come frasi parlate. TTS può essere utilizzato in molte applicazioni, tra cui materiali di lettura che utilizzano un schermo lettore per persone con disabilità visive e difficoltà di lettura e che fornisce un output udibile per testi difficili da comprendere, ad esempio in lingue straniere.
La tecnologia ha fatto molta strada dai primi anni '1950, quando furono inventati i sistemi text-to-speech. Gli odierni sistemi text-to-speech (TTS) utilizzano algoritmi complessi per trasformare il testo in parlato naturale; considerano gli aspetti contestuali durante la lettura e voci diverse per i personaggi o le applicazioni.
I sistemi TTS potrebbero essere utilizzati in informazioni pubbliche, materiali didattici, per fornire feedback udibili all'input di testo o per leggere passaggi difficili. I TTS possono anche creare versioni audio di libri digitali, assistenti virtuali vocali e altri prodotti di intelligenza artificiale.
Offerte di testo-voce audio-to-text per ipovedenti e persone con disabilità di lettura, rendendo la lettura dei testi molto più semplice. TTS sarà utile anche per alcune persone che preferirebbero ascoltare i loro documenti piuttosto che leggerli o per coloro che vogliono accedere a testi scritti in lingue che devono ancora migliorare nella conversazione.