Analisis y síntesis de expresión emocional en cuentos leídos en voz alta
2005; Technical University of Valencia; Volume: 35; Issue: 35 Linguagem: Espanhol
ISSN
1135-5948
AutoresVirginia Francisco Gilmartín, Pablo Gervás Gómez-Navarro, Raquel Hervás,
Tópico(s)Speech Recognition and Synthesis
ResumoespanolUn reto importante para los conversores texto-voz es conseguir que la voz sintetica suene lo mas parecido posible a la voz humana. La voz generada por estos sistemas actualmente suena artificial y esta es la principal causa de rechazo por parte del publico general. Para conseguir que el sintetizador aparente ?vida? interesa generar voz con distintos estados animicos. El desafio fundamental de la generacion de voz emocional es tratar de generar una emocion suficientemente clara para que no haya confusion en el oyente. Existen muchas teorias para definir una escala emocional. La eleccion de una escala concreta determina las emociones que se pretenden distinguir. Otro desafio importante es analizar las caracteristicas acusticas de los distintos estados emocionales para intentar posteriormente regenerar las mismas a traves del sintetizador (Montero, 2003). Este trabajo se plantea explorar la viabilidad de modelar las cadencias propias de la narracion de historias a traves de los parametros de control de un conversor texto-voz. Para lograr estos parametros se realizara un analisis de material de audio emocional y una vez modeladas cada una de las emociones se realizara una evaluacion del material obtenido EnglishAn important challenge for text-to-speech is to get a synthesized voice that sounds as like as possible to the human voice. The voice synthesized by these systems sounds artificial and this is the most principal cause of rejection by the public at the moment. In order to obtain a lively synthesized voice it is necessary to generate a voice with emotions. The main goal of the generation of emotional voice is try to generate an emotion so clear that there will be no confusion in the listener. There are a lot of theories in order to define an emotional scale. The choice of a specific scale determines the emotions that we try to distinguish. Another important challenge is analyse the acoustic characteristics at different emotional states in order to try to regenerate the same characteristics by the synthesizer (Montero, 2003). This project raises to explorer the possibility of model the lack of the tales through control parameters in the synthesizer. In order to obtain these parameters we have to carry out an analysis of emotional audio and then, once we have obtained a model, we have carried out a test
Referência(s)