Logotipo de la Universidad Politécnica de Madrid

Segmentación y etiquetado fonéticos automáticos: Un enfoque basado en modelos ocultos de Markov y refinamiento posterior de las fronteras fonéticas.

Autor: TORRE TOLEDANO, Doroteo

Título: Segmentación y etiquetado fonéticos automáticos: Un enfoque basado en modelos ocultos de Markov y refinamiento posterior de las fronteras fonéticas.

Fecha: 2001

Materia: Sin materia definida

Escuela: E.T.S. DE INGENIEROS DE TELECOMUNICACION

Departamento: SEÑALES, SISTEMAS Y RADIOCOMUNICACIONES

Acceso electrónico:

Director/a(s):

  • Director/a: HERNÁNDEZ GOMEZ, Luis A.

Resumen: La tecnología del habla se basa en aprendizaje automatico a partir de datos: por lo que es de especial interés el etiquetado fonético de las bases de datos habladas. En la tesis se combinan los modelos ocultos de Markov así como técnicas especificas para realizar un sementado y etiquetado de una base de datos de voz. Para ello se diseñan técnicas especificas como reglas de lógica borrosa, redes neuronales y modelos estadísticos sobre unas características especificas. El uso de estas técnicas mejora bastante la segmentación inicial propuesta por los modelos de Markov lo que sugiere que las actuales características empleadas en el reconocimiento no sacan provecho de parte de la información presente en las fronteras fonéticas. El conjunto de técnicas propuestas se comparan con los de segmentación manual por dos etiquetadores expertos mediante la distribución de error completa, proponiéndose una nueva figura de mérito del promedio de los porcentajes de fronteras correctas para un muestreo uniforme entre 0 y 100 ms. Los resultados que se obtienen es superior en todos los casos al 92 por ciento claramente superior a todos los resultados propuestos hasta el momento en la bibliografía.