Tesis:

Segmentación y etiquetado fonéticos automáticos: Un enfoque basado en modelos ocultos de Markov y refinamiento posterior de las fronteras fonéticas.


  • Autor: TORRE TOLEDANO, Doroteo

  • Título: Segmentación y etiquetado fonéticos automáticos: Un enfoque basado en modelos ocultos de Markov y refinamiento posterior de las fronteras fonéticas.

  • Fecha: 2001

  • Materia: Sin materia definida

  • Escuela: E.T.S. DE INGENIEROS DE TELECOMUNICACION

  • Departamentos: SEÑALES, SISTEMAS Y RADIOCOMUNICACIONES

  • Acceso electrónico:

  • Director/a 1º: HERNÁNDEZ GOMEZ, Luis A.

  • Resumen: La tecnología del habla se basa en aprendizaje automatico a partir de datos: por lo que es de especial interés el etiquetado fonético de las bases de datos habladas. En la tesis se combinan los modelos ocultos de Markov así como técnicas especificas para realizar un sementado y etiquetado de una base de datos de voz. Para ello se diseñan técnicas especificas como reglas de lógica borrosa, redes neuronales y modelos estadísticos sobre unas características especificas. El uso de estas técnicas mejora bastante la segmentación inicial propuesta por los modelos de Markov lo que sugiere que las actuales características empleadas en el reconocimiento no sacan provecho de parte de la información presente en las fronteras fonéticas. El conjunto de técnicas propuestas se comparan con los de segmentación manual por dos etiquetadores expertos mediante la distribución de error completa, proponiéndose una nueva figura de mérito del promedio de los porcentajes de fronteras correctas para un muestreo uniforme entre 0 y 100 ms. Los resultados que se obtienen es superior en todos los casos al 92 por ciento claramente superior a todos los resultados propuestos hasta el momento en la bibliografía.