Sistema para la conversión de un texto ortográfico a hablado en tiempo real

<< Volver atrás

Tesis:

Sistema para la conversión de un texto ortográfico a hablado en tiempo real

Autor: OLABE BASOGAIN, Juan Carlos

Título: Sistema para la conversión de un texto ortográfico a hablado en tiempo real

Fecha: 1984

Materia: Sin materia definida

Escuela: E.T.S. DE INGENIEROS DE TELECOMUNICACION

Departamentos: SIN DEPARTAMENTO DEFINIDO

Acceso electrónico:

Director/a 1º: MUÑOZ MERINO, Elías

Resumen: Esta tesis es una continuación natural de la investigación sobre conversión texto a voz que se realiza en el departamento de Electrónica. Los objetivos que se han perseguido en este trabajo pueden resumirse en dos grupos principales. Uno es, básicamente, el análisis fonético-acústico del habla en español. En un sistema de conversión texto a voz por regla, el grado de calidad y de naturalidad de la síntesis depende tanto de la adopción de un buen modelo de síntesis como de un control conveniente de sus parámetros, de modo que éstos contemplen en lo posible la variación de las características y propiedades del habla natural. Para ello se necesita un detallado análisis de las principales propiedades fonético-acústicas del habla natural, y la derivación de él de las reglas o algoritmos que controlen los correspondientes parámetros del modelo de síntesis. Con este propósito se ha realizado un exhaustivo análisis de tres de las principales propiedades acústicas del habla: la energía, la distribución de los tres primeros formantes y la frecuencia fundamental. Como resultado, se han obtenido las reglas y algoritmos antes mencionados. El segundo de los objetivos se enfocó en la realización de un sistema de conversión texto a voz autónomo (no simulado en ordenador) capaz de procesar texto ininterrumpidamente (hasta 250 palabras por minuto) en tiempo real. Para lograr este objetivo se precisa, en primer lugar, un hardware especifico que disponga de un procesador digital especialmente programado para este propósito, que realice el proceso de síntesis en tiempo real, y, en segundo lugar, la adopción de un sofware especializado que permita el proceso ininterrumpido de texto y la producción ininterrumpida de voz. Para estas actividades se ha colaborado con Telesensory Speech Systems (Palo Alto, California), que desarrolló un sistema equivalente para la lengua inglesa. En dicho sistema, manteniendo las rutinas de control de programa y flujo de datos, que son independientes del idioma, se han introducido los programas propios del español para la conversión texto-voz. El resultado es un sistema que realiza la conversión texto en español en tiempo real, y cuyo grado de calidad e inteligibilidad se ha evaluado tras un exhaustivo conjunto de pruebas de audición