Tesis Doctorales UPM: Consulta online

Autor: GOLDEROS SANCHEZ, Antonio

Título: Reconocimiento de palabras aisladas con independencia del locutor, aplicación al reconocimiento de dígitos en español

Fecha: 1984

Materia: Sin materia definida

Escuela: E.T.S. DE INGENIEROS DE TELECOMUNICACION

Departamento: SIN DEPARTAMENTO DEFINIDO

Acceso electrónico:

Director/a(s):

Director/a: MUÑOZ MERINO, Elías

Resumen: El propósito fundamental de este trabajo es la concepción y puesta a punto de un sistema de reconocimiento de palabras aisladas, de vocabulario limitado, en castellano, e independiente del locutor. En el reconocimiento de palabras aisladas se han empleado históricamente dos modelos: reconocimiento global de tipo acústico y reconocimiento fonético. El trabajo se ha centrado en el vocabulario constituido por los dígitos del español, debido a que ofrece un gran número de posibilidades de codificación, utilizando pausas intermedias en la articulación de los mismos. Nuestro interés ha residido en demostrar la posibilidad de diseñar un sistema de reconocimiento cuasi-fonético, a través de una adecuada identificación de las diferentes clases de sonidos que componen el vocabulario, que puede competir, e incluso mejorar, los resultados obtenidos con los sistemas adaptativos, que se conciben mediante algoritmos ciegos a partir del modelo de reconocimiento global de tipo acústico. El modelo de reconocimiento cuasi-fonético utiliza, además de la caracterización de las palabras mediante un conjunto de parámetros suficientemente robustos, el conocimiento fonético de la estructura lexical de las palabras del vocabulario. En lo referente al modelo de reconocimiento global de tipo acústico se ha utilizado el modelo canónico de Itakura con diversas variantes. Para la creación de referencias válidas para que el sistema sea independiente del locutor se han usado técnicas de agrupamiento de patrones (clustering), típicas de la técnica de reconocimiento de formas. Ambos modelos han sido realizados sobre un ordenador PDP11/60 y evaluados mediante pruebas llevadas a cabo con una población de diez locutores, habiéndose confirmado los supuestos de partida. Creemos que es el primer intento de realización de un sistema de reconocimiento cuasi-fonético de palabras aisladas en español y con independencia del locutor. Los resultados obtenidos son superiores al 98 por 100 de éxitos. La principal ventaja del sistema es que se consigue esta alta tasa de reconocimiento sin necesidad de efectuar entrenamiento previo cada vez que un locutor diferente va a usar el sistema