Tesis:
Propuesta de estructuración del conocimiento lingüístico para interpretacción de textos: Aplicación al diseño de bases de datos
- Autor: MARTINEZ FERNANDEZ, Paloma
- Título: Propuesta de estructuración del conocimiento lingüístico para interpretacción de textos: Aplicación al diseño de bases de datos
- Fecha: 1998
- Materia: Sin materia definida
- Escuela: FACULTAD DE INFORMATICA
- Departamentos: LENGUAJES Y SISTEMAS INFORMATICOS E INGENIERIA DE SOFTWARE
- Acceso electrónico: http://oa.upm.es/9946/
- Director/a 1º: GARCIA SERRANO, Ana María
- Director/a 2º: MIGUEL CASTAÑO, Adoración de
- Resumen: La Ingeniería Lingüística es una nueva disciplina que, mediante la combinación de la tecnología PLN y de desarrollo software, tiene como objetivo la definición de las arquitecturas para sistemas PLN lo suficientemente flexibles y robustas para responder de manera satisfactoria a la creciente demanda de resultados prácticos en aplicaciones como traducción automática para servicios on-line, recuperación de información en W W W, etc. Sin embargo, el desarrollo de sistemas genéricos para el tratamiento autonómico del lenguaje esta condicionado por la imposibilidad de disponer de todo el conocimiento requerido. Por ello, en este trabajo se propone una arquitectura modular, portable y flexible que permite la incorporación de los distintos tipos de conocimiento lingüístico y extralingüístico disponible, tanto por los diseñadores y programadores como por los expertos lingüístas. Se ha elaborado una propuesta general de estructuración del conocimiento para la interpretación de textos, con un mecanismo de control fexible de los distintos procesos lingüísticos y empleando distintas técnicas: Desde el punto de vista lingüístico, se ha definido un conjunto de estrategias que combinan las distintas fuentes de conocimiento (morfología,sintaxis y semántica) para guiar el proceso de análisis de forma no determinista. Se realiza así una interpretación parcial dirigida por la información característica del dominio de aplicación presente en el propio texto; por ejemplo, patrones o expresiones típicas, verbos con preferencias semánticas y otras, aspectos que se incorporan en las denominadas Perspectivas Lingüísticas. La arquitectura propuesta se ha utilizado en el modelo conceptual de bases de datos a partir de textos para probar su potencialidad. Dos aspectos condicionan el interés de la aplicación en este dominio. Por un lado, hasta ahora no existen aproximaciones lingüísticas al modelado conceptual a partir de especificaciones textuales en castellano. Por otro, las existentes actualmente para idiomas como el inglés y francés tan solo proporcionan algunas heurísticas que ayudan a identificar candidatos a ciertos constructores de un modelo y que no son portables al castellano. Se ha diseñado un prototipo en el entorno KSM con el fin de mostrar la viabilidad de la estructuración propuesta y se ha desarrollado una aplicación en Prolog en la que se ha incluido parte del conocimiento en cada uno de los módulos. En este prototipo, la estructuración del conocimiento involucrado favorece el análisis, diseño y construcción de sistemas PLN, y en concreto, se ha utilizado el conocimiento lingüístico en la aplicación para la construcción de una primera propuesta de esquemas conceptuales de BD a partir de oraciones en LN, aportando una solución razonablemente correcta en el área de diseño de BD