Tesis:
Generación de patrones para localización de información, basado en mecanismos de contextualización.
- Autor: PROCEL MORENO, Mauricio Jorge
- Título: Generación de patrones para localización de información, basado en mecanismos de contextualización.
- Fecha: 2004
- Materia: Sin materia definida
- Escuela: FACULTAD DE INFORMATICA
- Departamentos: INTELIGENCIA ARTIFICIAL
- Acceso electrónico:
- Director/a 1º: CARDEÑOSA LERA, Jesús
- Resumen: Este trabajo trata de los métodos y técnicas empleados en la búsqueda y localización de documentos a partir de una pregunta del usuario, es decir puede enmarcarse dentro de disciplina general denominada Recuperación de Información. Dentro de ésta, nos vertemos más en el conjunto de técnicas que en la actualidad se usan más como soporte a buscadores en la Web aunque no son exclusivos de ésta, al ser técnicas que se utilizan también en búsquedas en bases de datos documentales y otros usos. Dentro de este contexto, el trabajo se encuentra en la línea basada en el análisis e interpretación de las frecuencias de los términos presentes en un documento o colección de documentos y de que en base a dicho análisis se puede establecer cuáles son los términos relevantes de los mismos. En consecuencia se puede tener un criterio no solo frecuentista sino semántico para que dichos documentos puedan ser encontrados por medio de preguntas de usuarios basados en palabras clave. Concretamente se propone un conjunto de mejoras a los métodos clásicos mediante mecanismos que permiten la contextualización de los términos estimados como "relevantes". En consecuencia el sistema podría llegar a reformular su pregunta acorde a los resultados de la primera búsqueda y llegar así a una precisión mucho mayor en amplitud (menos documentos encontrados) y en profundidad (documentos más ajustados a la pregunta efectuada por el usuario. Dicho mecanismo se basa en el establecimiento de algunos tipos de relaciones entre los términos de una pregunta y a la reformulación de dicha pregunta contra los sistemas estándares basados en los modelos de Espacio Vectorial de los espacios de información. El trabajo se ha basado en algunos estudios previos que iban en esa misma dirección (contextualización de los términos tanto en las preguntas como en los documentos), ya fuera considerando la totalidad del vocabulario existente en los documentos (Yonggang Qiu) o bien mediante una selección previa de los términos según aparecen en un documento mejor "calificado" por medio del llamado "análisis local del contexto" (Jinxi Liu). Tanto estos dos modelos como el propuesto en este trabajo de tesis se corresponden con la idea de "retroalimentación de la seudo relevancia", sin que para ello se tenga que recurrir al usuario que formuló la pregunta. El modelo que se presenta llega a resultados mejores que los anteriores como demostramos experimentalmente mediante la inclusión de un "Marco relativizador que llega a determinar con mayor acierto el valor que corresponde a los términos que se emplean por el sistema en la reformulación de una pregunta del usuario.