Tesis Doctorales UPM: Consulta online

Autor: MORAL MARTOS, Cristian

Título: Modeling the visualization and exploration of document collections with user and purpose-based adaptation

Fecha: 2016

Materia: Sin materia definida

Escuela: E.T.S DE INGENIEROS INFORMÁTICOS

Departamento: LENGUAJES Y SISTEMAS INFORMATICOS E INGENIERIA DE SOFTWARE

Acceso electrónico: http://oa.upm.es/44561/

Director/a(s):

Director/a: ANTONIO JIMÉNEZ, Angélica de
Director/a: FERRÉ GRAU, Xavier

Resumen: Seeking information is an essential activity in the field of research. However, due to the huge amount of information that already exists, and that is increased every day, it is difficult to find the specific information that a researcher actually needs. Many software tools have appeared in the last years to facilitate information-seeking activities, but most of them are based on the classic “best-match” approach. However, a “one-size-fits-all” solution is limited in order to effectively fulfill the user’s information needs, especially in the research domain, where huge document collections are managed, and very specific information is usually required to achieve the user’s purpose. Instead, information seeking and exploration systems should effectively adapt to all the aspects that may influence the information-seeking process, like the user, the type of data being used, the context of the seeking activity, or the purpose the user aims to achieve. An essential precondition for adaptation is the existence of a clear model of this process that considers all the concepts that intervene, and how they interrelate. However, such a model is still missing. To fill this gap, in this research we have carried out a complete inductive qualitative study allowing us to comprehensively understand how the process is performed by researchers and which are the relevant concepts and relationships that intervene in it. The research has been contextualized in the computer science field to ensure that the possible variability in the information-seeking practices in different domains does not bias the obtained information. Based on the results of this qualitative study, we propose representing the concepts and relationships that emerged in the analysis of the process through a set of holistic and extensive conceptual models. In order to facilitate their understanding, a pictorial representation has been created using a standard, easy-to-understand and widely used representation language (UML). First of all, we propose a conceptual model of the information-seeking process, where high-level concepts, like document, task, or purpose, are not only present, but are also modeled in detail. On the other hand, due to the huge amount of documents that are usually involved in seeking activities, information visualization has become an essential aspect of the process, as it potentially can transmit information (like relationships) in a very intuitive and effective way. For this reason, the concepts and relationships specifically related to the information visualization activities have also been described through a conceptual model. Finally, the researcher’s characteristics and preferences that are relevant for information seeking and exploration are also described in a conceptual model. In all cases, the models have been designed to reflect the complexity of the process, and are also flexible enough to be easily modified or extended. Once the processes and actors have been fully modeled, we propose a fuzzy logic approach to allow a dynamic and adaptive calculation of the relevance of certain information elements (like authors or documents) depending on the user preferences and on the interrelationships that exist among them (as specified in the conceptual model). In order to point out the usefulness of the proposed solution, we present some of its practical applications. First of all, the models provide a complete framework that can be used to comprehensively analyze, describe and compare in detail existing information systems. Additionally, models can also be used to guide the design of new information systems and some prototypes developed with the model guidance are presented to prove the feasibility of such application of our proposal. RESUMEN La búsqueda de información es una de las principales actividades en el ámbito de la investigación. No obstante, debido a la gran cantidad de información que ya existe, junto con la que se produce cada día, resulta especialmente difícil hallar la información que realmente necesita el investigador. En los últimos años han aparecido multitud de herramientas informáticas que buscan facilitar la búsqueda de información, pero la mayoría de ellas usan el enfoque clásico basado en hallar “la mejor coincidencia”. Sin embargo, este tipo de soluciones “de talla única” tienen una efectividad limitada a la hora de cubrir las necesidades de información del usuario, especialmente en al ámbito de la investigación, dónde se manejan grandes colecciones de documentos y se requiere de datos muy específicos para alcanzar el objetivo de la búsqueda. Sin embargo, los sistemas de información deberían adaptarse de manera efectiva a todos aquellos aspectos que puedan influir en el proceso, como el usuario, el tipo de dato usado, el contexto en el que se realiza la actividad o el propósito del usuario. Para que esto ocurra, es condición esencial que exista un modelo completo del proceso que contemple todos los conceptos y relaciones que intervienen en él. Sin embargo, dicho modelo no existe. En este trabajo hemos llevado a cabo un completo estudio cualitativo e inductivo que nos ha permitido comprender en detalle cómo buscan información los investigadores, y cuáles son los principales conceptos y relaciones que interviniente en el proceso de búsqueda. El estudio se llevó a cabo únicamente con investigadores en informática para asegurar que la variabilidad entre los distintos dominios no afectase a los resultados. En base a dichos resultados, hemos representado todos los conceptos y relaciones que emergieron del análisis del estudio cualitativo mediante una serie de completos y holísticos modelos conceptuales. Para facilitar su comprensión, se ha creado una representación pictórica mediante el uso de un lenguaje de representación estándar, fácil de entender y ampliamente usado (UML). En primer lugar, proponemos un modelo conceptual del proceso de búsqueda de información, en el cual se representan y detallan los conceptos de más alto nivel (documentos, tareas, objetivos. . . ). Por otro lado, la visualización de la información, es un concepto de alto nivel que es imprescindible modelar ya que permite transmitir más información (por ejemplo las relaciones) de forma más intuitiva y efectiva. Por este motivo, también proponemos un modelo conceptual de la visualización de información. Por último, también modelamos las principales características y preferencias del usuario que son relevantes en el proceso de búsqueda. En todos los casos, los modelos han sido diseñados para reflejar la complejidad del proceso, pero también para ser flexibles y permitir que puedan añadirse nuevos conceptos, o modificar o eliminar aquellos ya existentes. Tras esto, proponemos un sistema de lógica difusa para calcular dinámica y adaptativamente la relevancia de algunos conceptos (como un autor o un documento) en base a las preferencias del usuario y las relaciones mutuas que existen entre dichos elementos (tal y como se especifica en el modelo conceptual del proceso de búsqueda). Con el objetivo de mostrar la utilidad de la solución propuesta, se presentan algunas de sus aplicaciones prácticas, como servir como marco de referencia para analizar, describir y comparar sistemas de información ya existentes, o para ser usados para guiar el diseño de nuevos sistemas de información. Como prueba de dicha utilidad, se explican dos prototipos que se han desarrollado usando los modelos como guía.