Tesis:
Marco de Descubrimiento de Conocimiento para Datos Estructuralmente Complejos con Énfasis en el Análisis de Eventos en Series Temporales.
- Autor: LARA TORRALBO, Juan Alfonso
- Título: Marco de Descubrimiento de Conocimiento para Datos Estructuralmente Complejos con Énfasis en el Análisis de Eventos en Series Temporales.
- Fecha: 2010
- Materia: Sin materia definida
- Escuela: FACULTAD DE INFORMATICA
- Departamentos: LENGUAJES Y SISTEMAS INFORMATICOS E INGENIERIA DE SOFTWARE
- Acceso electrónico: http://oa.upm.es/5729/
- Director/a 1º: PEREZ PEREZ, Aurora
- Director/a 2º: CARAÇA-VALENTE HERNANDEZ, Juan Pedro
- Resumen: El proceso de Descubrimiento de Conocimiento en Bases de Datos (mas conocido por su nombre en ingles, Knowledge Discovery in Databases) es el proceso de extracción de conocimiento util, implícito y previamente desconocido a partir de grandes volúmenes de datos. Dicho proceso se compone de diferentes etapas entre las que cabe destacar la etapa de Data Mining, en la que se analizan los datos y se extrae conocimiento util de ellos haciendo uso de un conjunto de algoritmos. Data Mining ofrece una gran variedad de técnicas para resolver diferentes tipos de problemas. En los últimos anos, dichas técnicas han sido empleadas en multitud de dominios en los que el análisis se ha centrado en individuos cuya informacion se representa habitualmente mediante una tabla de atributos univaluados de tipo entero, real o enumerado. Sin embargo, existen muchos dominios en los que cada individuo no se representa mediante una simple tabla de atributos sino mediante un conjunto de datos con estructura más compleja, incluyendo tanto atributos univaluados como series temporales. El análisis de esos datos requiere nuevos enfoques. En esta Tesis se ha propuesto un marco de trabajo para el descubrimiento de conocimiento útil a partir de datos estructuralmente complejos, que pueden contener tanto series temporales como datos univaluados. Dicho marco consta de herramientas para la modelización conceptual, comparación y obtención de modelos de referencia a partir de esos datos. En particular, se han propuesto algoritmos para el análisis de series temporales en las que la informacion relevante de las mismas se concentra solo en aquellas regiones que se corresponden con eventos de interés para los expertos de cada dominio. El marco de extracción de conocimiento propuesto ha sido probado sobre datos estructuralmente complejos procedentes de dos áreas medicas: la Estabilometria, una disciplina que estudia el equilibrio de los seres humanos, y la Neurología, un área medica que estudia las enfermedades del sistema nervioso y los músculos. La obtencion de resultados satisfactorios en dominios tan complejos y diferentes entre si confirma la generalidad del marco propuesto.