Tesis Doctorales UPM: Consulta online

Autor: MENASALVAS RUIZ, Ernestina

Título: Integración del proceso de inferencia de conocimiento con los sistemas de bases de datos relacionados: Formalización matemática de la fase de análisis

Fecha: 1998

Materia: Sin materia definida

Escuela: FACULTAD DE INFORMATICA

Departamento: SIN DEPARTAMENTO DEFINIDO

Acceso electrónico: http://oa.upm.es/955/

Director/a(s):

Director/a: FERNANDEZ BAIZAN, María Covadonga
Director/a: WASILEWSKA, Anita

Resumen: La rápida extensión de la computación en la ciencia, gobierno y negocios de todo tipo ha hecho que sea esencial el descubrimiento efectivo y eficaz del conocimiento oculto en las grandes cantidades de datos que han sido recogidas en los últimos años. El descubrimiento en las bases de datos (KDD) o Data Mining ha surgido como una solución para el problema de ánalisis de datos al que se esta enfrentando las organizaciones. En este contexto, Data Mining no es sino un nuevo nombre para el viejo proceso de búsqueda de patrones de datos. Así, los estudios previos que se han realizado desde la aparición del termino, se centran en el diseño y programación de algoritmos eficientes para la fase de Data Mining. Sin embargo, hasta el momento, no se ha realizado ningún estudio que intente formalizar el proceso en concreto la fase de Data Mining de una manera uniforme. Tampoco se ha abordado el proceso de descubrimiemto del conocimiento desde la perspectiva de bases de datos, esto es, para intentar que la próxima generación de sistemas de gestión de bases de datos proporcionen consultas que permitan el análisis de los mismos. En este trabajo en primer lugar, se realiza un estudio detallado de las operaciones que se llevan a cabo a lo largo del proceso del descubrimiento del conocimiento. Como consecuencia de este estudio, dichas operaciones se clasifican en un nuevo ciclo en sus fases correspondientes. El ciclo propuesto, permite establecer ciertos requisitos para las operaciones que se realicen en cada fase, lo que desemboca en una definicion de los distintos perfiles de los usuarios. El estudio en profundidad de las características de la fase de Data Mining lleva al descubrimiento de una estructura matemática capaz de modelizar aquellas consultas de Data Mining que se puedan traducir al modelo sintáctico que se propone. Esta estructura matemática resulta ser un retículo y por consiguiente, las propiedades del mismo se pueden tener en cuenta en futuras implementaciones de consultas. La validez del modelo se demuestra formalizando las consultas mas representativas como funciones matemáticas del modelo y demostrando que efectivamente la ejecución de las mismas forma un retículo con los que sus resultados son susceptibles de ser ordenados con el orden establecido en el modelo. Finalmente, se analizan los resultados obtenidos y se conforman las bases para una futura investigación en este campo