Tesis:
Optimización de procesos de adquisición de conocimiento en Biología Computacional.
- Autor: GONZALEZ TORTOSA, Santiago
- Título: Optimización de procesos de adquisición de conocimiento en Biología Computacional.
- Fecha: 2010
- Materia: Sin materia definida
- Escuela: FACULTAD DE INFORMATICA
- Departamentos: ARQUITECTURA Y TECNOLOGIA DE SISTEMAS INFORMATICOS
- Acceso electrónico: http://oa.upm.es/4742/
- Director/a 1º: ROBLES FORCADA, Víctor
- Director/a 2º: FAMILI, Fazel
- Resumen: Tradicionalmente, los datos clínicos han sido la única fuente de información para el diagnóstico de enfermedades. Hoy en día, existen otros tipos de información, como Microarrays de ADN, que permiten mejorar el diagnóstico y pronóstico en muchas enfermedades. Esta tesis propone un nuevo enfoque, denominado CliDaPa, para combinar eficientemente ambas fuentes de información (datos clínicos y genéticos), de forma que se mejoren las estimaciones. Para ello, en primer lugar, los pacientes se segmentan utilizando una representación en árbol a través de sus datos clínicos (árbol clínico). Por tanto, se identifican distintas agrupaciones de pacientes según comportamientos similares. A continuación, se analiza cada agrupación independientemente con la información genética asociada, mediante técnicas de minería de datos. Para demostrar su validez, el método se aplica a distintos conjuntos de datos reales (sobre cáncer de mama y de cerebro). La validación de los resultados se basa en dos métodos de validación, interna y externa, utilizando para ello el Centro de Supercomputación y Visualización de Madrid (CeSViMa), en donde se ejecutaron los tres enfoques paralelizados del algoritmo. Los resultados obtenidos se comparan con distintos estudios de la literatura, así como con las técnicas de análisis tradicionales, demostrando una mejora significativa en los resultados existentes.