Tesis:

Data-driven approaches in rheumatology: learning from real-world data


  • Autor: MADRID GARCÍA, Alfredo

  • Título: Data-driven approaches in rheumatology: learning from real-world data

  • Fecha: 2022

  • Materia:

  • Escuela: E.T.S. DE INGENIEROS DE TELECOMUNICACION

  • Departamentos: TECNOLOGIA FOTONICA Y BIOINGENIERIA

  • Acceso electrónico: https://oa.upm.es/72300/

  • Director/a 1º: MENASALVAS RUÍZ, Ernestina
  • Director/a 2º: RODRÍGUEZ RODRÍGUEZ, Luis

  • Resumen: Las enfermedades reumáticas y musculoesqueléticas son un grupo heterogéneo de patologías de etiología variable, siendo en algunos casos desconocida, presentes en todos los segmentos poblacionales pudiendo afectar no sólo a tejidos propios del aparato locomotor, sino al resto de órganos. Liderando el grupo de enfermedades con mayor tasa de discapacidad a nivel mundial, éstas tienen un gran impacto a nivel social, mental y económico, mermando de forma notable la calidad de vida de los pacientes que las padecen. Por su parte, el uso de herramientas y técnicas basadas en inteligencia artificial se ha generalizado en los últimos años como respuesta al aumento en el volumen, velocidad y variedad de los datos, propiciando un nuevo escenario en el que las bases de datos longitudinales pueden ser explotadas con nuevos enfoques y para múltiples fines. Con esta tesis se busca extraer conocimiento en el campo médico de la reumatología y de las enfermedades musculoesqueléticas a partir de una historia clínica electrónica departamental, usada de forma rutinaria en el Hospital Clínico San Carlos (Madrid, España), con datos del mundo real y aplicando técnicas de minería de datos siguiendo la metodología Knowledge Discovery in Databases. Para ello, i) se introducen las características de los pacientes reumáticos que ejemplifican el por qué es necesario contar con herramientas eficaces de análisis de datos, ii) se revisa el uso de estas técnicas en el campo de la reumatología en los últimos años, iii) se describe la gestión de los datos desde su extracción, a partir de una base de datos relational, hasta la obtención de un conjunto de los mismos analizable, iv) se presentan distintos casos de uso, haciendo especial énfasis en la calidad de vida de los pacientes, y se extrae conocimiento de los mismos. El escrito concluye con una discusión de las conclusiones obtenidas en cada caso de uso y con una conclusión general del trabajo realizado: las técnicas de minería de datos son útiles para explotar datos de pacientes musculoesqueléticos, recogidos de forma rutinaria en un entorno ambulatorio, y extraer conocimiento de los mismos. ABSTRACT Rheumatic and Musculoskeletal Diseases (RMDs) are a heterogeneous group of pathologies of variable, and in some cases unknown, aetiology presented in all age segments that may affect not only the locomotor apparatus but also the internal organs. With a high social, mental, and economic impact, RMDs are among the leading causes of disability worldwide, significantly reducing the quality of life of patients who suffer from them. The increase in volume, velocity, and variety of data in recent years has propitiated the use of tools and techniques based on artificial intelligence, creating a new scenario in which longitudinal databases can be exploited with new approaches and for multiple purposes. The aim of this thesis is to extract knowledge from the RMDs field, using a departmental electronic health record routinely used in the Hospital Cl´ınico San Carlos (Madrid, Spain), with real-world data, using data mining techniques and following the Knowledge Discovery in Databases approach. Hence, i) the characteristics of rheumatic patients are introduced to illustrate why it is necessary to count with efficient data analysis tools, ii) the use of such techniques in the rheumatology field over the past years is reviewed, iii) the management of data, from its extraction from a relational database, until an analysable dataset is obtained is described, iv) different use cases are presented, with special emphasis on the quality of life of patients, and knowledge from them is acquired. This document ends with a discussion of the conclusions obtained in each use case and with a general conclusion: data mining techniques are useful for exploiting RMDs patient data, collected routinely in an outpatient setting, for knowledge discovery.