Tesis:

Propuesta de metodología para el registro, la gestión y la reutilización de datos de salud basada en modelos de arquitectura dual


  • Autor: PEDRERA JIMÉNEZ, Miguel

  • Título: Propuesta de metodología para el registro, la gestión y la reutilización de datos de salud basada en modelos de arquitectura dual

  • Fecha: 2022

  • Materia:

  • Escuela: E.T.S. DE INGENIEROS DE TELECOMUNICACION

  • Departamentos: TECNOLOGIA FOTONICA Y BIOINGENIERIA

  • Acceso electrónico: https://oa.upm.es/72139/

  • Director/a 1º: MUÑOZ CARRERO, Adolfo
  • Director/a 2º: HERNANDO PÉREZ, María Elena

  • Resumen: La obtención de datos de salud para investigación y otros fines secundarios debe evolucionar desde un paradigma basado en el registro manual en sistemas de información específicos para un propósito de explotación, hacia una reutilización efectiva de los datos registrados durante el proceso asistencial en la Historia Clínica Electrónica, conocidos como datos del mundo real (RWD, por sus siglas en inglés). No obstante, para alcanzar este escenario ideal es necesario que los datos sean registrados, extraídos y transformados desde los sistemas de información con pleno significado, y a través de procesos formales y transparentes que los hagan entendibles, auditables y reproducibles. Esta Tesis tiene como objetivo proponer una metodología para el registro, la gestión y la reutilización de los datos de salud basada en modelos de arquitectura dual, también conocidos como Modelos Clínicos Detallados (DCM, por sus siglas en inglés). Así, las aportaciones de la Tesis son: (1) El estudio del paradigma de Modelos Clínicos Detallados en la HCE, concretamente la Norma UNE-EN ISO 13606, para la gestión y gobernanza de los modelos de conceptos y de datos en las diferentes tipologías de sistemas de información que componen la HCE; (2) El análisis de terminologías estándares, como SNOMED CT y LOINC, para representar el significado de los conceptos del dominio de la salud formalizados a través de arquetipos clínicos; (3) La propuesta de un proceso formal, transparente y automatizado de extracción, selección y transformación de los datos de salud para su reutilización en cualquier propósito y escenario de aplicación; (4) La evaluación de la validez, utilidad y aceptabilidad de la metodología en su aplicación a diferentes casos de uso. Estas aportaciones se han aplicado a diferentes proyectos de datos de salud desarrollados en el Hospital Universitario 12 de Octubre en la pandemia de COVID-19. Dichos proyectos especificaron modelos de datos de diferentes tipologías: repositorios normalizados, formularios de reportes de casos y conjuntos de datos agregados. Al desarrollarse estos proyectos en una situación crítica como lo ha sido la pandemia de COVID-19, los datos se requerían de manera ágil, flexible y sin suponer esfuerzo adicional a los profesionales sanitarios, por lo que se ha contado con un escenario ideal para aplicar y evaluar la metodología de reutilización de datos de salud propuesta. La conclusión de esta Tesis Doctoral es que la metodología propuesta ha permitido obtener datos válidos y útiles para los proyectos de investigación, empleando un proceso que es aceptado por los consumidores de los datos. Esto supone un primer paso hacia el cambio de paradigma de obtención de datos para investigación, pasando de procesos ad-hoc de recogida manual para un único propósito, a un proceso que es eficiente, pues se aprovecha lo ya registrado en la Historia Clínica Electrónica; flexible, pues es aplicable para múltiples propósitos y para cualquier organización que demande los datos; y transparente, al poder ser analizado en procesos de auditoría técnica o funcional. ABSTRACT The collection of health data for research and other secondary purposes must evolve from a paradigm based on the manual recording in specific information systems for a purpose of exploitation, towards an effective reuse of the data recorded during the care process in the Electronic Health Record, known as real-world data (RWD). However, to achieve this ideal scenario it is necessary that the data are recorded, extracted, and transformed from the information systems with full meaning, and through formal and transparent processes that make them understandable, auditable, and reproducible. This thesis aims to propose a methodology for the recording, management and reuse of health data based on dual architecture models, also known as Detailed Clinical Models (DCM). Thus, the contributions of the thesis are: (1) The study of the paradigm of Detailed Clinical Models in the EHR, specifically the UNE-EN ISO 13606 standard, for the management and governance of concept and data models in the different typologies of information systems that compose the EHR; (2) The analysis of standard terminologies, such as SNOMED CT and LOINC, to represent the meaning of the concepts of the health domain formalized through clinical archetypes; (3) The proposal of a formal, transparent and automated process of extraction, selection and transformation of health data for reuse in any purpose and application scenario; (4) The evaluation of the validity, utility and acceptability of the methodology in its application to different use cases. These contributions have been applied to different health data projects developed at the Hospital Universitario 12 de Octubre in the COVID-19 pandemic. These projects specified data models of different typologies: standardized repositories, case report forms and aggregated data sets. As these projects were developed in a critical situation such as the COVID-19 pandemic, the data were required in an agile and flexible manner and without additional effort for health professionals, thus providing an ideal scenario to apply and evaluate the proposed health data reuse methodology. The conclusion of this PhD Thesis is that the proposed methodology has made it possible to obtain valid and useful data for research projects, using a process that is accepted by the consumers of the data. This is a first step towards changing the paradigm of data collection for research, going from ad-hoc processes of manual collection for a single purpose, to a process that is efficient, as it takes advantage of what is already recorded in the Electronic Health Record; flexible, as it is applicable for multiple purposes and for any organization that demands the data; and transparent, as it can be analyzed in technical or functional auditing processes.