Tesis:

Propuesta de modelos predictivos en salud mental para la personalización de terapias de rehabilitación en pacientes con adicciones


  • Autor: TAPIA GALISTEO, José

  • Título: Propuesta de modelos predictivos en salud mental para la personalización de terapias de rehabilitación en pacientes con adicciones

  • Fecha: 2021

  • Materia: Sin materia definida

  • Escuela: E.T.S. DE INGENIEROS DE TELECOMUNICACION

  • Departamentos: TECNOLOGIA FOTONICA Y BIOINGENIERIA

  • Acceso electrónico: http://oa.upm.es/68120/

  • Director/a 1º: HERNANDO PÉREZ, María Elena

  • Resumen: El consumo de drogas y los trastornos asociados a las mismas han seguido una tendencia creciente en la última década, y esta situación se augura con peor pronóstico debido a la crisis mundial provocada por la COVID-19. Los trastornos por adicciones representan un conjunto de problemas multifactoriales, fuertemente ligados a los trastornes mentales y a los déficits cognitivos, y que afectan de manera directa a la sociedad mundial. Las personas con problemas de adicciones representan un gran coste para los sistemas sociosanitarios y económicos, no sólo por los costes asociados a los tratamientos médicos y farmacológicos, sino también por las complicaciones asociadas, tales como enfermedades y pruebas médicas necesarias, la repercusión en la salud mental y el bienestar de los seres queridos y del resto de la sociedad, el impacto en la violencia y el sistema jurídico penal, así como la pérdida de productividad asociada a la discapacidad y a las muertes prematuras. Los criterios diagnósticos para este tipo de patologías han sufrido múltiples revisiones y cambios en las últimas décadas, con motivo de la complejidad inherente y con el fin de mejorar la calidad asistencial y los estigmas asociados. Además, el acceso a los tratamientos para la rehabilitación por drogadicción sigue siendo insuficiente y desigual, careciendo de la cobertura y especificidad necesarias y dependiendo fuertemente de la región y de la droga de consumo. El uso de técnicas de aprendizaje automático se encuentra actualmente en auge, con multitud de investigaciones que han demostrado su utilidad y su potencial en el campo biomédico. En concreto, dentro de la psiquiatría de adicciones, también se está produciendo un movimiento emergente para la aplicación de estas técnicas, con el fin de trasladar las investigaciones hacia las prácticas clínicas en psiquiatría. En esta tesis doctoral se proponen y evalúan diferentes modelos predictivos en salud mental para la personalización de terapias de rehabilitación en pacientes con adicciones, teniendo como objetivo la predicción del éxito en el tratamiento residencial para pacientes con adicción a la cocaína mediante técnicas de aprendizaje automático a partir de datos heterogéneos de gran dimensionalidad. Los datos heterogéneos empleados son previos al posible acceso al tratamiento residencial, siendo esta información la que se utiliza en la práctica clínica actual para decidir la derivación al recurso residencial. Estos datos provienen de los informes de solicitud de derivación, los cuales son documentos de texto con una estructura fija y predeterminada por la administración pública. En estos se haya información sociodemográfica, farmacológica, mental, cognitiva, de personalidad, de habilidades y competencias, la historia de consumo, los tratamientos previos en adicciones y demás parámetros individuales relacionados con la salud. La extracción de dicha información se ha realizado de manera manual por personal investigador, mediante lectura y transformación en una base de datos estructurada. Como objetivo secundario, en esta tesis doctoral se propone y evalúa una herramienta que permite la extracción automática de la información contenida en los informes de derivación utilizando técnicas de procesamiento de lenguaje natural, con el potencial de poder aumentar la muestra de pacientes para futuras investigaciones, unificando criterios de extracción y suponiendo un ahorro de tiempo y costes para el personal investigador. Para la creación de los modelos predictivos se hace uso de diferentes técnicas de selección de características, así como distintas tipologías de algoritmos de aprendizaje automático, generándose múltiples combinaciones. De esta forma se entrenan diferentes modelos predictivos a partir de diferentes conjuntos de características, y estos se comparan entre sí en base a parámetros objetivos. El mejor modelo predictivo resultó ser un algoritmo de tipo bosques aleatorios, entrenado con el conjunto de características obtenido mediante un evaluador wrapper y un algoritmo de búsqueda Best First, el cual presentó la mayor exactitud (82.12%), F1-score (0.89), MCC (0.53) y área bajo la curva (0.81), así como una elevada sensibilidad (0.96). Los resultados obtenidos han permitido comprobar que el uso de algoritmos de aprendizaje automático en conjunto con técnicas de selección de características sobre un conjunto de variables heterogéneas de diferentes dimensiones proporciona resultados útiles para la predicción del éxito terapéutico en pacientes adictos a la cocaína. La utilización del modelo predictivo como ayuda en la toma de decisiones en la práctica clínica podría reducir la tasa de abandono entre un 17.11% y un 36.82%, mejorando su pronóstico futuro de reinserción en la sociedad. La herramienta de extracción automática de la información obtiene una precisión del 91.59%, y con un tiempo de extracción irrelevante (1.67 segundos por informe), por lo que se postula como un método prometedor para la obtención y estructuración de mayores volúmenes de datos, permitiendo generar grandes beneficios para el desarrollo de futuras investigaciones y para la gestión clínica. Hasta donde tenemos conocimiento, este es el primer estudio de investigación que utiliza técnicas de aprendizaje automático en una muestra de población europea con trastorno por consumo de cocaína, así como el tamaño de la muestra de pacientes empleada también es la mayor que se ha utilizado en este contexto. También hasta donde conocemos, este es el primer estudio de investigación que ha considerado las características de los tratamientos previos junto con variables mentales, cognitivas, sociodemográficas, de personalidad y farmacológicas en la adicción a la cocaína. ----------ABSTRACT---------- Drug use and drug-related disorders have shown an increasing trend in the last decade, and the prognosis is expected to worsen due to the global crisis caused by COVID-19. Addiction disorders represent a multifactorial set of problems, strongly linked to mental disorders and cognitive deficits, and directly affecting society worldwide. People with addiction problems represent a major cost to health care and economic systems, not only because of the costs associated with medical and pharmacological treatment, but also because of the associated complications, such as illness and medical tests required, the impact on the mental health and well-being of loved ones and the rest of society, the impact on violence and the criminal justice system, as well as the loss of productivity associated with disability and premature deaths. Diagnostic criteria for this type of pathology have undergone multiple revisions and changes in recent decades, due to the inherent complexity and in order to improve the quality of care and the associated stigmas. In addition, access to drug rehabilitation treatment remains insufficient and unequal, lacking the necessary coverage and specificity and depending heavily on the region and the drug of use. The use of machine learning techniques is currently booming, with much research demonstrating their usefulness and potential in the biomedical field. Specifically, within addiction psychiatry, there is also an emerging movement for the application of these techniques, with the aim of transferring research into clinical practice in psychiatry. In this doctoral thesis, different predictive models in mental health for the personalization of rehabilitation therapies in patients with addictions are proposed and evaluated, aiming at predicting success in residential treatment for patients with cocaine addiction using machine learning techniques from heterogeneous high dimensional data. The heterogeneous data used are prior to the possible access to residential treatment, being this information the one used in current clinical practice to decide the referral to the residential resource. The data used come from the referral request reports, which are text documents with a fixed structure and predetermined by the public administration. They contain socio-demographic, pharmacological, mental, cognitive, personality, skills and competences information, history of consumption, previous addiction treatment and other individual parameters related to health. The extraction of this information has been carried out manually by researchers, by reading and transforming it into a structured database. As a secondary objective, this doctoral thesis proposes and evaluates a tool that allows the automatic extraction of information contained in referral reports using natural language processing techniques, with the potential to increase the sample of patients for future research, unifying extraction criteria and saving time and costs for researchers. For the creation of predictive models, different feature selection techniques are used, as well as different types of machine learning algorithms, generating multiple combinations. Different predictive models are trained on different sets of features and compared with each other on the basis of objective parameters. The best predictive model was a random forest type algorithm, trained with the set of features obtained by means of a wrapper evaluator and a Best First search algorithm, which presented the highest accuracy (82.12%), F1-score (0.89), MCC (0.53) and area under the curve (0.81), as well as a high sensitivity (0.96). The results obtained have shown that the use of machine learning algorithms in conjunction with feature selection techniques on a set of heterogeneous variables of different dimensions provides useful results for the prediction of therapeutic success in patients addicted to cocaine. The use of the predictive model as a decision-making tool in clinical practice could reduce the dropout rate between 17.11% and 36.82%, improving their future prognosis for reintegration into society. The automatic information extraction tool obtains a precision of 91.59%, with an irrelevant extraction time (1.67 seconds per report), making it a promising method for obtaining and structuring larger volumes of data, allowing it to generate great benefits for the development of future research and for clinical management. To our knowledge, this is the first research study to use machine learning techniques in a European population sample with cocaine use disorder, and the size of the patient sample used is also the largest ever used in this context. To our knowledge, this is also the first research study that has considered previous treatment characteristics together with mental, cognitive, personality, sociodemographic and pharmacological variables in cocaine addiction.