Tesis:

A machine learning-based representation of the electron density in biomacromolecules


  • Autor: CUEVAS ZUVIRÍA, Bruno

  • Título: A machine learning-based representation of the electron density in biomacromolecules

  • Fecha: 2021

  • Materia: Sin materia definida

  • Escuela: E.T.S. DE INGENIERÍA AGRONÓMICA, ALIMENTARIA Y DE BIOSISTEMAS

  • Departamentos: BIOTECNOLOGIA-BIOLOGIA VEGETAL

  • Acceso electrónico: http://oa.upm.es/68071/

  • Director/a 1º: FERNÁNDEZ PACIOS, Luis

  • Resumen: Solving Quantum Mechanics (QM) many-body electronic problems in molecular systems has become one of the most contested targets of modern Machine Learning (ML). Among the most fundamental properties of molecules, we find the electron density: the probability of finding electrons in each region of space. By only knowing this property, it is possible to derive most other molecular aspects. In this thesis, we aim to predict the electron density of large molecules by employing Machine Learning. We first studied how to convert QM electron density into linear models by simple means. Once we found some fundamental aspects of such decompositions, we built both analytical datasets of electron densities and Neural Network-based ML methods. The resulting networks leverage the local environments of each atom to generate deformations on the atomic electron density, so that they turn into accurate molecular electron densities. By combining our approach with different heuristics and formulas, we reached several targets such as the description of electron densities in proteins or the calculation of intermolecular energies. We consider that this methodology has a promising future ahead in many relevant targets of computational chemistry. ----------RESUMEN---------- Resolver problemas electrónicos de muchos cuerpos en sistemas moleculares en Mecánica Cuántica ha sido uno de los objetivos más disputados del Aprendizaje Automático. Entre las propiedades moleculares fundamentales, está la densidad electrónica que es la probabilidad de encontrar carga electrónica en una región del espacio. Conociendo esta propiedad, es posible calcular casi todos los demás aspectos de un sistema molecular. En esta tesis, hemos tratado de predecir la densidad electrónica de grandes moléculas empleando Aprendizaje Automático. Primero hemos estudiado cómo convertir densidades electrónicas provenientes de cálculos cuánticos en modelos lineales a través de una metodología sencilla. Una vez entendimos cómo realizar dicha conversión, construimos tanto conjuntos de datos de densidades electrónicas analíticas como métodos de Aprendizaje Automático basados en redes neuronales. Las redes resultantes sacan partido de los entornos locales de cada átomo para generar deformaciones de la densidad electrónica atómica, de forma que el resultado es una predicción precisa de la densidad electrónica molecular. Combinando nuestro enfoque con varias heurísticas y fórmulas, hemos podido alcanzar diferentes objetivos, como describir la densidad electrónica de proteínas o calcular energías intermoleculares. Consideramos que esta metodología tiene un gran futuro por delante en varios aspectos de la química computacional.