Tesis:

Computational tools to study emergent behaviours in bacterial populations and their hosts


  • Autor: NÚÑEZ BERRUECO, Elena

  • Título: Computational tools to study emergent behaviours in bacterial populations and their hosts

  • Fecha: 2024

  • Materia:

  • Escuela: E.T.S DE INGENIEROS INFORMÁTICOS

  • Departamentos: INTELIGENCIA ARTIFICIAL

  • Acceso electrónico: https://oa.upm.es/81366/

  • Director/a 1º: RODRÍGUEZ-PATON ARADAS, Alfonso

  • Resumen: The fields of systems and synthetic biology in the context of microbiology greatly rely on computational tools. Systems biology views cells as interconnected networks, while synthetic biology engineers biocircuits with novel behaviours. Computational models are pivotal for understanding biological systems, forecasting behaviours, and optimizing experimentation in both fields. Artificial neural networks (ANNs) exhibit unparalleled versatility and accuracy inpredictions. Alongside manual models, agent-based models (ABMs) provide detailedmechanistic representations, mapping individual cell interactions to emergent population-level behaviours. ABMs excel in capturing spatial heterogeneity, of significantvalue in light of the growing interest in multicellular circuits. Nevertheless, these twomethodologies entail limitations that constraint their application. This thesis aims toenhance their applicability and accessibility in systems and synthetic microbiology. The first contribution of this thesis is an interpretable ANN architecture namedsmall interpretable neural networks (SINNs), specifically designed for extremely limiteddatasets. It resides within the emerging domain of visual neural networks (VNNs),which utilise biological networks as ANN architectures. While the prevalent applicationof this approach aims to enhance interpretability, this thesis uniquely capitalises on theirsparse representation to train models with scarce data. This novel SINN architectureintegrates targeted enhancements tailored towards this objective, diverging from existingmethodologies. The work underscores how this constrained, biologically meaningfulconnectivity mitigates noise and spurious patterns from the dataset. The SINN approach has materialized into a software tool for model training via amultipopulation, steady-state, real-coded genetic algorithm. Applied to the intricatenetwork of type III secretion system (T3SS) effectors of Citrobacter rodentium witha minimal dataset of 100 instances, the model yielded unexpected yet experimentallyvalidated insights. These findings guided subsequent experimental investigations. As a second contribution, this thesis introduces an enhanced version of the widelyknown ABM simulator, gro, termed gro 3.0. This updated iteration aims to augmentaccessibility and align with evolving synthetic biology trends. Notably, gro 3.0 replacesthe original programming language with a graph-based experiment specification layer,rendering the software more accessible while retaining substantial flexibility. gro 3.0 is acompletely revamped software with enhanced performance, expandability, user interface,associated tools, and simulation capabilities. Among the plethora of new biological features, quantitative DNA dynamics stand out,encompassing plasmid replication, segregation, mutation, gene editing, and various formsof horizontal gene transfer. These facilitate simulations of DNA-based communication,a promising area in synthetic biology research. Additionally, an inventive stochasticitymanagement approach introduces spatially-structured cell variability and supportsevolution experiments. With this comprehensive catalogue of features, gro 3.0 emergesas a premier option for the development of bacterial ABMs and lays a robust foundationfor the prospective establishment of a unified simulation platform for multicellularconsortia. These two contributions offer accessible modelling tools, one automated and one mechanistic, optimizing experimentation and accelerating the pace of discovery in microbiological research. Moreover, certain concepts and methodologies introduced in this work hold the potential to extend beyond biology. RESUMEN Los campos de la biología de sistemas y la biología sintética en microbiología dependen ampliamente de herramientas computacionales. La biología desistemas entiende las células como redes interconectadas, mientras que la biología sintéticadiseña biocircuitos con comportamientos novedosos. Los modelos computacionales son cruciales para comprender sistemas biológicos, predecir comportamientos y optimizar laexperimentación en ambos campos. Las redes neuronales artificiales (ANNs) exhiben versatilidad y exactitud sin igual en sus predicciones. Entre los modelos manuales, los basados en agentes (ABMs) ofrecen representaciones mecanicistas detalladas, relaciona interacciones celulares individuales con comportamientos poblacionales emergentes. Los ABMs destacan por capturar la heterogeneidad espacial, de gran valor considerando el creciente interés en los circuitos multicelulares. No obstante, estos dos enfoques conllevan limitaciones que restringensu uso. Esta tesis pretende mejorar su aplicabilidad y accesibilidad en microbiología de sistemas y sintética. La primera contribución de esta tesis es una arquitectura interpretable ANN llamada redes neuronales interpretables pequeñas (SINNs), diseñadas específicamente para conjuntos de datos extremadamente limitados. Se engloba en el dominio de las redes neuronales visuales (VNNs), que utilizan redes biológicas como arquitecturas ANN. Mientras que la aplicación prevalente de este método se centra en mejorar la interpretabilidad, esta tesis aprovecha su representación dispersa para entrenar modelos con datos escasos. La novedosa arquitectura SINN integra mejoras dirigidas hacia este objetivo, divergiendo de metodologías existentes. Este trabajo resalta cómo esta conectividad restringida y con sentido biológico mitiga el ruido y los patrones espurios del conjunto de datos. El enfoque SINN se ha materializado en una herramienta software para entrenar modelos mediante un algoritmo genético multi-población, de estado estacionario y codificación real. Aplicado a la intrincada red de efectores del sistema de secreción tipo III (T3SS) de Citrobacter rodentium con un conjunto de datos mínimo de 100 casos, el modelo produjo resultados inesperados pero validados experimentalmente. Estos hallazgos orientaron investigaciones experimentales posteriores. Como segunda contribución, esta tesis introduce una versión mejorada del conocido simulador ABM, gro, denominada gro 3.0. Esta nueva iteración pretende mejorar la accesibilidad y alinearse con las tendencias en evolución en biología sintética. A destacar, gro 3.0 reemplaza el lenguaje de programación original por una capa de especificación de experimentos basada en grafos, haciendo el software accesible mientras conserva flexibilidad. gro 3.0 es un software completamente renovado con un mejor rendimiento,capacidad de expansión, interfaz de usuario, herramientas asociadas y capacidades desimulación. Entre la multitud de nuevas funcionalidades biológicas, destacan las dinámicas del ADN, abarcando replicación de plásmidos, segregación, mutación, edición génica y transferencia genética horizontal. Éstas facilitan la simulación de comunicación basada en ADN, un área prometedora en biología sintética. Además, un enfoque innovador de manejo de la estocasticidad introduce variabilidad celular espacialmente estructurada y sustenta experimentos de evolución. Con este catálogo de características, gro 3.0 emerge como una opción principal para el desarrollo de ABMs bacterianos y sienta una base sólida para el establecimiento futuro de una plataforma de simulación unificada para consorcios multicelulares. Estas dos contribuciones ofrecen herramientas de modelado accesibles, una automatizada y otra mecanicista, destinadas a optimizar la experimentación y acelerar e lritmo de descubrimiento en la investigación microbiológica. Además, ciertos conceptos y metodologías introducidos en este trabajo tienen el potencial de extenderse más allá de la biología.