Tesis:
A new agent-based platform for simulating multicellular biocircuits with conjugative plasmids
- Autor: GUTIÉRREZ PESCARMONA, Martín Eduardo
- Título: A new agent-based platform for simulating multicellular biocircuits with conjugative plasmids
- Fecha: 2017
- Materia: Sin materia definida
- Escuela: E.T.S DE INGENIEROS INFORMÁTICOS
- Departamentos: INTELIGENCIA ARTIFICIAL
- Acceso electrónico: http://oa.upm.es/48812/
- Director/a 1º: RODRÍGUEZ-PATÓN ARADAS, Alfonso
- Resumen: La biología sintética es una disciplina nacida recientemente que se origina en el año 2000 en el Laboratorio de Inteligencia Artificial del MIT. Emerge como una disciplina en que la ingeniería se aplica a componentes y sistemas biológicos. Por su naturaleza, la biología sintética es un campo interdisciplinario en el que los ingenieros y biólogos trabajan en conjunto para diseñar e implementar circuitos que ya sea persiguen recrear vida, o bien comportarse de manera no natural con algún propósito específico. Hasta recientemente, ésta ingeniería de la biología se ha llevado a cabo de manera informal. No existían herramientas bioCAD o de simulación para asistir en el diseño de circuitos biológicos. Un ciclo de prueba y error en conjunto con la intuición del biólogo eran las directrices en un proceso largo con el objetivo de alcanzar el comportamiento deseado del circuito biológico. Esto coloca a la biología sintética en un estado comparable al de la microelectrónica en los años 80. El método de prueba y error es lento, por lo que simuladores y herramientas de bioCAD son requerimientos para acelerar el proceso. El ciclo de diseño-construcción-prueba-aprendizaje es un enfoque que muchos biólogos sintéticos actualmente utilizan para llevar a cabo dicha tarea. Este ciclo aprovecha plenamente el uso de las herramientas de software para acelerar el proceso. En la fase de diseño del ciclo, los científicos trabajan en un diseño y profundizan sobre su funcionalidad de manera teórica. Es en este punto que las simulaciones computacionales muestran su utilidad, puesto que reproducen las dinámicas base de dichos diseños. Estos programas tienen por finalidad ayudar en la identificación y descarte de diseños incorrectos. También sirven para dirigir y estimar valores de parámetros que luego serán utilizados en la implementación de los diseños en el laboratorio de microbiología. El objetivo es minimizar costos en tiempo y dinero que suscita la experimentación en el laboratorio. En este contexto, hay una necesidad clara de simuladores veloces, precisos y simples de usar. Los modelos basados en agentes (AbMs), también conocidos como modelos basados en individuos (IbMs), son un tipo de modelos implementados por simuladores que se centran en el comportamiento de cada individuo en una colonia (en el contexto actual, son colonias de células). Estos modelos son alternativas a aquellos basados en Ecuaciones Diferenciales Ordinarias (ODE) o estocásticos (Gillespie). Los AbM proporcionan una mejor representación de cómo interactúan poblaciones bacterianas y se comportan de manera espacial, mientras modelos basados en ODEs y Gillespie ofrecen una simulación más precisa de dinámicas a nivel intracelular. Las colonias bacterianas crecen en 2D sobre placas de Petri. Cada bacteria se puede ver como un agente individual que se comunica e interactúa con otras bacterias a través de señales químicas del en torno o por intercambio de mensajes genéticos (plásmidos). Cada célula sigue una serie de reglas probabilísticas que dirigen su crecimiento, reproducción, comunicación, muerte, o cualquier acción que ejecute. Esto representa el comportamiento completo de la bacteria. Las reglas probabilísticas implican la emergencia de un comportamiento global a nivel poblacional. Los simuladores AbM son adecuados para evaluar y predecir comportamientos de circuitos sintéticos multicelulares. Lo expuesto conduce a hacerse las siguientes tres preguntas de investigación al respecto: 1) ¿Qué potencial tienen los simuladores AbM actuales para simular circuitos genéticos multicelulares novedosos que utilicen conjugación bacteriana? 2) ¿Cómo se pueden solucionar las limitaciones identificadas para que se puedan simular circuitos genéticos multicelulares novedosos que utilicen conjugación bacteriana? 3) ¿Qué diseños novedosos relacionados con patrones espaciales y/o temporales puede prototipar la plataforma mejorada? Al empezar el desarollo del presente trabajo, no habían simuladores AbM capaces de simular circuitos multicelulares del proyecto PLASWIRES. gro se seleccionó como AbM para ser mejorado y extendido. A raíz de esta elección y del aumento gradual en complejidad de las simulaciones, se estableció un listado de características para complementar el simulador: - Mejorar la velocidad del simulador: se logró implementando CellEngine, un nuevo motor físico que consta de un algoritmo de empuje adaptado para colonias de bacterias. - Agregar conjugación bacteriana como mecanismo de comunicación intercelular: se implemento directamente en el código fuente de gro, siendo un requerimiento clave para simular circuitos de PLASWIRES. - Simplificar el proceso de expresión genética en el simulador y la especificación de simulaciones: CellPro es un nuevo módulo que simplifica la expresión genética por medio de dinámicas asociadas a proteínas binarias. ProSpec define un nuevo lenguaje de especificación escalable para describir circuitos genéticos complejos. - Agregar consumo de nutrientes y modulación de crecimiento celular: un simulador de consumo de nutrientes basado en Monod, CellNutrient, se desarrolló para acoplarse a gro. - Mejorar las capacidades de señales del entorno: CellSignals empaqueta una nueva versión extendida de simulación de señales del entorno para gro. gro se mejoró sustancialmente con la inclusión de las características propuestas. Ahora es capaz de simular 105 bacterias en minutos (en vez de una semana). La aceleración adquirida del simulador lo ubica como una herramienta de prototipado muy rápida que se aplica a una amplia gama de diseños en biología sintética y de sistemas. Además, gro ahora dispone de especificación y dinámicas genéticas incorporadas en el sistema, consumo de nutrientes, capacidades de señales del entorno mejoradas y conjugación bacteriana. La plataforma junto con los módulos mencionados son de código abierto y se pueden encontrar en: https://github.com/liaupm/GRO-LIA. El realismo de las simulaciones producidas por la plataforma ha aumentado gracias a la gran cantidad de bacterias que es posible simular ahora y que ellas pueden hacer uso de las nuevas características. Los resultados de estas simulaciones muestran el comportamiento de circuitos multicelulares, cumpliendo así su propósito en el prototipado para evaluar tempranamente el diseño de los circuitos. Este trabajo también presenta diseños multicelulares novedosos como aplicación de la herramienta para implementación y análisis de diseños de circuitos sintéticos multicelulares. Estos diseños se refieren principalmente a patrones espaciales y/o temporales, y hacen uso de todas las características nuevas incluidas en gro. El desarrollo futuro del simulador incluye la automatización de la especificación de simulaciones, una versión web del simulador, la conexión con estándares existentes como SBOL o SBML y la implementación de nuevas características como infección de bacteriófagos o capacidad de edición genética como en el caso del sistema CRISPR/Cas9. gro se ha convertido en una herramienta que le es útil a un público más amplio que en su versión anterior. Biología de sistemas, biología evolutiva y epidemiología son ejemplos de otras disciplinas que se podrían beneficiar de una nueva plataforma como la que se presenta en el documento actual. ----------ABSTRACT---------- Synthetic biology is a recently born discipline, finding its origins in the year 2000 at the MIT Artificial Intelligence lab. It emerges as a discipline in which engineering is applied to biological components and systems. As per its nature, synthetic biology is an interdisciplinary field in which engineers and biologists work together to design and implement circuits that either seek to recreate life or display an unnatural behavior for a specific purpose. Until recently, this engineering of biology has been carried out in an informal manner, as bioCAD and simulation tools were not available to aid in the design of biocircuits. A trial-and-error cycle along with the biologist intuition are the guidelines for a long process in reaching the desired biocircuit behavior. This places synthetic biology at a stage that can be compared to microelectronics in the 1980s. Trialand- error is a slow method, simulators and bioCAD tools are a requirement for speeding up the process. The design-build-test-learn cycle is the approach most synthetic biologists currently use to undertake the task. This cycle takes full advantage of the software tools to speed up the process. In the design phase of this cycle, the scientist works on a design and elaborates on its functionality in a theoretical manner. I t is at this stage that computer simulations become useful, as they reproduce the basic dynamics of the designs. These programs serve the purpose of assisting in identifying flaws and ruling out incorrect designs. They also help in directing and estimating parameters to implement designs in the wet lab. One goal is to minimize the costs in time and money due to experimentation. In this scenario, there is a clear need for fast, accurate and simple to use simulators. Agent based Models (AbMs), also known as Individual based Models (IbMs), are a type of models implemented by simulators that focus on the behavior of each individual in a colony (in this context, it is a colony of cells). These models are alternatives to Ordinary Differential Equation (ODE) or stochastic (Gillespie) based models. AbMs provide a better representation of how bacterial populations interact and behave in a spatial manner, whilst ODE and Gillespie models offer a more accurate simulation of dynamics at an intracellular level. Bacterial colonies grow in a Petri dish in a 2D manner. Each bacterium can be seen as an individual agent that communicates and interacts with other bacteria through environmental chemical signals or by exchanging genetic messages (plasmids). Each cell follows probabilistic rules that direct its growth, reproduction, communication, death, or any action it executes. This accounts for the whole bacterium behavior. These probabilistic rules yield the emergence of a global population-level behavior. AbM simulators are well-suited for assessing and predicting multicellular synthetic circuit behavior. This leads to three research questions on the matter: 1) What potential do current AbM simulators have for simulating novel multicellular genetic circuits using bacterial conjugation? 2) How should the identified shortcomings be overcome to enable the simulation of novel multicellular genetic circuits using bacterial conjugation? 3) What novel designs relating to spatial and/or temporal patterns can the newly enhanced platform prototype? When this work began, no AbM simulator was capable of simulating multicellular circuits in the PLASWIRES project. gro was selected as the AbM framework to be improved and extended. Following this choice, and the scaling complexity in simulations, a roadmap of features to complement it was established: - Improving the simulator speed: this was done by implementing CellEngine, a new physics engine featuring a shoving algorithm tailored for bacterial colonies. - Adding bacterial conjugation as an intercell communication mechanism: implemented directly into the gro source code, being a key requirement for simulating PLASWIRES circuits. - Simplifying the gene expression process in the simulator and simulation specification: CellPro is a new module that simplifies gene expression through binary protein dynamics. ProSpec defines a new scalable specification language for describing complex genetic circuits. - Adding nutrient uptake and modulating cell growth: a Monod based nutrient uptake simulator module, CellNutrient, was developed to couple with gro. - Improving the environmental signal capabilities: CellSignals packages a new and extended version of environmental signal simulation for gro. gro was improved substiantially upon inclusion of the proposed features. It is now capable of simulating 105 bacteria in a matter of minutes (instead of a week). This newly-acquired speed of the simulator places it as a very fast prototyping tool for a wide range of systems and synthetic biology designs. Additionally, gro now provides built-in genetic specification and dynamics, nutrient consumption, improved environmental signal capabilities and bacterial conjugation. This platform, along with the mentioned modules are open-source and can be found at: https://github.com/liaupm/GRO-LIA. Realism of the simulations produced by the platform has increased as high cell counts are now attainable and can make use of the new features. Outcomes of these simulations accurately shed light on the behavior of multicellular circuits, fulfilling their purpose in prototyping for early assessment of circuit design. This work also presents novel multicellular designs as an application of the tool for implementation and analysis of multicellular synthetic circuit designs. They mainly refer to spatial and/or temporal patterns, and make full use of the newly included features of gro. Future developments on the simulator include automating simulation specification, offering a web-based version of the simulator, connecting to existing standards such as SBOL or SBML and adding onto the existing features by implementing bacteriophage infection or gene editing capabilities such as a CRISPR/Cas9 system. gro has become a tool that is useful for a broader audience than its previous version. Systems biology, evolutionary biology and epidemiology are examples of other fields that could benefit from a new platform like the one presented in the current document.