Autor: LÓPEZ BELTRÁN, Adrián
Título: Dynamics of CRISPR-mediated virus-host interactions in global ecosystems
Fecha: 2025
Materia: ---
Escuela: E.T.S. DE INGENIERÍA AGRONÓMICA, ALIMENTARIA Y DE BIOSISTEMAS
Departamento: SIN DEPARTAMENTO DEFINIDO
Acceso electrónico: https://oa.upm.es/91917/
Director/a(s):
- Director/a: IRANZO SANZ, Jaime
Resumen: Introduction CRISPR-Cas systems are adaptive immunity mechanisms in bacteria and archaea that have transformed molecular biology and provide a natural record of virushost interactions. However, their potential to study ecological processes in complex microbial communities remains limited by technical challenges in analyzing arrays from short metagenomic reads and by the lack of studies in global natural ecosystems. Objectives This thesis aimed to: (i) develop a bioinformatic pipeline to recover CRISPR arrays from short-read metagenomic data, (ii) validate it with the HMP2-IBD human gut microbiome project, (iii) apply the methodology to global ecosystems to explore interactions between viruses, plasmids, and hosts, and (iv) analyze the temporal dynamics of spacer acquisition and its effect on the prevalence and abundance of mobile genetic elements (MGEs). Results The pipeline enabled the assembly of tens of thousands of arrays with higher quality and diversity than traditional methods. Spacers showed a strong bias toward phage targets, with lysogenic phages predominating in distal regions and lytic phages in the leader end, reflecting coexisting endemic and epidemic dynamics. Transcriptomic analysis confirmed that distal spacers are expressed, albeit at lower levels, supporting their immunological relevance. Application to more than one thousand global samples revealed marked differences between host-associated ecosystems (more stable, with temperate strategies) and open ecosystems (more dynamic, dominated by lytic phages). Use of reads or contigs when studying CRISPR targets in local metagenome showed that the former capture low-abundance interactions, whereas the latter reflect more dominant and usually stable elements. Conclusions Targeted assembly with short reads substantially increases the recovery and quality of CRISPR arrays. CRISPR array profiles vary across ecosystems, with distinct length distributions, subtypes, and spacer targets. The human gut exhibits long-term memory dynamics, with endemic lysogenic phages in distal spacers and epidemic lytic phages in leader ends. Ecological openness modulates dynamics: host-associated ecosystems favor piggyback-the-winner strategies, while open ones are more unstable and variable. Reads and contigs capture different ecological snapshots in local metagenome: the former detect low-abundance interactions, while the latter reflect dominant ones. RESUMEN Introducción Los sistemas CRISPR-Cas son mecanismos de inmunidad adaptativa en bacterias y arqueas, que han transformado la biología molecular y ofrecen un registro natural de interacciones virushuésped. Sin embargo, su potencial para estudiar procesos ecológicos en comunidades microbianas complejas sigue estando limitado por dificultades técnicas en el análisis de arrays a partir de reads metagenómicas cortas, y la falta de estudios en ecosistemas naturales globales. Objetivos Esta tesis tuvo como metas: (i) desarrollar una pipeline bioinformática para recuperar arrays de CRISPR en datos metagenómicos dereads cortas, (ii) validarlo con el proyecto HMP2-IBD del microbioma intestinal humano, (iii) aplicar la metodología a ecosistemas globales para explorar interacciones entre virus, plásmidos y hospedadores, y (iv) analizar la dinámica temporal de adquisición de spacers y su efecto sobre la prevalencia y abundancia de elementos genéticos móviles (MGEs en inglés). Resultados La pipeline permitió ensamblar decenas de miles de arrays con mayor calidad y diversidad que los métodos tradicionales. Los spacers mostraron un sesgo hacia tener fagos como objetivo, con predominio de lisogénicos en las regiones distales, mientras que los líticos aparecieron en el extremo líder, reflejando dinámicas endémicas y epidémicas coexistentes. El análisis transcriptómico confirmó que los spacers distales se expresan, aunque a menor nivel, lo que respalda su relevancia inmunológica. La aplicación a más de mil muestras globales evidenció diferencias marcadas entre ecosistemas asociados a hospedadores (más estables, con estrategias temperadas) y abiertos (más dinámicos, dominados por fagos líticos). El uso de reads o contigs a la hora de estudiar secuencias afectadas por el sistema CRISPR-Cas en metagenomas locales mostró que las primeras capturan interacciones de baja abundancia mientras los segundos reflejan elementos más dominantes y generalmente estables. Conclusiones El ensamblado dirigido con reads cortas aumenta sustancialmente la recuperación y calidad de arrays de CRISPR. Los perfiles de arrays de CRISPR varían entre ecosistemas, con distintas distribuciones de longitudes, subtipos y objetivos de sus spacers. El intestino humano presenta dinámicas de memoria a largo plazo, con fagos endémicos lisogénicos en los spacers distales y fagos epidémicos líticos en los líderes. La apertura ecológica modula las dinámicas: los ecosistemas asociados a hospedadores favorecen piggyback-the-winner, mientras que los abiertos son más inestables y cambiantes. Reads y contigs capturan distintos paisajes ecológicos: las primeras detectan interacciones de baja abundancia, las segundas reflejan interacciones dominantes.