Tesis:
FAIR approaches applied to unraveling Plant-Pathogen Interactions Data and RNA Processing Evolution
- Autor: RODRÍGUEZ IGLESIAS, Alejandro
- Título: FAIR approaches applied to unraveling Plant-Pathogen Interactions Data and RNA Processing Evolution
- Fecha: 2016
- Materia: Sin materia definida
- Escuela: E.T.S. DE INGENIEROS AGRONOMOS
- Departamentos: BIOTECNOLOGIA
- Acceso electrónico: http://oa.upm.es/44220/
- Director/a 1º: WILKINSON, Mark D.
- Director/a 2º: SESMA GALARRAGA, Ane
- Resumen: This thesis is the result of combining Semantic Web technologies (Ontology modeling/building), Data management (FAIR Principles) and exploration of biological data per se (plant-pathogen interactions / RNA Metabolism Evolution). The work and results of this thesis are divided on three main chapters. The first chapter (3.1) addresses the in silico evolutionary study we performed on the transcriptional and polyadenylation machineries in the fungal kingdom. Being both of them key processes involved the maturation of pre-mRNAs, we decided to analyze the complete ortholog/paralog network of the participant proteins, as well as whole-protein domain conservation studies. We found a significant number of proteins and domains not conserved among different taxonomic groups, with some proteins being exclusively present in some fungal clusters. Particularly, species belonging to the Microsporidia phylum present the lowest level of conservation. The second chapter (3.2) focuses on describing the complete modeling and construction of the Plant-Pathogen Interactions Ontology (PPIO), a formal ontological model that represents the entity-relationships that hold within the plant-pathogen knowledge domain. We based the PPIO modeling in grounded biological principles and recommended good practices in ontology building, and our intention is make it a core resource for reuse by the plant research community. In this chapter we also discuss the merge of the PPIO with the resulting ontology of chapter 3.3, as well as the steps taken to make the ontology fulfill the FAIR principles of data management and publication. The work described in the third chapter (3.3) deals with the transformation workflow of a relevant host-pathogen related database (PHI-base) and the datasets from chapter 3.1 to a form that firmly adheres to each of the FAIR Principles. The PHI-base-to-FAIR transformation work, called Semantic PHI-base, was published in the form of an article in the Frontiers in Plant Science Journal, being first public data repository designed to be fully compliant with the spirit of the FAIR data principles. RESUMEN Esta tesis es el resultado de combinar tecnologías de la Web Semántica (Modelado/construcción de ontologías), manejo y publicación de datos (principios FAIR) y exploración de datos biológicos per se (interacciones planta-patógeno / Evolución del Metabolismo de ARN). El trabajo y los resultados de esta tesis están divididos en tres capítulos. El primer capítulo (3.1) se centra en el estudio in silico de evolución sobre las maquinarias de transcripción y poliadenilación del reino de los hongos. Siendo ambos procesos vitales en la maduración del ARN, decidimos analizar y comparar todas las redes de ortólogos/parálogos de las proteínas que intervienen, así como realizar estudios en masa de conservación de dominios proteicos. Hemos encontrado un número significativo de proteínas y dominios no conservados entre los diferentes grupos taxonómicos. Las maquinarias de ARN de las especies pertenecientes al filo Microsporidia son las que presentan un grado de conservación bajo. Esta aproximación in silico sugiere que algunos componentes podrían ser exclusivos de algunos grupos de hongos. En el segundo capítulo (3.2), describo el modelado completo y la construcción de la Plant-Pathogen Interactions Ontology (PPIO), una plataforma de carácter ontológico en el que representamos las relaciones entre entidades que se describen en área de conocimiento de las relaciones planta-patógeno. Hemos basado el modelado de PPIO en fundamentos biológicos asentados, así como en prácticas recomendadas en la construcción de ontologías; nuestra intención es hacer de PPIO un recurso clave que pueda ser usado por la comunidad investigadora vegetal. En este capítulo también discutimos la fusión de PPIO con la ontología resultante del capítulo 3.3, así como los pasos que seguimos hasta conseguir que la ontología cumpla con los principios FAIR de publicación y manejo de datos. El trabajo descrito en el tercer capítulo (3.3) aborda la transformación de una base de datos relevante en el campo de la interacción huésped-patógeno (PHI-base) y de los resultados obtenidos en el capítulo 3.1, con el objetivo de que se adhieran a los principios FAIR comentados anteriormente. La transformación de PHI-base a FAIR, denominado como Semantic PHI-base, ha sido publicada en forma de artículo en la revista Frontiers in Plant Science, siendo el primer ejemplo de repositorio de datos públicos diseñado para cumplir los principios FAIR.