Tesis:
Association study of phenology, yield and quality related traits in table grapes using SSR and SNP markers
- Autor: ZAROURI, Belkacem
- Título: Association study of phenology, yield and quality related traits in table grapes using SSR and SNP markers
- Fecha: 2016
- Materia: Sin materia definida
- Escuela: E.T.S. DE INGENIEROS AGRONOMOS
- Departamentos: BIOTECNOLOGIA
- Acceso electrónico: http://oa.upm.es/43315/
- Director/a 1º: CABEZAS MARTÍNEZ, José Antonio
- Director/a 2º: ANDRÉS DOMÍNGUEZ, María Teresa de
- Resumen: The advent of cheaper high throughput genotyping technologies and the availability of large germplasm collections encouraged the extension of Genome-Wide Association Studies (GWAS) to crop plants. However, to date these strategies have not yet been tested in grapevine (Vitis vinífera L.). Taking advantage of the availability of a large grapevine germplasm collection maintained at the germplasm bank of El Encín (Alcalá de Henares, Madrid, Spain) and the relatively affordable genotyping tools, in this study we proposed to assess the feasibility of GWAS in grapevine, using both a high density Single Nucleotide Polymorphisms (SNPs) dataset and a sparse Simple Sequence Repeats (SSRs) coverage. A diversity panel of 274 grapevine accessions representing most of the cultivated grapevine gene pool was genotyped using the Genotyping by Sequencing strategy (GBS). A total of 358,454 genome-wide distributed SNPs were identified. After filtering, a reliable dataset of 36,332 SNPs across 242 individuals, with a minimum minor allele frequency (MAF) of 0.01 and an average missingness of 12%, was obtained. On the other hand, we developed a panel of multiplex PCRs (Polymerase Chain Reaction) that allowed to genotype the mapping collection for 264 genome-wide distributed SSR markers using only 45 PCRs and sequencer runs. The genetic information generated with this panel (allele size ranges, diversity parameters, presence of null alleles and ease of scoring) will serve as the basis for the identification of the most suitable loci for future microsatellite-based genetic studies in grapevine. GWAS relies on Linkage Disequilibrium (LD) to detect genotype-phenotype associations. LD across the grapevine genome was examined using both GBS-SNPs and SSR markers. SNP-based LD decayed to r2 = 0.2 within an average distance of 1 kb, with considerable variation among chromosomes (from 0.03 to 6.79 kb). Therefore, millions of SNPs would be needed to perform efficient GWAS in grapevine. Although the set of SSR markers did not allow to obtain reliable estimates of LD decay throughout the genome because of insufficient marker density, the results suggest that SSR-based LD would not extend much more than SNP-based LD. SNP-based GWAS across 21 phenotypic and agronomic traits permitted to identify genetic associations at the genome-wide Bonferroni corrected threshold for simply to moderately inherited traits such as berry color, flower sex, muscat flavor, seed content or berry size. Most of these associations overlapped with previously known quantitative trait loci (QTLs), validating hence the effectiveness of this approach, whereas others correspond to new loci that have not been identified before. Putative QTLs were also found for some traits such as ripening time, cluster architecture or berry shape and firmness. However no associations were detected for others such as flowering time or cluster length and diameter. The SSR-based association analysis allowed to detect consistent associations at the nominal significance level of 0.01 for more than one year that agree with SNP-based associations found in the present research and/or with QTLs reported in the literature, but also provided some evidence of new associations. Overall, the present research demonstrates the potential of association studies in grapevine, highlighting ad discussing strengths and weaknesses that would need to be taken into consideration in future GWAS projects. RESUMEN Las últimas innovaciones en tecnologías de genotipado de alto rendimiento y la disponibilidad de grandes colecciones de germoplasma han impulsado la realización de estudios de asociación conocidos como “Genome-Wide Association Studies” (GWAS) en las especies cultivadas. Sin embargo, hasta la fecha no se han llevado a cabo trabajos que evalúen la utilidad de este tipo de estrategias en la vid (Vitis vinífera L.). En este estudio nos propusimos comprobar la utilidad del GWAS para análisis genético en la vid, empleando para ello la colección del banco de germoplasma de vid de El Encín (Alcalá de Henares, Madrid, España) y dos aproximaciones: utilizando por un lado marcadores SNPs (Single Nucleotide Polymorphism) en alta densidad; y por otro una baja cobertura de marcadores microsatélites (SSR; Simple Sequence Repeat). Una colección de 274 accesiones de vid, que representa gran parte de la diversidad genética existente en la vid cultivada fue genotipada empleando la estrategia de Genotyping by Sequencing (GBS), lo que permitió identificar un total de 358.454 SNPs distribuidos a lo largo de todo el genoma. Tras un proceso de filtrado de datos se obtuvo un set de 36.332 SNPs de alta calidad para 242 individuos, con una frecuencia mínima del alelo minoritario (MAF) de 0,01 y una proporción media de datos perdidos del 12%. Por otro lado, se desarrolló un panel de PCRs (Polymerase Chain Reaction) multiplex que permitió analizar 264 marcadores SSRs distribuidos a lo largo del genoma de la vid empleando sólo 45 reacciones de PCR. La información genética y alélica generada con este panel (rangos de amplificación, parámetros de diversidad, presencia de alelos nulos, facilidad de genotipado) serán de gran utilidad para seleccionar los marcadores SSRs más adecuados para futuros estudios genéticos en la vid. Los estudios de tipo GWAS se fundamentan en los patrones de distribución del desequilibrio de ligamiento (LD) a lo largo del genoma. En este trabajo hemos estudiado los patrones de distribución del LD a lo largo del genoma de la vid empleando tanto marcadores de tipo SNPs como microsatélites. Los resultados demostraron que el LD basado en SNPs decae para un r2 de 0.2, dentro de una distancia media de 1 kb, aunque se observó una variación considerable entre cromosomas (de 0,03 a 6,79 kb). Por lo tanto, para desarrollar GWAS eficientemente en la vid sería necesario utilizar millones de SNPs. Aunque el análisis con SSRs no permitió obtener estimas fiables del decaimiento del LD a lo largo de todo el genoma debido a la insuficiente densidad de marcadores, los resultados indican que el LD basado en SSRs no se extendería mucho más que el LD basado en SNPs. El GWAS para 21 caracteres fenotípicos e agronómicos basado en SNPs permitió detectar asociaciones con una significación muy alta (corrección de Bonferroni) para caracteres de herencia sencilla o moderadamente compleja como el color de la baya, el sexo de la flor, el sabor amoscatelado, contenido en semillas o el tamaño de bayas. Muchas de estas asociaciones se localizan en regiones en las que estudios anteriores habían ya identificado QTLs (Quantitative Trait Loci), confirmando así la validez de los resultados obtenidos, mientras que otras corresponden a nuevos QTLs no identificados hasta la fecha. Se detectaron también posibles asociaciones para algunos caracteres, como la fecha de maduración, arquitectura del racimo o la forma y firmeza de la baya. Sin embargo, no se detectaron asociaciones para otros caracteres, como fecha de floración o longitud y diámetro del racimo. El análisis de asociación basado en SSRs permitió detectar asociaciones consistentes al nivel de significación del 0.01 para más de un año, coincidiéndose con asociaciones encontradas en el análisis con SNPs y/o con QTLs identificados en estudios anteriores. El análisis de asociación basado en SSRs también proporcionó algunas pruebas de nuevos QTLs. Como conclusión, el trabajo desarrollado demuestra el potencial de los estudios de asociación en la vid, poniendo de manifiesto sus fortalezas, pero también puntos débiles, que deberían ser objeto de especial consideración en futuros proyectos de GWAS.