Abstract:
RESUMO: A utilização de dados simulados é útil para o desenvolvimento de métodos genômicos e avaliação de cenários que seriam mais complexos com o uso de dados reais. Neste estudo, objetivou-se avaliar a eficiência da detecção de QTLs e acurácias de predição genômica, com uso de diferentes tamanhos populacionais, densidade de Chip de SNPs e estratégias de genotipagem. No Capítulo 1, os QTLs foram detectados por estudo de associação genômica ampla com uso do método single-step GWAS e abordagem do p-valor exato, com informações geradas por meio de simulações baseadas em parâmetros de dados reais de AOL. Painéis simulados de SNPs de três densidades diferentes foram utilizados com base na estrutura do genoma ovino. Animais das três últimas gerações constituíram 48 cenários propostos de acordo com o painel de SNPs, quantidade de QTLs e número de animais genotipados. O limite de significância para um conjunto de marcadores foi obtido pela correção de Bonferroni e taxa de falsa descoberta. Verificou-se que quanto maior a quantidade de animais genotipados e SNPs no painel, maior a possibilidade de detecção de associações verdadeiras entre os SNPs significativos e os QTLs simulados. Com 2.014 QTLs, os cenários com o painel de alta densidade proporcionaram maior quantidade de detecções verdadeiras. Com 114 QTLs, geralmente, observou-se pelo menos uma associação verdadeira, com picos maiores nos cenários com maior quantidade de animais. Portanto, a abordagem do p-valor exato possibilitou a detecção de pelo menos uma associação verdadeira entre SNPs e QTLs simulados. No Capítulo 2, dois painéis de SNPs (50K e 12K) foram utilizados. Diferentes tamanhos de populações de referência e validação compuseram seis cenários diferentes para cada painel. O método single-step GBLUP foi utilizado para a estimação dos efeitos dos SNPs. As estimativas de herdabilidade variaram de 0,17 a 0,38. Os maiores valores de acurácia foram obtidos com uso das estruturas de treinamento com maior quantidade de animais genotipados, enquanto os menores valores deste parâmetro foram observados nas populações com menos animais genotipados na estrutura de treinamento. Diferenças significativas foram observadas entre os diferentes tamanhos da população de treinamento, enquanto que nos cenários com o treinamento e com menor quantidade de informações de genótipos e fenótipos, não foi verificada diferença significativa entre os resultados obtidos com uso dos dois painéis. Há uma tendência de aumento da acurácia com o acréscimo de animais genotipados na população de treinamento ou referência.
ABSTRACT: The use of simulated data is essential for the development of genomic methods and evaluation of scenarios that would be unfeasible using real data. In this study, we aimed to assess the detection of QTLs associated with a phenotype like the loin eye area (LEA), as well as the efficiency of genomic selection in sheep (Ovis aries) for LEA, using simulated scenarios with different genetic structures, population sizes, and number of genotyped animals. In Chapter 1, QTLs were detected by genome-wide association study using the single-step GBLUP method and the exact p-value approach, with information generated through simulations based on parameters of real data of LEA. Simulated SNP panels of three different densities were used based on the structure of the sheep genome. Animals of the three last generations composed 48 scenarios proposed based the SNP panel, number of QTLs, and number of genotyped animals. The significance of SNP effects was obtained by the Bonferroni correction and false discovery rate. We observed that larger number of genotyped animals and higher density of SNP panels increased the possibility of detection of true associations between significant SNPs and simulated QTLs. When 2,014 QTLs were used, the scenarios with high density panel allowed a higher number of true detections. In general, when 114 QTLs were used, we observed at least one true association with higher peaks is scenarios containing larger number of animals. Therefore, the exact p-value approach allowed the detection of at least one true association between SNPs and simulated QTLs. In Chapter 2, two SNP panels (12k and 50k) were used. Different sizes of reference and validation populations composed six different scenarios for each panel. The single-step GBLUP method was used to estimate SNP effects on LEA. The prediction accuracy was obtained using the Pearson correlation between genomic estimated breeding values (GEBVs) andtrue breeding values (TBVs), as well as the regression coefficients, and bias of prediction. Heritability estimates ranged from 0.17 to 0.38. The highest values were obtained using training sets with larger number of genotyped animals, whereas the lowest values were observed when training populations containing lower number of genotyped animals were used. Significant differences were observed between scenarios with different training population sizes; however, no significant differences were observed among the results of scenarios with lower training population sizes, considering the two SNP panels evaluated. There is a trend of increasing the prediction accuracy with the addition of genotyped animals either in the training or reference populations.
Description:
Orientador: Prof. Dr. José Lindenberg Rocha Sarmento
Coorientador: Prof. Dr. Luiz Fernando Brito (Purdue University)
Examinador interno: Prof. Dr. Fábio Barros Britto
Examinador externo: Prof. Dr. Luiz Antônio Silva Figueiredo Filho (IFMA)
Examinador interno: Prof. Dr. Natanael Pereira da Silva
Examinador externo: Prof. Dr. Gleyson Vieira dos Santos