| Nome: | Descrição: | Tamanho: | Formato: | |
|---|---|---|---|---|
| 7.17 MB | Adobe PDF |
Resumo(s)
As cigarras são insetos pertencentes à ordem Hemiptera e à família Cicadidae. São caracterizadas
pelos sons produzidos pelos machos durante o verão. Estes sons são produzidos por um órgão
especializado membranoso, o tímbalo. O som é produzido pelo movimento de retração e expansão de
uma membrana ligada aos músculos timbálicos. Os sons de chamamento são os mais comuns e
específicos da espécie. A especiação em cigarras pode ocorrer de várias formas, dependendo das
espécies. Em casos de alopatria pode ocorrer isolamento por distância, devido à baixa capacidade de
dispersão destes insetos; Reproductive Character Displacement em situações de simpatria; seleção
sexual (apesar de este ser um mecanismo controverso dentro da família Cicadidae); discrepâncias na
duração do ciclo de vida de diferentes espécies, alocronia. Hipoteticamente as glaciações,
especialmente os ciclos glaciares do Pleistoceno terão tido um papel na especiação de vários géneros
de cigarras. Existem evidências da ocorrência durante este período de alterações climáticas e
orográficas que causaram alterações nas áreas de distribuição dos vários grupos de cigarras e nos
tamanhos das populações, podendo ter causado o surgimento e extinção de espécies. Pouco se sabe
sobre a genómica dos diferentes grupos de cigarras em especial do ponto de vista filogenómico. A
maioria dos estudos sobre a filogenia de cigarras são feitos com base em alguns genes nucleares e em
particular o gene nuclear EF-1α. Isto limita a resolução das relações filogenéticas entre os vários taxa
por falta de informação sobre uma quantidade suficiente de genes, uma vez que, diferentes genes
poderão teoricamente ter histórias evolutivas diferentes. No entanto, estudos anteriores demonstram
que os genomas dos vários grupos de cigarras tendem a ter grandes dimensões o que pode contribuir
para a dificuldade em estudá-los globalmente pelo aumento dos custos financeiros e temporais do
processo de sequenciação. Apenas três estudos filogenómicos de cigarras foram encontrados na
literatura, dois utilizando o método de sequenciação RAD-seq o mais recente recorrendo ao método de
sequenciação anchored hybrid enrichment. A presente dissertação debruça-se sobre o estudo do género
Tettigettalna. Este género é constituído por dez espécies, oito das quais endémicas da Península
Ibérica. Segundo estudos anteriores baseados na sequenciação das regiões 5’ e 3’ do gene mitocondrial
citocromo c oxidase I (COI) e do gene mitocondrial ATPase e do gene nuclear 1α-EF, a primeira
espécie a formar-se terá sido Tettigettalna josei há cerca de sete milhões de anos, seguida de
Tettigettalna afroamissa cerca de dois milhões de anos depois. Os mesmos estudos ainda sugerem
uma diversificação rápida (radiação), provavelmente durante o Pleistoceno. Apesar de as diferentes
espécies estarem acusticamente bem diferenciadas entre si os estudos filogenéticos realizados com
base nas regiões 5’ e 3’ do gene mitocondrial COI e o gene mitocondrial ATPase e no gene nuclear
1α-EF não permitem resolver o complexo de espécies formado por Tettigettalna mariae, Tettigettalna
argentata e Tettigettalna aneabi nem a politomia formada pelas duas subespécies Tettigettalna
helianthemi helianthemi e Tettigettalna helianthemi galantei e os tipos Tettigettalna helianthemi
galantei tipo I e Tettigettalna helianthemi galantei tipo II. É também desconhecida uma justificação
para o grau de estruturação populacional encontrado para as espécies Tettigettalna helianthemi e
Tettigettalna defauti o qual é maior do que o esperado para a reduzida área de distribuição destas
espécies. Além disso, também o impacto das glaciações do Pleistoceno na evolução das espécies
endémicas do género é parcamente conhecido.
Assim, a presente dissertação tem como objetivos biológicos, (i) a reconstrução das relações
filogenómicas entre grupos taxonómicos do género Tettigettalna, (ii) a datação dos eventos de
divergência das várias espécies em relação aos ciclos glaciais do Pleistoceno e (iii) finalmente taxonómicos.
Para o cumprimento destes objetivos utilizou-se um conjunto de dados de RAD-seq.
Deste modo executou-se o controlo de qualidade das sequências multiplexadas e compararam-se os
assemblers ipyrad e Stacks para diferentes combinações de parâmetros por forma a identificar qual
dos dois softwares e qual a combinação de parâmetros que otimizam o número de SNPs, a quantidade
de missing data e o tempo de computação do processo de assembly.
O ipyrad identificou menos SNPs do que o Stacks na lane 1. Contudo, após a filtragem de acordo
com a quantidade máxima de missing data por locus e a minor allele frequency por locus, o ipyrad
manteve mais loci do que o Stacks em ambas as lanes. No que diz respeito à quantidade de missing
data identificada por cada um dos dois programas os resultados foram praticamente concordantes,
finalmente o tempo de computação do ipyrad foi significativamente menor do que o Stacks. Assim
o ipyrad foi selecionado para ser utilizado nas restantes análises.
Seguidamente, foi construída uma árvore filogenética, utilizando o programa RaxML-NG, de forma a
averiguar as relações de proximidade entre os indivíduos. Verificou-se que os indivíduos se agrupavam
não de acordo com os grupos taxonómicos em que estavam classificados, mas sim de acordo com a
lane em que tinham sido sequenciados, tornando evidente que as duas lanes são incomparáveis entre
si. Daí em diante as duas lanes foram analisadas em separado. As análises filogenéticas feitas com as
lanes em separado também não revelaram um agrupamento de acordo com as classificações
taxonómicas. Tendo em conta estes resultados e de modo a permitir uma comparação entre a presente
dissertação e estudos anteriores que analisaram a diferenciação entre as subespécies de Tettigettalna
helianthemi e os tipos em que se subdivide a subespécie Tettigettalna helanthemi galantei, as restantes
espécies da lane 1 foram eliminadas das análises seguintes.
Para averiguar a existência de estruturação populacional foram efetuadas para cada lane uma PCA e
uma análise de admixture, através do programa Structure. Nenhuma destas análises revelou
resultados biologicamente conclusivos. Finalmente, foram executadas análises de seleção pairwise
analisando pares de espécies em que o som é a única característica que permite a distinção entre as
duas espécies de cada par. Estas análises foram executadas recorrendo aos programas BayeScan e
SelEstim. Nenhum dos softwares obteve resultados biologicamente conclusivos.
A impossibilidade de interpretar biologicamente os resultados obtidos poderá ser devida a um artefacto
técnico de falta de representação da maior parte do genoma que impede que as sequências que
diferenciam as espécies de serem analisadas, pelo facto de não terem sido sequenciadas, e pela
ocorrência de fenómenos de paralogia em que reads pertencentes a diferentes loci com sequências
similares alinham como pertencendo a um mesmo loci. Estes artefactos são em parte justificáveis pelo
grande tamanho do genoma (9.8Gbp).
No entanto, a presente dissertação permitiu observar o impacto de um genoma de grandes dimensões
(apesar de não serem consideradas gigantescas) nos resultados de análises de genómica populacional,
filogenómica e deteção de seleção tendo várias espécies do género Tettigettalna como modelos. Isto
tornará possível que o género Tettigettalna e outros com genomas de dimensões similares sirvam dde
termo de comparação intermédio entre genomas considerados pequenos e genomas considerados gigantes contribuindo assim para a resolução de controvérsias sobre as causas e consequências da
evolução do tamanho do genoma e o impacto desta característica em fenótipos atuais alguns dos quais
podem afetar a vida humana através da agricultura ou das pescas como é o caso da variação da
capacidade de invasão de diferentes espécies invasoras.
Efetuar a assembly do genoma contra um genoma de referência ou a utilização de tecnologias de
sequenciação que permitam a obtenção de reads mais longas e em maior quantidade poderá evitar a
falta de representação do genoma. A ocorrência de parálogos pode ser minimizada através da
utilização de assemblers com a capacidade de eliminar potenciais parálogos.
Concluindo, apesar de não ter sido possível atingir os objetivos biológicos propostos para a realização
da dissertação as análises executadas permitem formular hipóteses sobre como lidar com genomas de
grande dimensão do ponto de vista técnico, permitindo uma contribuição não só para futuros estudos
sobre genómica e em particular da genómica evolutiva do género Tettigettalna mas também sobre
problemáticas mais vastas relativas a todos os níveis de organização biológica como as causa e
consequências da evolução do tamanho do genoma ao longo da História da vida e o impacto presente
desta característica em fenótipos morfológicos, fisiológicos e ecológicos dos grupos taxonómicos
atuais.
Cicadas belong to the order Hemiptera and the family Cicadiade. They are characterised by the sounds produced by males, the calling songs, which are species-specific. Little is known about the genomics of cicadas. The present study focuses on the genomics of the cicada genus Tettigettalna. Tettigettalna is composed of ten species, eight endemic to the Iberian Peninsula. Previous phylogenetic analyses left the relationships among some taxonomic groups unresolved and doubts about the population structure of others and the impact of the Pleistocene glacial cycles on the evolution of the genus. The biological objectives of this dissertation are, (i) to reconstruct the phylogenomic relationships among the Tettigettalna taxonomic groups based on nuclear DNA markers; (ii) to compare the divergence timings of the various taxonomic groups with the timing of the Pleistocene glaciations; (iii) attempt to identify loci potentially under selection which justify the differentiation of the different taxonomic groups. Phylogenetic trees with the individuals as taxa were built to understand the individuals' genomic proximity. These analyses revealed that individuals did not group according to their taxonomic classification. To study the differentiation and populational structure of the various taxonomic groups PCA and Structure analyses were performed. Once more, the individuals did not group according to their taxonomic groups or any biologically interpretable pattern. To identify loci potentially under selection that could explain the taxonomic groups' differences, selection detection analyses were executed comparing two softwares, BayeScan and SelEstim. They presented contradictory results concerning the number of potential loci under selection, which in both cases are unlikely to have a biological justification. The unexpected results may be due to poor genome representation and paralogy phenomena, at least partly caused by the large 9.8Gbp genome of the Tettigettalna genus. This allows the study of genome size’s impact on analysis outcomes.
Cicadas belong to the order Hemiptera and the family Cicadiade. They are characterised by the sounds produced by males, the calling songs, which are species-specific. Little is known about the genomics of cicadas. The present study focuses on the genomics of the cicada genus Tettigettalna. Tettigettalna is composed of ten species, eight endemic to the Iberian Peninsula. Previous phylogenetic analyses left the relationships among some taxonomic groups unresolved and doubts about the population structure of others and the impact of the Pleistocene glacial cycles on the evolution of the genus. The biological objectives of this dissertation are, (i) to reconstruct the phylogenomic relationships among the Tettigettalna taxonomic groups based on nuclear DNA markers; (ii) to compare the divergence timings of the various taxonomic groups with the timing of the Pleistocene glaciations; (iii) attempt to identify loci potentially under selection which justify the differentiation of the different taxonomic groups. Phylogenetic trees with the individuals as taxa were built to understand the individuals' genomic proximity. These analyses revealed that individuals did not group according to their taxonomic classification. To study the differentiation and populational structure of the various taxonomic groups PCA and Structure analyses were performed. Once more, the individuals did not group according to their taxonomic groups or any biologically interpretable pattern. To identify loci potentially under selection that could explain the taxonomic groups' differences, selection detection analyses were executed comparing two softwares, BayeScan and SelEstim. They presented contradictory results concerning the number of potential loci under selection, which in both cases are unlikely to have a biological justification. The unexpected results may be due to poor genome representation and paralogy phenomena, at least partly caused by the large 9.8Gbp genome of the Tettigettalna genus. This allows the study of genome size’s impact on analysis outcomes.
Descrição
Tese de Mestrado, Biologia Evolutiva e do Desenvolvimento, 2024, Universidade de Lisboa, Faculdade de Ciências
Palavras-chave
Tettigettalna Filogenómica RAD-seq Tamanho do Genoma Teses de mestrado - 2024
