Repository logo
 
Publication

Functional analysis of epigenetic differentially methylated regions in the context of rare diseases

datacite.subject.fosDepartamento de Biologia Vegetalpt_PT
dc.contributor.advisorDefrance, Matthieu
dc.contributor.advisorCarvalho, Margarida Henriques da Gama, 1972-
dc.contributor.authorMacedo, Catarina Zorro Nobre Mesquita
dc.date.accessioned2024-06-21T14:39:17Z
dc.date.available2024-06-21T14:39:17Z
dc.date.issued2024
dc.date.submitted2024
dc.descriptionTese de mestrado, Biologia Molecular e Genética , 2024, Universidade de Lisboa, Faculdade de Ciênciaspt_PT
dc.description.abstractA epigenética consiste no estudo de todas as mudanças que afetam a expressão génica (e o transcritoma) sem alterar a sequência do DNA, transmitidas por mitose e meiose. Ao conjunto de todas as modificações epigenéticas ocurrentes ao longo do tempo num organismo, dá-se o nome de epigenoma. Este é dinâmico e influenciado por fatores genéticos e ambientais. Os mecanismos de modificação epigenética podem dividir-se em três, que colaboram entre si, contribuindo para um desenvolvimento normal. Dois afetam a transcrição controlando a acessibilidade dos fatores de transcrição (TFs) ao DNA, sendo estes a metilação do DNA (DNAm) e modificações nas histonas. As modificações das histonas alteram a estrutura da cromatina para estruturas mais relaxadas – eucromatina – ou mais constritas – heterocromatina – as quais facilitam ou dificultam o acesso dos TFs ao DNA, respetivamente. A DNAm consiste na transferência covalente de um grupo metilo do S-adenosil metionina ao carbono-5 de uma citosina, catalisada por DNA metiltransferases. A metilcitosina (5-mC) está presente em 4% do genoma humano, maioritariamente em contextos CG (CpGs) nos animais. Estes tendem a aglomerar-se formando regiões chamadas ilhas CpGs (CGIs), que os protege da metilação. Cerca de metade dos CpGs localiza-se nos promotores génicos, perto dos locais de iniciação de transcrição (TSS), e o resto distribui-se por regiões intergénicas (IGRs) ou no corpo génico. No genoma humano, mais de 80% dos CpGs estão metilados, excluindo os promotores e enchancers de genes ativamente expressos. Promotores ou enhancers densamente metilados associam-se à heterocromatina e repressão da expressão génica. Contrariamente, a metilação dos CpGs no corpo génico favorece a transcrição. As tecnologias de deteção da DNAm englobam tecnologias baseadas no pré-tratamento do DNA com bisulfito e tecnologias de sequenciamento de terceira geração como o nanopore. Na deteção com bisulfito, é aplicado bisulfito ao DNA desnaturado, convertendo as citosinas não metiladas em uracilo, e deixando as citosinas metiladas intactas. Depois, para análises envolvendo todo o genoma, são utilizados normalmente microarrays genómicos, como o Illumina Infinium Human Methylation 450 BeadChip (HM450) e o Illumina Infinium Methylation EPIC BeadChip (EPIC). Estes contêm milhares de micropérolas, cada uma contendo centenas de cópias de sondas oligonucleotídicas complementares a citosinas metiladas e não metiladas em CpGs específicos. Depois da conversão bisulfito e amplificação por PCR, os fragmentos de DNA hibridizam com as sondas, e o sinal de intensidade medido para cada CpG reflete o seu nível de metilação. O HM450 cobra um total de 485 577 CpGs distribuídos nos promotores, 5UTRs, corpo génico e 3UTRs, cobrando 96% das CGIs. O EPIC é um microarray mais atualizado, cobrando 850 000 CpGs. Mutações em genes codificantes de proteínas envolvidas nas modificações epigenéticas são causadores de Distúrbios Mendelianos da Máquina Epigenética (MDEMs). MDEMs incluem distúrbios do neurodesenvolvimento (NDDs), caraterizados por alta comorbidade e problemas cognitivos, comportamentais e/ ou motores desde a infância até ao fim da vida. Também podem incluir malformações dos membros, retardamento do crescimento ou crescimento excessivo, e problemas no sistema imunitário. O diagnóstico começa com uma avaliação clínica dos sintomas, seguida de testes genéticos. Estes podem ser direcionados a um gene/ conjunto de genes de interesse, a uma avaliação de desequilíbrios cromossómicos ou um sequenciamento total do exoma ou do genoma. No entanto, um diagnóstico pode demorar 1-8 anos, e 50-66% dos indivíduos permanece não diagnosticado. Assim, uma análise do metiloma surgiu como um teste especialmente útil no diagnóstico destes casos. As mutações génicas relacionadas com MDEMs provocam padrões de DNAm ao longo do genoma caraterísticos da mutação subjacente, denominadas assinaturas epigenéticas (esigs). Estas têm vindo a ser utilizadas como biomarcadores no diagnóstico de várias MDEMs, e no estudo dos mecanismos da doença afetados por estes padrões de metilação. O uso de esigs depende de modelos de aprendizado de máquina (ML). O metiloma analisado provém normalmente de amostras de sangue periférico de indivíduos com diagnóstico clínico validado e portadores da variante patogénica respetiva. O resultante conjunto de citosinas diferentemente metiladas (DMCs) é dividido em grupos de treino e de teste, que são aplicados a modelos de ML supervisionados. O grupo de treino é treinado para dar a probabilidade da amostra pertencer a um indivíduo afetado. O grupo de teste avalia o desempenho do modelo treinado, incluindo a precisão, sensibilidade e especificidade. O modelo também é normalmente validado utilizando um conjunto de amostras independente. Nesta tese, foram comparados os conjuntos de DMCs pertencentes a dois modelos de esigs de três NDDs: CHARGE, Kabuki e Sotos. Estes são maioritariamente causados por mutações nos genes CHD7, KMT2D e KDM6A (Kabuki I e II), e NSD1, respetivamente. Estes modelos foram desenvolvidos por dois grupos de investigação liderados por Sadikovic e Weksberg. A comparação consistiu em analisar a distribuição genómica dos DMCs e os processos biológicos (BPs) em que os genes diferentemente metilados (DMGs) estavam envolvidos e qual a sua relação com as manifestações clínicas. As CHARGE-esigs consistiram em DMCs maioritariamente distribuídas no corpo génico e IGRs. Os BPs consistiram no desenvolvimento embriónico dos sistemas esqueléticos e circulatórios, cérebro, especificação do eixo anteroposterior, regulação transcricional, proliferação celular, sinalização do receptor do tipo Toll e adesão celular. Estes relacionam-se com alguns sintomas do CHARGE, a exemplo, escoliose, defeitos no septo atrioventricular, excesso de fluido cerebrospinal, e mudanças na adesão de células da crista neural (NCCs). Os genes com maiores valores diferenciais de metilação – valores ∆β – foram o HOXA5 e HOXA-AS3 (hipermetilados) e HOTAIRM1, HOXA1, e SLITRK5 (hipometilados) à semelhança de estudos prévios, também como LINC02914 (hipometilado). Aqueles envolvidos em vias moleculares do desenvolvimento foram o HOXA1 (especificação das NCCs e desenvolvimento do coração e ouvido), SLITRK5 (sinapses e neurogénese), HOXA5 (inervação do diafragma), APP (neurogénese, sinaptogénese e adesão celular), COL4A2 (vascularização cerebral), GFI1 (diferenciação ciliar do ouvido interior), NOX4 (protetor do coração aquando elevada pressão sanguínea), KIRREL3 (mediador sináptico, com variantes associadas a hipoplasia cerebelar), DAB1 (processo cognitivo), ARHGEF15 (vascularização neoretinal), FOXP2 (desenvolvimento craniofacial) e PARVA (desenvolvimento do septo cardíaco). As Kabuki-esigs consistiram em DMCs maioritariamente distribuídos no corpo génico. No grupo de Sadikovic, os DMGs estavam envolvidos no metabolismo e transporte transmembranar de lípidos, regulação da transcrição, fagocitose, morte e proliferação celular, e desenvolvimento do nervo cranial V. Estes relacionam-se com o Kabuki. O KMT2D participa no metabolismo lipídico, e a sua perda de função rompe o ciclo de proliferação celular e promove a atrofia do tronco cerebral (que engloba o nervo cranial V). No grupo Weksberg, os BPs estavam envolvidos na apoptose, desenvolvimento esquelético e glândula mamária, especificação anteroposterior, angiogénese, transporte da leucina e prolina, adesão e senescência celular e regulação do movimento ciliar. No Kabuki, há aumento dos processos apópticos, desenvolvimento mamário precoce, defeitos na angiogénese (ex: defeito do arco aórtico), ciliopatias (ex: hidrocefalia) e escoliose. A prolina é abudante nas sinapses e a leucina ativa a secreção de insulina, sendo hipoglicémia uma manifestação rara do Kabuki. Os genes mais diferentemente metilados consistiram no ZMIZ1 (hipermetilado), e TNS1, AGAP2 e AGAP2-AS1 (hipometilados). Aqueles envolvidos no desenvolvimento foram o ZMIZ1 (gene candidato do Kabuki e participante da diferenciação neuronal e da glia), LAMA1 (desenvolvimento vascular retinal e adesão da célula de copo óptico, podendo relacionar-se com a falta de vista no Kabuki), ARHGEF7 (sinaptogénese, com haploinsuficiência em casos de deficiência intelectual ou ID), RPS6 (envolvida em retardamento do crescimento fetal), MXRA8 (maturação da barreira hematoencefálica), ESR1 (ligante do KMT2D; relacionado com hipospadias e diferenciação glandular mamária), CNTN5 (sinapses, relacionado com autismo, raro no Kabuki) e KIRREL3 (variantes envolvidas no autismo e ID). Finalmente, na Sotos-esig, os DMCs distribuíram-se maioritariamente no corpo génico, seguido por IGRs e promotores, e perfil totalmente hipometilado. Os BPs estiveram enriquecidos em vias biológicas de migração e crescimento dos fibroblastos, morfogénese de estruturas ramificadas, proliferação celular, assemblamento dos nucleossomas e regulação da sinalização MAPK no grupo Sadikovic. No Sotos, há relatórios de atividade diminuída da cascada MAPK relacionada com o crescimento excessivo e proliferação celular desregulada. Na esig de Weksberg, diversos processos de regulação, desenvolvimento, transporte, metabolismo, vias de sinalização e adesão celular estiveram enriquecidos. Destacam-se as sinaléticas Wnt (desregulação envolvida no crescimento excessivo) e BMP (essencial em etapas iniciais do desenvolvimento), desenvolvimento esquelético e da pele, e desenvolvimento do sistema nervoso e transporte de neurotransmissores, relacionados com ID. Os DMGs de topo foram os PCAT6 e KDM5B. Aqueles envolvidos no desenvolvimento foram o KDM5 (diferenciação de células progenitoras neuronais), ZPR1, MIR200B, H4C1 (microcefalias e deficiência intelectual ou ID), ITGA2B (sépsis, por vezes presente em recém-nascidos com Sotos), TP73, TPPP3 (desenvolvimento musculoesquelético e regeneração axonal), TET1 (reprogramação epigenética), LDB3 (miopatias relacionadas com dismorfismo facial do Sotos), CERS2 (defeitos mielínicos), SFN, HLX, HYAL2 (variantes em dismorfismo facial), CXCL12 (neurogénese; variantes em NDDs), TDGF1 (defeitos no coração) , VAX2, DDR1 (formação mielínica), NOTCH4 (cardiomiopatias), ACSL6 (produção do ácido docosahexaenóico, protetor neuronal), DLX3 (desenvolvimento craniofacial; sobreexpressão na preclampsia presente no Sotos), CREB3L1 (osteogénese imperfeita relacionada com idade óssea avançada no Sotos), GAB1, FOXL1 (desenvolvimento cerebral), RD3, GIT1 (sinapses), RASIP1, BBS4, COLI2A1 (causativo de um distúrbio do tecido conetivo e muscular), NCS1 (diferentemente expresso em NDDs), e o ZNF423 (neurogénese). Esta análise funcional pode ser utilizada no desenvolvimento de modelos de esigs mais robustos e mais relacionados com as caraterísticas do síndrome.pt_PT
dc.description.abstractEpigenetics consists of modifications affecting gene expression (and transcriptome) without affecting the DNA sequence. Cytosine methylation is the most prevalent modification. Mutations of genes involved in the epigenetic machinery create DNA methylation (DNAm) patterns - episignatures (esigs) – that lead to differential expression of several genes. These patterns form in early embryo development and are thought to cause Mendelian neurodevelopmental disorders (NDDs). This thesis focused on CHARGE, Kabuki and Sotos rare NDDs, caused by mutations in CHD7, KMT2D or KDM6A (Kabuki subtypes) and NSD1, respectively, which create specific patterns of differentially methylated cytosines (DMCs). A functional analysis of a pair of esigs (DMCs set) from Sadikovic and Weksberg research groups for each syndrome was performed to compare genic distribution, see differentially methylated genes (DMGs), main affected biological processes (BPs) and link to clinical manifestations. The least differences were of CHARGE-esigs. In Kabuki and Sotos, however, the Weksberg results were more aligned with the clinical manifestations in the BP enrichment analysis. In CHARGE, the top DMGs were homeobox and related genes (HOXA5, HOXA-AS3, HOTAIRM1 and HOXA1), LINC02914 and SLITRK5. Those involved in developmental pathways were HOXA1, SLITRK5, HOXA5, APP, COL4A2, GFI1, NOX4, KIRREL3, DAB1, ARHGEF15, FOXP2 and PARVA. In Kabuki, top DMGs were ZMIZ1, TNS1, AGAP2 and AGAP2-AS1. Those of developmental pathways were ZMIZ1, LAMA1, ARHGEF7, RPS6, MXRA8, ESR1, CNTN5 and KIRREL3. In Sotos, the top DMGs were PCAT6 and KDM5B. DMGs in developmental pathways were KDM5, ZPR1, MIR200B, H4C1, ITGA2B, TP73, TPPP3, TET1, LDB3, CERS2, SFN, HLX, HYAL2, CXCL12, TDGF1, VAX2, DDR1, NOTCH4, ACSL6, DLX3, CREB3L1, GAB1, FOXL1, RD3, GIT1, RASIP1, BBS4, COLI2A1, NCS1, and ZNF423. Together, this analysis paves the way for improvement on the classification models for studying DNAm patterns by selecting the most relevant CpGs, and provides a better understanding of the disorder mechanisms.pt_PT
dc.identifier.tid203683358
dc.identifier.urihttp://hdl.handle.net/10451/65087
dc.language.isoengpt_PT
dc.subjectCHARGEpt_PT
dc.subjectKabukipt_PT
dc.subjectSotospt_PT
dc.subjectassinaturas epigenéticaspt_PT
dc.subjectTeses de mestrado - 2024pt_PT
dc.titleFunctional analysis of epigenetic differentially methylated regions in the context of rare diseasespt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameTese de mestrado em Biologia Molecular e Genéticapt_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
TM_Catarina_Macedo.pdf
Size:
6.36 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.2 KB
Format:
Item-specific license agreed upon to submission
Description: