Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10451/63531
Título: | Epigenetic reprogramming by TET enzymes impacts co-transcriptional R-loops |
Autor: | Sabino, João C. |
Orientador: | Almeida, Sérgio Alexandre Fernandes de |
Palavras-chave: | Reprogramação epigenética Enzimas TET Co-transcriptional R-loops Biologia celular Teses de doutoramento - 2022 |
Data de Defesa: | Dez-2022 |
Resumo: | Transcription is an inherently mutagenic process that requires tight surveillance mechanisms to guarantee the preservation of genomic integrity. During transcription, the nascent RNA molecule can hybridize with the template DNA and form a DNA:RNA hybrid, displacing the single-stranded DNA (ssDNA). Although these triple-stranded structures, called R-loops, are physiologically relevant intermediates of several cellular processes, such as immunoglobulin class-switch recombination and gene expression, non-scheduled or persistent R-loops constitute an important source of DNA damage, namely DNA double-strand breaks (DSBs). To preserve genome integrity, cells possess diverse mechanisms to prevent the formation of R-loops or to resolve them. R-loop formation is restricted by RNA-binding proteins and topoisomerases, whereas R-loops are removed by helicases and ribonucleases, such as ribonuclease H enzymes RNase H1 and RNase H2, which degrade R-loops by digesting the RNA strand of the DNA:RNA hybrid. The concerted action of several R-loop resolving enzymes at different stages of the transcription cycle and in distinct physiological contexts is extremely important to maintain gene expression homeostasis and to prevent transcription-dependent DNA damage.
Intrinsic features of the transcribed DNA influence the propensity to form R-loops. An asymmetrical distribution of guanines (G) and cytosines (C) nucleotides in the DNA duplex, with an excess of Cs in the template DNA strand (positive G:C skew), favors R-loop formation, which is further stabilized by the establishment of G quadruplexes in the G-rich coding strand. Additionally, the negative DNA supercoiling accumulating upstream of a transcribing RNA Polymerase II (RNA Pol II) creates a local DNA unwinding that provides a window of opportunity for nascent RNA to hybridize with the template DNA, hence promoting R-loop formation.
R-loops can drive chromatin modifications that are critical for transcription regulation. Promoter-proximal R-loops enhance the recruitment of the Tip60–p400 histone acetyltransferase complex and inhibit the binding of polycomb repressive complex 2 and histone H3 lysine-27 methylation. Also, R-loops formed over G-rich terminator elements promote histone H3 lysine-9 dimethylation, a repressive mark that reinforces RNA Pol II pausing during transcription termination.
Besides affecting histone modifications, R-loops act as barriers against DNA methylation spreading into active genes. DNA methylation, namely 5-methylcytosine (5mC), results from the covalent addition of a methyl group to the carbon 5 of a C attached to a G through a phosphodiester bond (CpG). The activity of DNA methyltransferase (DNMT) enzymes makes 5mC widespread across the mammalian genome, where it plays major roles in imprinting, retrotransposon silencing, and gene expression regulation. More than 70% of all human gene promoters contain stretches of CpG dinucleotides, termed CpG islands (CGIs), whose transcriptional activity is repressed by CpG methylation.
R-loops positioned near promoters of active genes maintain CGIs in an unmethylated state, likely by reducing the affinity of DNMT1 binding to DNA, or by recruiting active DNA demethylation machinery: the ten-eleven translocation (TET) methylcytosine dioxygenases. In mammals, TET family comprises TET1, TET2 and TET3, which share the ability to oxidize 5mC to 5-hydroxymethylcytosine (5hmC), a relatively rare DNA modification found across the genome much less frequently than 5mC. TETs can further oxidize 5hmC to 5-formylcytosine (5fC) and to 5-carboxylcytosine (5caC), which engage in different pathways that lead to their replacement by native cytosine. Genome-wide, 5hmC is more abundant at regulatory regions such as promoters and exons, consistent with its role in gene expression regulation. The levels of 5hmC are enriched at active promoter regions, as observed upon activation of neuronal function-related genes in neural progenitors and neurons.
Interestingly, 5hmC has the potential to modify the DNA helix structure by favoring DNA-end breathing motion, a dynamic feature of the protein–DNA complexes thought to control DNA accessibility. Moreover, 5hmC weakens the interaction between DNA and nucleosomal H2A-H2B dimers, facilitating transient nucleosome unfolding to accommodate the passage of RNA Pol II during transcription elongation. Also, 5hmC diminishes the thermodynamic stability of the DNA duplex: while 5mC increases the melting temperature, 5hmC reduces the amount of energy needed to separate the two strands of the DNA double helix. Molecular dynamics simulations revealed that the highest amplitude of GC DNA base-pair fluctuations is observed in the presence of 5hmC, whereas 5mC yielded GC base-pairs with the lower amplitude values. 5hmC destabilizes GC pairing by alleviating steric constraints through an increase in molecular polarity, rendering the DNA more flexible and less rigid.
Because features that destabilize the DNA duplex, such as supercoiling or G-quadruplexes, are known to facilitate nascent RNA annealing with the template DNA strand, we reasoned that 5hmC may favor R-loop formation. We used an in vitro transcription model to show that the presence of 5hmC in the transcribed DNA promotes the annealing of the nascent RNA to the template DNA strand, leading to the formation of an R-loop.
This hypothesis was further tested in vivo by editing 5hmC density and assessing the consequent impact on R-loops. Indeed, depletion of the three TET enzymes, which significantly reduced cellular 5hmC levels, caused a pronounced decrease in endogenous R-loops in mouse embryonic stem (ES) and fibroblast cells. Interestingly, the results obtained with individual depletion of each single TET were much milder, suggesting that there is a partial redundancy in the activity of the three TET enzymes. Additionally, CRISPR-mediated tethering of TET to an active gene promoted the formation of R-loops. The above described effects occurred independently of changes in transcription rate, firmly pointing towards a direct impact of 5hmC on DNA:RNA annealing. Collectively, these data suggest that editing 5hmC density by changing the expression levels or the genomic distribution of TET enzymes influences R-loop formation in cells.
The interplay between 5hmC and R-loops was further strengthened by genome-wide analysis revealing a strong overlap, detected in half of all active genes, between both structures, which was validated through single-molecule co-localization techniques. Metagene plots of 5hmC and R-loops density show that overlapping of 5hmC and R-loops peaks at the transcription termination site (TTS), suggesting a dedicated role of TET activity in transcription termination by guiding the formation of R-loops. Strikingly, TET abrogation leads to significantly higher levels of readthrough transcripts genome-wide, a characteristic of defective termination. These data support a model whereby TET enzymes act upstream of R-loop formation during efficient transcription termination. Owing to the effect of 5hmC as R-loop facilitator, we also described a positive correlation between 5hmC-rich regions and DNA damage response markers, positioning 5hmC decorated loci as genomic instability hotspots.
Finally, we wanted to explore the functional impact of R-loops formed in 5hmC-rich regions. Since TETs drive the developmental DNA methylome reprogramming, the role of 5hmC on stem cell differentiation and development has been widely acknowledged. As such, we used transcriptomic data from ES cells with global R-loop suppression. Gene expression analysis revealed that depletion of R-loops specifically positioned in 5hmC-rich loci impinges most significantly on pathways that control the proliferation/ dormancy balance in ES cells. Therefore, this study discloses a putative role for R-loops, instructed by controlled 5hmC deposition, as mediators in the activation of ES cells gene expression programs. A transcrição génica é um processo inerentemente mutagénico que requer mecanismos de vigilância rigorosos de forma a garantir a integridade genómica. Durante a transcrição, a molécula de RNA nascente pode hibridar com a cadeia complementar de DNA, dando origem a um híbrido de DNA:RNA e deixando assim a cadeia de DNA codificante desemparelhada. Estas estruturas de cadeia tripla são designadas R-loops e atuam como intermediários com relevância fisiológica em vários processes celulares, tais como a recombinação da classe das imunoglobulinas ou a expressão génica. No entanto, a sua formação descontrolada e persistente constitui uma importante fonte de lesões no DNA, nomeadamente quebras na dupla cadeia de DNA (do inglês DSBs). Para preservar a integridade do genoma, as células possuem diversos mecanismos para impedir a formação de R-loops ou para os remover. Topoisomerases e proteínas de ligação ao RNA limitam a formação de R-loops, enquanto helicases e ribonucleases, como RNase H1 e RNase H2, degradam-nos através da digestão da cadeia de RNA do híbrido. A ação articulada destas enzimas em diferentes fases do ciclo de transcrição e em contextos fisiológicos distintos é crucial para manter a homeostase da expressão génica e prevenir lesões de DNA decorrentes do processo de transcrição. Características intrínsecas ao DNA transcrito influenciam a propensão para formar R-loops. Uma distribuição assimétrica de nucleótidos de guanina (G) e citosina (C) na dupla cadeia de DNA, com excesso de Cs na cadeia não codificante (enviesamento G:C positivo), favorece a formação de R-loops. Quando isso acontece, a cadeia codificante desemparelhada, rica em Gs, pode adquirir conformações quadruplas de guaninas (G- quadruplexes) que contribuem para a estabilização dos R-loops. Adicionalmente, a torção negativa que se acumula no DNA a montante de uma RNA Polimerase II (RNA Pol II) em transcrição leva a uma relaxação local do DNA, o que cria oportunidade para o RNA nascente invadir a dupla hélice e hibridar com o DNA complementar, promovendo assim a ocorrência de R-loops. Por outro lado, os R-loops também podem causar modificações na cromatina, fundamentais à regulação da transcrição. R-loops próximos de promotores potenciam o recrutamento do complexo de acetiltransferases de histonas Tip60-p400, enquanto simultaneamente inibem a ligação de complexos supressores de transcrição e impedem a metilação da lisina 27 da histona H3. Quanto às regiões de terminação, ricas em Gs, a formação de R-loops promove a dimetilação da lisina 9 da histona H3, uma modificação repressora que impõe o abrandamento da RNA Pol II durante a terminação da transcrição. Além de afetarem as modificações de histonas, os R-loops atuam como barreiras à propagação da metilação em genes ativos. A metilação do DNA, na forma de 5-metilcitosina (5mC), resulta da junção covalente de um grupo metilo ao carbono 5 de uma citosina unida a uma guanina por uma ligação fosfodiéster (CpG). Esta reação é catalisada pelas enzimas metiltransferases de DNA (DNMT), que difundem 5mC por todo o genoma dos mamíferos, onde esta modificação desempenha papéis importantes ao nível da supressão de retrotransposões, silenciamento da transcrição e regulação global da expressão génica. Por exemplo, mais de 70% dos promotores de genes humanos contêm extensões de dinucleótidos CpG, denominadas ilhas CpG (CGIs), cuja atividade transcricional é suprimida pela metilação. R-loops localizados junto a promotores de genes ativos mantêm as CGIs não metiladas, possivelmente pela redução da afinidade das enzimas DNMT ao DNA, ou pelo recrutamento de maquinaria específica de demetilação: as dioxigenases de metilcitosina designadas “translocação dez-onze” (do inglês TET). Em mamíferos, a família TET inclui as TET1, TET2 e TET3, que partilham a capacidade de oxidar 5mC em 5- hidroximetilcitosina (5hmC), uma modificação de DNA relativamente rara e muito menos frequente no genoma em comparação com 5mC. As TET conseguem ainda oxidar sequencialmente 5hmC em 5-formilcitosina (5fC) e 5-carboxilcitosina (5caC), modificações que podem seguir diversas vias com vista à sua reposição por citosina nativa. A nível genómico, verifica-se uma maior abundância de 5hmC em regiões regulatórias, tais como promotores e exões, em linha com a sua função na regulação da expressão génica. Promotores ativos apresentam enriquecimento em 5hmC, observado por exemplo aquando da ativação de programas de transcrição específicos em neurónios e progenitores neurais. Curiosamente, 5hmC tem o potencial de alterar a estrutura da hélice de DNA, favorecendo atributos dinâmicos que lhe conferem maior acessibilidade. A interação entre o DNA e o dímero de histonas nucleossomal H2A-H2B é enfraquecida por 5hmC, facilitando o desmantelamento transiente do nucleossoma necessário à passagem da RNA Pol II ao longo da transcrição. Além disso, 5hmC diminui a estabilidade termodinâmica da cadeia dupla de DNA: enquanto 5mC aumenta a temperatura de desnaturação do DNA, 5hmC reduz a quantidade de energia necessária para separar as duas cadeias. Esta modificação também tem implicações ao nível do emparelhamento de bases, como observado através de simulações de dinâmicas moleculares que revelaram uma maior amplitude de flutuações entre pares GC na presença de 5hmC, enquanto 5mC produz as amplitudes de flutuação mais baixas. 5hmC destabiliza os pares GC porque alivia limitações conformacionais através de um aumento da polaridade molecular, tornando assim o DNA menos rígido e inflexível. Uma vez que características que destabilizam a dupla hélice de DNA, tais como torções ou G-quadruplexes, facilitam a hibridação da molécula de RNA nascente com a cadeia de DNA complementar, colocámos a hipótese de que a modificação 5hmC possa também favorecer a formação de R-loops. Para testar esta possibilidade, utilizámos primariamente um modelo de transcrição in vitro, que nos permitiu concluir que a presença de 5hmC no DNA transcrito promove de facto a hibridação do transcrito produzido com o DNA, criando R-loops. O estudo desta hipótese foi então aprofundado in vivo. Para tal, alterámos a densidade de 5hmC, quer de forma generalizada através de variações nos níveis de expressão das TET, quer de forma focalizada através do direcionamento específico da sua ação enzimática, investigando posteriormente o consequente impacto nos R-loops. A depleção das três TET (e resultante redução significativa dos níveis celulares de 5hmC) causou um decréscimo acentuado de R-loops endógenos em células estaminais embrionárias e em fibroblastos de ratinho. A depleção de cada TET individualmente produziu resultados muito mais ligeiros, sugerindo a existência de uma redundância parcial na atividade das três enzimas. Adicionalmente, com recurso ao sistema CRISPR, direcionámos a actividade enzimática TET para um gene ativo específico, onde observámos aumento da ocorrência de R-loops. De salientar que os efeitos acima descritos ocorreram na ausência de alterações nos níveis de transcrição, cimentando um efeito direto da modificação 5hmC como facilitadora de híbridos DNA:RNA. A interação entre 5hmC e R-loops foi corroborada por uma análise genómica global que revelou uma forte sobreposição, verificada em metade dos genes ativos, entre ambas as estruturas, sobreposição essa que validámos através de técnicas de co-localização de moléculas individuais. A distribuição de 5hmC e R-loops ao longo do perfil dos genes mostrou que o seu pico de sobreposição ocorre na zona de terminação da transcrição (do inglês TTS), sugerindo que nesta região as TET desempenham um papel específico conducente à formação de R-loops. De facto, em células com atividade deficitária das TET, observámos um aumento significativo de transcritos que se prolongam além do TTS, chamados readthrough transcripts, característicos de um processo de terminação erróneo. Estas evidências suportam um modelo segundo o qual a ação das TET induz a formação de R-loops necessários à terminação eficiente da transcrição. Além disso, constatámos ainda que existe uma correlação positiva entre regiões ricas em 5hmC e marcadores de cromatina característicos da resposta a lesões no DNA. Dado o efeito de 5hmC como facilitador de R- loops, propomos que locais do genoma abundantes em 5hmC marcam focos de instabilidade genómica. Finalmente, quisemos explorar o impacto funcional de R-loops formados em zonas abundantes em 5hmC. Uma vez que as TET impulsionam a reprogramação do metiloma subjacente ao desenvolvimento embrionário, a marca epigenética 5hmC tem um papel amplamente reconhecido na diferenciação de células estaminais. Como tal, decidimos utilizar dados de transcritómica de células estaminais embrionárias com supressão global de R-loops. A análise da expressão génica revelou que a depleção de R-loops posicionados especificamente em locais ricos em 5hmC influencia mais significativamente vias celulares relacionadas com o controlo do equilíbrio entre proliferação e dormência de células estaminais. Assim, este estudo revela um potencial papel dos R-loops, instruídos pela deposição controlada de 5hmC, como mediadores da activação de programas de transcrição específicos em células estaminais. |
URI: | http://hdl.handle.net/10451/63531 |
Designação: | Tese de doutoramento, Ciências Biomédicas (Biologia Celular e Molecular), Universidade de Lisboa, Faculdade de Medicina, 2022 |
Aparece nas colecções: | FM - Teses de Doutoramento |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
scnd741495_td_João_Sabino.pdf | 8,84 MB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.