Loading...
Research Project
Making sense of antisense transcription
Funder
Authors
Publications
RNA polymerase II phosphorylated on CTD serine 5 interacts with the spliceosome during co-transcriptional splicing
Publication . Nojima, Takayuki; Rebelo, Kenny; Gomes, Tomás; Grosso, Ana Rita; Proudfoot, Nicholas J.; Carmo-Fonseca, Maria
The highly intronic nature of protein coding genes in mammals necessitates a co-transcriptional splicing mechanism as revealed by mNET-seq analysis. Immunoprecipitation of MNase-digested chromatin with antibodies against RNA polymerase II (Pol II) shows that active spliceosomes (both snRNA and proteins) are complexed to Pol II S5P CTD during elongation and co-transcriptional splicing. Notably, elongating Pol II-spliceosome complexes form strong interactions with nascent transcripts, resulting in footprints of approximately 60 nucleotides. Also, splicing intermediates formed by cleavage at the 5' splice site are associated with nearly all spliced exons. These spliceosome-bound intermediates are frequently ligated to upstream exons, implying a sequential, constitutive, and U12-dependent splicing process. Finally, lack of detectable spliced products connected to the Pol II active site in human HeLa or murine lymphoid cells suggests that splicing does not occur immediately following 3' splice site synthesis. Our results imply that most mammalian splicing requires exon definition for completion.
Pharmacological inhibition of the spliceosome subunit SF3b triggers EJC-independent NMD
Publication . Carvalho, Teresa; Martins, Sandra; Rino, José; Marinho, Sérgio; Carmo-Fonseca, Maria
Spliceostatin A, meayamycin, and pladienolide B are small molecules that target the SF3b subunit of the spliceosomal U2 small nuclear ribonucleoprotein (snRNP). These compounds are attracting much attention as tools to manipulate splicing and for use as potential anti-cancer drugs. We investigated the effects of these inhibitors on mRNA transport and stability in human cells. Upon splicing inhibition, unspliced pre-mRNAs accumulated in the nucleus, particularly within enlarged nuclear speckles. However, a small fraction of the pre-mRNA molecules were exported to the cytoplasm. We identified the export adaptor ALYREF as being associated with intron-containing transcripts and show its requirement for the nucleo-cytoplasmic transport of unspliced pre-mRNA. In contrast, the exon junction complex (EJC) core protein eIF4AIII failed to form a stable complex with intron-containing transcripts. Despite the absence of EJC, unspliced transcripts in the cytoplasm were degraded by nonsense-mediated decay (NMD), suggesting that unspliced transcripts are degraded by an EJC-independent NMD pathway. Collectively, our results indicate that although blocking the function of SF3b elicits a massive accumulation of unspliced pre-mRNAs in the nucleus, intron-containing transcripts can still bind the ALYREF export factor and be transported to the cytoplasm, where they trigger an alternative NMD pathway.
The role of antisense transcription on regulation of gene expression
Publication . Luís, Rui Sérgio de Sousa; Fonseca, M. Carmo,1959-; Couto, Francisco José Moreira
Uma explosão no número de transcritos que não codificam para proteínas tem sido registada nos últimos anos, muito justificada pela utilização de técnicas de alto rendimento de sequenciação. Apesar da sua abundancia, a função de muitos deles ainda permanece desconhecida. Uma das classes de RNAs não codificantes são os transcritos contra-sentido, que são transcritos na cadeia de DNA oposta a dos genes codificadores (PC) aos quais estão associados. Esta proximidade sugere uma possível função reguladora entre ambas as unidades transcricionais. E hoje sabido que um elevado numero de regiões promotoras de genes apresenta transcrição bidirecional, dando origem a transcritos divergente não codificantes de proteínas. A transcrição contra sentido convergente (NATs) é também comum, mas a sua relevância biológica permanece muito menos compreendida. Várias análises efectuadas contemplando todo o genoma indiciam que a expressão dos NATs leva a uma repressão da expressão dos genes PC sobrepostos. Contudo, recentemente foi estudado um destes pares no nosso laboratório – ZEB2 / ZEB2-NAT – o qual apresentou uma dinâmica oposta a generalidade dos pares descritos na literatura, aumentando os níveis de mRNA quando o NAT e expresso. O ZEB2-NAT (transcrito contrasentido) e transcrito a partir do primeiro intrão do gene ZEB2 (gene codificador para proteínas), terminado a montante do início de transcrição deste. Outros pares, como VIM / VIM-AS1 e SPHK1 / LncRNA Khps1 apresentam os seus elementos contra-sentido a serem transcritos igualmente a partir do primeiro intrão, demonstrando uma correlação positiva face a sua expressão, semelhante ao par estudado no nosso laboratório. Estas evidências levaram-me a perguntar quantos pares havia no genoma humano numa disposição semelhante, e se a sua expressão também aumentaria os níveis dos PC sobrepostos. Para responder a esta questão, baseado nas anotações Ensembl, selecionei pares expressos com uma disposição semelhante aos referidos anteriormente, utilizando RNA-seq da fracção da cromatina, em células HeLa. Nesta identificação foram usados limites de 2 e 1 TPMs (Transcripts per Kilobase Milion) , acima dos quais eram considerados expressos os transcritos de PC e contra-sentido, respectivamente. Apos o trimming com o software Cutadapt e o alinhamento com o Hisat2, efectuei a quantificação de reads com o software StringTie, do qual foram obtidos os valores de TPMs. Daqui, um conjunto de 97 pares foram selecionados como tendo ambas as unidades transcricionais expressas. Seguidamente, realizei uma curação manual, na qual apliquei dados de mammalian native elongating transcript sequencing (mNET-seq), os quais revelaram o sinal da pausa da RNA polimerase junto dos promotores dos transcritos contra-sentido, permitindo aceitar ou rejeitar os pares anteriormente identificados de forma automática. Nesta técnica são sequenciados os RNAs que se encontram a ser transcritos pela RNA Polimerase II, havendo uma selecção pelo estado de fosforilação dos diferentes aminoácidos (UnPh, Y1P, S2P, Th4, S5P, S7P) do domínio Carboxi-terminal (CTD) deste complexo proteico. Era desconhecido para os transcritos contra sentido qual o estado de fosforilação que caracterizava a sua transcrição. Por este motivo analisei inicialmente todas os estados. Na analise efetuada não foram detetadas diferenças nos sinais de CTD da RNA polimerase II entre a transcrição de PCATs e PC, sendo igualmente detetado um forte sinal para os anticorpos associados aos estados Y1P e UnPh da RNA polimerase II. Estes elevados níveis foram cruciais para a identificação de PCATs expressos e não expressos. Esta estratégia de busca permitiu a identificação de 65 pares de unidades transcricionais, nos quais ambos os transcritos eram expressos. Aos elementos não codificantes destes pares atribuímos o nome de promoter-proximal convergent antisense transcripts (PCATs). Após a sua identificação realizei uma caracterização da classe PCAT. Esta análise começou por verificar os níveis de poliadenilação destes transcritos, por comparação a outras classes de genes, para os quais esta modificação pós-transcricional esta bem caracterizada. Para tal, utilizei dois conjuntos de dados de RNA-seq da fração nucleoplasmática. Num deles foram selecionados e sequenciados reads pertencentes a transcritos poliadenilados, enquanto para um segundo, reads de transcritos não poliadenilados. Os meus resultados mostram que para a classe PCAT a abundância relativa de reads pertencentes a transcritos poliadenilados é superior à de não poliadenilados. Observação similar a encontrada em genes PC, os quais sabemos que sofrem esta modificação. Os rácios entre reads poadeniladas / não-poliadeniadas são similares entre PCATs e PCs, o que dita uma poliadenilacao eficiente por parte desta nova classe em estudo.
Sabendo que um elevado número de transcritos não codificadores de proteína são mantidos no núcleo e degradado neste compartimento, decidi analisar os níveis de degradação dos PCATs na fração da cromatina e do nucleoplasma pelo exossoma nuclear. Para tal, recorri a dados de RNA-seq das frações de cromatina e nucleoplasma de células HeLa com knock-down (KD) do exossoma. Por comparação a células wild type, demonstrei que os PCATs são estáveis enquanto ligados a cromatina, não apresentando diferenças entre os dois grupos. Quando analisados os dados de nucleoplasma foi possível concluir que a abundância dos PCATs quando feito KD do exossoma nuclear era superior. Esta observação indica que este complexo enzimático tem um efeito de degradação sobre a classe em estudo na fração nucleoplasmática, nao observada na cromatina. Desta forma, os dados sugerem uma possível função preferencial dos PCATs na fração da cromatina, comparativamente a do núcleo plasma.
De modo a entender possíveis efeitos da presença destes transcritos na cromatina, recorrendo a dados de ChIP-seq do ENCODE project, estudei a modificação de vários aminoácidos das projeções de histones e proteínas associadas ao DNA (CTCF, EZH2, H2A.Z, H3K27ac, H3K27me3, H3K36me3, H3K4me1, H3K4me2, H3K4me3, H3K79me2, H3K9ac, H3K9me3, H4K20me1 e RNA Polymerase II) em regiões onde os PCATs são expressos. Das várias modificações estudadas, as acetilações H3K9ac e H3K27ac demonstraram estar mais presentes quando os PCATs são expressos, em comparação a regiões que não expressam estes transcritos não codificadores para proteínas. Estas marcas estão intimamente ligadas a ativação de genes e a descompactação do DNA. Desta forma, estes resultados apontam para um efeito regulador sofre a cromatina por parte dos PCATs, podendo levar a uma sobre expressão dos genes PC sobrepostos. Por fim, com dados de RNA-seq da fração da cromatina, previamente usados para a identificação dos PCATs, comparei os níveis de mRNAs para PC com PCATs expressos e não expressos. Desta análise conclui que para PC com PCATs anotados, os níveis de mRNAs são mais elevados aquando da sua expressão. Verificamos ainda que os níveis de expressão de genes sem PCATs anotados são semelhantes aos encontrados para aqueles que tem PCATs expressos, sugerindo que certas regiões no genoma necessitam da expressão destes transcritos para terem níveis de expressão semelhantes aos genes convencionais. Deste trabalho surtiu a descoberta de 65 pares de transcritos semelhantes ao par previamente estudado no nosso laboratório - ZEB2 / ZEB2-NAT. Alem disso, os meus resultados apontam que os PCATs identificados têm um poder regulador sobre os PC sobrepostos, idêntico ao ZEB2-NAT. Contudo, o estudo destes pares em laboratório vai ser essencial, não só para confirmar este poder regulador mas também para entender o seu mecanismo de ação. Os resultados obtidos neste trabalho levam-me a propor os PCATs como uma nova classe reguladora de RNA não codificantes.
Organizational Units
Description
Keywords
Contributors
Funders
Funding agency
Fundação para a Ciência e a Tecnologia
Funding programme
3599-PPCDT
Funding Award Number
PTDC/BEX-BCM/5899/2014