Utilize este identificador para referenciar este registo: http://hdl.handle.net/10451/32636
Título: Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
Autor: Viegas, Inês Correia
Orientador: Fonseca, Andreia de Jesus Amaral Gomes Barbosa
Carmo, Maria Beatriz Duarte Pereira do,1960-
Palavras-chave: miRNA
isomiR
small-RNA-seq
Bioinformática
Pipeline
Teses de mestrado - 2017
Data de Defesa: 2017
Resumo: A sequenciação de nova geração tornou-se, nos últimos anos, a tecnologia de eleição para o estudo do transcriptoma. Esta metodologia permite a sequenciação de pequenos RNAs não codificantes (small-RNA-seq) a serem expressos numa amostra, tendo contribuído para o aumento, a um ritmo nunca antes visto, da descrição de novos microRNAs (miRNAs) nos genomas de várias espécies. Principalmente, permite caracterizar a complexidade existente numa amostra de RNA, o que acabou por revelar a existência de pequenas variações no que toca ao comprimento e/ou à sequência de miRNAs quando comparados ao respectivo miRNA canónico. Os miRNAs que apresentam estas variações são denominados de isomiRs, sendo que as variações podem incluir a adição ou remoção de um ou mais nucleótidos nas extremidades da sequência ou podem resultar de eventos de editing no interior da sequência. Os miRNAs são conhecidos por actuarem como reguladores de expressão génica em várias espécies, sendo considerados essenciais para manter um bom funcionamento de inúmeras vias biológicas. No entanto, estudos recentes sugerem que as variações na sequência dos isomiRs têm como consequência uma alteração nos alvos destes (miRNAs), resultando em alterações ao nível da programação genética da célula. Apesar de vários estudos apontarem para este cenário, o impacto biológico dos isomiRs ainda não é extensivamente conhecido. Várias ferramentas têm sido desenvolvidas para a análise de dados de small-RNA-seq com o intuito de identificar isomiRs, no entanto, a maioria das ferramentas, não permite identificar todos os tipos possíveis de isomiRs. Adicionalmente, muitas das ferramentas disponibilizadas não realizam de um modo automatizado a inferência sobre o impacto da expressão destes isomiRs ao nível funcional, ou seja, estudar o impacto destas sequências ao nível dos pathways e de redes de regulação génica da célula. Por este motivo, o presente projecto teve como finalidade o desenvolvimento de um pipeline que integra a ferramenta IsomiR Window. A ferramenta em questão permite obter a anotação, quantificação e análise funcional de miRNAs/isomiRs provenientes de dados de small-RNA-seq. O pipeline desenvolvido tem a capacidade de receber múltiplos ficheiros de input para um total de duas condições experimentais, permitindo a identificação e quantificação dos diferentes tipos de pequenos RNAs não codificantes presentes em cada dataset. Posteriormente, é capaz de detectar e categorizar todos os tipos de isomiRs: modificações nas extremidades 3’ e 5’ relativamente ao miRNA canónico, eventos de editing internos, adição de tailings na extremidade 3’ relativamente ao miRNA canónico e possíveis combinações entre os diferentes tipos de isomiRs. Adicionalmente, o pipeline inclui uma etapa de análise de expressão diferencial e análise funcional, fornecendo informação relacionada com os targets de isomiRs específicos e com o seu impacto funcional em diversas vias biológicas. O pipeline integra ainda a funcionalidade de previsão de novos miRNAs. Finalmente, embora não de forma automatizada, é possível adicionar os novos miRNAs previstos à correspondente base de dados das espécies em estudo, permitindo, numa análise subsequente, a identificação de isomiRs derivados de potenciais novos pre-miRNAs. De modo a validar o pipeline desenvolvido, analisaram-se seis datasets que incluíram amostras de indivíduos saudáveis e amostras de indivíduos infectados com hepatite B. Esta análise incluiu a identificação, quantificação, análise de expressão diferencial e por fim, a previsão de alvos para os isomiRs de interesse. Como resultado, identificámos alterações significativas na expressão de alguns isomiRs que não tinham sido anteriormente reportados. Adicionalmente, a análise funcional permitiu identificar genes, que de acordo com a literatura, não têm sido associados a lesões no fígado.
Since the development of deep sequencing for small non-coding RNAs (small-RNA-seq), several novel microRNAs (miRNAs) have been identified, which led to the observation that miRNAs can vary in length and/or sequence when comparing to their canonical form. These variants, named isomiRs, appear due to an addition or deletion of one or more nucleotides at the 5' or 3' ends or both. Additionally they can also result from internal editings in their sequence. Nowadays, it is already well-established that microRNAs play an important role as regulators of gene expression across multiple species, being critical for maintaining normal physiology and considered candidate biomarkers, regulators, and therapeutic targets for a wide spectrum of diseases. However, numerous recent studies suggest that isomiRs might regulate the expression of different targets in comparison to their respective canonical. Reports indicating differential functionality for isomiRs are still limited to particular variants, and although isomiRs are common, their biological impact is not yet fully understood. The growing number of available tools to perform small-RNA-seq data analyses shows that the interest in obtaining accurate miRNA annotation and quantification is rapidly increasing. However, several tools fail to provide an accurate identification of all forms of isomiRs and to allow a comprehensive analysis of their function. Here we present the development of the analysis pipeline embedded within the IsomiR Window tool, a bioinformatics tool for accurate annotation, quantification and functional analysis of microRNAs and their isoforms (isomiRs) from small-RNA-sequencing data. The developed pipeline enables the simultaneous processing of multiple data files for two experimental conditions, identifying all types of small non-coding RNAs present in each dataset. It further detects and categorizes all types of isomiRs, such as 5′ and 3′ miRNA modifications, internal editings and 3’ tailings. In addition, the pipeline includes a functional analysis module, providing information related to the targets of selected isomiRs and their functional impact in the cell genetic program in comparison with its canonical form. Additionally, the pipeline offers the possibility to perform novel miRNA prediction, and to add the novel predicted miRNAs to the database file of the species in question, in order to allow the identification of isomiRs derived from these predicted miRNAs, in a subsequent analysis. We applied this pipeline to analyze simultaneously six small-RNA-seq datasets from either healthy individuals or individuals with hepatitis B. The investigation led to the rapid and accurate identification, quantification and differential expression of several miRNAs and isomiRs. Our analysis allowed to identify significant changes at isomiR level, which were not previously investigated, as well as to identify genes that have not been previously associated with liver damage.
Descrição: Tese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, em 2017
URI: http://hdl.handle.net/10451/32636
Designação: Mestrado em Bioinformática e Biologia Computacional
Aparece nas colecções:FC - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
ulfc124148_tm_Ines_Viegas.pdf1,83 MBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.