Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10451/36559
Título: | Cross disease network analysis |
Autor: | Ramos, Inês Filipa Fernandes |
Orientador: | Pinto, Francisco |
Palavras-chave: | Análise Inter-Doenças Priorização de Genes de Doença Redes regulatórias Doenças degenerativas de neurónios motores Teses de mestrado - 2018 |
Data de Defesa: | 2018 |
Resumo: | A grande maioria das doenças mais comuns são doenças complexas, causadas por uma combinação de vários fatores, incluindo fatores genéticos, ambientais e de estilo de vida. Com os recentes avanços em tecnologias de biologia molecular de alto desempenho e técnicas de bioinformática, a informação disponível sobre mecanismos de doença a diversos níveis moleculares, nomeadamente a nível do genoma, do transcriptoma, do proteoma ou do metaboloma, e em diferentes contextos, como em diferentes fases de doença, em diferentes tecidos ou organismos, tem vindo a crescer rapidamente. Atualmente as abordagens mais utilizadas para identificar genes envolvidos em doenças complexas são análises de linkage genético ou estudos de associação do genoma completo (em inglês genome-wide association studies ou GWAS) que permitem identificar regiões de cromossomas onde novos genes associados a doenças estão localizados, no entanto estas regiões podem conter elevados números de genes candidatos, aumentando o tempo e os custos da validação experimental dos genes identificados. Na última década o número de metodologias computacionais alternativas que visam reduzir a quantidade de genes candidatos e priorizar os mais promissores para posterior validação experimental, tem vindo a aumentar, com especial foco em técnicas que usam redes celulares. Com o aumento da qualidade e quantidade de informação de interações dentro da célula e o desenvolvimento de técnicas de teoria dos grafos, foi possível construir e analisar mapas de grande dimensão de interações moleculares, onde componentes celulares como ADN, ARN, proteínas ou outras moléculas, são reduzidos a nodos e as interações entre eles, sejam interações físicas, bioquímicas ou funcionais, são reduzidas a conexões entre os nodos. As conexões podem não ter direção, representando interações em que não é possível distinguir o nodo de origem e o alvo, ou podem ser direcionadas, representando uma relação de causa-efeito ou a direção do fluxo de informação. Podem ainda ser conexões idênticas ou ser distinguidas por pesos, para representar significância estatística, confiança ou importância das associações. Redes moleculares fornecem assim uma estrutura gráfica simples e fácil de interpretar para descrever sistemas celulares complexos e altamente interligados. Doenças podem ser representadas como perturbações dessas redes celulares que se propagam pelas conexões, e que consequentemente levam à falha de certas funções fisiológicas. Diferentes doenças podem apresentar vias moleculares comuns desreguladas, representadas nas redes celulares como uma sobreposição das sub-redes afetadas em cada doença (também designadas de módulos de doença), particularmente se elas partilham parte do fenótipo. A descoberta de genes associados a múltiplas doenças é especialmente interessante porque pode desvendar os mecanismos moleculares implicados na função fisiológica afetada em comum e fornecer novos alvos terapêuticos polivalentes. Esta dissertação baseia-se precisamente num método computacional de redes desenvolvido recentemente, o método de dupla especificidade (em inglês double specific-betweenness ou S2B), que prioriza nodos com uma maior probabilidade de estar simultaneamente associado a duas doenças fenotipicamente semelhantes. A priorização baseia-se no princípio comumente usado de culpa por associação, que identifica e prioriza candidatos em redes com base na sua proximidade a outros genes de doença, uma vez que genes associados a um fenótipo patológico tendem a colocalizar na mesma vizinhança nas redes, formando módulos de genes associados às funções biológicas afetadas nessa doença. O método foi desenvolvido para usar redes não direcionadas de interações físicas entre proteínas e extrair uma propriedade dos nodos da rede, uma versão modificada de intermediação (ou betweenness centrality em inglês), que mede a centralidade dos nodos através da contagem do número de caminhos mais curtos que ligam genes de um módulo de doença ao genes do outro que passam por cada nodo da rede, de modo a priorizar as proteínas mais centrais e mais especificamente conectadas às duas doenças e que consequentemente têm maior probabilidade de pertencer à sobreposição dos módulos de doença. O método foi testado com módulos artificiais de doença cujo objetivo é reproduzir as características de módulos reais e fornecer estruturas para teste cuja sobreposição é conhecida. Os testes de desempenho demostraram que o método consegue identificar corretamente a localização da sobreposição entre módulos, visto que os nodos priorizados com um score mais alto têm maior probabilidade de pertencer à sobreposição. O método foi também aplicado a duas doenças degenerativas dos neurónios motores, Esclerose Lateral Amiotrófica (ELA) e Atrofia Muscular Espinhal (AME). São duas doenças clinicamente e geneticamente distintas, visto que ELA é a doença neuromotora mais comum com início na vida adulta, caracterizada por degeneração dos neurónios motores superiores e inferiores causando fraqueza e atrofia muscular, rigidez, espasticidade e hiperreflexia, e associada a várias causas genéticas, das quais a maioria correspondente a casos esporádicos ainda é desconhecida. A AME, por outro lado, é a doença neuromotora com início na infância mais comum, caracterizada pela degeneração dos neurónios motores inferiores provocando atrofia muscular, causada por uma mutação hereditária recessiva no gene SMN1 (codifica a proteína de sobrevivência do neurónio motor) no cromossoma 5. Apesar das diferenças entre ELA e AME, vários estudos demostraram a conexões funcionais e físicas entre as causas genéticas das duas doenças, indicando uma etiologia comum associada à degeneração neuromotora presente em ambas. A aplicação do método S2B às duas doenças identificou novos genes envolvidos em processos críticos de neurodegeneração, como apoptose, reparação de ADN, processamento de ARN, transporte de proteínas e organização do citoesqueleto. O presente trabalho visa expandir o método S2B possibilitando a análise de redes com interações direcionadas. A expansão permite a análise de redes regulatórias de sinalização e de transcrição, fornecendo novas informações regulatórias que não podem ser capturadas com interações proteína-proteína e contribuindo para hipóteses de mecanismos de doença mais ricas para explicar as deficiências fisiológicas comuns. Em redes com conexões dirigidas um caminho que vai de um nodo A para B não é o mesmo que o caminho que vai de B para A, uma vez que se tem que ter em conta a coerência da direção do caminho, pelo que para calcular a intermediação dos nodos é necessário considerar todos os tipos de caminhos com diferentes direções que podem passar pelos nodos a conectar genes dos dois módulos de doença. De maneira a distinguir caminhos com diferentes direções e significados biológicos, três novas versões do método foram desenvolvidas cada uma a priorizar nodos com base em diferentes ligações às duas doenças. As novas versões do método foram testadas com novos tipos de módulos artificiais de doença direcionados, mais complexos e com múltiplas causas de doença num mesmo módulo, cujos resultados demostraram que o método dirigido com um todo é capaz de prever eficientemente a sobreposição de módulos de doença na rede e adicionalmente consegue oferecer nova informação sobre o papel dos candidatos previstos nos módulos. O S2B dirigido foi aplicado ao mesmo par de doenças neuromotoras, demonstrando sua vantagem sobre o método original em recuperar novos genes de doença associados a mecanismos regulatórios desregulados no processo de degeneração dos neurónios motores, nomeadamente a apoptose, transcrição, metabolismo de ARN e reparação de ADN. Os resultados promissores de ambos os estudos na previsão e priorização de genes associados a múltiplas doenças, usando redes não dirigidas de interações proteína-proteína e redes dirigidas de interações regulatórias de sinalização e transcrição, demostram a versatilidade deste método inovador para ser aplicado a diversos tipos de redes moleculares. O objetivo, no futuro, é integrar várias redes por forma a captar as interações entre diferentes componentes moleculares, que são perdidas com a utilização de apenas um tipo de dados. Ademais, sendo um método que aplica um conceito de teoria dos grafos, tem o potencial para ser aplicado a outras áreas científicas, incluindo do campo biomédico, que também utilizem redes. Diseases are often complex, caused by a combination of several factors including genetic, environmental and lifestyle factors. The complexity makes it more challenging to uncover the patho mechanisms underlying genotype-phenotype relationships. Cellular networks offer a simple framework to represent the highly interlinked cellular systems, by reducing cellular components, such as metabolites, proteins, DNA molecules or RNA molecules, to nodes and physical, biochemical or functional interactions to links between them. Diseases can be viewed as perturbations of these cellular networks, that lead to faulty physiological functions. Different diseases can have common deregulated molecular pathways, represented in the network as an overlap of subnetworks that are affected in each disease, particularly if they partially share phenotypes. The discovery of genes associated with multiple diseases is especially interesting because it can shed light on the molecular mechanisms implicated in the commonly affected physiological functions and provide new polyvalent therapeutic targets. This dissertation builds upon a previously developed network-based method, called double specific-betweenness (S2B) method, to prioritize nodes with a higher probability of being simultaneously associated with two phenotypically similar diseases. The method was developed to use undirected networks of physical interactions between proteins and extract a network property, a modified version of betweenness centrality, to prioritize proteins specifically connected with two different diseases. The method was tested with artificial disease network modules and applied to two fatal motor neuron diseases: Amyotrophic Lateral Sclerosis and Spinal Muscular Atrophy. The present work aims to expand the S2B method enabling the analysis of networks with directed interactions. This expansion allows the analysis of signaling and transcriptional regulatory networks, providing new regulatory information that can’t be captured with protein-protein interactions, contributing to richer mechanistic hypothesis to explain the common physiological deficiencies. The new extended version of the method was tested with several types of directed artificial disease modules, proving to be able to efficiently predict the network overlap between them and offer new insights into the role of the predicted candidates in the network. The directed S2B was also applied to the same motor neuron disease pair, demonstrating its ability to retrieve novel disease genes associated with regulatory mechanisms dysregulated in motor neuron degeneration. |
Descrição: | Tese de mestrado integrado em Engenharia Biomédica e Biofísica, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, em 2018 |
URI: | http://hdl.handle.net/10451/36559 |
Designação: | Mestrado Integrado em Engenharia Biomédica e Biofísica |
Aparece nas colecções: | FC - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
ulfc124658_tm_Ines_Ramos.pdf | 4,86 MB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.