Publicação
Double specific betweenness variants for cross disease network analysis
| datacite.subject.fos | Ciências Naturais::Ciências Biológicas | pt_PT |
| dc.contributor.advisor | Pinto, Francisco Rodrigues | |
| dc.contributor.author | Conceição, Sofia Isabel Rodrigues da | |
| dc.date.accessioned | 2021-05-18T15:19:21Z | |
| dc.date.available | 2021-05-18T15:19:21Z | |
| dc.date.issued | 2020 | |
| dc.date.submitted | 2020 | |
| dc.description | Tese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2020 | pt_PT |
| dc.description.abstract | Genes associados a doenças (GAD) tendem em agrupar-se em redes celulares definindo módulos na rede. As observações indicam que estes módulos têm grande interação de proteína-proteína e partilham caminhos comuns. É importante identificar estes módulos de doenças, uma vez que poderá ajudar a desvendar os mecanismos moleculares que fazem parte da doença, mas também descobrir novos genes alvos para fármacos. Contudo, achar estes módulos não é fácil, uma vez que o conhecimento atual está em constante progressão, o que leva a redes de doenças incompletas. Medidas da teoria dos grafos podem caracterizar quantitativamente e comparar redes, os seus vértices ou grupos de vértices. Utilizando estas medidas, alguns métodos foram desenvolvidos de modo a melhor identificar os módulos de doenças nas redes. Um desses métodos é o Double Specific-Betweenness (S2B), que prevê GADs partilhados com base nos genes que são achados frequentemente, e, especifica mente, nos caminhos mais curtos entre os módulos das duas doenças relacionadas. O S2B prevê genes comuns entre doenças na sobreposição de ambos os módulos de doenças numa rede não dirigida usando GAD conhecidos. Com isto, o método prevê que vértices presentes na rede têm mais probabilidade de fazer parte de ambos os módulos. Este método difere de outros já existentes, porque prevê vértices que estão associados simultaneamente a duas doenças, enquanto os outros métodos focam-se apenas em priorização de proteínas, apenas para uma doença. A utilização de duas doenças simultaneamente é uma vantagem, uma vez que é possível inferir mecanismos subjacentes a comorbidades em doenças ou identificar vértices, e/ou caminhos que não estavam previamente associados a comorbidade, dando assim a possibilidade de tratar a doença ou sintoma em ambas em vez de atuar numa só. Neste trabalho desenvolvemos variantes mais flexíveis do S2B para redes não dirigidas e dirigidas. Estas variantes foram comparadas em três tipos de redes distintas e foram avaliados em termos de robustez e estabilidade. Os resultados obtidos mostram que o S2B, em conjunto com as variantes que usam passeios aleatórios (SRWR e SLB) são os métodos com melhor performance. Estes métodos têm uma melhor performance na rede de sinalização não dirigida. Os resultados também demonstram que os métodos são robustos a mudanças iniciais nas sementes (variação aleatória de sementes ou no número de sementes usadas). O rácio do módulo de doença completo para o número de sementes de input está correlacionado com a performance do método. Resumindo, este trabalho providencia um guia compreensivo para a aplicação de métodos de previsão da sobreposição com a máxima performance. | pt_PT |
| dc.description.abstract | Disease associate genes (DGs) tend to cluster in cellular networks defining network modules. It has been observed that these modules have many protein-protein interactions and share common pathways. It is important to identify these disease modules, since it can help to unveil the molecular mechanisms that contribute to disease, as well as discovering new candidate drug target genes. However, finding these modules is not an easy task, and, as the current knowledge is still expanding, most known disease network modules are incomplete. Graph theory measures can quantitatively characterize and compare networks, their nodes or group of nodes. Using these measures, some methods were developed to better identify network disease modules. One method is the Double Specific-Betweenness (S2B), that predicts shared DGs based on the genes that are found frequently and specifically in shortest paths between two related disease modules. S2B predicts cross-disease genes in the overlap of both disease modules in an undirected graph using known DGs. With this, the method predicts the nodes present in the graph that are most likely to be part of both disease modules. This method differs from previously existing methods because it predicts nodes that are simultaneously associated with two diseases, while other existing methods focus in protein prioritization only for one disease. Using two diseases at the same time is an advantage, since we can infer new mechanisms underlying comorbid diseases or identify nodes and/or pathways that were not assigned to a comorbidity before, giving the possibility to treat the disease or symptom for both of them instead of a single one. In this work we developed more more flexible S2B variants for undirected and directed networks. These variants were compared in three distinct network types and were evaluated regarding robustness and stability. The obtained results show that S2B, together with variants using random walks (SRWR and SLB) are the best performing methods. These methods perform better with an undirected signalling network. Also, the results show that the methods are robust to changes in initial seeds (random variation of the seeds or the number of seeds used), and to module connectivity. The ratio of complete module size to the number of input seeds is correlated with method performance. In summary, this work provides a comprehensive guide for the application of module overlap prediction methods with maximal performance. | pt_PT |
| dc.identifier.tid | 202596591 | pt_PT |
| dc.identifier.uri | http://hdl.handle.net/10451/47980 | |
| dc.language.iso | eng | pt_PT |
| dc.subject | Biologia de redes | pt_PT |
| dc.subject | Priotização de Genes de Doenças | pt_PT |
| dc.subject | Interações Proteína-Proteína | pt_PT |
| dc.subject | Redes de sinalização | pt_PT |
| dc.subject | Teses de mestrado - 2020 | pt_PT |
| dc.title | Double specific betweenness variants for cross disease network analysis | pt_PT |
| dc.type | master thesis | |
| dspace.entity.type | Publication | |
| rcaap.rights | openAccess | pt_PT |
| rcaap.type | masterThesis | pt_PT |
| thesis.degree.name | Mestrado em Bioinformática e Biologia Computacional | pt_PT |
Ficheiros
Principais
1 - 1 de 1
A carregar...
- Nome:
- ulfc126270_tm_Sofia_Conceição.pdf
- Tamanho:
- 2.57 MB
- Formato:
- Adobe Portable Document Format
