Repository logo
 
Publication

Semantic perspectives for learning over biomedical knowledge graphs

datacite.subject.fosCiências Naturais::Ciências da Computação e da Informaçãopt_PT
dc.contributor.advisorPesquita, Cátia Luísa Santana Calisto
dc.contributor.advisorSilva, Sara Guilherme Oliveira da
dc.contributor.authorSousa, Rita Isabel Torres de
dc.date.accessioned2025-02-18T15:39:03Z
dc.date.available2025-02-18T15:39:03Z
dc.date.issued2024-07-01
dc.date.submitted2023-12-29
dc.description.abstractKnowledge graphs represent an unparalleled opportunity for machine learning in the biomedical domain, given their ability to enrich data with meaningful context through semantic representations, such as knowledge graph embeddings and semantic similarity. However, the specificity of many biomedical tasks contrasts with the broad domains covered by large and successful biomedical knowledge graphs that describe entities according to several perspectives — semantic aspects. This is particularly challenging for predicting specific relations between entities described in the knowledge graph when the graph itself does not encode these relations. Current semantic representation methods consider the knowledge graph as a whole, ignoring the different semantic aspects. This thesis hypothesizes that semantic representations that are able to distinguish semantic aspects can improve the performance and explainability of biomedical relation prediction tasks. This work investigated different paradigms for defining semantic aspects based on classes and properties and developed multiple semantic representation techniques for both individual entities and entity pairs, with a focus on their explainability. Extensive experiments in proteinprotein interaction and gene-disease association predictions supported the empirical evaluation of the proposed methods and demonstrated that semantic aspect-oriented representations improve both predictive performance and explainability, fostering biomedical research. This work further highlights that in complex and multi-disciplinary domains, where a single knowledge graph is used to support a wide variety of tasks, it is essential to shift from viewing knowledge graphs as a whole to focusing on specific semantic perspectives.pt_PT
dc.description.abstractOs grafos de conhecimento no domínio biomédico representam uma oportunidade única para a aprendizagem automática, dada a sua capacidade de fornecer um contexto significativo aos dados através de representações semânticas, tais como métodos de embedding e semelhança semântica. No entanto, a especificidade das tarefas de aprendizagem automática contrasta com os amplos domínios cobertos por muitos destes bem-sucedidos grafos de conhecimento que descrevem entidades de acordo com diversas perspetivas — aspetos semânticos. Isto é particularmente desafiador na previsão de relações específicas entre entidades descritas no grafo de conhecimento, quando estas relações não estão incluídas no grafo. Os métodos atuais de representação semântica consideram o grafo de conhecimento como um todo, ignorando os diferentes aspetos semânticos. Esta tese de doutoramento levanta a hipótese de que as representações semânticas capazes de distinguir aspetos semânticos podem melhorar o desempenho e a explicabilidade de tarefas de previsão de relações biomédicas. Este trabalho investigou diferentes paradigmas para definição de aspetos semânticos baseados em classes e propriedades e desenvolveu múltiplas técnicas de representação semântica tanto para entidades individuais quanto para pares de entidades, com foco na explicabilidade. Experiências extensivas na previsão de interações de proteínas e previsão de associação entre genes e doenças apoiaram a avaliação empírica dos métodos propostos e demonstraram que as representações orientadas a aspetos semânticos melhoram tanto o desempenho da previsão quanto a explicabilidade, promovendo o avanço da investigação biomédica. Este trabalho destaca ainda que em domínios complexos e multidisciplinares, onde um único grafo de conhecimento é usado para apoiar uma ampla variedade de tarefas, é essencial deixar de considerar os grafos de conhecimento como um todo para focar em perspetivas semânticas específicas.pt_PT
dc.identifier.tid101667574pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.5/98530
dc.language.isoengpt_PT
dc.relationNovo: Semantic perspectives for learning over biomedical knowledge graphs. Inicial: Evolving meaning for supervised learning in complex biomedical domains using knowledge graphs
dc.subjectKnowledge graphpt_PT
dc.subjectSemantic similaritypt_PT
dc.subjectKnowledge graph embeddingpt_PT
dc.subjectMachine learningpt_PT
dc.subjectBiomedical applicationpt_PT
dc.subjectGrafo de conhecimentopt_PT
dc.subjectSemelhança semânticapt_PT
dc.subjectEmbedding de grafos de conhecimentopt_PT
dc.subjectAprendizagem automáticapt_PT
dc.subjectAplicação biomédicapt_PT
dc.titleSemantic perspectives for learning over biomedical knowledge graphspt_PT
dc.typedoctoral thesis
dspace.entity.typePublication
oaire.awardTitleNovo: Semantic perspectives for learning over biomedical knowledge graphs. Inicial: Evolving meaning for supervised learning in complex biomedical domains using knowledge graphs
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/Concurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017%2F2018) - Financiamento Base/UIDB%2F00408%2F2020/PT
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/Concurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017%2F2018) - Financiamento Programático/UIDP%2F00408%2F2020/PT
oaire.awardURIinfo:eu-repo/grantAgreement/FCT//SFRH%2FBD%2F145377%2F2019/PT
oaire.fundingStreamConcurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017/2018) - Financiamento Base
oaire.fundingStreamConcurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017/2018) - Financiamento Programático
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.nameFundação para a Ciência e a Tecnologia
project.funder.nameFundação para a Ciência e a Tecnologia
project.funder.nameFundação para a Ciência e a Tecnologia
rcaap.rightsopenAccesspt_PT
rcaap.typedoctoralThesispt_PT
relation.isProjectOfPublicationb772636b-907c-47d6-82ed-f4d9f69107f3
relation.isProjectOfPublicationb54ed187-079f-4130-ae95-a218fb9feb3f
relation.isProjectOfPublication79947034-4194-47d4-a6ce-ad98a776bb22
relation.isProjectOfPublication.latestForDiscoveryb772636b-907c-47d6-82ed-f4d9f69107f3
thesis.degree.nameTese de doutoramento, Informática, Universidade de Lisboa, Faculdade de Ciências, 2024pt_PT

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
scnd990026354742082_td_Rita_Sousa.pdf
Size:
24.49 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.2 KB
Format:
Item-specific license agreed upon to submission
Description: