Name: | Description: | Size: | Format: | |
---|---|---|---|---|
24.49 MB | Adobe PDF |
Authors
Abstract(s)
Knowledge graphs represent an unparalleled opportunity for machine learning in the biomedical domain, given their ability to enrich data with meaningful context through semantic representations, such as knowledge graph embeddings and semantic similarity. However, the specificity of many biomedical tasks contrasts with the broad domains covered by large and successful biomedical knowledge graphs that describe entities according to several perspectives — semantic aspects. This is particularly challenging for predicting specific relations between entities described in the knowledge graph when the graph itself does not encode these relations.
Current semantic representation methods consider the knowledge graph as a whole, ignoring the different semantic aspects. This thesis hypothesizes that semantic representations that are able to distinguish semantic aspects can improve the performance and explainability of biomedical relation prediction tasks.
This work investigated different paradigms for defining semantic aspects based on classes and properties and developed multiple semantic representation techniques for both individual entities and entity pairs, with a focus on their explainability. Extensive experiments in proteinprotein interaction and gene-disease association predictions supported the empirical evaluation of the proposed methods and demonstrated that semantic aspect-oriented representations improve both predictive performance and explainability, fostering biomedical research. This work further highlights that in complex and multi-disciplinary domains, where a single knowledge graph is used to support a wide variety of tasks, it is essential to shift from viewing knowledge graphs as a whole to focusing on specific semantic perspectives.
Os grafos de conhecimento no domínio biomédico representam uma oportunidade única para a aprendizagem automática, dada a sua capacidade de fornecer um contexto significativo aos dados através de representações semânticas, tais como métodos de embedding e semelhança semântica. No entanto, a especificidade das tarefas de aprendizagem automática contrasta com os amplos domínios cobertos por muitos destes bem-sucedidos grafos de conhecimento que descrevem entidades de acordo com diversas perspetivas — aspetos semânticos. Isto é particularmente desafiador na previsão de relações específicas entre entidades descritas no grafo de conhecimento, quando estas relações não estão incluídas no grafo. Os métodos atuais de representação semântica consideram o grafo de conhecimento como um todo, ignorando os diferentes aspetos semânticos. Esta tese de doutoramento levanta a hipótese de que as representações semânticas capazes de distinguir aspetos semânticos podem melhorar o desempenho e a explicabilidade de tarefas de previsão de relações biomédicas. Este trabalho investigou diferentes paradigmas para definição de aspetos semânticos baseados em classes e propriedades e desenvolveu múltiplas técnicas de representação semântica tanto para entidades individuais quanto para pares de entidades, com foco na explicabilidade. Experiências extensivas na previsão de interações de proteínas e previsão de associação entre genes e doenças apoiaram a avaliação empírica dos métodos propostos e demonstraram que as representações orientadas a aspetos semânticos melhoram tanto o desempenho da previsão quanto a explicabilidade, promovendo o avanço da investigação biomédica. Este trabalho destaca ainda que em domínios complexos e multidisciplinares, onde um único grafo de conhecimento é usado para apoiar uma ampla variedade de tarefas, é essencial deixar de considerar os grafos de conhecimento como um todo para focar em perspetivas semânticas específicas.
Os grafos de conhecimento no domínio biomédico representam uma oportunidade única para a aprendizagem automática, dada a sua capacidade de fornecer um contexto significativo aos dados através de representações semânticas, tais como métodos de embedding e semelhança semântica. No entanto, a especificidade das tarefas de aprendizagem automática contrasta com os amplos domínios cobertos por muitos destes bem-sucedidos grafos de conhecimento que descrevem entidades de acordo com diversas perspetivas — aspetos semânticos. Isto é particularmente desafiador na previsão de relações específicas entre entidades descritas no grafo de conhecimento, quando estas relações não estão incluídas no grafo. Os métodos atuais de representação semântica consideram o grafo de conhecimento como um todo, ignorando os diferentes aspetos semânticos. Esta tese de doutoramento levanta a hipótese de que as representações semânticas capazes de distinguir aspetos semânticos podem melhorar o desempenho e a explicabilidade de tarefas de previsão de relações biomédicas. Este trabalho investigou diferentes paradigmas para definição de aspetos semânticos baseados em classes e propriedades e desenvolveu múltiplas técnicas de representação semântica tanto para entidades individuais quanto para pares de entidades, com foco na explicabilidade. Experiências extensivas na previsão de interações de proteínas e previsão de associação entre genes e doenças apoiaram a avaliação empírica dos métodos propostos e demonstraram que as representações orientadas a aspetos semânticos melhoram tanto o desempenho da previsão quanto a explicabilidade, promovendo o avanço da investigação biomédica. Este trabalho destaca ainda que em domínios complexos e multidisciplinares, onde um único grafo de conhecimento é usado para apoiar uma ampla variedade de tarefas, é essencial deixar de considerar os grafos de conhecimento como um todo para focar em perspetivas semânticas específicas.
Description
Keywords
Knowledge graph Semantic similarity Knowledge graph embedding Machine learning Biomedical application Grafo de conhecimento Semelhança semântica Embedding de grafos de conhecimento Aprendizagem automática Aplicação biomédica