Repository logo
 
Publication

Understanding ALS patients using Semantic Similarity

datacite.subject.fosCiências Naturais::Ciências Biológicaspt_PT
dc.contributor.advisorPesquita, Cátia,1980-
dc.contributor.advisorMadeira, Sara Alexandra Cordeiro
dc.contributor.authorTeixeira, David Carriço
dc.date.accessioned2019-11-22T17:26:39Z
dc.date.available2019-11-22T17:26:39Z
dc.date.issued2019
dc.date.submitted2019
dc.descriptionTese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2019pt_PT
dc.description.abstractAs técnicas clássicas de prospecção de dados têm dificuldades a lidar com dados biomédicos não estruturados/ semiestruturados, pois estes contêm um significado semântico profundamente enraizado em palavras e frases que não é detectado através da extracção e análise diretas de recursos. Uma maneira de formalmente contextualizar dados é anotá-los com ontologias biomédicas e usar semelhança semântica sobre essas anotações para encontrar relações ocultas entre instâncias de dados. Deste modo, se os dados puderem ser enriquecidos com conhecimento externo, uma prospecção mais informada poderá, em princípio, retornar resultados mais precisos. Este projeto abordou este desafio desenvolvendo uma metodologia para analisar registos médicos de pacientes por meio da integração com recursos e software semânticos. Uma pipeline de três etapas cria uma rede semântica de ontologias que garante cobertura semântica sobre os dados alvo, calcula a semelhança semântica entre pacientes com a aplicação SML (Semantic Measures Library), e agrupa pacientes usando algoritmos de clustering do módulo Scikit-Learn do Python. Além disso, foi desenvolvida uma ferramenta para elaborar uma descrição resumida do conteúdo semântico de um agrupamento, destacando os seus elementos mais relevantes. Estes métodos foram avaliados usando um conjunto de dados de 1376 pacientes com esclerose lateral aiotrófica (ELA), possuindo uma forte componente textual e uma ampla heterogeneidade de sintomas entre pacientes. Os grupos de pacientes obtidos foram comparados, juntamente com uma baseline não-semântica, com grupos ground-truth de pacientes derivados das suas taxas de progressão de ELA. Foi demonstrado que a eficácia da metodologia proposta era fortemente dependente do número e da qualidade das anotações, mas também que os dados disponíveis não eram suficientes para detectar grupos de progressão. Apesar disso, as descrições de agrupamentos foram aplicadas com êxito em todas as abordagens, e forneceram informações úteis que evidenciaram pontos em comum entre o conteúdo semântico dos agrupamentos teste e da ground-truth. Por fim, esta metodologia pode ser generalizada para quaisquer entidades biomédicas que podem ser anotadas semanticamente com ontologias existentes.pt_PT
dc.identifier.tid202374432pt_PT
dc.identifier.urihttp://hdl.handle.net/10451/40236
dc.language.isoengpt_PT
dc.relationSMiLax: Semantic Mining with Linked Data
dc.subjectOntologias biomédicaspt_PT
dc.subjectSemelhança semânticapt_PT
dc.subjectEsclerose Amiotrófica Lateralpt_PT
dc.subjectAgrupamentopt_PT
dc.subjectTeses de mestrado - 2019pt_PT
dc.titleUnderstanding ALS patients using Semantic Similaritypt_PT
dc.typemaster thesis
dspace.entity.typePublication
oaire.awardTitleSMiLax: Semantic Mining with Linked Data
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/5876/UID%2FCEC%2F00408%2F2013/PT
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/3599-PPCDT/PTDC%2FEEI-ESS%2F4633%2F2014/PT
oaire.fundingStream5876
oaire.fundingStream3599-PPCDT
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.nameFundação para a Ciência e a Tecnologia
project.funder.nameFundação para a Ciência e a Tecnologia
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
relation.isProjectOfPublicationb02b03f5-581e-454f-ae70-55752fc0fe91
relation.isProjectOfPublication2eef2758-bca0-4076-9730-5ec6e141f19d
relation.isProjectOfPublication.latestForDiscoveryb02b03f5-581e-454f-ae70-55752fc0fe91
thesis.degree.nameMestrado em Bioinformática e Biologia Computacionalpt_PT

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
ulfc125369_tm_David_Teixeira.pdf
Size:
21.52 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.2 KB
Format:
Item-specific license agreed upon to submission
Description: