Assessing brain functional connectivity in Parkinson’s disease using explainable Artificial Intelligence methods

Pires, Leonor Maria de Oliveira

http://hdl.handle.net/10451/61709

Utilize este identificador para referenciar este registo.

Nome:	Descrição:	Tamanho:	Formato:
TM_Leonor_Pires.pdf		7.18 MB	Adobe PDF	Ver/Abrir

Contacte-nos

Autores

Pires, Leonor Maria de Oliveira

Orientador(es)

Andrade, Alexandre da Rocha Freire de

Resumo(s)

A doença de Parkinson (DP) é uma patologia neurogenerativa caracterizada pela perda de neurónios dopaminérgicos, em particular nos gânglios da base, e acumulação da proteína α-sinucleína. A DP é caracterizada por quatro sinais cardinais motores: tremores, bradicinesia, rigidez muscular e instabilidade postural. A doença é também manifestada por sintomas não motores como perda do olfato, doenças neuropsiquiátricas como depressão e ansiedade, e distúrbios do sono. Esta doença progressiva não tem cura, sendo que os tratamentos procuram a melhoria da qualidade de vida dos pacientes atenuando os sintomas. Relativamente ao diagnóstico, este é ainda principalmente baseado na análise da apresentação clínica dos sintomas. Entidades como a Sociedade de Doenças do Movimento apresentam uma série de critérios clínicos para aferir o diagnóstico da DP. Não existindo qualquer exame de imagiologia ou teste analítico que confirme um diagnóstico, as técnicas de neuroimagem surgem como ferramentas complementares com o fim de detetar alterações neuroquímicas relacionadas com a DP. O exame imagiológico mais comum é o DatScan, um tipo de aquisição de tomografia computorizada de emissão de fotão único que visa a deteção do transportador de dopamina, um biomarcador da degeneração dos neurónios dopaminérgicos. Dada a precisão e confiança insuficiente nos critérios clínicos de diagnóstico, bem como a falta de consistência do DaTScan, métodos de neuroimagem alternativos têm sido considerados para averiguar alterações cerebrais funcionais relacionadas com a DP, como por exemplo, a ressonância magnética (RM). Em particular, o fluxo sanguíneo cerebral e a conectividade do cérebro são analisadas através de RM funcional (RMf), uma técnica de RM que determina a atividade cerebral, em repouso ou perante uma tarefa, através da deteção de alterações no fluxo sanguíneo. Deste modo, vários estudos têm apontado como uma potencial e inovadora abordagem a utilização de aprendizagem profunda (AP) para auxiliar e automatizar o diagnóstico de doenças neurológicas como a doença de Parkinson, baseando em dados de neuroimagem como a RMf. Não obstante, estas investigações ao nível da DP, AP e RMf não incluem, até ao momento e à luz do nosso conhecimento, estudos em larga escala: os números de sujeitos são ainda consideravelmente reduzidos, na ordem das dezenas. Ademais, os modelos de AP apresentam uma natureza de "caixa negra", ou seja, não é possível aferir de que forma o algoritmo chegou às decisões que levaram à classificação efetuada. Assim, a inteligência artificial explicável (IAE), um conjunto de métodos que pretende explicar e interpretar as decisões tomadas por modelos de inteligência artificial, surge como uma ferramenta apropriada para ultrapassar a falta de transparência dos modelos de AP. Posto isto, o trabalho que surge no âmbito desta dissertação tem como objetivo o desenvolvimento de métodos para estudar e detetar alterações ao nível da conectividade funcional (CF) do cérebro relacionadas com a DP, recorrendo a um modelo de classificação baseado na arquitetura de redes neuronais convolucionais (RNC), e a métodos de IAE. Adicionalmente, pretende-se identificar potenciais biomarcadores funcionais da DP. Para este fim, utilizaram-se aquisições de RMf do conjunto de dados do PPMI, que inclui 120 scans de doentes com DP, e 22 de controlos saudáveis. Como este conjunto apresentava um desequilíbrio devido ao reduzido número de dados de controlos, recorreu-se ao conjunto de dados ADNI para recolher mais 131 scans de controlos. Este ajustamento foi efetuado considerando que a diferença entre os parâmetros de aquisição de RMf entre os dois consórcios, em particular o tempo de repetição, não leva a alterações significativas na avaliação da CF. Os dados de RMf foram pré-processados de acordo com uma sequência de métodos que incluíram: realinhamento funcional e distorção, correção temporal, identificação de outliers, segmentação e normalização, e atenuação funcional. Foi ainda removido ruído dos dados, através da regressão de potenciais efeitos perturbadores e da aplicação de um filtro passa-banda entre os 0,008 Hz e os 0,09 Hz. Os dados foram segmentados de acordo com um atlas que inclui 14 redes neuronais de repouso. A conetividade funcional de cada sujeito foi aferida através do cálculo das matrizes de CF, que correspondem a matrizes de correlação entre as 14 redes funcionais de repouso. Para tal, foi aplicado o cálculo do coeficiente de correlação de Pearson e a transformada de Fisher. As matrizes de conetividade foram inseridas numa RNC denominada de ExtendedConnectomeCNN, uma rede inspirada na ConnectomeCNN. Esta é composta por três camadas convolucionais e uma camada totalmente conectada. O tamanho da janela dos filtros é de 3 por 3 e o passo igual a 2. O número de filtros diminui ao longo das camadas convolucionais, de 256 para 128, e para 64. Em termos de parâmetros de treino, foram selecionados um número de épocas igual a 200 e um tamanho de grupo igual a 16. Como hiperparâmetros a otimizar, foram selecionados: a taxa de dropout, a taxa de aprendizagem, e a presença de uma camada de normalização em lote em cada camada convolucional. O processo de otimização dos hiperparâmetros foi efetuado através de validação cruzada com 10 folds (ou subconjuntos). Neste processo foi utilizado o conjunto de desenvolvimento dos dados, que corresponde a 90% do conjunto total das matrizes de CF. Da otimização de hiperparâmetros, foi selecionado o conjunto de hiperparâmetros que apresentou a melhor performance, isto é, com valores de médias das métricas de avaliação satisfatórios e balanceados. O conjunto com melhor performance apresentava uma taxa de dropout de 0,1 nas camadas convolucionais e de 0,4 na camada totalmente conectada, uma taxa de aprendizagem de 0,00001, e não tinha inseridas camadas de normalização em lote. Destacamse os valores de exatidão de treino, 0,8814, de exatidão de validação, 0,7760, e de área sob a curva de característica de operação do receptor (AUC ROC) de 0,7496. Estes valores refletem modelos generalizáveis que detetam tanto as classes positiva (DP) como negativa (controlo). Foi, de seguida, desenvolvido um modelo final com os melhores hiperparâmetros, treinado no conjunto de desenvolvimento e testado no conjunto de teste reservado à parte. Foram obtidas: uma extaidão de treino de 0,8776, exatidão de teste de 0,8214, e uma AUC ROC de 0,8230. Logo, o modelo construído apresenta valores de performance satisfatórios e balanceados, e potencial de interpretabilidade, o que permite a aplicação de métodos de IAE. Ao modelo final foram aplicados três métodos de IAE: propagação de relevância camada a camada (do inglês LRP, layer-wise relevance propagation), rede de deconvolução, e retropropagação direcionada. Para cada método foi calculada a área de curva de perturbação do mais relevante primeiro, ou AOPC do inglês area over the MoRF perturbation curve, que avalia o quão relevantes são as explicações fornecidas pelos métodos de IAE. Considerando que o método LRP produziu mapas de explicação mais específicos e não dispersos, e que apresentou ainda valores de AOPC maiores e melhor distribuídos, considerou-se esse método como o que melhor explica a classificação de DP. A partir das explicações fornecidas pelo método LRP foram extraídas as redes funcionais de repouso que mais relevância têm na classificação de DP. Não foram identificadas quaisquer alterações referentes à rede dos gânglios da base, apesar de tal ser esperado. No entanto, identificaram-se como potenciais biomarcadores funcionais da DP as redes de modo padrão dorsal, de modo padrão ventral, e de saliência posterior, essencialmente envolvidas em manifestações não-motoras da doença. Considerando que (1) o pré-processamento dos dados de RMf seguiu métodos adequados e produziu resultados satisfatórios, (2) o modelo de RNC para classificação de DP demonstrou ser suficientemente generalizável, com métricas de avaliação satisfatórias e equilibradas, e (3) a análise de IAE aparenta ser fidedigna e concordante com a literatura referente às alterações de redes funcionais de repouso perante a DP, conclui-se que a abordagem tomada para o estudo da CF relacionada com a DP utilizando métodos de IAE foi bem sucedida. Assim, os objetivos da dissertação foram cumpridos, com a expetativa de que este estudo resultará num progresso no desenvolvimento de técnicas inovadoras de diagnóstico de DP assistido por métodos de inteligência artificial.

Parkinson’s disease (PD) is a neurodegenerative disease characterised by dopaminergic neuron loss and α-synuclein accumulation. It exhibits both motor symptoms (such as tremors, bradykinesia, and rigidity) and non-motor symptoms. Diagnosis relies on clinical presentation and DaTScan, though their reliability varies. Functional magnetic resonance imaging (fMRI) and brain connectivity analysis have aided PD assessment. Studies have shown promise in diagnosing PD using deep learning (DL) but lack large-scale studies and transparency due to their black-box nature. Explainable AI (XAI) aims to provide understandable explanations for AI model decisions. This dissertation proposes methods to assess functional connectivity in PD using a convolutional neural network (CNN) classifier and XAI. Resting-state fMRI scans from the PPMI and ADNI data sets were pre-processed following an atlas composed of 14 resting-state networks. The FC matrices were computed through Pearson correlation coefficient and Fisher transform. The FC matrices were fed to the ExtendedConnectomeCNN, optimised through 10-fold crossvalidation, and tested, yielding a final model with 0.8214 accuracy, satisfactory performance metrics, balanced metrics, and interpretability potential. Three XAI methods were applied: layer-wise relevance propagation (LRP), deconvolutional network (DeconvNet) and guided backpropagation. The LRP method provided more specific explanations, achieving higher AOPC value. Therefore, it is the method that better explains the classification of PD. No basal ganglia network alterations were found, but changes in dorsal and ventral default mode, and posterior salience networks – involved in PD pathophysiology – were identified as potential biomarkers. An attempt to perform transfer learning by training a model on the larger ABIDE set was executed. The model presented a poor performance and was not generalising, hence, we disregarded this possibility. The approach to assessing functional connectivity changes in PD using XAI methods was fairly successful. The objectives of the dissertation were fulfilled, with hopes for contribution to novel PD diagnosis techniques.

Descrição

Tese de Mestrado, Engenharia Biomédica e Biofísica, 2023, Universidade de Lisboa, Faculdade de Ciências

Palavras-chave

Inteligência artificial explicável Doença de Parkinson Conectividade funcional Redes funcionais de repouso Redes neuronais convolucionais Teses de mestrado - 2023

URI

http://hdl.handle.net/10451/61709

Coleções

FC - Dissertações de Mestrado

Ver registo completo