| Nome: | Descrição: | Tamanho: | Formato: | |
|---|---|---|---|---|
| 1.34 MB | Adobe PDF |
Autores
Orientador(es)
Resumo(s)
A diabetes é uma doença metabólica multifatorial, caracterizada por níveis elevados de glucose no sangue (hiperglicemia). Esta é uma condição crónica, resultante da progressiva destruição ou disfunção das células beta presentes no pâncreas, onde se dá a produção de insulina, uma hormona anabólica envolvida na absorção e metabolismo da glucose. Sintomas clássicos de diabetes incluem fome e sede excessivas (polifagia e polidipsia, respetivamente), vontade frequente de urinar (poliúria) e cansaço. Se o nível de glucose no sangue estiver continuamente acima do normal, podem ocorrer manifestações mais graves da doença, como sejam cetoacidose e coma hiperosmolar, com perigo de morte associado. A longo-prazo, indivíduos com diabetes têm um risco aumentado de complicações micro e macro vasculares, tais como retinopatia, nefropatia, neuropatia e doenças cardiovasculares. O controlo da doença é feito através de tratamento farmacológico, aliado a um estilo de vida saudável, procurando evitar ou retardar, tanto quanto possível, consequências graves. No entanto, uma baixa-autopercepção do risco de complicações e falhas no acompanhamento destes doentes ao nível dos cuidados de saúde primários contribuem para piores resultados clínicos, com eventual necessidade de cuidados de saúde hospitalares. O presente trabalho teve por objetivo descrever e modelar uma série temporal de internamentos hospitalares por diabetes em Portugal, com ênfase na predição. Para tal, foram usados dados constantes da Base de dados de Morbilidade Hospitalar, cedida pela Administração Central do Sistema de Saúde (ACSS), I.P., do Ministério da Saúde. Foram selecionados todos os diagnósticos de diabetes como causa primária de admissão, codificados, até ao terceiro dígito, por 250 (diabetes mellitus), de acordo com a Classificação Internacional de Doenças (ICD), 9ª revisão, Modificação Clínica (ICD-9-CM) ou E10 (diabetes tipo 1), E11 (diabetes tipo 2), E13 (outro tipo de diabetes), segundo a 10ª revisão da ICD (ICD-10-CM/PCS). Cada um destes registos foi associado a um episódio específico, através de um número sequencial único entre bases de dados, selecionando-se aqueles com data de admissão entre 1 de janeiro de 2010 e 31 de dezembro de 2018 e internamento mínimo de um dia. Com base nestes dados, foi construída uma série temporal do número mensal internamentos por diabetes entre 2010 e 2018, num total de 108 observações. Um subconjunto destes dados, composto por observações entre janeiro de 2010 e dezembro de 2016, foi utilizado na identificação e estimação do modelo (conjunto de treino; 84 meses), e as restantes observações, entre janeiro de 2017 e dezembro de 2018, usadas exclusivamente para validação do modelo (conjunto de teste; 24 meses). Seguindo a metodologia de Box e Jenkins para modelos Autorregressivos e de Médias Móveis Integrados Sazonais (SARIMA), vários modelos foram identificados com base na análise gráfica das funções de autocorrelação e autocorrelação parcial e estimados por máxima verosimilhança. Na seleção do melhor modelo, foi considerado o critério de informação de Akaike (AIC), avaliando-se posteriormente a sua adequação aos dados através da estatística de Ljung-Box e inspeção visual dos resíduos. A capacidade preditiva do modelo selecionado foi investigada por comparação entre as previsões obtidas e os dados do conjunto de teste, através de um procedimento de avaliação de origem móvel, em que novos valores são imputados ao modelo à medida que, supostamente, se tornam conhecidos. Neste caso, considerou-se quer a atualização do modelo, quer a sua recalibração, tendo por base uma janela fixa, onde se incluem todas as observações disponíveis até ao momento, ou móvel, composta pelas 84 observações mais recentes. Medidas como o erro absoluto médio (MAE), a raiz do erro quadrático médio (RMSE) e o erro percentual absoluto médio (MAPE) foram utilizadas para quantificar a precisão do modelo em cada contexto de predição, permitindo a sua comparação com um método de referência, um passeio aleatório sazonal, segundo o qual cada previsão iguala o valor da série no mesmo mês do ano anterior. Entre janeiro de 2010 e dezembro de 2018, foram contabilizados em Portugal 73.050 episódios de internamento por diabetes (676 casos por mês, em média), o que representa 35% de todas as admissões hospitalares por esta causa. Este número resulta, na sua maioria, de admissões urgentes (79,5%). A distribuição por sexo mostrou-se relativamente equilibrada (52,5% de homens), tendo sido observado um maior número de internamentos entre indivíduos com idade igual ou superior a 60 anos e na região Norte do país. Globalmente, o número de episódios diminuiu 45% entre 2010 e 2018 (10.011 e 5.530 internamentos, respetivamente). Para além da tendência decrescente, foram também observadas flutuações sazonais, com um pico de casos nos meses de Inverno e números mais baixos no Verão. Tendo por base o número de internamentos por mês entre 2010 e 2016, foram identificados e estimados nove modelos candidatos para a série original e diferenciada, quer na componente regular, quer sazonal. Entre estes, o modelo mais parcimonioso, SARIMA(1, 1, 2) × (0, 1, 1)12 (AIC = 10,647), foi usado para prever o número mensal de internamentos em 2017 e 2018. Considerando a disponibilidade de novos dados a cada mês, foi avaliada a capacidade preditiva do modelo para os horizontes temporais de 1, 3, 6 e 12 meses. De uma forma geral, o modelo re-estimado teve um melhor desempenho do que o modelo atualizado, registando-se o menor erro médio em previsões a um mês obtidas por meio de um janela móvel (MAE = 39,5; RMSE = 47,4; MAPE = 7,8%). Independentemente de ser usada uma janela fixa ou móvel na recalibração do modelo, a capacidade preditiva deste piorou com o aumento do horizonte temporal para 3, 6 e 12 meses. Em todo o caso, quer por via da atualização, quer da recalibração do modelo, foi observado um erro relativo inferior a 10% num horizonte temporal até seis meses. Foi ainda calculado o MAPE para 2017 e 2018, considerando a re-estimação do modelo com janela móvel a cada 1, 3, 6 e 12 meses. Neste caso, previsões a três meses apresentaram a maior precisão, com um erro anual médio de 7,7%, muito próximo do obtido com previsões a um mês (MAPE = 7,8%). Da re-estimação do modelo a cada 12 meses resultou o maior erro de previsão (MAPE = 12,4%), representando, ainda assim, uma redução de 30% face ao modelo de referência (MAPE = 17,7%). A representação gráfica das previsões do modelo SARIMA mostrou que estas ficaram maioritariamente acima da série observada, sobretudo em 2018. Não obstante, com a exceção de fevereiro de 2017 e maio de 2018, todos os valores observados se situaram entre os limites obtidos para as previsões. Estes resultados suportam a aplicação de modelos SARIMA na previsão de internamentos por diabetes em Portugal a curto/médio prazo, permitindo que decisões ao nível da gestão hospitalar sejam tomadas atempadamente. Esta seria uma forma de melhorar a capacidade de resposta dos serviços de saúde, sobretudo em períodos de maior fluxo de pacientes. Permitiria, igualmente, um uso mais eficiente do orçamento, pela adequação de recursos às reais necessidades dos pacientes, sem comprometer a qualidade dos cuidados prestados. Não desvirtuando o estudo de um ponto de vista clínico e epidemiológico, este tem associadas algumas limitações metodológicas. Começar por referir que foram incluídos apenas os diagnósticos principais de diabetes e os tipos mais comuns da doença, subestimando quer o seu impacto, quer a procura de cuidados de saúde específicos por esta causa. Por outro lado, o uso de dados agregados a nível nacional inviabiliza o uso das previsões obtidas em contextos reais de prática clínica. No que concerne à modelação dos dados, o uso do AIC como critério de seleção pode ter levado a uma interpretação errónea da qualidade dos modelos, dada a sua aplicação a diferentes conjuntos de dados (série original e diferenciada). Como trabalho futuro neste campo de investigação, conta-se a realização de uma análise espaciotemporal de internamentos hospitalares por diabetes, segundo métodos Bayesianos hierárquicos de mapeamento de doenças, considerando características sociodemográficas da população e indicadores de acesso a cuidados de saúde a nível regional.
Diabetes is a chronic disease characterized by high blood sugar levels, as a result of the progressive destruction or dysfunction of the pancreatic 𝛽-cells that produce insulin, an anabolic hormone involved in cellular glucose uptake and metabolism. Poor self-management and inefficient monitoring at primary health care contribute to an inadequate glycaemic control, which often leads patients to seek hospital health care, while facing acute or long-term complications of diabetes. The objective of this study is then to describe and model a series of hospitalizations due to diabetes in Portugal, with an emphasis on prediction. Episodes of hospital admissions occurred between 2010 and 2018 with main diagnosis of diabetes, coded, up to the third digit, by 250, according to International Classification of Diseases (ICD), 9th Revision, Clinical Modification (ICD-9-CM), or E10, E11, E13, based on the 10th revision of ICD (ICD-10-CM/PCS), and duration of at least one day were selected from the Hospital Morbidity Databases provided by the Central Administration of the Health System (ACSS), I.P. Following the Box-Jenkins approach for Seasonal Autoregressive Integrated Moving Average (SARIMA) modelling, a time series analysis on monthly hospitalizations in Portugal from January 2010 to December 2018 was conducted. Using data from 2010 to 2016 (84 observations), several models were identified as suitable and estimated by maximum likelihood. Akaike´s information criterion (AIC) was used to select the best model, whose adequacy was further investigated by residual analysis. For the selected model, 1, 3, 6 and 12-month forecasts were computed and compared against the observed series in 2017 and 2018, based on rolling-origin-update and rolling-origin-recalibration evaluation, with either a fixed (all available data) or rolling window (data from the last 84 months). The predictive ability of this model was assessed using the Mean Absolute Error (MAE), the Root Mean Square Error (RMSE) and the Mean Absolute Percentage Error (MAPE), and compared with a benchmark method, namely a Seasonal Random Walk. From 2010 to 2018, there were 73,050 hospitalizations due to diabetes in Portugal, representing 35% of all admissions for this cause. The series of monthly hospitalizations exhibits a decreasing trend and apparent seasonality, with a higher number of episodes observed in winter months. From nine candidate models, the SARIMA(1, 1, 2) × (0, 1, 1)12 (AIC = 10.647) was selected as the most parsimonious and used to predict hospitalizations in 2017 and 2018. For both rolling-origin-update and rolling-origin-recalibration, the relative error was lower than 10% for a forecast horizon up to six months. Overall, rolling-origin-recalibration performed better, with the lowest MAPE obtained with one-month forecasts, given either a fixed or a rolling window (8.2% and 7.8%, respectively). As the forecast timespan increased, up to 3, 6 and 12-months, the predictive accuracy of the model worsened. The average error for 2017 and 2018, obtained by using a rolling window to re-estimate the model every 1, 3, 6 and 12 months, revealed predictions at three months as the most accurate (MAPE = 7,7%), followed by those at one month (MAPE = 7,8%). The highest error was obtained with 12-month forecasts (MAPE = 12,4%), still representing a 30% reduction in relation to the benchmark model (MAPE = 17,7%). The graphical representation of the forecasts showed that the selected model often overestimated the observed series, yet, all but two observations were in the 95% prediction interval. The selected model was able to capture the seasonal patterns of the series, revealing a good predictive ability up to six months. These findings suggest that SARIMA models can be used to forecast hospitalizations due to diabetes at short/medium term with good accuracy, allowing for management decisions to be taken timely. Future work on this field of research includes a spatiotemporal analysis of hospitalizations due to diabetes in Portugal, following a Bayesian hierarchical disease mapping approach, while taking into account population socioeconomic characteristics and access to health care.
Diabetes is a chronic disease characterized by high blood sugar levels, as a result of the progressive destruction or dysfunction of the pancreatic 𝛽-cells that produce insulin, an anabolic hormone involved in cellular glucose uptake and metabolism. Poor self-management and inefficient monitoring at primary health care contribute to an inadequate glycaemic control, which often leads patients to seek hospital health care, while facing acute or long-term complications of diabetes. The objective of this study is then to describe and model a series of hospitalizations due to diabetes in Portugal, with an emphasis on prediction. Episodes of hospital admissions occurred between 2010 and 2018 with main diagnosis of diabetes, coded, up to the third digit, by 250, according to International Classification of Diseases (ICD), 9th Revision, Clinical Modification (ICD-9-CM), or E10, E11, E13, based on the 10th revision of ICD (ICD-10-CM/PCS), and duration of at least one day were selected from the Hospital Morbidity Databases provided by the Central Administration of the Health System (ACSS), I.P. Following the Box-Jenkins approach for Seasonal Autoregressive Integrated Moving Average (SARIMA) modelling, a time series analysis on monthly hospitalizations in Portugal from January 2010 to December 2018 was conducted. Using data from 2010 to 2016 (84 observations), several models were identified as suitable and estimated by maximum likelihood. Akaike´s information criterion (AIC) was used to select the best model, whose adequacy was further investigated by residual analysis. For the selected model, 1, 3, 6 and 12-month forecasts were computed and compared against the observed series in 2017 and 2018, based on rolling-origin-update and rolling-origin-recalibration evaluation, with either a fixed (all available data) or rolling window (data from the last 84 months). The predictive ability of this model was assessed using the Mean Absolute Error (MAE), the Root Mean Square Error (RMSE) and the Mean Absolute Percentage Error (MAPE), and compared with a benchmark method, namely a Seasonal Random Walk. From 2010 to 2018, there were 73,050 hospitalizations due to diabetes in Portugal, representing 35% of all admissions for this cause. The series of monthly hospitalizations exhibits a decreasing trend and apparent seasonality, with a higher number of episodes observed in winter months. From nine candidate models, the SARIMA(1, 1, 2) × (0, 1, 1)12 (AIC = 10.647) was selected as the most parsimonious and used to predict hospitalizations in 2017 and 2018. For both rolling-origin-update and rolling-origin-recalibration, the relative error was lower than 10% for a forecast horizon up to six months. Overall, rolling-origin-recalibration performed better, with the lowest MAPE obtained with one-month forecasts, given either a fixed or a rolling window (8.2% and 7.8%, respectively). As the forecast timespan increased, up to 3, 6 and 12-months, the predictive accuracy of the model worsened. The average error for 2017 and 2018, obtained by using a rolling window to re-estimate the model every 1, 3, 6 and 12 months, revealed predictions at three months as the most accurate (MAPE = 7,7%), followed by those at one month (MAPE = 7,8%). The highest error was obtained with 12-month forecasts (MAPE = 12,4%), still representing a 30% reduction in relation to the benchmark model (MAPE = 17,7%). The graphical representation of the forecasts showed that the selected model often overestimated the observed series, yet, all but two observations were in the 95% prediction interval. The selected model was able to capture the seasonal patterns of the series, revealing a good predictive ability up to six months. These findings suggest that SARIMA models can be used to forecast hospitalizations due to diabetes at short/medium term with good accuracy, allowing for management decisions to be taken timely. Future work on this field of research includes a spatiotemporal analysis of hospitalizations due to diabetes in Portugal, following a Bayesian hierarchical disease mapping approach, while taking into account population socioeconomic characteristics and access to health care.
Descrição
Trabalho de projeto de mestrado em Bioestatística, Universidade de Lisboa, Faculdade de Ciências, 2020
Palavras-chave
Modelos SARIMA Previsão Avaliação de origem móvel Diabetes Internamentos Teses de mestrado - 2020
