Logo do repositório
 
A carregar...
Miniatura
Publicação

Analysis of gene expression in adipocytes of individuals with metabolic syndrome by multivariate statistical methods

Utilize este identificador para referenciar este registo.
Nome:Descrição:Tamanho:Formato: 
ulfc121650_tm_Jaime_Combadão.pdf1.69 MBAdobe PDF Ver/Abrir

Resumo(s)

Metabolic syndrome is defined as a cluster of cardiovascular risk factors. Its presence is associated with the occurrence of many biologic phenomena, diseases and conditions, as insulin resistance, inflammation, oxidative stress, diabetes, mental diseases and increased severity of health problems. It is also very prevalent in modern societies due to lifestyle choices and due to the ageing of the populations. Due to human variability in behaviors, food choices, chosen environments, genetic and epigenetic traits, amongst other factors, the working definition of metabolic syndrome must be adapted to the population under study. Some previous work from other researchers suggests that a definition of metabolic syndrome as a continuous variable can be better suitable to the clinical and ambulatory settings, to effective interventions in the population and to the progress in the scientific knowledge. Besides that, it is our believe that gene expression studies (and generally genomics studies) can also benefit greatly from this redefinition. In this work, for a male Finnish population, from whom we have clinical measures, we have redefined the metabolic syndrome as a continuous variable. This result can be used to improve the knowledge in the diagnostics and prognostics of this syndrome, in this population. Even more, with the data of the gene expression in abdominal adipocytes of these men, we have used multivariate statistical methods, as principal component analysis, non-negative matrix factorization and independent component analysis to create components/factors that are associated with the continuous variable mentioned. In this way, by annotation of the genes that have the major contributions in these components/factors, we expect to ag genes as good candidates to further research.
A síndrome metabólica é definida como um agregado de fatores de risco cardiovasculares. Pode ser medida facilmente por um conjunto de medidas em ambiente clínico e/ou ambulatório: a tensão arterial; a frequência cardíaca; o índice de massa corporal ou outra medida antropométrica com funcionalidade semelhante; concentrações séricas de biomoléculas; etc. Por esse motivo, é considerada como facilmente mensurável. A sua importância vem do facto de estar associada ao aparecimento prematuro ou ao aumento da gravidade de várias doenças, condições ou fenómenos biológicos, como a diabetes, várias doenças mentais, a resistência à insulina, inflamação, stress oxidativo. Em alguns estudos transversais e estudos de coorte, a razão de chances e o risco relativo foram estimados, obtendo valores de cerca de 1.2- 1.8 para a progressão para a doença cardiovascular e de 4.1 para o risco de progressão para o diabetes tipo 2. Para além da importância clínica, de risco individual, de cada sujeito, a prevalência da síndrome metabólica nas populações europeias modernas é elevada e, por esse motivo, considerada como um problema de saúde pública. Tipicamente encontramos valores na gama de 20% a 80% de prevalência (ajustada para as idades) nas diferentes comunidades europeias. A definição atual da síndrome metabólica, feita pela pontuação obtida num conjunto de pontos de corte em medidas clínicas já referidas acima é pouco fina, pelo que não permite a desejável discriminação das pessoas afetadas em termos de gravidade da síndrome. Ao longo dos últimos anos na investigação desta síndrome, existe um cada vez maior consenso na necessidade de se evoluir desta situação para uma em que a definição de síndrome metabólica seja baseada numa variável contínua composta. No entanto, algumas das tentativas realizadas foram baseadas apenas na soma de valores standardizados das variáveis referidas, e não tiveram em conta a necessidade de atribuir pesos diferentes às variáveis aquando da construção da variável contínua referente à síndrome metabólica. Mais recentemente, outros autores progrediram para o uso da análise fatorial confirmatória para estimar a diferente contribuição de cada uma das variáveis clínicas referidas. No entanto, esta construção é sempre específica para a população em estudo devido à existência de muitas variáveis que ainda são desconhecidas ou cuja medição é complicada. Neste trabalho começámos por usar o método de análise fatorial confirmatória para quantificar a gravidade da síndrome metabólica numa população de homens finlandeses. Este modelo, que se apresentou muito adequado aos dados usados, permitirá melhorar o diagnóstico e, assim, melhorar o prognóstico para esta população. A quantificação da gravidade permitirá também melhorar as intervenções populacionais pelo maior esforço nos grupos de maior risco e na melhoria da sensibilização dos utentes dos serviços de saúde. Esta metodologia permite também a utilização do modelo construído através de uma série de expressões fáceis de calcular em ambiente ambulatório e por todos os profissionais de saúde, sem necessidade de se recorrer a software estatístico ou a pressionais mais qualificados na área da estatística. No entanto, as variáveis clínicas são uma consequência da presença da síndrome metabólica e de muitos outros fenómenos sociais e biológicos. Para entendermos esta síndrome é necessário pesquisar as suas causas. Nesta parte do trabalho concentrámo-nos nas possíveis associações genéticas, ou seja, na identificação dos genes cuja expressão esteja associada à gravidade desta síndrome. Mais especificamente, analisamos a expressão génica dos adipócitos abdominais, da população já referida acima, através da análise de dados de microarrays. Existem vários métodos estabelecidos na literatura para a análise de microarrays, sendo a maior parte deles da área da estatística multivariada. Um dos métodos utilizados foi o de análise em componentes principais, sendo este um método clássico na área. Em termos biológicos, este método tem sido referenciado como tendo a desvantagem de criar componentes ortogonais. Considera-se que as componentes nestes sistemas de expressão génica não têm que ser necessariamente ortogonais e, talvez por isso, esta técnica seja à partida menos adequada que outros métodos na área. No entanto, é um facto que apresentou resultados que permitiram a evolução da área e continua a ser uma referência. A factorização matricial não negativa é um método de decomposição matricial utilizado quando as matrizes não apresentam valores negativos. Tem sido utilizada de forma frequente na análise de dados genómicos e apresenta a vantagem de ser mais propensa a criar soluções com maior sparsity, levando a interpretações mais simples e mais fáceis de testar biologicamente. Neste trabalho, começámos por analisar os dados de microarrays por análise em componentes principais e depois prosseguimos para a decomposição matricial não-negativa e para a análise em componentes independentes. Esta última análise tem como uma das suas propriedades que as componentes criadas serão estatisticamente independentes, o que é considerado uma vantagem em sistemas de regulação genética, já que permite testar a modularidade natural destes sistemas. Estes métodos permitiram criar novas componentes/factores que, ao mesmo tempo que explicaram uma parte importante da variabilidade dos dados, permitiram a análise dos mesmos num espaço de dimensão muito mais reduzida. Nesse sentido, todas as técnicas referidas tiveram sucesso. No entanto, um dos objectivos desta parte do trabalho foi o de encontrar componentes/factores que pudessem ter uma associação com a variável contínua de gravidade da síndrome metabólica criada por análise fatorial confirmatória. O que esperamos é que o fenótipo medido pelas variáveis clínicas e codificado pelo modelo construído por análise fatorial confirmatória possa dar-nos pistas e maior conhecimento sobre quais os genes cuja expressão poderá estar mais associada à síndrome. A análise correlacional por coeficiente de Pearson indicou uma das componentes criadas pela análise en componentes independentes como tendo uma correlação razoável (0.63) com a gravidade da síndrome metabólica, sendo esta maior do que as correlações obtidas com outros métodos. No entanto, é interessante referir que com a análise em componentes principais também se obteve uma componente com uma correlação de 0,47. A seguir à identificação das componentes com maior correlação com a gravidade do fenótipo estudado, procedemos à identificação dos genes com maior contribuição para estas componentes. Descobrimos então que estes genes são essencialmente da área metabólica, inflamação e relacionados com o sistema imunitário. Embora o facto de estas áreas serem importantes nesta síndrome seja já do conhecimento generalizado dos investigadores, a pesquisa mais fina permitirá muito provavelmente identificar genes que podem ser alvo de mais pesquisa para aumentar o conhecimento nesta síndrome e nas terapias a ela associadas. Em sumário, neste trabalho construímos um modelo estatístico para a gravidade da síndrome metabólica, com a ajuda da análise fatorial confirmatória, aplicável à população de onde a amostra foi originada. Cremos que esta foi a primeira vez que um modelo estatístico desta natureza foi construído para uma população de homens da Finlândia. Este modelo permitir à melhorar a qualidade do diagnóstico e do prognóstico nesta população. Para além disso, através dos métodos estatísticos multivariados já referidos, conseguimos encontrar os genes cuja expressão génica tem uma contribuição mais associada a esta síndrome metabólica. Este conhecimento, também criado pela primeira vez por estas técnicas, permitirá aprofundar a pesquisa genómica nesta síndrome levando potencialmente a maior conhecimento científico e a novas terapias.

Descrição

Trabalho de projeto de mestrado, Bioestatística, Universidade de Lisboa, Faculdade de Ciências, 2017

Palavras-chave

Síndrome Metabólica Análise factorial confirmatória Análise em componentes principais Análise em componentes independentes Trabalhos de projeto de mestrado - 2017

Contexto Educativo

Citação

Projetos de investigação

Unidades organizacionais

Fascículo

Editora

Licença CC