PInto, Francisco RodriguesAlmeida, André Moitinho deMonteiro, Lucas da Costa2024-04-222024-04-2220242024http://hdl.handle.net/10451/64476Tese de Mestrado, Bioinformática e Biologia Computacional, 2024, Universidade de Lisboa, Faculdade de CiênciasCom o recente crescimento no interesse da exploração e colonização espacial como a nova vaga de exploração lunar ou até a colonização de Marte por empreendimentos privados, levantam-se questões éticas quanto às suas implicações e responsabilidades. A repentina invasão humana sobre os imaculados habitats extraterrestres poderá provocar contaminação indesejada potencialmente destruindo as suas sensíveis formas de vida. A destruição deste património genético e funcional provar-se-ia um desastre ecológico e científico de escala planetária. Como podemos prevenir esta catástrofe? Que meios podemos oferecer? O Comité de Pesquisa Espacial requer que certas metas sejam cumpridas em missões interplanetárias de modo a evitar uma potencial contaminação direta. As suas recomendações dependem do tipo de missão e do corpo celestial explorado. Incluem montagem em sala limpa, redução da carga biológica, e métodos de esterilização. Estes protocolos provam-se bastante dispendiosos e demorados, podendo até comprometer a praticidade das missões. Podemos desenvolver um método acessível para testar o poder de contaminação de um potencial contaminador? Reconstruções metabólicas à escala genómica mostram-se atualmente capazes de simular e prever o desenvolvimento de bactérias de maneira eficaz, significante e módica. Experiências demonstram que o alastramento destes seres unicelulares é possível e preciso sobre diferentes substratos, conseguindo até prever como o ser se desenvolveria num novo substrato. Este tipo de modelo tem um valor crescente em engenharia genética industrial e na vertente da biologia sintética. No entanto, os seus resultados são relativamente ao crescimento sobre condições ótimas, as quais não serão encontradas noutros cenários ambientais, nomeadamente noutros planetas. Neste projeto pretendese assim testar a adaptação deste tipo de modelos a grande variedade de condições térmicas não ótimas de modo a analisar como as reconstituições metabólicas de seres potencialmente contaminantes reagem nos ambientes extraterrestres e então prever o risco de contaminação. A adaptação do modelo por um terceiro deverá ser simples e rápida, dispondo de ferramentas de análise para auxiliar os seus próprios propósitos. No nosso caso, um modelo metabólico de escala de Escherichia coli será utilizado como backbone do projeto pelo fato de se tratar de um modelo simples, bem estudado, com os dados alvo melhor definidos e disponíveis, pois é um elemento contaminante na Terra, e utiliza o humano como vetor de transmissão. Neste trabalho foram testados vários métodos que utilizaram uma aproximação da cinética enzimática a uma lei de ação de massas. Esta abordagem permite simplificar o modelo, resumindo os parâmetros enzimáticos em apenas um parâmetro cinético e a constante de equilíbrio da reação. O parâmetro cinético engloba características intrínsecas à reação como afinidade catalítica e velocidade enquanto que a constante de equilíbrio considera a influência da temperatura na termodinâmica da reação diretamente e através da variação da energia livre de Gibbs. Esta última serve então como a ponte que necessitamos para adaptar o modelo a diferentes condições térmicas, atuando nas propriedades termoquímicas da reação, e pode ser estimada sabendo a variação de entropia e entalpia da reação e a temperatura a que ela ocorre. Uma vez que estes dados estão apenas parcialmente disponíveis, tivemos de utilizar aproximações que envolveram uma calculadora de termodinâmica bioquímica - eQuilibrator - e dados de uma investigação científica de modo a continuar o projeto. Por outro lado, os parâmetros enzimáticos não estão disponíveis, tampouco o parâmetro cinético que utilizamos na nossa aproximação. Os métodos desenvolvidos servem então para estimar os parâmetros cinéticos das reações e simular os respetivos fluxos da rede metabólica. Primeiramente tentámos estimar este parâmetro algebricamente, revertendo a equação de lei de ação de massas. No entanto, este método provou-se inviável estimando valores negativos ou seja irrealistas. O problema provavelmente advém da incoerência dos nossos dados. Cada concentração é estimada através da análise de diferentes experiências com diferentes condições e protocolos laboratoriais, levando a uma incongruência experimental. O metabolismo dos organismos estudados é sensível a pequenas alterações nas condições daí não podermos esperar que os dados sejam correlacionados. Para resolver este problema implementamos um algoritmo genético que visa minimizar esta incoerência estimando um vetor de concentrações de metabolitos coesas na rede metabólica em estudo. Este algoritmo utiliza um parâmetro de fitness que aproxima as estimativas a uma amostra de fluxos matematicamente coerente obtido de uma análise direta do modelo metabólico. No entanto, os resultados mantiveram-se irrealistas mostrando a importância de uma boa base de dados para os estudos pretendidos. Dada a ausência de dados, decidimos estender o algoritmo genético para os parâmetros cinéticos. Este mantém sempre uma relação com a constante de equilíbrio da reação. Por isso, para evitar que o algoritmo se enviesasse para constantes de equilíbrio absurdas, foram definidos valores limite a partir dos quais as reações passariam a ser irreversíveis. Os resultados para este método foram favoráveis e por isso este foi o método selecionado para analisar os dados de Escherichia coli numa gama diversa de temperaturas. Paralelamente, foi investigado ainda um terceiro método que tira proveito de uma construção matemática que emerge do nosso modelo se considerarmos que as concentrações de metabolito não são significativamente alteradas pela temperatura. No entanto, este método apenas funcionou para a temperatura ambiente, insinuando que a aproximação não é válida numa gama térmica maior. Para analisar um modelo metabólico real e_coli_core, começámos por importar-lo e curá-lo para os nossos objetivos. Considerou-se apenas o metabolito central uma vez que apenas para estas reações temos acesso a dados termoquímicos e sabendo que a dinâmica enzimática é substancialmente diferente para outras reações como de transporte e intercâmbio com o ambiente. Posteriormente, simulou-se o desempenho do modelo para uma gama de temperaturas entre os 10K e os 800K, utilizando perto de 7000 amostras da análise de fluxo para o algoritmo genético. Destas, 1225 foram consideradas plausíveis e devidamente analisadas. Foi descoberto que a osmolaridade da célula mantêm-se relativamente estável para todas as temperaturas, descartando problemas de pressão osmótica. Por outro lado, as constantes cinéticas variavam bastante com a temperatura. Foi então desenvolvida uma função de stresse que compara as constantes a uma dada temperatura com as constantes à temperatura ambiente, ao mesmo tempo que considera o peso da reação em causa na produção de biomassa. Assim, esta função serve como um quantificador de quanto a célula tem de se alterar de modo a corresponder aos requerimentos celulares, quer seja em recursos ou eficácia enzimática. Verificou-se um elevado stresse metabólico entre 10K e 320K, com uma descida abrupta para níveis basais até 620K, e uma subida repentina até 800K. Uma análise mais profunda mostra que estes incrementos em stresse devem-se à irreversibilidade da aconitase a baixas temperaturas e da desidrogenase do gliceraldeído 3-fosfato a altas temperaturas. De notar que ambas as enzimas catalisam reações chave nos ciclos de obtenção de energia celular. Em princípio, esperar-se-ia que os valores da função de stresse à temperatura ambiente de 298K fossem basais. No entanto, não é isso que ocorre, realçando a natureza qualitativa da função em relação a um modo ótimo e a impossibilidade de fazer uma análise de sobrevivência noutros planetas. Contudo, é de notar que a temperatura ótima para a proliferação de E. coli é ligeiramente superior à ambiente, onde o nosso limite se estabelece. Poderá ser que estes microrganismos se desenvolvem a temperaturas menores com uma maior carga enzimática? O limite superior a 620K é bastante superior às mais altas temperaturas registadas suportadas por formas de vida extremas de cerca de 390K. No entanto, note-se que apenas parâmetros termodinâmicos estão a ser considerados e não mecanismos mais termo-sensíveis, como a estrutura de proteínas. Sabendo que os resultados são qualitativos e não permitem uma conclusão sobre a sobrevivência de organismos noutros planetas , apenas uma análise grosseira foi realizada sobre as temperaturas superficiais. Toda a gama de temperaturas marcianas indicam uma maior carga por parte do metabolismo, enquanto certas regiões da Lua apresentam temperaturas ótimas para o seu desenvolvimento, embora com alguma periodicidade. Em resumo, foi desenvolvido um método que adapta modelos metabólicos de escala para qualquer temperatura utilizando um algoritmo genético e uma função de stresse que quantifica o nível de adaptação ao novo ambiente. Para isso, dados experimentais das concentrações de metabolito e dos parâmetros termoquímicos devem ser importados. Estes dados refletem a maior limitação do método pois a sua aquisição pode-se provar desafiante devido a incongruências e recursos. O aparente desempenho ótimo do organismo a altas temperaturas relembra-nos do fato que os resultados não são conclusivos. Uma célula é um mecanismo frágil, sensível, e altamente complexo. Logo, para uma previsão plausível da sua capacidade de adaptação a ambientes inóspitos, outros fatores para além da temperatura devem ser tomados em consideração. Para permitir essa exploração, deverão estar disponíveis dados e recursos adicionais. Não obstante, o presente trabalho permite abrir caminho para o desenvolvimento de métodos mais complexos e precisos, e desvendar o comportamento de organismos em ambientes extremos. Estes métodos podem ser cruciais para o avanço do conhecimento na vertente da engenharia genética e constituir uma ajuda fundamental e inovadora nos mais recentes empreendimentos espaciais.With the growing interest in space exploration, ethical issues arise. The sudden human invasion of pristine extraterrestrial habitats could potentially destroy sensitive life forms, resulting in an ecological disaster. The Committee on Space Research issues goals for interplanetary missions with direct interest in chemical evolution such as biological load reduction, but these are costly and time-consuming. An accessible method to test the contamination potential involves genome-scale metabolic reconstructions. These have shown the ability to simulate and predict bacterial growth effectively and economically on different substrates. However, these models are based on optimal growth conditions, which are unlikely to be found in extraterrestrial environmental scenarios. The project aims to adapt these models to a variety of non-optimal thermal conditions to analyze how the metabolism of potentially contaminating organisms react in extraterrestrial environments and predict contamination risk. The adapted model should be simple and quick to analyse with the provided tools. An Escherichia coli metabolic model is used as the project’s backbone due to its simplicity, well-studied nature, and its role as a contaminant on Earth, easily utilizing humans as dissemination vectors. Several methods using a mass action kinetics simplification were tested, involving thermodynamical data and kinetic parameters estimation to simulate metabolic network flows. However, data inconsistencies and unrealistic results highlighted the importance of a reliable database. An extended genetic algorithm was developed to address incoherence, estimating kinetic parameters that were used to simulate cellular response across temperature ranges from 10K to 800K. The analysis revealed that cellular osmolarity remains stable across temperatures, but kinetic constants vary significantly. A stress function was developed to quantify how much a cell needs to change to meet viability requirements, showing significant metabolic stress between 10K and 320K, and a sudden rise in stress levels above 620K. Due to inconsistency with observations, no final conclusions about potential extraplanetary survival were drawn.engContaminação InterplanetáriaModelos de Escala GenómicaEscherichia coliAlgoritmo GenéticoFunção de StresseTeses de mestrado - 2024E(xtraterrestris). Coli : adapting genome-scale metabolic models to non-standard thermodynamical constraintsmaster thesis203599748