| Nome: | Descrição: | Tamanho: | Formato: | |
|---|---|---|---|---|
| 3.25 MB | Adobe PDF |
Autores
Resumo(s)
Streptococcus dysgalactiae (SD) é uma bactéria Gram-positiva pertencente aos grupos de Lancefield
C, G, L e, raramente, A. Esta espécie subdivide-se nas seguintes subespécies: Streptococcus
dysgalactiae subsp. equisimilis (SDSE) e Streptococcus dysgalactiae subsp. dysgalactiae (SDSD).
Ambas causam infeções em diversos organismos. SDSE é beta-hemolítica, pertence aos grupos de
Lancefield C, G, L e A, e causa infeções em humanos e animais domésticos. SDSD é alfa-hemolítica
ou não hemolítica, pertence ao grupo de Lancefield C, e causa infeções em animais de criação como
vacas e ovelhas. Porém, nos últimos anos foram reportados quatro casos de infeções por SDSD em
humanos. SD apresenta grande variabilidade genética devido a fenómenos de recombinação genética e
transferência horizontal de genes.
Os genomas para análise desta espécie podem ser obtidos a partir de bases de dados públicas
dedicadas a gerir dados genómicos, tais como o National Center for Biotechnology (NCBI) e o
European Nucleotide Archive (ENA) ou a partir de coleções privadas. O método de multilocus
sequence typing (MLST) é frequentemente aplicado para realizar a tipagem desta espécie com base na
identificação de 7 genes. A combinação de alelos identificados para estes 7 genes permite a atribuição
de um Sequence Type (ST). A ferramenta mlst (https://github.com/tseemann/mlst) é utilizada para
identificar o ST com base nas definições de ST geridas pela plataforma PubMLST. A tipagem desta
espécie também é realizada através da identificação do gene de virulência emm. Uma das ferramentas
utilizadas para identificação do gene emm é o emmtyper (https://github.com/MDU-PHL/emmtyper).
Como as ferramentas e métodos de tipagem acima mencionados baseiam a sua análise numa
pequena fracção do genoma de SD, não apresentam resolução suficiente para identificar determinadas
sublinhagens. Os métodos de core genome MLST (cgMLST) e whole genome MLST (wgMLST)
permitem analisar e comparar genomas com base em centenas ou até milhares de genes, apresentando
resolução bastante superior ao MLST clássico. O método de cgMLST analisa os genes distintos
comuns a todos os genomas de um conjunto, enquanto que o método de wgMLST analisa todos os
genes distintos identificados num conjunto de genomas. A ferramenta chewBBACA
(https://github.com/B-UMMI/chewBBACA) é utilizada para análises cg/wgMLST. A criação de um
esquema cg/wgMLST robusto apresenta os seguintes requisitos: a selecção de um conjunto de
genomas de alta qualidade que representem a diversidade genética da espécie ou linhagem de
interesse; a identificação de novos alelos para os genes do esquema a partir de um conjunto de
genomas mais diverso; a anotação funcional dos genes do esquema e refinação do esquema para
identificar e remover parálogos, alelos truncados, fusões de genes, entre outros problemas.
Para desenvolver um esquema cg/wgMLST para SD, foram selecionados 56 genomas de alta
qualidade que abrangem a diversidade genética das duas subespécies. Utilizando a versão 2.8.5 da
ferramenta chewBBACA, foi criado um esquema com 4780 genes identificados neste conjunto de
genomas. Os alelos presentes no conjunto de genomas utilizados para criar o esquema inicial e um
conjunto de 1527 genomas draft públicos e pertencentes à Unidade de Microbiologia Molecular e
Infecção do Instituto de Medicina Molecular (iMM) foram adicionados ao esquema através do módulo
AlleleCall. No total, 189972 alelos foram adicionados ao esquema, equivalendo a 125823 proteínas
distintas. Considerando todos os genomas utilizados para criar o esquema, o core genome é constituído
por 564 genes (11.80% do esquema).
Para analisar o core genome desta espécie foi utilizada a plataforma PHYLOViZ 2.0
(https://online2.phyloviz.net/index). Esta plataforma gera grafos Minimum Spanning Tree like (MST-like) com base nos perfis alélicos ao nível do core genome determinados pela ferramenta
chewBBACA. Também permite associar metadados às análises (e.g. informação sobre o ST, tipo de
emm, fatores de virulência presentes nos genomas). A visualização da MST permite explorar as
características de cada genoma e encontrar grupos de estirpes potencialmente relacioandas com base
no número de diferenças alélicas e nos metadados
A visualização da MST obtida em conjunto com os metadados permitiu distinguir três grupos
de genomas. Foi possível identificar um grupo constituído por estirpes de SDSE identificadas apenas
em humanos, estirpes de SDSE identificadas em animais e humanos, e estirpes de SDSD presentes em
diversos hospedeiros, incluindo humanos. A análise destes grupos em separado permitiu a
identificação do core genome específico de cada grupo e subsequente aumento da resolução de análise.
O grupo de SDSE exclusivo de humanos partilhava um core genome de 724 genes (15.15% do
esquema), o grupo de SDSE de animais e humanos apresentava um core genome de 1103 genes
(23.07% do esquema) e o grupo de SDSD de 1196 genes (25.02% do esquema). O único grupo em que
foi observada uma subdivisão devido à análise em separado foi o grupo de SDSE de animais, onde um
subgrupo constituído por amostras obtidas a partir de cavalos e cães apresentava 1050 diferenças
alélicas (95.19% do core genome deste grupo) relativamente a outro subgrupo característico de outros
hospedeiros.
Potenciais zoonoses foram identificadas nos grupos de SDSE de animais. Também foram
encontrados casos de potenciais zoonoses no grupo de SDSD, subespécie que no passado era associada
exclusivamente a infeções em animais, com apenas quatro casos de infeções em humanos descritos.
Foram examinados todos os possíveis casos de zoonose, incluindo a variação do número de alelos
distintos, diferença de ST e tipo de emm. No grupo de SDSE de animais, as possíveis zoonoses estão
dispersas pela MST. O maior número de amostras obtidas a partir de humanos com menor número de
diferenças alélicas encontra-se num subgrupo associado a galinhas/humanos, onde há uma grande
variação ao nível de ST, mas que partilham o mesmo tipo de emm. No grupo de SDSD, foram
identificados três potenciais zoonoses. Esses casos apresentam um grande número de diferenças
alélicas entre si, não estando relacionados. Dois dos casos apresentavam poucas diferenças alélicas,
estando associadas a espécies animais próximas e compartilhando o mesmo ST.
Dos factores de virulência identificados nas amostras, apenas dois estão presentes
universalmente, fbp54 e hasC. O fator de virulência fbp54 produz uma glicoproteína de ligação à
fibronectina, com função de mediar a adesão do patogénio às células do hospedeiro. O gene de
virulência hasC faz parte do operão hasABC, que codifica a cápsula de ácido hialurónico em
Streptococcus pyogenes (GAS). No entanto, a cápsula de ácido hialurónico não é produzida em SD, o
que é explicado pela ausência dos genes hasA e hasB. Outro gene de virulência que está presente nos
três grupos, embora em proporção variável, é o gene sda. Alguns dos genes identificados são
específicos de uma subespécie, como é o exemplo de speG. O gene mf3, foi identificado nos grupos de
SDSE de humanos e SDSD, mas não está presente no grupo de SDSE animal.
O SD é um patogénio emergente de grande importância que pode causar infeções em humanos
e outros animais. Dada a falta de caracterização genética e epidemiológica desta espécie, era
necessário criar um esquema wgMLST robusto que contemplasse toda a diversidade genética de SD.
A utilização de esquemas deste tipo permite a simplificação de diversos estudos, incluindo a
identificação de fatores de virulência e genes de resistência a antibióticos, bem como a monitorização
deste patogénio para a prevenção e identificação de possíveis surtos. Com o aumento da sequenciação genética desta espécie, também será possível expandir o esquema com novos alelos e identificar novas
linhagens de SD, o que permitirá prevenir zoonoses, salvar vidas e reduzir custos da indústria
pecuária.
Streptococcus dysgalactiae (SD) is a pathogen with high genetic variability that affects a wide variety of hosts, including humans It is subdivided into two subspecies, Streptococcus dysgalactiae subsp. equisimilis (SDSE) and Streptococcus dysgalactiae subsp. Dysgalactiae (SDSD), due to factors such as recombination and horizontal gene transfer. By using a gene-by-gene approach on 56 draft and complete assemblies representing the diversity of this species, a novel draft whole-genome multilocus sequence typing (wgMLST) schema was developed, consisting of 4780 loci covering the genomic diversity of both SD subspecies. The schema was used for wgMLST analysis of all publicly available SD assemblies, as well as assemblies from another study and a private collection. The results of the core-genome MLST (cgMLST) for the gathered datasets were analysed using PHYLOViZ. Clustering based on cgMLST data revealed a clear division of this species into three groups: human SDSE group, animal SDSE group and SDSD group. Each group was analysed in terms of the sequence type (ST) composition, host distribution, emm typing and other virulence factors to identify potential zoonotic transmissions. As expected, potential zoonotic transmissions were identified in animal SDSE. Several potential zoonotic transmissions were identified in the SDSD group, subspecies that was described to be exclusively pathogenic to animals with only a handful of zoonotic cases described. Several virulence factors were found to be present in all of the isolates, including fbp54 and hasC, while others, such as sda, were found to be in varying proportion in the three groups. Some were found to be subspecies specific, such as speG in SDSE, while others like mf3 were found to be present only in human SDSE and SDSD.
Streptococcus dysgalactiae (SD) is a pathogen with high genetic variability that affects a wide variety of hosts, including humans It is subdivided into two subspecies, Streptococcus dysgalactiae subsp. equisimilis (SDSE) and Streptococcus dysgalactiae subsp. Dysgalactiae (SDSD), due to factors such as recombination and horizontal gene transfer. By using a gene-by-gene approach on 56 draft and complete assemblies representing the diversity of this species, a novel draft whole-genome multilocus sequence typing (wgMLST) schema was developed, consisting of 4780 loci covering the genomic diversity of both SD subspecies. The schema was used for wgMLST analysis of all publicly available SD assemblies, as well as assemblies from another study and a private collection. The results of the core-genome MLST (cgMLST) for the gathered datasets were analysed using PHYLOViZ. Clustering based on cgMLST data revealed a clear division of this species into three groups: human SDSE group, animal SDSE group and SDSD group. Each group was analysed in terms of the sequence type (ST) composition, host distribution, emm typing and other virulence factors to identify potential zoonotic transmissions. As expected, potential zoonotic transmissions were identified in animal SDSE. Several potential zoonotic transmissions were identified in the SDSD group, subspecies that was described to be exclusively pathogenic to animals with only a handful of zoonotic cases described. Several virulence factors were found to be present in all of the isolates, including fbp54 and hasC, while others, such as sda, were found to be in varying proportion in the three groups. Some were found to be subspecies specific, such as speG in SDSE, while others like mf3 were found to be present only in human SDSE and SDSD.
Descrição
Tese de Mestrado, Bioinformática e Biologia Computacional, 2024, Universidade de Lisboa, Faculdade de Ciências
Palavras-chave
Streptococcus dysgalactiae Core/whole Genome Multilocus Sequence Typing Fatores de virulência Teses de mestrado - 2024
