79
Análise de Microbiomas João Carlos Setubal

Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Análise de Microbiomas

João Carlos Setubal

Page 2: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Os microorganismos estão portoda parte

• São responsáveis por muitos processosfundamentais para a vida do planeta em gerale para a vida dos seres humanos em particular

Page 3: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

junho 2012

Projeto Microbioma Humano

June 2012 Issue

outubro 2012maio 2013

Page 4: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

www.earthmicrobiome.org

Page 5: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Há uma certa confusão

• Earth Biogenome Project (EBP)

• Projeto lançado em 2017 que pretendesequenciar “all life on Earth”

– voltado para eucariotos

Page 6: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Comunidades microbianas –Microbiotas– são típicas

de cada ambiente

6

Page 7: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Microbiotas contêmvariedade de microrganismos

Bacteria

Archaea

EukaryaFungiProtozoans

Vírus e Bacteriófagos7

Page 8: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Imagem adaptada de: Whiteside, S. A. et al. (2015) The microbiome of the urinary tract—a role beyond infection Nat. Rev. Urol. doi:10.1038/nrurol.2014.361

Genes, Genomas,Proteínas e Metabólitos da Microbiota

Microbioma

Proteínas e Metabólitos da respostado Hospedeiro à interação com a microbiota

Metabólitos do hospedeiroProteínas do hospedeiro

Metabólito da microbiotaProteína da microbiota

Page 9: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Como acessar essa extraordinária riqueza microbiológica?

Abordagens dependentes de cultivo

Cultivo de bactérias em meio sólido

Imag

em

: Ju

lio O

live

ira

9

Page 10: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

A fração cultivável da vasta riqueza microbiana da biosfera é muit0 pequena (estimada em 1%)

Porém...

10

Page 11: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Como acessar a extraordinária maioria invisível?

→ Abordagens independentes do cultivo

11

Page 12: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

12

MetaGenômicarevela as espécies, os genes e genomas de

comunidades microbianas

MetaTranscritômicarevela os genes expressos (microbiota ativa)

MetaProteômicarevela as proteínas expressas (microbiota ativa)

Meta-ômicas

Page 13: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Amostra ambiental

454 - RocheIllumina HiSeq

Illumina MiSeq

Ion ProtonPacBio

SoLiD

IlluminaNextSeq500

13

MetaGenômica e MetaTranscritômica

Extrair o DNA(ou RNA)

Sequenciamento de DNA alto-desempenho

Sequenciar

Analisar as sequências de

DNA: metagenômicacDNA: metatranscritômica

Page 14: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Tecnologias de sequenciamento

• NGS – next generation sequencing

– Illumina

• 90% do mercado

• Em metagenômica talvez seja perto de 100%

– PacBio

• Long reads

– Nanopore

• Long reads

Page 15: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Big Data

• Milhões de reads

• Que significa isto?

• Supondo

– cada read com 300 bp

– 10 milhões de reads para uma amostra

– 10 x 106 x 300 = 3 x 109 bp

– Um genoma bacteriano: 5 x 106 bp

– Equivalente a 600 genomas bacterianos

• A bioinformática é essencial

Page 16: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Metagenômica: tipos de Dados

16S / 18S / ITS shotgun

Page 17: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Alberts et al. 2008

Page 18: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Crédito: Christel Chehoud, http://slideplayer.com/slide/4641762/

Page 19: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Primers “universais”

Alta variabilidade

Baixa variabilidade

Page 20: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

DNA shotgun

• Sequenciar o DNA total da amostra

• Resultado

– Milhões de fragmento

– Mistura dos DNAs dos diversos organismospresents

– fragmentos devem ser montados

Page 21: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Montagem de genomas

buraco

contig

Page 22: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Montagem

• Montagem é essencial para

– Análise funcional

– Recuperação de genomas

• Objeto principal resultante

– contigs

– genomas draft

• Em raros casos

– genomas completos

Page 23: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

16S vs. shotgun: objetivos

• 16S

– Composição e estrutura da microbiota

• “perfil taxonômico”

• Shotgun

– Resultados mais detalhados

• Perfil taxonômico

• Funções gênicas

• genomas

Page 24: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

16S e shotgun: positivos e negativos

16S shotgun

custo Mais baixo Mais alto

Vieses (biases) Menor chance de serrepresentativo

Maior chance de “pegar tudo”

Bancos de dados Maior cobertura Menor cobertura

Identificaçãotaxonômica

Menos precisa (emgeral, não mais do que gênero)

Mais precisa, podendochegar a especie, e talvez cepas

Page 25: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Que perguntas queremos fazer?

Page 26: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Quem está na amostra?

• Identificação taxonômica (16S, shotgun)

• Recuperação de genomas (shotgun)

Page 27: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

JC Setubal 27

16S / DNA shotgun

A comunidade

SEQBIOINFO

populações

Page 28: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Recuperação de genomas

JC Setubal 28

A comunidade

SEQBIOINFO

populações

Page 29: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Identificação taxonômica dependede bancos de dados

Page 30: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Bancos de dados de 16S

Page 31: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •
Page 32: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •
Page 33: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Bancos de dados para DNA total

• GenBank

– nt

– nr

– env_nr

– refSeq

– WGS

Page 34: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Classificação taxonômica e abundância relativa

Proteobacteria, 29%

Firmicutes, 27%

Actinobacteria, 16%

Bacteroidetes, 15%

Chloroflexi, 5%

Deinococcus-Thermus, 2%

Cyanobacteria, 1% Planctomycetes, 1%

Acidobacteria, 1%

other, 3%

Page 35: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Genomas de procariotos no GenBank

filo # genomas %

Actinobacteria 4059 13

Bacteroidetes/chlorobi 932 3

Cyanobacteria 340 1

Firmicutes 9628 31

Proteobacteria 14268 46

Spirochaetes 525 2

Others 1500 5

Source: Land et al. 2015

Page 36: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Quais funções estão presentes?

• Em genes (shotgun)

• Em genes expressos (metaTranscritômica)

Page 37: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

ZC1 contig00009.9 (27,919 bp)

1. Beta-xylosidase (376aa, COG3507)2. Dehydrogenases (280aa, COG1028) 3. hypothetical protein (379aa);4. hypothetical protein (283aa)5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717)6. Dehydrogenases (267aa, COG1028)7. hypothetical protein (1799aa)8. SusD family protein (606aa, pfam07980)9. TonB-linked outer membrane protein (1068aa, COG4771); 10. Pectate lyase (518aa, COG3866)11. Predicted unsaturated glucuronyl hydrolase12. Pectin methylesterase (568aa, COG4677)13. Endopolygalacturonase (523aa, COG5434)14. Nucleoside-diphosphate-sugar epimerase (326aa, COG0451)15. Nucleoside-diphosphate-sugar pyrophosphorylase (249aa, pfam00483)16. Galactokinase (377aa, COG0153)17.Soluble lytic murein transglycosylase (347aa, COG0741)18. hypothetical protein (235aa)19. Predicted UDP-glucose 6-dehydrogenase (283aa, COG1004).

Page 38: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Metagenômica comparativa

Page 39: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Mesmo local, variação no tempo

Page 40: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Mesmo local, variação de indivíduos

• Amostras da boca

– Indivíduos que fumam

– Indivíduos que não fumam

Page 41: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

http

://h

utt

enhow

er.sph.h

arv

ard

.ed

u/m

eta

ph

lan

Page 42: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Taxonomia

• Xanthomonas citri

• Filo: proteobacteria

– Classe: proteobacteria gama

• Ordem: xanthomonadales

–Família: xanthomonadácea

»Gênero: xanthomonas

• Espécie: citri

Page 43: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

GTDB 2018

Page 44: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •
Page 45: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

OTU

• Unidade taxonômica operacional

• Se for conhecida, leva um rótulo padronizado

– Xanthomonas citri

• Mas pode ser desconhecida

– Nesse caso, recebe um número, que varia de análise para análise

• Conceito comum em análise de dados de 16S

Page 46: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

ASV

• Amplicon Sequence Variant

• A diferença entre duas ASVs pode ser apenas uma base

• é um conceito mais preciso do que OTU

• Deve ser usado em lugar de OTU

– Mas podem ser usados em conjunto

• diferentes ASVs podem corresponder a uma OTU– por exemplo: um gênero

Page 47: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

A amostra é representativa?

• Curvas de rarefação

Page 48: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Curvas de rarefação (ou saturamento)

n. especies

Ou OTUs

n. amostras

Page 49: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Muitas fontes de erro

• Amostragem

• Preparação da biblioteca

• Sequenciamento

• Tamanho da sequência (pode ser curta demais)

• Programas (montadores, classificadores)

• Viéses dos bancos de dados

Page 50: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Classificação de reads de DNA total

• Similaridade com sequências de origemconhecida

– BLAST

• Propriedades intrínsecas de cada sequência

– Assinaturas genômicas

• Apropriado para binning

Page 51: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Por analogia com classificação de reads em dados de 16S (OTUs)

• Separar reads em “caixinhas”

• cada caixinha tem os reads que mutuamente se parecem num nível de 97 ou 98% de identidade

• qual seria o análogo para DNA total?

Page 52: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Classificação com base na frequênciade palavras de k bases

k = 4: AAAA, AAAC, AAAG, AAAT, CAAA, etc…

Dada uma janela de x kb, podemos contar as ocorrências de cada uma dessas palavras dentro da janela

Exemplo:

AGATTAGCGACTATTATAGCCTAGATCGATCATTACC

AGAT ocorre 2 vezes

ATTA ocorre 3 vezes

etc

Palavras de k bases: k-mers (kâmeros)

Page 53: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Matriz de frequências

janela AAAA AAAC AAAG AAAT ACAA ACAC ACAG ACAT

1 15 2

2 16 3

3 14 0

4 13 2

5 15 4

6 12 0

7 18 1

8 17 3

9 16 1

Page 54: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Zho

u, O

lman

, Xu

, BM

C B

ioin

form

ati

cs, 2

00

9

Genome “barcodes”

E. coli K12 E. coli O157

Burkholderia pseudomallei

Pyrococcus furiosusrandom

Page 55: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Não funciona bem com fragmentos curtos

Fragment size, bp

Accuracy, %

Zhou et al, 2009 simulated data

Page 56: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Exercício

• S1 = TTCTACTACT

• S2 = TTGTACTAGG

• S3 = ACTTCTACTA

• Contar palavras de tamanho 2

Page 57: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Montagem de genomas

buraco

contig

Page 58: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Montagem

• Em genomas bacterianos isolados, é um processorazoavelmente bem compreendido

• Em metagenomas há velhas e novas dificuldades

– Mistura de organismos

• Quimeras

• Transferência lateral

– Repetições

– Tamanho dos conjuntos de dados

– Chegando a bilhões de reads

Page 59: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Exemplo de quimerismo

chlorobiumfirmicutes euryarch.

proteob.

crenarch.

g1 g2 g3 g4 g5contig

genes

Page 60: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Paradigmas de montagem

• OLC

– overlap, layout, consensus

– mais rigoroso, mas mais lento

• k-meros + grafos de de Bruijn

– menos rigoroso, mas muito mais rápido

– mais apropriado para metagenômica

Page 61: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

grafos de de Bruijn

http://chessprogramming.wikispaces.com/De+Bruijn+sequence

Sobreposição de k-mers

alfabeto binário

k = 1

Page 62: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

http://www.homolog.us/blogs/wp-content/uploads/2011/07/i6.png

Grafo de de Bruijn em montagem

Page 63: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Single-end and Paired-end reads

Crédito: http://www.cureffi.org/2012/12/19/forward-and-reverse-reads-in-paired-end-sequencing/

Page 64: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Anotação funcional

• Pipeline para genomas completos pode ser usado

– Exemplo: IMG/M

• Revejam aula sobre anotação de genomas

Page 65: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Cobertura

• Quanto cada genoma é coberto pelos reads obtidos

• Ambientes de grande riqueza: cobertura baixa

• Cobertura baixa cria contigs pequenos

– maioria das ORFs são parciais

– Dificulta atribuição de função• Potencial gerador de erros

Page 66: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Comparação de metagenomas

• Genomicamente

• Taxonomicamente

• Funcionalmente

• Recursos oferecidos pelo IMG/M

Page 67: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Figure 1. Distribution of the GC content percentage for ZC1 and ZC2 compared with selected metagenomes.

Martins LF, Antunes LP, Pascon RC, de Oliveira JCF, Digiampietri LA, et al. (2013) Metagenomic Analysis of a Tropical Composting

Operation at the São Paulo Zoo Park Reveals Diversity of Biomass Degradation Functions and Organisms. PLoS ONE 8(4):

e61928. doi:10.1371/journal.pone.0061928

http://127.0.0.1:8081/plosone/article?id=info:doi/10.1371/journal.pone.0061928

Page 68: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Genome clustering (IMG/M)

Page 69: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Figure 8. Hierarchical clustering of functional gene groups of ZC1 and ZC2 and seven public metagenomes.

Martins LF, Antunes LP, Pascon RC, de Oliveira JCF, Digiampietri LA, et al. (2013) Metagenomic Analysis of a Tropical Composting

Operation at the São Paulo Zoo Park Reveals Diversity of Biomass Degradation Functions and Organisms. PLoS ONE 8(4):

e61928. doi:10.1371/journal.pone.0061928

http://127.0.0.1:8081/plosone/article?id=info:doi/10.1371/journal.pone.0061928

Categorias COG COGs

Page 70: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Abundância de funções

• mapeamento de reads em ORFs anotadas

70

Page 71: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

• é necessário o conceito de família gênica

• COG

– Clusters of Orthologous Groups

• COGs diferencialmente representados

• Semelhante a genes diferencialmente expressos

• Heat maps, clusterização hierárquica

Abundância relativa espacial

Page 72: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Based on 386 COGs

shared by ATIIC,

Aloha, BATS with

differential

representation

Iquique not included

COGs

Page 73: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Platformas web de processamento

• Laboratórios governamentais

• Serviços padronizados de processamento

Page 74: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •
Page 75: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •
Page 76: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •
Page 77: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Sugestões de leitura

Page 78: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •
Page 79: Análise de Microbiomas - USP · 4. hypothetical protein (283aa) 5. 5-keto 4-deoxyuronate isomerase (280aa, COG3717) 6. ... contig g1 g2 g3 g4 g5 genes. Paradigmas de montagem •

Nature Reviews

Microbiology

2018