View
21
Download
0
Category
Preview:
DESCRIPTION
Polimorfismos de nucleotídeos únicos em espécies poliplóides. LGE - Laboratório de Genômica e Expressão. Ramon Oliveira Vidal Email: ramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área : Bioinformática Orientador : Gonçalo A.G. Pereira . @ ramonvidal. - PowerPoint PPT Presentation
Citation preview
Polimorfismos de nucleotídeos únicos em
espécies poliplóidesRamon Oliveira Vidal
Email: ramon.vidal@gmail.comDoutorando em Genética e Biologia Molecular
Sub área: BioinformáticaOrientador: Gonçalo A.G. Pereira LG
E - L
abor
atór
io d
e G
enôm
ica
e E
xpre
ssão
@ramonvidal
Marcadores Moleculares◦ Marcadores por Hibridação◦ Marcadores por Amplificação
Polimorfismos X mutações SNPs
◦ Origem◦ Aplicações◦ Haplótipos◦ Genotipagem◦ Identificando os SNPs (em genomas e transcriptomas)
Sanger 454 Solexa
Taxa de evolução Identificação de SNPs em Coffea arabica
Tópicos da Apresentação
Fenótipo Propriedades observáveis de um indivíduo, que
se desenvolveram sob a influência de: genótipo do indivíduo fatores ambientais
Fenótipo e Genótipo
Genótipo Constituição genética de um organismo
como revelada pela análise genética e molecular, ou seja, o conjunto completo de genes, tanto dominantes e recessivos.
Qualquer característica morfológica ou molecular que diferencia indivíduos, e que seja facilmente detectável
Marcadores
É um fenótipo de fácil identificação, normalmente determinado por um único alelo.
Características fenotípicas de fácil identificação visual são utilizadas como marcadores morfológicos desde os tempos de Mendel
Marcadores Morfológicos
Polimorfismo detectado na seqüência de DNA Vantagens:
- Não é objeto de influências ambientais;- Praticamente ilimitado em número;
Maior desvantagem é a necessidade de técnicas e equipamentos mais complexos.
Marcadores de DNA (moleculares)
Reprodutibilidade; Amplamente distribuído através do genoma;
Poder de discriminação; Ausência de influências ambientais; Barato; Fácil de mensurar
Características Desejáveis aos marcadores moleculares
Diplóide: Constituído por duas cópias (homólogos) de cada cromossomo.
Alelo: As formas alternativas de um caráter genético encontrado em um determinado locus de um cromossomo.
Homozigotos: Um organismo diplóide com alelos idênticos de um determinado gene em ambos os cromossomos homólogos.
Heterozigotos :Um organismo diplóide com alelos diferentes de um determinado gene em ambos os cromossomos homólogos.
Alguns conceitos básicos
Diplóide
Haplóide
Alelos
homozigoze
heterozigoze
Hibridação◦ RFLP – (Restriction Fragment Length Polymorphism)◦ Minissatélites – VNTR –(Variable Number of Tandem
Repeats)
Amplificação de DNA◦ RAPD – (Random Amplified Polymorphic DNA)◦ SCAR (Sequence Characterized Amplified Regions)
ou ASA (Amplified Specific Amplicon)◦ Microssatélites –SSR (Simple Sequence Repeats)◦ AFLP (Amplified Fragment Length Polymorphism)
Tipos de marcadores
RFLP – Restriction Fragment Length Polymorphism
RFLP – Restriction Fragment Length Polymorphism
RAPD - Random Amplified Polymorphic DNA
Polimorfismo de DNA entre indivíduos pode ser devido a:• Ausência do sítio do
primer.• Surgimento de um novo
sítio.• Ao comprimento da
região amplificada entre sítios de primer
Significa Seqüências Simples Repetidas, a qual consiste de pequenas seqüências de nucleotídeos (1 a 4) repetidas em tandem.
Essas seqüências são distribuídas ao acaso no genoma e é um dos marcadores mais utilizados atualmente
Microssatélites – SSR (Simple Sequence Repeats)
Primers específicos (20 a 30 pb). Diferentes números de elementos simples
repetidos. Cada segmento amplificado de tamanho
diferente representa um alelo diferente do mesmo loco
Microssatélites – SSR (Simple Sequence Repeats)
Genótipos na eletroforese
Mutações genéticas◦ Alteração na seqüência de nucleotídeos de uma molécula de
DNA. ◦ O termo "mutação“ é geralmente usado para referir-se a
alterações na seqüência de DNA que não estão presentes na maioria dos indivíduos de uma espécie
Polimorfismos genéticos◦ Diferença na seqüência de DNA entre indivíduos, grupos ou
populações. ◦ Incluem SNPs, seqüências repetitivas, inserções, deleções e
recombinações. Podem dar origem a olhos ou olhos castanhos, cabelo liso ou cabelos
crespo◦ Resultado de processos naturais ou induzidos por agentes
externos (como vírus ou radiação).
Polimorfismos genéticos X Mutações genéticas
Polimorfismos genéticos X Mutações genéticas
Polimorfismos são alterações no DNA que se mantém nas gerações futuras◦ Polimorfismo: variação >1%◦ Mutação: variação <1%
C T T A G C T T
C T T A G T T T
Polimorfismo
C T T A G C T T
C T T A G T T T
Mutação
94%
6%
99.9%
0.1%
TAAAAAT
TAACAAT
TAAAAAT TAAAAAT TAACAAT TAACAAT TAACAAT
TAAAAAT TAACAAT
TAAAAAT
• Polimorfismos foram mutações que se propagaram ao longo de gerações
Polimorfismos genéticos X Mutações genéticas
Single Nucleotide Polymorphism, ou SNP ("snip"):
◦ pequena mudança, ou variação, que pode ocorrer em um único nucleotídeo numa sequência de DNA em uma porção significativa (mais de 1%) de uma população.
SNPs
SNPs são as mais frequêntes formas de variações genéticas◦90% das variações genéticas humanas vêm dos SNPs
SNPs tem se tornado marcadores de preferência pela sua grande abundância e pelo desenvolvimento de tecnologias de genotipagem em larga escala.
Single Nucleotide Polymorphism
SNPs em menor quantidade em genes do que em regiões não-codificantes
Menor quantidade de SNPs nos cromossomos sexuais (humano). Dentro de um único cromossomo, SNPs podem se concentrar em
uma região específica, geralmente implicando uma região de interesse ou de pesquisa.
Em média, ocorrem a cada 300~600 nucleotídeos (humano). Genes com maior pressão para modificação tem maior frequência
de SNP (resistência, adaptação, interação parasita-hospedeiro, etc)
Distribuição dos SNPs
Intra espécie◦Diversidade entre os indivíduos de uma
mesma espécie◦Reflete os SNPs entre os alelos (espécies
diplóides) Inter espécies
◦Diversidade entre espécies diferentes
SNPs intra/inter específicos
Não-codificantes Codificantes
Sinônimas Não-sinônimas
conservativas Não-conservativas
Classificação dos SNPTransições
Purina<->PurinaPirimidina<->Pirimidina
TransversõesPurina<->Pirimidina
Genotipagem ◦ Detecção de genótipos de individuos. ◦ Pode ser realizada observando os SNPs.
Haplótipo (genótipo haplóide) ◦ Alelo encontrado em um único cromossomo que
apresenta o mesmo padrão de SNPs. ◦ Blocos haplótipos e tendem a ser herdados
juntos.◦ Podem servir como marcadores de doença
genética. ◦ A análise de haplótipos é útil na identificação
de eventos de recombinação.
Blocos de haplótipos Dentro de um bloco haplótipo, acontece
pouca ou nenhuma recombinação Os SNPs dentro de um bloco haplótipo são
passados juntos nas gerações futuras
haplótipos Um haplótipo é um conjunto de SNP no
mesmo cromossomo
SNP1 SNP2 SNP3
-A C T T A G C T T-
-A A T T T G C T C-
-A C T T T G C T C-
Haplotype 2
Haplotype 3
C A T
A T C
C T CHaplotype 1
SNP1 SNP2 SNP3
Zonas de recombinação e Blocos de haplótipos
Recombinationhotspots
Chromosome
Haplotypeblocks
C1 C2 C1S1
S2
S3
S4
S5
S1
S2
S3
S4
S5
SNP loci
Haplotype patterns : Major allele
: Minor allele
SNP loci
C2
I1 I2
SNPs estão relacionados com a diversidade de genótipos de humanos◦ podem ser mapeados relacionando-os a
diversidade de fenótipos. Um SNP individual ou um bloco haplótipo
pode servir de indicação para◦ características agronômicas◦ doenças◦ etc
Essa relação constitui a base e a motivação para a identificação e genotipagem de SNPs.
Blocos de Haplótipos
O genoma de cada indivíduo contém distintos padrões de SNPs
Pessoas podem ser agrupadas de acordo com esse perfil
Perfil de SNPs são importantes na identificação de respostas a terapias◦ Existe uma correlação entre certos perfis de
SNPs e respostas específicas a tratamentos
Genotipagem e utilizando SNPs como marcadores
Genoma/transcriptoma◦Sanger◦454◦Solexa/Solid/...
Alinhamento de sequências Identificação de Discrepâncias
Identificação de SNPs através da análise de sequencias
Encontrando SNPs: Mineração de SNPs baseados no sequenciamento
(Sanger tradicional)
Sequenciamento De DNA
mRNA
cDNALibrary
ESTOverlap
Genomic
BACLibrary
RRSLibrary
BACOverlap
ShotgunOverlap
Fragment DNA
DNA from multiple individuals
Sequence and Reassemble (known sequence) Assembly with other overlapping
GTTACGCCAATACAGGATCCAGGAGATTACCGTTACGCCAATACAGCATCCAGGAGATTACC
mismatches = SNPs
Encontrando SNPs: Mineração de SNPs baseados no sequenciamento
Base-calling Contig assembly
Sequence viewingPolymorphism tagging
Relatório de polimorfismosGenotipagem individual
Polymorphism detection
PolyPhred
Consed
Analysis
Sequenciamento Phred PhrapAmplificação do DNA5’ 3’
Vários indivíduos
SNP Discovery - Sanger sequencing (EST)
SNP Discovery - Diploids (heterozygous loci)
Sequenciamentos de Nova geração para a
identificação de SNPs
Método Sanger foi o único utilizado por 30 anos
Sanger processa em paralelo 96 sequencias enquanto NGS processa milhões de sequencias a um custo 6X menor.
Problemas:◦ Fidelidade dos dados◦ Tamanho dos reads◦ Custo da infraestrutura◦ Manipular grandes volumes de dados
Sanger vs NGS
Problemas do tamanho da sequência
Sequencias curtas não mapeiam unicamente em um lugar no genoma.
Solução #1: Reads longos. Solução #2: Reads pareados.
ACTTAAGGCTGACTAGC TCGTACCGATATGCTG
Sequenciamentos de Nova Geração
Necessário ter uma montagem de referência Mapeamento dos reads na referencia Coberturas médias necessárias:
◦ Solexa - 100X, 454 - 10X Análise estatística para validar discrepâncias com base na
redundância dos dados Muitos Softwares disponíveis Desenvolvimento de algorítmos para aumentar velocidade
de processamento
Ferramentas para descoberta de SNPs em reads curtos
http://seqanswers.com/wiki/Special:BrowseData
SNP Discovery: Goal
sequencing errors SNP
SNP Discovery
AACGTTAGCATAAACGTTAGCATAAACGTTAGCATA
strain 1
strain 2
strain 3
haploid
individual 1
individual 3
individual 2
diploid
AACGTTCGCATAAACGTTCGCATA
AACGTTAGCATAAACGTTAGCATAAACGTTAGCATA
AACGTTAGCATAAACGTTAGCATAAACGTTCGCATAAACGTTCGCATA
AACGTTCGCATAAACGTTCGCATAAACGTTCGCATAAACGTTCGCATA
AACGTTAGCATAAACGTTAGCATA
Para inferir uma taxa de evolução a um gene são estimados o KA e o KS
KA - é a relação entre substituições não sinônimas e todos os possíveis sitios não sinônimos
KS – é a relação entre substituições sinônimas e todos os possíveis sítios sinônimos
Taxa de Evolução – kaks ou dn/ds
Exemplo:
Prolina:◦CCT◦CCA◦CCG◦CCC
Um sítio sinônimo e dois não sinônimos
A taxa KA/KS é uma medida clássica da evolução de maneira global num gene
KA/KS << 1 indica que uma substancial proporção de mudanças de aminoácidos devem ter sido eliminadas por seleção de purificação.
KA/KS > 1 indica seleção adaptativa ou positiva
KA/KS (dn/ds)
NG: Nei, M. and Gojobori, T. (1986) - Faster LWL: Li, W.H., et al. (1985) LPB: Li, W.H. (1993) and Pamilo, P. and
Bianchi, N.O. (1993) MLWL (Modified LWL), MLPB (Modified LPB):
Tzeng, Y.H., et al. (2004) YN: Yang, Z. and Nielsen, R. (2000) MYN (Modified YN): Zhang, Z., et al. (2006) GY: Goldman, N. and Yang, Z. (1994) MS (Model Selection), MA (Model Averaging)
KaKs_calculator - Métodos
A taxa de KAKS em humanos e chimpanzes é de 0,23.
Assumindo que mutações sinônimas são neutras, esse resultado implica que 77% das alterações de aminoácidos em genes hominideos são suficientemente deletérias e são eliminadas por seleção natural. Como mutações sinônimas não são totalmente neutras, a proporção de alterações de aminoácido neutras com consequências deletérias deve ser maior
Identificação de SNPs e haplótipos na poliplóide Coffea arábica
Objetivos principais Identificar e caracterizar SNPs em
sequências de EST Identificar os haplótipos com base nos
padrões de SNPs Identificar kaks
Foram utilizados dados de duas espécies de café:◦ Coffea arabica,◦ Coffea canephora
Coffea canephora Espécie diplóide Polinização cruzada: Alógama. Alta variabilidade C. canephora é melhor adaptada ao clima
equatorial úmido e quente Cultivada em baixas e médias altitudes Qualidade de bebida inferior Mais resistente a diversas condições do
que Coffea arabica, em particular a doenças e pragas.
Coffea arabica Allopoliploide (tetraplóide) Autógama Baixa variabilidade Originada de um cruzamento recente
(1mya) entre Coffea eugenoides e Coffea canephora
Espécie mais cultivada. Ocupa 75% das plantações mundiais de café.
Qualidade da bebida excelente.
Poliploidia
SoftwaresCAP3 para montagem dos ESTQualitySNP KaKs_calculatorScripts PERL
A montagem 95% similaridade por 100bp
◦Previnir agrupamento de parálogos Remover clusters com menos de 4 ESTs
Remover clusters com mais de 500 ESTs◦Evitar contigs mal formados
QualitySNP Analisar informações do CAP3 (Arquivo ACE) Detecção de SNPs
◦ Filtros◦ Reconstrução de haplótipos
Detecção de polimorfismos sinônimos e não sinônimos com o FASTY
Construir Banco de dados com os dados gerados.
Filtro 1 – Detectar SNPs potenciais Detecta todos os SNPs bi, tri e tetra
alélicos Cada alelo é representado com mais de
uma sequencia. ◦ Excluindo SNPs singlets
Classificação dos SNPs como intra ou inter espécies
Filtro 2 – Reconstrução dos haplótipos Agrupa sequências que representam um
mesmo alelo Tem os mesmos nucleotídeos nos sítios
polimorficos. Utiliza métodos matemáticos para
minimizar falsas reconstruções de haplótipos
Exclui haplótipos formados por apenas uma sequencia
Filtro 3 – Busca SNPs com alto score de confiabildade É calculado de acordo com a ocorrencia do
SNP em cada alelo com relação às regiões de alta e baixa qualidade
O score de confiabilidade é o menor valor Descartados valores abaixo de 2
Identificação de SNPs não-sinônimos Fasty
◦ Produz menores alinhamentos em sequencias de baixa qualidade
Detecção da ORF Correção de frameshifts Detecção de sSNP/nsSNP e SNPs ou INDELs
em regiões UTR Kaks Calculator
The database
Identificação dos ancestrais haplótipos Padrões diferentes de expressão dos
homeologos Contribuição de cada ancestral de arabica
no transcriptoma relacionando ao fenótipo Genes com maior pressão seletiva para
mudança Genes com maior pressão seletiva para
estabilização Artigo submetido e em revisão
Resultados
LGE - BioinformáticaGenômica, Transcriptômica, Biologia Sintética,
Biologia de Sistemashttp://www.lge.ibi.unicamp.br
Projetos
Projetos
Projetos
Projetos
Projetos
Projetos
Projetos
Projetos
Projetos
Projetos
O LGE
Recommended