19

Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

  • Upload
    buibao

  • View
    219

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile
Page 2: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

  Diversità genetica a livello di sequenza   Trovare gli SNP   Genotipizzare gli SNP   Principali applicazioni

Sommario

Page 3: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

SNP: definizioni   Polimorfismo al singolo nucleotide, in genere si intende la sostituzione di

una base – alcuni autori includono anche i polimorfismi di inserzione/delezione di una base.

  Più frequente tipo di variazione genetica   Per lo più bi-allelici, a causa della loro dipendenza dal tasso di mutazione

spontanea nella specie (nel range di 1 x 10-6 per generazione).   Parametri che quantificano la frequenza e l’informatività degli SNP:

  S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile nelle altre specie e nelle colture agrarie)

  MAF (minor allele frequency = frequenza dell’allele minore): l’informatività di uno SNP è funzione di quanto siano bilanciate le frequenze dei due alleli nella popolazione, idealmente, con p

  (frequenza di un allele) + q (frequenza dell’altro allele) = 1, p = q = 0.5.

Page 4: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

SNP

Da: Wikipedia

Page 5: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

Frequenza degli SNP nelle piante Specie Frequenza (S) References

Orzo 1 / 108-200 Rolstocks et al., 2005; Kota et al., 2008 Mais 1 / 43-61 Ching et al., 2002; Jones et al., 2009 Riso (indica) 1 / 270 Han and Xue, 2003 Riso (japonica) 1 / 5,700 Yamamoto et al., 2010 Frumento 1 / 335-540 Somers et al. 2003; Ravel et al. 2006 Melo 1 / 52 Micheletti et al. submitted

Arabidopsis 1 / 336 Schmid et al 2003 Uomo 1 / 100-500 Sachidanandam et al 2001

Page 6: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

Mappaggio per associazione

Page 7: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

Basi del mappaggio per associazione   Ricerca di una correlazione statistica tra

marcatori e fenotipo utilizzando una collezione di individui non strettamente collegati da pedigree (es. collezioni di germoplasma)

  Utilizzo il residuo linkage disequilibrium (LD) tra marcatore e gene che controlla il fenotipo

  L’effettivo livello di LD deve essere verificato empiricamente

Page 8: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

Linkage disequilibrium (disequilibrio di associazione) Due alleli a loci diversi in una popolazione sono in linkage disequilibrium (LD) quando sono presenti in un inividuo piu’ frequentamente di quanto atteso su base casuale

Associazione non bilanciata e non independente tra varianti alleliche a due loci nell’ambito di una popolazione.

Page 9: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

Meiosis 3

2 1 3 4

1 2 1 2 3 4 3 4

Meiosis 1

Meiosis 2

LD

1 2 3 4

Parentale A Aplotipo A

Parentale B Aplotipo B

alto

basso

Aplotipo: la combinazione di alleli a loci limitrofi (associati) presenti su un singolo cromosoma

Nuovi aplotipi

Page 10: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile
Page 11: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

Approcci di mappaggio per associazione

Figura 20.61 Basi teoriche del mappaggio genetico per associazione: (A) l’approccio basato sulla scansione di un genoma consiste nel genotipizzare ad un certo numero di loci gli individui di una popolazione al fine di correlare i polimorfismi o gli aplotipi di specifici geni con i fenotipi; (B) Organizzazione dei blocchi aplotipici nei cromosomi in relazione alla ubicazione dei geni e delle regioni ad elevata ricombinazione (hot spots) (modificata da: Rafalski e Morgante, 2003).

Page 12: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

-  Il disequilibrio da associazione (LD) tra marcatori, geni e caratteri

viene utilizzato per mappare i fattori genetici che controllano:

- Caratteri mendeliani

- Caratteri quantitativi

Page 13: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

Linkage disequilibrium e risoluzione genetica

• Richiede meno marcatori

• Scarsa risoluzione di mappa

• Ideale per una ricerca sull’intero genoma

• Richiede molti marcatori

• Elevata risoluzione di mappa

• Ideale per l’approccio del “gene candiato”

LD elevato

Mod. from Rafalski A., 2002, Curr Opin Plant

LD basso

Page 14: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

LD nelle piante   LD varia molto tra specie, entro specie ed

a seconda della regione cromosomica

• Mais: da 2 kb (collezione di vecchie razze locali) fino a 600

LD (r2) decay over bp in six maize genes

(Wilson et al. 2004 Plant Cell) kb (collezioni di linee elite moderne)

• Arabidopsis: da 100 kb fino ad alcuni cM

• Riso: fino a100 kb nel riso coltivato

• Orzo: >200 kb nel materiale elite

Page 15: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

Livelli di LD in specie diverse

Tabella 20.17 Linkage disequilibrium (LD) in alcuni organismi in relazione a distanza genetica (cM) o fisica (kb). Barcaccia e Falcinelli, vol III, pag 1016.

Page 16: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

Buckler and Thornsberry, 2002, Current Opinion in Plant Biology

Page 17: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

QTL mapping and cloning strategies

genome-wide (high LD panel)

Linkage mapping (biparental)

Association mapping (set of accessions)

candidate gene (low LD panel)

QTL coarse mapping

Near isogenic lines (NILs)

Candidate gene validation

Positional cloning

Resolution

10-20 cM

1-100 kb

Page 18: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

Linkage disequillibrium across the maize 10 chromosomes measured with 914 SNPs on 632 inbred lines. Only SNPs with a minor allele frequency greater than 0.05 are shown (Yan et al 2009 PLoS ONE 4(12): e8451).

Gli SNP sono ampiamente utilizzati nello studio del linkage disequilibrium a livello genomico

Page 19: Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile

Genotipizzazione ad alta densità del genoma per analisi di associazione (Genome-Wide Association Mapping)

Belò et al, MGG 2008

•  8,590 SNPs

•  553 linee pure di mais

•  Fenotipo: contenuto di acido oleico nell’embrione

Massima associazione tra SNP e fenotipo in corrispondenza del gene candidato Fad2 (Fatty acid desature)