70
Genetica di popolazioni Guido Barbujani Dip. Scienze della Vita e Biotecnologie Università di Ferrara [email protected]

Genetica di Popolazioni 1

Embed Size (px)

Citation preview

Page 1: Genetica di Popolazioni 1

Genetica di popolazioni

Guido BarbujaniDip. Scienze della Vita e Biotecnologie Università di Ferrara [email protected]

Page 2: Genetica di Popolazioni 1

Obiettivi del corso:

Capire le basi genetiche dell’evoluzione

Arrivare a porsi domande scientificamente corrette

Arrivare a poter leggere criticamente un articolo

POWERPOINT: http://utenti.unife.it/guido.barbujani/index.php?lng=it&p=5

ESERCIZI: http://darwin.eeb.uconn.edu/simulations/simulations.html

Page 3: Genetica di Popolazioni 1

TESTO ADOTTATOJ.H. Relethford (2013) Genetica delle popolazioni umane. Ambrosiana, 36 Euro.

Page 4: Genetica di Popolazioni 1

Conner & Hartl. Elementi di Genetica ecologica, Piccin

Frankham, Ballou, Briscoe. Fondamenti di Genetica della

conservazione, Zanichelli

Hartl & Clark. Principles of poplation genetics. Sinauer

Page 5: Genetica di Popolazioni 1

ALCUNE DOMANDE IMPORTANTI

• Con che frequenza troviamo unioni consanguinee nelle popolazioni, e quali effetti hanno?

• Cosa ci dice la diversità genetica riguardo alla storia delle diverse specie?

• Come possiamo utilizzare dati genetici per ricostruire la storia delle migrazioni?

• Perché alcune popolazioni presentano frequenze elevate di alleli patologici?

• Perché alcune piccole popolazioni sono così diverse da quelle vicine?

Page 6: Genetica di Popolazioni 1

Cose da ricordare, per cominciare

1. Cos’è un gene, un allele, un aplotipo2. Com’è fatto il DNA3. Com’è fatto un gene Eucariote4. Com’è fatto un gene procariote5. Com’è la struttura dei geni (siti codificanti, siti di

regolazione, introni, esoni)6. Come funzionano i geni

Page 7: Genetica di Popolazioni 1

Cosa vuol dire che due geni sono associati?

Se le coppie A,a e B,b sono associate che gameti produce il genotipo AaBb e il genotipo Aa BB?

Se AaBb si incrocia con AaBb che tipi di figli può avere?

Se AaBb si incrocia con aabb che tipi di figli può avere?

Cosa si intende per locus genico?

Cosa si intende per allele?

Cosa vuol dire che due geni sono indipendenti?

Se le coppie A,a e B,b sono indipendenti che gameti produce il genotipo AaBb? E il genotipo Aa BB?

Page 8: Genetica di Popolazioni 1

Che cos’è il crossing-over?

Se c’è crossing-over tra due geni associati, gli effetti del crossing-over sono evidenziabili nei gameti?

In che modo i geni codificano le proteine?

Cosa significa dire che i gameti sono aploidi?

Qual è la differenza tra meiosi e mitosi?

Che differenza c’è tra popolazione e specie?

Quanti alleli di un dato locus ci sono in una popolazione?

Specie diverse con lo stesso numero di cromosomi si possono incrociare?

Page 9: Genetica di Popolazioni 1

Programma del corso

1. Diversità genetica

2. Equilibrio di Hardy-Weinberg

3. Inbreeding

4. Linkage disequilibrium

5. Mutazione

6. Deriva genetica

7. Flusso genico e varianze genetiche

8. Selezione

9. Mantenimento dei polimorfismi e teoria neutrale

10. Introduzione alla teoria coalescente

11. Struttura e storia della popolazione umana

+ Lettura critica di articoli

Page 10: Genetica di Popolazioni 1

Programma del corso

1. Diversità genetica

2. Equilibrio di Hardy-Weinberg

3. Inbreeding

4. Linkage disequilibrium

5. Mutazione

6. Deriva genetica

7. Flusso genico e varianze genetiche

8. Selezione

9. Mantenimento dei polimorfismi e teoria neutrale

10. Introduzione alla teoria coalescente

11. Struttura e storia della popolazione umana

+ Lettura critica di articoli

Page 11: Genetica di Popolazioni 1

Conosciamo 1,6 milioni di specie, stimiamo che ne esistano >10 milioni

Page 12: Genetica di Popolazioni 1

Prima di tutto: non c’è genetica senza variabilità

Variabilità morfologica

Page 13: Genetica di Popolazioni 1

1. Variabilità morfologica2. Variabilità serologica3. Variabilità proteica4. Variabilità del DNA

4.1. Varianti di singolo nucleotide: Single-Nucleotide Polymorphisms (SNP)4.2. Varianti di lunghezza: Inserzioni/delezioni (Indel), Variable Number of Tandem Repeats (VNTR), Short Tandem Repeats (STR)4.3. Varianti strutturali: Copy-Number Variation (CNV)

Page 14: Genetica di Popolazioni 1

Quanto DNA in una cellula?

Nell’uomo: 6 miliardi di paia di basi nei 46 cromosomi1 base ≈ 0,8 mμ6 miliardi di basi ≈ 5 m di DNA in 5-20 μ

5-20 μ

Page 15: Genetica di Popolazioni 1

Quanto DNA in una cellula?

6 miliardi di paia di basi1 base ≈ 0,8 mμ6 miliardi di basi ≈ 5 m di DNA in 5-20 μ

Foglio A4, 60 battute per riga. 30 righe = 1800 basi su ogni foglio, due facciate ≈ 2000 basi

Se 100 fogli = 1 cm6 miliardi di paia di basi ≈ 15000 cm = 150 m

Page 16: Genetica di Popolazioni 1

Variabilità genetica: Proteine, Test serologici

J.B.S. Haldane: Frequenza dell’allele AB0*B in Europa

Page 17: Genetica di Popolazioni 1

Variabilità genetica: Proteine, sequenze amminoacidiche

Page 18: Genetica di Popolazioni 1

Variabilità genetica: Sequenze di DNA

Page 19: Genetica di Popolazioni 1

Applicazioni: Confronti fra sequenze in casi forensi

Page 20: Genetica di Popolazioni 1

Applicazioni: Genetic variation in Arabidopsis thaliana: SNPsNordborg et al., 2005 PLoS Biology

Page 21: Genetica di Popolazioni 1

Some human genome statisticsTotal size 3 190 491 286 bp (male, haploid) [was 3 283 984 159 in Dec. 2011]N of protein-coding genes 21 224 [were 20 442]N of RNA genes 15 952N of pseudogenes 14 427N of gene exons 679 045N of gene transcripts 194 015N of short variants 52 126 039 (+ 13.4 million: Lachance et al. 2012)N of structural variants 6 303 392

From Ensembl Release 68, July 2012

Nucleotide differences with chimp 1.5 %Structural differences with chimp 4%Human genes missing in chimp 60 (expressed mainly in cerebral cortex and testes)

From Wu et al. (2011) PLoS Genet

Page 22: Genetica di Popolazioni 1

Some human genome statistics

Page 23: Genetica di Popolazioni 1

I geni trascritti in proteine rappresentano negli Eucarioti fra il 5% e il 10% del genoma

Parte del restante 90-95% non è funzionale (junk DNA), ma un’altra parte contiene importanti siti di regolazione

Page 24: Genetica di Popolazioni 1

Human-mouse alignment

Human-chimp alignment

Page 25: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

1. Single Nucleotide Polymorphism: SNP2. Inserzione/delezione3. Variazione del numero di copie: Indel, STR, VNTR, 4. Variazione strutturale: CNV

Page 26: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

1. SNP

2010: Almeno 4 milioni di SNPs nel genoma umano (Schuster et al. 2010)2012: Almeno 65 milioni di SNPs nel genoma umano (Lachance et al. 2012)

Page 27: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

1. SNP: Restrizione

Page 28: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

1. SNP: Fasi preparatorie al sequenziamento

Page 29: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

1. SNP: Sequenziamento

Qual è il vantaggio del sequenziamento rispetto alla restrizione?

Page 30: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

1. SNP: Costruzione di aplotipi

Page 31: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

1. SNP: Effetti fenotipici

Cioè in regioni: regolatrici codificanti intergeniche introniche

Con sostituzioni: nonsinonime sinonime

Page 32: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

1. SNP: Effetti fenotipici

Page 33: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

2. Inserzione/delezione: Indel

Page 34: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

2. Inserzione/delezione: Indel

Pereira et al. Genet. Mol. Res. 5 (1): 63-71 (2006)

Page 35: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

2. Inserzione/delezione: Indel, inserzione di un retrovirus

Page 36: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: STR

Page 37: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: STR

Page 38: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: STR

Page 39: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: STR & VNTR

Page 40: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: CNV

Page 41: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: CNV

An ~11kb deletion on chromosome 8 revealed by ultra-high resolution CGH. Blue lines: individuals with two copies. Red line: individual with zero copies.

Page 42: Genetica di Popolazioni 1

Tipi di polimorfismo studiati nel DNA

3. Variazione del numero di copie: CNV

La CGH (Comparative Genomic Hybridization) rileva variazioni del numero di copie di geni.

Competizione per il legame su cromosomi in metafase di due DNA genomici marcati con fluorocromi diversi. Un DNA è estratto dal paziente in esame mentre l’altro DNA è un pool di DNA genomico di riferimento.

Si legherà in proporzione più DNA se maggiore sarà il numero di copie presenti in quel locus rispetto al numero di copie presenti nel DNA genomico di controllo. Viceversa se ne legherà meno se minore sarà il numero di copie presenti in quel locus rispetto al numero di copie presenti nel DNA genomico di controllo.

Page 43: Genetica di Popolazioni 1

3. Variazione del numero di copie: CNV

Marques-Bonet et al. (2009) Trends in Genetics 25:443-454

Page 44: Genetica di Popolazioni 1
Page 45: Genetica di Popolazioni 1

Average mutation rates for different polymorphisms(per locus per generation)

VNTR 10-1 – 10-2

STR 10-2 – 10-4

SNPs 10-6 – 10-8

Indel (retrovirus) 10-10 – 10-11

CNV ?

In the mitochondrial DNA hypervariable region, up to 5 x 10-5 per site per generation

Page 46: Genetica di Popolazioni 1

Quand’è che una popolazione può dirsi variabile?

A B

Page 47: Genetica di Popolazioni 1

Misure di diversità genetica

• N di alleli• Eterozigosi osservata:

Ho = N genotipi eteroz./N genotipi totali

• Eterozigosi attesa:

H = 1 –Σ pi2

(la frazione di individui che ci si aspetta siano eterozigoti a un gene sconosciuto)

Page 48: Genetica di Popolazioni 1

Quand’è che una popolazione può dirsi variabile?

A BN alleli = 5 N alleli = 2HO = 0.4 HO = 0.6H = 0.35 H = 0.5

Quando il genotipo individuale è difficile da prevedere

Page 49: Genetica di Popolazioni 1

Quand’è che una popolazione può dirsi variabile?

• Quando molti siti del DNA sono variabili

diversità nucleotidica:

π = N siti polimorfici / N totale siti• Quando ci sono grandi differenze molecolari fra I suoi membri

mismatch medio:

k = Σ dij / [N (N-1) / 2]

Page 50: Genetica di Popolazioni 1

Il mismatch è il numero di sostituzioni fra coppie di individui

TCTAGA

CCTAGA CCTAGG

CTTAGA CTTAAA

1 2

3

1

1

2 21

2 2

Σ dij = 17 k = 1.7

Page 51: Genetica di Popolazioni 1
Page 52: Genetica di Popolazioni 1
Page 53: Genetica di Popolazioni 1
Page 54: Genetica di Popolazioni 1
Page 55: Genetica di Popolazioni 1

Un’applicazione: variabilità STR in popolazioni di lupi scandinavi (Flagstad et al. 2003)

N alleli HO H

1829-1889 5.0 0.66 0.74

1890-1939 4.4 0.61 0.68

1940-1980 3.1 0.45 0.52

Finlandia 4.9 0.69 0.72

Page 56: Genetica di Popolazioni 1

Quanto polimorfismo c’è nel DNA della nostra specie?

Goldman et al. (1987) PNAS

Page 57: Genetica di Popolazioni 1

Livelli di diversità fra

uomo e scimpanzè

Tempi di dissociazione indicano una

differenza pari all’1.76%

(Sibley & Ahlquist, 1984)

Page 58: Genetica di Popolazioni 1

Livelli di polimorfismo nell’uomo: SNP

35 milioni di SNP fra uomo e scimpanzè. Su un totale di 3 miliardi di basi (genoma aploide) 1.23% (Chimpanzee Genome Sequencing Consortium, 2005)

Di questi SNP, 1.06% fissati fra specie 0.17% polimorfici nell’uomo

Kaessmann et al. (2001)

Page 59: Genetica di Popolazioni 1

Livelli di polimorfismo nell’uomo: Indel

Origine della duplicazione

Siti di inserzione

Marquès-Bonet et al. (2009)

Page 60: Genetica di Popolazioni 1

Livelli di polimorfismo nell’uomo: genomi completi

Nel 2010 erano 14 i genomi interamente sequenziati (6

miliardi di paia di basi)

Page 61: Genetica di Popolazioni 1

Africa del sud

Americani bianchi

Yoruba

Asiatici

Polimorfici almeno lo 0.13% dei siti

Nel 2010 erano 14 i genomi interamente sequenziati (6 miliardi di paia di basi)

Page 62: Genetica di Popolazioni 1

Nel 2014 i genomi umani interamente sequenziati sono migliaia

PopulationNumber of

Individual DNA SamplesAfrican Caribbean in Barbados [ACB] 79

African Ancestry in SW USA [ASW] 62

British From England and Scotland [GBR] 100

Chinese Dai in Xishuangbanna, China [CDX] 100

Colombian in Medellín, Colombia [CLM] 105

Finnish in Finland [FIN] 100

Han Chinese in Beijing, China [CHB] 120Han Chinese South [CHS] 150Iberian Populations in Spain [IBS] 150Japanese in Tokyo, Japan [JPT] 120

Kinh in Ho Chi Minh City, Vietnam [KHV] 100

Luhya in Webuye, Kenya [LWK] 120

Mexican Ancestry in Los Angeles [MXL] 71

Peruvian in Lima Peru [PEL] 105Puerto Rican in Puerto Rico [PUR] 105Toscani in Italia [TSI] 114

Yoruba in Ibadan, Nigeria [YRI] 62

Page 63: Genetica di Popolazioni 1

Livelli di polimorfismo nell’uomo: genomi completi

Page 64: Genetica di Popolazioni 1

N of markers

Samples FST Reference

599,356 SNPs

209 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba

0.13 Weir et al. 2005

1,034,741 SNPs

71 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba

0.10 Weir et al. 2005

1,007,329 SNPs

269 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba

0.12 International HapMap Consortium 2005

443,434 SNPs

3845 worldwide distributed individuals 0.052 Auton et al. 2009

2,841,354 SNPs

210 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba

0.11 Barreiro et al. 2008

243,855 SNPs

554 individuals from 27 worldwide populations 0.123 Xing et al. 2009

100 Alu insertions

710 individuals from 23 worldwide populations 0.095 Watkins et al. 2008

67 CNVs 270 individuals from 4 populations with ancestry in Europe, Africa or Asia

0.11 Redon et al. 2006

Le stime genomiche di FST per la popolazione umana globale sono ∼ 0.12

Le popolazioni umane esprimono ∼ 12% della varianza massima possibile, date le loro frequenze alleliche

Page 65: Genetica di Popolazioni 1

100%

100%100%

I membri della nostra comunità sono solo un po’ più simili a noi dei membri di comunità molto lontane

88%88%

88%

Cosa vuol dire?

Page 66: Genetica di Popolazioni 1

Due persone dello stesso continente possono essere

geneticamente più distanti di persone di

continenti diversi.

Page 67: Genetica di Popolazioni 1

In the 117 megabases (Mb) of sequenced exome-containing intervals, the average rate of nucleotide difference between a pair of the Bushmen was 1.2 per kb, compared to an

average of 1.0 per kb between a European and Asian individual. Schuster et al. (2010)

In media, ci sono differenze più grandi fra due africani che fra europei e asiatici

Page 68: Genetica di Popolazioni 1

Nota beneLa variabilità interna di una popolazione è solo uno degli

aspetti della variabilità genetica:

Variabilità tra individui della stessa popolazione

Variabilità tra individui di popolazioni diverse

Variabilità tra individui di gruppi di popolazioni diverse

eccetera

Page 69: Genetica di Popolazioni 1

PS: Cos’è una popolazione?

Hendrick: un gruppo di individui che si accoppiano e coesistono nel tempo e nello spazio

In pratica, si usano come unità operative di analisi gruppi di individui localizzati nello spazio, che spesso hanno in comune vari tratti culturali, come mezzi di sussistenza, lingua, casta (in India), religione.

La scelta dell’unità operativa di analisi dipende spesso (a) dalla domanda scientifica che ci si pone e (b) dalla effettiva disponibilità di dati

Page 70: Genetica di Popolazioni 1

Riassunto• La genetica di popolazioni è un ramo della genetica, e quindi si

occupa di studiare la variabilità• Si può descrivere la variabilità o diversità genetica a partire dal

fenotipo (morfologia o proteina) o dal genotipo (DNA)• La diversità del DNA è dovuta a polimorfismi di singolo nucleotide

(SNP), alla presenza di elementi ripetuti (STR e VNTR) e alla presenza di delezioni, inserzioni o duplicazioni (CNV)

• Per quantificare la diversità genetica si ricorre a statistiche, fra cui: (1) numero di alleli; (2) eterozigosi osservata; (3) eterozigosi attesa; (4) polimorfismo nucleotidico; (5) differenze a coppie o mismatch