Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Introducción a la selección genómica Selección genómica Factores en GS
Selección genómica
N.Ibáñez-Escriche
Genètica i Millora Animal. IRTA-Lleida
Valencia-2010
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Outline
1 Introducción a la selección genómicaIntroducciónEstrategias
2 Selección genómicaImplementaciónMetodologias GS
3 Factores en GSFactores
MarcadoresFenotiposEfectos no aditivos
Dificultades GSCoste de GSVentajas GS
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Introducción
Caracteres cuantitativos
Modelos usados para explicar la variación genética de loscaracteres
Modelo infinitesimal (Fisher 1919)Ampliamente usado en mejora genética animalLa información utilizada es el fenotipo y el parentesco
Modelo de locis infinitosSe ha utilizado en la busqueda de loci de moderado a gran efecto
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Introducción
Uso genética molecular en mejora animal
Seleccionar por QTLDirectamente: Gen candidatoIndirectamente: a través de marcadores
Estratégias
GAS: gene assistant selectionMAS: marker assistant selectionGS: genomic selection
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Estrategias
Estrategias habituales
GASSe asume el gen conocidoCausa de la mutación conocida
MAS (selección asistida por marcadores)Tres situaciones:
Marcadores en LEse puede trazar la ruta de marcador desde el padre a sudescendenciaSe estima efecto alelo paterno y materno
Marcadores en LDEl marcador se encuentra cerca del QTLSe estiman menos marcadores que en LE
Marcadores LD y LE
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Estrategias
¿Que es LD?Asociación no aleatoria de alelos entre dos lociNo segregan de forma independiente ⇒ una frecuencia derecombinación menor del 50Cuanto más cerca están más fácil que esten ligados
Problemas MASDificultad para encontrar marcadores en LDMétodo poco robustoDiferentes marcadores para cada carcácterProblemas de falsos positivos y negativos
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Estrategias
Estrategia alternativa
Genomic selection (Selección simultanea con muchosmarcadores)¿Porque GS?
Actualmente se dispone de una gran densidad de marcadoresgenéticos (SNPs)Expectativa: Algunos de estos marcadores están en alto LD con elQTLHumanos ∼ 1 millón SNPsVacas, ovejas, cerdos, pollos: ∼ 50.000 SNP chip⇒ genotipos con 10-20 SNP markers por cMCoste: ∼ 100-300 Euro/Chip
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Estrategias
GS vs MAS
MASLocalizar los marcadores en LD: test de hipotésisSe aplica a pocos QTLExplica una fracción limitada de la varianza genética
GSNo necesita conocer donde esta el QTLFunciona sin genes mayoresFunciona sin incluir el efecto poligénico
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Implementación
Modelización del fenotipo
Ejemplo: modelo para los datos de los animales 1, 2 y 3
y1 = µ + a1 + e1
y2 = µ + a2 + e2
y3 = µ + a3 + e2
El modelo generalizado quedaría
yi = µ + ai + ei
yi es el dato del individuo i , µ la media general, ai valor genético aditivo del individuo i y ei error para dato i
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Implementación
Modelización de los valores genotipos aditivos
Situación ideal donde se conocen todos los genes
Ejemplo: Carácter regulado por tres genes
a1 = q1α1 + q2α2 + q3α3
a2 = q1α1 + q2α2 + q3α3
a3 = q1α1 + q2α2 + q3α3
El modelo generalizado quedaría
ai =∑
j
qijαj
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Implementación
Modelización del fenotipo
El modelo anterior quedaría
yi = µ +∑
j
qijαj + ei
qij es el genotipo de i para el locus del fenotipo j
En realidad no se conoce el genotipo del gen pero si el de los marcadoresXj
qijαj ≈X
j
xijgj
xij es el genotipo de i para el marcador del locus j
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Implementación
Pasos en GS
Estimación de efectosModelo:
yi = µ +∑
j
xijgj + ei
gj es el efecto de sustitución del maracdor y xij es el genotipo dei para el locus del fenotipo jPoblación testaje: fenotipo y genotipo
Predicción del genotipo
gi = µ +∑
ij
xij gj
Una vez µ y g son estimados, puede predecirse los valoresgenotipicos sin pedigree o información genotípica
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
Mínimos cuadrados
No se hace asunciones de la distribución de los maracdores
2 pasos
1 Análisis de regresión simple para cada marcador i
y = µ1n + xigi + e
2 Se seleccionan los n marcadores más importantes y se estimas susefectos simultáneamente
y = µ1n +nXi
xigi + e
Problemas:Elección nivel significaciónEstimación regresión simple produce un problema desobrestimacion de los efectos de los QTL
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
Ridge regression y BLUP
Asume que los efectos de los marcadores g son aleatorios convarianza comúnSe estiman simultáneamente todos los g
Aplicación en GS
g = (X ′X + λI)−1X ′y
La elección de λ es arbitrariaNotar que λ = σ2
e/σ2g , con lo que es similar al BLUP
Elección σ2g
Meuwissen al. (2001) usan la varianza genética esperada de unmodelo genético de mutatión y derivaGianola et al. (2003) estiman la varianza de los marcadores
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
BLUP con incertidumbre en las varianzas
Se estima la varianza de los marcadoresAsumimos el modelo anterior
yi = µ +∑
j
xijgj + ei
Se asume
p(y |µ, g, σ2g , σ2
e) ∼ N(µ1n + Xg, σ2e)
A prioris asumidos
µ cte
e y g normales N(0, σ2e) y N(0, σ2
g)
σ2e y σ2
g chi-quadrado invertidas νeS−2e χ−2
νe y νgS−2g χ−2
νg
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
BLUP
Aplicando el teorema de Bayes
p(µ, g, e, σ2g , σ2
e |y) ∝ p(y |µ, g, e, σ2g , σ2
e)p( µ)
p(g|σ2g)p(e|σ2
e)p(σ2g)p(σ2
e)∝
exp−[(y − µ1n − Xg)′(y − µ1n − Xg) + νeS2
e
2σ2e
]exp−[(g′g + νeS2
e)
2σ2g
]
(σ2e)−
n+νe2 +1(σ2
g)−n+νg
2 +1
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
BLUP
Distribuciones condicionales:
(µ|g, e, σ2g , σ2
e , y) ∼ N((1′y − 1′Xg)/n, σ2e/n)
(g j |µ, e, σ2g , σ2
e , y) ∼ N(gj , σ2e/cj)
donde
gj =x ′j (y − µ1n −
∑− j x−jg−j)
cj
y cj = x ′j xj + σ2e/σ2
g
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
Distribuciones condicionales
(σ2e |µ, g, e, σ2
g , y) ∼ νeS2eχ−2
νe
dondee = (y − µ1n − Xg)
y
S2e =
[e′e + νeS2
e ]
νe, νe = n + νe
(σ2g |µ, g, e, σ2
e , y) ∼ νgS2gχ−2
νg
donde
S2g =
[g′g + νjS2g ]
νg, νg = q + νg
El algoritmo de Gibbs se utiliza para muestrear los parámetrosde su condicional posterior
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
Muestreo Gibbs
Distribuciones condicionales:1 (µ1|g0, e0, σ
2(0)g , σ
2(0)e , y) ∼ N((1′y − 1′Xg0)/n, σ
2(0)e /n)
2 (g1j |µ1, gj
0, e0, σ2(0)g , σ
2(0)e , y) ∼ N(g1
j , σ2(0)e /cj)
3 (σ2e
1|µ1, g1, e1, σ2(0)g , y) ∼ νeS2
eχ−2νe
4 (σ2g
1|µ1, g1, e1, σ2(1)e , y) ∼ νgS2
gχ−2νg
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
Bayes A
Se asume una varianza diferente para cada gj
Ahora los a prioris de gj y σ2gj
serían:
gj ∼ N(0, σ2gj), σ2
gj∼ νgj S
−2gj
χ−2νgj
y sus distribuciones posteriores:
(g j |µ, e, σ2gj, σ2
e , y) ∼ N(gj , σ2e/cj)
dondecj = x ′j xj + σ2
e/σ2gj
(σ2g j|µ, g, e, σ2
e , y) ∼ νgj S2gjχ−2
νg j
donde
S2gj
=[g′
j g j + νjS2gj]
νgj
, νgj = 1 + νgj
νgj son los grados de libertad asignados a priori
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
Bayes B
Se asume con probabilidad π que un porcentaje de marcadoresno tienen efecto ni varianzaPara el resto se asume una varianza diferente para cada gj
A priori las distribuciones gj y σ2gj
son:
(gj |π, σ2gj ) ∼ N(0, σ2
gj ) con probabilidad (1− π)
(gj |π, σ2gj ) = 0 con probabilidad π
entonces(σ2
gj |π) ∼ t(0, νgj , S−2gj
) con probabilidad (1− π)
(σ2gj |π) = 0 con probabilidad π
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
Muestreo Bayes B
gj y σ2gj
son distribuciones mixtas con forma no conocida
Estrategia de muestreo1 Muestreo µ y σ2
e con Gibbs2 Muestreo conjunto de gj y σ2
gj con el algoritmo deMetropolis-Hastings
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
Bayes C
Se asume con probabilidad π que un porcentaje de marcadoresno tienen efecto ni varianzaPara el resto se asume la misma varianzaSe estima π
π ∼ Uniforme(0, 1)
En este caso las distribuciones posteriores de (1− π) sonconocidasEstrategia de muestreo:
1 Muestreo de µ g, σ2g , σ2
e como en el BLUP bayesiano2 Muestreo π → (π|y , µ, g, σ2
e , σ2g) = π(q−m)(1− π)m
donde m = g′g y q es el número de marcadoresLa distribución π es una distribución Beta con a=q-m+1 y b=m+1
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
Métodos
Mínimos cuadradosNo asume ninguna distribución para los marcadores
Ridge Regression and BLUPMarcadores tienen la misma Varianza
Bayes ACada marcador tienen una varianza
Bayes BCada marcador tiene una varianza, pero muchos no tienen efecto
Bayes CHay marcadores que no tienen efecto, pero los que tienen efectotienen la misma varianza
Semiparamétrico (Gianola et al., 2006)
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Metodologias GS
Comparación métodos
Comparación entre los valores estimados y los verdaderos(2000 animales y 1000 cM 1 Mrk x cM)
r+ SE b+SELS 0.318∓0.018 0.285∓0.024
BLUP 0.732∓0.030 0.896∓0.045BayesA 0.798∓0.018 0.827∓0.020BayesB 0.848∓0.012 0.946∓0.0018
Meuwissen et al. (2001)
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Factores
Factores
1 Cuantos marcadores son necesarios para mantener el LD?2 Cuantos fenotipos se requieren?3 Como afectan los efectos no aditivos en la precisión de GS?4 En que poblaciones se debe aplicar?
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Factores
Número de Marcadores
Meuwissen et al. (2001)→ r2 >=0.2Solberg et al. (2006) 20% ⇓ precisión cuando se pasa de de 1Mk 0.5cM a 4cMCalus et al. (2007) Pecisión 0.68 →r2 =0.1, 0.82→ r2 =0.2Baja densidad mejor utilizar Haplotipos
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Factores
Número de Marcadores
Meuwissen et al. (2001)→ r2 >=0.2Solberg et al. (2006) 20% ⇓ precisión cuando se pasa de de 1Mk 0.5cM a 4cMCalus et al. (2007) Pecisión 0.68 →r2 =0.1, 0.82→ r2 =0.2Baja densidad mejor utilizar Haplotipos
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Factores
Número de Marcadores
Meuwissen et al. (2001)→ r2 >=0.2Solberg et al. (2006) 20% ⇓ precisión cuando se pasa de de 1Mk 0.5cM a 4cMCalus et al. (2007) Pecisión 0.68 →r2 =0.1, 0.82→ r2 =0.2Baja densidad mejor utilizar Haplotipos
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Factores
Número de Marcadores
Meuwissen et al. (2001)→ r2 >=0.2Solberg et al. (2006) 20% ⇓ precisión cuando se pasa de de 1Mk 0.5cM a 4cMCalus et al. (2007) Pecisión 0.68 →r2 =0.1, 0.82→ r2 =0.2Baja densidad mejor utilizar Haplotipos
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Factores
! ""
!
!
#$%&'()!*+,&-.-/0&-%$!.%)!+,-$1!2+3&-43%/+,!2(0,+)(,!%.!56!-,!&'0&!&'(7!/0$!8(!3(,,!
90)-083(!&'0$!:0-)4;-,(!2(0,+)(,<!!='(!90)-0&-%$!-$!56!0)-,(,!.)%2!&;%!,02:3-$1!
:)%/(,,(,!>?(-)!0$@!A-33!"BCDE<!='(!.-),&!,02:3-$1!:)%/(,,!)(.3(/&,!&'(!,02:3-$1
!%.!
102(&(,!&%!.%)2!,+//(,,-9(!1($()0&-%$,F!0$@!-,!@(:($@($&!%$!.-$-&(!:%:+30&-%$!,-G(<!
='(!,(/%$@!,02:3-$1!:)%/(,,!-,!&'(!,02:3-$1!%.!-$@-9-@+03,!&%!8(!1($%&7:(@!.)%2!&'(!
:%:+30&-%$F!0$@!-,!@(:($@($&!%$!&'(!,02:3(!,-G(F!!<!!='(!.-),&!,02:3-$1!:)%/(,,!
/%$&)-8+&(,!&%!&'(!'-1'!90)-08-3-&7!%.!56!2(0,+)(,<!!H0)I()!:0-),!0&!@-..()($&!:%-$&,!-$!
&'(!1($%2(F!8+&!0!,-2-30)!@-,&0$/(!0:0)&F!/0$!'09(!9()7!@-..()($&!)J!903+(,F!:0)&-/+30)37!
-.!&'(!20)I()!@-,&0$/(!-,!,2033F!K-1+)(!"<L<!!='-,!-,!8(/0+,(!87!/'0$/(!&'()(!207!'09(!
8(($!0$!0$/(,&)03!)(/%28-$0&-%$!8(&;(($!%$(!:0-)!%.!20)I(),F!8+&!$%&!&'(!%&'()<!
!
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 1000000 2000000 3000000 4000000 5000000 6000000 7000000 8000000 9000000 10000000
Distance (bp)
r2
!
!"#$%&'()*)''%+',-.$&/'-#-"0/1'2"/1-03&'"0'4-/&/'4&15&&0'6-"%/'78'9-%:&%/'8%79';'
;;;'#&079&'5"2&'<=>/'#&071?6&2'"0'-'676$.-1"70'78'@7./1&"0'!%"&/"-0'3-11.&)''
(;;;;;;'4-/&/'"/'-66%7A"9-1&.?'(3B)'''
!
H+3&-43%/+,!2(0,+)(,!%.!56!/0$!'09(!)(@+/(@!90)-08-3-&7!8(/0+,(!&'(7!0//+2+30&(!
-$.%)20&-%$!0/)%,,!2+3&-:3(!3%/-!-$!0$!-$&()903F!&'+,!09()01-$1!,%2(!%.!&'(!(..(/&,!%.!
/'0$/(!)(/%28-$0&-%$,<!!A07(,!(&!03<!>JDDME!-$9(,&-10&(@!&'(!90)-08-3-&7!%.!)J!0$@!NOA!
+,-$1!,-2+30&-%$<!!='(7!,-2+30&(@!0!/')%2%,%2(!,(12($&!%.!"D!/H!/%$&0-$-$1!""!
20)I(),!;0,!,-2+30&(@!;-&'!0!2+&0&-%$4@)-.&!2%@(3F!;-&'!0!/%$,&0$&!"!%.!"DDD<!!='(7!
Figure: SNPs genotipados en vaca Holstein. 1.000.000 de bases esaproximadamente 1cM
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Factores
Ejemplo:Vacuno de leche r2 =0.2 cuando MKr espaciados cada 100KbGenoma bovino ≈ 3.000.000kbImplica 30.000 marcadores para que tenga éxito GS
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Factores
Fenotipos
⇑ Fenotipos ⇑ Mayor PrecisiónDiferencias ente métodos estadísticos + cd el número de datoses pequeño
Comparación entre los valores estimados y los verdaderos
No datos500 1000 2200
LS 0.124 0.204 0.318BLUP 0.579 0.659 0.732
BayesB 0.708 0.787 0.848
Meuwissen et al. (2001)
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Factores
Marcadores vs Fenotipos
Precisión
Datos 1000 4000Marker Bayes B Bayes B
500 0.79 (0.02 ) 0.83 (0.03)2000 0.91 (0.01) 0.94 (0.01)
Ibañez-Escriche et al. (2009)
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Factores
Efectos no aditivos
Actualmente no se tienen en cuentaGran Interés:
Mejorar estimasSelección de ApareamientosGran interés en animales cruzados
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Dificultades GS
Problemas GS en poblaciones y razas
Los chips de SNPs se diseñan con unas poblaciones concretasComo generalizar su uso a todas las poblaciones?Se puede aplicar GS a una población diferente a la derefernecia?Problemas: patrón de LDDiferentes efectos de mutación según razaIteración genotipo ambiente
Ejemplo
Alelo DGAT1 (Holstein-Friesian, Jersey)
⇑ Grasa ⇓ Proteina y Volumen Leche
Mismo gen en Holstein produce doble Grasa que en Jersey
Gene asociado a raza ⇒ Miostatina (Dunner et al. 2003)
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Dificultades GS
Solución: utilizar referencias multiraza?Ibañez-Escriche et al.,(2009)cy Toosi et al.(2010)
Encuentran posibilidades en utilizar animales cruzados paraevaluar varias razas
De Ross et al.(2009) y Hayes et al.(2009)Proponen combinar datos de varias razasEl éxito depende de la densidad de marcadores y distancia entrepoblaciones
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Dificultades GS
Cada cuanto se reestima los efectos de losmarcadores?
Los marcadores y QTL están afectados por las mutacionesExiste recombinación entre marcador y QTLImplica ⇓ Precisión del valor genético⇑ Generación ⇓ Precisión
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Dificultades GS
Ejemplo
Precisión por generación
Generación rTBV ;EBV1003 0.8481004 0.8041005 0.7681006 0.7581007 0.7341008 0.718
Meuwissen et al. (2001)
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Dificultades GS
Scenario 1
Generation
Acc
urac
y
Criterion 1= ûa
abk
1000 1002 1004 1006 1008 1010
0.0
0.2
0.4
0.6
0.8
1.0
Escenario 2
GeneraciónP
reci
sión
Criterio 1= ûa
abk
1000 1002 1004 1006 1008 1010
0.0
0.2
0.4
0.6
0.8
1.0
Figure: Ibáñez-Escriche and Blasco (2010)
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Dificultades GS
Generacion 5 ⇓ PrecisiónSe recomienda reestimar cada 3 generaciones
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Coste de GS
Coste
Dependiendo de tecnología30000 SNPs ≈ $50050 SNPs ≈ $20Si GS se aplicase ⇓ marcadoresSe podría utilizar en esquemas de selecciónPosibilidad:
Métodos estadísticos para seleccionar solo marcadores con efecto(Bayes B, Laso, No paramétricos)
Problema:Multicaracteres30 Caracteres ⇒ 1500 markersCoste de 1500 SNPs ≈ 30000 SNPs
N.Ibáñez-Escriche Selección genómica
Introducción a la selección genómica Selección genómica Factores en GS
Ventajas GS
Ventajas
Vacuno lechero:Reduce el intervalo generacional⇑ Respuesta a la selección
Porcino, ovino,avícola:Interesante en caracteres difíciles de medirResistencia a enfermedadesCalidad de carneEvaluación de multiraza
Peces (no hay genealogia)
N.Ibáñez-Escriche Selección genómica