Capítulo 11: Predicciones Genéticas · 2016-07-13 · 1 Capítulo 11: Predicciones Genéticas En este momento ya debería estar claro que la tasa de cambio genético en una población

1

Capítulo 11:

Predicciones Genéticas

En este momento ya debería estar claro que la tasa de cambio genético en una población

depende en gran medida de la precisión de la predicción o más exactamente, en la precisión

de los valores de cría predichos o estimados.

La precisión puede ser incrementada hasta un cierto punto al aumentar la heredabilidad de

los caracteres. Manejar los animales de manera uniforme, tomando minuciosas medidas,

ajustando por efectos ambientales conocidos, utilizando grupos contemporáneos – todo

ayuda. Sin embargo, para aumentar la precisión aún más se requiere el uso de tanta

información como sea posible y ponderar cada una apropiadamente. Para hacerla corta,

requiere el uso de la tecnología de predicción genética.

El propósito de este capítulo es proveer un panorama de dos metodologías estrechamente

relacionadas que se utilizan comúnmente para la predicción genética: el índice de selección

y la mejor predicción linear insesgada. No se examinarán estas tecnologías en detalle, pues

esto requeriría conocimientos de estadística y álgebra matricial que muy pocos estudiantes

tienen. El énfasis aquí no es como los índices de selección y la mejor predicción linear

insesgada trabajan, más vale en cuando deberían ser usadas y también de qué son capaces.

En el capítulo 12 se trata la presentación e interpretación de las predicciones genéticas

producidas con estas tecnologías.

COMPARACIÓN DE ANIMALES UTILIZANDO DATOS DE GRUPOS GENÉTICAMENTE

SIMILARES – EL INDICE DE SELECCIÓN.

La teoría del índice de selección fue desarrollada por primera vez en 1930 y 1940, como

método para la predicción genética y como un medio para combinar de caracteres en la

selección de animales de la manera más óptima económicamente. En este capítulo

consideraremos el índice de selección como una metodología de predicción. Su rol en la

selección multicarácter será discutido en el capítulo 14.

Un índice de selección es esencialmente una combinación linear o índice de varios tipos de

información fenotípica y factores de ponderación apropiados.

Toman la siguiente forma:

Donde

I = un valor índice o predicción genética

bi= un factor de ponderación.

2

xi= un simple ítem de información fenotípica – un registro de producción o el promedio de los registros de producción de un grupo.

n= número total de ítems de información fenotípica.

En un índice de selección (o en cualquier método de predicción genética) la información utilizada en el cálculo de las predicciones genéticas para un individuo proviene de tres clases de fuentes: (1) registros de performance del propio individuo, (2) registros de producción de antecesores y/o parientes colaterales de los individuos (datos de pedigrí o genealógicos), y (3) los registros de producción de los descendientes del individuo (datos de la progenie).

Las cantidades relativas de datos de estas tres fuentes varían. Animales no nacidos o muy

jóvenes tienen solamente datos de pedigrí. Como estos animales crecerán y envejecerán

ellos adquirirán datos de performance propios. (Asumiendo, por supuesto, que ellos pueden

adquirir datos propios, ya que algunos caracteres tienen limitación de sexo. Los machos

lecheros por ejemplo no tienen datos de performance propios para caracteres de lactación y

leche) Si los animales son seleccionados para convertirse en padres, ellos generarán datos de

progenie, y si se vuelven populares, tendrán una gran cantidad de datos de progenie.

Cualquiera de los tres tipos de registros se puede tomar de cualquier carácter para el cual se

calcularán las predicciones, o pueden ser datos de otros caracteres genéticamente

correlacionados. Por ejemplo, en las especies en las cuales la distocia es una preocupación,

las predicciones de la susceptibilidad genética hacia ellas pueden ser determinadas por la

medida directa de las distocias como grados de distocia, por el peso al nacimiento (un

carácter genéticamente correlacionado), o por ambos.

Los datos utilizados en el índice de selección – el x1s – provienen de muchas fuentes dentro

de las categorías: de la propia performance, del pedigrí, y los datos de progenie. Por

ejemplo, x1 podría ser un registro de performance individual propia para un carácter, x2

podría ser el promedio de performance de los medio hermano paternos del individuo para el

mismo carácter, x3 podría ser el promedio de la performance de la progenie del individuo, y

x4, x5 y x6 podrían representar la performance del individuo, medio hermanos, y progenie

respectivamente para un carácter correlacionado. En todos los casos cada x es un número.

En un índice de selección cada ítem de la información fenotípica es normalmente expresado

como el desvío de la media de un grupo contemporáneo. Como bien se vio en el capítulo 9,

expresando la performance de esa forma, se tiene en cuenta las diferencias ambientales

entre grupos contemporáneos. EL problema con este enfoque, es que se asume que todos

los grupos contemporáneos son genéticamente similares. Un desvío de +10 unidades en un

grupo contemporáneo se asume como el equivalente genético de una desviación de +10

unidades en cualquier otro grupo contemporáneo. Si la media del valor de cría en cada

grupo es la misma, (es decir si los grupos contemporáneos son realmente genéticamente

similares) esta asunción es correcta. Sin embargo, si el valor de cría medio de los grupos

contemporáneos difiere, el uso de las desviaciones de las medias del grupo contemporáneo

crea sesgos en los datos.

3

Los registros provenientes de los grupos contemporáneos genéticamente más pobres

parecen mejores de lo que deberían, y los registros de los grupos contemporáneos

genéticamente superiores parecen peores de lo que deberían.

Por esta razón, los índices de selección solo deberían ser usados para las predicciones

genéticas cuando los datos de performance provienen de un grupo contemporáneo que se

piensa son genéticamente similares. En la práctica, esto significa que probablemente

deberían ser utilizados dentro de rodeos o majadas individuales y no en toda una población.

Y si un determinado rebaño ha experimentado cambios genéticos significativos en el tiempo,

los datos provenientes de los grupos contemporáneos más antiguos – grupos con valores de

cría más “antiguos“y por lo tanto diferentes – deberían ser excluidos del índice.

Los índices de selección podrán ser de aplicación restringida, pero son muy útiles. Suponga,

por ejemplo, que usted está criando ovejas y quiere comparar sus carneros sobre la base de

la performance de sus progenies dentro de su majada. Usted podría usar un índice de

selección para producir progenie, basado en EBVs o EPDs para cada carnero. Los cálculos

involucrados son bastante simples, no requieren nada más que una calculadora de mano.

Usted necesitará una computadora para aplicaciones más complejas de los índices de

selección pero aún así una PC y una hoja de cálculo serán suficientes.

Índice de selección: Una combinación linear de información fenotípica y factores de

ponderación que es usada para la predicción genética cuando los datos de performance

provienen de grupos contemporáneos genéticamente similares.

Datos de performance del propio individuo: Información sobre el fenotipo del propio

individuo.

Datos de genealogía: Información sobre el genotipo o la performance de antecesores y/o

parientes colaterales de un individuo.

Datos de la progenie: Información sobre el genotipo o la performance de los descendientes

de un individuo.

Sesgo: Cualquier factor que causa la distorsión de las predicciones genéticas.

Predicciones usando regresión: una revisión

El índice de selección no es nada más que una ecuación de predicción, recuerde la forma

general de una ecuación de predicción:

Valor predicho = coeficiente de regresión * “evidencia”.

En el índice de selección, el valor índice (Y) es un valor predicho – normalmente un EVB, EPD,

o MPPA. El xys en el índice es la evidencia, información fenotípica consistente en registros de

performance individual o medias de grupo de registros de performance (expresados como

desvío de la media de un grupo contemporáneo). Los bys en el índice de selección son

4

coeficientes de regresión. Ellos son regresiones de valores reales (BV, PD, o PA) sobre la

evidencia. En otras palabras, miden el cambio esperado en los valores verdaderos por

unidad de cambio en la evidencia. Las fórmulas para bys de los índices de selección son

bastante complicadas como se verá, y el mayor desafío matemático en el uso de los índices

de selección es calcular los valores numéricos de bys. (Técnicas de derivación de las fórmulas

para las regresiones del índices de selección y algunos ejemplos se dan en el Apéndice).

( )

De la simple ecuación de predicción al índice de selección con una sola fuente.

La ecuación simple de predicción se expresa como

Donde

un valor de predicción para el animal i

la media de las medias esperadas para los animales de la población

la regresión de los valores que se estan estimando sobre la evidendencia

la evidencia del animal i , expresada como la desviacion de la media poblacional

En el índice de selección más simple utilizando solo una fuente de evidencia, el valor predicho es

el valor índice, o

Valor de cría, diferencia de progenie, etc., promedian cero en la población, asimismo sus

predicciones, entonces

0

El coeficiente de regresion es

b

La evidencia en un índice de selección se expresa como desviacion de la media de un grupo

contemporaneo, entonces

( ) x

Poniendo todo junto,

5

Predicción utilizando una sola fuente de información.

Los índices de selección más simple son aquellos que involucran una sola fuente de

información x. Estos índices son de la siguiente forma:

I = bx

Son fáciles de calcular porque se necesita solo una ecuación para resolver el coeficiente de

regresión b. Este es el tipo de índice de selección que usted puede determinar utilizando

solo una calculadora de mano.

Algunas fórmulas para coeficientes de regresión utilizados en algunos índices de selección de

una sola fuente común, se pueden ver en la Tabla 11.1.

Identificado en la columna más a la izquierda de la tabla está el tipo de valor predicho – EBV,

EPD, o MPPA.

La siguiente columna muestra el tipo de valor de cría predicho verdadero.

La tercera columna describe la única fuente de información (x) o la evidencia a ser utilizada,

seguida por la columna de fórmulas para los coeficientes de regresión apropiados (b).

La última columna tiene las fórmulas para la precisión de la predicción – la correlación entre

el verdadero valor (BV, PD o PA) y sus predicciones (el valor índice Y). Las predicciones

genéticas para un animal individual se acompañan frecuentemente de un valor de precisión-

una correlación entre valores reales y sus predicciones. Las correlaciones son medidas

poblacionales y como tal podría parecer raro que sean asignadas a un individuo. Sólo

valores, recuerde, se supone que son aplicados a los individuos.

Las precisiones son de hecho medidas poblacionales, pero la “población” es muy teórica. Es

una población de animales hipotéticos que tienen exactamente la misma clase y cantidad de

información predictiva como el animal en cuestión. Un valor de precisión entonces, mide la

fortaleza de la relación entre valores reales y predicciones en esta población abstracta y al

mismo tiempo tiene relevancia para un animal individual.

6

Tabla 11.1 Una muestra de fórmulas para (1) coeficientes de regresión usados para calcular

predicciones de una sola fuente de información, y (2) Precisiones asociadas.

Para practicar el uso de la Tabla 11.1 suponga que desea calcular el MPPA para rendimiento

lechero de una vaca lechera. Llamemos a esta vaca Iris. La fuente de información en este

caso es la historia propia de lactación de Iris. Una vaca vieja, que ha tenido cinco registros de

lactación con un promedio de 1072 libras por sobre la media de su grupo contemporáneo. La

fórmula para el coeficiente de regresión apropiado, ubicado en la tercera fila de la Tabla 11.1

es:

( )

7

La Repetibilidad (r) del rendimiento lechero es de alrededor de 0,5 y el número de registros

de Iris (n) es 5. Entonces

( )

( )

( )( )

Por cada libra de aumento en la media de los 5 registros de Iris, aumentamos nuestra

expectativa de su verdadera habilidad productiva en 0,833 libras.

Para calcular la MPPA de Iris debemos ahora substituir este coeficiente de regresión por el

índice de selección. Así

( )

La MPPA de Iris es + 893 libras. En otras palabras esperamos que ella produzca 893 libras

más de leche que la media de sus contemporáneas. Si los rendimientos promedio de

lactación en este rodeo fueran 14.000 libras, nuestra predicción del próximo registro de Iris

es de 14.893 libras de leche.

Podemos calcular la precisión de esta predicción ( ) usamos la fórmula en la última

columna de la Tabla 11.1. Así:

√

( )

√ ( )

( )( )

√

Ajuste para mucha cantidad de información

Note que aunque el promedio de Iris es de más de 1072 libras que la media de sus

contemporáneas, nuestra predicción de su habilidad productiva es menor que esa cifra. Esto

es porque la predicción ha sido sujeto de lo que a veces se denomina regresión por cantidad

de información. Este es un proceso matemático que provoca que las predicciones genéticas

8

sean más o menos “conservadoras” (más cercanas a la media) dependiendo de la cantidad

de información utilizada para calcularlas.

Para tener una mejor idea de cómo la regresión por cantidad de información considere otras

dos vacas en el mismo rodeo Violet y Rose. Violet tiene dos registros de lactancia con un

promedio de 1204 libras por sobre la media del grupo contemporáneo. En su caso,

( )

( )

( )( )

La MPPA de Violet es entonces

( )

√

( )

√

Rose tiene solamente un registro, ella produjo 918 libras menos de leche que la media de su

grupo contemporáneo. En el caso de Rose

( )

( )

( )( )

La MPPA de Rose es entonces

( )

9

Con una precisión de

√

( )

√

Las medias de lactación y MPPA para Iris, Violet y Rose se muestran gráficamente en la

Figura 11.1. La MPPA de iris (+893 libras) es apenas menor que su verdadera media de

lactancia (+1072 libras). Con seis registros, Iris nos proveyó de considerable información

(evidenciada por una precisión de 0,91) y nosotros podemos confiar que ella

verdaderamente tiene una alta habilidad de producción. Aún así cinco registros no son

suficientes para estar totalmente convencidos. Es posible que Iris se haya beneficiado de una

secesión favorable de efectos ambientales temporarios (Et). Para contabilizar esta

posibilidad su MPPA ha sido ajustada en pequeño grado (la cantidad de regresión en este

caso, 1072- 893 = 179 libras, es en realidad una estimación de la media de los efectos

ambientales temporarios de Iris).

Violet tiene el promedio de lactación más alto (+1024 libras), pero su MPPA no es tan alto

como el de Iris. Esto es porque este fue más ajustado. Con solo dos registros (precisión

=0,82) no podemos confiar en la habilidad de Violet, entonces le asignamos una predicción

más conservadora.

Rose tiene solo un registro entonces su MPPA ha sido ajustada severamente – de -918 a -459

lb. Porque su primer registro es negativo la MPPA de Rose ha sido ajustada en alza, esta vez

a favor de Rose. Hay una buena posibilidad de que Rose haya experimentado un efecto

ambiental temporario durante su primera lactancia, entonces le damos el beneficio de la

duda.

El ejemplo de la vaca lechera muestra como las MPPAs son ajustadas por la cantidad de

información, pero ejemplos similares pueden ser construidos para cualquiera de las

10

predicciones listadas en la Tabla 11.1. En el ejemplo del MPPA el grado en el cual la

predicción ha sido ajustada es una función del número de registros y de la repetiblidad del

carácter. En los ejemplos que involucran EBV o EPDs el ajuste por regresión es una función

del número de registros, de la heredabilidad, de la repetibilidad del carácter (en los casos

donde se tienen registros repetidos) y relaciones de parentesco entre los animales que están

siendo medidos y el animal cuya predicción está siendo calculada. Con la excepción de las

relaciones de pedigrí, las fórmulas de los coeficientes de regresión de la Tabla 11.1 indican

exactamente qué factores entran en juego en cada situación.

El ajuste de las predicciones genéticas por cantidad de información resulta en predicciones

insesgadas. Esto simplemente significa que cuanto mayor es la información utilizada en las

predicciones subsecuentes para el mismo animal, las predicciones pueden cambiar en una

dirección positiva o en una negativa. Debido a que las predicciones genéticas son ajustadas

de acuerdo a la cantidad de información, ellas son en esencia, ajustadas por la precisión. En

otras palabras la precisión de una predicción es tomada en cuenta para la predicción misma.

El beneficio de ajustar por precisión es que ello permite comparaciones directas de

predicciones para diferentes animales sin tener en cuenta la precisión de dichas

predicciones. Por ejemplo si dos animales tienen el mismo EBV, pero la precisión de un

animal es mucho más alta que el de otro, se justifica que usted considere a los dos animales

genéticamente iguales. Por supuesto existe un gran riesgo de que el verdadero valor de cría

del animal que tiene la precisión más baja sea significativamente más pobre que la esperada.

Este representa un gran riesgo de selección. Por otro lado hay una posibilidad mayor de que

el verdadero valor genético de este animal sea significativamente mejor que lo esperado. En

este caso él representa una gran oportunidad de selección.

El gran beneficio de los valores de precisión es que permiten la selección de animales en una

forma compatible con la particular actitud de cada uno hacia la toma de riesgos.

Ajuste por cantidad de información: El proceso matemático que provoca que las

predicciones genéticas sean más o menos “conservadoras” (más cerca de la media)

dependiendo de la cantidad de información utilizada para calcularlas.

Insesgada: Una predicción genética es considerada insesgada si cuanto mayor es la

información utilizada en las predicciones subsecuentes para el mismo animal, las

predicciones pueden cambiar en una dirección positiva o en una negativa.

Estimaciones para ambientes comunes

Las fórmulas de coeficiente de regresión y precisiones en la Tabla 11.1 explican el parecido

en la performance de parientes, este parecido que ocurre porque los parientes tienen genes

en común. Pero algunas veces los parientes se desempeñan en forma semejante por otras

razones. Por ejemplo, los hermanos enteros tienen la misma madre, ellos experimentan un

ambiente común – en este caso un ambiente materno común. Como ellos tienen ambos

11

padres en común también comparten una proporción más grande de combinaciones de

genes que los individuos no emparentados o aún los medio hermanos. Y ésta fuente de

parecido genético a menos que sea expresamente tenida en cuenta de alguna otra manera,

forma parte del ambiente común de los hermanos enteros también. A causa del ambiente

común, los registros de performance para hermanos enteros tienden a ser más parecidos de

lo esperado dada la proporción de genes que tienen en común (50%), por cual los registros

adicionales sobre hermanos enteros provee menos información que en otros casos.

En teoría los efectos ambientales comunes, pueden ocurrir dentro de familias de cualquier

clase. Es conocido que se dan por ejemplo, dentro de las familias de medio hermano

paternos de los animales lecheros. Los tamberos muchas veces tratan a las hijas de un

macho en forma diferenciada que a las hijas de otros machos, esto crea un efecto ambiental

común.

El caso más claro de efectos ambientales es dentro de las familias de hermanos enteros. Los

efectos ambientales comunes son por lo tanto especialmente importantes en la especies

politocas como los cerdos, conejos, gatos, perros y ratones. Cuando existen efectos

ambientales comunes, pero no son tomados en cuenta en las predicciones genéticas, los

coeficientes de regresión (factores de ponderación) y las precisiones asociadas son sesgadas

en alza, es decir no lo son suficientemente conservadoras.

Para tomar en cuenta los efectos ambientales comunes en forma apropiada, se incorpora

una medida de covariación entre parientes causada por el ambiente común, que se

representa con c2. Dos de los 10 escenarios que se listan en la Tabla 11.1 (línea 6 y 9) utilizan

información proveniente de hermanos enteros. Note el uso de c2 en los denominadores de

las fórmulas para los coeficientes de regresión y precisiones. Al aumentar sus

denominadores, disminuimos el tamaño del coeficiente de regresión y las precisiones

haciéndolos más conservadores.

efectos ambientales comunes: Un incremento en la similitud en la performance de los

miembros de una familia causada por su ambiente común compartido. Los efectos

ambientales comunes son particularmente importantes en las camadas (hermanos enteros)

Factores que afectan la precisión de la predicción

Muchos de los factores que afectan la precisión de las predicciones pueden verse en las

fórmulas de precisión listadas en la columna de la derecha de la tabla 11.1. Son los mismos

que los factores que afectan los coeficientes de regresión: número de registros,

heredabilidad, repetibilidad y relaciones genealógicas.

Para tener una idea de la importancia relativa de esos factores en la precisión de las

predicciones, es útil examinar diferentes situaciones de predicción. En la Tabla 11.2, hay

valores para la precisión o exactitud de la predicción de los valores de cría, provenientes de

diferentes fuentes de información.

12

Las fuentes varían en las relaciones genealógicas y el número de registros. “Individuo” se

refiere al animal del cual se están prediciendo los valores de cría. En todos los casos, se

asume un solo registro por animal y cada fuente es considerada independientemente (es

decir, como una sola fuente de información). Se muestran precisiones correspondientes a

tres niveles de heredabilidad.

Lo primero que se puede notar en la tabla es que cuando aumenta la heredabilidad, lo hace

la precisión de la predicción – sin importar la fuente de información. Elija cualquiera de las

filas de la tabla. Mientras usted va desde izquierda a derecha (en otras palabras a medida

que la heredabilidad aumenta) la precisión aumenta también. Esto tiene sentido porque la

heredabilidad mide la fortaleza de la relación entre los valores de cría y los valores

fenotípicos. Cuanto más fuerte es esta relación mejor será el registro de producción de cada

animal como indicador del valor de cría de este.

Cuando la fuente de información es el registro del propio individuo, la heredabilidad mide la

fortaleza de la relación entre el valor de cría que estamos tratando de predecir y la fuente de

información. La heredabilidad es precisión (o para ser técnicamente correcto, el cuadrado de

la precisión).

Cuando la fuente de información no es el individuo mismo sino algún grupo de parientes

(por ejemplo medio hermanos), la heredabilidad más alta provoca que los registros de

performance de cada hermano sea un mejor indicador de sus propios valores de cría y por lo

tanto, un mejor indicador de los valores de cría de su hermano – el individuo en cuestión.

La precisión también aumenta con las relaciones genealógicas. Los números en la columna

de las relaciones de pedigrí de la Tabla 11.2 miden la proporción de genes que tienen en

común diferentes tipos de parientes. EL individuo tiene el 100% de los genes en común

consigo mismo, el 25% en común con los medio hermanos y el 50% con su progenie.

Compare la fila de los registros del propio individuo con las filas de un medio hermano y de

una cría. La precisión es más alta para los registros del individuo, seguida por los registros de

la progenie y luego los registros de medio hermanos. Cuanto más cercana la relación del

individuo con los animales que proveen los registros de performance, mejor esos registros

como indicadores del valor de cría del individuo.

La precisión de la predicción aumenta con el número de registros. Mire cada una de las filas

para los medio hermanos o las filas para la progenie en la tabla. Cuanto mayor es el número

de registros, mejor la precisión. Claramente, más cantidad de registros proveen más

información en la cual basar la predicción.

La Tabla 11.2, ofrece una mirada dentro del valor del registro propio del individuo, en vez de

los registros de parientes. Cuando la heredabilidad es alta, los registros del propio individuo

son especialmente valorados. Con una heredabilidad = 0,7 (la última columna en la tabla), el

registro del propio individuo (precisión = 0,84) es más revelador que los registros de 10 hijos

(precisión de 0,82) y mejor que 1000 registros de medio hermanos (precisión= 0,49). Esto

13

sigue directamente la definición de heredabilidad: la fuerza de la relación existente entre la

performance y el valor de cría. Cuando la heredabilidad es alta, el registro de performance

propio de un individuo debería ser un buen indicador de su valor de cría.

Si la performance individual tiene un mayor valor con altos niveles de heredabilidad, ello

explica la razón de que los registros de performance de los parientes deberían valorar más a

bajos niveles de heredabilidad. Con una heredabilidad de 0,5 (la primera columna de

precisiones en la tabla), el registro del propio individuo provee la misma cantidad de

información (precisión =0,22) que los registros de 20 hermanos o entre cuatro o cinco hijos,

pero no está cerca de proveer la información equivalente de un número más alto de

parientes.

Los registros de la progenie son la última fuente de información para predecir valores de

cría. Note las altas precisiones de predicción en la Tabla 11.2 cuando hay un gran número de

hijos. Con suficiente progenie, la precisión es alta aún cuando la heredabilidad es baja por la

siguiente razón. Los registros de la progenie proveen una medida del valor de los genes que

un individuo transmite. Un registro de una sola cría puede no ser muy revelador por varias

razones: (1) los efectos ambientales pueden tener más influencia que los efectos genéticos

(la heredabilidad puede ser baja), (2) el valor de cría del otro progenitor (madre) no es

tenido en cuenta y (3) la cría puede haber recibido una muestra particularmente buena o

mala de genes del individuo – puede haber sido beneficiado o sufrido el muestreo

mendeliano.

Sin embargo, los efectos ambientales, el valor de cría del otro progenitor y los efectos del

muestro mendeliano pueden disminuirse con un gran número de hijos. La performance

promedio de muchos hijos es un buen indicador del valor de cría de un individuo.

Esto es un punto importante para recordar. A menudo se asume que es virtualmente

imposible el progreso genético en caracteres que son de baja heredabilidad, debido a la

dificultad de identificar los individuos genéticamente superiores. Esto es verdad si limitamos

nuestra fuente de información a los registros de performance del propio individuo. Sin

embargo con registros de la progenie – y un gran número de ellos – el problema de la

heredabilidad baja puede ser sobrepasado. Podemos determinar precisamente aquellos

animales con los mejores valores de cría.

Los registros de los hermanos pueden aumentar la precisión solo hasta un punto. Fíjese en la

línea de la Tabla 11.2 correspondiente a los 1000 medio hermanos. Aún con esta enorme

cantidad de datos, la precisión no excede 0,5. De hecho 0,5 es el límite de precisión para las

predicciones derivadas de registros de medio hermanos, sin importar el número de registros

o la heredabilidad del carácter. Esto es porque los datos del medio hermano, proveen

información de solo la mitad de la genealogía del individuo, y no tiene en cuenta el muestreo

mendeliano.

14

En la Figura 11.2 se ilustra como los registros de los medio hermanos paternos influencian la

predicción del valor de cría de un individuo. Si existe gran cantidad de registros de medio

hermanos, el valor de cría del padre del individuo, será bien establecido. Los registros de los

medio hermanos son después de todo, registros de progenie para su padre. Pero establecer

el valor de cría del padre no es lo mismo que determinar el valor de cría del individuo. No

podemos decir a partir de los registros de los medio hermanos, si el individuo heredó una

mejor o peor muestra de genes de sus padres que el promedio – si este sufrió o se benefició

del muestreo mendeliano. En otras palabras, no podemos decir si el individuo heredó más o

menos que la mitad del valor de cría de su padre. Es más no tenemos información sobre el

valor de cría de la madre o de la muestra de genes heredados de ella.

En el caso improbable de que un gran número de medio hermanos de ambos padres

(materno y paterno) esté disponible, es posible tener precisión en la predicción por sobre

0,5. En este caso, tenemos una buena estimación de los valores de cría de la madre y del

padre del individuo, pero aún así no tenemos información sobre el muestreo mendeliano y

el límite superior de precisión tiende a ser la raíz cuadrada de 0,5 o 0,71.

Lo que es cierto para los datos de los medio hermanos, también es cierto para lo datos de

genealogía en general. Registros de performance de los padres, antecesores y parientes

colaterales de un individuo pueden ser útiles, pero por sí mismos nunca pueden producir

predicciones genéticas con precisiones especialmente altas.

15

Tabla 11.2 Precisión de la predicción del valor de cría de una sola fuente de

información

Heredabilidad Fuente de información

Relación genealógica

N° de registros

0,05 0,30 0,70

Individuo 1,00 1 0,22 0,55 0,84

Medio Hermanos

0,25 1 0,06 0,14 0,21

10 0,17 0,33 0,41

20 0,22 0,39 0,45

100 0,37 0,47 0,49

1000 0,48 0,49+ 0,49+

Progenie

0,50 1 0,11 0,27 0,42

10 0,34 0,67 0,82

20 0,45 0,79 0,90

100 0,75 0,94 0,98

1000 0,96 0,99 0,99+

Una perspectiva sobre el número de progenie

Los criadores de animales, especialmente de las especies más glamorosas como equinos,

bovinos y perros tienden a precipitarse en sus conclusiones. En particular, ellos tienden a

formar opinión sobre los padres, basados en información insuficiente de la progenie.

Si los primeros pocos hijos de un macho son sobresalientes, ellos asumen que ese macho es

sobresaliente también, mientras que si es mediocre, el macho es asumido como mediocre

también. Que los criadores lleguen a conclusiones prematuras sobre los padres es bastante

comprensible; la paciencia es una virtud poco común en el humano. Sin embargo, la

selección sería más efectiva si la confianza que los criadores ponen en los datos de la

progenie estuviera en línea con el número de hijos.

La Tabla 11.3 provee alguna perspectiva sobre el número de hijos utilizando ejemplos con

dos caracteres. El tiempo requerido para una raza de equinos para trotar una milla y el

tamaño de la camada al destete en cerdos. En cada línea de la tabla están los valores de las

medias de performance de la progenie, el número de hijos, EPD, precisión, y 68% de

intervalo o rango de confianza para los EPD.

El rango de confianza es una forma alternativa de expresar la precisión. Define un rango de

valores dentro del cual esperamos – con una probabilidad dada, un grado de confianza

dado- que se encuentre el verdadero valor. Por ejemplo el EPD en la segunda línea de la

tabla es -0,11 segundos. Dada la cantidad de información utilizada para obtener esta

predicción, el rango de confianza para este EPD es -1,22 a +0,99 segundos. La posibilidad de

que la verdadera diferencia de progenie del animal esté en algún lugar entre -1,22 y +0,99

segundos es un poquito mejor que dos en tres (2/3) o del 68%. En otras palabras, podemos

16

tener un 68% de confianza de que el verdadero EPD esté dentro de este intervalo. Si el 68%

parece un nivel de confianza un poco arbitrario – bueno, lo es. Sin embargo, es el nivel

arbitrario estándar.

Miremos la parte superior de la Tabla 11.3, la parte que contiene el tiempo para trotar una

milla. Cada fila corresponde a registros para diferentes números de hijos de un solo caballo.

Para simplificar se asume que hay solo un registro por hijo (es decir, solo el registro de la

primera carrera de cada hijo es utilizado en los cálculos) y sin importar el número de hijos, la

media de la progenie es la misma: -1 segundo o 1 segundo más veloz que la media de los

contemporáneos.

Debería notar algún patrón enseguida. El primero es un buen ejemplo de ajuste por cantidad

de información. Aunque la media de la progenie no cambia, los EPD sí, y los cambios en los

EPD son un reflejo de cuanto han sido ajustados por cantidad de información. Cuanto mayor

el número de progenie menor el ajuste de los EPDs – más lejos de cero estarán. Con sólo un

registro de la progenie de -1 segundo, el EPD de nuestro caballo es -11 segundos, pero con

100 hijos promediando -1 segundo, su EPD es -0,93 segundos. En el primer caso, el EPD es

ajustado severamente por la escasa cantidad de información disponible, en el segundo caso,

es ajustado muy poco debido a la abundante cantidad de información.

También notará que al aumentar el número de hijos, también aumentan las precisiones. Y al

aumentar el número de hijos, el 68% del rango de confianza es menor. Con un solo registro

de progenie podemos esperar que la diferencia de progenie real del caballo esté entre -1,22

y +0,99 segundos, una duración total de 2,21 segundos. Con 100 hijos el rango es de -1,24 a

0,61 segundos, una duración de solo 0,63 segundos. Cuanta mayor cantidad de hijos,

estaremos más cerca de identificar el verdadero valor de diferencia en la progenie, por lo

tanto será más estrecho el rango de confianza.

El mensaje más importante que le debería quedar de la Tabla 11.3 es que harán falta

bastante más que unos pocos registros de progenie para conocer mucho acerca del padre.

Sin registros de progenie – ninguna información- la diferencia de progenie del caballo se

predice que es 0 o promedio y el 68% de rango de confianza para esta predicción es de -1,17

a +1,17 segundos un total de 2,43 segundos. Con cinco registros de progenie, el rango de

confianza es de -1,31 a 0,53 o 1,84 segundos en total. El rango es más pequeño con cinco

registros que con ninguno, pero no tanto. Note que el límite de confianza superior es aún

mayor que cero (+0,53). En otras palabras, con cinco hijos no tenemos seguridad de que

nuestro caballo es genéticamente superior que la media. Solo cuando el número de hijos es

cercano a 20, cuando el límite superior del rango de confianza va por debajo de cero,

podemos estar razonablemente confiados en que el animal dará hijos más rápido que el

promedio.

Las mismas conclusiones pueden ser tomadas de la mitad hacia debajo de la Tabla 11.3, para

el carácter números de lechones destetados. En este ejemplo los EPDs son calculados para

17

un padrillo, basados en los registros de sus hijas para tamaño de la camada al destete. Para

simplificar, se asume que cada hija ha producido una sola lechigada.

Como en el ejemplo anterior, un número relativamente grande de registros de progenie es

necesaria antes de que sepamos mucho sobre el reproductor. Pero aún más cantidad de

registros se requieren para el tamaño de camada que para el tiempo de carrera. Esto es

porque el número de lechones destetados es menos heredables (h2= 0,10 versus 0,45). Cada

registro conlleva menos información sobre los valores de cría subyacentes por lo cual son

necesarios más registros. EL rango de confianza decrece lentamente de 0,88 lechones (-0,44

a+ 0,449) cuando el padrillo no tiene hijas; a 0,83 lechones (-0,36 a +0,47) con cinco hijas; a

0,72 lechones (-0,19 a + 0,53) con 20 hijas. Se requieren camadas de más de 50 madres antes

de que el límite menor del rango de confianza exceda a cero y podamos estar confiados de

que nuestro padrillo dará hijas que son mejores que la media para n° de lechones

destetados.

La Tabla 11.3 está diseñada para mostrar el peligro de juzgar reproductores sobre la base de

un pequeño número de hijos. También se puede concluir de la tabla que juzgar a las

hembras sobre la base de los datos de la progenie es riesgoso en casi todos los casos. Con

excepción de las especies politocas, las hembras raramente producen 10 hijos y mucho

menos 20, 50 o 100. Es difícil tener suficiente información de la progenie de las hembras que

sean demasiado reveladoras.

Rango de confianza: un rango de valores dentro del cual esperamos – con una probabilidad

dada, un grado de confianza dado- que se encuentre el verdadero valor de interés.

Tabla11.3 Intervalos de confianza para EPDs derivados de distinto número de registros de progeniea Carácter (especies)

Progenie promedio

N° de progenie

EPD ACC Rango de confianza de 68%

Tiempo para trotar una milla (Standardbreds) h2= 0,45 σp=3,5 seg.

0 0,00 0,00 -1,17 a +1,17

-1,0 seg 1 -0,11 0,34 -1,22 a +0,99

" 2 -0,20 0,45 -1,25 a +0,85

" 5 -0,39 0,62 -1,31 a +0,53

" 10 -0,56 0,75 -1,34 a +0,22

" 20 -0,72 0,85 -1,34 a – 0,9

" 50 -0,86 0,93 -1,30 a – 0,43

" 100 -0,93 0,96 -1,24 a – 0,61

N° de cerdos de cerdos destetados (porcinos) h2= 0,10 σp=2,8 cerdos

0 0,00 0,00 -0,44 a +0,44

+ 0,5 cerdos 1 +0,01 0,16 -0,42 a +0,45

" 2 +0,02 0,22 -0,41 a +0,46

" 5 +0,06 0,34 -0,36a +0,47

" 10 +0,10 0,45 -0,29 a +0,50

" 20 +0,17 0,58 -0,19 a +0,53

" 50 +0,28 0,75 -0,01 a +0,57

" 100 +0,36 0,85 +0,13 a +059 a

Asunciones: (Standardbreds, raza de caballo) una carrera por hijo; (porcinos) una camada por hija. Las

unidades para EPDs y rangos de confianza son segundos para tiempo de carrera, y cerdos para número de

cerdos destetados. ACC es sinónimo de precisión.

18

Predicción usando múltiples fuentes de información

Podemos estar interesados en predecir un valor para un individuo basado en más de una

sola fuente de información. Por ejemplo, podríamos querer predecir el valor de cría de un

animal basado en su propia performance, la performance media de sus medio hermanos

paternos y el promedio de performance de su progenie. El índice de selección en este caso

aparecería como

O

Para calcular este EBV necesitamos valores para los tres factores de ponderación b1, b2 y b3 y

eso requiere de la construcción y solución simultánea de tres ecuaciones. Es posible lograrlo

√( )

√( )

(

)

( ( ) )

√( ( ))( )

La relación matemática entre el rango de confianza y la precisión

Sea T para algún valor real (es decir, BV, PD, PA, etc.). Entonces

Ejemplo

En los escenarios mostrados en la Tabla 11.3 para el tiempo para correr una milla,

Y

Entonces

68%de rango de confianza = √( )

De la Tabla 11.3,

Co 10 hijos

68%de rango de confianza = √( )

19

a mano pero no sin un considerable dolor de cabeza. Los cálculos para índices de selección

que involucran más de dos fuentes de información es mejor dejarlas para la computadora.

Ponderación de cada fuente de información

( )

√

Un ejemplo de cuatro ecuaciones

Suponga que queremos predecir el valor de cría de un animal para un caracter no repetido basado en 4 fuentes de información(1) performance del individuo (2) performance promedio de medio hermanos paternos (3) performance promedio de medio hermanos maternos (4) performance promedio de la progenie. El índice de selección es entonces

O

Las 4 ecuaciones que se deberán resolver simultaneamente para determinar los coeficientes de regresion (b1,b2,b3, y b4) son:

( )

=

( )

=

Donde las RS hacen referencia a las relaciones de pedigree, y n1, n2, y n3 hacen referencia al número de medio hermanos paternos, medio hermanos maternos, y progenie, respectivamente. Específicamente,

+

+

+

= 1

+

( )

+ 0 +

=

+ 0 +

( )

+

=

+

+

+

( )

=

Los coeficientes de regresión son funciones de la heredabilidad, de las relaciones de pedirgee y de los números de registros de cada grupo de parientes. Una vez que se han determinado los valores de los bs, simplemente se sustituyen en la ecuación para calcular el índice de EBV del animal. la exactitud del índice es:

Para muestras de la aplicación de estos índices, mire los datos de la Tabla 11.4. Ellos fueron derivados de las ecuaciones de índices listadas arriba.

20

Como podría adivinarse, los valores de bs, es decir los factores de ponderación necesarios

para los índices de selección que involucran fuentes de información múltiples, varían

dependiendo de la cantidad y relevancia de los datos de cada fuente. Por ejemplo, si un

animal tiene muchos datos de genealogía y registros de performance propios, pero pocos

datos de progenie, esperamos que en el cálculo del EBV de ese animal el mayor énfasis sea

colocado en los datos de genealogía y su propia información. Por otra parte, si el mismo

animal adquiere una vasta cantidad de datos de progenie, esperamos que el énfasis cambie

a esa fuente de información. Los datos de la progenie, después de todo, proveen la última

prueba del valor de cría de un individuo. Cuando se usan ecuaciones simultáneas para

resolver la ponderación en los índices de selección, cada factor de ponderación

automáticamente refleja la cantidad apropiada de énfasis que se debería colocar en su

correspondiente fuente de información. Se podría pensar en esto como en la solución

mágica de las ecuaciones simultáneas. La Tabla 11.4 ha sido construida para ilustrar algunos

aspectos de esta magia matemática.

En la Tabla 11.4 se pueden ver proporciones decimales representando el énfasis relativo

dado a cada fuente de información en particular, para la predicción del valor de cría. Cada

línea representa un escenario diferente, cada uno involucrando diferente cantidad de datos

sobre la performance individual (IND), la performance media de medio hermanos paternos

(PHS), el promedio de la performance de medio hermano maternos (MHS), y la performance

media de la progenie (PROG). El carácter medido se asume que no es repetido (cada animal

puede tener un solo registro) con una heredabilidad de 0,3.

Las líneas (escenarios) en la Tabla 11.4 se agrupan en tres secciones. Las primeras tres

representan situaciones en las cuales solo está disponible la información genealógica de un

individuo. Quizás el individuo todavía no haya nacido o sea demasiado joven para tener

registros de performance propios. Las siguientes dos filas reflejan la combinación de los

datos de genealogía y de la performance del propio individuo. Las últimas cuatro filas

combinan genealogía, performance propia, e información de la progenie – datos que

podrían estar disponibles solamente para un animal más viejo. Note que la precisión de la

predicción del valor de cría (la columna de la derecha) aumenta con la cantidad de

información.

El escenario representado en la primera fila representa una modesta cantidad de

información del pedigrí. La madre del individuo de interés – el individuo cuyo valor de cría

estamos prediciendo- tiene dos crías previas, y el macho es probablemente joven, teniendo

solamente 10 hijos. Un mayor énfasis se da a los registros de los hermanos paternos que a

los registros de los hermanos maternos porque hay más registros para aquellos, pero todos

juntos proveen poca información y la precisión es baja (0,30).

En la segunda fila, el padre del individuo de interés con 200 registros de progenie, está bien

evaluado. EL énfasis sobre la información de los hermanos paternos aumenta en

consecuencia y la precisión es más alta.

21

En la fila tres el número de registros se duplica. El número de registros de los hermanos

paternos aumenta de 200 a 400 y el número de registros de hermanos maternos de 2 a 4. A

pesar del gran aumento en el número de hermanos paternos el énfasis relativo en estos

decrece. Esto es porque el lado paterno del pedigrí ya está establecido. Con 200 hijos, el

valor de cría del padre del individuo de interés se predice con una alta precisión y agregar

200 hijos más, no sería de gran ayuda. Por otra parte, el lado de la madre en el pedigrí es un

lado “misterioso”. Con solo dos crías sabemos muy poco su valor de cría. Adicionar dos crías

más parecería no mejorar demasiado, pero esos dos registros proveen información de una

parte del pedigrí que ya era poca antes. La escasa información trae una mayor ponderación

por registro que información abundante.

La precisión de los valores de cría estimados basados solamente en la información

genealógica no es muy alta. En el ejemplo en la Tabla 11.4 la precisión alcanza un pico de

0,55 en la tercera fila. Como se explicó en la discusión de las predicciones para una sola

fuente, los datos de genealogía no toman en cuenta el muestreo mendeliano. Una

estimación de la genealogía es útil como una primera conjetura, pero no podemos esperar

que sea confiable.

Las filas 4 y 5 de la tabla combinan la información genealógica con los registros de la

performance propias del individuo. Debido a que el carácter es de moderada heredabilidad

(h2 = 0,3) los registros propios del individuo tienen un considerable peso – 75% cuando hay

pocos datos genealógicos y 54% cuando hay abundantes datos de los hermanos paternos. El

registro del individuo es solo uno, pero es un registro del pariente más cercano del individuo

(él mismo), y este refleja el muestreo mendeliano de los genes; nos dice algo sobre el valor

de los genes que el individuo realmente recibió de sus padres.

Las últimas cuatro filas incorporan tres clases de información: genealógica, performance

propia, y datos de progenie. Note la relativa importancia de los datos de la progenie aún

cuando el número de hijos es pequeño. Con un mayor número de hijos (las últimas dos filas)

otras fuentes de información no tienen consecuencias prácticamente, aún cuando están

representadas por muchos registros. Y con suficientes datos de la progenie, la precisión de la

predicción es muy alta – 0,97 más en este ejemplo.

Tabla 11.4: Énfasis proporcional puesto en diferentes fuentes de registros utilizados para predecir valores de cría cuando el número de registros varía .a Número de registros Énfasis Proporcional

IND PHS MHS PROG IND PHS MHS PROG ACC

Sólo datos de progenie:

0 10 2 0 0,00 0,76 0,24 0,00 0,38

0 200 2 0 0,00 0,87 0,13 0,00 0,52

0 400 4 0 0,00 0,80 0,20 0,00 0,55

Datos de pedigrí y performance propia:

1 10 2 0 0,71 0,22 0,07 0,00 0,61

1 200 2 0 0,54 0,40 0,06 0,00 0,67

Pedigrí, performance propia y datos de progenie:

1 10 2 10 0,30 0,09 0,03 0,58 0,77

22

1 200 2 10 0,27 0,20 0,03 0,50 0,79

1 10 2 200 0,03 0,01 0,00 0,96 0,97

1 200 2 200 0,03 0,02 0,00 0,95 0,97 aIND = individuo: PHS= medio hermanas paternas; MHS= medio hermanas maternas; PROG= progenie; ACC=

precisión de la predicción; h2 = 0,3.

Estimación del pedigrí: Una predicción genética basada solamente en datos genealógicos.

COMPARACIÓN DE ANIMALES USANDO DATOS DE DIFERNTES GRUPOS GENÉTICOS

–MEJOR PREDICCIÓN LINEAR INSESGADA.

El índice de selección es un poderoso método para la predicción genética. Sin embargo una

asunción básica del índice de selección es que la información de performance utilizada

proviene de grupos contemporáneos genéticamente similares. ¿Y si queremos hacer

predicciones usando datos de grupos contemporáneos genéticamente diferentes? – grupos

de diferentes establecimientos o de diferentes décadas. Una extensión de la metodología de

los índices de selección conocida como mejor predicción linear insesgada o BLUP por su

sigla en inglés (Best Linear Unbiased Predicition) está diseñada para este tipo de

información. La distinción hecha aquí entre índice de selección y BLUP refleja diferencias en

como las dos tecnologías han sido aplicadas históricamente. Es teóricamente posible

construir índices de selección que podrían tomar en cuenta las diferencias genéticas entre

grupos contemporáneos y que podrían ser para propósitos prácticos tan buenos como la

más sofisticada tecnología BLUP. Sin embargo, estos índices de selección no han sido

utilizados por la simple razón de que no tienen ventajas particulares sobre procedimientos

BLUP análogos.

La teoría estadística detrás del BLUP es casi tan vieja como la teoría detrás del índice de

selección. Sin embargo no fue hasta principios de 1980 que las computadoras y los

algoritmos matemáticos han avanzado hasta el punto de que la difusión de la aplicación del

BLUP para las evaluaciones genéticas se convirtió en factible. BLUP requiere de computación

intensivamente. Tal como los índices de selección que utilizan múltiples fuentes de

información, BLUP involucra la solución simultánea de un gran número de ecuaciones. Sin

embargo, una aplicación típica del BLUP incorpora muchas veces el número de ecuaciones

que serían utilizadas por el correspondiente índice de selección, en parte porque un análisis

BLUP simple provee predicciones para una población entera de animales – no solo para un

animal a la vez (que es el caso de la mayoría de las aplicaciones del índice de selección).

Debido a su habilidad para tomar en cuenta las diferencias entre grupos contemporáneos y

debido a que provee predicciones genéticas para muchos animales a la vez, BLUP es el

método preferido para las evaluaciones genéticas a gran escala: la evaluación genética de

poblaciones grandes, típicamente razas enteras. Los registros de performance utilizados en

dichas evaluaciones usualmente provienen de datos de campo, datos que regularmente son

reportados por criadores individuales a las asociaciones de cría de las razas o a las agencias

gubernamentales.

23

Mejor predicción linear insesgada BLUP: Un método de predicción genética que es

particularmente apropiado cuando los datos de performance provienen de grupos

contemporáneos genéticamente diversos.

Evaluaciones genéticas a gran escala: la evaluación genética de poblaciones grandes,

típicamente razas enteras.

Datos de campo: datos que regularmente son reportados por criadores individuales a las

asociaciones de cría de las razas o a las agencias gubernamentales.

Tipos de modelos de BLUP

BLUP es una técnica que puede ser concebida como una familia de modelos estadísticos, es

decir, representaciones matemáticas de performance animal que incluye varios efectos

ambientales y genéticos y que son usados para las predicciones genéticas. Hay modelos

padre, modelos padre-abuelo materno, modelo animal, modelo de medidas repetidas,

modelos materno-directo, modelos multicarácter- la lista continua y continua. Las

diferencias entre modelos tienen que ver primariamente con que animales recibirán las

predicciones genéticas (solamente los padres, todos los progenitores, o todos los animales),

el número y clase de predicciones generadas y la dificultad computacional. En general

cuanto más sofisticado el modelo, involucra más ecuaciones y más cantidad de recursos

informáticos requiere.

Modelo estadístico: Representación matemática de la performance de un animal que

incluye varios efectos genéticos y ambientales y es utilizado para la predicción genética.

Potencial de los modelos BLUP avanzados

La predicción BLUP es un asunto complicado, y los criadores a menudo tienen preguntas

sobre las capacidades de los procedimientos BLUP. En particular, se preguntan si los análisis

BLUP pueden sobrepasar la clase de sesgo que usualmente traen los datos de campo. A

continuación hay una discusión sobre los atributos del BLUP que ha sido diseñada para

contestar muchas de estas preguntas. Es siempre peligroso generalizar acerca de los

modelos BLUP. Cada uno difiere del próximo de una forma u otra, y dos de ellos no tienen

exactamente las mismas capacidades. El modelo particular previsto en la construcción de

ésta sección es el más básico, todavía el más avanzado y actualmente el tipo más popular de

modelo BLUP – el modelo animal.

El modelo animal tiene una cantidad de cualidades deseables de las cuales la más obvia es su

habilidad para evaluar “todos los animales” (en contraposición a solo los machos) en una

población.

Modelo Animal: Modelo estadístico avanzado para la predicción genética que es utilizado

para evaluar todos los animales (al contrario de solo los padres) en una población.

24

Niveles genéticos de los grupos contemporáneos

Los modelos BLUP tienen en cuenta las diferencias en los valores de cría promedio de los

grupos contemporáneos. En otras palabras, tienen en cuenta el hecho de que la

performance superior en un grupo contemporáneo genéticamente inferior, no es

equivalente a la performance superior en un grupo contemporáneo superior. En un análisis

BLUP la performance de un caballo ganador en su tercera carrera en una feria común en el

país no es considerada tan impresionante como la performance del ganador del Derbi de

Kentucky.

El índice de selección como se recordará no puede hacer esta distinción. A causa de que usa

desvíos de la media de los grupos contemporáneos (en el ejemplo del caballo de carrera,

desviaciones del tiempo medio para correr una carrera dada) el índice de selección no puede

tener en cuenta el nivel de la competencia. Una desviación de - 0,5 es una desviación de -5

segundos si la carrera es en el Derbi de Kentucky o una de las tantas de las ferias del país.

Los modelos BLUP no utilizan desviaciones de las medias de los grupos contemporáneos. En

cambio incluyen ecuaciones que realmente resuelven los efectos del grupo contemporáneo

(Ecg), es decir efectos ambientales comunes a todos los miembros de un grupo

contemporáneo. Y lo hacen mediante la comparación de la performance de parientes en

grupos contemporáneos diferentes. Si los animales en un grupo contemporáneo en

particular no producen como deberían de acuerdo a lo determinado por la performance de

sus parientes en otros grupos contemporáneos, entonces, el efecto ambiental común a ese

grupo contemporáneo se estima que es más bajo que la media. Igualmente, si los animales

en el grupo producen mejor que lo que deberían, el Ecg se estima que es superior a la media.

A través de la solución simultánea de ecuaciones, las estimaciones de los efectos de los

grupos contemporáneos proveen la información que se utiliza para producir una predicción

genética más confiable para animales individuales y viceversa. Así los procedimientos BLUP

tienen en cuenta el hecho de que la información de performance utilizada en las

predicciones proviene de grupos contemporáneos que difieren por razones ambientales y

genéticas. Se puede comparar directamente las predicciones genéticas provenientes de los

modelos BLUP, aún cuando esas predicciones derivan grandemente de registros producidos

en ambientes muy diferentes y/o en grupos contemporáneos que difieren ampliamente en

el mérito genético promedio.

Tendencia genética

Un corolario de las capacidades de los modelos BLUP para contabilizar los niveles genéticos

de los grupos contemporáneos es su habilidad para tomar en cuenta la tendencia genética.

Si una población ha sido objeto de una selección efectiva por un período de tiempo

considerable (es decir si ha experimentado una tendencia genética significativa), el valor de

cría promedio de los grupos contemporáneos más nuevos deberían ser mejores que los

25

valores de cría promedio de los grupos contemporáneos más viejos. Pero a causa de que los

procedimientos BLUP toman en cuenta las diferencias genéticas entre grupos

contemporáneos, las tendencias genéticas usualmente no son un problema (las tendencias

genéticas causarían sesgos en un índice de selección utilizando desvíos de las medias de los

grupos contemporáneos). Con los modelos BLUP podemos utilizar registros de performance

legítimamente provenientes de animales de diferentes épocas – desde aquellos que desde

hace mucho tiempo que están muertos hasta los recién nacidos.

Uso de todos los datos

Las aplicaciones tradicionales de los índices de selección utilizan registros de relativamente

pocas fuentes. El índice de selección utilizado para generar los valores en la Tabla 11.4, por

ejemplo, utiliza cuatro fuentes: el registro de un individuo, los registros de hermanos

maternos y paternos, y los registros de la progenie. Los modelos BLUP pueden usar

información de muchas más fuentes. De hecho, a menudo utilizan información proveniente

de todos los animales en una población.

El beneficio de esto puede no ser grande; los registros de los parientes lejanos

potencialmente no contribuyen mucho a una predicción. Aún así la habilidad de los BLUP de

incorporar información de toda clase de parientes suma precisión a la predicción, aunque

solamente fuera poco. También clarifica las relaciones genealógicas. Lo que podría ser

considerado el registro de un medio hermano en un índice de selección típico podría ser

representado más correctamente en un análisis BLUP como el registro de un pariente que es

medio hermano y primo hermano (vea la Figura 11.3 y la leyenda que la acompaña). Este

registro por lo tanto podría recibir una ponderación más apropiada con BLUP que con los

índices de selección.

El uso de todos los datos también puede ser interpretado como medio para utilizar los datos

de caracteres correlacionados. Los modelos BLUP multicarácter, modelos estadísticos

utilizados para predecir valores para más de un carácter a la vez, permite que la información

sobre un carácter sea utilizada en la predicción de valores para otro carácter. Esto es

especialmente útil cuando la información en el segundo carácter es escasa. Por ejemplo,

generalmente hay mucha más información sobre pesos al destete que sobre pesos al

nacimiento tomados a campo en el ganado de carne. Cuando estos caracteres son

incorporados en un modelo multicarácter, la información del peso al destete ayuda a

predecir valores del peso al nacimiento y viceversa. El resultado es más preciso para ambos

caracteres.

26

Modelos BLUP multicarácter: modelos estadísticos utilizados para predecir valores para más

de un carácter a la vez.

Apareamientos no aleatorios

Los productores son reacios a aparear animales al azar (es decir asignar machos a las

hembras en una forma aleatoria). ¿Puede usted culparlos? Si estuviera pagando una tarifa

de stud de $50,000 por el servicio de un famoso semental, ¿Lo aparearía con cualquier

hembra? Por supuesto que no. Maximizaría la probabilidad de producir un potrillo

sobresaliente apareando al semental con su mejor hembra. El problema con esta estrategia

desde el punto de vista de la predicción genética es que le da ventaja a algunos animales

sobre los otros – incrementa el sesgo. Aquellos machos que se piensan que son mejores son

apareados con las mejores hembras, y por lo tanto es factible que obtengan una progenie

con las mejores performances. Los restantes machos son relegados a las peores hembras y

por lo tanto es probable que tengan una progenie con una performance más pobre. Los

procedimientos BLUP tienen en cuenta los apareamientos no aleatorios de ésta clase, en

esencia ajustando las predicciones por el mérito genético de los progenitores (padre y

madre).Las predicciones genéticas para los machos y hembras se producen

simultáneamente y la solución simultánea de ecuaciones provoca que cada predicción sea

tenida en cuenta para todas las otras. El feliz resultado (dependiendo de su perspectiva) es

que no es posible hacer lucir a un individuo mejor de lo que es asignándole un macho o una

hembra superior.

Apareamiento no aleatorio: Cualquier sistema de apareamiento en el cual los machos no

son asignados de manera aleatoria a las hembras

27

Refugo por baja performance

Otra clase de sesgo es causado por el refugo por baja performance en caracteres repetidos o

en un carácter que es registrado antes del registro de otro carácter genéticamente

relacionado. Un ejemplo de este tipo de sesgo, es el que afecta a los caballos de carrera

como se ilustra la Figura 11.4. Los equinos pura sangre de carrera usualmente comienzan a

correr a los dos años de edad. Si tienen éxito en su primera temporada, continúan corriendo.

De otra manera son refugados por baja performance. Refugar así causa sesgo si la progenie

de alguno de los macho es rechazada más severamente que la progenie de otros machos.

En la Figura 11.4 la performance de la progenie del macho B es mucho mejor que la progenie

del macho A, a los dos años de edad. Claramente el macho B debería tener el mejor valor de

cría para performance en la carrera. Entre las temporadas de carrera, algunos de ambos

machos son refugados por baja performance, pero a causa de que la progenie del macho A

tiene una performance más baja de lo normal, una proporción mucho más grande de su

progenie que de la progenie del macho B es refugada. La poca progenie remanente del

macho A corre bien en años posteriores, entonces la diferencia en la media de la

performance subsecuente de la progenie de los dos machos ( ) es relativamente

pequeña. Note que esta diferencia es mucho más pequeña que si no hubiera habido refugo.

Si muchos de los datos utilizados para predecir los valores de cría para estos machos

proviene de la progenie que mayor de tres años o más, el macho A tendrá una ventaja

relativa y el macho B una desventaja relativa.

28

Los modelos BLUP multicarácter tienen en cuenta este sesgo causado por el refugo por baja

performance. Si el carácter en el cual se basa el refugo es incluido en el análisis y si las

relaciones genéticas (correlaciones genéticas) entre ese carácter y caracteres subsecuentes

se incorporan también, las predicciones para el segundo carácter no son afectadas por el

refugo. Si el BLUP es utilizado para evaluar caballos de carrera, las predicciones de los

valores de cría para la performance de una carrera a edades más altas no sufrirán sesgo por

el refugo por la performance a los dos años de edad.

Predicción de los componentes genéticos directos y maternos de los caracteres

Todos los caracteres tienen lo que se denomina componente directo, el efecto de los genes

de un individuo sobre su propia performance. Algunos caracteres tienen un componente

materno, el efecto de los genes de la madre de un individuo que influencia en la

performance de este a través del ambiente provisto por la ella.

El ejemplo clásico de un carácter con ambos componentes directo y materno es el peso al

destete. El peso al destete de un animal es una función de su habilidad heredada para la tasa

de crecimiento y la producción de leche y habilidad materna de su madre. La tasa de

crecimiento heredada está determinada por los genes del animal. Este comprende el

componente directo del peso al destete. La producción de leche y la habilidad materna de la

madre están determinadas por los genes de ésta (así como por el ambiente). Los genes de la

madre para estos caracteres no afectan la tasa de crecimiento de la progenie directamente,

pero si afectan el ambiente experimentado por la cría. La producción de leche y la habilidad

materna comprende el componente materno del peso al destete.

Otros caracteres que tienen componente materno importante incluyen la distocia y la

sobrevivencia. El componente directo de la distocia está relacionado con el tamaño y la

forma del feto. El componente materno está asociado con el tamaño y la conformación de la

pelvis de la madre y otros factores fisiológicos y psicológicos más sutiles. El componente

directo de la sobrevivencia es una función de esos genes en los animales jóvenes que

afectan la fortaleza física, la respuesta inmune, y el instinto de supervivencia. El componente

materno se relaciona con la habilidad de la madre para amamantar y proteger a su cría.

Los procedimientos BLUP son capaces de separar los componentes directos y maternos de un

carácter, proveyendo predicciones para ambos. En el caso del peso al destete, las

predicciones están disponibles para el componente de crecimiento, así como para el

componente leche/ habilidad materna.

Los criadores a menudo se preguntan cómo es posible eso, dado que el componente

materno del peso al destete no se mide directamente. Nadie ordeña cerdas, ovejas o vacas

de carne y registra sus rendimientos lecheros. En su lugar la información para la predicción

del componente materno proviene de los mismos pesos al destete. La verdadera explicación

de esta aparente paradoja yace en la solución simultánea de ecuaciones, pero usted puede

pensar en ellos y no incorrectamente como una simple cuestión de substracción.

29

Suponga por ejemplo, que un macho produce un gran número de hijos y de los pesos al

destete de éstos obtenemos una predicción confiable de los valores de cría de ese macho

para el carácter tasa de crecimiento predestete - el componente directo del peso al destete.

Las hijas de este macho son entonces apareadas y producen su propia progenie. Nosotros ya

tenemos una expectativa de los pesos al destete de esa progenie – nietos del macho –

basada en lo que ya conocemos sobre el potencial crecimiento de sus madres. Si los pesos al

destete de estos nietos exceden dichas expectativas, entonces se puede asumir que la

diferencia es debida a la habilidad materna superior de sus madres (producción de leche

superior). Por el otro lado, si los pesos al destete de los nietos no alcanzan las expectativas,

la diferencia es atribuida a la habilidad materna inferior de sus madres. Así la predicción para

el componente materno del peso al destete, está determinado por la diferencia entre la

performance real y las expectativas de performance al destete. Toda la situación es

complicada por el hecho de que el macho mismo pudo haber sido apareado con las mejores

o peores hembras que la media, y sus hijas con machos peores o mejores que la media, pero

BLUP toma en cuenta eso, y otras consideraciones igualmente confusas.

Una discusión de los componentes directos y maternos de los caracteres no estaría completa

sin mencionar un tercer componente, el componente paterno. Una definición de

componente paterno sería análoga a la de componente materno. De acuerdo a eso, el

componente paterno de un carácter es el efecto de los genes en el padre de un individuo

que influyen en su performance a través del ambiente provisto por el padre. Sin embargo,

para los animales domésticos, una definición de este tipo es rara, los machos tienen muy

poco que ver con la crianza de sus hijos y por lo tanto no tienen efecto ambiental sobre la

performance de estos. Efectos paternos sí existen para especies de pájaros silvestres y para

algunos – jacanas y pingüino emperador, por ejemplo – los componentes paternos de

incubabilidad y sobrevivencia de los pichones pueden ser hasta más importantes que el

componente materno.

Una segunda definición de componente paterno se aplica a los caracteres de fertilidad. Las

medidas de fertilidad que son consideradas caracteres de la madre o de la cría, pero que

están afectadas por la fertilidad del macho y su habilidad física para el servicio, se dice que

tienen un componente paterno. Hablamos por ejemplo, del componente paterno para la

tasa de concepción. Esta segunda definición tiene una mayor aplicación práctica en el

mejoramiento de las especies domésticas.

Componente directo: el efecto de los genes de un individuo sobre su propia performance.

Componente materno: el efecto de los genes de la madre de un individuo que influencia en

la performance de este a través del ambiente provisto por su madre.

Componente paterno: es el efecto de los genes del padre de un individuo que influyen en la

performance de este a través del ambiente provisto por el padre. Los caracteres de la madre

o del hijo que son afectados por la fertilidad y habilidad para reproducirse del macho

también se dice que tienen un componente paterno.

30

Predicción de varios tipos de valores

Los procedimientos BLUP, típicamente producen EBVs o EPDs para los componentes

directos de los caracteres, como así también para caracteres con componentes maternales

importantes, (EBVs o EPDs para estos también). Sin embargo, las predicciones de los análisis

BLUP no se limitan solamente a eso. También es posible la predicción de los efectos

ambientales permanentes para caracteres repetidos, y eso significa que BLUP puede ser

usado para predecir la habilidad de producción. Así

PA = BV + Ep

Donde se asume que Ep contiene el efecto permanente y el valor combinatorio de los genes,

entonces

= +

Podemos calcular la MPPA de una hembra lechera para producción de leche asumiendo su

valor de cría estimado y la predicción de su efecto ambiental permanente. Note cuanto más

sofisticado es este MPPA comparado con el MPPA computado anteriormente en este

capítulo utilizando un índice de selección de una sola fuente. En ese cálculo, la información

utilizada se limitaba a la propia performance de lactación de la hembra. En contraste, la

información utilizada para calcular la MPPA de un análisis BLUP incluye registros de lactación

de todo tipo de parientes.

Otro valor comúnmente estimado por los procedimientos BLUP es el llamado valor materno

total (BVtm). EL valor materno total combina los valores de cría para los componentes

maternos y directos del carácter. Por ejemplo, el valor materno total de una vaca de carne

para peso al destete representa su habilidad genética para producir peso al destete. Como

tal, incluye los efectos de sus genes para la producción de leche y su habilidad materna (el

componente maternal para peso al destete) así como también los efectos de sus genes para

la tasa de crecimiento predestete que ella transmite a su ternero – el componente directo

del peso al destete. (Se usa una vaca de carne en este ejemplo. Predecimos valores

maternos totales para machos también. Pero debido a que los genes del padre para el

componente materno del peso al destete no son expresados en el peso al destete de su hijo,

un ejemplo utilizando un macho es más difícil de entender).

En forma de ecuación,

Donde los subíndices WW, m y d representan el peso al destete, materno y directo

respectivamente. El valor materno total de la vaca contiene todo su valor de cría para el

componente materno de peso al destete y solo la mitad de su valor de cría para el

componente directo de peso al destete. Esto es debido a que todos sus genes que

31

influencian el componente producción de leche/habilidad materna afectan a la performance

de su ternero, pero debido a que transmite solo la mitad de los genes al ternero, solo la

mitad de sus genes que influencian la tasa de crecimiento predestete afecta la performance

del ternero. En términos de predicciones genéticas

Y

Los EBVs maternos totales y los EPDs maternos totales son fáciles de confundir. EL EBV

materno total de una hembra es una predicción de su habilidad genética para producir algo

medido en su hijo. Es nuestra expectativa de su propia producción (excluyendo los efectos

ambientales). El EPD materno total de un individuo, por el otro lado, es nuestra expectativa

sobre la producción de las hijas de un individuo.

El EVB materno total de una vaca para peso al destete es una predicción de la parte

heredable de su habilidad para producir el peso al destete del ternero – su valor de cría para

la producción de peso al destete. Podemos ir un paso más allá y calcular el MPPA de una

vaca para peso al destete. Esto podría incluir cualquier efecto ambiental permanente en la

producción de peso al destete. Matemáticamente

Los análisis BLUP también producen estimativas de los efectos ambientales comunes a todos

los miembros del grupo contemporáneo (Ecg). A pesar de que no son rutinariamente

utilizados, podrían ser útiles desde el punto de vista del manejo. Podrían indicar situaciones

donde los calendarios sanitarios son inefectivos, las pasturas están siendo sobrepastoreadas,

etc. Cuando las estimaciones de los efectos de grupos contemporáneos en una población

son trazadas a través del tiempo, revelan la tendencia ambiental – cambio en la

performance media de una población a través del tiempo causada por los cambios en el

ambiente.

Valor materno total (BVtm): Una combinación de los valores de cría para los componentes

directo y materno de un carácter. El valor materno total de una hembra representa la parte

heredable de su habilidad para producir una cantidad que es medida en sus hijos.

Tendencia ambiental: cambio en la performance media de una población a través del

tiempo causada por los cambios en el ambiente.

32

Predicciones para todos los animales

Los procedimientos BLUP pueden ser utilizados para generar predicciones de cualquier

animal en una población. Las predicciones están disponibles para machos y hembras, padres

y no padres, animales que todavía no han sido concebidos y animales que han muerto hace

mucho tiempo, y animales con registros de performance o animales sin ellos.

Documents

Capítulo 11: Predicciones Genéticas · 2016-07-13 · 1 Capítulo 11: Predicciones Genéticas En este momento ya debería estar claro que la tasa de cambio genético en una población