19
Máxima Verosimilitud y reconstrucción ancestral

Maxima Verosimilitud y Reconstruccion de Ancestros

Embed Size (px)

DESCRIPTION

clases

Citation preview

Page 1: Maxima Verosimilitud y Reconstruccion de Ancestros

Máxima Verosimilitud y reconstrucción ancestral

Page 2: Maxima Verosimilitud y Reconstruccion de Ancestros

Aproximación de Máxima verosimilitud

● Verosimilitud ≠ probablidad.● Verosimilitud: “Función de los parámetros de un modelo

estadístico que permite realizar inferencias acerca de su valor a partir de un conjunto de observaciones”

● Probabilidad “Permite, a partir de una serie de parámetros conocidos, realizar predicciones acerca de los valores que toma una variable aleatoria”

● Es una forma de ajustar modelos, estimar parámetros a partir de los datos. Usado en varios ámbitos científicos.

● Requerimientos– Datos observados+modelo probabilistico de cómo surgieron los datos

observados.

– Modelo Probabilistico: Permite calcular la probabilidad de cualquier posible resultado (dado un set específico de valores para los parámetros del modelo)

Page 3: Maxima Verosimilitud y Reconstruccion de Ancestros

Ejemplo de cara/cruz de una moneda

● Datos:

– Luego de lanzar una moneda al aire 10 veces, se obtienen 7 caras (h) y 3 cruces.

● Modelo:

– La probabilidad de obtener caras es p, mientras que la de obtener cruces es 1-p. (Ignorando la posibilidad de que la moneda caiga sobre su borde...)

– Siguiendo una distribución binomial, la probabilidad de obtener h en n intentos es:

Objetivo: Encontrar el mejor estimador del parámetro desconocido (p – único parametro en este ejemplo) en base a las observaciones

Page 4: Maxima Verosimilitud y Reconstruccion de Ancestros

Aproximación de Máxima verosimilitud

● Verosimilitud (Modelo) = Probabilidad (Datos|Modelo)

● Máxima Verosimilitud: Los mejores estimadores son el set de valores de parámetros que den la máxima verosimilitud (probabilidad) de los datos.

Probabilidad de los datosdado el modelo y sus parámetros

Page 5: Maxima Verosimilitud y Reconstruccion de Ancestros

Aproximación de Máxima verosimilitud● Datos: 10 lanzamientos – 7

caras, 3 cruces

● Modelo: las caras ocurren con probablidad p y las cruces con 1-p

Se opta por una solución numérica

● Obj: Encontrar el valor de p que de la mejor probabildad para los datos

h

P

Page 6: Maxima Verosimilitud y Reconstruccion de Ancestros

Modelo probabilistico aplicado a filogénia● Datos: alineamiento (ojo con los

errores)

● Modelo: Una secuencia ancestral evolucionó en las secuencias observadas (3 en este ejemplo)

Parámetros:

Topología y distancia en las ramificaciones

Frecuencia de nucleótidos

Tasas de sustitutción nucleótido-nucleótido (Modelos de evolución)

● Para el caso de la moneda había una formula, pero aca??... Cómo calcular los valores de los parámetros?

Page 7: Maxima Verosimilitud y Reconstruccion de Ancestros

Cálculo de la probabilidad de una columna en un alineamiento, dada la topología y otros parámetros

● Cada columna del alineamiento contiene nucleótidos homólogos. Esto es, surgen a partir de un solo ancestro común

● Objetivo: Calcular la probabilidad del alineamiento

● Parámetros:

– Topología, distancia de las ramificaciones, frecuencia de nt, tasas de sustitución

● Asignar valores aleatorios a todos los parámetros y calcular la probabildad a partir de cualquier tip.

● Aqui, arbitrariamente los ancestros son A y A.

Cálculo para una sola columna

Page 8: Maxima Verosimilitud y Reconstruccion de Ancestros

Cálculo de la probabilidad de una columna en un alineamiento, dada la topología y otros parámetros

● Se calcula la Probabilidad, pero para cada una de las posibles combinaciones (16 en este ejemplo) de nucleótidos ancestros.

● L(j) es la probabildad total de la suma de probabilidades para cada combinación de nt

● El cálculo se hace de la misma forma para cada columna del alineamiento

● La probabilidad resultante (Probabildad del modelo), viene de la multiplicación (eventos independientes) de los valores de suma anteriores

Como la multiplicación de valores pequeños entrega valores más pequeños aún, puede producirse un error underflow. Por eso se aplica Ln a los resultados

Page 9: Maxima Verosimilitud y Reconstruccion de Ancestros

Probabilidad de la columna en el alineamiento: cálculo para cada posible par de nucleótidos ancestros

Page 10: Maxima Verosimilitud y Reconstruccion de Ancestros

Requerimientos mínimos, pueden incluirse más parámetros

(Parecido a la búsqueda heurística)

Una secuencia ancestral ha evolucionado hacia los datos observados en el alineamiento

Varios máximos locales hasta obtener el global

Page 11: Maxima Verosimilitud y Reconstruccion de Ancestros

Probabilidad de la columna en el alineamiento: cálculo para cada posible par de nucleótidos ancestros

Esta es la base para establecer cómo pueden haber sido las secuencias ancestrales

Por ejemplo, aca T-G>>>A-A

Este análisis es necesario para cada posición del alineamiento

Es de interés establecer la secuencia de cada nodo ancestro (e.g. Mamíferos, verterbrados, proteobacteria, etc)

Page 12: Maxima Verosimilitud y Reconstruccion de Ancestros

Probabilidad de la columna en el alineamiento: cálculo para cada posible par de nucleótidos ancestros

Para el nodo 1, agrupar las probabilidades de cada posible ancestro y sumarlas.

Page 13: Maxima Verosimilitud y Reconstruccion de Ancestros

Reconstrucción de Ancestros

Máxima probablidad:100x más que G/C10000x más que A

Page 14: Maxima Verosimilitud y Reconstruccion de Ancestros

Reconstrucción de Ancestros

Este ancestro se ajusta a los datos observados: ambos descencientes son T

Page 15: Maxima Verosimilitud y Reconstruccion de Ancestros

Reconstrucción Ancestral

● El análisis se hace para cada columna, por lo que al final se obtiene una secuencia ancestral

● Es posible sintetizar esta secuencia ancestral y experimentalmente probar su función

● Algunas proteínas investigadas de esta forma son:

– Ribonucleasas

– Chymase proteasas

– Factores de transcripción Pax

– Rodopsinas de vertebrados

– Receptores esteroideos

– Factor de elongación EF-Tu

● Edad de las proteínas reconstruidad: 5 millones – 1 billon de años atrás

Page 16: Maxima Verosimilitud y Reconstruccion de Ancestros

Reconstrucción Ancestral: Rodopsinas en visión nocturna de dinosaurios

● Rodopsinas: Transformación de la luz en energía y detección de estimulos luminosos en el ojo (a través de la proteína G - - transducción de señales)

● Rol en visión nocturna (luz tenue)

● Reconstrucción de la secuencia de rodopsina en un grupo de dinosaurios

● Proteína funcional!

● Sugiere que este dinosaurio tenia visibilidad nocturna y que probablemente tenía hábitos nocturnos...

Page 17: Maxima Verosimilitud y Reconstruccion de Ancestros

Reconstrucción Ancestral: Termoestabilidad de proteínas ancestrales

● Resurrección de factores de elongación protéicos

● Se midieron las T de denaturación para cada uno de los ancestros resucitados

Page 18: Maxima Verosimilitud y Reconstruccion de Ancestros

Reconstrucción Ancestral: Termoestabilidad de proteínas ancestrales

Page 19: Maxima Verosimilitud y Reconstruccion de Ancestros

Reconstrucción Ancestral: Manuscritos

● Copias de textos realizadas en conventos de monjes (copia de una copia de otra copia, etc, etc...)

● El proceso de copia se parece a la replicación del DNA (se introducen errores)

● Puede realizarse un análisis filogenético pra reconstruir los árboles de las copias existentes (Hay un agrupamiento).

● Reconstrucción ancestral: permite descifrar cual es la palabra original más probable y asi reconstruir el manuscrito entero.

● Ej: