Transcript

Ejemplos de Interacción entre

Estadística y Ecología

Dr. Jorge Armando Argáez Sosa

Universidad Autónoma de Yucatán

Facultad de Matemáticas

[email protected]

III Verano de Probabilidad y Estadística

Objetivo:

Presentar algunos ejemplos de la

intervención de un estadístico en

estadística aplicada.

De “aplicación”:

Problema: Tengo dos fórmulas que sirven para

encontrar el tamaño de muestra para estimar la

media. ¿Cuál debo usar?

Las dos fórmulas

Nz

dn

1

1

22

2 222

22

zme

mzn

¿Qué es esa mesita?

iacx

¿Cómo aplico esta fórmula?

n

i

axcD1

Otras:

Dos imágenes producto de un SIG

¿Cuál es el porcentaje de pixeles que cambiaron?

La verdad

Uno de Regresión Lineal Simple

Se aplicó un modelo de regresión lineal simple.

Y = Peso seco.

X = Diámetro a la altura del pecho.

XY 10

El modelo es:

Y

X

i

XY 10

Se obtuvieron los estimadores y se procedió a

hacer inferencia con el modelo resultante.

Software

Pregunta obligada

¿Validaron los supuestos?

Eeeeeeee . . . ¿supuestos?

Supuestos en RLS:

),0(~

0

2

2

N

Var

E

ji

Al validar supuestos

No se cumplía el supuesto de

independencia de residuales

¿Y eso que?

¿Cómo se estiman los parámetros?

),...,|,( 110 nyyL ),|,...,( 101 nyyf

n

i

iyf1

10 ),|(

Independencia

Ahora uno de Regresión lineal múltiple

Objetivo: Modelar una variable Y en función de k

variables, X1,…,Xk.

…. apliqué la regresión y al verificar los supuestos

usando los residuales observé que no se cumplía el

supuesto de normalidad. Entonces transformé los

residuales usando el logaritmo, con lo que ya se

cumplió el supuesto de normalidad y entonces….

Regresión Lineal Múltiple

kk XXY 110Modelo:

Supuestos:

),0(~

0

2

2

N

Var

E

ji

Y

X

i

Y

X

¿Debo transformar residuales?

Idea equivalente en medicina: al hacer un análisis de

sangre el paciente salió con diagnóstico de cáncer.

Entonces a la sangre extraída se le aplicó tratamiento

con radiación. Posteriormente se analizó de nuevo y

resultó negativo. Así, el paciente está sano.

¿Y qué si no se cumple este

supuesto?

¿Cómo se estiman los parámetros?

),...,|,( 110 nyyL ),|,...,( 101 nyyfn

i

iyf1

10 ),|(

Normalidad

2

210

2

)(

2

1 ii xy

e

¿Entonces qué era lo correcto?

• Usar un modelo no lineal.

• Transformar los datos.

Otro de Regresión Lineal Múltiple

Objetivo: Modelar el índice de

marginación de municipios de Mérida

como función de variables

socioeconómicas.

Datos: 106 municipios, 9 variables.

Intenté correr el análisis pero

no me da los resultados

¿Qué está pasando?

¿Cómo se define la RLM?

iikkii εXβXββY 110

εβXY

εβXY

nknkn

k

k

n xx

xx

xx

y

y

y

2

1

1

0

1

221

111

2

1

1

1

1

iikkii εxβxββy 110

¿Dónde puede estar el problema?

Solución:

.YX)XX(β tt

1)XX( t

¿Cuándo existe la inversa de

una matriz A?

Una matriz cuadrada A es invertible si Det(A)≠0.

¿Cuándo Det(A)=0?

Si sus columnas (filas) son linealmente dependientes.

,02211 XaXa .0, 21 aa

Con dos variables:

Entonces:1

221

a

XaX

Es decir: si una columna (fila) puede

expresarse como combinación lineal de las

otras.

¿Cuando XtX tiene columnas linealmente dependientes?

Cuando alguna columna de X es múltiplo de otra(s).

¿En la práctica eso qué significa?

Cuando se está “repitiendo” la información de

alguna(s) variables(s).

En la práctica no se encuentra que una

columna sea exactamente combinación

lineal de otras variables.

Lo que suele ocurrir es que las variables se

encuentren altamente correlacionadas. Esto

se conoce como multicolinealidad.

Una de postulación de parámetros

(aplicación de estadística Bayesiana)

πi|µ,γ ~ Beta(µγ,γ(1-µ))

µ ~ Beta(a, b)

γ ~ Gamma (c, d)

¿Cómo postular los parámetros?

11 )1()()(

)(~),|( ba

ba

babaf

¿Cuál es el soporte de la densidad Gamma?

Tienen un software para la Beta

Pero no siempre funciona!!!!

Le puse que estoy 95% seguro de que μ es

mayor que 0.5 y la moda es 0.55.

¿Por qué no funciona?

P(μ >0.5) = 0.95 y moda= 0.55

Se postuló:

Es decir:

P(μ ≤0.5)=0.05 y moda=0.55

¿Cómo tendría que ser la densidad?

Y para la gamma postuló

P(γ<7)=0.05 y P(γ<7.2)=0.5

¿Cómo encontrar los parámetros?

¿Cuál es el soporte de la densidad Gamma?

dcc

ec

ddcf 1

)(~),|(

¿Qué se está queriendo obtener con

P(γ<7)=0.05 y P(γ<7.2)=0.5 ?

Una Mezcla de técnicas

Objetivo: determinar si los ejemplares muestreados

de dos poblaciones poseen características similares.

A cada ejemplar de cada grupo se le midieron

cuatro características: Largo de la hoja, Ancho de

la hoja, Largo del fruto y Ancho del fruto.

Una idea:

Si calculo la media de cada variable en cada grupo, podré

aplicar un ANDEVA para probar la igualdad de medias.

4321

24232221

14131211

nnnn xxxx

xxxx

xxxx

4321

24232221

14131211

mmmm yyyy

yyyy

yyyy

4321 xxxx 4321 yyyy

Pero…. Están en diferentes escalas, por lo que las

medias no serán comparables.

Pero ya se cómo arreglar ese problema

• A cada variable se le calcula el coeficiente de variación.

• Cada grupo tendrá cuatro valores adimensionales.

• Ahora si puedo aplicar un Análisis de Varianza: Dos

“tratamientos”, cada uno con cuatro datos.

Supuestos del ANOVA

Observaciones Independientes.

Distribución Normal.

Varianzas Homogéneas.

Independencia de las Observaciones

Si no hubo asignación aleatoria de tratamientos aunidades experimentales, entonces los resultadospueden incluir un efecto persistente de factores noconsiderados en el análisis. Esto invalida elexperimento.

En nuestro caso: Las variables originales se

encuentran correlacionadas.

Los coeficientes de variación están correlacionados.

Se viola el supuesto de independencia.

Moraleja

Para hacer Estadística Aplicada se requiere

conocer la teoría que sustenta los métodos para:

a) Aplicarlos correctamente.

b) Ser capaces de modelar apropiadamente

variables aleatorias de interés.

¿Qué se debe saber?

Cálculo diferencial e integral.

Álgebra Lineal.

Análisis Funcional.

Inferencia Estadística.

Probabilidad.

Nuevamente, gracias por su

atención

Dr. Jorge Armando Argáez Sosa

Universidad Autónoma de Yucatán

Facultad de Matemáticas

[email protected]