III Verano de Probabilidad y Estadística - cimat.mx ?· Ö G G 1 G G (tX ) 1 G G ¿Cuándo existe la…

  • View
    212

  • Download
    0

Embed Size (px)

Transcript

  • Ejemplos de Interaccin entre

    Estadstica y Ecologa

    Dr. Jorge Armando Argez Sosa

    Universidad Autnoma de Yucatn

    Facultad de Matemticas

    argasosa@uady.mx

    III Verano de Probabilidad y Estadstica

  • Objetivo:

    Presentar algunos ejemplos de la

    intervencin de un estadstico en

    estadstica aplicada.

  • De aplicacin:

    Problema: Tengo dos frmulas que sirven para

    encontrar el tamao de muestra para estimar la

    media. Cul debo usar?

  • Las dos frmulas

    Nz

    dn

    1

    1

    22

    2 222

    22

    zme

    mzn

  • Qu es esa mesita?

    iacx

    Cmo aplico esta frmula?

    n

    i

    axcD1

    Otras:

  • Dos imgenes producto de un SIG

    Cul es el porcentaje de pixeles que cambiaron?

  • La verdad

  • Uno de Regresin Lineal Simple

  • Se aplic un modelo de regresin lineal simple.

    Y = Peso seco.

    X = Dimetro a la altura del pecho.

    XY 10

    El modelo es:

  • Y

    X

    i

    XY 10

  • Se obtuvieron los estimadores y se procedi a

    hacer inferencia con el modelo resultante.

    Software

  • Pregunta obligada

    Validaron los supuestos?

    Eeeeeeee . . . supuestos?

  • Supuestos en RLS:

    ),0(~

    0

    2

    2

    N

    Var

    E

    ji

  • Al validar supuestos

    No se cumpla el supuesto de

    independencia de residuales

    Y eso que?

  • Cmo se estiman los parmetros?

    ),...,|,( 110 nyyL ),|,...,( 101 nyyf

    n

    i

    iyf1

    10 ),|(

    Independencia

  • Ahora uno de Regresin lineal mltiple

  • Objetivo: Modelar una variable Y en funcin de k

    variables, X1,,Xk.

    . apliqu la regresin y al verificar los supuestos

    usando los residuales observ que no se cumpla el

    supuesto de normalidad. Entonces transform los

    residuales usando el logaritmo, con lo que ya se

    cumpli el supuesto de normalidad y entonces.

  • Regresin Lineal Mltiple

    kk XXY 110Modelo:

    Supuestos:

    ),0(~

    0

    2

    2

    N

    Var

    E

    ji

  • Y

    X

    i

  • Y

    X

  • Debo transformar residuales?

    Idea equivalente en medicina: al hacer un anlisis de

    sangre el paciente sali con diagnstico de cncer.

    Entonces a la sangre extrada se le aplic tratamiento

    con radiacin. Posteriormente se analiz de nuevo y

    result negativo. As, el paciente est sano.

  • Y qu si no se cumple este

    supuesto?

  • Cmo se estiman los parmetros?

    ),...,|,( 110 nyyL ),|,...,( 101 nyyfn

    i

    iyf1

    10 ),|(

    Normalidad

    2

    210

    2

    )(

    2

    1 iixy

    e

  • Entonces qu era lo correcto?

    Usar un modelo no lineal.

    Transformar los datos.

  • Otro de Regresin Lineal Mltiple

  • Objetivo: Modelar el ndice de

    marginacin de municipios de Mrida

    como funcin de variables

    socioeconmicas.

  • Datos: 106 municipios, 9 variables.

    Intent correr el anlisis pero

    no me da los resultados

    Qu est pasando?

  • Cmo se define la RLM?

    iikkii XXY 110

    XY

  • XY

    nknkn

    k

    k

    n xx

    xx

    xx

    y

    y

    y

    2

    1

    1

    0

    1

    221

    111

    2

    1

    1

    1

    1

    iikkii xxy 110

  • Dnde puede estar el problema?

    Solucin:

    .YX)XX( tt

    1

  • 1)XX( t

    Cundo existe la inversa de

    una matriz A?

    Una matriz cuadrada A es invertible si Det(A)0.

  • Cundo Det(A)=0?

    Si sus columnas (filas) son linealmente dependientes.

    ,02211 XaXa .0, 21 aa

    Con dos variables:

    Entonces:1

    221

    a

    XaX

  • Es decir: si una columna (fila) puede

    expresarse como combinacin lineal de las

    otras.

    Cuando XtX tiene columnas linealmente dependientes?

    Cuando alguna columna de X es mltiplo de otra(s).

  • En la prctica eso qu significa?

    Cuando se est repitiendo la informacin de

    alguna(s) variables(s).

  • En la prctica no se encuentra que una

    columna sea exactamente combinacin

    lineal de otras variables.

    Lo que suele ocurrir es que las variables se

    encuentren altamente correlacionadas. Esto

    se conoce como multicolinealidad.

  • Una de postulacin de parmetros

    (aplicacin de estadstica Bayesiana)

  • i|, ~ Beta(,(1-))

    ~ Beta(a, b)

    ~ Gamma (c, d)

  • Cmo postular los parmetros?

    11 )1()()(

    )(~),|( ba

    ba

    babaf

    Cul es el soporte de la densidad Gamma?

  • Tienen un software para la Beta

  • Pero no siempre funciona!!!!

    Le puse que estoy 95% seguro de que es

    mayor que 0.5 y la moda es 0.55.

    Por qu no funciona?

  • P( >0.5) = 0.95 y moda= 0.55

    Se postul:

    Es decir:

    P( 0.5)=0.05 y moda=0.55

    Cmo tendra que ser la densidad?

  • Y para la gamma postul

    P(

  • Cul es el soporte de la densidad Gamma?

    dcc

    ec

    ddcf 1

    )(~),|(

    Qu se est queriendo obtener con

    P(

  • Una Mezcla de tcnicas

    Objetivo: determinar si los ejemplares muestreados

    de dos poblaciones poseen caractersticas similares.

    A cada ejemplar de cada grupo se le midieron

    cuatro caractersticas: Largo de la hoja, Ancho de

    la hoja, Largo del fruto y Ancho del fruto.

  • Una idea:

    Si calculo la media de cada variable en cada grupo, podr

    aplicar un ANDEVA para probar la igualdad de medias.

    4321

    24232221

    14131211

    nnnn xxxx

    xxxx

    xxxx

    4321

    24232221

    14131211

    mmmm yyyy

    yyyy

    yyyy

    4321 xxxx 4321 yyyy

  • Pero. Estn en diferentes escalas, por lo que las

    medias no sern comparables.

    Pero ya se cmo arreglar ese problema

    A cada variable se le calcula el coeficiente de variacin.

    Cada grupo tendr cuatro valores adimensionales.

    Ahora si puedo aplicar un Anlisis de Varianza: Dos

    tratamientos, cada uno con cuatro datos.

  • Supuestos del ANOVA

    Observaciones Independientes.

    Distribucin Normal.

    Varianzas Homogneas.

  • Independencia de las Observaciones

    Si no hubo asignacin aleatoria de tratamientos aunidades experimentales, entonces los resultadospueden incluir un efecto persistente de factores noconsiderados en el anlisis. Esto invalida elexperimento.

  • En nuestro caso: Las variables originales se

    encuentran correlacionadas.

    Los coeficientes de variacin estn correlacionados.

    Se viola el supuesto de independencia.

  • Moraleja

  • Para hacer Estadstica Aplicada se requiere

    conocer la teora que sustenta los mtodos para:

    a) Aplicarlos correctamente.

    b) Ser capaces de modelar apropiadamente

    variables aleatorias de inters.

  • Qu se debe saber?

    Clculo diferencial e integral.

    lgebra Lineal.

    Anlisis Funcional.

    Inferencia Estadstica.

    Probabilidad.

  • Nuevamente, gracias por su

    atencin

    Dr. Jorge Armando Argez Sosa

    Universidad Autnoma de Yucatn

    Facultad de Matemticas

    argasosa@uady.mx