INFERENCIA ESTADÍSTICA
Giovanna Gatica, MS
Extracción de conclusiones sobre una muestra estudiada
En general se estudia parte de una población
Técnicas de muestreo (simples, estratificada, sistemática, por conglomerados)
INFERENCIA ESTADÍSTICA
Intervalo de valores en el cuál se pueda precisar, con una determinada probabilidad, que el verdadero valor de el parámetro se encuentra en esos límites.
IC 95% = proporción ± 1,96 * ES
ES de la proporción = √ (p * (1-p)) / n
INTERVALO DE CONFIANZA
La variabilidad en las estadísticas de muestras proviene de un error de muestreo debido al azar
Hay diferencias entre cada muestra y la población, y entre las diversas muestras
ERROR ESTANDAR
Distribución normal Gaussiana Es simétrica Forma de campana Es una distribución continua Describe muy bien la mayoría de los eventos
biológicos
DISTRIBUCIÓN DE LOS DATOS
DISTRIBUCIÓN NORMAL
EJEMPLO
Grupo 1 Peso al nascer promedio de niños: 3244 g
Grupo 2 Peso al nascer promedio de niñas: 3093 g
PRUEBA DE HIPÓTESIS
Comparar grupos 1 y 2 H0: hipótesis nula (igualdad)
µ1 = µ2
H1: hipótesis alternativa µ1 µ2 (test bicaudal); µ1 > µ2 (test unicaudal); ó µ1 < µ2 (test unicaudal).
TIPOS DE ERRORES
H0 V F Test (rechazo H0)
Si Error I OK No OK Error II
PROBABILIDAD DE LOS ERRORES
= P(error I) = P(rechaza H0 | H0 es V)
= P(error II) = P(no rechaza H0 | H0 es F)
Poder do teste 1 - = (rechazar H0 | H0 es F)
LIMITAR ERROR I
Definir un test de forma a limitar por ejemplo, < 5% P(rechazar H0 | H0 es V) < 5%
Equivale a usar un valor p < 5% como punto de corte
HIPÓTESIS NULA
Si p < 5% rechazo H0
Caso contrario, no rechazo H0
Valor p significativo si es < 5% ó 0.05
Las diferencias entre las categorías SON diferentes
Se rechaza la Ho
HIPÓTESIS NULA
H0 no es rechazada No quiere decir que ella es confirmada Siempre estamos evaluando la hipótesis NULA
PODER DEL TEST
Para una determinada diferencia, aumentar N aumenta el poder
Por eso, se calcula un N de forma que para una dada diferencia (o efecto) < 5% poder del estudio 80%
La desviación estándar (σ) mide cuánto se separan los datos de la media.
La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"
DESVIACIÓN ESTANDAR
Es el cuadrado de la desviación estándar Ejemplo:
Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
VARIANZA
La desviación estándar es que es útil: ahora veremos qué los datos están a una distancia más/menos 3.87 de la media
Así que, usando la desviación estándar tenemos una manera "estándar" de saber como están distribuidos los datos que estudiamos
UTILIDAD DE LA DESVIACIÓN ESTANDAR