36
Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO

Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Embed Size (px)

Citation preview

Page 1: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística DEO/CICS.

Pruebas de hipótesis

MGA/DEO

Pruebas de hipótesis

MGA/DEO

Page 2: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Contenidos

• Introducción

• Ejemplo

• Etapas de una prueba estadística

Formulación de supuestos y sistema de hipótesis

Definición de la distribución de muestreo

Nivel de significación estadística y región crítica

Cálculo de los estadísticos de la prueba

Toma de decisiones y conclusiones

Page 3: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Introducción

El propósito esencial de los métodos estadísticos es legitimar generalizaciones sobre poblaciones usando datos de muestras.

La estadística inferencial ayuda a hacer juicios acerca de una población partiendo de muestras, tal como ocurre en encuestas de opinión, control de calidad en la industria, comparaciones entre medicamentos, diseño de experimentos y otros muchos ejemplos.

Page 4: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Introducción

• Típicamente, tomamos una muestra y calculamos de ella un valor llamado estadístico para estimar alguna característica llamada parámetro de una población específica.

Page 5: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Introducción

• Una cosa es segura desde antes de hacer el estudio: el estadístico no será igual al parámetro. Siempre habrá una diferencia llamada error. ¡Y, además, ese error no lo conoceremos nunca!

Page 6: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Introducción

La prueba de hipótesis, tal como se aplica en el enfoque estadístico, es un recurso muy valioso y de uso generalizado en la investigación científica.

La prueba de hipótesis utiliza conceptos similares a los que se usan en la estimación de intervalos con los cuales se complementa.

Page 7: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Introducción

La selección de la prueba que será utilizada depende de la naturaleza de los datos básicos y la hipótesis, pero la lógica general es la misma.

Page 8: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Introducción

En la prueba de hipótesis, al igual que en la estadística descriptiva, la pregunta básica está relacionada con qué podemos decir acerca de los parámetros de la población y cuál es el nivel de confianza.

Page 9: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Introducción

El investigador muy a menudo toma decisiones sobre poblaciones, a partir de información obtenida de muestras.

Las pruebas estadísticas que realiza para ese efecto tienen algunos pasos específicos previos a la inspección de los datos.

Page 10: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Ejemplo

Un cierto microorganismo se encuentra en la saliva en la mitad de las personas. Tomamos una muestra de 17 personas. De las personas de esta muestra, 14 no tienen el microorganismo. Sólo 3 sí lo tienen.Pregunta: ¿Pudo esa muestra venir de una población que tiene una proporción de 1:1 en cuanto a la presencia del microbio?

Page 11: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Una solución.

Supongamos que podemos crear una población infinitamente grande de elementos, la mitad de cuyos miembros tiene el microorganismo. Obtenemos repetidas muestras aleatorias de 17 elementos cada una. Esto podría hacerse de una población finita de elementos de la que obtenemos muestras con reemplazo. Luego, observamos cuántas tienen 14 negativos.

Page 12: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Otra solución.

Nos apoyamos en lo que sabemos de teoría de probabilidades. Seleccionamos la distribución binomial y determinamos la probabilidad de obtener una muestra de 14 - y 3 +.

Podemos considerar también, como es convencional, las muestras de 14 o más negativos.

Page 13: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas: formulación de supuestos y sistema de hipótesis

| Ho: p = q Ho: p = 2qCon microorganismo Sin microorganismo Frecuencia relativa Frecuencia relativa

17 0 0.0000076 0.001015016 1 0.0001297 0.008627215 2 0.0010376 0.034508814 3 0.0051880 0.086271913 4 0.0181580 0.150975612 5 0.0472107 0.196267911 6 0.0944214 0.196267610 7 0.1483765 0.15421019 8 0.1854706 0.09638118 9 0.1854706 0.04819057 10 0.1483765 0.01927626 11 0.0944214 0.00613335 12 0.0472107 0.00153334 13 0.0181580 0.00029493 14 0.0051880 0.00004212 15 0.0010376 0.00000421 16 0.0001297 0.00000030 17 0.0000076 0.0000000

Page 14: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

| Ho: p = q Ho: p = 2qCon microorganismo Sin microorganismo Frecuencia relativa Frecuencia relativa

17 0 0.0000076 0.001015016 1 0.0001297 0.008627215 2 0.0010376 0.034508814 3 0.0051880 0.086271913 4 0.0181580 0.150975612 5 0.0472107 0.196267911 6 0.0944214 0.196267610 7 0.1483765 0.15421019 8 0.1854706 0.09638118 9 0.1854706 0.04819057 10 0.1483765 0.01927626 11 0.0944214 0.00613335 12 0.0472107 0.00153334 13 0.0181580 0.00029493 14 0.0051880 0.00004212 15 0.0010376 0.00000421 16 0.0001297 0.00000030 17 0.0000076 0.0000000

Curso de Bioestadística.

Pruebas de hipótesis

Si p = q,

P(x=14) = 0.0051880 y

P(x=>14) = 0.0063629

En ambos casos, la probabilidad es muy baja.

Page 15: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Lo que hemos realizado es una prueba de una cola porque nos interesó saber acerca de 14 o más personas sin el microorganismo. Pero, si no tenemos mayor información, podemos interesarnos en saber la probabilidad de encontrar 14 o más personas con y sin el microorganismo. En ese caso, hacemos una prueba de dos colas.

Page 16: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas: formulación de supuestos y sistema de hipótesis

| Ho: p = q Ho: p = 2qCon microorganismo Sin microorganismo Frecuencia relativa Frecuencia relativa

17 0 0.0000076 0.001015016 1 0.0001297 0.008627215 2 0.0010376 0.034508814 3 0.0051880 0.086271913 4 0.0181580 0.150975612 5 0.0472107 0.196267911 6 0.0944214 0.196267610 7 0.1483765 0.15421019 8 0.1854706 0.09638118 9 0.1854706 0.04819057 10 0.1483765 0.01927626 11 0.0944214 0.00613335 12 0.0472107 0.00153334 13 0.0181580 0.00029493 14 0.0051880 0.00004212 15 0.0010376 0.00000421 16 0.0001297 0.00000030 17 0.0000076 0.0000000

Page 17: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Para efectuar la prueba de dos colas, es decir, para buscar la probabilidad de que p q (todos los valores iguales a 14 y 3 o más extremos en cualquier sentido), simplemente duplicamos la probabilidad y obtenemos 0.0127258.

¿Qué significa esta probabilidad y para qué nos sirve?

Page 18: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticasLas pruebas estadísticas incluyen algunos pasos

específicos previos a la inspección de los datos:

1. Formulación de supuestos y sistema de hipótesis

2. Definición de la distribución de muestreo

3. Selección del nivel de significación estadística y la región crítica

4. Cálculo de los estadísticos de la prueba

5. Toma de decisiones y conclusiones

Page 19: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas1) formulación de supuestos y sistema de hipótesis

El investigador:

• Formula los supuestos relacionados con la población y los procedimientos de muestreo.

• Establece el modelo de la prueba.

• Define la hipótesis estadística que someterá a prueba y la o las hipótesis alternativas en caso la primera no se sostenga con la evidencia empírica.

Page 20: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:1) formulación de supuestos y sistema de hipótesis

• En el ejemplo presentado, la hipótesis p = q = 0.5 es la hipótesis nula (H0 ), en contraste con la hipótesis de investigación o alternativa (H1 ).

• La hipótesis nula se llama así porque (usualmente) expresa que no hay una real diferencia o relación entre el valor paramétrico y aquél sobre el cual se hace la hipótesis.

Page 21: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:1) formulación de supuestos y sistema de hipótesis

• Convencionalmente, la hipótesis nula se escribe así:

H0 : p = q = 0.5

• Una hipótesis alternativa puede ser H1 : p > q, o ésta otra: H1 : p q

Page 22: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:1) formulación de supuestos y sistema de hipótesis

• Otros ejemplos de hipótesis nulas son:

H0 : = 14.0

H0 : 2 = 15

H0 : 1 - 2 = 0 o también H0 : 1 = 2

H0 : 1 = 2 = 3

H0 : = 0

H0 : = 0.75

Page 23: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:1) formulación de supuestos y sistema de hipótesis

• Por lo regular, la hipótesis nula enuncia que no hay diferencia o relación entre variables.

• La mayoría de las veces, el investigador espera que la hipótesis nula sea errónea y se deje descartar a favor de la hipótesis alternativa.

Page 24: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:1) formulación de supuestos y sistema de hipótesis

• Al aislar el supuesto que es la hipótesis nula, afirmamos nuestra confianza en otros supuestos: que la muestra es aleatoria, que los datos siguen una determinada distribución, que nuestra técnica tiene validez, que nuestros indicadores con confiables ...

• Algunos llaman modelo al conjunto de estos supuestos relativamente confiables.

• Si estos fallan, podemos estar en medio de un grave error.

Page 25: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:2) definición de la distribución de muestreo

• Una vez definidos los supuestos, podemos obtener una distribución de muestreo para asociar las probabilidades con los resultados.

• En el ejemplo dado seleccionamos la distribución binomial. En otro caso, podría ser normal, Poisson, t, F, 2, ...

Page 26: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:2) definición de la distribución de muestreo

• Seleccionamos una determinada distribución teórica de frecuencias con base en nuestros supuestos.

• Las razones por las que seleccionamos dicha distribución deben ser explícitas.

Page 27: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:2) definición de la distribución de muestreo

• El conocimiento de la probabilidad de un resultado particular nos permite tomar una decisión racional sobre si se acepta o no la hipótesis planteada.

• Cuando los datos observados no se ajustan a la expectativa teórica, debemos buscar lo que causa la desviación de dicha expectativa.

Page 28: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

• Cuando obtenemos una muestra muy improbable como en ejemplo (14- y 3+) podemos tomar dos decisiones: aceptar o rechazar la hipótesis nula.

• Ya sea que se acepte o rechace la hipótesis nula, la decisión puede ser correcta o incorrecta.

Page 29: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

No rechazada RechazadaHipótesis nula Verdadera Decisión correcta Error tipo I

Falsa Error tipo II Decisión correcta

Hipótesis nula

Page 30: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

• Antes de efectuar una prueba, debemos decidir qué magnitud permitiremos de errores tipo I y II, sabiendo que siempre podrá haber muestras muy desviadas y la posibilidad de obtener muestras engañosas.

• Pregunta: En la tabla siguiente ¿a partir de qué combinación de muestras rechazamos la hipotesis nula si hubiéramos fijado nuestro error tipo I en 5% ? ¿Y en 1% ? (De 1 y 2 colas).

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Page 31: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas: formulación de supuestos y sistema de hipótesis

| Ho: p = q Ho: p = 2qCon microorganismo Sin microorganismo Frecuencia relativa Frecuencia relativa

17 0 0.0000076 0.001015016 1 0.0001297 0.008627215 2 0.0010376 0.034508814 3 0.0051880 0.086271913 4 0.0181580 0.150975612 5 0.0472107 0.196267911 6 0.0944214 0.196267610 7 0.1483765 0.15421019 8 0.1854706 0.09638118 9 0.1854706 0.04819057 10 0.1483765 0.01927626 11 0.0944214 0.00613335 12 0.0472107 0.00153334 13 0.0181580 0.00029493 14 0.0051880 0.00004212 15 0.0010376 0.00000421 16 0.0001297 0.00000030 17 0.0000076 0.0000000

Page 32: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

• El error tipo I se expresa comúnmente como probabilidad y se simboliza por la letra griega (Ej.: = 0.05).

• Si este valor se expresa como porcentaje, se conoce usualmente como nivel de significación (Ej.: 5 %).

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Page 33: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

• Cuando especificamos el área más extrema a partir de , nos referimos a la región crítica o área de rechazo (es un criterio para rechazar la hipótesis nula).

• La que conduce a aceptar la hipótesis nula es llamada región de no rechazo (mal referida a veces como de aceptación de la hipótesis nula).

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Page 34: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

• Si especificamos un = 0.01, aceptamos la H0 para todas las muestras que tienen 13 o menos elementos del mismo tipo. Cerca de 99 % de las muestras son así.

• Pero, ¿qué tal si la H0 es falsa y la H1 es correcta?

• Observemos las distribuciones.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Page 35: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

Pruebas de hipótesis

/ 2 1 - / 2

1 -

Page 36: Curso de Bioestadística DEO/CICS. Pruebas de hipótesis MGA/DEO Pruebas de hipótesis MGA/DEO

Curso de Bioestadística.

• Se hace evidente que al reducir el error aumentamos simultánea y necesariamente el error que consiste en no rechazar la hipótesis nula siendo falsa, el error tipo II.

• El error tipo II expresado como porcentaje es .

• En el ejemplo que hemos visto, la muestra de 17 elementos es insuficiente para distinguir entre las dos hipótesis.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica