Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Embed Size (px)

Citation preview

  • Estadstica Aplicada

    Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Pgina 1 de 11

    Practica dirigida de prueba de hiptesis para la diferencia de dos medias

    Ejemplo Aplicativo Nro 1 Un corredor de valores de la bolsa de lima estudia los porcentajes de rendimiento de las empresas del sector minero y del sector financiero. Se sabe que las tasas de los rendimientos tienen una distribucin normal. Dos muestras aleatorias de las tasas de 8 empresas del sector minero (M) y de 6 empresas del sector financiero (F) han dado los siguientes valores de rendimiento en porcentajes:

    Sector M 17 23 25 18 24 20 21 16 Sector F 13 16 14 12 15 14

    Qu sector empresarial presenta mayor rendimiento?

    Solucin Para resolver este problema se debe cumplir las siguientes condiciones:

    a) Los datos provengan de poblaciones normales. b) Los datos sean independientes. c) Probar la igualdad de varianzas. d) Probar la igualdad de medias.

    En este ejemplo vamos a suponer que se cumplen las dos primeras condiciones, y vamos a docimar las dos ltimas.

    Primer paso Prueba de hiptesis para la igualdad de varianzas. Cuando se trata de una prueba de hiptesis para la igualdad de varianzas, se utiliza la distribucin F de Fisher-Snedecor.

    1) H0: 2 2M F = H1: 2 2M F

    2) Nivel de significancia: = 5% 3) Estadstica

    4) Regla de decisin

    6.85, se obtiene leyendo la tabla Fisher del 2.5% con 7 grados de libertad en el numerador y 5 grados de libertad en el denominador. 0.19; se obtiene hallando la inversa del valor de la tabla Fisher de 2.5% con 5 grados de libertad en el numerador y 7 grados de libertad en el denominador.

    1 2

    2122

    ( r ;r )SF ~ FS

    =

    F

    2.5%

    2.5%

    6.85 0.19

    10 195 29

    .

    .

    =

  • Estadstica Aplicada

    Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Pgina 2 de 11

    5) Clculos Datos del Problema

    2

    M

    2

    F

    = 11.1428

    = 2

    Cal

    Cal

    11.1428F =

    2

    F = 5.57

    6) Decisin Dado que el FCal = 5.57 RA, aceptamos H0 y rechazamos H1, por lo tanto podemos concluir que las varianzas poblacionales del sector minero y financiero son iguales.

    Clculos con Statgraphics a) Una vez introducidos los valores de las variables, se procede a ejecutar men

    comparacin Dos muestras Comparacin de dos muestras, luego se seleccionan las respectivas muestras en el cuadro de dialogo y se acepta, ver los pasos para este procedimiento:

    Se introducen los valores de las

    variables

    Se configura el cuadro de la siguiente manera y se presiona aceptar

  • Estadstica Aplicada

    Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Pgina 3 de 11

    b) Luego se presiona el botn , y se activa la siguiente opcin:

    c) Finalmente se analiza el resultado:

    Comparacin de Desviaciones Tpicas -----------------------------------

    Sector M Sector F ------------------------------------------------------------

    Desviacin Tpica 3.33809 1.41421 Varianza 11.1429 2.0 GL 7 5

    Cociente de varianzas = 5.57143

    95.0% Intervalos de Confianza Desviacin Tpica deSector M: [2.20706;6.79393] Desviacin Tpica deSector F: [0.882763;3.46852] Cociente de varianzas: [0.812978;29.4463]

    Contrastes F para comparar varianzas

    Hiptesis nula: sigma1 = sigma2 (1) Hiptesis alt.: sigma1 sigma2 F = 5.57143 P-Valor = 0.0766501

    El StatAdvisor --------------

    Esta opcin ejecuta un F-test para comparar las varianzas de las dos muestras. Tambin establece los intervalos de confianza o los lmites para cada desviacin tpica y para el ratio de varianzas. De particular inters est el intervalo de confianza para el ratio de las varianzas, el cual se extiende desde 0.812978 hasta 29.4463. Dado que el intervalo contiene el valor 1.0, no existe diferencia estadsticamente significativa entre las desviaciones tpicas de las dos muestras para un nivel de confianza del 95.0%. Tambin puede utilizarse un F-test para probar una hiptesis especfica sobre las desviaciones tpicas de las poblaciones de las que proceden las dos muestras. En este caso, el test se ha realizado para determinar si el ratio de las desviaciones tpicas son iguales 1.0 frente a la hiptesis alternativa en la que el ratio no es igual 1.0. Puesto que el p-valor calculado no es inferior a 0.05, no podemos rechazar la hiptesis nula. NOTA IMPORTANTE: los F-test y los intervalos de confianza mostrados dependen de que las muestras procedan de distribuciones normales. Para comprobar esta asuncin, seleccione Resumen Estadstico de la lista de Opciones Tabulares y observe los valores de asimetra estandarizada y curtosis estandarizada.

    Lo mas importante aqu, es observar el valor de p = 7.67% > = 5%, lo que indica que se acepta la hiptesis nula.

  • Estadstica Aplicada

    Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Pgina 4 de 11

    Clculos con Excel a) Primero se deben colocar los datos en una hoja de clculo. b) Activar men herramientas Anlisis de datos Prueba F para varianzas de

    dos muestras

    c) Se configura el cuadro de dialogo de la siguiente manera:

    Obsrvese que el valor de a ha sido colocado dividido entre 2, esto por que en el Excel, para esta prueba, siempre se considera solo uno de los lados, ya sea el izquierdo o el derecho, esto segn cual de las dos muestras tenga mayor o menor varianza

    d) Obtenindose los siguientes resultados:

    Prueba F para varianzas de dos muestras

    Sector M Sector F Media 20.5 14 Varianza 11.14285714 2 Observaciones 8 6 Grados de libertad 7 5 F 5.571428571 P(F

  • Estadstica Aplicada

    Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Pgina 5 de 11

    Segundo Paso Con la Prueba anterior se ha demostrado que las varianzas poblacionales son iguales, pero desconocidas, entonces ahora se procede a elaborar una prueba de hiptesis para la diferencia de medias.

    Prueba de hiptesis para la diferencia de medias, con varianzas iguales 1) H0: M = F

    H1: M F

    2) = 5% 3) Estadstica.

    Dado que las varianzas poblacionales resultaron ser iguales, se utiliza:

    4) Regla de decisin

    5) Clculos

    Sector Minero Sector Financiero Media Aritmtica 20.5 14

    Varianza Muestral 11.14285714 2 Tamao de muestra 8 6

    6) Decisin Dado que TCal = 4.44 R.A., aceptamos H1 y rechazamos H0, por lo tanto los rendimientos medios en las empresas del sector minero no son iguales a los de las empresas del sector financiero.

    Hasta este momento solo podemos decir que los rendimientos medios son diferentes pero no sabemos en que sectores son mayores, para ello hacemos un replanteamiento de las hiptesis. Para este replanteamiento se observa el signo del estadstico TCal dado que este es positivo, hay un fuerte indicio que el rendimiento en las empresas del sector minero sea mayor al de las empresas del sector financiero.

    1 21 22 2

    1 2

    2C C

    X XT t( n n )S Sn n

    = +

    +

    2 22

    1 1 2 2

    1 2

    1 12

    C( n )S ( n )SS

    n n

    + =

    +

    0 t

    2.5% 2.5%

    -2.179 2.179

    2

    C

    2

    C

    (8-1)11.14285+(6-1)2S =

    8+6-2

    S =7.33

    Cal

    20.5-14T =

    7.33 7.33+

    8 6

    CalT =4.44

  • Estadstica Aplicada

    Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Pgina 6 de 11

    Replanteando 1) H0: M F

    H1: M > F

    2) = 5%

    3) Estadstica. Dado que las varianzas poblacionales resultaron ser iguales, se utiliza:

    4) Regla de decisin

    5) Clculos

    Sector Minero Sector Financiero Media Aritmtica 20.5 14

    Varianza Muestral 11.14285714 2 Tamao de muestra 8 6

    6) Decisin Dado que TCal = 4.44 R.A., aceptamos H1 y rechazamos H0, por lo tanto el rendimiento promedio de las empresas del sector minero son mayores al rendimiento medio de las empresas del sector financiero.

    Clculos con Statgraphics Con el Statgraphics, se sigue el mismo procedimiento que para la prueba de hiptesis

    para las varianzas, con la unica salvedad que al presionar el botn , se deb escoger la siguiente opcin:

    1 21 22 2

    1 2

    2C C

    X XT t( n n )S Sn n

    = +

    +

    2 22

    1 1 2 2

    1 2

    1 12

    C( n )S ( n )SS

    n n

    + =

    +

    0 t

    5%

    1.782

    2

    C

    2

    C

    (8-1)11.14285+(6-1)2S =

    8+6-2

    S =7.33

    Cal

    20.5-14T =

    7.33 7.33+

    8 6

    CalT =4.44

  • Estadstica Aplicada

    Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Pgina 7 de 11

    Obtenindose as el siguiente resultado:

    Comparacin de Medias ---------------------

    95.0% intervalo de confianza para la media de Sector M: 20.5 +/- 2.79072 [17.7093,23.2907] 95.0% intervalo de confianza para la media de Sector F: 14.0 +/- 1.48413 [12.5159,15.4841] 95.0% intervalos de confianza para la diferencia de medias: suponiendo varianzas iguales: 6.5 +/- 3.18651 [3.31349,9.68651]

    contrastes t de comparacin de medias

    Hiptesis nula: media1 = media2 Hiptesis alt.: media1 media2 suponiendo varianzas iguales: t = 4.44446 P-Valor = 0.00080058

    El StatAdvisor --------------

    Esta opcin ejecuta el t-test para comparar las medias de las dos muestras. Tambin establece los intervalos de confianza o los lmites para cada media y para la diferencia entre las medias. De particular inters est el intervalo de confianza para la diferencia entre las medias, el cual se extiende desde 3.31349 hasta 9.68651. Dado que el intervalo no contiene el valor 0.0, existe diferencia estadsticamente significativa entre las medias de las dos muestras para un nivel de confianza del 95.0%. Tambin puede aplicarse un t-test para probar una hiptesis especfica sobre la diferencia entre las medias de las poblaciones de las que proceden las dos muestras. En este caso, el test se ha realizado para determinar si la diferencia entre las dos medias es igual a 0.0 frente a la hiptesis alternativa en la que la diferencia no es igual 0.0. Puesto que el p-valor calculado es inferior a 0.05, podemos rechazar la hiptesis nula en favor de la alternativa. NOTA: estos resultados asumen la igualdad de varianzas en las dos muestras. En este caso, esa asuncin parece ser razonable teniendo en cuenta los resultados del F-test para comparar las desviaciones tpicas. Puede ver los resultados de este test seleccionando Comparacin de Desviaciones Tpicas del men Opciones Tabulares.

    Se puede observar que el estadstico calculado tCal = 4.44 y que el valor de p = 0.00080058; el que es mucho menor que a, por lo tanto se acepta la hiptesis alternativa.

  • Estadstica Aplicada

    Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Pgina 8 de 11

    Clculos con Excel a) Primero se deben colocar los datos en una hoja de clculo. b) Activar men herramientas Anlisis de datos Prueba t para dos muestras

    suponiendo varianzas iguales.

    c) Se configura el cuadro de dialogo de la siguiente manera:

    d) Obtenindose los resultados siguientes:

    Prueba t para dos muestras suponiendo varianzas iguales

    Sector M Sector F Media 20.5 14 Varianza 11.14285714 2 Observaciones 8 6 Varianza agrupada 7.333333333 Diferencia hipottica de las medias 0 Grados de libertad 12 Estadstico t 4.444462482 P(T

  • Estadstica Aplicada

    Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Pgina 9 de 11

    Ejemplo Aplicativo Nro 2 Un corredor de valores de la bolsa de lima estudia los porcentajes de rendimiento de las empresas del sector minero y del sector financiero. Se sabe que las tasas de los rendimientos tienen una distribucin normal. Dos muestras aleatorias de las tasas de 8 empresas del sector minero (M) y de 6 empresas del sector financiero (F) han dado los siguientes valores de rendimiento en porcentajes:

    Sector M 17 23 25 18 24 20 21 16 Sector F 13 15 14 12 15 14

    Qu sector empresarial presenta mayor rendimiento?

    En este segundo ejemplo, lo nico que se ha hecho es cambiar la segunda observacin del sector financiero de 16 por 15 y con este pequesimo cambio, la prueba de igualdad de varianzas da como resultado:

    1) H0: 2 2M F = H1: 2 2M F

    2) Nivel de significancia: = 5% 3) Estadstica

    4) Regla de decisin

    6.85, se obtiene leyendo la tabla Fisher del 2.5% con 7 grados de libertad en el numerador y 5 grados de libertad en el denominador. 0.19; se obtiene hallando la inversa del valor de la tabla Fisher de 2.5% con 5 grados de libertad en el numerador y 7 grados de libertad en el denominador.

    5) Clculos Datos del Problema

    2

    M

    2

    F

    = 11.1428

    = 1.3667

    Cal

    Cal

    11.1428F =

    1.3667

    F = 8.1533

    1 2

    2122

    ( r ;r )SF ~ FS

    =

    F

    2.5%

    2.5%

    6.85 0.19

    10 195 29

    .

    .

    =

  • Estadstica Aplicada

    Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Pgina 10 de 11

    6) Decisin Dado que el FCal = 8.15 RA, aceptamos H1 y rechazamos H0, por lo tanto podemos concluir que las varianzas poblacionales del sector minero y financiero son diferentes.

    Se deja al alumno el desarrollo de este ejercicio con el software respectivo.

    Prueba de hiptesis para la diferencia de medias, con varianzas desiguales 1) H0: M = F

    H1: M F

    2) = 5% 3) Estadstica.

    Dado que las varianzas poblacionales resultaron ser desiguales, se utiliza:

    4) Regla de decisin

    5) Clculos

    Sector Minero Sector Financiero Media Aritmtica 20.5 13.8333

    Varianza Muestral 11.14285714 1.3667 Tamao de muestra 8 6

    r 9

    6) Decisin Dado que TCal = 5.24 R.A., aceptamos H1 y rechazamos H0, por lo tanto los rendimientos medios en las empresas del sector minero no son iguales a los de las empresas del sector financiero.

    0 t

    2.5% 2.5%

    -2.262 2.262

    Cal

    20.5-13.83T =

    11.1429 1.3667+

    8 6

    CalT =5.24

    1 2

    2 21 2

    1 2

    X XT t( r )S Sn n

    =

    +

    22 21 2

    1 2

    2 22 21 2

    1 2

    1 21 1

    S Sn n

    r

    S Sn n

    n n

    +

    =

    +

    r, representa el nmero de grados de libertad

    ( ) ( )2

    2 2

    11.1429 1.3667+

    8 6r= =9.1347

    1.3611.148 6+

    8-1 6-1

  • Estadstica Aplicada

    Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Pgina 11 de 11

    Calculo con Excel

    a) Primero se deben colocar los datos en una hoja de clculo. b) Activar men herramientas Anlisis de datos Prueba t para dos muestras

    suponiendo varianzas desiguales.

    c) Configurar el cuadro de dialogo

    d) Finalmente los resultados son:

    Prueba t para dos muestras suponiendo varianzas desiguales

    Sector M Sector F Media 20.5 13.83333333 Varianza 11.14285714 1.366666667 Observaciones 8 6 Diferencia hipottica de las medias 0 Grados de libertad 9 Estadstico t 5.236801889 P(T