Transcript
  • 8/10/2019 4f Inferencia Estadistica.pptx

    1/40

    P R U E B A S D E H I P T E S I S D E D O S M U E S T R A S

    4f. Pruebas de hiptesis

  • 8/10/2019 4f Inferencia Estadistica.pptx

    2/40

    Introduccin

    Hasta ahora se vieron pruebas de hiptesis parainferir caractersticas (media, varianza o proporcin)de la POBLACIN por medio de UNA MUESTRA.

    Se seleccion una sola muestra aleatoria de unapoblacin y se realiz una prueba para ver si erarazonable/correcto el valor propuesto de la

    poblacin.

  • 8/10/2019 4f Inferencia Estadistica.pptx

    3/40

    Ahora se ampliar el estudio a casos de pruebas dehiptesis para dos muestras, donde se seleccionanmuestras aleatorias de dos poblaciones distintas paradeterminar si son iguales las medias o las proporciones

    de la poblacin. Casos que veremos: Hay alguna diferencia en el nmero medio de defectos

    producidos en los turnos matutino y vespertino de GM? Hay un aumento en la tasa de produccin si se toma

    msica en el rea de produccin? Hay alguna diferencia en la proporcin de estudiantes de

    MBA y de maestra en ingeniera que aprobaron el examende certificacin en el primer intento?

  • 8/10/2019 4f Inferencia Estadistica.pptx

    4/40

    Pruebas de hiptesis para dos muestras: Muestrasindependientes

    Si partimos del caso: Suponer que un analista financiero busca saber si la tasa de

    recuperacin media para los fondos mutualistas de altorendimiento ES DISTINTA a la tasa de recuperacin media

    para los fondos mutualistas globales.

    En este caso hay 2 poblaciones independientes:

    1. Fondos mutualistas de alto rendimiento2. Fondos mutualistas globales

  • 8/10/2019 4f Inferencia Estadistica.pptx

    5/40

    Entonces, se deben seleccionar una muestra aleatoria deCADA POBLACIN, y se calculara la media de las 2muestras.

    Si las dos media muestrales son iguales, es esperara quela diferencia entre las dos medias poblacionales fueraceroPero qu pasara si los resultados, dado que sonmuestrales, produjeran una diferencia distinta de cero?la diferencia se debe a la casualidad o realmente existe

    una diferencia entre ambos fondos? Por medio de una prueba de hiptesis para ambas

    medias muestrales ayudar a contestar esta pregunta.

  • 8/10/2019 4f Inferencia Estadistica.pptx

    6/40

    Recordando que una distribucin de mediassuele aproximarse a la distribucin normal,entonces se supondr que una distribucin

    de las medias de muestras seguir unadistribucin normal, y con esto asumimosque la distribucin de sus diferencias

    tambin seguir una distribucin normal.

  • 8/10/2019 4f Inferencia Estadistica.pptx

    7/40

    Sobre la variabilidad de la distribucin de lasdiferencias de medias muestrales, si ambasprovienen de poblaciones independientes, ladistribucin de las diferencias tienen una varianzaigual a la suma de dos varianzas individuales, esdecir:

    Varianza de la distribucin de las diferencias en medias

  • 8/10/2019 4f Inferencia Estadistica.pptx

    8/40

    Para considerar esto como error estndar, se sacaraz y para considerar el estadstico de pruebaestandarizado resulta:

  • 8/10/2019 4f Inferencia Estadistica.pptx

    9/40

    Los clientes de Soriana tienen una opcin de pagar porsus compras. Pueden pagar en caja registradora normaloperada por una cajero o bien por internet.

    Se seleccionan 2 muestras resultando: el ticket promedio

    de 50 clientes que compran fsicamente en tienda es de$1,500 con una desviacin estndar de la poblacin de$300 mientras que el ticket promedio de 100 clientes decompras en lnea es de $1,750 con una desviacinestndar de la poblacin de $150.

    Podra afirmarse con un nivel de confianza de 95% quelos clientes de Soriana en general (incluyendo los que vanfsicamente a las tiendas como los compradores en lnea)en promedio compran cantidades similares?

  • 8/10/2019 4f Inferencia Estadistica.pptx

    10/40

    Se establece hiptesis nula y alternativa: Ho : s = u Ha : s u

    Dado el nivel de significancia de 0.05 se establecen

    las regiones crticas:

    Estadstico de prueba:

    1-= 0.95 = 0.05

    /2= 0.025

    -1.96 1.96

    Se rechaza HoPor lo que se concluye queexiste una diferencia en el ticketpromedio entre ambos tipos declientes

  • 8/10/2019 4f Inferencia Estadistica.pptx

    11/40

  • 8/10/2019 4f Inferencia Estadistica.pptx

    12/40

    Prueba de proporciones de dos muestras

    Para casos donde se requiere saber si dosproporciones de muestras provenientes depoblaciones iguales.

    Ejemplos de casos: El VP de RH desea saber si hay alguna diferencia en la

    proporcin de empleados asalariados por hora que faltan msde 5 das de trabajo por ao en las plantas de Atlanta yHouston.

    Ford considera un diseo nuevo para su modelo Focus. Eldiseo se muestra a un grupo de compradores potencialesmenores de 30 aos de edad y otro grupo de compradores demayores de 60 aos de edad. La compaa quiere saber si hayalguna diferencia en la proporcin de los dos grupos que lesgusta el diseo nuevo.

  • 8/10/2019 4f Inferencia Estadistica.pptx

    13/40

  • 8/10/2019 4f Inferencia Estadistica.pptx

    14/40

    Para hacer la prueba de hiptesis se asume que lamuestra es lo bastante grande para que ladistribucin normal sirva como una buenaaproximacin a la distribucin binomial.

    Estadstico de prueba:n1 nmero de observaciones en la 1 muestra

    n2 nmero de observaciones en la 2 muestra

    P1 proporcin de 1 muestra que posee la caracterstica

    P2 proporcin de la 2 muestra que posee la caracterstica

    Pc proporcin conjunta que posee la caracterstica en las

    muestras combinadas, y se calcula:

    X1 nmero que posee la

    caracterstica en la 1 muestra

    X2 nmero que posee la

    caracterstica en la 2 muestra

  • 8/10/2019 4f Inferencia Estadistica.pptx

    15/40

    Ejemplo

    La compaa de perfumes Manelli desarroll una fragancianueva. Varios estudios de mercado indican que esta nuevafragancia tiene un buen potencial. El depto. De ventas tieneinters en saber si hay alguna diferencia en las proporcionesde mujeres jvenes y mayores que compraran el perfume si

    saliera al mercado. Hay dos poblaciones independientes: unade mujeres jvenes y otra de mujeres mayores. A cada una delas mujeres muestreadas se le pedir que huela la fragancianueva e indique si le gusta lo suficiente para comprar elperfume.

    Realizar la prueba de hiptesis a un nivel de significancia de

    0.05 cuando los resultados fueron: Una muestra aleatoria de 100 mujeres jvenes revel que a 19 les gust

    la nueva fragancia lo suficiente para comprar el perfume.P1 Una muestra de 200 mujeres mayores revelo que a 62 les gust la nueva

    fragancia lo suficiente para comprarlaP2

  • 8/10/2019 4f Inferencia Estadistica.pptx

    16/40

    Solucin al ejemplo

    1. Formular hiptesis nula/alternativa: Ho : 1 = 2 Ha: 1 2

    2. Regiones crticas:

    3. Proporciones:

    1-= 0.95 = 0.05/2= 0.025

    -1.96 1.96

  • 8/10/2019 4f Inferencia Estadistica.pptx

    17/40

    Estadstico de prueba:

    -1.96 1.96

    -2.21

    Se rechaza Ho.Se rechaza la hiptesis nula de

    que la proporcin de mujeresjvenes que compraran lafragancia es igual a laproporcin de mujeres mayoresque tambin la compraran.

    L hi i l l i

  • 8/10/2019 4f Inferencia Estadistica.pptx

    18/40

    Ejercicios en clase La hiptesis nula y alternativa son:

    Ho:1 2

    Una muestra de 200 observaciones de la 1 poblacin indic que X1 es 170;otra de 150 observaciones de la 2 poblacin revel que X2 es 110. Utilice unnivel de significancia de 0.05 para probar la hiptesis.

    La familia Damon posee un viedo grande en el oeste de NY. Probaran 2nuevos insecticidas (Pernod 5 y Action). Para probarlos, se seleccionaron 3hileras y se fumigaron con Pernod 5, y otras 3 con Action. Tiempo despus,

    se revisaron 400 vides tratadas con Pernod 5 e igualmente otras 350 serevisaron para verificar el efecto de Action. Los resultados fueron:

    Con un nivel de significancia de 0.05 se puede concluir que existe unadiferencia en la proporcin de vides infectadas empleando Pernod 5 encomparacin con las fumigadas con Action?

  • 8/10/2019 4f Inferencia Estadistica.pptx

    19/40

    Comparacin de medias con desviaciones estndaresde la poblacin desconocidas (prueba t conjunta)

    En los casos hasta ahora vistos se utiliz la z(distribucin normal estndar) como estadstico deprueba.

    Se compararon medias muestrales de 2 poblacionesindependientes con el objetivo de saber si provenan delas mismas poblaciones o de poblaciones iguales(medias poblacionales estadsticamente iguales).

    La realidad es que difcilmente conoceremos ladesviacin estndar poblacional () por lo queutilizaremos la desviacin estndar de la muestra (s).

  • 8/10/2019 4f Inferencia Estadistica.pptx

    20/40

  • 8/10/2019 4f Inferencia Estadistica.pptx

    21/40

    De qu manera se agrupan las desviacionesestndar muestrales? Las 2 desviaciones estndares de las muestras se agrupan para

    formar una sola estimacin de la desviacin estndar

    desconocida de la poblacin. Esto se calcula mediante una media ponderada de las dos

    desviaciones estndares de las 2 muestras.

    Las ponderaciones son los grados de libertad de cada muestra.

  • 8/10/2019 4f Inferencia Estadistica.pptx

    22/40

    El estadstico de prueba t se calcula:

  • 8/10/2019 4f Inferencia Estadistica.pptx

    23/40

    Ejemplo

    Owens Inc. Analiza dos procedimientos distintospara el montaje del motor al chasis de una podadora.La pregunta es: existe una diferencia en el tiempomedio para montar los motores al chasis?.

    El primer procedimiento se consultaron 5mediciones y result un tiempo promedio de 4 mincon una desviacin estndar muestral de 2.91.

    El segundo procedimiento se consultaron 6

    mediciones y result un tiempo promedio de 5 mincon una desviacin estndar muestral de 2.09. Utilice un nivel de significancia de 0.1

  • 8/10/2019 4f Inferencia Estadistica.pptx

    24/40

  • 8/10/2019 4f Inferencia Estadistica.pptx

    25/40

  • 8/10/2019 4f Inferencia Estadistica.pptx

    26/40

    -1.83 +1.83

    Rechazo HoRechazo Ho

    -0.662

    Por lo que NO se rechaza Ho, se acepta Ho como cierta. Se concluye que NO existe diferencia en los tiempos

    medios para montar el motor en el chasis con los 2mtodos.

  • 8/10/2019 4f Inferencia Estadistica.pptx

    27/40

  • 8/10/2019 4f Inferencia Estadistica.pptx

    28/40

    Comparacin de medias poblacionales condesviaciones estndares desiguales

    Hasta ahora se vieron los casos donde suponemosque las poblaciones tenan desviaciones estndaresIGUALES.

    Importante: NO se conocan los valores peroSUPONAMOS eran iguales.

    Qu pasa si las desviaciones estndar de la poblacinsuponemos son DIFERENTES?

    Se emplearn nuevamente las desviaciones estndarde las muestras (S1 y S2) en lugar de las de lapoblacin.

  • 8/10/2019 4f Inferencia Estadistica.pptx

    29/40

    Estadstico de prueba para medias sin diferencia,varianzas desiguales:

    Grados de libertad para prueba con varianzadesigual:

  • 8/10/2019 4f Inferencia Estadistica.pptx

    30/40

    Ejemplo

    Se desea conocer la absorcin de toallas de papel. Secomparan toallas de marcas diferentes de calidad similar.Una primera muestra de la marca 1 se realiz elexperimento con 9 toallas obtenindose una absorcin

    media de 6.44ml con una desviacin estndar de 3.32ml.La segunda muestra de la marca 2 se realiz con 12toallas obtenindose una absorcin media de 9.417mlcon una desviacin estndar de 1.621ml.

    Utilice un nivel de significancia de 0.1 y pruebe queexiste una diferencia en la cantidad media de lquidoabsorbido.

  • 8/10/2019 4f Inferencia Estadistica.pptx

    31/40

  • 8/10/2019 4f Inferencia Estadistica.pptx

    32/40

    Se calcula el estadstico de prueba:

    Buscando en tablas de la Distribucin t-student connivel de significancia de 0.1 y 10 grados de libertad,consideramos las regiones crticas

    -1.812 +1.812

    Rechazo HoRechazo Ho

    -2.418

    Por lo que seRECHAZA H0, seconcluye que la tasade absorcin mediapara las 2 marcasde toallas NO es la

    mis.a

    P b d hi t i d d t

  • 8/10/2019 4f Inferencia Estadistica.pptx

    33/40

    Prueba de hiptesis de dos muestras:Muestras dependientes

    Este mtodo se utiliza cuando las muestras sondependienteso estn relacionadas.

    Tambin se les conoce como muestras

    apareadas. Bsicamente lo que vamos a utilizar como muestra

    ser la distribucin de las medias de las diferenciasde ambas muestras.

    Vamos a explicar esto ltimo por medio de unejemplo:

    Un ejecutivo de crditos hipotecarios de Bancomer

  • 8/10/2019 4f Inferencia Estadistica.pptx

    34/40

    Un ejecutivo de crditos hipotecarios de Bancomerrecurre a dos empresas dedicadas a Bienes Raices:Century 21 y Kasa; para valuar propiedades que estn

    susceptibles de venta. Es importante que ambasempresas tengan valores similares en sus avalos. Pararealizar esto, Bancomer selecciona 10 casas de formaaleatoria y pide a Century 21 y Kasa realicen su avalos.

    Entonces, para cada casa, se realizarn 2 avalos, unorealizado por Century 21 y otro por Kasa.

    Los avalos dependen o estn relacionados con la casaseleccionada.

    Para la prueba de hiptesis el inters es la distribucin

  • 8/10/2019 4f Inferencia Estadistica.pptx

    35/40

    Para la prueba de hiptesis el inters es la distribucinde las diferencias en el valor del avalo de cada casa.

    Entonces de aqu solo hay 1 muestra.

    Bancomer intenta saber si la media de la distribucinde las diferencias en los avalos es cero, es decir, sindiferencia o si existe alguna diferencia.

    La muestra se compone de las diferencias de losavalos de ambas empresas (Century 21 y Kasa).

    Si ambas empresas reportan estimados similares,entonces algunas veces los avalos de Century 21 sern

    mayores y otras veces sern los de Kasa. A pesar deesto la media de las diferencias ser cero.

  • 8/10/2019 4f Inferencia Estadistica.pptx

    36/40

    Se utilizar dpara indicar la media poblacional dela distribucin de las diferencias, suponiendo que ladistribucin de las diferencias sigue una distribucin

    Normal. El estadstico de prueba sigue la distribucin t

    student (con n-1 grados de libertad)y secalcula:

    d: es la media de las diferencias entre lasobservaciones apareadas o relacionadas.Sd: desviacin estndar de las diferencias entre lasobservaciones apareadas o relacionadas.n: nmero de observaciones apareadas.

  • 8/10/2019 4f Inferencia Estadistica.pptx

    37/40

    Sdse calcula de manera similar al clculo normal dela desviacin estndar, nicamente cambiando x pord, es decir:

  • 8/10/2019 4f Inferencia Estadistica.pptx

    38/40

    1. Formular hiptesis nula y alternativa:

  • 8/10/2019 4f Inferencia Estadistica.pptx

    39/40

    1. Formular hiptesis nula y alternativa:Ho: d= 0 Vs Ha: d 0

    2. Hay 10 casas valuadas por ambas empresas, entonces n=10 ygl= 10-1=9. Se tiene una prueba de dos colas a un nivel de

    significancia de 0.05 (=0.05). Buscando en tablas t studentpara determinar valores crticos:

    -2.262 +2.262

    Rechazo HoRechazo Ho

  • 8/10/2019 4f Inferencia Estadistica.pptx

    40/40

    Calculando el estadstico de prueba:

    -2.262 +2.262

    3.305

    Se rechaza Ho,concluyndose que ladistribucin de las

    diferencias de la poblacinNO tiene una media de 0,hay una diferencia en losavalos medios de lascasas.