MI RESUMEN1234567890

Embed Size (px)

DESCRIPTION

rsumen

Citation preview

MUESTREO Y DISTRIBUCIONES DE MUESTREOPROPIEDADES DE LA MEDIA ARITMETICAEntre varias propiedades de la media aritmtica para una distribucin normal estn:1. Imparcialidad: implica el hecho de que el promedio de todas las medias de muestras posibles ser igual a la media de la poblacin2. Eficiencia: precisin de la muestra de estadstica como un estimador del parmetro de poblacin.3. Consistencia: efecto del tamao de la muestra sobre la utilidad de un estimador. Al incrementarse el tamao de muestra, la variacin de la media de muestra de la media de poblacin se hace ms pequea, por lo que se vuelve una mejor estimacin.ERROR ESTANDAR DE LA MEDIAEl hecho de que las medias de muestras variables son menos variables que los datos de poblacin se desprenden de la ley de nmeros grandes. Una media de muestra particular promedia conjuntamente todos los valores de la muestra. Una poblacin puede consiste en resultados individuales que pueden tener un amplio radio de valores, de extremadamente pequeos a extremadamente grandes. Sin embargo, si un valor extremo cae en la muestra, aunque tendr un efecto en la media, el efecto se reducir pues se promediara con todos los dems valores de la muestra. Adems, al incrementarse el tamao de muestra, el efecto de un solo valor extremo se hace cada vez menor, puesto que se est promediando con ms observaciones.Este fenmeno se expresa estadsticamente en el valor de la desviacin estndar de la media y se denomina desviacin de la media de muestra o error estndar de la media.INTRODUCCIN AL MUESTREOLos especialistas usan la palabra poblacin para referirse a todo los elementos que han sido escogidos para su estudio; y la palabra muestra para describir una porcin escogida de la poblacin.ESTADISTICAS Y PARAMETROSCuando la media, mediana, moda y desviacin estndar describen caractersticas de una muestra, se denominan estadsticas; cuando describen las caractersticas de una poblacin se llaman parmetros.TIPOS DE MUESTREOSUtilizamos muestreos porque en algunos casos medir una poblacin completa no puede ser factible debido al tiempo y costos que conlleva.Existen dos tipos: No aleatorio o de juicio: se emplea el conocimiento y la opinin personal para identificar a los elementos de una poblacin que deben incluirse en una muestra. Probabilidad: todos los elementos de la poblacin tienen la posibilidad de ser elegidos. Incluyen un anlisis mayor estadstico y de planeacin, toman as tiempo y dinero que las muestras subjetivas. Aleatorio simple: cada posible muestra tiene igual probabilidad de ser seleccionada y cada elemento de la poblacin tiene igual oportunidad de ser incluido en la muestra. Sistemtico: cada elemento tiene igual probabilidad de ser incluido pero cada muestra no tiene la misma oportunidad de ser elegida. Estratificado: dividir la poblacin en grupos relativamente homogneos, llamados estratos y luego se elige si se escoge aleatoriamente un nmero especfico de elementos o extraemos el mismo nmero de elementos de cada estrato y se ponderan los resultados. Garantiza que cualquier elemento de la poblacin tenga la misma posibilidad de ser elegido. Se elige cuando existe mayor varianza entre grupos que dentro del mismo grupo; cuando los grupos son homogneos.El muestreo de juicio y el de probabilidad no son necesariamente excluyentes. Si existe poca informacin, se podra sugerir uno de probabilidad.DISEO DE EXPERIMENTOSDefinimos un evento como uno o ms de los resultados posibles de hacer algo, y un experimento como la actividad que tendra como resultados tales eventos.FASES1. Se hace una afirmacin2. Se establecen objetivos3. Se selecciona la variable de respuesta4. Eleccin del tamao de muestra5. Las condiciones experimentales se mantienen constantes6. Anlisis de datos.INTRODUCCION A LAS DISTRIBUCIONES DE MUESTREOUna distribucin de probabilidad de todas las medias posibles de las muestras es una distribucin de las medias de las muestras. Los especialistas en estadstica la conocen como distribucin de muestreo de la media.Cualquier distribucin de probabilidad puede ser descrita parcialmente por su media y su desviacin estndar.ERROR ESTANDAR DE DESVIACION ESTANDAR DE LA DITRIBUCION DE DE LA MUESTRA

La mediaMedias

ProporcinProporcin

EstadsticaEstadstica

MedianaMediana

RangoRango

DISTRIBUCION DE MUESTREOS

POBLACIONES NORMALESError estndar de la media para poblaciones infinitas, con reemplazo:

Estandarizacin de la media de la muestra:

El error estndar de la media es el error de muestreo.POBLACIONES NO NORMALESTEOREMA DEL LIMITE CENTRALLa media de la distribucin de muestra de la media ser igual a la media de la poblacin, sin importar el tamao de la muestra; la distribucin de muestreo de la media se acercara a la normalidad, sin importar la forma de la distribucin de la poblacin.El teorema del lmite central asegura que la distribucin de muestreo de la media se aproxima a la normal al incrementarse el tamao de la muestra.La distribucin de muestreo de la media tendr distribucin aproximadamente normal:

Para la mayora, sin importar la forma30 observaciones

Distribuciones bastante simtricas15 observaciones

Distribucin normalmenteSiempre

La importancia del teorema del lmite central es que nos permite usar estadsticas de muestras para hacer inferencias con respecto a los parmetros de poblacin, sin saber sobre la forma de la distribucin de frecuencia de esa poblacin ms lo que podamos obtener en la muestra.RELACIN ENTRE EL TAMAO DE MUESTRA Y EL ERROR ESTANDARSi la dispersin disminuye ( se hace ms pequea) entonces los valores tomados por la media de la muestra tienden a agruparse ms cercanamente alrededor de , y viceversa. Al disminuir el error estndar, el valor de cualquier media de muestra probablemente se acercara al valor de la media de poblacin.MULTIPLICADOR DE POBLACIN FINITAFactor de correccin para poblaciones finitas:

Error estndar de la media para poblaciones finitas:

Los especialistas en estadstica se refieren a la fraccin n/N como la fraccin de muestreo, porque es la fraccin de la poblacin N contenida en la muestra.Si la fraccin de muestreo es menor a 0,5 no es necesario usar el multiplicador de poblacin finita. Si es mayor debe utilizarse, o si el muestreo es conducido sin reemplazo de poblaciones que son de tamao finito N.Cuando la muestra constituye una muy pequea fraccin de la poblacin, el factor de correccin no tiene ningn efecto en la estimacin del intervalo de confianza.Para que sea ms pequea, debo agrandar n. En consecuencia, resulta que el tamao absoluto de la muestra es el que determina la precisin del muestreo.El fcpf siempre ser menor a 1, lo cual implica que en este tipo de muestreo, las estimaciones surgidas resultan ms exactas, o lo que es lo mismo, tienen menos dispersin en el muestreo.ESTIMACIONLos administradores utilizan estimaciones porque deben tomar decisiones racionales sin contar con la informacin pertinente completa y con una cuota de incertidumbre de lo que el futuro pueda deparar.Estadstica inferencial: tcnicas que permiten dar considerado plausible acerca de un valor de parmetro poblacional de inters.En la inferencia estadstica, debemos tomar los resultados de una sola muestra y llegar a conclusiones acerca de la poblacin, y no al contrario.Estadgrafos: medidas anlogas obtenidas a partir de datos muestrales. Tambin conocidos como estimadores. Se utilizan para proporcionar una idea del valor de a media poblacional correspondiente, pero solo considerando los datos muestrales.TIPOS DE ESTIMACIONESUna estimacin puntual es un solo nmero que se utiliza para estimar un parmetro de poblacin desconocido. A menudo, una estimacin puntual solo tiene dos opciones: correcta o equivocada, por eso es mucho ms til si viene acompaada por una estimacin del error que podra estar implicado.Una estimacin de intervalo es un conjunto de valores que se utiliza para estimar un parmetro de la poblacin. Una estimacin de este tipo indica el error de dos maneras: por la extensin del intervalo y por la probabilidad de que el verdadero parmetro poblacional se encuentre dentro del intervalo.ESTIMADOR Y ESTIMACIONESUn estimador es un estadstico de la muestra utilizado para estimar un parmetro poblacional. Una estimacin es un valor especfico observado de un estadstico que resulta de la muestra particular observada.CRITERIOS PARA SELECCIONAR UN BUEN ESTIMADOR1. Insesgado: La media de la distribucin muestral de las medias de las muestras tomadas de la misma poblacin es igual a la media de la poblacin misma.2. Eficiencia: Se refiere al tamao del error estndar del estadstico. El ms eficiente ser el que tenga el menor error estndar o la menor desviacin estndar de la distribucin muestral, tendr mayor oportunidad de producir una estimacin ms cercana al parmetro poblacional que se est considerando.3. Consistencia: Si al aumentar el tamao de la muestra, se tiene casi la certeza de que el valor del estadstico se aproxima bastante al valor del parmetro poblacional4. Suficiencia: Si utiliza tanta informacin de la muestra que ningn otro estimador puede extraer informacin adicional acerca del parmetro de poblacin que se est estimando.Un estadstico de la muestra dado no siempre es el mejor estimador de su parmetro poblacional correspondiente. Considere una poblacin con distribucin simtrica, en la que los valores de la media y mediana coinciden. En este caso, la media de la muestra sera un estimador imparcial de la mediana de la poblacin. Tambin, la media de la muestra sera un estimador consistente de la mediana de la poblacin puesto que, al aumentar el tamao de la muestra, el valor de la media de la muestra tendera a acercarse bastante a la poblacin. Y la meda de la muestra sera un estimador ms eficiente de la mediana de la poblacin que de la mediana de la muestra misma, ya que en muestras grandes, la media de la muestra tiene un error esta dar menor que la de la mediana de la muestra. Al mismo tiempo, la mediana de la muestra de una poblacin con distribucin simtrica sera un estimador imparcial y consistente de la media de la poblacin, pero no el ms eficiente, porque en muestras grandes su error estndar es mayor que el de la media de la muestra.

ESTIMACIONES PUNTUALESLa media de la muestra es el mejor estimador de la media de la poblacin. Es insesgada, consistente el estimador ms eficiente y, siempre y cuando la muestra sea suficientemente grande, su distribucin muestral puede ser aproximada por medio de la distribucin normal.DESVIACION ESTANDAR Muestra

PoblacinESTIMACION DE INTERVALO: CONCEPTOS BSICOSUna estimacin de intervalo describe un conjunto o rango de valores dentro del cual es posible que est un parmetro de la poblacin. Sabemos que si seleccionamos graficamos un nmero grande de medias de muestras de una poblacin, la distribucin de estas medias se aproximara a la curva normal. Adems, la media de las medias muestrales ser igual a la media de la poblacin. Para medir la extensin o dispersin de la distribucin demedias muestrales podemos calcular el error estndar de media.PROBABILIDAD DE QUE EL PARAMETRO POBLACIONAL CAIGA DENTRO DE LA ESTIMACION DEL INTERVALOSeleccionamos una muestra de 200 bateras, con una vida media de 36 meses. Aplicando la frmula del error estndar de la media obtenemos un error de 0,707 meses, podemos decir que la vida til real de las bateras puede estar en alguna parte de la estimacin de intervalo comprendida entre 35,293 y 36,707.Necesitamos calcular que la duracin real de las bateras este en este intervalo o en otros intervalos de diferentes anchos que podamos escoger, , , y as sucesivamente.Tenemos que la probabilidad es 0,955 de que la media de una muestre de 200 bateras este dentro de errores estndar de la media de la poblacin, dentro del intervalo comprendido entre 34,586 y 37,414, tenemos un 90,7% de confianza de que este dentro del intervalo que va de 33,879 a 38,121 meses o dentro de errores estndar de la media de la poblacin.ESTIMACION DE INTERVALO DE INTERVALOS DE CONFIANZALa probabilidad que asociamos con una estimacin de intervalo se conoce como nivel de confianza esta probabilidad indica qu tanta confianza tenemos de que la estimacin de intervalo incluya al parmetro de poblacin. Una probabilidad ms alta implica una mayor confianza.El nivel de confianza se simboliza como (1-) x100%, en donde es la proporcin que se encuentra en los extremos de la distribucin que esta fuera del intervalo de confianza.El valor de Z elegido para construir el intervalo de confianza se lo conoce como el valor crtico de la distribucin. Cualquier aumento en el nivel de confianza se ogra ampliando simultneamente el intervalo de confianza obtenido, hacindolo menos preciso y menos til.El intervalo de confianza es el rango o alcance de la estimacin que estamos haciendo.Los lmites de confianza son los lmites superior e inferior del intervalo de confianza. +x es el LSC y -x es el LIC.A medida que se establece un intervalo de confianza cada vez ms estrecho, se determina un nivel de confianza cada vez ms bajo. Si el intervalo de confianza es muy reducido, la estimacin est asociada a n nivel de confianza tan bajo que cuestionamos su valor; sacrificamos confianza para ganar precisin.Los altos niveles de confianza producen intervalos ms amplios, de manera que sacrificamos precisin para ganar confianza.Supongamos que tenemos 95% de confianza de que se encuentre entre 30 y 32. Esta afirmacin no significa que se tiene 0,95 de probabilidad de que la media caiga dentro del intervalo establecido para la muestra. Ms bien, indica que si seleccionamos muchas muestras aleatorias del mismo tamao y calculamos un intervalo de confianza para cada na, entonces en alrededor del 95% de los casos la media de la poblacin caer dentro de dicho intervalo.LSC Lmite superior de confianza y LIC Lmite inferior de confianza

Es el valor de la tabla estandarizada normal, que tiene acumulado hasta ese valor de probabilidad. Este valor se denomina valor crtico de la distribucin. Los ms usuales:

(1-)Nivel de confianza

95%1,96

99%2,575

90%1,645

CLCULO DE ESTIMACIONES DE INTERVALO DE LA PROPORCION A PARTIR DE MUESTRAS GRANDESDistribucin en el muestreo de la proporcin: distribucin de probabilidades que puede asumir un estadstico muestral, calculados a partir de muestras del mismo tamao y extrados en forma aleatoria de la misma poblacin.Para las variables categricas, en las cuales se registra la posesin o no de una caracterstica, el parmetro poblacional de inters es la proporcin que indica qu proporcin de la poblacin posee tal caracterstica:

Para derivar la media y la desviacin estndar de la distribucin nominal:

N= nmero de ensayos o intentos P= probabilidad de tener xito Q= 1-p= probabilidad de fracasosTericamente, la distribucin binomial es la distribucin correcta a utilizar en la construccin de intervalos de confianza para estimar una proporcin de la poblacin.Debido a que el clculo de probabilidades binomiales puede ser largo, el uso de la misma para elaborar estimaciones de intervalo de la proporcin de una poblacin es una proposicin complicada. Conforme aumenta el tamao de la muestra, la distribucin binomial puede aproximarse a la normal apropiada, que podemos utilizar para aproximar la distribucin muestral. Los estadsticos recomiendan que en la estimacin, n sea lo suficientemente grande para que tanto np como nq sean al menos 5 cuando se usa la distribucin normal como sustituto de la distribucin binomial.Los lmites del intervalo sern:

Para un tamao dado, los intervalos de confianza para las proporciones a menudo parecen ser ms amplias que los correspondientes a variables continuas, esto se debe a que pueden aportar mayor informacin. En otras palabras, una variable categrica con solamente dos valores posibles es una medicin bastante general, en comparacin con una variable continua, de modo que cada observacin aporta solamente un poco de informacin acerca del parmetro que estamos estimando.

Error estndar de la proporcin:

Error estndar estimado de la proporcin:

ESTIMACIONES DE INTERVALOS CON LA DISTRIBUCION tEl uso de la distribucin t para hacer estimaciones se requiere siempre que el tamao de la muestra sea menor o igual a 30 no est muy sesgada y la desviacin estndar de la poblacin no se conozca. Adems, al utilizar la distribucin t suponemos que la distribucin poblacional es normal o aproximadamente normal.Fue estudiada por Gasset.CARACTERISTICAS DE LA DISTIBUCION tLa distribucin t y normal tienen relacin. Ambas son simtricas, acampanadas. En general, la distribucin t es ms plana que la distribucin normal y hay una distribucin t para cada tamao posible de muestra. Aun as, conforme el tamao de muestra o grados de libertad se hace ms grande, la forma de la distribucin t deja de ser plana y se aproxima ms a la normal. Esto se debe a que conforme aumenta el tamao de la muestra, la desviacin de la muestra se vuelve una mejor estimacin de la desviacin de la poblacin. Con un tamao de muestra aproximadamente 120 o mayor, S estima a , con suficiente precisin, de modo que existe poca diferencia entre las distribuciones t y Z. Por esta razn, cuando la muestra es mayor a 120 se utiliza la distribucin Z en lugar de la distribucin t.La distribucin t tiene ms rea en los extremos y menos en la parte central que en el caso de la distribucin normal.Una distribucin t es menor en la media y mayor en las colas que una distribucin normal.

GRADOS DE LIBERTADPodemos definirlos como el nmero de valores que podemos escoger libremente. Utilizaremos los grados de libertado cuando elijamos una distribucin t para estimar una media de poblacin, y utilizaremos n-1 grados de libertas, cuando n es igual al tamao de la muestra.La varianza es mayor a 1. Cuanto ms grados de libertad tenga, la varianza es ms cercana a 1 y ms se aproximan las distribuciones.La idea de grados de libertad remite a la cantidad de valores de una muestra que podra asumir cualquier calor. Cada restriccin impuesta en la observacin, hace perder un grado de libertad.USO DE LA TABLA DE DISTRIBUCION tDiferencias entre la tabla t y la tabla z: La tabla t es ms compacta y muestra reas y valores de t solo para algunos porcentajes (10, 5, 2 y 1%) La tabla z no se concentra en la probabilidad de que el parmetro de poblacin que se est estimando se encuentre dentro del intervalo de confianza. En lugar de ello, mide la probabilidad de que el parmetro de poblacin que estamos estimando no est dentro de nuestro intervalo de confianza, de que est afuera. En la tabla t debemos especificar los grados de libertad que se manejan.

ESTIMACION MEDIANTE EL MINIMO ESFUERZOImplica la seleccin de una muestra inicial y un posterior muestreo de la muestra inicial. Desarrollado por Efron, requieren el uso intensivo de la computadora.No requieren de conocimiento de los parmetros de la poblacin.Pasos a seguir:1. Seleccione una muestra aleatoria de tamao n sin reemplazo de un marco de poblacin de tamao N.2. Tome un ejemplo de la muestra inicial, seleccionando n observaciones con reemplazo.3. De esta segunda muestra calcule la media, la estadstica de inters.4. Repita los pasos 2 y 3 m veces diferentes. M suele ser entre 100 y 1000.5. Forme la distribucin de muestreo repetido de la estadstica de inters, utilizando un diagrama de tallo y hoja o una presentacin ordenada.6. Para formar el intervalo de confianza de mnimo esfuerzo utilice el valor que interseca al menor y al mayor valor de de la estadstica.

INTERVALO DE PREDICCION PARA UN VALOR INDIVIDUAL FUTUROEl intervalo de prediccin de n valor individual futuro est dado por:

DETERMINACION DEL TAMAO DE MUESTRA EN ESTIMACIONSe presentara cierto grado de error de muestreo por no estudiar la poblacin completa. Siempre que tomamos una muestra, perdemos algo de informacin til de la poblacin. Si queremos tener un alto nivel de precisin debemos muestrear la poblacin lo suficiente para asegurarnos que obtuvimos la informacin requerida. El error de muestreo se puede controlar si seleccionamos una muestra con el tamao adecuado. En general, cuanta ms precisin se requiera, ms grande ser el tamao necesario de la muestra. Tenemos que pensar en qu tanto error podeos aceptar y todava ser capaces de obtener conclusiones adecuadas sobre los datos.Incluso en los casos en que el nivel de confianza y el error de muestreo estn especificados, debemos tener disponible una estimacin de la desviacin estndar, la podemos desarrollar apropiadamente si tomamos en cuenta el alcance y la distribucin de la variable. ; ; Debe conocerse:1. Nivel de confianza Z2. Error de muestreo permitido, e. 100% - X% nivel de confianza = e3. Desviacin estndar, Al determinar el tamao de muestra cuando se estima la media, utilizamos la ecuacin del medio, en la que n es el tamao de la muestra sin considerar el factor de correccin de poblacin finita.La aplicacin del factor de correccin tiene como resultado el tamao de muestra real, n, calculado con la ecuacin:

La regla indica que se utilizara un valor de p=0,5 dado que es un criterio conservador, que dar un mayor valor e la varianza y tamao de la muestra.Para poblaciones finitas, se obtiene despejando n de la frmula del error, en el que se utilizara el factor de correccin.Determinar el tamao de la muestra nos asegura que el estimador se vuelve ms confiable con muestras grandesCUNDO APLICAR CADA ESTADSTICO? Para estimar el intervalo para la media poblacional, se aplica la distribucin normal, en caso de distribucin normal de la variable de estudio, o en su defecto si la muestra es superior a 30 casos. El uso de la distribucin t en la estimacin por intervalos de la media poblacional es un requisito cuando desconocemos la varianza poblacional, con distribucin de la variable en estudio normal si la muestra es menor a 30 casos, y es recomendable, en idnticas condiciones, aun cuando la muestra es mayor. Se usan todos los casos en que necesites estimar la varianza.

FUNDAMENTOS DE LA PRUEBA DE HIPOTESISLa prueba de hiptesis comienza con una suposicin llamada hiptesis, que hacemos acerca de un parmetro de poblacin. Empieza con algo de teora, afirmacin o asercin con respecto a un parmetro particular de una poblacin.Una hiptesis nula es siempre una de status quo o de no diferencia.Siempre que especifiquemos una hiptesis nula debemos especificar una hiptesis alternativa, o una que debe ser verdadera si se encuentra que la hiptesis nula es falsa.La hiptesis alternativa representa la conclusin a la que se llegara si hubiera suficiente evidencia de la informacin de la muestra para decidir que es improbable que la hiptesis nula sea verdadera y, por lo tanto, rechazarla.No rechazar la hiptesis nula no prueba que sea cierta; simplemente no nos proporciona evidencia estadstica para rechazarla. Siempre que afirmemos que aceptamos la hiptesis nula, en realidad lo que queremos decir es que no hay suficiente evidencia para rechazarla, porque estamos basando nuestra decisin nicamente en la informacin de la muestra, no en la poblacin entera. Si no rechazamos la hiptesis nula, lo nico que podemos decir es que la evidencia fue insuficiente para garantizar su rechazo. La hiptesis nula es la que se va a probar La hiptesis alternativa es contraria a la nula, representa la conclusin a la que se llegara si la hiptesis nula fuera rechazadaEn lo que se conoce como metodologa de prueba de hiptesis clsica: La H0 siempre se refiere a un valor especificado del parmetro de poblacin. El planteamiento de H0 contiene un signo de igualdad. El planteamiento de la H1 nunca contiene un signo de igualdad.Una vez definida la hiptesis, recolectamos datos de muestra, producimos estadsticas muestrales y usamos esta informacin para decidir qu tan probable es que nuestro parmetro de poblacin hipottico sea correcto. Digamos que suponemos un cierto valor para una media de poblacin. Para probar la validez de esa suposicin recolectamos datos de muestra y determinamos la diferencia entre el valor hipottico y el valor real de la media de la muestra. Despus juzgamos la diferencia obtenida, si es o no significativa. Mientras ms pequea sea la diferencia, mayor ser la probabilidad de que nuestro valor hipottico para la media sea correcto. Mientras mayor sea la diferencia, ms pequea ser la probabilidad.Nuestro estndar mnimo para una probabilidad, tambin es el riesgo que corremos de rechazar una hiptesis que es cierta. PRUEBA DE HIPOTESISEn una prueba de hiptesis, debemos establecer el valor supuesto o hipottico del parmetro de poblacin antes de comenzar a tomar la muestra. La suposicin que deseamos probar se conoce como hiptesis nula y se simboliza H0.Un valor hipottico de una media de poblacin seria: H0.Si los resultados de nuestra muestra no respaldan la hiptesis nula, debemos concluir que se cumple alguna otra cosa. Siempre que rechazamos la hiptesis, la conclusin que s aceptamos se llama hiptesis alternativa cuyo smbolo es H1.La distribucin de muestreo de la estadstica de prueba se divide en dos regiones: una regin de rechazo o crtica y una regin de no rechazo. Si la estadstica de prueba cae dentro de la regin de no rechazo, no se puede rechazar la hiptesis nula.La regin de rechazo puede considerarse como el conjunto de valores de la estadstica de prueba que no tienen posibilidad de presentarse si la hiptesis nula es verdadera. Por otro lado, estos valores no son tan improbables de presentarse si la H0 es falsa. En consecuencia, si observamos un valor de la estadstica de prueba que cae en esta regin critica, rechazamos la H0 porque el valor seria improbable si sta fuera verdadera.Con el fin de tomar una decisin con respecto a la H0, primero debemos determinar el valor crtico de la estadstica de prueba. El valor crtico separa las regiones de rechazo y no rechazo; depende del tamao de la primera, que est relacionada con el riesgo implicado en el uso de una sola evidencia de muestra para tomar decisiones con respecto a un parmetro de poblacin.ERRORES DE TIPO I Y IIRechazar una hiptesis nula cuando es cierta se denomina error tipo I o nivel de significacin y su probabilidad se simboliza con . Los investigadores han elegido niveles de alfa igual o menores a 5.Aceptar una hiptesis nula cuando es falsa se le llama error tipo II o riesgo , y su probabilidad se simboliza con . Se conoce tambin como nivel de riesgo del consumidor. Depende de la diferencia entre los valores supuesto y real del parmetro de poblacin.La probabilidad de cometer un tipo de error puede reducirse solo si estamos dispuestos a aumentar la probabilidad de cometer el otro tipo de error.Con el fin de obtener una baja, tendremos que tolerar una alta. Los tomadores de decisiones deciden el nivel de significancia adecuando examinando los costos o la penalizacin vinculados con ambos tipos de error.INTERPRETACIN DEL NIVEL DE SIGNIFICANCIA El propsito de la prueba de hiptesis no es cuestionar el valor calculado del estadstico de la muestra, sino hacer juicio respecto a la diferencia entre ese estadstico y un parmetro hipottico de la poblacin.Qu pasa si probamos una hiptesis con 5% de nivel de significancia? Esto quiere decir que rechazaremos la hiptesis nula si la diferencia entre el estadstico y el parmetro hipottico de la poblacin es tan grande que esta u otra diferencia mayor ocurrir, en promedio, solo cinco o menos veces en cada 100 muestras, cuando el parmetro hipottico de la poblacin es correcto. Si suponemos que la hiptesis es correcta, entonces el nivel de significancia indicara el porcentaje de medias muestrales que esta fuera de ciertos lmites. El nivel de confianza indicaba el porcentaje de medias muestrales que caan dentro de los lmites de confianza obtenidos.SELECCIN DE UN NIVEL DE SIGNIFICANCIACuanto ms alto sea el nivel de significancia que utilizamos para probar una hiptesis, mayor ser la probabilidad de rechazar la hiptesis nula cuando es cierta.Cuanto ms alto sea el nivel de significancia, el rea de no rechazo ser ms pequea, por lo que rara vez se rechaza una hiptesis cierta.MEDICION DE LA POTENCIA DE UNA PRUEBA DE HIPOTESISPor cada valor de para el que la hiptesis alternativa es cierta hay una probabilidad diferente, , de aceptar incorrectamente una hiptesis nula. Claro que desearamos que esta fuera lo ms pequea posible o, de manera equivalente, nos gustara que 1- fuera lo ms grande posible.Puesto que rechazar una hiptesis nula cuando es falsa es justo lo que debe hacer una buena prueba, un valor alto de 1- (algo cerca de 1.0) significa que la prueba trabaja bastante bien (rechaza la hiptesis nula cuando es falsa); un valor bajo de 1- (cerca de 0.0) significa que la prueba trabaja muy mal (no rechaza la hiptesis cuando es falsa). Como el valor de 1- es la medida de qu tan bien trabaja la prueba, recibe el nombre de potencia de prueba.Es decir, es la probabilidad de rechazar H0 cuando sta es falsa y debe ser rechazada.COEFICIENTE DE CONFIANZAEst representado por 1-, es la probabilidad de que H0 no sea rechazada cuando de hecho es verdadera y debera ser aceptada.Representa la probabilidad de llegar a la conclusin de que el valor especificado del parmetro que se est probando con la H0 pueda ser plausible.RIESGOS EN LA TOMA DE DECISIONESDependiendo de la decisin especifico, uno de dos clases de error se puede cometer, o se puede llegar a una de dos conclusiones correctas.Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un estudio, consiste en aumentar el tamao de la muestra. Para un nivel dado de , aumentar el tamao de la muestra disminuir y aumentara la potencia de la prueba para detectar si a H0 es falsa.SITUACION

Decisin estadsticaH0 verdaderaH0 falsa

No rechazar H0Confianza ( 1-)Error tipo II

Rechazar H0Error tipo IPotencia (1-)

Podemos determinar el efecto de a potencia sobre la prueba si variamos, uno a la vez: El tipo de prueba estadstica: de uno o dos extremos: Una prueba de un extremo es ms poderosa que una de dos extremos, y se debera utilizar siempre que sea adecuado especificar la direccin de la H1. El nivel de significacin: Puesto que la probabilidad de cometer un error de tipo I y la del II tienen una relacin inversa, y esta ltima es el complemento de la potencia de prueba, entonces alfa y la potencia de prueba varan en proporcin directa. Un aumento en el valor de significancia escogido tendra como resultado un aumento en la potencia de la prueba; una disminucin en alfa tendra como resultado una disminucin en la potencia. El tamao de la muestra: Un aumento en el tamao de la muestra escogida tendra como resultado un aumento en la potencia de la prueba; una disminucin en el tamao de la muestra seleccionada tendra como resultado una disminucin en la prueba.DETERMINACION DEL TAMAO DE MUESTRA BASANDOSE EN Y Suponiendo que se trata de una prueba de un extremo:

DECISION DE QU TIPO DE DISTRIBUCION USAR EN LA PRUEBA DE HIPOTESISCondiciones para usar las distribuciones normal y t en la prueba de hiptesis sobre mediasSe conoce No se conoce

30 < nNormal, zNormal, z

30 > o = nNormal, zDistribucin t

Otra regla que debe cumplirse al probar el valor hipottico de una media. Al igual que en la estimacin, utilice el multiplicador de poblacin finita siempre que la poblacin sea finita en tamao, el muestreo se haga sin reemplazo y la muestra sea de ms del 5% de la poblacin.PRUEBAS DE HIPOTESIS DE DOS COLAS Y DE UNA COLAUna prueba de dos colas rechaza la hiptesis nula si la media de muestra es significativamente mayor o menor que la media hipottica de la poblacin. Por lo tanto, en una prueba de dos colas, existen dos regiones de rechazo.Una prueba de dos colas es apropiada cuando la hiptesis nula es = H0 y la hiptesis alternativa es H0. En este caso, la evidencia muestral con la media de la muestra significativamente menor que la media hipottica de la poblacin es la que nos lleva a rechazar la hiptesis nula en favor de la hiptesis alternativa. Dicho de otro modo, la regin de rechazo est en la cola inferior de la distribucin de la media muestral, y esa es la razn por la que la llamamos prueba de cola inferior.Otro tipo de prueba de una cola es una prueba de cola derecho o superior. Una prueba de cola superior se utiliza cuando las hiptesis son H0: = H0 y H1: > H0. Solo los valores de la media de la muestra que son significativamente mayores que la media hipottica de la poblacin harn que rechacemos la hiptesis nula en favor de la hiptesis alternativa.

VALOR P PARA LA PRUEBA DE HIPOTESISEl valor p es la probabilidad de obtener una estadstica de prueba igual o ms exacta que el resultado obtenido a partir de los datos de la muestra, dado que la H0 es realmente verdadera.Al valor p se o conoce como el nivel de significacin observado, que es el mnimo nivel al cual H0 puede ser rechazada para un conjunto de datos.

PRUEBAS DE UNA MUESTRA CON DATOS NUMRICOSELECCION DEL PROCEDIMIENTO DE PRUEBA APROPIADAPROCEDIMIENTOS PARAMTRICOSLos procedimientos de prueba paramtricos pueden definirse como aquellos que:1) Requieren que el nivel de medicin obtenido con los datos recolectados este en forma de escala de intervalo o de una escala de cociente2) Implican la prueba de hiptesis de valores de parmetro especificados3) Requieren un conjunto limitante de suposicionesSin embargo, podemos decidir qu tipos de procedimientos escoger si: Las mediciones obtenidas con los datos son solamente categricas, es decir, estn escaladas nominalmente; o en rangos, escaladas ordinalmente. Las suposiciones subyacentes en el uso de los mtodos paramtricos pueden no cumplirse. La situacin requiere el estudio de caractersticas tales como aleatorizacin, independencia, simetra o bondad de ajuste en lugar de la prueba de hiptesis con respecto a valores especficos de parmetros de poblacin en particular.PROCEDIMIENTOS SIN DISTRIBUCION Y NO PARAMETRICOSLos procedimientos de prueba sin distribucin pueden definirse ampliamente como:1. Aquellos cuya estadstica de prueba no depende de la forma de la distribucin de la poblacin subyacente de la cual se tom la muestra de datos2. Aquellos para los cuales los datos no tienen fuerza suficiente para garantizar operaciones aritmticas significativas, estn escalados nominal u ordinalmente.Los procedimientos no paramtricos pueden definirse como aquellos que no tienen que ver con los parmetros de una poblacin.Principales ventajas del uso de estos dos procedimientos: Pueden utilizarse en todo tipo de datos: categricos, de rangos datos medidos con ms precisin. Son fciles de aplicar y rpidos de calcular cuando los tamaos de muestra son pequeos. Implican un menor nmero de suposiciones menos limitantes que los mtodos paramtricos. En consecuencia, tienen una mayor aplicabilidad y producen un conjunto de conclusiones ms general y con una base amplia. Los mtodos no paramtricos permiten la resolucin de problemas que no implican la prueba de parmetros de la poblacin. Dependiendo del procedimiento particular elegido, los mtodos sin distribucin pueden ser igualmente o casi, poderosos que el procedimiento paramtrico correspondiente cuando las suposiciones del ltimo se cumplen, y cuando no se cumplen pueden ser bastante ms poderosos.Principales desventajas: Utilizar mtodos libres de distribucin cuando se pueden cumplir todas las suposiciones de procedimiento paramtrico. Conforme aumenta el tamao de la muestra, la manipulacin de datos requerida para efectuar o procedimientos sin distribucin y los no paramtricos es laboriosa. Con frecuencia se necesitan tablas especiales de valores crticos y no es tan fcil disponer de ellas.IMPORTANCIA DE LAS SUPOSICIONES EN LA SELECCIN DE LA PRUEBASe dice que algunos procedimientos de prueba paramtricos son robustos porque son relativamente insensibles a ligeras violaciones en las suposiciones. Sin embargo, cuando las violaciones son grandes, y 1- reales pueden diferir enormemente de lo que se espera. En esos casos, una prueba paramtrica no es vlida y debera seleccionarse un procedimiento sin distribucin.No es ventajoso utilizar un procedimiento libre de distribucin cuando todas las suposiciones de la correspondiente prueba paramtrica pueden lograrse.PRUEBAS DE HIPOTESIS DE MEDIAS CUANDO SE CONOCE LA DE LA POBLACIONPRUEBA DE HIPOTESIS USANDO LA ESCALA ESTANDARIZADAHay dos escalas de medicin, la escala original o sin procesar y la escala estandarizada. Como estos dos nmeros se dan en dos escalas distintas, no podemos compararlos directamente cuando probamos nuestras hiptesis. Debemos convertir uno de ellos a la escala del otro. Hicimos nuestra prueba de hiptesis en la escala original al convertir los valores z crticos a los valores crticos de en la escala original.En lugar de convertir los valores crticos z a la escala original, para obtener nmeros directamente comparables con el valor observado de , podramos haber convertido nuestro valor observado de estandarizada:

Los dos mtodos siempre llevaran a las mismas conclusiones, utilizaremos el que nos resulte ms cmodo.EL PROCESO DE CINCO PASOS PARA LA PRUEBA DE HIPOTESIS UTILIZANDO LA ESCALA ESTANDARIZADA1) Decida si esta es una prueba de dos colas o una. Establezca su hiptesis. Seleccione un nivel de significancia apropiado para esta decisin.2) Decida qu distribucin, z o t, es adecuada y encuentro valores crticos para el nivel de significancia elegido en la tabla adecuada.3) Calcule el error estndar del estadstico muestral. Use el error estndar para convertir el valor observado del estadstico en un valor estandarizado.4) Bosqueje la distribucin y marque la posicin del valor de la muestra estandarizado y del valor crtico para la prueba.5) Compre el valor del estadstico muestral estandarizado con los valores crticos para esta prueba e interprete el resultado.PRUEBA DE HIPOTESIS PARA PROPORCIONES: MUESTRAS GRANDESPRUEBA DE UNA O DOS COLAS PARA PROPORCIONES1. Establezca sus hiptesis, tipo de prueba y nivel de significancia2. Elija la distribucin apropiada y encuentre el valor critico3. Calcule el error estndar y estandarice el estadstico de la muestra

4. Bosqueje la distribucin y seale el valor de la muestra y los valores crticos5. Interprete el resultado.PRUEBA DE HIPOTESIS DE MEDIAS CUANDO NO SE CONOCE LA DE LA POBLACIONPRUEBA DE UNA O DOS COLAS PARA MEDIAS USANDO LA DISTRIBUCION tComo nuestra prueba de hiptesis se basa en la distribucin t, usamos t para denotar el estadstico estandarizado:

Si utilizamos la distribucin t para una prueba de una cola, necesitamos determinar el rea localizada solo en una de ellas.La prueba t est considerada como un procedimiento paramtrico clsico. Como tal, requiere de un cierto nmero de suposiciones limitantes que deben cumplirse si queremos estar seguros de que los resultados obtenidos al emplear la prueba son vlidos. En particular, para utilizar la prueba t de una muestra se supone que los datos numricos son tomados de manera independiente y representan una muestra aleatoria de la poblacin que est distribuida normalmente.PRUEBA DE HIPOTESIS: PRUEBAS DE DOS MUESTRASPRUEBA DE HIPOTESIS PARA DIFERENCIAS ENTRE MEDIAS Y PROPORCIONESDISTRIBUCION DE MUESTREO PARA LA DIFERENCIA ENTRE DOS PARAMETROS DE POBLACIONLa distribucin de muestreo que nos interesa es la distribucin muestral de la diferencia entre medias muestrales.La media de la distribucin muestral es la diferencia entre las medias muestrales se representan por y es igual a . Si ambas son iguales, su diferencia ser 0.La desviacin estndar de las diferencias entre las medias de la muestra se conoce como el error estndar de la diferencia entre dos medias y se calcula con la siguiente formula:

Si no conocemos las dos desviaciones de la poblacin, podemos estimar el error estndar de la diferencia entre dos medias utilizando .PRUEBAS PARA DIFERENCIAS ENTRE MEDIAS: Suponemos que estamos tomando las muestras de poblaciones distribuidas normalmente que tienen la misma varianza.En situaciones en las que no podemos hacer la suposicin de que las dos poblaciones realmente estn distribuidas normalmente, la prueba t de varianza conjunta es robusta, es decir que no es sensible con respecto a violaciones moderadas de la suposicin, siempre y cuando el tamao de muestras sea grande. En tales situaciones, la prueba t de varianza conjunta puede utilizarse sin que se vea seriamente afectada en su potencia.Si el tamao de las muestras es pequeo y no podemos suponer que los datos fueron tomados de poblaciones distribuidas normalmente: se puede realizar alguna transformacin normalizante y luego utilizar la prueba de t de varianza conjunta; o seguir un procedimiento de libre distribucin, como la prueba de suma de rangos de Wilcoxon, que no dependen de la suposicin de normalidad de las dos poblaciones.En situaciones en las que no podemos o no deseamos hacer la suposicin de que las dos poblaciones estn distribuidas normalmente, de las cuales se tomaron las muestras que tienen igual varianza, se dice que tiene un problema de Behrens Fisher, y se puede utilizar la prueba t de varianza separada, desarrollada por Satterwaite.MUESTRAS GRANDESCuando ambos tamaos de muestra son mayores que 30, estandarizamos la diferencia de las medias entre las muestras. Primero calculamos la diferencia hipottica de las medias de las poblaciones y luego dividimos entre el error estndar estimado de la diferencia entre las medias muestrales.

MUESTRAS PEQUEASNuestra primera tarea al efectuar la prueba consiste en calcular el error estndar de la diferencia entre las dos medias. Como no se conocen las desviaciones estndar de las poblaciones, utilizaremos la .La estimacin conjunta de 2:

Como tenemos que usar las varianzas de la muestra para estimar el valor desconocido de 2, la prueba estar basada en la distribucin t. Este caso es igual a probar una sola media de tamao n, cuando no conocemos el valor de 2. Ah utilizamos una distribucin t con n-1 grados de libertad, debido a que una vez que conocemos la media de la muestra solo n-1 observaciones se pueden especificar libremente.En el paso 3, clculo del error estndar estimado de la diferencia entre dos medias muestrales, con muestras pequeas y varianzas de poblaciones iguales tenemos:

PRUEBA DE DIFERENCIAS ENTRE MEDIAS CON MUESTRAS DEPENDIENTESEl uso de muestras dependientes o apareadas permite llevar a cabo un anlisis ms preciso, porque permite controlar factores externos. Con muestras dependientes, todava se sigue el procedimiento bsico adoptado en todas las pruebas de hiptesis. Las nicas diferencias consisten en que se emplea una formula distinta para el error estndar estimado de las diferencias muestrales y que es necesario que ambas muestras sean del mismo tamao.Con muestras independientes, la hiptesis nula no puede ser rechazada.PRUEBAS PARA DIFERENCIAS ENTRE PROPORCIONES: MUESTRAS GRANDESPRUEBAS DE DOS COLAS PARA DIFERENCIAS ENTRE PROPORCIONESEl error estndar de la diferencia entre dos proporciones:

Si establecemos la hiptesis de que no hay diferencia entre las dos proporciones de la poblacin, entonces la mejor estimacin de la proporcin global de xitos en la poblacin es, tal vez, la proporcin combinada de xitos en ambas muestras, esto es:

Y en el caso de los dos compuestos:

Estandarizamos la diferencia entre as dos proporciones de la muestra observada, dividimos entre el error estimado de la diferencia entre dos proporciones:

VALOR P: OTRA MANERA DE VER LAS PRUEBAS DE HIPOTESISCuando probamos las hiptesis, tomamos una muestra, calculamos la media y rechazamos la hiptesis nula si la media de la muestra se aleja de la poblacional, que la probabilidad de encontrar una gran diferencia entre ambas es menor que 0,05. En otras palabras, antes de tomar la muestra especificamos qu tan improbables debern ser los resultados observados para que rechacemos la hiptesis nula. Existe otra forma de enfocar la decisin de aceptar o rechazar la hiptesis nula que no requiere especificar el nivel de significancia antes de tomar la muestra. VALORES P PARA OTRAS CONDICIONES1. Si fuera conocida y estuviramos realizando una prueba de una cola, habramos calculado el valor P exactamente de la misma manera, con la excepcin de que no multiplicaramos por dos la probabilidad obtenida en la tabla de distribucin normal, porque esa tabla da las probabilidades de una cola directamente.2. Si no se conociera , habramos utilizado la distribucin t con n-1 grados de libertad y la tabla de distribucin de t de Student. Esta tabla nos da las probabilidades de dos colas, pero solo unas cuantas, de modo que no podemos obtener valores p exactos.3. PRUEBA DE HIPOTESIS X2 PARA LA VARIANZA O DESVIACION ESTANDARLas pruebas de ji cuadrada nos permiten hacer mucho ms que probar la igualdad de varianzas de proporcin.

Una distribucin chi cuadrada es una distribucin sesgada cuya forma depende exclusivamente de los grados de libertad; a medida que aumenta, la distribucin se vuelve ms simtrica.Debemos tener cuidado al probar una hiptesis con respecto a una varianza o desviacin estndar de la poblamos, tenemos que ser conscientes de que hemos supuesto que los datos de la poblacin estn distribuidos normalmente. Esta prueba es bastante sensible a los alejamientos de tal suposicin, es decir que no es una prueba robusta, de tal modo que si la poblacin no est distribuida normalmente, en especial para tamaos pequeos de muestra, la precisin de la prueba puede verse seriamente afectada.PRUEBA DE HIPOTESIS DE RANGOS CON SIGNO WILCOXON PARA LA MEDIANALa prueba de rangos con signo de Wilcoxon puede utilizarse cuando deseamos probar una hiptesis con respecto a la mediana de la poblacin, Mx. este procedimiento libre de distribucin, que no implica ninguna suposicin acerca de la forma especfica de la distribucin de poblacin subyacente, excepto que sea aproximadamente simtrica.Es ms probable que el procedimiento de Wilcoxon, que hace pocas suposiciones menos limitantes que la prueba t, sea ms poderoso para detectar la existencia de diferencias significativas que su correspondiente contraparte paramtrica.Las suposiciones necesarias para llevar a cabo la prueba de rangos con signo de Wilcoxon son:1. Que los datos observados constituyan una muestra aleatoria de n valores independientes de una poblacin con una mediana desconocida.2. Que el fenmeno aleatorio subyacente de inters sea continuo.3. Que los datos observados sean medidos a un nivel ms alto que la escala ordinal4. Que la poblacin subyacente sea aproximadamente simtricaNo todas las distribuciones simtricas tienen forma de campana, aunque todas las distribuciones normales son simtricas y tienen forma de campana.Para llevar a cabo la prueba se deben seguir seis pasos:1) Obtenemos un conjunto de resultados de diferencia Di entre cada uno de los valores observados y el valor especificado de la mediana supuesta: , donde i=1, 2, 32) Obtenemos un conjunto de n diferencias absolutas: |Di|3) Omitimos cualquier diferencia cuyo resultado es 0.4) Luego asignamos rangos, , de 1 a n a cada una de las diferencias absolutas, de modo tal que la ms pequea obtenga el rango 1 y la mayor el rango n. Debido a una falta de precisin en el proceso de medicin, si dos o ms de las |D| son iguales, a cada una se le asigna un rango promedio de los rangos que tendran asignaos de manera individual.5) Reasignamos los signos + y a cada uno de los n rangos, dependiendo d si la diferencia era originalmente positiva o negativa.6) La prueba de Wilcoxon, W, se obtiene de a suma de los rangos positivos:

La prueba estadstica de prueba W est distribuida de manera aproximadamente normal, y puede utilizarse la siguiente formula de aproximacin de muestra grande para probar la H0:

Entonces:

PRUEBA DE CORRIDAS DE UNA MUESTRA DE WALD-WOLFWITZSe supone que todos los datos recolectados en un estudio constituyen una muestra aleatoria, de modo que cada observacin o medida es tomada de la poblacin de manera aleatoria e independiente. Tal suposicin puede ser probada mediante el empleo de un procedimiento no paramtrico conocido como pruebas de corridas de una muestra de Wald-Wolfwitz para aleatoriedad.Para probar la aleatoriedad: H0: el proceso que genera el conjunto de datos numricos es aleatorio H1: el proceso que genera el conjunto de datos numricos no es aleatorioLa hiptesis nula de aleatoriedad puede probarse mediante la observacin del orden o secuencia e que se obtienen los elementos de la muestra. Si a cada elemento se le asigna uno de dos trminos, como E y F (xito y fracaso), dependiendo de si la medida cae por arriba o por debajo de un cierto valor, la aleatoriedad de la secuencia puede ser investigada. Si esta es generada de manera aleatoria, el valor E o F de un elemento ser independiente tanto de su posicin en la secuencia como del valor de los elementos que le preceden.Por otra parte, si el valor de un elemento de la secuencia es afectado por los valores de los dems elementos, o si la probabilidad de su ocurrencia depende de su posicin en la secuencia, el proceso que la genera no es considerado aleatorio. En los casos no aleatorios, los elementos parecidos tendern a agruparse o se mezclaran de manera alternada, de modo que se presentara algn efecto peridico sistemtico.Para estudiar si una secuencia observada es aleatoria o no, consideraremos como estadstica de prueba el nmero de corridas presentes en los datos.Una corrida se define como una serie de elementos similares que estn limitados por elementos de un tipo diferente o por el inicio o el final de la secuencia.Al probar la aleatoriedad, lo esencial es el ordenamiento o la colocacin de los elementos de la secuencia, no nada ms la frecuencia de los elementos de cada tipo.En caso de querer comprobar la aleatoriedad utilizaremos una prueba de dos colas.Si estamos interesados en probar la aleatoriedad contra una alternativa especfica utilizaremos una prueba de una cola: Izquierda U menor o igual al valor crtico: efecto de tendencia, hay tendencia de agrupamiento de los elementos parecidos. Derecha U mayor al valor crtico: efecto sistemtico o peridico, se presentan demasiadas corridas.La frmula de clculo:

JI CUADRADA COMO PRUEBA DE INDEPENDENCIALa prueba de independencia permite establecer si existe o no relacin entre variables categricas, cuando cada una de las cuales posee dos o mas categoras.La prueba ji-cuadrada es una prueba de carcter general que se utiliza cuando se desea determinar si las frecuencias absolutas obtenidas en la observacin difieren significativamente o no de las que se esperaran bajo cierta hiptesis planteada de interrelacion de las categoras de las variables consideradas.En las pruebas de ji-cuadrada de independencia, siempre se coloca el riesgo de no aceptar la hiptesis nula siendo sta cierta en el extremo superior de valores de la distribucin.

Tablas de contingenciaDescribiremos las dimensiones de una tabla de contingencia estableciendo primero el nmero de renglones y luego el nmero de columnas. El total no cuenta como parte de las dimensiones.Frecuencias observadas

Pn es la proporcin del noreste que prefieren el plan actual Ps sureste que prefieren plan actualPc proporcin centralPw proporcin oesteFrecuencia real:NSCWTOTAL

N ACTUAL68755779279

N NUEVO32453331141

TOTAL10012090110420

Frecuencia esperada:NSCWTOTAL

N ACTUAL66,4379,7259,7973,07-

N NUEVO33,5740,2830,2136,93-

TOTAL-----

Podemos combinar las muestras: Prefieren actual:

Prefieren lo nuevo: El estadstico ji-cuadrada

En el ejemplo es igual a 2,7638.Si este valor fuera muy grande, indicara una diferencia sustantiva entre los valores esperados los observados. Una ji-cuadrada igual a cero indica que las frecuencias son exactamente iguales. Nunca puede ser negativo porque las frecuencias estn elevadas al cuadrado.Para probar la hiptesis nula, debemos comparar las frecuencias que se observaron con las que esperaramos si la hiptesis nula fuera verdadera. Si el conjunto de ambas frecuencias son casi iguales, podemos razonar de manera intuitiva que la hiptesis nula se acepta. Si existe una diferencia grande entre estas frecuencias, podemos rechazar la hipotesis nula intuitivamente y concluir que existen diferencias significativas en las proporciones.La distribucin de ji-cuadradaPara un numero pequeo de grados de libertad (gl), la distribucin ji-cuadrada estar seriamente sesgada a la derecha. Conforme aumentan los gl, la curva de hace cada vez mas simtrica hasta que el numero de grados alcanza valores grandes, en cuyo caso puede aproximarse con la normal.

Determinacin de los gl

Tabla de cotingencia con mas de dos renglones

: frecuencia esperada en una celda dadaRT: total por rengln, para el que contiene esa celdaCT: total por columna, para la que contiene esa celdaN: numero total de observacionesPrecauciones al usar ji-cuadradaUsar tamaos de muestras grandes. Para evitar incurrir en inferencias incorrectas de la prueba de hiptesis ji-cuadrada, siga la regla general de que una frecuencia esperada de menos de 5 en una celda de una tabla de contingencia es muy pequea para utilizarla.Utilizar con cuidado los datos recolectados. Si el valor de ji-cuadrada fuera cero, tendramos que ser cuidadosos al preguntar si existe absolutamente ninguna diferencia entre las frecuencias esperadas y las observadas.PRUEBA DE BONDAD DE AJUSTE: PRUEBA DE LO APROPIADO DE UNA DISTRIBUCIONLa prueba ji-cuadrada puede utilizarse tambin para decidir si una distribucin de probabilidad en particular, como la binomial, la de Poisson o la normal, es la apropiada. La prueba de ji-cuadrada nos permite probar si hay una diferencia significativa entre una distribucin de frecuencias observadas y una distribucin de frecuencias tericas. De esta forma, podemos determinar si debemos creer que los datos observados constituyen una muestra obtenida de la distribucin teorica hipottica.La prueba de bondad sirve para determinar si una poblacin tiene una distribucin teorica especifica, ya sea una distribucin conocida o una distribucin ad hoc.La prueba se basa en que tan buen ajuste o concordancia tiene entre las frecuencias de ocurrencia de las observaciones de una muestra observada y las frecuencias esperadas que se obtienen a partir de una distribucin hipottica.La hiotesis nula ser que la variable tiene la distribucin supuesta y la hiptesis alternativa esta dada por que la variable no sigue la distribucin supuesta.En las pruebas de ji-cuadrada de bondad de ajuste, siempre se coloca el riesgo de no aceptar la hiptesis nula siendo sta cierta en el extremo superior de valores de la distribucin.

Calculo de las frecuencias observadas y esperadas. Calculo de ji-cuadrada Ho: P=40 es buena H1: P=40 no es buena Distribucin binomial 0,20=CALIFICACIONES POSITIVASPROBABILIDAD RESULTADOS POSIBLESN CANDIDATOS

ENTREVISTA 0140,216X100=21,6

ENTREVISTA 1470,432X100=43,2

ENTREVISTA 2240,288X100=28,8

ENTREVISTA 3110,064X100=6,4

21,6-3,612,960,6

43,23,814,440,3343

28,8-4,823,040,8

6,44,621,263,3063

Determinacin de los gl de una prueba de bondad de ajusteAntes de calcular el nmero adecuado de gl para una prueba de ji-cuadrada de bondad de ajuste, es necesario contar el nmero de clases, denotado por k, para las que se compararon las frecuencias esperadas y observadas. Podemos vernos forzados a imponer restricciones adicionales en el clculo de gl.Primero aplicamos la regla: (k-1) y luego restamos 1 gl adicional por cada parmetro de poblacin que se debe estimar a partir de los datos de la muestra.Tenemos 6 clases: 0, 1 , 2 , 3, 4, 5 k-1=6-1=5.Si tenemos que usar la media de la muestra como estimacin de la poblacional, tendremos que restar otro gl, por lo que nos quedaran 4 gl. Ejemplo con distribucin de PoissonHo: N de defectos con distribucin de Poisson.H1: N no tiene distribucin de Poisson.Gl=3 ; =0,05 Valor critico de X2= 7,83 N7,38 Rechaza HoCalculamos la probabilidad de ocurrencia para obtener la frecuencia esperada: ;

DEFECTOSP(x)N TOTAL

00,52205X43=2,44815

10,33933X43=14,59119

20,10519X43=4,52317

3+0,03343x43=1,43749

DEFECTOS

02,4481525-2,551858,5911938420,29008798

114,59119104,5911921,07902561,444464061

24,523176-1,476832,181026850,48218989

3+1,437492-0,562510,31641750,22011805

TOTAL4343--2,43703653

Uso de la prueba de ji-cuadrada de bondad de ajusteBuscamos en la tabla para =0,2 y gl=5 4,642La regin que se encuentra a la derecha del valor ji-cuadrada 4,642 contiene 0,2 del rea bajo la curva.

Me uede en 13.4 lo que sigue y cap 13. 5 es del modulo 3

PRUEBA T DE VARIANZA SEPARADA PARA DIFERENCIAS ENTRE DOS MEDIASLa estadstica de prueba t de varianzas independientes puede ser aproximada por una distribucion t con los grados de libertad, v, tomados como la parte entera del calculo:

Estadstica 2| 23