UNIDAD IV PRUEBAS DE HIPOTESIS CON DOS MUESTRAS Y VARIAS MUESTRAS DE DATOS NUMÉRICOS

ESTADISTICA INFERENCIAL 1 MUESTRAS DE DATOS NUMRICOS

UNIDAD 4: PRUEBAS DE HIPOTESIS CON DOS MUESTRAS Y VARIAS

4.1 INTRODUCCIN PRUEBAS DE HIPTESIS Introduccin: Prueba de hiptesis En esta unidad nos concentraremos en la prueba de hiptesis, otro aspecto de la inferencia estadstica que al igual que la estimacin del intervalo de confianza, se basa en la informacin de la muestra. Se desarrolla una metodologa paso a paso que le permita hacer inferencias sobre un parmetro poblacional mediante el anlisis diferencial entre los resultados observados (estadstico de la muestra) y los resultados de la muestra esperados si la hiptesis subyacente es realmente cierta. En el problema de estimacin se trata de elegir el valor de un parmetro de la poblacin, mientras que en las pruebas de hiptesis se trata de decidir entre aceptar o rechazar un valor especificado (por ejemplo, si el nivel de centramiento de un proceso es o no lo es). Prueba de hiptesis: Estadsticamente una prueba de hiptesis es cualquier afirmacin acerca de una poblacin y/o sus parmetros. Una prueba de hiptesis consiste en contrastar dos hiptesis estadsticas. Tal contraste involucra la toma de decisin acerca de las hiptesis. La decisin consiste en rechazar o no una hiptesis en favor de la otra. Una hiptesis estadstica se denota por H y son dos: - Ho: hiptesis nula - H1: hiptesis alternativa Partes de una hiptesis 1-La hiptesis nula Ho 2-La hiptesis alternativa H1 3-El estadstico de prueba 4-Errores tipo I y II 5La regin de rechazo (crtica) 6-La toma de decisin 1. Concepto: Una prueba de hiptesis estadstica es una conjetura de una o ms poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a no ser que se examine la poblacin entera. Esto por su puesto sera imprctico en la mayora de las situaciones. En su lugar, se toma una muestra aleatoria de la poblacin de inters y se utilizan los datos que contiene tal muestra para proporcionar evidencia que confirme o no la hiptesis. La evidencia de la muestra que es un constante con la hiptesis planteada conduce a un rechazo de la misma mientras que la evidencia que apoya la hiptesis conduce a su aceptacin. Definicin de prueba de hiptesis estadstica es que cuantifica el proceso de toma de decisiones. Por cada tipo de prueba de hiptesis se puede calcular una prueba estadstica apropiada. Esta prueba estadstica mide el acercamiento del calor de la muestra (como un promedio) a la hiptesis nula. La prueba estadstica, sigue una distribucin estadstica bien conocida (normal, etc.) o se puede desarrollar una distribucin para la prueba estadstica particular. La distribucin apropiada de la prueba estadstica se divide en dos regiones: una regin de rechazo y una de no rechazo. Si la prueba estadstica cae en esta ltima regin no se puede rechazar la hiptesis nula y se llega a la conclusin de que el proceso funciona correctamente. Al tomar la decisin con respecto a la hiptesis nula, se debe determinar el valor crtico en la distribucin estadstica que divide la regin del rechazo (en la cual la hiptesis nula no se puede rechazar) de la regin de rechazo. A hora bien el valor crtico depende del tamao de la regin de rechazo.

4.2 DISTRIBUCIN NORMAL Y DISTRIBUCIN T DE STUDENT

TRABAJO EN EQUIPO



En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece en fenmenos reales. La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro. Esta curva se conoce como campana de Gauss. La importancia de esta distribucin radica en que permite modelar numerosos fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observacin se obtiene como la suma de unas pocas causas independientes. De hecho, la estadstica es un modelo matemtico que slo permite describir un fenmeno, sin explicacin alguna. Para la explicacin causal es preciso el diseo experimental, de ah que al uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional. La distribucin normal tambin es importante por su relacin con la estimacin por mnimos cuadrados, uno de los mtodos de estimacin ms simples y antiguos. La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo, la distribucin muestral de las medias mustrales es aproximadamente normal, cuando la distribucin de la poblacin de la cual se extrae la muestra no es normal.[1] Adems, la distribucin normal maximiza la entropa entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la eleccin natural de la distribucin subyacente a una lista de datos resumidos en trminos de media muestral y varianza. La distribucin normal es la ms extendida en estadstica y muchos tests estadsticos estn basados en una supuesta "normalidad". En probabilidad y estadstica, la distribucin t (de Student) es una distribucin de probabilidad que surge del problema de estimar la media de una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo. Aparece de manera natural al realizar la prueba t de Student para la determinacin de las diferencias entre dos medias muestrales y para la construccin del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser estimada a partir de los datos de una muestra. La distribucin t de Student es la distribucin de probabilidad del cociente

Donde Z tiene una distribucin normal de media nula y varianza 1 V tiene una distribucin chi-cuadrado con grados de libertad Z y V son independientes

TRABAJO EN EQUIPO



Si es una constante no nula, el cociente es una variable aleatoria que sigue la distribucin t de Student no central con parmetro de no-centralidad . 4.3 PRUEBAS DE SIGNIFICANCIA Las pruebas de significancia estadstica son un procedimiento que brinda un criterio objetivo para calificar las diferencias que se presentan al comparar los resultados de dos muestras, con el objetivo de explicar si dichas diferencias se mantienen dentro de los lmites previstos por el diseo estadstico (un error y una confianza esperados) o si, por el contrario, la diferencia entre ellas resulta lo suficientemente grande como para inferir que ha ocurrido un cambio real en el indicador 4.4 COMPARACIN DE DOS MUESTRAS INDEPENDIENTES: PRUEBAS T PARA LAS DIFERENCIAS ENTRE NORMALES. Para comparar las medias de dos muestras aleatorias procedentes de dos poblaciones normales e independientes, se utiliza el procedimiento Prueba T para muestras independientes, y para ello, se selecciona:

A continuacin se abre una ventana con los siguientes campos: Contrastar variables: donde se han de introducir las variables que se van a analizar, es decir, aquellas variables sobre las que se va a contrastar si hay o no, diferencias de grupos. Variable de agrupacin: aqu se debe introducir la variable que se utiliza para definir los grupos de sujetos sobre los que se estudian las diferencias. Entonces el sistema activa el botn definir grupos y al presionarlo aparece una ventana donde se introducen los valores de la variable que definen los dos grupos de sujetos a comparar, o el valor de la variable que har de corte para definir dichos grupos. Si el valor de la variable para un individuo es menor o igual que el valor especificado, el individuo pertenecer al primer grupo, y en caso contrario, al segundo. Opciones: presionando este botn se obtiene una ventana donde se especifica igual que en la seccin anterior el nivel de confianza para el intervalo y la forma de tratar los valores missing. Ejemplo: Vamos a comprobar si existen diferencias significativas entre los tiempos medios de dedicacin a la docencia, para los profesores asociados y los titulares de

TRABAJO EN EQUIPO



universidad de Profesores2.sav. Para ello, seleccionamos el procedimiento Prueba T para muestras independientes, y elegimos la variable Tiemdoc para llevarla al campo contrastar variables. Seguidamente seleccionamos como variable agrupacin la variable categora, presionamos el botn definir grupos, y tecleamos un 1 en el primer grupo y un 3 en el segundo. Por ltimo pulsamos continuar y aceptar para ejecutar el procedimiento. El resultado que muestra la Tabla contiene dos tablas. La primera recoge para ambos grupos, profesores asociados y titulares de universidad, el nmero de casos en cada muestra, los tiempos medios dedicados a la docencia, las desviaciones tpicas y los errores tpicos de la media. La segunda tabla muestra el valor del estadstico para la prueba de Levene sobre la igualdad de varianzas, junto con su p-valor. Este se distribuye como una F de Snedecor y vale 0.808, mientras que su p-valor 0.373, lo que nos conduce a aceptar que las varianzas sean iguales, ya que el p-valor es mayor que 0.05. Tambin aparece en la tabla el valor del estadstico para resolver el contraste de igualdad de medias, supuesto varianzas iguales y distintas, (en ambos casos se distribuye como una t de Student), junto con los correspondientes grados de libertad y sus p-valores. Puesto que hemos concluido que las varianzas coinciden, fijmonos en el que se han asumido varianzas iguales, el cual vale 8.661, y cuyo p-valor es 0, luego se rechaza que las medias coincidan. Razonamiento que tambin se puede deducir del intervalo de confianza, que no contiene el cero. Tabla : Contraste sobre las Medias de dos Poblaciones Independientes Prueba T Estadsticos de Grupo Desviacin Error tp. de Categora N Media tp. la media Tiempo diario 1 29 251,3759 29,36731 5,4534 para la docencia 3 23 187,1000 22,5337 4,6986 Prueba de muestras independientes Prueba de Levene para la igualdad Prueba T para la igualdad de medias de varianzas Error Sig. Diferenci tpico de Intervalo de F Sig. t gl bilater a de la confianza para al medias diferenci la diferencia a Superio Inferior r Asumiend 0.80 0,37 8,66 49,370 79,181 Tiempo 50 0.000 64,2759 7,4209 o 8 3 1 4 3 varianzas diario iguales para la No 8,92 49,96 0.000 64,2759 7,1983 49,817 78,734 Asumiend 9 1 3 5

TRABAJO EN EQUIPO



o docenci varianzas a iguales En muchos estudios, incluidos la mayora de los ensayos clnicos, es necesario comparar ciertas caractersticas en dos o ms grupos de sujetos. Tal sera el caso, por ejemplo, si pensamos que un tratamiento nuevo puede tener un porcentaje de mejora mayor que otro estndar, o cuando nos planteamos si los nios de las distintas comunidades autnomas tienen o no la misma altura. En este artculo se analizar nicamente el problema de la comparacin de dos grupos con respecto a una variable continua. La eleccin de un mtodo de anlisis apropiado en este caso depender de la naturaleza de los datos y la forma en la que estos hayan sido obtenidos. Fundamentalmente, cuando se comparan dos o ms grupos de observaciones pueden darse dos tipos de diseo: aquel en el que las observaciones se refieren a dos grupos independientes de individuos, o el caso en el que cada serie de datos se recoge en los mismos sujetos bajo condiciones diferentes. El tipo de metodologa ser distinto segn el caso en el que nos encontremos. Otro aspecto a tener en consideracin ser el tipo y distribucin de los datos. Para grupos independientes, los mtodos paramtricos requieren que las observaciones en cada grupo provengan de una distribucin aproximadamente normal con una variabilidad semejante, de modo que si los datos disponibles no verifican tales condiciones, puede resultar til una transformacin1,2,3 de los mismos (aplicacin del logaritmo, raz cuadrada, etc.) o, en todo caso, se debera recurrir a la utilizacin de procedimientos no paramtricos4. Normalmente en este tipo de anlisis podremos establecer una hiptesis de partida (hiptesis nula), que generalmente asume que el efecto de inters es nulo, por ejemplo que la tensin arterial es la misma en hombres y mujeres o que dos tratamientos para la hipercolesterolemia son igualmente efectivos. Posteriormente se puede evaluar la probabilidad de haber obtenido los datos observados si esa hiptesis es correcta. El valor de esta probabilidad coincide con el valor-p que nos proporciona cada test estadstico, de modo que cuanto menor sea ste ms improbable resulta que la hiptesis inicial se verifique. En un primer apartado, se presentar el test t de Student para dos muestras independientes, introduciendo las modificaciones necesarias en el caso de que la variabilidad de ambos grupos sea distinta. A continuacin se introducir el test t de Student para el caso de dos muestras dependientes. t de Student para dos muestras independientes Uno de los anlisis estadsticos ms comunes en la prctica es probablemente el utilizado para comparar dos grupos independientes de observaciones con respecto a una variable numrica. Como ejemplo, consideremos los datos que se muestran en la Tabla 1, correspondientes a 75 individuos con sobrepeso sometidos a dos dietas alimenticias distintas, de modo que se desea comparar el peso de los individuos que iniciaron cada una de las dietas. Como ya se ha adelantado, la aplicacin de un contraste paramtrico requiere la normalidad de las observaciones para cada uno de los grupos. La comprobacin de esta hiptesis puede realizarse tanto por mtodos grficos (por medio de histogramas, diagramas de cajas o grficos de normalidad) como mediante tests estadsticos5 (test de Kolmogorov-Smirnov, test de Shapiro-Wilks). Un nmero suficiente de observaciones (digamos mayor de 30) como ocurre en el ejemplo planteado justifica, no obstante, la utilizacin del mismo test. As mismo, este tipo de metodologa exigir que la varianza en ambos grupos de observaciones sea la misma. En primer lugar se desarrollar el test t de

TRABAJO EN EQUIPO



Student para el caso en el que se verifiquen ambas condiciones, discutiendo posteriormente el modo de abordar formalmente el caso en el que las varianzas no sean similares. Bajo las hiptesis de normalidad e igual varianza la comparacin de ambos grupos puede realizarse en trminos de un nico parmetro como el valor medio (Figura 1a), de modo que en el ejemplo planteado la hiptesis de partida ser, por lo tanto: H0: La media de peso inicial es igual en ambos grupos Se denotar por {X1, X2,...,Xn} e {Y1,Y2,...,Ym} al peso observado en cada uno de los sujetos sometidos a la dieta A y a la dieta B respectivamente. En general no se exigir que coincida el nmero de observaciones en cada uno de los grupos que se comparan, de modo que en el ejemplo n=40 y m=35. El t test para dos muestras independientes se basa en el estadstico:

(1)

Donde

e

denotan el peso medio en cada uno de los grupos:

y

,

las cuasi varianzas mustrales correspondientes:

Con lo cual, en este caso particular, el valor utilizado para el contraste ser:

Si la hiptesis de partida es cierta el estadstico (1) seguir una distribucin t de Student con n+m-2 grados de libertad. De ser as, el valor obtenido debera estar dentro del rango de mayor probabilidad segn esta distribucin. Usualmente se toma como referencia el rango de datos en el que se concentra el 95% de la probabilidad. El valor-p que usualmente reportan la mayora de paquetes estadsticos no es ms que la probabilidad de obtener, segn esa distribucin, un dato ms extremo que el que proporciona el test. Como ya se dijo, refleja tambin la probabilidad de obtener los datos observados si fuese

TRABAJO EN EQUIPO



cierta la hiptesis inicial. Si el valor-p es muy pequeo (usualmente se considera p0.05. En el ejemplo planteado el valor-p correspondiente es de 0.425, de modo que no existe evidencia estadstica de que el peso medio en ambos grupos sea diferente. En la Tabla 2, se determina los grados de libertad (en la primera columna) y el valor de (en la primera fila). El nmero que determina su interseccin es el valor crtico correspondiente. De este modo, si el estadstico que se obtiene toma un valor mayor se dir que la diferencia es significativa. Otro modo de obtener esta misma informacin es mediante el clculo de intervalos de confianza para la diferencia de la respuesta media en ambos grupos. A mayores, el intervalo de confianza constituye una medida de la incertidumbre con la que se estima esa diferencia a partir de la muestra, permitiendo valorar tanto la significacin estadstica como la magnitud clnica de esa diferencia6. En el caso que nos ocupa, el intervalo de confianza vendr dado como:

Donde denota el valor que segn la distribucin t de Student con n+m-2 grados de libertad deja a su derecha el 2.5% de los datos. En el ejemplo, el intervalo de confianza con una seguridad del 95% para la diferencia de peso viene dado por:

Que expresa en definitiva un rango de valores entre los que se puede encontrar el valor real de la diferencia entre los pesos de ambos grupos. Proporciona adems la misma informacin que obtenamos del contraste estadstico. El hecho de que el valor cero pertenezca al intervalo indica que no se dispone de evidencia para concluir que el peso sea distinto en ambos grupos. A medida que el tamao muestral aumenta, la distribucin del estadstico (1) se hace ms prxima a la de una variable Normal estndar. De este modo, en algunos textos se opta por utilizar esta distribucin para realizar la comparacin de medias. Aunque esta aproximacin es correcta para muestras suficientemente grandes, ambos mtodos proporcionan en este caso resultados prcticamente idnticos, por lo que resulta ms simple utilizar, independientemente del tamao de la muestra, la misma metodologa a partir de la distribucin t. El mismo planteamiento podra utilizarse en el caso de varianzas distintas o de muestras apareadas. Dos muestras dependientes Ya se ha comentado que cuando se trata de comparar dos grupos de observaciones, es importante distinguir el caso en el que son independientes de aquel en el que los datos estn apareados. Las series dependientes surgen normalmente cuando se evala un mismo dato ms de una vez en cada sujeto de la muestra. Tambin se puede encontrar este tipo de observaciones en estudios de casos y controles donde cada caso se aparea individualmente con un control. Supongamos que queremos comprobar, en los datos de la Tabla 1 si realmente se produce una prdida de peso significativa en esos individuos, para lo que se recoge enTRABAJO EN EQUIPO



cada sujeto su peso antes y despus de someterse a la dieta. En este tipo de anlisis el inters no se centra en la variabilidad que puede haber entre los individuos, sino en las diferencias que se observan en un mismo sujeto entre un momento y otro. Por este motivo, resulta intuitivo trabajar con la diferencia de ambas observaciones (en el ejemplo ser la prdida de peso), de modo que se quiere contrastar la hiptesis: H0: La prdida de peso es nula frente a la alternativa de que la prdida de peso sea importante (es decir, distinta de cero). La veracidad de dicha hiptesis puede ser contrastada igualmente mediante el test t de Student. Como se ha dicho, este tipo de mtodos tienen como hiptesis fundamental la normalidad de los datos. En este caso, sin embargo, no ser necesario que las observaciones en ambos grupos provengan de poblaciones normales, sino que nicamente se requiere verificar la normalidad de su diferencia. Denotando por prdida media de peso la hiptesis de la que se parte es que: la

frente a la alternativa

A partir de las observaciones mustrales {Y1,Y2,..., Yn} e {Y1,Y2,...,Yn} en cada uno de los grupos se calcula la diferencia de peso para cada sujeto {d1,d2,...,dn} con dj=Xj-Yj j=1,2,...,n. Ntese que en este caso un requisito fundamental es que se tenga un nmero igual de observaciones en ambos grupos. A partir de estos datos, el contraste se basa en el estadstico:

o en el clculo del 95% intervalo de confianza:

Donde

denota la media de la prdida de peso estimada a partir de la muestra:

y

denota la cuasi varianza muestral de la diferencia dada por:

En nuestro ejemplo el valor del estadstico vendra dado por:

TRABAJO EN EQUIPO



a comparar del modo habitual con la distribucin t de Student con n-1=74 grados de libertad. El intervalo de confianza para la prdida media de peso correspondiente a una seguridad del 95% es de (3.56;4.41), lo cual se traduce en una prdida de peso significativamente distinta de cero, tal y como indica el valor-p correspondiente de p 1.26).

2 1

2

Solucin: Calcular el valor de Fisher:

Luego se va a la tabla de Fisher a buscar 30 grados de libertad 2 con 24 grados de libertad uno. Cuando se este en esta posicin se busca adentro de la tabla el valor de Fisher de 1.89. Al localizarlo y ver a la izquierda de este valor se obtiene un rea de 0.95, pero esta rea correspondera a la probabilidad de que las relaciones de varianzas mustrales fueran menor a 1.26, por lo que se calcula su complemento que sera 0.05, siendo esta la probabilidad de que s12/s22 > 1.26.

Intervalo de Confianza para el Cociente de Varianzas de Dos Distribuciones Normales Supngase que se tienen dos poblaciones normales e independientes con varianzas2 2 desconocidas y 2 , respectivamente. De este par de poblaciones, se tienen disponibles dos muestras aleatorias de tamaos n1 y n2, respectivamente, sean s12 y s22

TRABAJO EN EQUIPO



las dos varianzas muestrales. Se desea conocer un intervalo de confianza del 100( ) por ciento para el cociente de las dos varianzas,2 1

/

2

2

.

Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se coloca la varianza muestral mayor en el numerador del estadstico F. Ejemplos: Un fabricante de automviles pone a prueba dos nuevos mtodos de ensamblaje de motores respecto al tiempo en minutos. Los resultados se muestran el la tabla: Mtodo 1 n1 = 31 s12 = 50 Mtodo 2 n2 = 25 s22 = 24

Construya un intervalo de confianza del 90% para Solucin:

1

2

/

2 2

.

Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la siguiente frmula:

al despejar:

.

F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En este caso los grados de libertad uno valen 30 y los grados de libertad dos 24.

1.

2.

y

4.6 COMPARACIONES DE DOS MUESTRAS PAREADAS

TRABAJO EN EQUIPO



Una de las hiptesis sobre las que habitualmente se fundamentan las pruebas estadsticas de comparacin es que las observaciones pertenecientes a cada una de las muestras son independientes entre s, no guardan relacin; siendo precisamente ese uno de los objetivos de la aleatorizacin (eleccin aleatoria de los sujetos o unidades de observacin). Sin embargo, la falta de independencia entre las observaciones de los grupos puede ser una caracterstica del diseo del estudio para buscar fundamentalmente una mayor eficiencia del contraste estadstico al disminuir la variabilidad. En otras ocasiones con este tipo de diseo pareado lo que se busca es dar una mayor validez a las inferencias obtenidas, controlando o eliminando la influencia de variables extraas cuyo efecto ya es conocido o sospechado, y no se desea que intervenga en el estudio actual pudiendo enmascarar el efecto del tratamiento o de la variable de inters. Las muestras apareadas se obtienen usualmente como distintas observaciones realizadas sobre los mismos individuos. Un ejemplo de observaciones pareadas consiste en considerar a un conjunto de n personas a las que se le aplica un tratamiento mdico y se mide por ejemplo el nivel de insulina en la sangre antes (X) y despus del mismo (Y). En este ejemplo no es posible considerar aX eY como variables independientes ya que va a existir una dependencia clara entre las dos variables. 4.7 MODELO TOTALMENTE ALEATORIO: ANLISIS DE VARIANZA DE UN FACTOR. Hay varias formas en las cuales puede disearse un experimento ANOVA. Quizs el ms comn es el diseo completamente aleatorizado a una va. El trmino proviene del hecho que varios sujetos o unidades experimentales se asignan aleatoriamente a diferentes niveles de un solo factor. Por ejemplo: varios empleados (unidades experimentales) pueden seleccionarse aleatoriamente para participar en diversos tipos (niveles diferentes) de un programa de capacitacin (el factor). El anlisis de varianza se basa en una comparacin de la cantidad de variacin en cada uno de los tratamientos. Si de un tratamiento al otro la variacin es significativamente alta, puede concluirse que los tratamientos tienen efectos diferentes en las poblaciones. a. Esta variacin entre el nmero total de las 14 observaciones. Esto se llama variacin total. b. Existe variacin entre los diferentes tratamientos (muestras). Esto se llama variacin entre muestras. c. Existe variacin dentro de un tratamiento dado (muestra). Esto se denomina variacin dentro de la muestra. 4.8 SELECCIN DEL TAMAO DE MUESTRA PARA ESTIMAR LA DIFERENCIA DE DOS MEDIAS En Estadstica el tamao de la muestra es el nmero de sujetos que componen la muestra extrada de una poblacin, necesarios para que los datos obtenidos sean representativos de la poblacin. 1. Estimar un parmetro determinado con el nivel de confianza deseado. 2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mnimo de garanta. 3. Reducir costes o aumentar la rapidez del estudio. Por ejemplo, en un estudio de investigacin epidemiolgico la determinacin de un tamao adecuado de la muestra tendra como objetivo su factibilidad. As: Si el nmero de sujetos es insuficiente habra que modificar los criterios de seleccin, solicitar la colaboracin de otros centros o ampliar el periodo de reclutamiento. Los

TRABAJO EN EQUIPO



estudios con tamaos muestrales insuficientes, no son capaces de detectar diferencias entre grupos, llegando a la conclusin errnea de que no existe tal diferencia. Si el nmero de sujetos es excesivo, el estudio se encarece desde el punto de vista econmico y humano. Adems es poco tico al someter a ms individuos a una intervencin que puede ser menos eficaz o incluso perjudicial. El tamao de una muestra es el nmero de individuos que contiene. Una frmula muy extendida que orienta sobre el clculo del tamao de la muestra para datos globales es la siguiente: n = ( (k^2) * N*p*q) / ( (e^2 * (N-1) )+( (k^2) * p*q)) N: es el tamao de la poblacin o universo (nmero total de posibles encuestados). k: es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigacin sean ciertos: un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores k ms utilizados y sus niveles de confianza son: K 1,15 1,28 1,44 1,65 1,96 2 2,58 Nivel de confianza 75% 80% 85% 90% 95% 95,5% 99% (Por tanto si pretendemos obtener un nivel de confianza del 95% necesitamos poner en la frmula k=1,96) e: es el error muestral deseado. El error muestral es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la poblacin y el que obtendramos si preguntramos al total de ella. Ejemplos: Ejemplo 1: si los resultados de una encuesta dicen que 100 personas compraran un producto y tenemos un error muestral del 5% comprarn entre 95 y 105 personas. Ejemplo 2: si hacemos una encuesta de satisfaccin a los empleados con un error muestral del 3% y el 60% de los encuestados se muestran satisfechos significa que entre el 57% y el 63% (60% +/- 3%) del total de los empleados de la empresa lo estarn. Ejemplo 3: si los resultados de una encuesta electoral indicaran que un partido iba a obtener el 55% de los votos y el error estimado fuera del 3%, se estima que el porcentaje real de votos estar en el intervalo 52-58% (55% +/- 3%). p: proporcin de individuos que poseen en la poblacin la caracterstica de estudio. Este dato es generalmente desconocido y se suele suponer que p=q=0.5 que es la opcin ms segura. q: proporcin de individuos que no poseen esa caracterstica, es decir, es 1-p. n: tamao de la muestra (nmero de encuestas que vamos a hacer). Altos niveles de confianza y bajo margen de error no significan que la encuesta sea de mayor confianza o est ms libre de error necesariamente; antes es preciso minimizar la principal fuente de error que tiene lugar en la recogida de datos. Para calcular el tamao de la muestra suele utilizarse la siguiente frmula: Otra frmula para calcular el tamao de la muestra es: n=(N^2 Z^2)/((N-1) e^2+^2 Z^2 ) Donde: n = el tamao de la muestra. N = tamao de la poblacin.

TRABAJO EN EQUIPO



= Desviacin estndar de la poblacin que, generalmente cuando no se tiene su valor, suele utilizarse un valor constante de 0,5. Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en relacin al 95% de confianza equivale a 1,96 (como ms usual) o en relacin al 99% de confianza equivale 2,58, valor que queda a criterio del encuestador. e = Lmite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que vara entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador. La frmula anterior se obtiene de la frmula para calcular la estimacin del intervalo de confianza para la media: X -Z /n ((N-n)/(N-1))X +Z /n ((N-n)/(N-1)) En donde el error es: e=Z /n ((N-n)/(N-1)) Elevando al cuadrado el error se tiene: (e) ^2=(Z /n ((N-n)/(N-1)))^2 e^2=Z^2 ^2/n (N-n)/(N-1) Multiplicando fracciones: e^2= (Z^2 ^2 (N-n))/n(N-1) Eliminando denominadores: e^2 n(N-1)=Z^2 ^2 (N-n) Eliminando parntesis: e^2 nN-e^2 n=Z^2 ^2 N-Z^2 ^2 n Transponiendo n a la izquierda: e^2 nN-e^2 n+Z^2 ^2 n=Z^2 ^2 N Factor comn de n: n(e^2 N-e^2+Z^2 ^2 )=Z^2 ^2 N Despejando n: n=(Z^2 ^2 N)/(e^2 N-e^2+Z^2 ^2 ) Ordenando se obtiene la frmula para calcular el tamao de la muestra: n=(N^2 Z^2)/((N-1) e^2+^2 Z^2 ) Ejemplo ilustrativo: Calcular el tamao de la muestra de una poblacin de 500 elementos con un nivel de confianza del 99% Solucin: Se tiene N=500, para el 99% de confianza Z = 2,58, y como no se tiene los dems valores se tomar =0,5, y e = 0,05. Reemplazando valores en la frmula se obtiene: n=(N^2 Z^2)/((N-1) e^2+^2 Z^2 ) n=(500 0,5 ^2 2,58 ^2)/((500-1) (0,05) ^2+ 0,5 ^2 2,58 ^2 ) =832,05/2,9116=285,77=286 Suponga que se tienen dos poblaciones distintas, la primera con media1

y desviacin

estndar 1, y la segunda con media 2 y desviacin estndar 2. Ms an, se elige una muestra aleatoria de tamao n1 de la primera poblacin y una muestra independiente aleatoria de tamao n2 de la segunda poblacin; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La coleccin de todas esas diferencias se llama distribucin muestral de las

TRABAJO EN EQUIPO



Ejemplo: Si se tienen dos poblaciones con medias

1

y

2

y varianzas1

1

2

y

2

2

,

respectivamente, un estimador puntual de la diferencia entre estadstica1

y

2

est dado por la

. Por tanto. Para obtener una estimacin puntual de

-

2,

se seleccionan dos muestras aleatorias independientes, una de cada poblacin, , de las medias muestrales.

de tamao n1 y n2, se calcula la diferencia

Recordando a la distribucin muestral de diferencia de medias:

Al despejar de esta ecuacin

1

-

2

se tiene:

En el caso en que se desconozcan las varianzas de la poblacin y los tamaos de muestra sean mayores a 30 se podr utilizar la varianza de la muestra como una estimacin puntual. Ejemplo: Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B. Se mide el rendimiento en millas por galn de gasolina. Se realizan 50 experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se utiliza y las dems condiciones se mantienen constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galn y el promedio para el motor B es 24 millas por galn. Encuentre un intervalo de confianza de 96% sobre la diferencia promedio real para los motores A y B. Suponga que las desviaciones estndar poblacionales son 6 y 8 para los motores A y B respectivamente. Solucin: Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la media mayor menos la media menor. En este caso ser la media del motor B menos la media del motor A. El valor de z para un nivel de confianza del 96% es de 2.05.

3.4330, el estadgrafo de prueba es: Se distribuye normal estndar. Regla de decisin: se determina de acuerdo a la hiptesis alternativa (si es bilateral o unilateral), lo cual puedes fcilmente hacerlo auxilindote de la tabla 4.4.1. En el caso de muestras pequeas se utiliza la distribucin Binomial. No lo abordaremos por ser complicado y poco frecuente su uso. Diferencia entre las proporciones de dos poblaciones La situacin ms frecuente es suponer que existen diferencias entre las proporciones de dos poblaciones, para ello suelen enunciarse las hiptesis de forma similar al caso de las medias: Ho: p1 = p2 p1 - p2 = 0 H1: p1 p2 Puede la hiptesis alternativa enunciarse unilateralmente. El estadgrafo de prueba para el caso de muestras independientes: Siendo a1 y a2, el nmero de sujetos con la caracterstica objeto de estudio en las muestras 1 y 2 respectivamente, es decir, en vez de calcular la varianza para cada muestra, se calcula una p conjunta para ambas muestras bajo el supuesto que no hay diferencias entre ambas proporciones y as se obtiene la varianza conjunta. Recuerda que q = 1-p. Est de ms que te diga que este estadgrafo se distribuye normal estndar. La regla de decisin se determina de manera similar a los casos ya vistos anteriormente. El objetivo de la prueba es comparar estas dos proporciones, como estimadores

TRABAJO EN EQUIPO



H1: p1 p2 Recuerda que la H1 tambin puede plantearse de forma unilateral. 5.1 PRUEBA Z PARA LA DIFERENCIA ENTRE DOS PROPORCIONES. En algunos diseos de investigacin, el plan muestral requiere seleccionar dos muestras independientes, calcular las proporciones muestrales y usar la diferencia de las dos proporciones para estimar o probar una diferencia entre las mismas. Las aplicaciones son similares a la diferencia de medias, por ejemplo si dos empresas consultoras ofrecen datos de proporciones de personas que van a votar por el PRI y al hacer dos estudios diferentes salen resultados ligeramente diferentes pero qu tanta diferencia se requiere para que sea estadsticamente significativo? De eso se pruebas estadsticas de diferencias de proporciones. El estadstico Z para estos casos se calcula de la siguiente manera:

Ejemplo: Una muestra de 87 mujeres trabajadoras profesionales mostr que la cantidad promedio que pagan a un fondo de pensin privado el 5% de su sueldo. Una muestra de 76 hombres trabajadores profesionales muestra que la cantidad que paga un fondo de pensin privado es 6.1% de su sueldo. Un grupo activista de mujeres desea demostrar que las mujeres no pagan tanto como los hombres en fondos de pensin privados. Si se usa alfa = 0.01 Se confirma lo que el grupo activista de mujeres desea demostrar o no? Paso 1. Determinar la hiptesis Nula Ho y Alternativa Ha Ntese que este problema es de una cola.

TRABAJO EN EQUIPO



Ho: Lo que pagan las mujeres en el fondo de pensin es igual o mayor a lo que pagan los hombres (algunos autores solo le colocan igual).

Ha: _______________________________________ (El estudiante debe describir la Ha) La hiptesis alternativa es lo que las mujeres del grupo activista desean demostrar. Paso 2. Determinar el nivel de significancia. Definida por el analista, en este casi se desea usar = 0.01 Grficamente el nivel de significancia se distribuye en la curva de distribucin normal como se muestra en la figura:

Paso 3. Calcular los intervalos que implican ese nivel de significancia Para dicho nivel de significancia el valor de Z es: Z=-2.326 Grficamente queda de la siguiente manera:

TRABAJO EN EQUIPO



Paso 4

TRABAJO EN EQUIPO



Ejemplo: En un estudio de infeccin de vas urinarias no complicadas, los pacientes fueron asignados para ser tratados con trimetoprim / sulfametoxazol o fosfomicina / trometamol. 92% de los 100 tratados con fosfomicina/ trometamol mostraron curacin bacteriolgica mientras que el 61% de los 100 manejados con trimetoprim / sulfametoxazol se cur la infeccin. Cuando comparamos proporciones de muestras independientes, debemos primero calcular la diferencia en proporciones. El anlisis para comparar dos proporciones independientes es similar al usado para dos medias independientes. Calculamos un intervalo de confianza y una prueba de hiptesis para la diferencia en proporciones. La notacin que usamos para el anlisis de dos proporciones es el mismo que para una proporcin. Los nmeros inferiores son para distinguir los dos grupos. Parmetros Poblacin 1 Proporcin 1 2 2 Muestra 1 p1 2 p2

TRABAJO EN EQUIPO



Desviacin estndar

1(1-2) 2)

2(1-

p1(1-p1) p2)

p2(1-

El cuadrado del error estndar de una proporcin es conocido como la varianza de la proporcin La varianza de la diferencia entre las dos proporciones independientes es igual a la suma de las varianzas de las dos proporciones de las muestras. Las varianzas son sumadas debido a que cada muestra contribuye al error de muestreo en la distribucin de las diferencias. ES = p(1-p)/n Varianza = p(1-p)/n p1(1- p1) Varianza (p1-p2)= varianza de p1 + varianza de p2 = --------n1 p2(1- p2) + ---------n2

El error estndar de la diferencia entre dos proporciones es dado por la raz cuadrada de la varianza. ES (p1-p2)= [p1(1-p1)/n1 + p2(1-p2)/n2] Para calcular el intervalo de confianza necesitamos conocer el error estndar de la diferencia entre dos proporciones. El error estndar de la diferencia entre dos proporciones es la combinacin del error estndar de las dos distribuciones independientes, ES (p1) y ES (p2). Hemos estimado la magnitud de la diferencia de dos proporciones de las muestras; ahora calcularemos el intervalo de confianza para esa estimacin. La frmula general para el intervalo de confianza al 95% es: Estimado 1.96 x ES La frmula para 95% IC de dos proporciones sera: (p1-p2) 1.96 ES(p1-p2) En el estudio de infeccin de vas urinarias, la proporcin en el grupo de fosfomicina/ trometamol fue 0.92 y para trimetoprim/ sulfametoxazol fue 0.61 Diferencia en proporciones = 0.92-0.61=0.31 ES = [(0.92(1-0.92)/100 + 0.61(1-0.61)/100] = 0.056 El intervalo de confianza al 95% sera: 0.31 1.96 (0.056) = 0.310.11 = 0.2 a 0.42 El intervalo de confianza al 95% sera: 1.96 (0.056) = 0.310.11 = 0.2 a 0.42

TRABAJO EN EQUIPO



Tengo 95% de confianza de que la diferencia en las proporciones en la poblacin estara entre 0.2 y 0.42. Como la diferencia no incluye 0, estamos confiados que en la poblacin la proporcin de curados con fosfomicina/trometamol es diferente que con trimetoprim sulfametoxazol. Una prueba de hiptesis usa la diferencia observada y el error estndar de la diferencia. Sin embargo, usamos un error estndar ligeramente diferente para calcular la prueba de hiptesis. Esto se debe a que estamos evaluando la probabilidad de que los datos observados asumen que la hiptesis nula es verdad. La hiptesis nula es que no hay diferencia en las proporciones de las dos poblaciones y ambas grupos tienen una proporcin comn, . El mejor estimado que podemos obtener de es la proporcin comn, p, de las dos proporciones de la muestra. P=r1+r2/n1+n2 Donde: r1 y r2 son los nmeros de respuestas positivas en cada muestra n1 y n2 son los tamaos de muestra en cada muestra. La proporcin comn siempre estar entre las dos proporciones individuales. El error estndar puede ser calculado sustituyendo p, por p1 y p2. ES(p1-p2)=p(1-p)(1/n1 +1/n2) Esto se conoce como error estndar agrupado. En el estudio de infeccin de vas urinarias, la proporcin en el grupo de fosfomicina/ trometamol fue 0.92 y para trimetoprim/ sulfametoxazol fue 0.61 Fueron 100 intregrantes en cada grupo. Proporcin comn, p= 92 + 61/100+100 = 153/200 = 0.765 ES(p1-p2)=0.77(1-0.77)(1/100 +1/100)= 0.1771 x 0.002 = 0.019 Si asumimos una aproximacin a la Normalidad para la distribucin Binomial, calculamos la prueba de z , como antes. Para calcular la prueba de hiptesis, debemos: 1.- Sealar la hiptesis nula Ho 2.- Sealar la hiptesis alternativa H1 3.- Calcular la prueba de hiptesis z. Hiptesis nula: Cuando comparamos dos proporciones de poblaciones independientes es usualmente que las dos proporciones son iguales. Ho: 1 = 2 Es lo mismo que si la diferencia en las proporciones de las dos poblaciones es igual a 0. Ho: 1 - 2 = 0

TRABAJO EN EQUIPO



Hiptesis alternativa: Es usualmente que las dos proporciones no son iguales. H1: 1 2 Es lo mismo que la diferencia en proporciones no es igual a cero. H1: 1 2 0 0.92 de xito para fosfomicina / trometamol y 0.61 para trimetoprim / sulfametoxazol ES = 0.019 (p1-p2) 0 0.31 - 0

z= -------------- = -----------= 16.3 ES(p1-p2) P30, el estadgrafo de prueba es: se distribuye normal estndar. Regla de decisin: se determina de acuerdo a la hiptesis alternativa (si es bilateral o unilateral. En el caso de muestras pequeas se utiliza la distribucin Binomial. No lo abordaremos por ser complicado y poco frecuente su uso. Diferencia entre las proporciones de dos poblaciones La situacin ms frecuente es suponer que existen diferencias entre las proporciones de dos poblaciones, para ello suelen enunciarse las hiptesis de forma similar al caso de las medias: Ho: p1 = p2 p1 - p2 = 0 0.019

TRABAJO EN EQUIPO



H1: p1 p2 Puede la hiptesis alternativa enunciarse unilateralmente. El estadgrafo de prueba para el caso de muestras independientes: donde

Siendo a1 y a2, el nmero de sujetos con la caracterstica objeto de estudio en las muestras 1 y 2 respectivamente, es decir, en vez de calcular la varianza para cada muestra, se calcula una p conjunta para ambas muestras bajo el supuesto que no hay diferencias entre ambas proporciones y as se obtiene la varianza conjunta. Recuerda que q = 1-p. Est de ms que te diga que este estadgrafo se distribuye normal estndar. La regla de decisin se determina de manera similar a los casos ya vistos anteriormente. El objetivo de la prueba es comparar estas dos proporciones, como estimadores H1: p1 p2 Recuerda que la H1 tambin puede plantearse de forma unilateral. En algunos diseos de investigacin, el plan muestral requiere seleccionar dos muestras independientes, calcular las proporciones mustrales y usar la diferencia de las dos proporciones para estimar aprobar una diferencia entre las mismas .Las aplicaciones son similares a la diferencia de medias, por ejemplo si dos empresas consultoras ofrecen datos de proporciones de personas que van a votar por el PRI y al hacer dos estudios diferentes salen resultados ligeramente diferentes pero qu tanta diferencia se requiere para que sea estadsticamente significativo? De eso se tratan las Pruebas estadsticas de diferencias de proporciones. Estimacin de la Diferencia de dos Proporciones En la seccin anterior se vio el tema de la generacin de las distribuciones muestrales, en donde se tena el valor de los parmetros, se seleccionaban dos muestras y podamos calcular la probabilidad del comportamiento de los estadsticos. Para este caso en particular se utilizar la distribucin muestral de diferencia de proporciones para la estimacin de las mismas. Recordando la formula:

Despejando P1-P2 de esta ecuacin:

Aqu se tiene el mismo caso que en la estimacin de una proporcin, ya que al hacer el despeje nos queda las dos proporciones poblacionales y es precisamente lo que

TRABAJO EN EQUIPO



queremos estimar, por lo que se utilizarn las proporciones de la muestra como estimadores puntuales:

Ejemplo: Se considera cierto cambio en un proceso de fabricacin de partes componentes. Se toman muestras del procedimiento existente y del nuevo para determinar si ste tiene como resultado una mejora. Si se encuentra que 75 de 1500 artculos del procedimiento actual son defectuosos y 80 de 2000 artculos del procedimiento nuevo tambin lo son, encuentre un intervalo de confianza de 90% para la diferencia real en la fraccin de defectuosos entre el proceso actual y el nuevo. Solucin: Sean P1 y P2 las proporciones reales de defectuosos para los procesos actual y nuevo, respectivamente. De aqu, p1=75/1500 = 0.05 y p2 = 80/2000 = 0.04. con el uso de la tabla encontramos que z para un nivel de confianza del 90% es de 1.645.

-0.0017

Documents

UNIDAD IV PRUEBAS DE HIPOTESIS CON DOS MUESTRAS Y VARIAS MUESTRAS DE DATOS NUMÉRICOS