Inferencia estadística

Guía de Bioestadística Dr. Julio Idrovo

3. INFERENCIA ESTADÍSTICA

3.1 Introducción La inferencia estadística es la parte de la estadística que permite tomar decisiones sobre una determinada

cuestión con un grado de confianza establecido a priori. Por ejemplo, se puede averiguar si dos muestras

están o no correlacionadas linealmente, si sus medias son iguales, si su variabilidad es diferente, cuáles

son sus distribuciones, etc.

3.2 Teoría de los tests estadísticos La formulación de la teoría de los tests estadísticos comprende los siguientes pasos:

3.2.1 Planteamiento de la hipótesis nula

La hipótesis nula (H0) generalmente es formulada con la intención de rechazarla. Postula la carencia de

diferencia entre los parámetros motivo del problema. Simultáneamente se plantea la hipótesis alternativa

(HA) o hipótesis de trabajo, la misma que es complementaria a la hipótesis nula. El rechazo de H0

conduce a la aceptación de HA y viceversa.

Se puede saber si un test se realizará a "una cola" o a "dos colas" mirando a cuantos lados va la hipótesis

alternativa.

H0: s

2 = 3.25 H

A : s

2 3.25 dos colas

H0: s

2 3.25 H

A : s2 > 3.25 cola derecha

H0: s

2 3.25 H

A : s

2 < 3.25 cola izquierda

3.2.2 Nivel de significancia ( )

El nivel de significancia se considera como la probabilidad de rechazar la hipótesis nula cuando es

verdadera; es por lo tanto un error denominado de tipo I. Su valor se da a priori, en porcentaje,

generalmente 5%. También es probable que se tenga que aceptar la hipótesis nula cuando es falsa; este es

un error de tipo II y se lo simboliza ß. El complemento de es el nivel de confianza, o sea la

probabilidad de aceptar H0 cuando es verdadera; esta es una decisión correcta de tipo A. La potencia de

un test se entiende como la probabilidad de rechazar H0 cuando es falsa; esta es una decisión correcta de

tipo B.

Decisión Verdadera Falsa

Aceptar A

Rechazar B

3.2.3 Elección del test estadístico

El test estadístico se seleccionará de acuerdo con la hipótesis planteada. Cuando para un mismo problema

existen dos o más tests disponibles, se elegirá aquel más potente. Generalmente los tests paramétricos

son los más potentes. Se denominan tests paramétricos a aquellos que necesitan del cálculo de

parámetros propios de la distribución, como la media, varianza, etc. Los tests no paramétricos son

aquellos que consideran únicamente el tamaño de la muestra.

3.2.4 Cálculo del valor del test

Con el test seleccionado se procederá a calcular el valor del estadístico, utilizando la fórmula propia de

cada test.

3.2.5 Determinación de los puntos críticos

Conociendo el tamaño de la muestra (o los grados de libertad) y el nivel de significancia, se procederá a

buscar los valores críticos del test, los mismos que se encuentran tabulados. Cuando el test se realiza a

dos colas, los puntos críticos se encuentran utilizando /2 en lugar de . El valor crítico izquierdo


representa la probabilidad de que 1- /2 de los datos sean mayores que él. El valor crítico derecho

representa la probabilidad de que /2 de los datos sean mayores que él. Estos determinan las zonas de

rechazo y aceptación de H0. La zona o zonas de rechazo comprenderán un área total igual a , mientras

que la zona de aceptación corresponderá a 1- .

3.2.6 Decisión

Si el valor del test cae dentro de la zona de rechazo de H0 se procederá a rechazar la hipótesis nula,

aceptando la hipótesis alternativa.

3.3 Normalidad de los datos La mayoría de las pruebas estadísticas parten del hecho de que los datos analizados están

aproximadamente normalmente distribuidos. En algunos casos puede ser necesario verificar si esto es

cierto, para lo cual nos sirven los tests a continuación detallados.

3.3.1 Test de Kolmogorov – Smirnov

Este test es de gran utilidad cuando se trata de analizar la distribución de la variable en estudio. La

distribución de la variable puede escribirse como una distribución acumulativa de frecuencias relativas.

Se procede de la siguiente manera: se compara el valor observado en la distribución acumulativa de

frecuencias con el valor de de la distribución teórica: , donde F0(x) es el valor de

la distribución teórica, F(x) es el valor observado y D(x) es el valor absoluto de la diferencia. La máxima

diferencia se denota como D = max D(x)

La hipótesis nula H0 asume que no hay diferencia entre la distribución acumulativa de frecuencias y la

distribución teórica. Los valores críticos D* se localizan conociendo el tamaño de la muestra y . Si la

distribución acumulativa de frecuencias hipotética es correcta, es razonable que el valor D sea pequeño.

La hipótesis H0 se acepta si el valor D observado es menor que el valor critico D* del test: D < D*

El test de Kolmogorov - Smirnov se puede aplicar para establecer comparaciones entre dos muestras. Se

procede haciendo las distribuciones acumulativas de frecuencias para cada muestra y se encuentra la

diferencia entre las frecuencias de las dos muestras para un mismo intervalo. La máxima diferencia es

probada en el test estadístico para verificar o no la carencia de diferencia entre las dos medidas. Los

valores críticos se localizan conociendo el tamaño de las dos muestras y , en la tabla del test de

Kolmogorov - Smirnov para dos muestras. La hipótesis H0 se verifica si D < D*.

La prueba de Kolmogorov - Smirnov puede aplicarse para tamaños de muestra pequeños, lo que no

sucede con la chi cuadrado. Además, es más poderosa que la , es decir, cuando se rechaza la hipótesis

nula, se tiene una mayor confiabilidad en dicho resultado. El test de Kolmogorov - Smirnov debe usarse

cuando la variable de análisis es continua. Sin embargo, si la prueba se usa cuando la distribución de la

población no es continua, el error que ocurre en la probabilidad resultante está en la dirección segura. Es

decir, cuando se rechaza la hipótesis nula, tenemos verdadera confianza en la decisión.

Ejemplo 1:

Se realizaron ocho titulaciones, con los resultados 25.13, 25.02, 25.11, 25.07, 25.03, 24.97, 25.14 y 25.09

mL. ¿Dichos resultados podrían proceder (a) de una población normal con media 25.00 mL y desviación

estándar 0.05 mL, y (b) de cualquier otra población normal?

(a) En este caso transformamos los valores x en valores z utilizando la relación


Los valores obtenidos son:

xi 25.13 25.02 25.11 25.07 25.03 24.97 25.14 25.09

zi 2.6 0.4 2.2 1.4 0.6 -0.6 2.8 1.8

xi zi fra P(z) D(x)

24.97 -0.6 0.125 0.2743 0.1493

25.02 0.4 0.250 0.6554 0.4054

25.03 0.6 0.375 0.7257 0.3507

25.07 1.4 0.500 0.9192 0.4192

25.09 1.8 0.625 0.9641 0.3391

25.11 2.2 0.750 0.9861 0.2361

25.13 2.6 0.875 0.9953 0.1203

25.14 2.8 1.000 0.9974 0.0026

El valor crítico es , y puesto que D=0.4192 la hipótesis de normalidad se rechaza.

(b) En este caso estimamos la media y la desviación estándar de los datos antes de transformarlos en

valores z.

La media es 25.07 y la desviación estándar es 0.0593. Con estas estimaciones se obtienen los

siguientes valores:

xi 25.13 25.02 25.11 25.07 25.03 24.97 25.14 25.09

zi 1.01 -0.84 0.67 0.00 -0.67 -1.69 1.18 0.34

xi zi fra P(z) D(x)

24.97 -1.69 0.1250 0.0458 0.0792

25.02 -0.84 0.2500 0.1995 0.0505

25.03 -0.67 0.3750 0.2499 0.1251

25.07 0.00 0.5000 0.5000 0.0000

25.09 0.34 0.6250 0.6321 0.0071

25.11 0.67 0.7500 0.7501 0.0001

25.13 1.01 0.8750 0.8443 0.0307

25.14 1.18 1.0000 0.8812 0.1188

El valor crítico es , y puesto que D=0.1251 la hipótesis de normalidad se acepta.

3.3.2 Test Chi cuadrado

Este test se puede interpretar como el test de la “bondad del ajuste”, el cual establece si existe una

diferencia significativa entre un número de objetos o respuestas y un número teórico.

El valor del test estadístico se calcula con la expresión

donde O es el valor observado y E es el valor esperado o teórico. Es de esperarse que un valor pequeño de

indique concordancia entre las dos series de frecuencias.

La hipótesis H0 asume que no existe diferencia entre las dos distribuciones y se acepta cuando es menor

que el valor critico localizado en las tablas por conocimiento de los grados de libertad (n—1) y


3.4 Valores anómalos Dada una muestra aleatoria simple de tamaño n procedente de una población univariante, (x1, x2, ..., xn),

podemos sospechar que una de sus observaciones, que forzosamente será la menor o la mayor de la

muestra, es un dato atípico, es decir, el valor registrado para ese individuo es anormalmente pequeño o

grande.

Ante esta situación, el analista debe investigar la procedencia de ese dato, y como consecuencia de ello,

eliminarlo de la muestra si se confirma que ha sido un error (quizás de medida o de transcripción manual

del dato) o modificar sus hipótesis sobre la población en caso de verificarse su exactitud (¿quién nos

asegura que un dato anómalo no es señal de la presencia de una veta de mineral en un análisis geológico

de cierto terreno?).

En todo caso, no se eliminará un dato sospechosamente atípico hasta no tener la certeza absoluta de que

su origen se debe a un error humano o de instrumentación.

La presencia de un valor anómalo puede alterar sensiblemente las conclusiones de un análisis estadístico.

Aquellos métodos poco sensibles a estos datos extraños se denominan robustos, y la estadística robusta es

un área de intensa investigación.

3.4.1 Test Q de Dixon

Esta prueba supone que la población está normalmente distribuida. Una forma de estudiar una medida

sospechosa es comparar la diferencia entre ella y la medida más próxima, con la diferencia entre las

medidas más grande y más pequeña (rango). El cociente de estas diferencias (sin signo) se denomina Q de

Dixon.

Si el valor de Q calculado supera el valor crítico Q*, se rechaza el valor sospechoso.

Ejemplo 2:

Se obtuvieron los siguientes valores para la concentración de nitrito (mg/L) en una muestra de agua de

río.

0.403 0.410 0.401 0.380 0.400 0.413 0.411

La medida 0.380 mg/L es sospechosa. ¿Debería rechazarse al nivel de significancia del 5%?

Datos:

Valor sospechoso = 0.380

Valor más cercano = 0.400

Valor más grande = 0.413

Valor más pequeño = 0.380

El valor crítico al 5% es

Puesto que Q>Q*, se rechaza el valor sospechoso al nivel de significancia del 5%, es decir, el dato es

anómalo.

3.4.2 Test de Grubbs

Como ayuda a la decisión sobre si un dato es o no atípico, se dispone de la prueba de Grubbs, la cual

exige que la muestra proceda de una población normal. Debería probarse, primeramente, que los datos

puedan ser razonablemente aproximados por una distribución normal antes de aplicar el test de Grubbs.

El contraste se plantea en los siguientes términos:

H0: "no hay datos atípicos en la muestra"

frente a la alternativa:

HA: "hay al menos un dato atípico".

Cuando se trata de una prueba a dos colas, se hará uso del estadístico:


siendo la media y s la desviación típica muestrales.

El test de Grubbs puede también ser definido como una de las siguientes pruebas a una cola.

1. Probar que el mínimo valor es un anómalo.

2. Probar que el máximo valor es un anómalo.

La región crítica de este contraste se puede obtener aproximadamente tomando como referencia la

distribución tn-2 de Student con (n - 2) grados de libertad y nivel de significancia *= /(2n) si es a dos

colas, o *= /n si la prueba se realiza a una cola.

Se aceptará la hipótesis alternativa HA de existencia de dato atípico si G excede de cierto valor crítico G*:

Ejemplo 3:

En un estudio sobre la posible influencia del tamaño del cerebro humano en la inteligencia, se ha

estimado la dimensión del órgano como el número de píxeles que ocupa en sendas imágenes obtenidas

por Resonancia Magnética. Los sujetos bajo estudio han sido 20 estudiantes masculinos de psicología de

cierta Universidad norteamericana. Al representar los datos en un histograma, se ha observado que el

primero aparece algo apartado de los demás, por lo que se sospecha que pueda ser atípico. Se supone que

la población tiene distribución normal.

1201121 1038437 965353 904858 955466

1079549 924059 945088 889083 892420

905940 955003 935494 1062462 949589

997925 879987 949395 930016 935863

Se aplica el test de Grubbs para contrastar la hipótesis nula de que no hay un registro anómalo.

La media de los datos es 964855.40 y la desviación estándar es 78103.09, y con estos valores se obtienen

los siguientes valores absolutos de zi.

3.03 0.94 0.01 0.77 0.12

1.47 0.52 0.25 0.97 0.93

0.75 0.13 0.38 1.25 0.20

0.42 1.09 0.20 0.45 0.37

Dado que 3.03>2.7, se rechaza la hipótesis nula. Según la prueba de Grubbs, todo parece indicar que el

dato 1201121 es atípico. Un fallo en la transcripción de la información muestral provocó la aparición de

esta cantidad en lugar de la correcta, que era 1001121. Corríjase este primer valor de la muestra y

ejecútese nuevamente el programa; el problema queda ahora resuelto.

3.5 Análisis de la precisión La precisión depende de la variabilidad de los datos, la cual determinaremos utilizando la varianza.

Analizaremos dos casos:

Comparar la varianza de una población con un valor preestablecido.


Comparar las varianzas de dos poblaciones.

3.5.1 Test Chi-cuadrado

Chi-cuadrado es una distribución asimétrica y no negativa. Este test permite verificar si la varianza de

una población es estadísticamente igual a un valor preestablecido. Utiliza la varianza de la muestra

considerada, por lo tanto es paramétrico.

La hipótesis nula postula que no hay diferencia entre la varianza poblacional 2 y el valor v.

El nivel de significancia se fija a priori. El valor del test estadístico se calcula mediante la fórmula que

se presenta a continuación. Los valores críticos se encuentran tabulados y se los localiza conociendo el

número de grados de libertad (n-1) y el nivel de significancia . Se toma la decisión de aceptar H0

cuando se cumple la doble condición indicada (en un test a dos colas).

Ejemplo 4:

Un proceso se encuentra fuera de control cuando su varianza excede el valor 5.6 . Se toma una muestra

de tamaño 25 con una varianza igual a 5.78 . Hay evidencia suficiente para decir que el proceso está

fuera de control al nivel de significancia del 5% ?.

1) H0: 2 5.6 HA:

2 > 5.6 (1 cola)

2) = 0.05

3) Test paramétrico chi-cuadrado.

4) Se calcula el valor del test:

2

2

2

2

1

25 1578

5624 771

( )

( ).

..

ns

5) El valor crítico tabulado es: 2

24 0 0536 415*

( , . ).

La zona de rechazo está a la derecha del valor crítico.

6) Puesto que el valor del test cae en la zona de aceptación, se procede a aceptar la hipótesis nula. Por

tanto, se concluye que la evidencia presentada no es suficiente para manifestar que el proceso está

fuera de control.

3.5.2 Test F

La distribución F es asimétrica y no negativa. Se utiliza para comparar las varianzas de dos poblaciones,

bajo el conocimiento de las varianzas de dos muestras; entonces es paramétrico.

La hipótesis plantea la igualdad entre las varianzas.



número de grados de libertad tanto del numerador como del denominador (n1-1 y n2-1) y el nivel de

significancia ( ). Se toma la decisión de aceptar H0 cuando se cumple la doble condición indicada (en un

test a dos colas).


Debido a la asimetría de la distribución F, el valor crítico de la izquierda

Ejemplo 5:

Dos muestras aleatorias de los resultados de una prueba dan las siguientes estadísticas:

Clase A: n = 16 s2 = 92.3

Clase B: n = 25 s2 = 34.7

Estos datos proveen suficiente evidencia para rechazar la hipótesis de que las dos clases tienen varianzas

iguales para los resultados de la prueba involucrados?. Usar = 0.05 .

1) H0: 2

A = 2

B HA: 2

A 2

B (dos colas)

2) = 0.05

3) Test paramétrico F.

4) Se calcula el valor del test: F = s2A / s

2B = 92.3 / 34.7 = 2.66

5) Los valores críticos son:

F*

(15,24,0.025) = 2.44 1/ F*

(15,24,0.025) = 1/2.44 = 0.41

6) Las zonas de rechazo están a la izquierda de 0.41 y a la derecha de 2.44 El valor del test (2.66) cae

en la zona de rechazo derecha por lo tanto se rechaza la hipótesis nula y se concluye que los resultados

de la prueba, para las dos clases, tienen varianzas diferentes.

3.6 Análisis de las medias Dentro del análisis de medias se pueden tener los siguientes casos:

Comparar la media de una población con un valor preestablecido.

Comparar las medias de dos poblaciones independientes.

Comparar las medias de dos poblaciones dependientes.

3.6.1 Test t para una población

La distribución t (conocida también como t de Student) es simétrica alrededor de la media. Tiene algunas

variantes, pero ahora nos ocuparemos de aquella que permite comparar la media de una población con un

valor dado. Requiere el conocimiento de la media y desviación estándar muestrales, por tanto es

paramétrica.



número de grados de libertad (n-1) y el nivel de significancia . Se toma la decisión de aceptar H0

cuando se cumple la doble condición indicada (en un test a dos colas).

Por la simetría de la distribución t, se tiene que

Ejemplo 6:

La muestra utilizada anteriormente arrojó una media igual a 8.75 . Hay evidencia suficiente para aceptar

el postulado de que la media es igual a 8.32 al nivel del 5% ?.

1) H0: = 8.32 HA: 8.32 (dos colas)

2) = 0.05

3) Test paramétrico t para una población.

4) El valor del test se calcula:


5) Los valores críticos tabulados son: ± t*(24,0.025) = ± 2.064

Las zonas de rechazo están a la derecha de t* y a la izquierda de -t

*.

6) Puesto que el valor del test está en la zona de aceptación, se acepta H0. Esto significa que no hay

evidencia suficiente para decir que la media no es igual a 8.32

3.6.2 Test t para dos poblaciones (muestras independientes)

Dos muestras son independientes cuando la fuente de la cual provienen es diferente. Se necesita conocer

las medias y las varianzas de las dos muestras. La hipótesis nula postula que las medias de las dos

poblaciones son iguales.

Para el análisis de las medias se debe considerar previamente si las varianzas son o no iguales (realizar un

test F) puesto que el test t es diferente.

VARIANZAS IGUALES

Cuando las varianzas son iguales es necesario calcular la desviación estándar pesada SP.

El número de grados de libertad es la suma de los grados de libertad de las dos muestras:



número de grados de libertad (n1 + n2 - 2) y el nivel de significancia ( ). Se toma la decisión de aceptar

H0 cuando se satisface la misma condición que en el caso anterior.

Ejemplo 7:

Dos poblaciones normalmente distribuidas se muestrean para comparar sus medias. ¿Los datos

siguientes, soportan la hipótesis de que las dos medias poblacionales son significativamente diferentes?.

Usar =0.05

n x

n x

1 1

2 2

12 75 6

15 78 7

s = 7.2

s = 8.1

2

2

1

2

.

.

1) H0: 1 = 2 HA: 1 2 (dos colas)

2) = 0.05

3) Test paramétrico t para dos poblaciones con varianzas iguales (se puede probar con un test F).

Muestras independientes.

4) Calculamos el valor del test. Es necesario que se encuentre el valor de la desviación estándar

ponderada sp.

5) Los valores críticos del test son ± t*

(25,0.025) = ± 2.060

6) Las zonas de rechazo se encuentran a la izquierda de -2.060 y a la derecha de 2.060 El valor del test (-

2.884) cae en la zona de rechazo izquierda por tanto se rechaza la hipótesis nula aceptándose, por

consiguiente, la hipótesis alternativa. Se concluye que las medias son significativamente diferentes.


Cuando no se sabe nada respecto a las varianzas poblacionales, se debe realizar previamente un test F

para determinar si éstas son iguales o no, y de esta manera escoger el test t apropiado.

VARIANZAS DESIGUALES

Cuando las varianzas son diferentes, el número de grados de libertad considerado será calculado

utilizando la expresión:


se presenta a continuación.

Los valores críticos se encuentran tabulados y se los localiza conociendo el número de grados de libertad

y el nivel de significancia ( ). Se toma la decisión de aceptar H0 cuando se satisface la misma condición

que en el caso anterior.

Ejemplo 8:

Dos máquinas dispensadoras de bebidas se muestrean para probar si las dos dispensan la misma cantidad

de bebida. Usar =0.05.

Máq. Cantidad dispensada

C 6.5 6.8 3.0 6.0 5.8 6.1 3.3 3.4 5.9 6.2

P 7.6 6.0 6.1 6.0 7.4 7.3 6.0 6.2 6.3 6.1

1) H0: 1 = 2 HA: 1 = 2 (dos colas)

2) = 0.05

3) Puesto que las varianzas son 2.13 y 0.43 respectivamente, se puede probar con un test F que son

significativamente diferentes. Se usa por tanto el test paramétrico t para dos poblaciones con

varianzas no iguales.

4) Calculamos el valor del test.

5) Los valores críticos tabulados son ± t*

(9,0.025) = ± 2.262

La zona de aceptación está comprendida entre -2.262 y 2.262

6) El valor del test cae fuera de la zona de aceptación, por tanto se concluye que las dos máquinas

dispensan diferentes cantidades de bebida.

3.6.3 Test t para dos poblaciones (muestras dependientes)

Dos muestras son dependientes cuando provienen de la misma fuente. En este caso es indispensable que

las muestras tengan el mismo tamaño (datos apareados). La hipótesis nula postula que la media de las

diferencias es igual a cero.

Es necesario determinar la media y la desviación estándar de las diferencias . El número de

grados de libertad es n-1, donde n es el tamaño de cualquiera de las dos muestras.


se presenta a continuación.


Los valores críticos se encuentran tabulados y se los localiza conociendo el número de grados de libertad

(n-1) y el nivel de significancia . Se toma la decisión de aceptar H0 cuando se satisface la misma

condición que en el caso anterior.

Ejemplo 9:

Un sociólogo está estudiando los efectos de cierta película sobre las actitudes de los hombres negros con

respecto a los hombres blancos. Al azar se seleccionaron doce hombres negros y se les pidió que llenen

un cuestionario antes y después de ver la película. Los resultados se muestran a continuación.(3)

Antes 10 13 18 12 9 8 14 12 17 20 7 11

Después 5 9 13 17 4 5 11 14 13 18 7 12

1) H0: d = 0 HA: d 0 (dos colas)

2) = 0.05

3) Test paramétrico t para dos poblaciones. Muestras dependientes.

4) Para calcular el test es necesario conocer la media y la desviación estándar de las diferencias.

Antes 10 13 18 12 9 8 14 12 17 20 7 11

Después 5 9 13 17 4 5 11 14 13 18 7 12

di 5 4 5 -5 5 3 3 -2 4 2 0 -1

5) Los valores críticos del test son ± t*

(11,0.025) = ± 2.201

6) La zona de aceptación va desde -2.201 hasta 2.201; el valor del test cae en la zona de aceptación de la

hipótesis. La película realmente no tiene efecto sobre las actitudes de los hombres negros.

3.7 Análisis de varianza En el trabajo analítico se presentan a menudo comparaciones en las que intervienen más de dos medias.

Entonces, existen dos posibles fuentes de variación: la primera, que siempre está presente, debida al error

aleatorio en la medida; y la segunda, debida al factor controlado.

El análisis de varianza es una técnica estadística muy poderosa que se utiliza para separar y estimar las

diferentes causas de variación.

Generalmente se tienen los datos en forma tabulada y se procede a calcular las medias y varianzas para

cada muestra:

repeticiones cuenta media varianza

1 2 ………

mu

estr

a

1 x11 x12 r1

2 x21 x22 r2

k xk1 xk2 rk

El número de ensayos (repeticiones) para cada muestra no tiene porque ser el mismo, de modo que ri

representará el número de repeticiones realizadas con la i-ésima muestra. Entonces, el número total de

ensayos n estará dado por la suma de las repeticiones de cada muestra y la media global

La hipótesis nula adoptada es que todas las k muestras se extraen de una población con media y

varianza 2. Con base en esta hipótesis se puede estimar la varianza (cuadrado medio) de dos formas: una


estudia la variación dentro de cada muestra, y la otra la variación entre las distintas muestras.

Variación dentro de la muestra: La estimación de la varianza dentro de la muestra se realiza a través de

su cuadrado medio (CM) definido como el cociente entre la suma de cuadrados (SC) y los grados de

libertad (gl). Los grados de libertad para cada muestra están dados por el número de repeticiones

realizadas en la muestra menos uno:

Variación entre muestras: La estimación de la varianza entre las muestras se realiza a través de su

cuadrado medio.

Se procede a elaborar la tabla ANOVA de la siguiente manera:

Fuente de variación SC gl CM

Entre muestras

Dentro de la

muestra

Total

Para la variación total se acumulan los parciales tanto para la suma de cuadrados como para los grados de

libertad.

El valor del test está dado por , el cual se compara con el valor crítico a una

cola .

Si, por ejemplo, se desea estudiar el efecto de tres diferentes catalizadores sobre el rendimiento de un

producto industrial, ó examinar cinco diferentes técnicas analíticas para la determinación de la

concentración de una especie, es indispensable aplicar el análisis de varianza.

Ejemplo 10:

Considere que 3 diferentes catalizadores han sido utilizados en un estudio respecto al rendimiento de un

producto industrial. La tabla presenta los datos de este experimento y los resultados de algunos cálculos.

repeticiones

A 85 86 83 82 87 90 80 81 8 84.25 11.36 79.50 5.06 40.50

B 87 86 85 93 89 88 86 89 8 87.88 6.41 44.88 1.89 15.13

C 89 85 90 86 83 88 87 91 8 87.38 7.13 49.88 0.77 6.13

= 24 259.50

174.25

61.75

86.50


Se asume que las observaciones son independientes y que cada serie proviene de una población

normalmente distribuida con varianza 2. Sin embargo, cada serie tiene media diferente. Entonces, en

este caso se utilizará ANOVA para establecer si la diferencia observada entre las medias surge debido a

la casualidad exclusivamente, o existe evidencia de que existe diferencia significativa entre las medias.

Se definen las siguientes cantidades:

n = número de datos = 24

k = número total de tipos de factor (catalizadores) bajo análisis = 3

SC(dentro) = 174.25

SC(entre) = 61.75

gl(dentro) = n-k = 24-3 = 21

gl(entre) = k-1 = 3-1 = 2

CM(dentro) = 174.25/21 = 8.30

CM(entre) = 61.75/2 = 30.88

Un valor significativo para F indica una variación significativa debida a los distintos tipos de factor, esto

es, las medias de los tres catalizadores no son las mismas.

Los resultados del ANOVA a un factor para los datos se resumen:

Fuente de Variación SC gl CM

Entre series

(debido al catalizador) 61.75 2 30.88

Residual

(errores casuales) 174.25 21 8.30

Total 236.00 23

El test F da el siguiente resultado: F. = 30.88 / 8.30 = 3.72 > F*

(2, 21, 0.05) = 3.47

Como se deduce de la observación de la tabla, la variación entre series es claramente mayor que la

variación casual. Por consiguiente el valor de F es significativo. Esto indica que los rendimientos

promedio con los catalizadores A, B, y C son diferentes. Esto significa que uno ó dos de los catalizadores

considerados dan resultados significativamente mejores que el ó los otros.

3.8 Análisis del coeficiente de correlación Para determinar si existe o no correlación lineal entre dos variables, se procede a realizar la inferencia

estadística sobre el coeficiente de correlación lineal.

A continuación se analizarán dos métodos: uno paramétrico y otro no paramétrico. La hipótesis nula

postula que el coeficiente de correlación lineal es igual a cero, lo cual equivale a decir que no existe

correlación lineal entre las variables.

3.8.1 Test de Pearson

Compara directamente el valor del coeficiente de correlación muestral (r) con el valor crítico que se

localiza conociendo el número de grados de libertad (n-2) y el nivel de significancia ( ). La hipótesis se

acepta si se cumple la condición

3.8.2 Test de Spearman (Rank Correlation)

Se realiza un ranking para cada una de las variables. Como los datos son apareados, se calculan las

diferencias de los ranks correspondientes (di). El valor del test se calcula con la fórmula indicada a

continuación y se compara con el valor crítico que se localiza conociendo el tamaño de la muestra (n) y el

nivel de significancia ( ).


La hipótesis se acepta si se cumple la condición

Ejemplo 11:

Las distancias recorridas y los tiempos empleados por 15 trabajadores para llega a sus trabajos se indican

a continuación. Hay evidencia suficiente para decir que estos datos bivariados están linealmente

correlacionados?. Usar =0.05.

X(mil) 3 5 7 8 10 11 12 12 13 15 15 16 18 19 20

Y(min) 7 20 20 15 25 17 20 35 26 25 35 32 44 37 45

Método paramétrico :

1) H0: = 0 HA: 0 (dos colas)

2) = 0.05

3) Inferencia paramétrica sobre el coeficiente de correlación lineal.

4) El test es el valor del coeficiente de correlación lineal calculado r=0.879.

5) Los valores críticos tabulados son ± r*(13,0.025) = ± 0.514

La zona de aceptación se encuentra entre -0.514 y 0.514 .

6) El test cae en la zona de rechazo derecha, por lo tanto la evidencia presentada es suficiente para

rechazar la hipótesis nula. Esto significa que los datos si están linealmente correlacionados.

Método no paramétrico :

1) H0: = 0 HA: 0 (dos colas)

2) = 0.05

3) Test de correlación de rango de Spearman.

4) Para calcular el valor del test es necesario elaborar los rankings de cada una de las variables. Esto se

muestra en la siguiente tabla.

i X Y Rx Ry di di2

1 3 7 1.0 1.0 0.0 0.00

2 5 20 2.0 5.0 -3.0 9.00

3 7 20 3.0 5.0 -2.0 4.00

4 8 15 4.0 2.0 2.0 4.00

5 10 25 5.0 7.5 -2.5 6.25

6 11 17 6.0 3.0 3.0 9.00

7 12 20 7.5 5.0 2.5 6.25

8 12 35 7.5 11.5 -4.0 16.00

9 13 26 9.0 9.0 0.0 0.00

10 15 25 10.5 7.5 3.0 9.00

11 15 35 10.5 11.5 -1.0 1.00

12 16 32 12.0 10.0 2.0 4.00

13 18 44 13.0 14.0 -1.0 1.00

14 19 37 14.0 13.0 1.0 1.00

15 20 45 15.0 15.0 0.0 0.00

= 70.50

rs = 1 - 6*70.5/[15 (225-1)] = 0.874

5) Los valores críticos tabulados son ± rs*(15,0.025) = ± 0.521

La zona de aceptación va desde -0.521 hasta 0.521

6) El valor del test cae fuera de la zona de aceptación, por tanto se rechaza la hipótesis nula. Se concluye

que las variables están linealmente correlacionadas.

3.9 Actividades

3.9.1 En clase

a) Cuál es la diferencia sustancial entre los tests paramétricos y los no paramétricos?


b) Cuáles son las diferentes aplicaciones del test t?.

c) Dé ejemplos de muestras independientes y dependientes.

d) De los tests estudiados, cuáles son paramétricos y cuáles son no-paramétricos?

e) Las galletas se empaquetan en cajas que se afirma tienen un promedio de 7.25 onzas y 32 galletas. Se

contó el número de galletas en cada una de 18 cajas aleatoriamente seleccionadas. Los resultados se

totalizaron mediante x = 535 y x2 = 16010. Al 0.02 de nivel de significancia, concuerda con que el

número de galletas por paquete podría ser 32 ?.(3)

f) Muestras aleatorias de los resultados de una prueba en dos clases dieron las siguientes estadísticas:

Clase A : n = 16 s2 = 92.3

Clase B : n = 25 s2 = 34.7

Proveen estos datos suficiente razón para rechazar la hipótesis de que las dos clases tienen varianzas

iguales ?. Use = 0.05 (3)

g) Los siguientes datos fueron obtenidos en un experimento conducido por un jardinero, cuyo objeto era

descubrir cuando un cambio aplicado en la mezcla de fertilizante para sus plantas de tomate resultaría

en mejores frutos. Tenía 11 plantas en una fila; a 5 se les dio la mezcla estándar de fertilizante A, y las

6 restantes fueron alimentadas con una mezcla supuestamente mejorada de fertilizante B. Las mezclas

A y B fueron aplicadas al azar sobre la fila de plantas.

# 1 2 3 4 5 6 7 8 9 10 11

Mezcla A A B B A B B B A A B

Lbs

tomate

29.9 11.4 26.6 23.7 25.3 28.5 14.2 17.9 16.5 21.1 24.3

Al nivel de significancia del 5%, hay suficiente evidencia para sostener que la nueva mezcla de

fertilizante mejora la producción?.

3.9.2 En casa

a) En un gran huerto de cerezas el promedio producido ha sido 4.35 toneladas por acre en los últimos

años. Se probó un nuevo fertilizante sobre 15 lotes de un acre, seleccionados al azar. La producción

de estos lotes fue la siguiente:

3.56 4.93 5.12 4.45 3.48

5.00 3.92 5.13 5.35 4.45

4.88 4.25 4.79 4.81 4.72

Al nivel de significancia del 0.05, se tiene suficiente evidencia para afirmar que hubo un incremento

significativo en la producción ?. (3)

b) Anteriormente la desviación estándar de los pesos de ciertos paquetes de 32.0 onzas llenados por una

máquina fue 0.25 onzas. Una muestra aleatoria de 20 paquetes mostró una desviación estándar de

0.35 onzas. Es el aparente incremento en variabilidad, significativo al nivel de significancia de 0.10 ?. (3)

c) La desviación estándar de las temperaturas anuales de una ciudad en un período de 100 años es 15 F.

Usando la temperatura media en el 15 día de cada mes durante los últimos 12 meses, una desviación

estándar de temperaturas anuales se calculó como 10.5 F. Es la temperatura en la ciudad

significativamente menos variable que en el pasado a un nivel de significancia de 0.10 ?.(3)

d) La contaminación del aire se determina midiendo varios elementos diferentes que pueden detectarse

en el aire. Uno de ellos es el monóxido de carbono (CO). La muestra de lecturas diarias en la tabla

siguiente se obtuvo del diario local.

3.5 3.9 2.8 3.1 3.1 3.4

4.8 3.2 2.5 3.5 4.4 3.1

1. Calcule la media y la desviación estándar para esta muestra.

El monóxido de carbono es medido e interpretado de acuerdo con la escala :

bajo : de 0 a 4.9; medio : de 4.9 a 14.9; alto : de 14.9 en adelante

2. Presenta la muestra suficiente evidencia para permitir concluir que el nivel de monóxido de

carbono es bajo al nivel de significancia del 5% ?.


3. Presenta la muestra suficiente evidencia para permitir rechazar la afirmación de que la varianza de

las lecturas de CO no es mayor que 0.25 a =0.05 ? (3)

f) Dos muestras independientes se tomaron de poblaciones normales, con los resultados mostrados en la

tabla adjunta. Esta información provee suficiente razón para rechazar la hipótesis nula en favor de la

afirmación de que la media de la población R es significativamente mayor que la media de la

población S ?. Use = 0.05 (3)

Muestra n x (x - x )2

R 10 295 75

S 8 195 90

g) Los efectos corrosivos de varios suelos sobre los filtros de acero con revestimiento y sin revestimiento

fueron probados usando un plan de muestreo dependiente. Los datos recogidos son resumidos en

n = 40 d = 220 d2 = 62220

donde d es la cantidad de corrosión de la porción revestida substraída de la cantidad de corrosión de la

porción no revestida. Provee esta muestra suficiente razón para concluir que el revestimiento es

beneficioso ?. Use = 0.01. (3)

h) Las dos muestras independientes de la tabla adjunta se obtuvieron esperando demostrar que la media

de la población A es mayor que la media de la población B. Las muestras proveen evidencia

significativa para justificar tal esperanza (utilice el test no paramétrico)?. Use = 0.05 (3)

Muestra A 6 7 7 6 6 5 6 8 5 4

Muestra B 7 2 4 3 3 5 4 6 4 2

i) Se ha efectuado un estudio respecto al tiempo de coagulación de la sangre de 24 animales los cuales

han sido distribuidos de manera casual en 4 grupos y se les ha suministrado 4 diferentes dietas

alimenticias (A, B, C, y D). Los resultados se resumen en la siguiente tabla:

A B C D

62 63 68 56

60 67 66 62

63 71 71 60

59 64 67 61

66 68 63

68 64

63

59

Media= 61,0 66,2 68,0 61,0

Aplique el análisis de varianza a un factor para establecer si existe o no diferencia significativa entre las

medias de los tiempos de coagulación de sangre obtenidos para las cuatro dietas y de acuerdo a esto

determine si es posible establecer cual es la mejor dieta a usar para el propósito de reducir el tiempo de

coagulación de la sangre de estos animales.

j) En un estudio del corazón se midió la presión sistolítica de la sangre a 24 hombres de 25 años de edad

y a 30 hombres de 40 años de edad. Muestran los datos siguientes suficiente evidencia para concluir

que los hombres de mayor edad tienen presión sistolítica de la sangre más alta, al nivel de

significancia del 0.02 ?. (3)

25 años :

95 100 100 105 106 108 110 110 115 118 120 122

124 125 130 130 130 132 136 138 140 148 150 156

40 años :

108 110 110 114 114 116 118 120 122 124

126 126 128 130 130 132 136 136 136 140


142 142 146 148 150 152 154 160 164 176

Documents

Inferencia estadística