Comparaciones Multiples Gabriel Alvarez-Maria Oviedo

UNIVERSIDAD CENTRAL DE VENEZUELAFACULTAD DE AGRONOMÍA

POSTGRADO EN ESTADÍSTICA

Comparaciones Múltiples

Gabriel ÁlvarezProf. Wilfre Machado

Maracay, Marzo de 2014

Procedimientos estadísticos realizados para encontrar él ó los grupos de tratamientos que influyen sobre la variable respuesta, los cuales son sugeridos por los datos una vez que ha ocurrido el rechazo de la hipótesis nula en el análisis de varianza correspondiente.

Se ha desarrollado y automatizado mediante software de análisis de datos estadístico, una gran cantidad de estos procedimientos, su aplicación dependerá de los criterios del investigador y de la situación real que esté bajo estudio.


COMPARACIONES A PRIORI

(PLANIFICADAS)

COMPARACIONES A POSTERIORI

(NO PLANIFICADAS)

Son las que el investigador fórmula y plantea cuando

están diseñando el experimento

Surgen de las conclusiones obtenidas

del ANAVAR

Contrastes ortogonales

LSD*

SNK*TUKEY*

DUNCAN*SHEFFE

WALLER-DUNCANGABRIEL

BONFERRONIPRUEBAS CONTRA UN TESTIGO (DUNNETT)*

Comparaciones Múltiples Clasificación

Pruebas que involucran sólo algunas

comparaciones

Pruebas que involucran la comparaciones de todos

los pares de media

Utiliza las pruebas de t para realizar comparaciones por pares entre las medias de los grupos, pero controla la tasa de error global estableciendo que la tasa de error de cada prueba sea igual a la tasa de error por experimento dividida entre el número total de contrastes. Esto es dividiendo el nivel de significancia escogido entre el numero total de comparaciones α/m, llamaremos B al estadístico de comparación o valor critico, el cual se obtiene por la siguiente formula:

Se declara significativa la diferencia entre las medias si

Bonferroni

Ejemplo:Un odontólogo está estudiando una sustancia recientemente desarrollada para ser utilizada en el control de placa bacteriana en la boca. Los experimentos se realizan a cinco concentraciones diferentes. La respuesta observada es el porcentaje de placa controlada por la sustancia. Se han obtenido los siguientes datos, concentraciones de una sustancia para el control de la placa bacteriana:

TratamientosN° T1 T2 T3 T4 T5 1 40 36 49 47 552 45 42 51 49 603 42 38 53 51 624 48 39 53 52 635 50 37 52 50 596 51 40 50 51 61

46.00 38.67 51.33 50.00 60.00

Se realiza el correspondiente análisis de varianza para un DCA en Statistix con la correspondiente salida:

Completely Randomized AOV for OBS

Source DF SS MS F PTRAT 4 1458.13 364.533 47.8 0.0000Error 25 190.67 7.627Total 29 1648.80

Se rechaza la Ho: por tanto puede considerarse que algunos tratamientos son diferentes, se realiza prueba de comparaciones de medias, de acuerdo al AOV se tienen los siguientes datos: CMEE=7.627 GLEE=25, se fija el nivel de significancia =0.10, ni=6 nj=6 Calculamos donde m=con lo cual =0.10/10=0.01 para cada comparación, se toma entonces la tabla t para dos colas con = 0.01 y v=25 que a continuación se muestra

Calculamos el estadístico de comparación con este valor:

Si la diferencia es significativa

Ordenamos las medias T5=60, T3=51.33, T4=50, T1=46, T2=38.7 y comparamos su diferencia con el valor crítico

T5 T3 T4 T1 T2

Se concluye que la sustancia T5 tiene mayor efecto sobre el porcentaje controlado de placa bacteriana; T3, T4 y T1 tienen efectos similares sobre el control de la placa , la sustancia T2 tiene el menor efecto sobre el control de la placa bacteriana .

Este método intenta resolver el problema que tiene la aplicación de numerosas pruebas de Student reduciendo la probabilidad de cometer un error de tipo I en cada comparación, controla la tasa de error dividiendo el nivel de significación α entre el número de comparaciones k realizadas.

Cada comparación se evalúa utilizando un nivel de significación α B= α/k

este procedimiento trabaja razonablemente bien cuando se tiene un número pequeño de grupos (Glantz, 2003). Si la cantidad de tratamientos se incrementa a ocho o a diez, el valor de t requerido para detectar una diferencia será demasiado grande, (el valor de α B será demasiado

pequeño), de manera que en la práctica el método se vuelve incapaz de detectarlas. En tales casos no se recomienda su uso

GabrielPrueba de comparación por parejas que utiliza el módulo máximo estudentizado cuando los tamaños de las muestras son desiguales. Para tamaños iguales de las muestras la prueba de Gabriel es equivalente al método GT2 de Hoctberg.La prueba de Gabriel puede volverse liberal cuando los tamaños de las muestras varían mucho.

El método es aplicable sólo a medias aritméticas se declara significativa la diferencia entre medias si

Donde es el valor critico de la distribución de máximo módulo estudentizado con un nivel de confianza total de comparaciones y grados de libertad

Considérese los datos del ejemplo anterior :

TratamientosN° T1 T2 T3 T4 T5 1 40 36 49 47 552 45 42 51 49 603 42 38 53 51 624 48 39 53 52 635 50 37 52 50 596 51 40 50 51 61

46.00 38.67 51.33 50.00 60.00

Se realiza el correspondiente análisis de varianza para un DCA en Statistix con la correspondiente salida:

Se rechaza Ho: por tanto puede considerarse que algunos tratamientos son diferentes, se realiza prueba de comparaciones de medias, de acuerdo al AOV se tienen los siguientes datos: CMEE=7.627 GLEE=25, se fija el nivel de significancia =0.05, ni ynj son los tamaños de las celdas correspondientes a cada media que se compara, el valor máximo módulo estudentizado es 3,048 véase la tabla anexa

Completely Randomized AOV for OBS

Source DF SS MS F PTRAT 4 1458.13 364.533 47.8 0.0000Error 25 190.67 7.627Total 29 1648.80

Si la diferencia es significativa Ordenamos las medias T5=60, T3=51.33, T4=50, T1=46, T2=38.7 y comparamos su diferencia con el valor crítico

***

**

* *

T5 T3 T4 T1 T2

T3 y T4 no son significativamente diferentes.

Consideremos los siguientes datos :

TratamientosN° T1 T2 T3 T4 T5 1 40 36 49 47 552 45 53 51 49 603 51 38 53 51 624 48 39 66 52 635 50 52 596 50 61

46.80 38.67 53.50 49.75 52.17

Realizaremos el ANAVAR correspondiente en SPSS ver 18 y el procedimiento de Gabriel para comparar las medias correspondientes

Hacemos click en el botón PostHoc

Marcamos la opción de Gabriel, hacemos click en el botón Continue

hacemos click en el botón Ok y esperamos por los resultados

• LSD. Utiliza pruebas t para llevar a cabo todas las comparaciones por pares entre las medias de los grupos. No se efectúa ninguna corrección de la tasa de error para el hecho de realizar múltiples comparaciones.

• Bonferroni. Utiliza las pruebas de t para realizar comparaciones por pares entre las medias de los grupos, pero controla la tasa de error global estableciendo que la tasa de error de cada prueba sea igual a la tasa de error por experimento dividida entre el número total de contrastes. Así, se corrige el nivel crítico por el hecho de que se están realizando múltiples comparaciones.

Procedimientos de Comparaciones Múltiples

• Sidak. Prueba de comparaciones múltiples por parejas basada en un estadístico t. La prueba de Sidak corrige el nivel de significación para las comparaciones múltiples y da lugar a límites más estrechos que los de Bonferroni.

• Scheffé. Realiza comparaciones múltiples conjuntas por parejas para todas las parejas de combinaciones de las medias posibles. Utiliza la distribución muestral F. Puede utilizarse para examinar todas las combinaciones lineales de grupos de medias posibles, no sólo las comparaciones por parejas.


• R-E-G-W F. Procedimiento múltiple por pasos (por tamaño de las distancias) de Ryan-Einot-Gabriel-Welsch que se basa en una prueba F.

• R-E-G-W Q. Procedimiento múltiple por pasos (por tamaño de las distancias) de Ryan-Einot-Gabriel-Welsch que se basa en el rango estudentizado.

• S-N-K. Realiza todas las comparaciones por parejas entre las medias utilizando la distribución del rango de Student. Con tamaños de grupo iguales, también compara pares de medias dentro de subconjuntos homogéneos utilizando un procedimiento por pasos. Las medias se ordenan de mayor a menor y se comparan primero las diferencias más extremas.


• Tukey. Utiliza el estadístico del rango estudentizado para realizar todas las comparaciones por pares entre los grupos. Establece la tasa de error por experimento como la tasa de error para el conjunto de todas las comparaciones por pares.

• Tukey-b. Prueba que emplea la distribución del rango estudentizado para realizar comparaciones por pares entre los grupos. El valor crítico es el promedio de los valores correspondientes a la diferencia honestamente significativa de Tukey y al método de Student-Newman-Keuls.

• Duncan. Realiza comparaciones por pares utilizando un orden por pasos idéntico al orden usado por la prueba de Student-Newman-Keuls, pero establece un nivel de protección en la tasa de error para la colección de contrastes, en lugar de usar una tasa de error para los contrastes individuales. Utiliza el estadístico del rango estudentizado.


• GT2 de Hoctberg. Prueba de comparaciones múltiples y de rango que utiliza el módulo máximo estudentizado. Es similar a la prueba de la diferencia honestamente significativa de Tukey.

• Waller-Duncan. Prueba de comparaciones múltiples basada en un estadístico t. Utiliza la aproximación Bayesiana.


• Dunnett. Prueba de comparaciones múltiples por parejas que compara un conjunto de tratamientos respecto a una única media de control. La última categoría es la categoría de control por defecto. Si lo desea, puede seleccionar la primera categoría. Para comprobar que la media de cualquier nivel del factor (excepto la categoría de control) no es igual a la de la categoría de control, utilice una prueba bilateral. Para contrastar si la media en cualquier nivel del factor es menor que la de la categoría de control, seleccione < Control. Para contrastar si la media en cualquier nivel del factor es mayor que la de la categoría de control, seleccione> Control.


Existe una gran cantidad de métodos de comparación múltiple; como ya se había enunciado uno de los supuestos para la aplicación del ANAVAR es la homogeneidad de varianzas y varias pruebas de comparaciones múltiples son sensibles a la igualdad ó no de las varianzas.

Para varianzas homogéneas:MDSBONFERRONISIDAKREGWSTUDENT NEUMAN KEULSTUKEYTUKEY B

Para varianzas heterogéneasT2 de TamhaneT3 de DunettGames-HowellC de Dunett

UNIVERSIDAD CENTRAL DE VENEZUELAFACULTAD DE AGRONOMÍA

POSTGRADO EN ESTADÍSTICA


María Virginia Oviedo FProf. Wilfre Machado

Maracay, Marzo de 2014

Scheffé

» Ventajas: Realiza los diferentes contrastes, manteniendo fijo un determinado valor alfa, o máxima probabilidad de cometer un error tipo I .

» Desventaja: Problema de realizar estas pruebas con la t, sería la acumulación de la probabilidad de cometer error tipo I en cada una de las diferentes pruebas.

Se basa en el cálculo de un rango o diferencia mínima, que nos ayudará a decidir si las diferencias entre las medias de los grupos, pueden considerarse significativas o no. Sí la diferencia entre las medias, en valor absoluto, es menos que el valor crítico de Scheffé, concluiremos que la diferencia no es significativa; por el contrario, si la diferencia es mayor que el valor crítico, se considerará que las diferencias entre los grupos son estadísticamente significativas.

Donde k representa el número de grupos, o categorías de la variable categórica; F es el valor de la F de Snedecor en función de los grados de libertad entre grupos e intragrupos y un alpha determinado . En esa expresión,a demás representa el cuadrado medio o varianza intragrupos o residual y representa el número de sujetos que hay en cada grupo.

raCM int

1n

Reagrupando los datos diferenciando los tres grupos de sujetos:

krakNkscheffé n

CMFkC 2).1( int);/1(

72,2162.22,192.68,3.2

schefféC

TukeyUtiliza el estadístico del rango estudentizado para realizar todas las comparaciones por pares entre los grupos. Establece la tasa de error por experimento como la tasa de error para el conjunto de todas las comparaciones por pares.

Su procedimiento se desarrolla considerando en primer lugar el caso del modelo unifactorial equilibrado, sus intervalos de confianza pertenecientes a 1-alpha

Ejercicio: Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos impuestos por el gobierno para el control de desechos de fabricación, pero quisiera determinar cuál es la situación de las otras tres. Para el efecto se toman cinco muestras de los líquidos residuales de cada una de las plantas y se determina la cantidad de contaminantes. Los resultados del experimento aparecen en la siguiente tabla.

Planta ContaminantesA 1,65 1,72 1,50 1,35 1,60 5 7,84 1,568B 1,70 1,85 1,46 2,05 1,80 5 8,86 1,772C 1,40 1,75 1,38 1,65 1,55 5 7,73 1,546D 2,10 1,95 1,65 1,88 2,00 5 9,58 1,916

iXjn iX

Conclusión: Puesto que se rechaza H0 y se concluye que hay diferencia significativa (al 5%) entre las cantidades medias de contaminantes para las diferentes plantas.

teorcalc FF

La aplicación reiterada de este procedimiento, para un nivel de

significación alfa dado, puede conducir a un número grande de

rechazos de la hipótesis nula aunque no existan diferencias reales

(desigualdad de bonferroni y el rango estandarizado: método de la

diferencia significativa honesta propuesta por Tukey o método HSD) y

a los procedimientos de rangos múltiples de Newman-Keuls y Duncan.

Finalmente se estudia el procedimiento general de Scheffé, basado en

la construcción de intervalos de confianza simultáneos para todas las

posibles diferencias de medias y que permite su extensión a

comparaciones más generales denominadas contrastes

Gracias por su atención.

Bibliografía

Biotecnología Vegetal Vol 8 N-2 p 67-71 Abril junio 2008SAS online Doc. Versión 7-1Melo y López Manual de diseño de Experimentos p 191Diseño de Experimentos Robert Khuel Análisis y Diseño de Experimentos D.C Montgomery SSPS 18 Online Help

Documents

Comparaciones Multiples Gabriel Alvarez-Maria Oviedo