124
IBM SPSS Advanced Statistics 23

IBM SPSS Advanced Statistics

Embed Size (px)

DESCRIPTION

Este manual en español corresponde a la versión más actual que es la 24 del año 2015

Citation preview

  • IBM SPSS Advanced Statistics 23

  • NotaAntes de utilizar esta informacin y el producto al que da soporte, lea la informacin que se incluye en el apartadoAvisos en la pgina 109.

    Informacin del producto

    Esta edicin se aplica a la versin 23, release 0, modificacin 0 de IBM SPSS Statistics y a todas las versiones ymodificaciones posteriores hasta que se indique lo contrario en nuevas ediciones.

  • ContenidoCaptulo 1. Introduccin a Estadsticasavanzadas. . . . . . . . . . . . . . 1

    Captulo 2. Anlisis MLG multivariante . 3Modelo MLG multivariante . . . . . . . . . 4

    Generar trminos . . . . . . . . . . . . 4Suma de cuadrados . . . . . . . . . . . 5

    MLG Multivariante: Contrastes . . . . . . . . 6Tipos de contrastes . . . . . . . . . . . 6

    Grficos de perfil de MLG multivariante . . . . . 6MLG multivariante: Comparaciones post hoc . . . 7MLG: Guardar. . . . . . . . . . . . . . 8MLG Multivariante: Opciones . . . . . . . . 9Caractersticas adicionales del comando GLM . . . 10

    Captulo 3. MLG Medidas repetidas . . 11MLG Medidas repetidas: Definir factores . . . . 13MLG Medidas repetidas: Modelo . . . . . . . 14

    Generar trminos . . . . . . . . . . . 14Suma de cuadrados. . . . . . . . . . . 14

    MLG Medidas repetidas: Contrastes . . . . . . 15Tipos de contrastes . . . . . . . . . . . 15

    MLG Medidas repetidas: Grficos de perfil . . . . 16MLG Medidas repetidas: Comparaciones post hoc 16MLG medidas repetidas: Guardar . . . . . . . 18MLG Medidas repetidas: Opciones . . . . . . 18Caractersticas adicionales del comando GLM . . . 19

    Captulo 4. Anlisis de componentesde la varianza. . . . . . . . . . . . 21Componentes de la varianza: Modelo. . . . . . 22

    Generar trminos . . . . . . . . . . . 22Componentes de la varianza: Opciones . . . . . 22

    Sumas de cuadrados (Componentes de lavarianza) . . . . . . . . . . . . . . 23

    Componentes de la varianza: Guardar en archivonuevo . . . . . . . . . . . . . . . . 24Caractersticas adicionales del comando VARCOMP 24

    Captulo 5. Modelos lineales mixtos . . 25Modelos lineales mixtos: Seleccin de las variablesde Sujetos/Repetidas . . . . . . . . . . . 26Efectos fijos de los Modelos lineales mixtos. . . . 27

    Generar trminos no anidados . . . . . . . 27Generar trminos anidados . . . . . . . . 27Suma de cuadrados. . . . . . . . . . . 28

    Efectos aleatorios de los Modelos lineales mixtos . . 28Estimacin de los Modelos lineales mixtos . . . . 29Estadsticos de Modelos lineales mixtos . . . . . 29Medias marginales estimadas de modelos linealesmixtos . . . . . . . . . . . . . . . . 30Guardar Modelos lineales mixtos . . . . . . . 31Caractersticas adicionales del comando MIXED . . 31

    Captulo 6. Modelos linealesgeneralizados. . . . . . . . . . . . 33Modelos lineales generalizados: Respuesta . . . . 36

    Modelos lineales generalizados: Categora dereferencia . . . . . . . . . . . . . . 36

    Modelos lineales generalizados: Predictores. . . . 36Modelos lineales generalizados: Opciones . . . 37

    Modelos lineales generalizados: Modelo . . . . . 37Modelos lineales generalizados: Estimacin. . . . 38

    Modelos lineales generalizados: Valores iniciales 39Modelos lineales generalizados: Estadsticos . . . 40Modelos lineales generalizados: Medias marginalesestimadas . . . . . . . . . . . . . . . 41Modelos lineales generalizados: Guardar . . . . 42Modelos lineales generalizados: Exportar . . . . 43Caractersticas adicionales del comando GENLIN. . 44

    Captulo 7. Ecuaciones de estimacingeneralizadas . . . . . . . . . . . . 45Ecuaciones de estimacin generalizadas: Tipo demodelo . . . . . . . . . . . . . . . . 47Respuesta de las ecuaciones de estimacingeneralizadas . . . . . . . . . . . . . . 49

    Ecuaciones de estimacin generalizadas:Categora de referencia . . . . . . . . . 49

    Ecuaciones de estimacin generalizadas: Predictores 50Ecuaciones de estimacin generalizadas:Opciones . . . . . . . . . . . . . . 50

    Ecuaciones de estimacin generalizadas: Modelo . . 51Ecuaciones de estimacin generalizadas: Estimacin 51

    Ecuaciones de estimacin generalizadas: Valoresiniciales . . . . . . . . . . . . . . 53

    Ecuaciones de estimacin generalizadas: Estadsticos 53Ecuaciones de estimacin generalizadas: Mediasmarginales estimadas . . . . . . . . . . . 54Ecuaciones de estimacin generalizadas: Guardar. . 55Ecuaciones de estimacin generalizadas: Exportar 56Caractersticas adicionales del comando GENLIN. . 57

    Captulo 8. Modelos mixtos linealesgeneralizados. . . . . . . . . . . . 59Obtencin de un modelo mixto lineal generalizado 60Objetivo . . . . . . . . . . . . . . . 60Efectos fijos . . . . . . . . . . . . . . 63

    Aadir un trmino personalizado . . . . . . 63Efectos aleatorios . . . . . . . . . . . . 64

    Bloque de efectos aleatorios . . . . . . . . 64Ponderacin y desplazamiento . . . . . . . . 65Opciones de compilacin generales . . . . . . 66Estimacin. . . . . . . . . . . . . . . 66Medias estimadas . . . . . . . . . . . . 67Guardar . . . . . . . . . . . . . . . 68Vista del modelo . . . . . . . . . . . . 69

    Resumen del modelo . . . . . . . . . . 69

    iii

  • Estructura de datos . . . . . . . . . . . 69Prediccin por observacin . . . . . . . . 69Clasificacin . . . . . . . . . . . . . 69Efectos fijos . . . . . . . . . . . . . 70Coeficientes fijos. . . . . . . . . . . . 70Covarianzas de efectos aleatorios . . . . . . 71Parmetros de covarianza . . . . . . . . 71Medias estimadas: Efectos significativos . . . . 72Medias estimadas: Efectos personalizados . . . 72

    Captulo 9. Anlisis loglineal: Seleccinde modelo . . . . . . . . . . . . . 75Anlisis loglineal: Definir rango . . . . . . . 76Anlisis loglineal: Modelo . . . . . . . . . 76

    Generar trminos . . . . . . . . . . . 76Anlisis loglineal: Opciones . . . . . . . . . 76Caractersticas adicionales del comandoHILOGLINEAR . . . . . . . . . . . . . 77

    Captulo 10. Anlisis loglineal general 79Anlisis loglineal general: Modelo . . . . . . . 80

    Generar trminos . . . . . . . . . . . 80Anlisis loglineal general: Opciones . . . . . . 80Anlisis loglineal general: Guardar . . . . . . 81Caractersticas adicionales del comando GENLOG 81

    Captulo 11. Anlisis loglineal logit. . . 83Anlisis loglineal logit: Modelo . . . . . . . . 84

    Generar trminos . . . . . . . . . . . 84Anlisis loglineal logit: Opciones . . . . . . . 85Anlisis loglineal logit: Guardar . . . . . . . 85Caractersticas adicionales del comando GENLOG 86

    Captulo 12. Tablas de mortalidad . . . 87Tablas de mortalidad: Definir evento para lavariable de estado . . . . . . . . . . . . 88Tablas de mortalidad: Definir rango . . . . . . 88Tablas de mortalidad: Opciones. . . . . . . . 88Caractersticas adicionales del comando SURVIVAL 89

    Captulo 13. Anlisis de supervivenciade Kaplan-Meier. . . . . . . . . . . 91Kaplan-Meier: Definir evento para la variable deestado . . . . . . . . . . . . . . . . 92Kaplan-Meier: Comparar niveles de los factores . . 92

    Kaplan-Meier: Guardar variables nuevas . . . . 92Kaplan-Meier: Opciones . . . . . . . . . . 93Caractersticas adicionales del comando KM . . . 93

    Captulo 14. Anlisis de regresin deCox . . . . . . . . . . . . . . . . 95Regresin de Cox: Definir variables categricas . . 96Regresin de Cox: Grficos . . . . . . . . . 96Regresin de Cox: Guardar nuevas variables . . . 97Regresin de Cox: Opciones . . . . . . . . . 97Regresin de Cox: Definir evento para la variable deestado . . . . . . . . . . . . . . . . 98Caractersticas adicionales del comando COXREG 98

    Captulo 15. Calcular covariabledependiente del tiempo . . . . . . . 99Para calcular una covariable dependiente del tiempo 99

    Regresin de Cox con covariables dependientesdel tiempo: Caractersticas adicionales . . . . 100

    Captulo 16. Esquemas decodificacin de variables categricas . 101Desviacin . . . . . . . . . . . . . . 101Simple. . . . . . . . . . . . . . . . 101Helmert . . . . . . . . . . . . . . . 102Diferencia . . . . . . . . . . . . . . 102Polinmico . . . . . . . . . . . . . . 102Repetido . . . . . . . . . . . . . . . 103Especial . . . . . . . . . . . . . . . 103Indicador. . . . . . . . . . . . . . . 104

    Captulo 17. Estructuras decovarianza . . . . . . . . . . . . 105

    Avisos . . . . . . . . . . . . . . 109Marcas comerciales . . . . . . . . . . . 111

    ndice. . . . . . . . . . . . . . . 113

    iv IBM SPSS Advanced Statistics 23

  • Captulo 1. Introduccin a Estadsticas avanzadasLa opcin Estadsticas avanzadas proporciona procedimientos que ofrecen opciones de modelado msavanzadas que las disponibles en el sistema Base.v MLG Multivariado ampla el modelo lineal general que proporciona MLG Univariado al permitir

    varias variables dependientes. Una extensin adicional, GLM Medidas repetidas, permite lasmediciones repetidas de varias variables dependientes.

    v Anlisis de componentes de la varianza es una herramienta especfica para descomponer lavariabibilidad de una variable dependiente en componentes fijos y aleatorios.

    v Los modelos mixtos lineales amplan el modelo lineal general de manera que los datos puedanpresentar variabilidad correlacionada y no constante. El modelo lineal mixto proporciona, por tanto, laflexibilidad necesaria para modelar no slo las medias sino tambin las varianzas y covarianzas de losdatos.

    v Los modelos lineales generalizados (GZLM) relajan el supuesto de normalidad del trmino de error yslo requieren que la variable dependiente est relacionada linealmente con los predictores medianteuna transformacin o funcin de enlace. Las ecuaciones de estimacin generalizada (GEE) amplaGZLM para permitir mediciones repetidas.

    v El anlisis loglineal general permite ajustar modelos a datos de recuento de clasificacin cruzada y laseleccin del modelo del anlisis loglineal puede ayudarle a elegir entre modelos.

    v El anlisis loglineal logit le permite ajustar modelos loglineales para analizar la relacin existente entreuna variable dependiente categrica y uno o ms predictores categricos.

    v Puede realizar un anlisis de supervivencia a travs de Tablas de mortalidad para examinar ladistribucin de variables de tiempo de espera hasta un evento, posiblemente por niveles de unavariable de factor; anlisis de supervivencia de Kaplan-Meier para examinar la distribucin devariables de tiempo de espera hasta un evento, posiblemente por niveles de una variable de factor ogenerar anlisis separados por niveles de una variable de estratificacin; y regresin de Cox paramodelar el tiempo de espera hasta un determinado evento, basado en los valores de las covariablesespecificadas.

    Copyright IBM Corp. 1989, 2014 1

  • 2 IBM SPSS Advanced Statistics 23

  • Captulo 2. Anlisis MLG multivarianteEl procedimiento MLG Multivariante proporciona un anlisis de regresin y un anlisis de varianza paravariables dependientes mltiples por una o ms covariables o variables de factor. Las variables de factordividen la poblacin en grupos. Utilizando este procedimiento de modelo lineal general, es posiblecontrastar hiptesis nulas sobre los efectos de las variables de factor sobre las medias de variasagrupaciones de una distribucin conjunta de variables dependientes. Asimismo puede investigar lasinteracciones entre los factores y tambin los efectos individuales de los factores. Adems, se puedenincluir los efectos de las covariables y las interacciones de covariables con los factores. Para el anlisis deregresin, las variables (predictoras) independientes se especifican como covariables.

    Se pueden contrastar tanto los modelos equilibrados como los no equilibrados. Se considera que undiseo est equilibrado si cada casilla del modelo contiene el mismo nmero de casos. En un modelomultivariado, las sumas de cuadrados debidas a los efectos del modelo y las sumas de cuadrados error seencuentran en forma de matriz en lugar de en la forma escalar del anlisis univariado. Estas matrices sedenominan matrices SCPC (sumas de cuadrados y productos vectoriales). Si se especifica ms de unavariable dependiente, se proporciona el anlisis multivariado de varianzas usando la traza de Pillai, lalambda de Wilks, la traza de Hotelling y el criterio de mayor raz de Roy con el estadstico F aproximado,as como el anlisis univariado de varianza para cada variable dependiente. Adems de contratarhiptesis, MLG Multivariante genera estimaciones de los parmetros.

    Tambin se encuentran disponibles los contrastes a priori de uso ms habitual para contrastar lashiptesis. Adems, si una prueba F global ha mostrado cierta significacin, pueden emplearse las pruebaspost hoc para evaluar las diferencias entre las medias especficas. Las medias marginales estimadasofrecen estimaciones de valores de las medias pronosticados para las casillas del modelo; los grficos deperfil (grficos de interacciones) de estas medias permiten observar fcilmente algunas de estasrelaciones. Las pruebas de comparaciones mltiples post hoc se realizan por separado para cada variabledependiente.

    En su archivo de datos puede guardar residuos, valores pronosticados, distancia de Cook y valores deinfluencia como variables nuevas para comprobar los supuestos. Tambin se hallan disponibles unamatriz SCPC residual, que es una matriz cuadrada de las sumas de cuadrados y los productos vectorialesde los residuos; una matriz de covarianzas residual, que es la matriz SCPC residual dividida por losgrados de libertad de los residuos; y la matriz de correlaciones residual, que es la forma tipificada de lamatriz de covarianzas residual.

    Ponderacin MCP permite especificar una variable usada para aplicar a las observaciones unaponderacin diferencial en un anlisis de mnimos cuadrados ponderados (MCP), por ejemplo paracompensar la distinta precisin de las mediciones.

    Ejemplo. Un fabricante de plsticos mide tres propiedades de la pelcula de plstico: resistencia, brillo yopacidad. Se prueban dos tasas de extrusin y dos cantidades diferentes de aditivo y se miden las trespropiedades para cada combinacin de tasa de extrusin y cantidad de aditivo. El fabricante deduce quela tasa de extrusin y la cantidad de aditivo producen individualmente resultados significativos, pero quela interaccin de los dos factores no es significativa.

    Mtodos. Las sumas de cuadrados de Tipo I, Tipo II, Tipo III y Tipo IV pueden emplearse para evaluarlas diferentes hiptesis. Tipo III es el valor predeterminado.

    Estadsticos. Las pruebas de rango post hoc y las comparaciones mltiples: Diferencia menos significativa(DMS), Bonferroni, Sidak, Scheff, Mltiples F de Ryan-Einot-Gabriel-Welsch (R-E-G-W-F), Rango mltiplede Ryan-Einot-Gabriel-Welsch, Student-Newman-Keuls (S-N-K), Diferencia honestamente significativa deTukey, b de Tukey, Duncan, GT2 de Hochberg, Gabriel, Pruebas t de Waller Duncan, Dunnett (unilateral y

    3

  • bilateral), T2 de Tamhane, T3 de Dunnett, Games-Howell y C de Dunnett. Estadsticos descriptivos:medias observadas, desviaciones estndar y recuentos de todas las variables dependientes en todas lascasillas; la prueba de Levene sobre la homogeneidad de la varianza; la prueba M de Box sobre lahomogeneidad de las matrices de covarianza de las variables dependientes; y la prueba de esfericidad deBartlett.

    Diagramas. Diagramas de dispersin por nivel, grficos de residuos, grficos de perfil (interaccin).

    MLG Multivariante: Consideraciones sobre los datos

    Datos. Las variables dependientes deben ser cuantitativas. Los factores son categricos y pueden tenervalores numricos o valores de cadena. Las covariables son variables cuantitativas que estn relacionadascon la variable dependiente.

    Supuestos. Para las variables dependientes, los datos son una muestra aleatoria de vectores de unapoblacin normal multivariada; en la poblacin, las matrices de varianzas-covarianzas para todas lascasillas son las mismas. El anlisis de varianza es robusto a las desviaciones de la normalidad, aunque losdatos debern ser simtricos. Para comprobar los supuestos se pueden utilizar las pruebas dehomogeneidad de varianzas (incluyendo la M de Box) y los grficos de dispersin por nivel. Tambinpuede examinar los residuos y los grficos de residuos.

    Procedimientos relacionados. Utilice el procedimiento Explorar para examinar los datos antes de realizarun anlisis de varianza. Para una variable dependiente nica, utilice MLG Factorial General. Si hamedido las mismas variables dependientes en varias ocasiones para cada sujeto, utilice MLG Medidasrepetidas.

    Para obtener un anlisis de varianza MLG multivariante1. Seleccione en los mens:

    Analizar > Modelo lineal general > Multivariante...2. Seleccione al menos dos variables dependientes.

    Si lo desea, puede especificar Factores fijos, Covariables y Ponderacin MCP.

    Modelo MLG multivarianteEspecificar modelo. Un modelo factorial completo contiene todos los efectos principales del factor, todoslos efectos principales de las covariables y todas las interacciones factor por factor. No contieneinteracciones de covariable. Seleccione Personalizado para especificar slo un subconjunto deinteracciones o para especificar interacciones factor por covariable. Indique todos los trminos que deseeincluir en el modelo.

    Factores y Covariables. Muestra una lista de los factores y las covariables.

    Modelo. El modelo depende de la naturaleza de los datos. Despus de seleccionar Personalizado, puedeelegir los efectos principales y las interacciones que sean de inters para el anlisis.

    Suma de cuadrados Determina el mtodo para calcular las sumas de cuadrados. Para los modelosequilibrados y no equilibrados sin casillas perdidas, el mtodo de suma de cuadrados ms utilizado es elde Tipo III.

    Incluir la interseccin en el modelo. La interseccin se incluye normalmente en el modelo. Si suponeque los datos pasan por el origen, puede excluir la interseccin.

    Generar trminosPara las covariables y los factores seleccionados:

    4 IBM SPSS Advanced Statistics 23

  • Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas. Esta esla opcin predeterminada.

    Efectos principales. Crea un trmino de efectos principales para cada variable seleccionada.

    Todas de 2. Crea todas las interacciones bidimensionales posibles de las variables seleccionadas.

    Todas de 3. Crea todas las interacciones tridimensionales posibles de las variables seleccionadas.

    Todas de 4. Crea todas las interacciones tetradimensionales posibles de las variables seleccionadas.

    Todas de 5. Crea todas las interacciones quntuples posibles de las variables seleccionadas.

    Suma de cuadradosPara el modelo, puede elegir un tipo de suma de cuadrados. El Tipo III es el ms utilizado y es el tipopredeterminado.

    Tipo I. Este mtodo tambin se conoce como el mtodo de descomposicin jerrquica de la suma decuadrados. Cada trmino se corrige slo respecto al trmino que le precede en el modelo. El mtodo TipoI para la obtencin de sumas de cuadrados se utiliza normalmente para:v Un modelo ANOVA equilibrado en el que se especifica cualquier efecto principal antes de cualquier

    efecto de interaccin de primer orden, cualquier efecto de interaccin de primer orden se especificaantes de cualquier efecto de interaccin de segundo orden, y as sucesivamente.

    v Un modelo de regresin polinmica en el que se especifica cualquier trmino de orden inferior antesque cualquier trmino de orden superior.

    v Un modelo puramente anidado en el que el primer efecto especificado est anidado dentro delsegundo efecto especificado, el segundo efecto especificado est anidado dentro del tercero, y assucesivamente. Esta forma de anidamiento solamente puede especificarse utilizando la sintaxis.

    Tipo II. Este mtodo calcula cada suma de cuadrados del modelo considerando slo los efectospertinentes. Un efecto pertinente es el que corresponde a todos los efectos que no contienen el que se estexaminando. El mtodo de suma de cuadrados de Tipo II se utiliza normalmente para:v Un modelo ANOVA equilibrado.v Cualquier modelo que slo tenga efectos de factor principal.v Cualquier modelo de regresin.v Un diseo puramente anidado (esta forma de anidamiento solamente puede especificarse utilizando la

    sintaxis).

    Tipo III. Es el mtodo predeterminado. Este mtodo calcula las sumas de cuadrados de un efecto dediseo como las sumas de cuadrados, corregidas respecto a cualquier otro efecto que no contenga elefecto, y ortogonales a cualquier efecto (si existe) que contenga el efecto. Las sumas de cuadrados de TipoIII tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla, siempre que la formageneral de estimabilidad permanezca constante. As, este tipo de sumas de cuadrados se suele considerarde gran utilidad para un modelo no equilibrado sin casillas perdidas. En un diseo factorial sin casillasperdidas, este mtodo equivale a la tcnica de cuadrados ponderados de las medias de Yates. El mtodode suma de cuadrados de Tipo III se utiliza normalmente para:v Cualquiera de los modelos que aparecen en los tipos I y II.v Cualquier modelo equilibrado o desequilibrado sin casillas vacas.

    Tipo IV. Este mtodo est diseado para una situacin en la que hay casillas perdidas. Para cualquierefecto F en el diseo, si F no est contenida en cualquier otro efecto, entonces Tipo IV = Tipo III = Tipo II.

    Captulo 2. Anlisis MLG multivariante 5

  • Cuando F est contenida en otros efectos, el Tipo IV distribuye equitativamente los contrastes que serealizan entre los parmetros en F a todos los efectos de nivel superior. El mtodo de suma de cuadradosde Tipo I se utiliza normalmente para:v Cualquiera de los modelos que aparecen en los tipos I y II.v Cualquier modelo equilibrado o no equilibrado con casillas vacas.

    MLG Multivariante: ContrastesLos contrastes se utilizan para comprobar si los niveles de un efecto son significativamente diferentesunos de otros. Puede especificar un contraste para cada factor del modelo. Los contrastes representan lascombinaciones lineales de los parmetros.

    El contraste de hiptesis se basa en la hiptesis nula LBM = 0, donde L es la matriz de coeficientes decontraste, M es la matriz de identidad (que tiene una dimensin igual al nmero de variablesdependientes) y B es el vector de parmetros. Cuando se especifica un contraste, se crea una matriz L demodo que las columnas correspondientes al factor coincidan con el contraste. El resto de las columnas secorrigen para que la matriz L sea estimable.

    Se ofrecen la prueba univariada que utiliza los estadsticos F y los intervalos de confianza simultneos detipo Bonferroni, basados en la distribucin t de Student para las diferencias de contraste en todas lasvariables dependientes. Tambin se ofrecen las pruebas multivariantes que utilizan los criterios de la trazade Pillai, la lambda de Wilks, la traza de Hotelling y la mayor raz de Roy.

    Los contrastes disponibles son de desviacin, simples, de diferencias, de Helmert, repetidos ypolinmicos. En los contrastes de desviacin y los contrastes simples, es posible determinar que lacategora de referencia sea la primera o la ltima categora.

    Tipos de contrastesDesviacin. Compara la media de cada nivel (excepto una categora de referencia) con la media de todoslos niveles (media global). Los niveles del factor pueden colocarse en cualquier orden.

    Simples. Compara la media de cada nivel con la media de un nivel especificado. Este tipo de contrasteresulta til cuando existe un grupo de control. Puede seleccionar la primera o la ltima categora comoreferencia.

    Diferencia. Compara la media de cada nivel (excepto el primero) con la media de los niveles anteriores (aveces tambin se denominan contrastes de Helmert inversos). (a veces tambin se denominan contrastesde Helmert inversos).

    Helmert. Compara la media de cada nivel del factor (excepto el ltimo) con la media de los nivelessiguientes.

    Repetidas. Compara la media de cada nivel (excepto el ltimo) con la media del nivel siguiente.

    Polinmico. Compara el efecto lineal, cuadrtico, cbico, etc. El primer grado de libertad contiene elefecto lineal a travs de todas las categoras; el segundo grado de libertad, el efecto cuadrtico, y assucesivamente. Estos contrastes se utilizan a menudo para estimar las tendencias polinmicas.

    Grficos de perfil de MLG multivarianteLos grficos de perfil (grficos de interaccin) sirven para comparar las medias marginales en el modelo.Un grfico de perfil es un grfico de lneas en el que cada punto indica la media marginal estimada deuna variable dependiente (corregida respecto a las covariables) en un nivel de un factor. Los niveles deun segundo factor se pueden utilizar para generar lneas diferentes. Cada nivel en un tercer factor se

    6 IBM SPSS Advanced Statistics 23

  • puede utilizar para crear un grfico diferente. Todos los factores estn disponibles para los grficos. Losgrficos de perfil se crean para cada variable dependiente.

    Un grfico de perfil de un factor muestra si las medias marginales estimadas aumentan o disminuyen atravs de los niveles. Para dos o ms factores, las lneas paralelas indican que no existe interaccin entrelos factores, lo que significa que puede investigar los niveles de un nico factor. Las lneas no paralelasindican una interaccin.

    Despus de especificar un grfico mediante la seleccin de los factores del eje horizontal y, de maneraopcional, los factores para distintas lneas y grficos, el grfico deber aadirse a la lista de grficos.

    MLG multivariante: Comparaciones post hocPruebas de comparaciones mltiples post hoc Una vez que se ha determinado que existen diferenciasentre las medias, las pruebas de rango post hoc y las comparaciones mltiples por parejas permitendeterminar qu medias difieren. Las comparaciones se realizan sobre valores sin corregir. Las pruebaspost hoc se realizan por separado para cada variable dependiente.

    Las pruebas de diferencia honestamente significativa de Tukey y de Bonferroni son pruebas decomparacin mltiple muy utilizadas. La prueba de Bonferroni, basada en el estadstico t de Student,corrige el nivel de significacin observado por el hecho de que se realizan comparaciones mltiples. Laprueba t de Sidak tambin corrige el nivel de significacin y da lugar a lmites ms estrechos que los deBonferroni. La prueba de diferencia honestamente significativa de Tukey utiliza el estadstico del rangoestudentizado para realizar todas las comparaciones por pares entre los grupos y establece la tasa deerror por experimento como la tasa de error para el conjunto de todas las comparaciones por pares.Cuando se contrasta un gran nmero de pares de medias, la prueba de la diferencia honestamentesignificativa de Tukey es ms potente que la prueba de Bonferroni. Para un nmero reducido de pares,Bonferroni es ms potente.

    GT2 de Hochberg es similar a la prueba de la diferencia honestamente significativa de Tukey, pero seutiliza el mdulo mximo estudentizado. La prueba de Tukey suele ser ms potente. La prueba decomparacin por parejas de Gabriel tambin utiliza el mdulo mximo estudentizado y es generalmentems potente que la GT2 de Hochberg cuando los tamaos de las casillas son desiguales. La prueba deGabriel se puede convertir en liberal cuando los tamaos de las casillas varan mucho.

    La prueba t de comparacin mltiple por parejas de Dunnett compara un conjunto de tratamientos conuna media de control simple. La ltima categora es la categora de control predeterminada. Si lo desea,puede seleccionar la primera categora. Asimismo, puede elegir una prueba unilateral o bilateral. Paracomprobar que la media de cualquier nivel del factor (excepto la categora de control) no es igual a la dela categora de control, utilice una prueba bilateral. Para contrastar si la media en cualquier nivel delfactor es menor que la de la categora de control, seleccione < Control. Asimismo, para contrastar si lamedia en cualquier nivel del factor es mayor que la de la categora de control, seleccione > Control.

    Ryan, Einot, Gabriel y Welsch (R-E-G-W) desarrollaron dos pruebas de rangos mltiples por pasos. Losprocedimientos mltiples por pasos (por tamao de las distancias) contrastan en primer lugar si todas las

    Figura 1. Grfico no paralelo (izquierda) y grfico paralelo (derecha)

    Captulo 2. Anlisis MLG multivariante 7

  • medias son iguales. Si no son iguales, se contrasta la igualdad en los subconjuntos de medias. R-E-G-W Fse basa en una prueba F y R-E-G-W Q se basa en un rango estudentizado. Estas pruebas son mspotentes que la prueba de rangos mltiples de Duncan y Student-Newman-Keuls (que tambin sonprocedimientos mltiples por pasos), pero no se recomiendan para tamaos de casillas desiguales.

    Cuando las varianzas son desiguales, utilice T2 de Tamhane (prueba conservadora de comparacin porparejas basada en una prueba t), T3 de Dunnett (prueba de comparacin por parejas basada en elmdulo mximo estudentizado), prueba de comparacin por parejas Games-Howell (a veces liberal), oC de Dunnett (prueba de comparacin por parejas basada en el rango estudentizado).

    La prueba de rango mltiple de Duncan, Student-Newman-Keuls (S-N-K) y b de Tukey son pruebas derango que asignan rangos a medias de grupo y calculan un valor de rango. Estas pruebas no se utilizancon la misma frecuencia que las pruebas anteriormente mencionadas.

    La prueba t de Waller-Duncan utiliza la aproximacin bayesiana. Esta prueba de rango emplea la mediaarmnica del tamao de la muestra cuando los tamaos muestrales no son iguales.

    El nivel de significacin de la prueba de Scheff est diseado para permitir todas las combinacioneslineales posibles de las medias de grupo que se van a contrastar, no slo las comparaciones por parejasdisponibles en esta caracterstica. El resultado es que la prueba de Scheff es normalmente msconservadora que otras pruebas, lo que significa que se precisa una mayor diferencia entre las mediaspara la significacin.

    La prueba de comparacin mltiple por parejas de la diferencia menos significativa (DMS) es equivalentea varias pruebas t individuales entre todos los pares de grupos. La desventaja de esta prueba es que nose realiza ningn intento de corregir el nivel de significacin observado para realizar las comparacionesmltiples.

    Pruebas mostradas. Se proporcionan comparaciones por parejas para DMS, Sidak, Bonferroni,Games-Howell, T2 y T3 de Tamhane, C de Dunnett y T3 de Dunnett. Tambin se facilitan subconjuntoshomogneos para S-N-K, b de Tukey, Duncan, R-E-G-W F, R-E-G-W Q y Waller. La prueba de ladiferencia honestamente significativa de Tukey, la GT2 de Hochberg, la prueba de Gabriel y la prueba deScheff son pruebas de comparaciones mltiples y pruebas de rango.

    MLG: GuardarEs posible guardar los valores pronosticados por el modelo, los residuos y las medidas relacionadas comovariables nuevas en el Editor de datos. Muchas de estas variables se pueden utilizar para examinarsupuestos sobre los datos. Si desea almacenar los valores para utilizarlos en otra sesin de IBM SPSSStatistics, gurdelos en el archivo de datos actual.

    Valores pronosticados. Son los valores que predice el modelo para cada caso.v No tipificados. Valor predicho por el modelo para la variable dependiente.v Ponderados. Los valores pronosticados no tipificados ponderados. Slo estn disponibles si se

    seleccion previamente una variable de ponderacin MCP.v Error estndar. Estimacin de la desviacin estndar del valor promedio de la variable dependiente

    para los casos que tengan los mismos valores en las variables independientes.

    Diagnsticos. Son medidas para identificar casos con combinaciones poco usuales de valores para loscasos y las variables independientes que puedan tener un gran impacto en el modelo.v Distancia de Cook. Una medida de cunto cambiaran los residuos de todos los casos si un caso

    particular se excluyera del clculo de los coeficientes de regresin. Una Distancia de Cook grandeindica que la exclusin de ese caso del clculo de los estadsticos de regresin har variarsubstancialmente los coeficientes.

    8 IBM SPSS Advanced Statistics 23

  • v Valores de influencia. Los valores de influencia no centrados. La influencia relativa de una observacinen el ajuste del modelo.

    Residuos. Un residuo no tipificado es el valor real de la variable dependiente menos el valor predichopor el modelo. Tambin se encuentran disponibles residuos eliminados, estudentizados y tipificados. Si haseleccionado una variable MCP, contar adems con residuos no tipificados ponderados.v No tipificados. Diferencia entre un valor observado y el valor predicho por el modelo.v Ponderados. Los residuos no tipificados ponderados. Slo estn disponibles si se seleccion

    previamente una variable de ponderacin MCP.v Tipificados. El residuo dividido por una estimacin de su error estndar. Los residuos tipificados, que

    son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen una media de 0y una desviacin estndar de 1.

    v Estudentizados. Residuo dividido por una estimacin de su desviacin estndar que vara de caso encaso, dependiendo de la distancia de los valores de cada caso en las variables independientes respectoa las medias en las variables independientes.

    v Eliminados. Residuo para un caso cuando ste se excluye del clculo de los coeficientes de la regresin.Es igual a la diferencia entre el valor de la variable dependiente y el valor predicho corregido.

    Estadsticos de los coeficientes. Escribe una matriz varianza-covarianza de las estimaciones de losparmetros del modelo en un nuevo conjunto de datos de la sesin actual o un archivo de datos externode IBM SPSS Statistics. Asimismo, para cada variable dependiente habr una fila de estimaciones de losparmetros, una fila de valores de significacin para los estadsticos t correspondientes a las estimacionesde los parmetros y una fila de grados de libertad de los residuos. En un modelo multivariante, existenfilas similares para cada variable dependiente. Si lo desea, puede usar este archivo matricial en otrosprocedimientos que lean archivos matriciales.

    MLG Multivariante: OpcionesEste cuadro de dilogo contiene estadsticos opcionales. Los estadsticos se calculan utilizando un modelode efectos fijos.

    Medias marginales estimadas. Seleccione los factores e interacciones para los que desee obtenerestimaciones de las medias marginales de la poblacin en las casillas. Estas medias se corrigen respecto alas covariables, si las hay. Las interacciones slo estn disponibles si se ha especificado un modelopersonalizado.v Comparar los efectos principales. Proporciona comparaciones por parejas no corregidas entre las

    medias marginales estimadas para cualquier efecto principal del modelo, tanto para los factoresinter-sujetos como para los intra-sujetos. Este elemento slo se encuentra disponible si los efectosprincipales estn seleccionados en la lista Mostrar las medias para.

    v Ajuste del intervalo de confianza. Seleccione un ajuste de diferencia menor significativa (DMS),Bonferroni o Sidak para los intervalos de confianza y la significacin. Este elemento slo estardisponible si se selecciona Comparar los efectos principales.

    Representacin. Seleccione Estadsticos descriptivos para generar medias observadas, desviacionesestndar y frecuencias para cada variable dependiente en todas las casillas. La opcin Estimaciones deltamao del efecto ofrece un valor parcial de eta-cuadrado para cada efecto y cada estimacin deparmetros. El estadstico eta cuadrado describe la proporcin de variabilidad total atribuible a un factor.Seleccione Potencia observada para obtener la potencia de la prueba cuando la hiptesis alternativa se haestablecido basndose en el valor observado. Seleccione Estimaciones de los parmetros para generar lasestimaciones de los parmetros, los errores estndar, las pruebas t, los intervalos de confianza y lapotencia observada para cada prueba. Se pueden mostrar Matrices SCPC de error y de hiptesis y laMatriz SCPC residual ms la prueba de esfericidad de Bartlett de la matriz de covarianzas residual.

    Captulo 2. Anlisis MLG multivariante 9

  • Las pruebas de homogeneidad producen la prueba de homogeneidad de varianzas de Levene para cadavariable dependiente en todas las combinaciones de nivel de los factores inter-sujetos slo para factoresinter-sujetos. Asimismo, las pruebas de homogeneidad incluyen la prueba M de Box sobre lahomogeneidad de las matrices de covarianza de las variables dependientes a lo largo de todas lascombinaciones de niveles de los factores inter-sujetos. Las opciones de diagramas de dispersin por nively grfico de los residuos son tiles para comprobar los supuestos sobre los datos. Estos elementos noestarn activado si no hay factores. Seleccione Grficos de los residuos para generar un grfico de losresiduos observados respecto a los pronosticados respecto a los tipificados para cada variabledependiente. Estos grficos son tiles para investigar el supuesto de varianzas iguales. Seleccione laPrueba de falta de ajuste para comprobar si el modelo puede describir de forma adecuada la relacinentre la variable dependiente y las variables independientes. La funcin estimable general permiteconstruir pruebas de hiptesis personales basadas en la funcin estimable general. Las filas en lasmatrices de coeficientes de contraste son combinaciones lineales de la funcin estimable general.

    Nivel de significacin. Puede que le interese corregir el nivel de significacin usado en las pruebas posthoc y el nivel de confianza empleado para construir intervalos de confianza. El valor especificadotambin se utiliza para calcular la potencia observada para la prueba. Si especifica un nivel designificacin, el cuadro de dilogo mostrar el nivel asociado de los intervalos de confianza.

    Caractersticas adicionales del comando GLMEstas caractersticas se pueden aplicar a los anlisis univariados, multivariados o de medidas repetidas.La sintaxis de comandos tambin le permite:v Especificar efectos anidados en el diseo (utilizando el subcomando DESIGN).v Especificar contrastes de los efectos respecto a una combinacin lineal de efectos o un valor (utilizando

    el subcomando TEST).v Especificar contrastes mltiples (utilizando el subcomando CONTRAST).v Incluir los valores perdidos del usuario (utilizando el subcomando MISSING).v Especificar criterios EPS (mediante el subcomando CRITERIA).v Construir una matrizL, una matriz M o una matriz K (utilizando los subcomandos LMATRIX, MMATRIX o

    KMATRIX).v Especificar una categora de referencia intermedia (utilizando el subcomando CONTRAST para los

    contrastes de desviacin o simples).v Especificar la mtrica para los contrastes polinmicos (utilizando el subcomando CONTRAST).v Especificar trminos de error para las comparaciones post hoc (utilizando el subcomando POSTHOC).v Calcular medias marginales estimadas para cualquier factor o interaccin entre los factores en la lista

    de factores (utilizando el subcomando EMMEANS).v Especificar nombres para las variables temporales (utilizando el subcomando SAVE).v Construir un archivo de datos de matriz de correlaciones (utilizando el subcomando OUTFILE).v Construir un archivo de datos de matriz que contenga estadsticos de la tabla de ANOVA inter-sujetos

    (utilizando el subcomando OUTFILE).v Guardar la matriz del diseo en un nuevo archivo de datos (utilizando el subcomando OUTFILE).

    Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.

    10 IBM SPSS Advanced Statistics 23

  • Captulo 3. MLG Medidas repetidasEl procedimiento MLG Medidas repetidas proporciona un anlisis de varianza cuando se toma la mismamedicin varias veces a cada sujeto o caso. Si se especifican factores inter-sujetos, stos dividen lapoblacin en grupos. Utilizando este procedimiento de modelo lineal general, puede contrastar hiptesisnulas sobre los efectos tanto de los factores inter-sujetos como de los factores intra-sujetos. Asimismopuede investigar las interacciones entre los factores y tambin los efectos individuales de los factores.Tambin se pueden incluir los efectos de covariables constantes y de las interacciones de las covariablescon los factores inter-sujetos.

    En un diseo doblemente multivariado de medidas repetidas, las variables dependientes representanmediciones de ms de una variable para los diferentes niveles de los factores intra-sujetos. Por ejemplo,se pueden haber medido el pulso y la respiracin de cada sujeto en tres momentos diferentes.

    El procedimiento MLG Medidas repetidas ofrece anlisis univariados y multivariados para datos demedidas repetidas. Se pueden contrastar tanto los modelos equilibrados como los no equilibrados. Seconsidera que un diseo est equilibrado si cada casilla del modelo contiene el mismo nmero de casos.En un modelo multivariado, las sumas de cuadrados debidas a los efectos del modelo y las sumas decuadrados error se encuentran en forma de matriz en lugar de en la forma escalar del anlisis univariado.Estas matrices se denominan matrices SCPC (sumas de cuadrados y productos vectoriales). Adems decontrastar las hiptesis, MLG Medidas repetidas genera estimaciones de los parmetros.

    Se encuentran disponibles los contrastes a priori utilizados habitualmente para elaborar hiptesis quecontrastan los factores inter-sujetos. Adems, si una prueba F global ha mostrado cierta significacin,pueden emplearse las pruebas post hoc para evaluar las diferencias entre las medias especficas. Lasmedias marginales estimadas ofrecen estimaciones de valores de las medias pronosticados para lascasillas del modelo; los grficos de perfil (grficos de interacciones) de estas medias permiten observarfcilmente algunas de estas relaciones.

    En su archivo de datos puede guardar residuos, valores pronosticados, distancia de Cook y valores deinfluencia como variables nuevas para comprobar los supuestos. Tambin se hallan disponibles unamatriz SCPC residual, que es una matriz cuadrada de las sumas de cuadrados y los productos vectorialesde los residuos; una matriz de covarianzas residual, que es la matriz SCPC residual dividida por losgrados de libertad de los residuos; y la matriz de correlaciones residual, que es la forma tipificada de lamatriz de covarianzas residual.

    Ponderacin MCP permite especificar una variable usada para aplicar a las observaciones unaponderacin diferencial en un anlisis de mnimos cuadrados ponderados (MCP), por ejemplo paracompensar la distinta precisin de las mediciones.

    Ejemplo. Se asignan doce estudiantes a un grupo de alta o de baja ansiedad basndose en laspuntuaciones obtenidas en una prueba de nivel de ansiedad. El nivel de ansiedad es un factorinter-sujetos porque divide a los sujetos en grupos. A cada estudiante se le dan cuatro ensayos para unadeterminada tarea de aprendizaje y se registra el nmero de errores por ensayo. Los errores de cadaensayo se registran en variables distintas y se define un factor intra-sujetos (ensayo) con cuatro nivelespara cada uno de los cuatro ensayos. Se descubre que el efecto de los ensayos es significativo, mientrasque la interaccin ensayo-ansiedad no es significativa.

    Mtodos. Las sumas de cuadrados de Tipo I, Tipo II, Tipo III y Tipo IV pueden emplearse para evaluarlas diferentes hiptesis. Tipo III es el valor predeterminado.

    Estadsticos. Las pruebas de rango post hoc y las comparaciones mltiples (para factores inter-sujetos):Diferencia menos significativa (DMS), Bonferroni, Sidak, Scheff, Mltiples F de Ryan-Einot-Gabriel-

    Copyright IBM Corp. 1989, 2014 11

  • Welsch (R-E-G-W-F), Rango mltiple de Ryan-Einot-Gabriel-Welsch, Student-Newman-Keuls (S-N-K),Diferencia honestamente significativa de Tukey, b de Tukey, Duncan, GT2 de Hochberg, Gabriel, Pruebas tde Waller Duncan, Dunnett (unilateral y bilateral), T2 de Tamhane, T3 de Dunnett, Games-Howell y C deDunnett. Estadsticos descriptivos: medias observadas, desviaciones estndar y recuentos de todas lasvariables dependientes en todas las casillas; la prueba de Levene sobre la homogeneidad de la varianza;la M de Box; y la prueba de esfericidad de Mauchly.

    Diagramas. Diagramas de dispersin por nivel, grficos de residuos, grficos de perfil (interaccin).

    MLG Medidas repetidas: Consideraciones sobre los datos

    Datos. Las variables dependientes deben ser cuantitativas. Los factores inter-sujetos dividen la muestra ensubgrupos discretos, como hombre y mujer. Estos factores son categricos y pueden tener valoresnumricos o valores de cadena. Los factores intra-sujetos se definen en el cuadro de dilogo MLGMedidas repetidas: Definir factores. Las covariables son variables cuantitativas que estn relacionadas conla variable dependiente. Para un anlisis de medidas repetidas, las covariables debern permanecerconstantes en cada nivel de la variable intra-sujetos.

    El archivo de datos debe contener un conjunto de variables para cada grupo de mediciones tomadas a lossujetos. El conjunto tiene una variable para cada repeticin de la medicin dentro del grupo. Se define unfactor intra-sujetos para el grupo con el nmero de niveles igual al nmero de repeticiones. Por ejemplo,se podran tomar mediciones del peso en das diferentes. Si las mediciones de esa misma propiedad sehan tomado durante cinco das, el factor intra-sujetos podra especificarse como da con cinco niveles.

    Para mltiples factores intra-sujetos, el nmero de mediciones de cada sujeto es igual al producto delnmero de niveles de cada factor. Por ejemplo, si las mediciones se tomaran en tres momentos diferentesdel da durante cuatro das, el nmero total de medidas sera 12 para cada sujeto. Los factoresintra-sujetos podran especificarse como da(4) y mediciones(3).

    Supuestos. Un anlisis de medidas repetidas se puede enfocar de dos formas: univariado y multivariado.

    El enfoque univariado (tambin conocido como el mtodo de modelo mixto o split-plot) considera lasvariables dependientes como respuestas a los niveles de los factores intra-sujetos. Las mediciones en unsujeto deben ser una muestra de una distribucin normal multivariada y las matrices devarianzas-covarianzas son las mismas en todas las casillas formadas por los efectos inter-sujetos. Serealizan ciertos supuestos sobre la matriz de varianzas-covarianzas de las variables dependientes. Lavalidez del estadstico F utilizado en el enfoque univariado puede garantizarse si la matriz devarianzas-covarianzas es de forma circular (Huynh y Mandeville, 1979).

    Para contrastar este supuesto se puede utilizar la prueba de esfericidad de Mauchly, que realiza unaprueba de esfericidad sobre la matriz de varianzas-covarianzas de la variable dependiente transformada yortonormalizada. La prueba de Mauchly aparece automticamente en el anlisis de medidas repetidas. Enlas muestras de tamao reducido, esta prueba no resulta muy potente. En las de gran tamao, la pruebapuede ser significativa incluso si es pequeo el impacto de la desviacin en los resultados. Si lasignificacin de la prueba es grande, se puede asumir la hiptesis de esfericidad. Sin embargo, si lasignificacin es pequea y parece que se ha violado el supuesto de esfericidad, se puede realizar unacorreccin en los grados de libertad del numerador y del denominador para validar el estadstico Funivariado. Se encuentran disponibles tres estimaciones para dicha correccin, denominada psilon, en elprocedimiento MLG Medidas repetidas. Los grados de libertad tanto del numerador como deldenominador deben multiplicarse por psilon y la significacin del cociente F debe evaluarse con losnuevos grados de libertad.

    El enfoque multivariado considera que las mediciones de un sujeto son una muestra de una distribucinnormal multivariada y las matrices de varianzas-covarianzas son las mismas en todas las casillasformadas por los efectos inter-sujetos. Para contrastar si las matrices de varianzas-covarianzas de todaslas casillas son las mismas, se puede utilizar la prueba M de Box.

    12 IBM SPSS Advanced Statistics 23

  • Procedimientos relacionados. Utilice el procedimiento Explorar para examinar los datos antes de realizarun anlisis de varianza. Si no existen mediciones repetidas para cada sujeto, utilice MLG Univariante oMLG Multivariante. Si slo existen dos mediciones para cada sujeto (por ejemplo, antes del test ydespus del test) y no hay factores inter-sujetos, puede utilizar el procedimiento Prueba T para muestrasrelacionadas.

    Obtencin de MLG Medidas repetidas1. Seleccione en los mens:

    Analizar > Modelo lineal general > Medidas repetidas...2. Escriba un nombre para el factor intra-sujetos y su nmero de niveles.3. Pulse en Aadir.4. Repita estos pasos para cada factor intra-sujetos.

    Para definir factores de medidas en un diseo doblemente multivariado de medidas repetidas:5. Escriba el nombre de la medida.6. Pulse en Aadir.

    Despus de definir todos los factores y las medidas:7. Pulse en Definir.8. Seleccione en la lista una variable dependiente que corresponda a cada combinacin de factores

    intra-sujetos (y, de forma opcional, medidas).

    Para cambiar las posiciones de las variables, utilice las flechas arriba y abajo.

    Para realizar cambios en los factores intra-sujetos, puede volver a abrir el cuadro de dilogo MLGMedidas repetidas: Definir factores sin cerrar el cuadro de dilogo principal. Si lo desea, puedeespecificar covariables y factores inter-sujetos.

    MLG Medidas repetidas: Definir factoresMLG Medidas repetidas analiza grupos de variables dependientes relacionadas que representandiferentes mediciones del mismo atributo. Este cuadro de dilogo permite definir uno o varios factoresintra-sujetos para utilizarlos en MLG Medidas repetidas. Tenga en cuenta que el orden en el que seespecifiquen los factores intra-sujetos es importante. Cada factor constituye un nivel dentro del factorprecedente.

    Para utilizar Medidas repetidas, deber definir los datos correctamente. Los factores intra-sujetos debendefinirse en este cuadro de dilogo. Observe que estos factores no son las variables existentes en susdatos, sino los factores que deber definir aqu.

    Ejemplo. En un estudio sobre la prdida de peso, suponga que se mide cada semana el peso de variaspersonas durante cinco semanas. En el archivo de datos, cada persona es un sujeto o caso. Los pesos delas distintas semanas se registran en las variables peso1, peso2, etc. El sexo de cada persona se registra enotra variable. Los pesos, medidos repetidamente para cada sujeto, se pueden agrupar definiendo unfactor intra-sujetos. Este factor podra denominarse semana, definido con cinco niveles. En el cuadro dedilogo principal, las variables peso1, ..., peso5 se utilizan para asignar los cinco niveles de semana. Lavariable del archivo de datos que agrupa a hombres y mujeres (sexo) puede especificarse como un factorinter-sujetos, para estudiar las diferencias entre hombres y mujeres.

    Medidas. Si los sujetos se comparan en ms de una medida cada vez, defina las medidas. Por ejemplo, sepodra medir el ritmo de la respiracin y el pulso para cada sujeto todos los das durante una semana. Elnombre de las medidas no existen como un nombre de variables en el propio archivo de datos sino sedefine aqu. Un modelo con ms de una medida a veces se denomina modelo doblemente multivariadode medidas repetidas.

    Captulo 3. MLG Medidas repetidas 13

  • MLG Medidas repetidas: ModeloEspecificar modelo. Un modelo factorial completo contiene todos los efectos principales del factor, todoslos efectos principales de las covariables y todas las interacciones factor por factor. No contieneinteracciones de covariable. Seleccione Personalizado para especificar slo un subconjunto deinteracciones o para especificar interacciones factor por covariable. Indique todos los trminos que deseeincluir en el modelo.

    Inter-sujetos. Muestra una lista de los factores inter-sujetos y las covariables.

    Modelo. El modelo depende de la naturaleza de los datos. Tras elegir Personalizado, puede seleccionarlos efectos y las interacciones intra-sujetos y los efectos y las interacciones inter-sujetos que sean deinters para el anlisis.

    Suma de cuadrados Determina el mtodo de clculo de las sumas de cuadrados para el modelointer-sujetos. Para los modelos inter-sujetos equilibrados y no equilibrados sin casillas perdidas, el mtodode suma de cuadrados ms utilizado es el de Tipo III.

    Generar trminosPara las covariables y los factores seleccionados:

    Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas. Esta esla opcin predeterminada.

    Efectos principales. Crea un trmino de efectos principales para cada variable seleccionada.

    Todas de 2. Crea todas las interacciones bidimensionales posibles de las variables seleccionadas.

    Todas de 3. Crea todas las interacciones tridimensionales posibles de las variables seleccionadas.

    Todas de 4. Crea todas las interacciones tetradimensionales posibles de las variables seleccionadas.

    Todas de 5. Crea todas las interacciones quntuples posibles de las variables seleccionadas.

    Suma de cuadradosPara el modelo, puede elegir un tipo de suma de cuadrados. El Tipo III es el ms utilizado y es el tipopredeterminado.

    Tipo I. Este mtodo tambin se conoce como el mtodo de descomposicin jerrquica de la suma decuadrados. Cada trmino se corrige slo respecto al trmino que le precede en el modelo. El mtodo TipoI para la obtencin de sumas de cuadrados se utiliza normalmente para:v Un modelo ANOVA equilibrado en el que se especifica cualquier efecto principal antes de cualquier

    efecto de interaccin de primer orden, cualquier efecto de interaccin de primer orden se especificaantes de cualquier efecto de interaccin de segundo orden, y as sucesivamente.

    v Un modelo de regresin polinmica en el que se especifica cualquier trmino de orden inferior antesque cualquier trmino de orden superior.

    v Un modelo puramente anidado en el que el primer efecto especificado est anidado dentro delsegundo efecto especificado, el segundo efecto especificado est anidado dentro del tercero, y assucesivamente. Esta forma de anidamiento solamente puede especificarse utilizando la sintaxis.

    Tipo II. Este mtodo calcula cada suma de cuadrados del modelo considerando slo los efectospertinentes. Un efecto pertinente es el que corresponde a todos los efectos que no contienen el que se estexaminando. El mtodo de suma de cuadrados de Tipo II se utiliza normalmente para:v Un modelo ANOVA equilibrado.

    14 IBM SPSS Advanced Statistics 23

  • v Cualquier modelo que slo tenga efectos de factor principal.v Cualquier modelo de regresin.v Un diseo puramente anidado (esta forma de anidamiento solamente puede especificarse utilizando la

    sintaxis).

    Tipo III. Es el mtodo predeterminado. Este mtodo calcula las sumas de cuadrados de un efecto dediseo como las sumas de cuadrados, corregidas respecto a cualquier otro efecto que no contenga elefecto, y ortogonales a cualquier efecto (si existe) que contenga el efecto. Las sumas de cuadrados de TipoIII tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla, siempre que la formageneral de estimabilidad permanezca constante. As, este tipo de sumas de cuadrados se suele considerarde gran utilidad para un modelo no equilibrado sin casillas perdidas. En un diseo factorial sin casillasperdidas, este mtodo equivale a la tcnica de cuadrados ponderados de las medias de Yates. El mtodode suma de cuadrados de Tipo III se utiliza normalmente para:v Cualquiera de los modelos que aparecen en los tipos I y II.v Cualquier modelo equilibrado o desequilibrado sin casillas vacas.

    Tipo IV. Este mtodo est diseado para una situacin en la que hay casillas perdidas. Para cualquierefecto F en el diseo, si F no est contenida en cualquier otro efecto, entonces Tipo IV = Tipo III = Tipo II.Cuando F est contenida en otros efectos, el Tipo IV distribuye equitativamente los contrastes que serealizan entre los parmetros en F a todos los efectos de nivel superior. El mtodo de suma de cuadradosde Tipo I se utiliza normalmente para:v Cualquiera de los modelos que aparecen en los tipos I y II.v Cualquier modelo equilibrado o no equilibrado con casillas vacas.

    MLG Medidas repetidas: ContrastesLos contrastes se utilizan para contrastar las diferencias entre los niveles de un factor inter-sujetos. Puedeespecificar un contraste para cada factor inter-sujetos del modelo. Los contrastes representan lascombinaciones lineales de los parmetros.

    El contraste de hiptesis se basa en la hiptesis nula LBM = 0, donde L es la matriz de coeficientes decontraste, B es el vector de parmetros y M es la matriz promedio que corresponde a la transformacinpromedio para la variable dependiente. Puede mostrar esta matriz de transformacin seleccionando laopcin Matriz de transformacin en el cuadro de dilogo Medidas repetidas: Opciones. Por ejemplo, siexisten cuatro variables dependientes, un factor intra-sujetos de cuatro niveles y se utilizan contrastespolinmicos (valor predeterminado) para los factores intra-sujetos, la matriz M ser (0,5 0,5 0,5 0,5)'.Cuando se especifica un contraste, se crea una matriz L de modo que las columnas correspondientes alfactor inter-sujetos coincidan con el contraste. El resto de las columnas se corrigen para que la matriz Lsea estimable.

    Los contrastes disponibles son de desviacin, simples, de diferencias, de Helmert, repetidos ypolinmicos. En los contrastes de desviacin y los contrastes simples, es posible determinar que lacategora de referencia sea la primera o la ltima categora.

    Deber seleccionar un contraste que no sea Ninguno para factores intra-sujetos.

    Tipos de contrastesDesviacin. Compara la media de cada nivel (excepto una categora de referencia) con la media de todoslos niveles (media global). Los niveles del factor pueden colocarse en cualquier orden.

    Simples. Compara la media de cada nivel con la media de un nivel especificado. Este tipo de contrasteresulta til cuando existe un grupo de control. Puede seleccionar la primera o la ltima categora comoreferencia.

    Captulo 3. MLG Medidas repetidas 15

  • Diferencia. Compara la media de cada nivel (excepto el primero) con la media de los niveles anteriores (aveces tambin se denominan contrastes de Helmert inversos). (a veces tambin se denominan contrastesde Helmert inversos).

    Helmert. Compara la media de cada nivel del factor (excepto el ltimo) con la media de los nivelessiguientes.

    Repetidas. Compara la media de cada nivel (excepto el ltimo) con la media del nivel siguiente.

    Polinmico. Compara el efecto lineal, cuadrtico, cbico, etc. El primer grado de libertad contiene elefecto lineal a travs de todas las categoras; el segundo grado de libertad, el efecto cuadrtico, y assucesivamente. Estos contrastes se utilizan a menudo para estimar las tendencias polinmicas.

    MLG Medidas repetidas: Grficos de perfilLos grficos de perfil (grficos de interaccin) sirven para comparar las medias marginales en el modelo.Un grfico de perfil es un grfico de lneas en el que cada punto indica la media marginal estimada deuna variable dependiente (corregida respecto a las covariables) en un nivel de un factor. Los niveles deun segundo factor se pueden utilizar para generar lneas diferentes. Cada nivel en un tercer factor sepuede utilizar para crear un grfico diferente. Todos los factores estn disponibles para los grficos. Losgrficos de perfil se crean para cada variable dependiente. Es posible utilizar tanto los factoresinter-sujetos como los intra-sujetos en los grficos de perfil.

    Un grfico de perfil de un factor muestra si las medias marginales estimadas aumentan o disminuyen atravs de los niveles. Para dos o ms factores, las lneas paralelas indican que no existe interaccin entrelos factores, lo que significa que puede investigar los niveles de un nico factor. Las lneas no paralelasindican una interaccin.

    Despus de especificar un grfico mediante la seleccin de los factores del eje horizontal y, de maneraopcional, los factores para distintas lneas y grficos, el grfico deber aadirse a la lista de grficos.

    MLG Medidas repetidas: Comparaciones post hocPruebas de comparaciones mltiples post hoc Una vez que se ha determinado que existen diferenciasentre las medias, las pruebas de rango post hoc y las comparaciones mltiples por parejas permitendeterminar qu medias difieren. Las comparaciones se realizan sobre valores sin corregir. Estas pruebasno estn disponibles si no existen factores inter-sujetos y las pruebas de comparacin mltiple post hoc serealizan para la media a travs de los niveles de los factores intra-sujetos.

    Las pruebas de diferencia honestamente significativa de Tukey y de Bonferroni son pruebas decomparacin mltiple muy utilizadas. La prueba de Bonferroni, basada en el estadstico t de Student,corrige el nivel de significacin observado por el hecho de que se realizan comparaciones mltiples. Laprueba t de Sidak tambin corrige el nivel de significacin y da lugar a lmites ms estrechos que los deBonferroni. La prueba de diferencia honestamente significativa de Tukey utiliza el estadstico del rango

    Figura 2. Grfico no paralelo (izquierda) y grfico paralelo (derecha)

    16 IBM SPSS Advanced Statistics 23

  • estudentizado para realizar todas las comparaciones por pares entre los grupos y establece la tasa deerror por experimento como la tasa de error para el conjunto de todas las comparaciones por pares.Cuando se contrasta un gran nmero de pares de medias, la prueba de la diferencia honestamentesignificativa de Tukey es ms potente que la prueba de Bonferroni. Para un nmero reducido de pares,Bonferroni es ms potente.

    GT2 de Hochberg es similar a la prueba de la diferencia honestamente significativa de Tukey, pero seutiliza el mdulo mximo estudentizado. La prueba de Tukey suele ser ms potente. La prueba decomparacin por parejas de Gabriel tambin utiliza el mdulo mximo estudentizado y es generalmentems potente que la GT2 de Hochberg cuando los tamaos de las casillas son desiguales. La prueba deGabriel se puede convertir en liberal cuando los tamaos de las casillas varan mucho.

    La prueba t de comparacin mltiple por parejas de Dunnett compara un conjunto de tratamientos conuna media de control simple. La ltima categora es la categora de control predeterminada. Si lo desea,puede seleccionar la primera categora. Asimismo, puede elegir una prueba unilateral o bilateral. Paracomprobar que la media de cualquier nivel del factor (excepto la categora de control) no es igual a la dela categora de control, utilice una prueba bilateral. Para contrastar si la media en cualquier nivel delfactor es menor que la de la categora de control, seleccione < Control. Asimismo, para contrastar si lamedia en cualquier nivel del factor es mayor que la de la categora de control, seleccione > Control.

    Ryan, Einot, Gabriel y Welsch (R-E-G-W) desarrollaron dos pruebas de rangos mltiples por pasos. Losprocedimientos mltiples por pasos (por tamao de las distancias) contrastan en primer lugar si todas lasmedias son iguales. Si no son iguales, se contrasta la igualdad en los subconjuntos de medias. R-E-G-W Fse basa en una prueba F y R-E-G-W Q se basa en un rango estudentizado. Estas pruebas son mspotentes que la prueba de rangos mltiples de Duncan y Student-Newman-Keuls (que tambin sonprocedimientos mltiples por pasos), pero no se recomiendan para tamaos de casillas desiguales.

    Cuando las varianzas son desiguales, utilice T2 de Tamhane (prueba conservadora de comparacin porparejas basada en una prueba t), T3 de Dunnett (prueba de comparacin por parejas basada en elmdulo mximo estudentizado), prueba de comparacin por parejas Games-Howell (a veces liberal), oC de Dunnett (prueba de comparacin por parejas basada en el rango estudentizado).

    La prueba de rango mltiple de Duncan, Student-Newman-Keuls (S-N-K) y b de Tukey son pruebas derango que asignan rangos a medias de grupo y calculan un valor de rango. Estas pruebas no se utilizancon la misma frecuencia que las pruebas anteriormente mencionadas.

    La prueba t de Waller-Duncan utiliza la aproximacin bayesiana. Esta prueba de rango emplea la mediaarmnica del tamao de la muestra cuando los tamaos muestrales no son iguales.

    El nivel de significacin de la prueba de Scheff est diseado para permitir todas las combinacioneslineales posibles de las medias de grupo que se van a contrastar, no slo las comparaciones por parejasdisponibles en esta caracterstica. El resultado es que la prueba de Scheff es normalmente msconservadora que otras pruebas, lo que significa que se precisa una mayor diferencia entre las mediaspara la significacin.

    La prueba de comparacin mltiple por parejas de la diferencia menos significativa (DMS) es equivalentea varias pruebas t individuales entre todos los pares de grupos. La desventaja de esta prueba es que nose realiza ningn intento de corregir el nivel de significacin observado para realizar las comparacionesmltiples.

    Pruebas mostradas. Se proporcionan comparaciones por parejas para DMS, Sidak, Bonferroni,Games-Howell, T2 y T3 de Tamhane, C de Dunnett y T3 de Dunnett. Tambin se facilitan subconjuntoshomogneos para S-N-K, b de Tukey, Duncan, R-E-G-W F, R-E-G-W Q y Waller. La prueba de ladiferencia honestamente significativa de Tukey, la GT2 de Hochberg, la prueba de Gabriel y la prueba deScheff son pruebas de comparaciones mltiples y pruebas de rango.

    Captulo 3. MLG Medidas repetidas 17

  • MLG medidas repetidas: GuardarEs posible guardar los valores pronosticados por el modelo, los residuos y las medidas relacionadas comovariables nuevas en el Editor de datos. Muchas de estas variables se pueden utilizar para examinarsupuestos sobre los datos. Si desea almacenar los valores para utilizarlos en otra sesin de IBM SPSSStatistics, gurdelos en el archivo de datos actual.

    Valores pronosticados. Son los valores que predice el modelo para cada caso.v No tipificados. Valor predicho por el modelo para la variable dependiente.v Error estndar. Estimacin de la desviacin estndar del valor promedio de la variable dependiente

    para los casos que tengan los mismos valores en las variables independientes.

    Diagnsticos. Son medidas para identificar casos con combinaciones poco usuales de valores para loscasos y las variables independientes que puedan tener un gran impacto en el modelo. Las opcionesdisponibles incluyen la distancia de Cook y los valores de influencia no centrados.v Distancia de Cook. Una medida de cunto cambiaran los residuos de todos los casos si un caso

    particular se excluyera del clculo de los coeficientes de regresin. Una Distancia de Cook grandeindica que la exclusin de ese caso del clculo de los estadsticos de regresin har variarsubstancialmente los coeficientes.

    v Valores de influencia. Los valores de influencia no centrados. La influencia relativa de una observacinen el ajuste del modelo.

    Residuos. Un residuo no tipificado es el valor real de la variable dependiente menos el valor predichopor el modelo. Tambin se encuentran disponibles residuos eliminados, estudentizados y tipificados.v No tipificados. Diferencia entre un valor observado y el valor predicho por el modelo.v Tipificados. El residuo dividido por una estimacin de su error estndar. Los residuos tipificados, que

    son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen una media de 0y una desviacin estndar de 1.

    v Estudentizados. Residuo dividido por una estimacin de su desviacin estndar que vara de caso encaso, dependiendo de la distancia de los valores de cada caso en las variables independientes respectoa las medias en las variables independientes.

    v Eliminados. Residuo para un caso cuando ste se excluye del clculo de los coeficientes de la regresin.Es igual a la diferencia entre el valor de la variable dependiente y el valor predicho corregido.

    Estadsticos de los coeficientes. Guarda una matriz varianza-covarianza o una matriz de las estimacionesde los parmetros en un conjunto de datos o archivo de datos. Asimismo, para cada variable dependientehabr una fila de estimaciones de los parmetros, una fila de valores de significacin para los estadsticost correspondientes a las estimaciones de los parmetros y una fila de grados de libertad de los residuos.En un modelo multivariante, existen filas similares para cada variable dependiente. Si lo desea, puedeusar estos datos matriciales en otros procedimientos que lean archivos matriciales. Los conjuntos de datosestn disponibles para su uso posterior durante la misma sesin, pero no se guardarn como archivos amenos que se hayan guardado explcitamente antes de que finalice la sesin. El nombre de un conjuntode datos debe cumplir las normas de denominacin de variables.

    MLG Medidas repetidas: OpcionesEste cuadro de dilogo contiene estadsticos opcionales. Los estadsticos se calculan utilizando un modelode efectos fijos.

    Medias marginales estimadas. Seleccione los factores e interacciones para los que desee obtenerestimaciones de las medias marginales de la poblacin en las casillas. Estas medias se corrigen respecto alas covariables, si las hay. Se pueden seleccionar tanto factores intra-sujetos como inter-sujetos.v Comparar los efectos principales. Proporciona comparaciones por parejas no corregidas entre las

    medias marginales estimadas para cualquier efecto principal del modelo, tanto para los factores

    18 IBM SPSS Advanced Statistics 23

  • inter-sujetos como para los intra-sujetos. Este elemento slo se encuentra disponible si los efectosprincipales estn seleccionados en la lista Mostrar las medias para.

    v Ajuste del intervalo de confianza. Seleccione un ajuste de diferencia menor significativa (DMS),Bonferroni o Sidak para los intervalos de confianza y la significacin. Este elemento slo estardisponible si se selecciona Comparar los efectos principales.

    Representacin. Seleccione Estadsticos descriptivos para generar medias observadas, desviacionesestndar y frecuencias para cada variable dependiente en todas las casillas. La opcin Estimaciones deltamao del efecto ofrece un valor parcial de eta-cuadrado para cada efecto y cada estimacin deparmetros. El estadstico eta cuadrado describe la proporcin de variabilidad total atribuible a un factor.Seleccione Potencia observada para obtener la potencia de la prueba cuando la hiptesis alternativa se haestablecido basndose en el valor observado. Seleccione Estimaciones de los parmetros para generar lasestimaciones de los parmetros, los errores estndar, las pruebas t, los intervalos de confianza y lapotencia observada para cada prueba. Se pueden mostrar Matrices SCPC de error y de hiptesis y laMatriz SCPC residual ms la prueba de esfericidad de Bartlett de la matriz de covarianzas residual.

    Las pruebas de homogeneidad producen la prueba de homogeneidad de varianzas de Levene para cadavariable dependiente en todas las combinaciones de nivel de los factores inter-sujetos slo para factoresinter-sujetos. Asimismo, las pruebas de homogeneidad incluyen la prueba M de Box sobre lahomogeneidad de las matrices de covarianza de las variables dependientes a lo largo de todas lascombinaciones de niveles de los factores inter-sujetos. Las opciones de diagramas de dispersin por nively grfico de los residuos son tiles para comprobar los supuestos sobre los datos. Estos elementos noestarn activado si no hay factores. Seleccione Grficos de los residuos para generar un grfico de losresiduos observados respecto a los pronosticados respecto a los tipificados para cada variabledependiente. Estos grficos son tiles para investigar el supuesto de varianzas iguales. Seleccione laPrueba de falta de ajuste para comprobar si el modelo puede describir de forma adecuada la relacinentre la variable dependiente y las variables independientes. La funcin estimable general permiteconstruir pruebas de hiptesis personales basadas en la funcin estimable general. Las filas en lasmatrices de coeficientes de contraste son combinaciones lineales de la funcin estimable general.

    Nivel de significacin. Puede que le interese corregir el nivel de significacin usado en las pruebas posthoc y el nivel de confianza empleado para construir intervalos de confianza. El valor especificadotambin se utiliza para calcular la potencia observada para la prueba. Si especifica un nivel designificacin, el cuadro de dilogo mostrar el nivel asociado de los intervalos de confianza.

    Caractersticas adicionales del comando GLMEstas caractersticas se pueden aplicar a los anlisis univariados, multivariados o de medidas repetidas.La sintaxis de comandos tambin le permite:v Especificar efectos anidados en el diseo (utilizando el subcomando DESIGN).v Especificar contrastes de los efectos respecto a una combinacin lineal de efectos o un valor (utilizando

    el subcomando TEST).v Especificar contrastes mltiples (utilizando el subcomando CONTRAST).v Incluir los valores perdidos del usuario (utilizando el subcomando MISSING).v Especificar criterios EPS (mediante el subcomando CRITERIA).v Construir una matrizL, una matriz M o una matriz K (utilizando los subcomandos LMATRIX, MMATRIX y

    KMATRIX).v Especificar una categora de referencia intermedia (utilizando el subcomando CONTRAST para los

    contrastes de desviacin o simples).v Especificar la mtrica para los contrastes polinmicos (utilizando el subcomando CONTRAST).v Especificar trminos de error para las comparaciones post hoc (utilizando el subcomando POSTHOC).v Calcular medias marginales estimadas para cualquier factor o interaccin entre los factores en la lista

    de factores (utilizando el subcomando EMMEANS).

    Captulo 3. MLG Medidas repetidas 19

  • v Especificar nombres para las variables temporales (utilizando el subcomando SAVE).v Construir un archivo de datos de matriz de correlaciones (utilizando el subcomando OUTFILE).v Construir un archivo de datos de matriz que contenga estadsticos de la tabla de ANOVA inter-sujetos

    (utilizando el subcomando OUTFILE).v Guardar la matriz del diseo en un nuevo archivo de datos (utilizando el subcomando OUTFILE).

    Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.

    20 IBM SPSS Advanced Statistics 23

  • Captulo 4. Anlisis de componentes de la varianzaEl procedimiento Componentes de la varianza, para modelos de efectos mixtos, estima la contribucin decada efecto aleatorio a la varianza de la variable dependiente. Este procedimiento resulta de particularinters para el anlisis de modelos mixtos, como los diseos split-plot, los diseos de medidas repetidasunivariados y los diseos de bloques aleatorios. Al calcular las componentes de la varianza, se puededeterminar dnde centrar la atencin para reducir la varianza.

    Se dispone de cuatro mtodos diferentes para estimar las componentes de la varianza: estimador mnimono cuadrtico insesgado (EMNCI, MINQUE), anlisis de varianza (ANOVA), mxima verosimilitud (MV,ML) y mxima verosimilitud restringida (MVR, RML). Se dispone de diversas especificaciones para losdiferentes mtodos.

    Los resultados predeterminados para todos los mtodos incluyen las estimaciones de componentes de lavarianza. Si se usa el mtodo MV o el mtodo MVR, se mostrar tambin una tabla con la matriz decovarianzas asinttica. Otros resultados disponibles incluyen una tabla de ANOVA y las mediascuadrticas esperadas para el mtodo ANOVA, y el historial de iteraciones para los mtodos MV y MVR.El procedimiento Componentes de la varianza es totalmente compatible con el procedimiento MLGFactorial general.

    La opcin Ponderacin MCP permite especificar una variable usada para aplicar a las observacionesdiferentes ponderaciones para un anlisis ponderado; por ejemplo, para compensar las variaciones deprecisin de las mediciones.

    Ejemplo. En una escuela agrcola, se mide el aumento de peso de los cerdos de seis camadas diferentesdespus de un mes. La variable camada es un factor aleatorio con seis niveles. Las seis camadasestudiadas son una muestra aleatoria de una amplia poblacin de camadas de cerdos. El investigadordeduce que la varianza del aumento de peso se puede atribuir a la diferencia entre las camadas ms quea la diferencia entre los cerdos de una misma camada.

    Componentes de la varianza: Consideraciones sobre los datos

    Datos. La variable dependiente es cuantitativa. Los factores son categricos; pueden tener valoresnumricos o valores de cadena de hasta ocho caracteres. Pueden tener valores numricos o valores decadena de hasta ocho bytes. Al menos uno de los factores debe ser aleatorio. Es decir, los niveles delfactor deben ser una muestra aleatoria de los posibles niveles. Las covariables son variables cuantitativasque estn relacionadas con la variable dependiente.

    Supuestos. Todos los mtodos suponen que los parmetros del modelo para un efecto aleatorio tienen demedia cero y varianzas constantes finitas y no estn correlacionados mutuamente. Los parmetros delmodelo para diferentes efectos aleatorios son tambin independientes.

    El trmino residual tambin tiene una media de cero y una varianza constante finita. No tiene correlacincon respecto a los parmetros del modelo de cualquier efecto aleatorio. Se asume que los trminosresiduales de diferentes observaciones no estn correlacionados.

    Basndose en estos supuestos, las observaciones del mismo nivel de un factor aleatorio estncorrelacionadas. Este hecho distingue un modelo de componentes de la varianza a partir de un modelolineal general.

    ANOVA y EMNCI no requieren supuestos de normalidad. Ambos son robustos a las desviacionesmoderadas del supuesto de normalidad.

    Copyright IBM Corp. 1989, 2014 21

  • MV y MVR requieren que el parmetro del modelo y el trmino residual se distribuyan de forma normal.

    Procedimientos relacionados. Use el procedimiento Explorar para examinar los datos antes de realizar elanlisis de componentes de la varianza. Para contrastar hiptesis, utilice MLG Factorial general, MLGMultivariado y MLG Medidas repetidas.

    Para obtener un anlisis de las componentes de la varianza1. Seleccione en los mens:

    Analizar > Modelo lineal general > Componentes de la varianza...2. Seleccione una variable dependiente.3. Seleccione variables para Factores fijos, Factores aleatorios y Covariables, en funcin de los datos. Para

    especificar una variable de ponderacin, utilice Ponderacin MCP.

    Componentes de la varianza: ModeloEspecificar modelo. Un modelo factorial completo contiene todos los efectos principales del factor, todoslos efectos principales de las covariables y todas las interacciones factor por factor. No contieneinteracciones de covariable. Seleccione Personalizado para especificar slo un subconjunto deinteracciones o para especificar interacciones factor por covariable. Indique todos los trminos que deseeincluir en el modelo.

    Factores y covariables. Muestra una lista de los factores y las covariables.

    Modelo. El modelo depende de la naturaleza de los datos. Despus de seleccionar Personalizado, puedeelegir los efectos principales y las interacciones que sean de inters para el anlisis. El modelo debecontener un factor aleatorio.

    Incluir la interseccin en el modelo. Normalmente se incluye la interseccin en el modelo. Si supone quelos datos pasan por el origen, puede excluir la interseccin.

    Generar trminosPara las covariables y los factores seleccionados:

    Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas. Esta esla opcin predeterminada.

    Efectos principales. Crea un trmino de efectos principales para cada variable seleccionada.

    Todas de 2. Crea todas las interacciones bidimensionales posibles de las variables seleccionadas.

    Todas de 3. Crea todas las interacciones tridimensionales posibles de las variables seleccionadas.

    Todas de 4. Crea todas las interacciones tetradimensionales posibles de las variables seleccionadas.

    Todas de 5. Crea todas las interacciones quntuples posibles de las variables seleccionadas.

    Componentes de la varianza: OpcionesMtodo. Puede seleccionar uno de los cuatro mtodos para estimar las componentes de la varianza.v EMNCI (estimador mnimo no cuadrtico insesgado) produce estimaciones que son invariables con

    respecto a los efectos fijos. Si los datos se distribuyen normalmente y las estimaciones son correctas,este mtodo produce la varianza inferior entre todos los estimadores insesgados. Puede seleccionar unmtodo para las ponderaciones previas de los efectos aleatorios.

    22 IBM SPSS Advanced Statistics 23

  • v ANOVA (anlisis de varianza) calcula las estimaciones insesgadas utilizando las sumas de cuadradosde Tipo I o Tipo III para cada efecto. El mtodo ANOVA a veces produce estimaciones de varianzanegativas, que pueden indicar un modelo errneo, un mtodo de estimacin inadecuado o la necesidadde ms datos.

    v Mxima verosimilitud (MV) genera estimaciones que sern lo ms coherente posible con los datosobservados realmente, utilizando iteraciones. Estas estimaciones pueden estar sesgadas. Este mtodo esasintticamente normal. Las estimaciones MV y MVR son invariables a la traslacin. Este mtodo notiene en cuenta los grados de libertad utilizados para estimar los efectos fijos.

    v Las estimaciones de mxima verosimilitud restringida (MVR) reducen las estimaciones ANOVA paramuchos (si no todos) los casos de datos equilibrados. Puesto que este mtodo se corrige respecto a losefectos fijos, deber dar errores estndar menores que el mtodo MV. Este mtodo tiene enconsideracin los grados de libertad utilizados para estimar los efectos fijos.

    Previas de los efectos aleatorios. Uniforme implica que todos los efectos aleatorios y el trmino residualtienen un impacto igual en las observaciones. El esquema Cero equivale a asumir varianzas de efectoaleatorio cero. Slo se encuentra disponible para el mtodo EMNCI.

    Suma de cuadrados Las sumas de cuadrados de Tipo I se utilizan para el modelo jerrquico, el cual esempleado con frecuencia en las obras sobre componentes de la varianza. Si selecciona Tipo III, que es elvalor predeterminado en MLG, las estimaciones de la varianza podrn utilizarse en MLG Factorialgeneral para contrastar hiptesis con sumas de cuadrados de Tipo III. Slo se encuentra disponible parael mtodo ANOVA.

    Criterios. Puede especificar el criterio de convergencia y el nmero mximo de iteraciones. Slo seencuentra disponible para los mtodos MV o MVR.

    Representacin. Para el mtodo ANOVA, puede seleccionar mostrar sumas de cuadrados y mediascuadrticas esperadas. Si selecciona el mtodo de Mxima verosimilitud o el de Mxima verosimilitudrestringida, puede mostrar una historia de las iteraciones.

    Sumas de cuadrados (Componentes de la varianza)Para el modelo, puede elegir un tipo de suma de cuadrados. El Tipo III es el ms utilizado y es el tipopredeterminado.

    Tipo I. Este mtodo tambin se conoce como el mtodo de descomposicin jerrquica de la suma decuadrados. Cada trmino se corrige slo respecto al trmino que le precede en el modelo. El mtodo desuma de cuadrados de Tipo I se utiliza normalmente para:v Un modelo ANOVA equilibrado en el que se especifica cualquier efecto principal antes de cualquier

    efecto de interaccin de primer orden, cualquier efecto de interaccin de primer orden se especificaantes de cualquier efecto de interaccin de segundo orden, y as sucesivamente.

    v Un modelo de regresin polinmica en el que se especifica cualquier trmino de orden inferior antesque cualquier trmino de orden superior.

    v Un modelo puramente anidado en el que el primer efecto especificado est anidado dentro delsegundo efecto especificado, el segundo efecto especificado est anidado dentro del tercero, y assucesivamente. Esta forma de anidamiento solamente puede especificarse utilizando la sintaxis.

    Tipo III. Es el mtodo predeterminado. Este mtodo calcula las sumas de cuadrados de un efecto dediseo como las sumas de cuadrados corregidas respecto a cualquier otro efecto que no lo contenga yortogonales a cualquier efecto (si existe) que lo contenga. Las sumas de cuadrados de Tipo III tienen unagran ventaja por ser invariables respecto a las frecuencias de casilla, siempre que la forma general deestimabilidad permanezca constante. As, este tipo de sumas de cuadrados se considera a menudo tilpara un modelo no equilibrado sin casillas perdidas. En un diseo factorial sin casillas perdidas, estemtodo equivale a la tcnica de cuadrados ponderados de las medias de Yates. El mtodo de suma decuadrados de Tipo III se utiliza normalmente para:

    Captulo 4. Anlisis de componentes de la varianza 23

  • v Cualquiera de los modelos que aparecen en Tipo I.v Cualquier modelo equilibrado o desequilibrado sin casillas vacas.

    Componentes de la varianza: Guardar en archivo nuevoSe pueden guardar algunos resultados de este procedimiento en un nuevo archivo de datos IBM SPSSStatistics.

    Estimaciones de las componentes de la varianza. Guarda las estimaciones de las componentes de lavarianza y las etiquetas de estimacin en un archivo de datos o conjunto de datos. Se puede utilizar paracalcular ms estadsticos o en otros anlisis de los procedimientos MLG. Por ejemplo, se pueden usarpara calcular intervalos de confianza o para contrastar hiptesis.

    Covariacin de las componentes. Guarda una matriz varianza-covarianza o una matriz de correlacionesen un archivo de datos o conjunto de datos. Slo est disponible si se han especificado los mtodos demxima verosimilitud o mxima verosimilitud restringida.

    Destino de los valores creados. Permite especificar un nombre para un conjunto de datos o para unarchivo externo que contenga las estimaciones de las componentes de la varianza y/o la matriz. Losconjuntos de datos estn disponibles para su uso posterior durante la misma sesin, pero no seguardarn como archivos a menos que se hayan guardado explcitamente antes de que finalice la sesin.El nombre de un conjunto de datos debe cumplir las normas de denominacin de variables.

    Se puede utilizar el comando MATRIX para extraer los datos que necesite del archivo de datos y despuscalcular los intervalos de confianza o realizar pruebas.

    Caractersticas adicionales del comando VARCOMPLa sintaxis de comandos tambin le permite:v Especificar efectos anidados en el diseo (utilizando el subcomando DESIGN).v Incluir los valores perdidos del usuario (utilizando el subcomando MISSING).v Especificar criterios EPS (mediante el subcomando CRITERIA).

    Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.

    24 IBM SPSS Advanced Statistics 23

  • Captulo 5. Modelos lineales mixtosEl procedimiento Modelos lineales mixtos ampla el modelo lineal general de manera que los datospuedan presentar variabilidad corelacionada y no constante. El modelo lineal mixto proporciona, portanto, la flexibilidad necesaria para modelar no slo las medias sino tambin las varianzas y covarianzasde los datos.

    El procedimiento Modelos lineales mixtos es asimismo una herramienta flexible para ajustar otrosmodelos que puedan ser formulados como modelos lineales mixtos. Dichos modelos incluyen losmodelos multinivel, los modelos lineales jerrquicos y los modelos con coeficientes aleatorios.

    Ejemplo. Una cadena de tiendas de comestibles est interesada en los efectos de varios vales en el gastode los clientes. Se toma una muestra aleatoria de los clientes habituales para observar el gasto de cadacliente durante 10 semanas. Cada semana se enva por correo un vale distinto a los clientes. Los modeloslineales mixtos se utilizan para estimar el efecto de los distintos vales en el gasto, a la vez que se corrigerespecto a la correlacin debida a las observaciones repetidas de cada sujeto durante las 10 semanas.

    Mtodos. Estimacin de mxima verosimilitud (MV) y mxima verosimilitud restringida (MVR).

    Estadsticos. Estadsticos descriptivos: tamaos de las muestras, medias y desviaciones estndar de lavariable dependiente y las covariables para cada combinacin de niveles de los factores. Informacin delos niveles del factor: valores ordenados de los niveles de cada factor y las frecuencias correspondientes.Asimismo, las estimaciones de los parmetros y los intervalos de confianza para los efectos fijos y laspruebas de Wald y los intervalos de confianza para los parmetros de las matrices de covarianzas.Pueden emplearse las sumas de cuadrados de Tipo I y Tipo III para evaluar diferentes hiptesis. Tipo IIIes el valor predeterminado.

    Modelos lineales mixtos: Consideraciones sobre los datos

    Datos. La variable dependiente debe ser cuantitativa. Los factores deben ser categricos y pueden tenervalores numricos o valores de cadena. Las covariables y la variable de ponderacin deben sercuantitativas. Las variables de sujetos y repetidas pueden ser de cualquier tipo.

    Supuestos. Se supone que la variable dependiente est relacionada linealmente con los factores fijos, lo