24
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL Titular: Agustín Salvia MÓDULO 4 B ANÁLISIS FACTORIAL SEMINARIO DE POSGRADO

Analisis Factorial

Embed Size (px)

DESCRIPTION

Análisis factorial

Citation preview

ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN

SOCIAL

Titular: Agustín Salvia

MÓDULO 4 B

ANÁLISIS FACTORIAL

SEMINARIO DE POSGRADO

ANÁLISIS FACTORIAL

Identificación de estructuras subyacentes

Reducción de información

EN LA INVESTIGACIÓN SOCIAL SE TRABAJA CON MUCHOS CONCEPTOS COMPLEJOSCONCEPTOS COMPLEJOS QUE

NO SON DIRECTAMENTE OBSERVABLES

Creación de variables resumen

USOS MÁS FRECUENTES

El Análisis Factorial es una técnica que consiste en resumir la información contenida en una matriz de datos con V variables. Para ello se identifican un reducido número de factores F, siendo el número de factores menor que el número de variables. Los factores representan a la variables originales, con una pérdida mínima de información.

El modelo del Análisis Factorial se expresa como una combinación lineal de factores no directamente observables: Xij = F1i ai1 + F2i ai2+....+Fki aik + Vi

ANÁLISIS FACTORIAL

El Análisis Factorial (método factor principal) supone que existe un factor común subyacente a las variables.

Este método busca factores que expliquen la mayor parte de la varianza común. La varianza común es la parte de la variación de la variable que es compartida con las otras variables. La varianza única es la parte de la variación de la variable que es propia de esa variable.

ANÁLISIS FACTORIALFACTOR PRINCIPAL

El Análisis Factorial (método componentes principales) no supone que existe un factor común subyacente a las variables.

El Análisis de Componentes Principales busca hallar combinaciones lineales de las variables originales que expliquen la mayor parte de la variación total. El primer factor o componente sería aquel que explica una mayor parte de la varianza total, el segundo factor sería aquel que explica la mayor parte de la varianza restante, y así sucesivamente.

ANÁLISIS FACTORIALCOMPONENTES PRINCIPALES

Para que el Análisis Factorial tenga sentido deberían cumplirse dos condiciones básicas:

Parsimonia e Interpretabilidad

Según el principio de parsimonia el número de factores debe ser lo más reducido posible y estos deben ser susceptibles de interpretación sustantiva. Una buena solución factorial es aquella que es sencilla e interpretable.

ANÁLISIS FACTORIAL

ANÁLISIS FACTORIAL

Se asume que los factores únicos no están correlacionados entre sí ni con los factores comunes.

Se puede distinguir entre Análisis Factorial Exploratorio, donde no se conocen los factores "a priori“ sino que se identifican por el análisis factorial y, por otro lado estaría el Análisis Confirmatorio donde se propone "a priori" un modelo, según el cual hay unos factores que representan mejor a las variables originales.

1- Calcular la matriz de correlaciones entre todas las variables (conocida habitualmente

como matriz R).

2- Extracción de los factores necesarios para representar los datos. Análisis de la matriz de cargas.

3- Rotación de los factores con objeto de facilitar la interpretación. Representación gráfica.

4- Calcular las puntuaciones factoriales de cada individuo.

ANÁLISIS FACTORIALPASOS EN EL ANALISIS FACTORIAL

REQUISITOS PARA SU UTILIZACIÓN

Selección de variables que formen conjuntos correlacionados. Variables deben estar en escala métrica. Un mínimo de 100 casos

ANÁLISIS FACTORIAL

ANÁLISIS FACTORIALEJEMPLO

Se intentan conocer los determinantes de los ingresos de la ocupación principal de los asalariados. Dado que se supone que estos están asociados a un conjunto de características de la persona y del puesto. Dado que el conjunto de variables es grande y se sospecha que algunas de ellas están muy relacionadas, por lo que parece conveniente antes del análisis intentar determinar si existen subconjuntos diferenciados de ellas.

EXAMEN DE LA MATRIZ DE CORRELACIONES

1- El primer paso en el Análisis Factorial será calcular la matriz de correlaciones entre todas las variables que entran en el análisis.

2- Una vez que se dispone de esta matriz cabe examinarla para comprobar si sus características son adecuadas para realizar un Análisis Factorial.

3- Uno de los requisitos que deben cumplirse para que el Análisis Factorial tenga sentido es que las variables estén altamente correlacionadas.    

ANÁLISIS FACTORIAL

EXAMEN DE LA MATRIZ DE CORRELACIONES

ANÁLISIS FACTORIALEJEMPLO

Correlation Matrix

1,000 ,281 ,136 ,379

,281 1,000 -,101 ,554,136 -,101 1,000 ,164,379 ,554 ,164 1,000

,000 ,000 ,000

,000 ,000 ,000,000 ,000 ,000,000 ,000 ,000

Tamaño delestablecimientoNivel de InstrucciónEdadCalificación laboralTamaño delestablecimientoNivel de InstrucciónEdadCalificación laboral

Correlation

Sig. (1-tailed)

Tamañodel

establecimiento

Nivel deInstrucción Edad

Calificación laboral

El Análisis Factorial extrae una matriz factorial:F 1 F 2

1 P11 P212 P12 P22

• Cada columna es un factor y cada fila una variable.  Los elementos Pij pueden interpretarse como índices de correlación entre el factor i y la variable j.

• Estos coeficientes reciben el nombre de pesos o cargas factoriales. Las cargas indican el peso de cada variable en cada factor. Lo ideal es que cada variable cargue alto en un factor y bajo en los demás.

ANÁLISIS FACTORIALMATRIZ DE CARGA

FACTORIAL

ANÁLISIS FACTORIALEJEMPLO

Component Matrixa

,680 ,202

,775 -,412,185 ,931,859 1,103E-02

Tamaño delestablecimientoNivel de InstrucciónEdadCalificación laboral

1 2Component

Extraction Method: Principal Component Analysis.2 components extracted.a.

• El cuadrado de una carga factorial indica la proporción de la varianza explicada por un factor en una variable particular.

• La suma de los cuadrados de los pesos de cualquier columna de la matriz factorial es lo que denominamos eigenvalues, indica la cantidad total de varianza que explica ese factor.

• Las cargas factoriales pueden tener como valor máximo 1, por tanto el valor máximo que puede alcanzar el valor propio es igual al número de variables.

ANÁLISIS FACTORIALEIGENVALUES (VALORES

PROPIOS)

EXTRACCIÓN DE MATRIZ FACTORIAL

ANÁLISIS FACTORIALEJEMPLO

Communalities

1,000 ,504

1,000 ,7711,000 ,9001,000 ,738

Tamaño delestablecimientoNivel de InstrucciónEdadCalificación laboral

Initial Extraction

Extraction Method: Principal Component Analysis.

Total Variance Explained

1,836 45,910 45,910 1,836 45,910 45,910 1,821 45,531 45,5311,077 26,913 72,823 1,077 26,913 72,823 1,092 27,292 72,823,702 17,544 90,367,385 9,633 100,000

Component1234

Total% of

VarianceCumulativ

e % Total% of

VarianceCumulativ

e % Total% of

VarianceCumulativ

e %

Initial EigenvaluesExtraction Sums of Squared

Loadings Rotation Sums of Squared Loadings

Extraction Method: Principal Component Analysis.

• Se denomina "comunalidad" a la proporción de la varianza explicada por los factores comunes en una variable. La comunalidad es la suma de los pesos factoriales al cuadrado en cada una de las filas.

• El Análisis Factorial comienza sus cálculos a partir de lo que se conoce como matriz reducida compuesta por los coeficientes de correlación entre las variables y con las comunalidades en la diagonal.

• Como la comunalidad no se puede saber hasta que se conocen los factores, este resulta ser uno de los problemas del Análisis Factorial.

ANÁLISIS FACTORIALCOMUNALIDADES

La matriz factorial presenta un número de factores superior al necesario para explicar la estructura de los datos. Generalmente hay un conjunto reducido de factores, los primeros, que son los que explican la mayor parte de la variabilidad total. Los otros factores suelen contribuir relativamente poco.

Existen diversos criterios para determinar el número de factores a conservar. Uno de los más utilizados es la regla de Kaiser: "conservar aquellos factores cuyos valores propios (eigenvalues) son mayores a la unidad". Este criterio tiende a sobreestimar el número de factores.

ANÁLISIS FACTORIALNUMERO DE FACTORES A

CONSERVAR

ANÁLISIS FACTORIALEJEMPLO

Scree Plot

Component Number

4321

Eige

nval

ue

2,0

1,5

1,0

,5

0,0

La matriz factorial resulta difícil de interpretar pues no queda claro en que factor satura cada variable. Para facilitar la interpretación se realizan lo que se denominan rotaciones factoriales, la cual consiste en hacer girar los ejes de coordenadas, que representan a los factores, hasta conseguir que se aproxime al máximo a las variables en que están saturados. La saturación de factores transforma la matriz factorial inicial en otra denominada matriz factorial rotada, de más fácil interpretación. La matriz factorial rotada es una combinación lineal de la primera y explica la misma cantidad de varianza inicial.

ANÁLISIS FACTORIALROTACIONES

FACTORIALES

La matriz factorial debe reunir las siguientes características:  1- Cada factor debe tener unos pocos pesos altos y los otros próximos a 0.  2- Cada variable no debe estar saturada más que en un factor.  3- Los factores distintos deben presentar distribuciones de cargas altas y bajas distintas.

Con la rotación factorial aunque cambie la matriz factorial las comunalidades no se alteran, sin embargo, cambia la varianza explicada por cada factor. Existen varios métodos de rotación: ortogonales para factores independientes (Varimax) y oblicuos para factores correlacionados (Oblimin).

ANÁLISIS FACTORIALEVALUACIÓN DE LA MATRIZ

ROTADA

MATRIZ ROTADA

ANÁLISIS FACTORIALEJEMPLO

Rotated Component Matrixa

,645 ,296

,826 -,2985,196E-02 ,947

,849 ,132

Tamaño delestablecimientoNivel de InstrucciónEdadCalificación laboral

1 2Component

Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.

Rotation converged in 3 iterations.a.

Component Transformation Matrix

,990 ,141-,141 ,990

Component12

1 2

Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.

ANÁLISIS FACTORIALEJEMPLO

Component Plot in Rotated Space

Component 1

1,0,50,0-,5-1,0

Com

pone

nt 2

1,0

,5

0,0

-,5

-1,0

calificación laboral

edad

nivel de instrucción

tamaño del estableci

Dos cuestiones pueden ayudar a la interpretación y reconocimiento de los factores: 1) Ordenar la matriz rotada de forma que las variables con saturaciones altas en un factor aparezcan juntas. 2) Eliminar las variables con cargas factoriales bajas (aquellas por debajo de 0,25).

Llamaremos variable compleja a aquella que satura altamente en más de un factor y que no debe ser utilizada para identificar los factores. Factores bipolares, son aquellos en los que unas variables cargan positivamente y otras tienen carga negativa.

ANÁLISIS FACTORIALINTERPRETACIÓN DE RESULTADOS