32
El Modelo del Análisis Factorial Ángel M. Carreras Jusino MATE 6600 Econometría y Modelos de Finanzas Dr. Balbino García Bernal

El Modelo Del Análisis Factorial

Embed Size (px)

DESCRIPTION

En la siguiente presentación se desarrollan algunas de las ideas fundamentales del análisis factorial para proporcional una introducción teórica al tema.

Citation preview

Page 1: El Modelo Del Análisis Factorial

El Modelo del Análisis Factorial

Ángel M. Carreras JusinoMATE 6600

Econometría y Modelos de FinanzasDr. Balbino García Bernal

Page 2: El Modelo Del Análisis Factorial

Introducción

• En la siguiente presentación se desarrollan algunas de las ideas fundamentales del análisis factorial para proporcional una introducción teórica al tema.

Page 3: El Modelo Del Análisis Factorial

Tópicos a Cubrirse

• La Ecuación de Especificación• La Ecuación Fundamental del Análisis Factorial• Extracción de Factores• Rotación de Factores• Representación Geométrica del Modelo

Factorial

Page 4: El Modelo Del Análisis Factorial

La Ecuación de Especificación

• En la base del análisis factorial hay un supuesto fundamental que puede formularse del siguiente modo:– Una puntuación típica en una variable puede

expresarse como una combinación lineal de puntuaciones en factores comunes, puntuaciones en factores específicos y puntuaciones en factores error.

Page 5: El Modelo Del Análisis Factorial

La Ecuación de Especificación 1 1 2 2

1

2

1 ...

donde

es una puntuación típica del sujeto en la variable ,

es un peso factorial de la variable en el factor común 1,

es un p

ik i k i k im mk is ik ie ik

ik

i

i

z a F a F a F a S a E

z k i

a i

a

eso factorial de la variable en el factor común 2,

es un peso factorial de la variable en el último factor común,

es un peso factorial de la variable en el factor específico ,

es

im

is

ie

i

a i

a i i

a

1

2

un peso factorial de la variable en el factor error ,

es una puntuación típica del sujeto en el factor común 1,

es una puntuación típica del sujeto en el factor común 2,

es una

k

k

mk

i i

F k

F k

F puntuación típica del sujeto en el factor común , el

último factor común,

es una puntuación típica del sujeto en el factor específico ,

es una puntuación típica del sujeto en ik

ik

k m

S k i

E k el factor error .i

Page 6: El Modelo Del Análisis Factorial

La Ecuación de Especificación

• Las puntuaciones z, F, S y E de la ecuación (1) son todas las puntuaciones típicas que tienen una media (M) de cero y una desviación típica (σ) de 1.0.

• Cada valor a de la ecuación (1) es una constante numérica, llamada peso factorial, que normalmente estará entre -1.0 y +1.0.

• La puntuación z, a la izquierda de la ecuación (1), se obtiene empiricamente como puntuación de una variable, mientras que las puntuaciones F, S, y E son factoriales hipotéticas que no se obtienen de la recogida de datos.

Page 7: El Modelo Del Análisis Factorial

La Ecuación de EspecificaciónEjemplo:• Sea zik la puntuación típica del sujeto k en una prueba de inteligencia.• Supongamos que solo hay cinco factores comunes concernientes a la

inteligencia humana, Aptitud Verbal (V), Aptitud Numérica (N), Memoria (M), Capacidad de Razonamiento (R) y Capacidad Perceptiva (P)

• Asumamos que las puntuaciones típicas en estos factores de habilidad son conocidas para toda persona de una población dada.

• Entonces en la ecuación (1) F1k representa la puntuación típica del sujeto k en el factor Verbal (V), F2k representa la puntuación típica del sujeto k en el factor Numérico (N) y F5k representa la puntuación típica del sujeto k en el factor Perceptual (P).

Page 8: El Modelo Del Análisis Factorial

La Ecuación de Especificación

Continuación del ejemplo:• El término Sik representa la puntuación típica del sujeto k en un factor

específico asociado solo con esta prueba de inteligencia; Eik representa la puntuación típica del sujeto k en el factor error asociado solo con esta prueba de inteligencia.

• Los valores ai1, ai2, …, ai5, ais, aie son los pesos factoriales para la prueba de inteligencia en los cinco factores comunes de habilidad más el factor error y el específico.

• Seleccionando un individuo particular que represente al sujeto k podrían resultar las siguientes sustituciones de puntuaciones típicas, sustituyendo en la ecuación (1):1.96 = ai1 (1.5) + ai2 (1.0) + ai3 (2.5) + ai4 (-1.0) + ai5 (-.2) + ais (-.3) + aie (1.0)

• Las puntuaciones típicas sustituidas en la ecuación (1), salvo raras excepciones, serán valores entre -3.0 y +3.0. Si los valores a se sustituyen por pesos factoriales hipotéticos, la ecuación se convierte en: 1.96 = .50 (1.5) + .40 (1.0) + .40 (2.5) + .37 (-1.0) + .30 (-.2) + .30 (-.3) + .33 (1.0)

Page 9: El Modelo Del Análisis Factorial

La Ecuación de Especificación

Continuación del ejemplo• La puntuación típica del sujeto k en la prueba de

inteligencia, 1.96, es relativamente alta, con cerca del 97.5% de la población por debajo de ella.

• Cuando se usa una media de 100 y una desviación típica de 16, esto correspondería a un CI de cerca de 132.

• Su mejor aptitud es la Memoria, con el factor Verbal y Numérico también muy por encima de la media.

• Está por debajo de la media en capacidad de Razonamiento y Capacidad Perceptual.

Page 10: El Modelo Del Análisis Factorial

La Ecuación de Especificación

• La ecuación (1) puede representarse en forma de esquema matricial para todos los valores de i y k simultáneamente, esto es, para todas las variables y todos los sujetos o cualesquiera otros sujetos productores de datos.

• La ecuación esquemática matricial puede representarse por la siguiente ecuación matricial: (2) Z = AuFu

• La ecuación (2) establece que la matriz Z de puntuaciones de variables puede obtenerse multiplicando la matriz de pesos factoriales, Au, por la matriz de puntuaciones factoriales, Fu.

Page 11: El Modelo Del Análisis Factorial

La Ecuación de EspecificaciónPersonas

1 2 3 … N

Variable

s

1 z11 z12 z13 … z1N

2 z21 z22 z23 … z2N

3 z31 z32 z33 … z3N

. . . . . .

n zn1 zn2 zn3 … znN

Z

Factores1 2 3 … m 1 2 3 … n 1 2 3 … n

=Variables

1 a11 a12 a13 ... a1m a1s 0 a1e 02 a21 a22 a23 ... a2m a2s a2e

3 a31 a32 a33 ... a3m a3s a3e

. . . . . . 0 . 0 .

n an1 an2 an3 ... anm ans ane

Au

Personas1 2 3 … N

xFactore

s

1 F11 F12 F13 … F1N

2 F21 F22 F23 … F2N

3 F31 F32 F33 … F1N

. . . . . .

m Fm1 Fm2 Fm3 … FmN

1 S11 S12 S13 … S1N

2 S21 S22 S23 … S2N

3 S31 S32 S33 … S3N

. . . . . .

n Sn1 Sn2 Sn3 … SnN

1 E11 E12 E13 … E1N

2 E21 E22 E23 … E2N

3 E31 E32 E33 … E3N

. . . . . .

n En1 En2 En3 … EnN

Fu

Notación matricial esquemática para todos los valores de i y k simultáneamente

u uZ A F

Page 12: El Modelo Del Análisis Factorial

La Ecuación Fundamental del Análisis Factorial

• En su utilización ordinaria, el análisis factorial implica derivar un conjunto de pesos factoriales a partir de una matriz de coeficientes de correlación entre las variables.

• La correlación entre un par de variables es igual a la suma de los productos de sus pesos factoriales, los valores a de la matriz Au, en los factores comunes.

• Es decir que

(3)

especifica la correlación entre las variables i y j.

1 1 2 2 ...ij i j i j im jmr a a a a a a

Page 13: El Modelo Del Análisis Factorial

La Ecuación Fundamental del Análisis Factorial

• La ecuación (3) puede representarse, para todos los valores de i y j simultáneamente, mediante la siguiente notación matricial esquemática.

1 2 3 … n

1 r11 r12 r13 … r1n

2 r21 r22 r23 … r2n

3 r31 r32 r33 … r3n

. . . . . .

n rn1 rn2 rn3 … rnn

R

1 2 3 … m 1 2 3 … n

=

1 a11 a12 a13 … a1m

x

1 a11 a21 a31 … an1

2 a21 a22 a23 … a2m 2 a12 a22 a32 … an2

3 a31 a32 a33 … a3m 3 a13 a23 a33 … an3

. . . . . . . . . . . .

n an1 an2 an3 … anm m a1m a2m a3m … anm

A A'

La ecuación correspondiente a esta representación esquemática es(4) R = AA’Es decir el producto de la matriz de pesos factorialescomunes por la transpuesta de esta.

Page 14: El Modelo Del Análisis Factorial

La Ecuación Fundamental del Análisis Factorial

• Un teorema muy importante del análisis factorial, que fue llamado por Thurstone (1947) la ecuación fundamental del análisis factorial, se puede ver a través de dos ecuaciones.

• Ambas ecuaciones establecen que la matriz de correlaciones entre las variables de datos puede descomponerse en el producto de una matriz factorial por su transpuesta.

• La ecuación(5) Ru = AuAu’

reproduce la matriz de correlaciones con unos en las diagonales, usando una matriz factorial Au que contiene factores específicos y de error.

Page 15: El Modelo Del Análisis Factorial

La Ecuación Fundamental del Análisis Factorial

• La ecuación (4) reproduce la matriz de correlaciones reducida, R, con comunalidades en la diagonal en lugar de unos.

• Los restantes elementos son iguales en la matriz R y la Ru.

• Para explicar las correlaciones entre las variables de datos, solo se necesitan los factores comunes.

• Para explicar la varianza total de las variables de datos, se necesitan, en este modelo, los factores comunes, específicos y de error.

Page 16: El Modelo Del Análisis Factorial

Extracción de Factores

• El proceso de extracción de factores comienza con una matriz de correlaciones entre las variables de datos con comunalidades en la diagonal y termina con una matriz de pesos factoriales A, tal que cuando se multiplica por su transpuesta A’ se produce la matriz de correlaciones R.

• La extracción de factores representa un problema de descomposición de matrices, es decir, la descomposición de R en el producto de otra matriz y su transpuesta.

Page 17: El Modelo Del Análisis Factorial

Extracción de Factores

• Tradicionalmente uno de los fines principales del análisis factorial ha sido explicar una matriz de datos con muchos menos factores que variables de datos.

• Los métodos de extracción de factores, diseñados para producir la matriz A buscan dar cuenta de la mayor parte posible de la varianza total extraída en cada factor extraído sucesivamente.

• Es decir, en cada paso se busca un factor para el cual la suma de los cuadrados de los pesos factoriales sea lo mayor posible.

Page 18: El Modelo Del Análisis Factorial

Rotación de Factores

• El análisis factorial y los métodos de extracción de factores no ofrecen una única solución a la ecuación R = AA’.

• Una de las razones es que la matriz R solo se reproduce aproximadamente en la práctica y los experimentadores pueden diferir en el sentido de hasta donde deben aproximarse a R.

• Otra razón para la ausencia de soluciones únicas es el hecho de que hay infinitas matrices A que reproducen la matriz R con la misma fidelidad.

Page 19: El Modelo Del Análisis Factorial

Rotación de Factores

• Consideremos lo siguiente.

11 12 11 12

21 22 21 22

31 32 31 32

41 42 41 42

cos sin

sin cos

a a v v

a a v v

a a v v

a a v v

A Λ VEsta operación matricial esquemática puede ser expresada como una ecuación matricial:(6) A Λ = V

Page 20: El Modelo Del Análisis Factorial

Rotación de Factores

• Si R = AA’, entonces es también verdad que R = VV’, ya que si trasponemos el producto AΛ, la ecuación (6) puede reescribirse de la siguiente forma:(7) (AΛ)’ = V’

• Puesto que la matriz traspuesta de un producto es el producto de las matrices traspuestas en orden inverso, la ecuación (7) se convierte en(8) Λ’A’ = V’

Page 21: El Modelo Del Análisis Factorial

Rotación de Factores

• Utilizando las ecuaciones (6) y (8) el producto VV’ se convierte en(9) VV’ = AΛΛ’A’

• Pero ΛΛ’ incluido en el centro del producto de matrices en ecuación (9), da a una matriz identidad, como sigue:

• Como resultado, la ecuación (9) se simplifica a R = AA’.• Puesto que no se especifica el valor de , puede haber tantas

matrices Λ, como valores de .

cos sin cos sin 1 0

sin cos sin cos 0 1

Λ Λ’ I

Page 22: El Modelo Del Análisis Factorial

Rotación de Factores

• En general, si hay m factores en la matriz A, la matriz Λ será de tamaño m x m.

• Toda matriz Λ debe cumplir los siguientes requisitos:1. La suma de los cuadrados de las filas debe ser igual a 1;2. la suma de los cuadrados de las columnas debe ser igual a 1;3. El producto interno de una fila por otra debe ser igual a cero

para todo par de filas distintas.4. El producto interno de una columna por otra debe ser igual a

cero para todo par de columnas distintas.* Este proceso garantiza que Λ Λ’ = I y que A Λ sea un sustituto

de A en la reproducción de la matriz R de la misma forma que A.

Page 23: El Modelo Del Análisis Factorial

Rotación de Factores

• El proceso de rotación en el análisis factorial lleva consigo el encontrar una matriz Λ tal que A Λ represente un conjunto óptimo de construcciones para los propósitos científicos.

Page 24: El Modelo Del Análisis Factorial

Representación Geométrica del Modelo Factorial

• En la representación geométrica del modelo factorial, una variable de datos puede representarse como un vector en un espacio de tantas dimensiones como factores comunes haya.

• La longitud de un vector de m dimensiones viene dada por

(10)

donde los valores ai son las coordenadas del vector respecto a los m ejes de referencia o dimensiones

2 2 2 21 2 3 ... mh a a a a

Page 25: El Modelo Del Análisis Factorial

Representación Geométrica del Modelo Factorial

• El producto escalar de dos vectores puede definirse como sigue:

(11) 21

2211 12 1

2

... m

m

a

aa a a c

a

Page 26: El Modelo Del Análisis Factorial

Representación Geométrica del Modelo Factorial

• λij – es el coseno entre el vector i y el eje coordenado j.– se denomina al coseno dirrecional del vector i

respecto al eje (factorial) de coordenadas j.

• Si aij es la coordenada del vector i respecto al eje factorial j y hi es la longitud del vector i, entonces:

(12) ijij ij i ij

i

aa h a

h

Page 27: El Modelo Del Análisis Factorial

Representación Geométrica del Modelo Factorial

• Sustituyendo (12) en (11) obtenemos:

(13)

1

2

1 2

1 1 2 2

1 1 2 2

j j

j j

i i i i i im

j jm

i j i j i j i j i j im jm

i j i j i j im jm

h

hh h h c

h

h h h h h h c

h h c

Page 28: El Modelo Del Análisis Factorial

Representación Geométrica del Modelo Factorial

• Por un teorema de geometría analítica el producto interno de los cosenos direccionales de dos vectores es igual al coseno del ángulo entre los vectores.

• Así que (13) se convierte en

(14)

• El producto escalar entre los vectores i y j es también igual a la correlación entre ellos.

(15)

cosi j ijh h c

1 1 2 2ij i j i j im jmr a a a a a a

Page 29: El Modelo Del Análisis Factorial

Representación Geométrica del Modelo Factorial

• Dividiendo (15) entre hi y hj obtenemos

(16)

1 21 2

1 1 2 2

cos

cos

ij j j jmi i im

i j i j i j i j

iji j i j im jm

i j

ijij

i j

ij i j ij

r a a aa a a

h h h h h h h h

r

h h

r

h h

r h h

Page 30: El Modelo Del Análisis Factorial

Representación Geométrica del Modelo Factorial

Donde:

cosij i j ijr h h

Ángulo entre los vectores i y j.

Longitud del vector i.

Longitud del vector j.

Correlación entre los vectores i y j.

Page 31: El Modelo Del Análisis Factorial

Representación Geométrica del Modelo Factorial

• Aunque el modelo factorial se puede desarrollar sin referirse a conceptos geométricos, lo antes presentado se hace útil como medio adicional para poder entender las bases de esta técnica estadística.

• Note que la representación geométrica tiene sus limitaciones, porque solo nos ofrece información visual para vectores de hasta tres dimensiones.

Page 32: El Modelo Del Análisis Factorial

Referencias

• Andrew L. Comrey (1985 ) Manual de Análisis Factorial

• http://www.uam.es/personal_pdi/economicas/eva/pdf/factorial.pdf

• http://www2.uca.es/serv/ai/formacion/spss/Pantalla/20factor.pdf

• http://ciberconta.unizar.es/LECCION/factorial/FACTORIALEC.pdf