4
ANALISIS DE COMPONENTES PRINCIPALES Carrión Ávila, Frank Castillo Elizalde, Tania Crisanto Ugaz, Alex El Análisis de Componentes Principales (ACP) es una técnica estadística de síntesis de la información, o reducción de la dimensión (número de variables). Es decir, ante un banco de datos con muchas variables, el objetivo será reducirlas a un menor número perdiendo la menor cantidad de información posible

El-Análisis-de-Componentes-Principales.docx

Embed Size (px)

DESCRIPTION

componentes principales

Citation preview

Page 1: El-Análisis-de-Componentes-Principales.docx

ANALISIS DE COMPONENTES PRINCIPALES

Carrión Ávila, FrankCastillo Elizalde, TaniaCrisanto Ugaz, Alex

El Análisis de Componentes Principales (ACP) es una técnica estadística de síntesis de la información, o reducción de la dimensión (número de variables). Es decir, ante un banco de datos con muchas variables, el objetivo será reducirlas a un menor número perdiendo la menor cantidad de información posible

Page 2: El-Análisis-de-Componentes-Principales.docx

El Análisis de Componentes Principales (ACP)

I. DEFINICION:

Es un método de análisis multivariante de simplificación o reducción de la dimensionalidad de un conjunto de variables que están intercorrelacionadas entre sí.

II. OBJETIVO :

Transformar un conjunto de variables cuantitativas (variables originales), caracterizadas por compartir información común entre sí (es decir, están correlacionadas), en un conjunto mucho más pequeño de variables llamadas Componentes Principales. Estas últimas, que están ya incorrelacionadas y que son una combinación lineal de las variables originales, recogen la máxima información del conjunto original de variables.

Esta técnica de análisis tiene un carácter puramente exploratorio y descriptivo, aunque en muchas ocasiones se presenta como un caso particular de otra técnica de análisis multivariante conocida como Análisis Factorial (AF), la cual tiene un claro carácter inferencial y, por tanto, presume un modelo estadístico formal de generación de los datos. La diferencia fundamental entre ambas técnicas es que en el Análisis Factorial se trata de explicar la varianza común de las variables originales a través de un modelo lineal que relaciona las variables originales y unas nuevas variables subyacentes, no observables, llamadas factores comunes, mientras que en la Análisis en Componentes Principales, las componentes se construyen para

explicar la varianza total. III. INTERÉS DEL MÉTODO

Explicar fenómenos cuya información se cifra en muchas variables más o menos correlacionadas.

Reducir la dimensión del número de variables inicialmente consideradas en el análisis.

Las nuevas variables pueden ordenarse según la información que llevan.

Page 3: El-Análisis-de-Componentes-Principales.docx

IV. PRINCIPIOS BÁSICOS

Sólo con datos cuantitativos y no es necesario establecer jerarquías ni comprobar la normalidad.

Si las variables originales no están correlacionadas, el análisis no tiene sentido. Como medida de la cantidad de información incorporada en el componente se

utiliza la varianza. Se ordenan según la varianza de mayor a menor. Se trabaja con variables tipificadas o con variables expresadas en desviaciones

respecto a la media para evitar problemas derivados de la escala. El nuevo conjunto de variables (componentes principales) es igual al número de

variables originales. Los componentes principales se expresan como una combinación lineal de las

variables originales.

V. UTILIDAD

Las variables que explican un fenómeno son muchas y están correlacionadas, es posible explicar el fenómeno con muy pocos componentes principales.

Ejemplo aplicativos: Análisis de mercados, Determinación del proceso de compra, Caracterización de explotaciones, variabilidad de productos. Etc.

VI. Características principales:

Permite transformar las variables originales, en general altamente correlacionadas, en un nuevo conjunto de variables incorrelacionadas, las componentes, que resumen la información de las primeras y facilitan la interpretación de los datos.

Presenta, por tanto, en un espacio de pequeña dimensión observaciones dadas en un espacio de dimensión mayor. En este sentido, es el primer paso para identificar las posibles variables latentes, no observables, que generan los datos.

Transforma la información original, creando un conjunto de variables nuevas que por estar ya incorrelacionadas podrían utilizarse en análisis posteriores que exijan partir de esta premisa de ausencia de correlación.

Page 4: El-Análisis-de-Componentes-Principales.docx

Por último, simplifica las relaciones existentes entre las variables explicativas observables y, en el caso que nos ocupa, nos proporciona los pesos relativos para construir un índice sintético.