22
UNIVERSIDAD DE EL SALVADOR FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE DEPARTAMENTO DE MATEMÁTICA TEMA : Análisis discriminante. ASIGNATURA: Problema de Estadística Aplicada (P.E.A) DOCENTE: Licda. Claudia Lissett Ramos Barrientos. ALUMNOS : Geovani Oswaldo Josué Isaac Blanco Henry Oswaldo Martínez CARRERA: LICENCIATURA EN ESTADÍSTICA (L30941) CICLO II / 2014

Análisis discriminante

Embed Size (px)

DESCRIPTION

es un documento sobre analisis discriminante de un conjunto de datos

Citation preview

UNIVERSIDAD DE EL SALVADORFACULTAD MULTIDISCIPLINARIA DE OCCIDENTEDEPARTAMENTO DE MATEMTICA

TEMA:Anlisis discriminante.ASIGNATURA: Problema de Estadstica Aplicada (P.E.A)DOCENTE: Licda. Claudia Lissett Ramos Barrientos.ALUMNOS:Geovani Oswaldo Josu Isaac BlancoHenry Oswaldo MartnezCARRERA: LICENCIATURA EN ESTADSTICA (L30941)CICLO II / 2014

Introduccin.

En el presente trabajo se describe una tcnica estadstica de inters especial en el mundo de la investigacin, es el denominado anlisis discriminante. Se trata de una herramienta que permite asignar o clasificar nuevos individuos dentro de los grupos previamente reconocidos o definidos; esto ltimo es la diferencia entre el anlisis discriminante y el anlisis clster o de conglomerados ya que el anlisis de conglomerados los grupos se forman pero surgidos por la propia esencia de los datos.El anlisis parte de una base de datos de n individuos en que se han medido p variables cuantitativas independientes (explicativas), como perfil de cada uno de ellos. Una variable cualitativa adicional (dependiente o clasificativa), con dos o ms categoras. Esto se puede ver como una tabla a partir de ella se obtendr un modelo discriminante contra el cual ser contrastado el perfil de un nuevo individuo cuyo grupo se desconoce para, en funcin de un resultado numrico, ser asignado al grupo ms probable; es importante mencionar que cuanto mejor sea la informacin de partida ms fiable ser el resultado de asignacin posteriores.El anlisis discriminante es aplicable a muy diversas reas de conocimiento. Se ha utilizado para distinguir grupos de patolgicos normales a partir de resultados obtenidos en pruebas diagnsticas, como los parmetros hemodinmicos en el mbito clnico mdico o las pruebas psicodiagnsticas en el mbito clnico psicolgico. En el campo de los recursos humanos se aplica a la seleccin de personal para realizar un filtrado de los currculos previo a la entrevista personal. En banca se han utilizado para atribuir riesgo crediticio y en las compaas aseguradoras para predecir la siniestralidad. Para propsito de conocimiento se menciona que: el anlisis discriminante es conceptualmente muy similar al anlisis de varianza multivariante de un factor. Su propsito es el mismo que el del anlisis de regresin logstica, pero a diferencia de l, solo admite variables cuantitativas. Si alguna de las variables independientes es categrica, es preferible usar la regresin logstica. Objetivos.

Objetivo general. Aplicarle el anlisis discriminante a la base de datos denominada coches.sav.

Objetivos especficos.

Explicar cada uno de los resultados producidos al aplicarle un anlisis discriminante a la base de datos coches.sav. Calcular la funcin discriminante y darle la interpretacin debida.

Marco Terico. Anlisis discriminante.

El planteamiento estadstico del anlisis de discriminante es el siguiente. Se dispone de un conjunto amplio de elementos que pueden venir de dos o ms poblaciones distintas. En cada elemento se observa una variable aleatoria p-dimensional X, cuya distribucin se conoce en las poblaciones consideradas. Se desea clasificar un nuevo elemento, con valores de las variables conocidas, en una de las poblaciones. Por ejemplo la primera aplicacin del anlisis discriminante consisti en clasificar los restos de un crneo descubierto en una excavacin como humano, utilizando la distribucin de medidas fsicas para los crneos humanos y los de antropoides.A falta de otra informacin, cualquier profesional se limita a utilizar su propia experiencia o la de otros, o su intuicin, para anticipar el comportamiento del nuevo elemento. Pero a medida que los problemas se hacen ms complejos y las consecuencias de una mala decisin ms graves, las impresiones subjetivas basadas en la propia intuicin o experiencia deben ser sustituidas por argumentos ms consistentes. El anlisis discriminante ayuda a identificar las caractersticas que diferencian (discriminan) a dos o ms grupos y a crear una funcin capaz de distinguir con la mayor precisin posible a los miembros de uno u otro grupo. Obviamente, para llegar a conocer en qu se diferencian los grupos se necesita disponer de la informacin (cuantificada en una serie de variables) en la que suponemos que se diferencian. El anlisis discriminante es una tcnica estadstica capaz de decirnos qu variables permiten diferenciar a los grupos y cuntas de estas variables son necesarias para alcanzar la mejor clasificacin posible. La pertenencia a los grupos, conocida de antemano, se utiliza como variable dependiente (una variable categrica con tantos valores discretos como grupos). Las variables en las que suponemos que se diferencian los grupos se utilizan como variables independientes o variables de clasificacin (tambin llamadas variables discriminantes).segn se ver deben ser variables cuantitativas continuas o, al menos, admitir un tratamiento numrico con significado.

El objetivo ltimo del anlisis discriminante es encontrar la combinacin lineal de las variables independientes que mejor permite diferenciar (discriminar) a los grupos. Una vez encontrada esa combinacin (la funcin discriminante) podr ser utilizada para clasificar nuevos casos. Se trata de una tcnica de anlisis multivariante que es capaz de aprovechar las relaciones existentes entre una gran cantidad de variables independientes para maximizar la capacidad de discriminacin.

El anlisis discriminante es conceptualmente muy similar al anlisis de varianza multivariante de un factor. Su propsito es el mismo que el del anlisis de regresin logstica, pero a diferencia de l, slo admite variables cuantitativas. Si alguna de las variables independientes es categrica, es preferible utilizar la regresin logstica.

Clasificacin con dos grupos.Se trata de estudiar la aplicacin del anlisis discriminante a la clasificacin de individuos en el caso de que dichos individuos se puedan asignar solamente a dos grupos a partir de k variables clasificadoras. Este problema lo resolvi Fisher analticamente su funcin discriminante la funcin discriminante de Fischer D se obtiene como funcin lineal de k variables explicativas. Las puntuaciones discriminantes son los valores que se obtienen al dar valores a en la ecuacin.

Se trata de obtener los coeficientes de ponderacin , si consideramos que existe n observaciones, podemos expresar la funcin discriminante para ellas:

. Es la puntuacin discriminante correspondiente a la observacin i-sima. Expresando las variables explicativas en desviaciones respecto a la media, tambin estar y la relacin anterior se puede expresar en forma matricial como sigue: = En notacin compacta se puede escribir:

La variabilidad discriminante (suma de cuadrados de las variables discriminantes en desviacin respecto a su media) se expresa como

La matriz es una matriz simtrica expresada en desviaciones respecto a su media, por lo que puede considerarse como la matriz T de suma de cuadrados (SCPC) total de las variables (explicativas) de la matriz X. segn la teora del anlisis multivariante de la varianza, se puede descomponer en la suma de la matriz entre grupos F y la matriz intragrupos V (o residual). Se tiene:

Los ejes discriminantes vendrn dados por los vectores propios asociados a los valores propios de la matriz ordenados de mayor a menor. Las puntuaciones discriminantes corresponden con los valores obtenidos al proyectar cada punto del espacio K-dimensional de las variables originales sobre el eje discriminante.Los centros de gravedad o centroides (vector de medias) son los estadsticos bsicos que resumen la informacin sobre los grupos. Los centroides de los grupos I y II sern los siguientes. Con lo que para los grupos I y II se obtiene:

El punto de corte discriminante C se calcula mediante el promedio:

El criterio para clasificar el individuo i es el siguiente:Si Si En general cuando, se clasifica un individuo en el grupo I si D-C > 0, y en grupo II en otro caso.A veces suelen construirse funciones discriminantes para cada grupo, y , con la siguiente estructura:

Cuando se utilizan estas funciones, se clasifica u individuo en el grupo en el que la funcin sea mayor. Este tipo de funciones clasificadoras tienen la ventaja de que se generalizan fcilmente para el caso en el que existan ms de dos grupo y viene implementado en la mayora del software estadstico. Si hacemos:

Ya que se pueden obtener los coeficientes Existen otros criterios de clasificacin, entre los que destacan el anlisis de la regresin y la distancia de Mahalanobis.La relacin entre el anlisis de regresin y el anlisis discriminante con dos grupos es muy estrecha. Si se realiza un ajuste por mnimos cuadrados tomando como variable dependiente la variable que defina la pertenencia a uno u otro grupo y como variables explicativas a las variables clasificadoras, se obtienen unos coeficientes que guardan una estricta proporcionalidad con la funcin discriminante de Fisher.

Criterio de la distancia de Mahalanobis.La distancia de Mahalanobis es una generalizacin de la distancia Eucldea que tiene en cuenta la matriz de covarianzas intragrupos. La distancia Eucldea es un caso particular de la distancia de Mahalanobis. La distancia Eucldea no tiene en cuenta la dispersin entre las variables y las relaciones existentes entre ellas, mientras que en la distancia de Mahalanobis s que se descuentan esos factores al introducir la inversa de la matriz de covarianza intragrupos. La distancia Eucldea ser.

Con el criterio de la distancia de Mahalanobis se calculan, para el punto i, las dos distancias siguientes:

La aplicacin de este criterio consiste en asignar cada individuo al grupo para el que la distancia de Mahalanobis es menor.Se observa que la distancia de Mahalanobis se calcula en el espacio de las variables originales, mientras que en el criterio de Fisher se sintetizan todas las variables en la funcin discriminante, que es la utilizada para realizar la clasificacin.Con los contrastes de significacin y evaluacin de la bondad de ajuste que se realizan en el anlisis discriminante con dos grupos, se trata de dar respuesta a tres tipos de cuestiones diferentes.Se cumplen las hiptesis de homoscedasticidad del modelo? Se cumple la hiptesis de normalidad?Difieren significativamente las medias poblacionales de los dos grupos? Clasificacin con ms de dos grupos.En un caso general del anlisis discriminante con G grupos (G>2) llamado anlisis discriminante mltiple, el nmero mximo de ejes discriminante que se pueden obtener viene dado por Por lo tanto pueden obtenerse hasta G-I ejes determinantes, si el nmero de variables explicativas k es mayor o igual que G-I, hecho que suele ser siempre cierto, ya que en las aplicaciones prcticas el nmero de variables explicativas suele ser grande.Cada una de las funciones discriminantes se obtiene como funcin lineal de las k variables explicativas X, es decir.

Los G-1 ejes discriminantes vienen definidos respectivamente por los vectores definidos mediante las siguientes expresiones: . Se puede concluir que los ejes discriminantes son las componentes de los vectores propios normalizados asociados a los valores propios de la matriz ordenados en sentido decreciente (a mayor valor propio menor eje discriminante).En cuanto a los contrastes de significacin, en el anlisis discriminante mltiple se plantean contrastes especficos para determinar si cada uno de los valores que se obtienen al resolver la ecuacin es estadsticamente significativo, es decir, para determinar si contribuye o no a la discriminacin entre los diferentes grupos.Este tipo de contraste se realiza a partir del estadstico V de Barlett, que es una funcin de la de Wilk y que se aproxima a una Chi-cuadrado. Su expresin es la siguiente: La hiptesis nula de este contraste es y ha de ser rechazada para que se pueda continuar con el anlisis discriminante, porque en caso contrario las variables clasificadoras utilizadas no tendran poder discriminante alguno.No se olvide que la matriz W era la matriz de suma de cuadrados y productos cruzados intragrupos en el anlisis de la varianza mltiple y T era la matriz suma de cuadrados y productos cruzados total.Tambin existe un estadstico de Barlett para contrastacin secuencial, que se elabora como sigue: Pero como el determinante de una matriz es igual al producto de sus valores propios, se tiene que: Esta expresin puede sustituirse en la expresin del estadstico V que fue vista anteriormente, para obtener la expresin alternativa siguiente para el estadstico de Barlett: Si se rechaza la hiptesis nula de igualdad de medias, al menos uno de los ejes discriminante es estadsticamente significativo, y ser el primero, porque es el que ms poder discriminante tiene.Una vez visto que el primer eje discriminante es significativo, se pasa a analizar la significancia del segundo eje discriminante, analizando la significancia de sucesivos ejes discriminantes. En este proceso secuencial se va eliminando del estadstico V las races caractersticas que van resultando significativas, deteniendo el proceso cuando se acepte la hiptesis nula de no significatividad de los ejes discriminantes que queden por contrastar.SPSS y el anlisis discriminaste.Para poder interpretar los resultados es necesario conocer que es lo que dicen los datos brindados por el programa SPSS; aunque algunos datos se les restara menos importancia ya que solo se definir lo ms importantes de la totalidad de informacin.En la opcin descriptivos se van a encontrar las opciones que permiten obtener informacin descriptiva y contraste univariantes y multivariantes sobre las variables utilizadas en el anlisis, tales como. Medias. Media, desviacin tpica, nmero de casos vlidos (ponderado y no ponderado) para cada uno de los grupos y para la muestra total. ANOVAs univariados. Tabla de ANOVA con estadsticos F que permiten contrastar la hiptesis de igualdad de medias entre los grupos en cada variable independiente. La tabla de ANOVA incluye tambin el estadstico lambda de Wilk univariante. La informacin de esta tabla suele utilizarse como prueba preliminar para detectar si los grupos difieren en las variables de clasificacin seleccionadas; sin embargo, debe tenerse en cuenta que una variable no significativa a nivel univariante podra aportar informacin discriminativa a nivel multivariante.El estadstico Lambda de Wilk que expresa la proporcin de variabilidad total no debida a la diferencia entre los grupos; sus hiptesis son:

M de Box. Prueba M de Box para el contraste de la hiptesis nula de igualdad de las matrices de varianzas-covarianzas poblacionales. Uno de los supuestos del anlisis discriminante es que todos los grupos proceden de la misma poblacin y, ms concretamente, que las matrices de varianzas-covarianzas poblacionales correspondientes a cada grupo son iguales entre s.Coeficientes de la funcin. Este apartado contiene opciones que permiten seleccionar algunos coeficientes adicionales utilizados en la clasificacin de los casos. Coeficientes no tipificados. Coeficientes brutos de la funcin cannica discriminante. Son los coeficientes utilizados por el programa para calcular las puntuaciones discriminantes y la ubicacin de los centroides de los grupos. Coeficientes de clasificacin de Fisher. Fisher (1936) present la primera aproximacin a la clasificacin multivariante para el caso de dos grupos. Los coeficientes propuestos por Fisher se utilizan nicamente para la clasificacin. Al solicitar esta opcin se obtiene una funcin de clasificacin para cada grupo. En el caso de dos grupos, la diferencia entre ambas funciones da lugar a un vector de coeficientes proporcional a los coeficientes no tipificados de la funcin discriminante cannica.Las opciones de clasificacin no afectan a la funcin discriminante; slo influyen en el resultado de la clasificacin de los casos.El proceso de clasificacin asigna o pronostica un grupo a todos los casos utilizados en la estimacin de la funcin discriminante y a todos los casos que, aun no perteneciendo a ninguno de los grupos utilizados (es decir, aun teniendo valor perdido en la variable de agrupacin), poseen informacin completa en las variables independientes. Tambin es posible, opcionalmente, clasificar los casos con informacin incompleta (es decir, con valor perdido en alguna de las variables independientes).Probabilidades previas. Las opciones de este apartado permiten controlar el valor que adoptarn las probabilidades previas o probabilidades a priori: Todos los grupos iguales. Se asigna la misma probabilidad a todos los grupos. Si el anlisis discrimina entre k grupos, la probabilidad a priori asignada a cada grupo vale 1/k. Con esta opcin el tamao de los grupos no influya en la clasificacin. Calcular segn el tamao de los grupos. La probabilidad a priori que se asigna a cada grupo es proporcional a su tamao. Siendo N el tamao de la muestra y ng el tamao de un grupo cualquiera, la probabilidad a priori asignada a ese grupo es ng/N. Con esta opcin, si un caso posee una puntuacin discriminante equidistante de los centroides de dos grupos, el caso es clasificado en el grupo de mayor tamao. Mediante sintaxis, es posible asignar a cada grupo probabilidades a priori personalizadas.

Metodologa. En este trabajo se hace uso de una base de datos llamada coches.sav, dentro de ella la variable categrica denominada origen contiene 3 opciones pero para propsitos prcticos se ha de eliminar la opcin etiquetada con el valor tres que hace referencia a los vehculos de origen Japons, para esto se siguen los siguientes pasos en el programa:Datos Seleccionar casosEn el cuadro de dilogo se marca la opcin Si se satisface la condicin y pulsar el botn Si, se establece la condicin de filtrado (origen < 3) y pulsar continuar.Ya con los datos filtrados se procede a realizar el anlisis discriminante, los pasos son:Analizar clasificar discriminante.Ya en el cuadro de dilogo del anlisis discriminante estn los botones estadsticos, Mtodo, Clasificar, Guardar; previamente marcar la opcin Usar mtodo de inclusin por pasos (aparece abajo del cuadro de variables independientes).En las opciones del botn estadstico se seleccionan, para los descriptivos: Medias, ANOVAS univariados, M de Box. Para los coeficientes de la funcin se seleccionan: de Fisher, no tipificados.Para las matrices, que pueden considerarse como opcionales ya que no provocan mayor peso sobre el anlisis en s, se seleccionan todas las opciones.En el botn mtodo nicamente corroborar la seleccin del mtodo Lambda de Wilks, igualmente dejar intacta las opciones seleccionadas en el botn clasificar. En el botn Guardar es opcional el marcar las opciones que all aparecen. Ya con los resultados brindados por el programa lo ms relevante es los contrates de hiptesis tales como el de la igualdad de medias realizado a travs del test de Lambda de Wilks as como la prueba M de Box para poder contrastar o no la hiptesis de igualdad de matriz de covarianzas poblacionales. El otro punto importante es la construccin de la funcin discriminante a travs de la tabla denominada coeficientes de las funciones cannicas discriminantes.

Descripcin de la base de datos.

La base de datos a utilizar en este trabajo para el tema del anlisis discriminante se llama coches.sav contiene 7 variables denominadas consumo, motor, CV, peso, acel, ao, origen. Dentro de ellas la variable denominada origen es del tipo cualitativa (la que servir como la variable categrica) y hace referencia al lugar geogrfico de fabricacin del vehculo; otra variable cualitativa es el denominado ao que hace referencia al ao en que se present al pblico el modelo. Consumo hace referencia a la cantidad de combustible que consumo el vehculo, motor al tipo de motor, CV a la potencia del motor del vehculo, peso al peso total del vehculo medido en kilogramos, acel a la aceleracin del vehculo. Todas ellas del tipo cuantitativas.La variable origen cuenta con tres opciones que son: EE.UU, Europa, Japn; para el estudio siguiente la base de datos ha de ser filtrada ya que el inters se centrara sobre EE.UU y Europa.Aplicacin estadstica. Si se observa la tabla 1 se puede observar que en lo relacionado al consumo del vehculo los de EE.UU en promedio consumen ms, mismo fenmeno ocurre con las variables potencia y peso total donde las cantidades son mayores que para el grupo denominado Europa pero cuando se observa la variable aceleracin los vehculos europeos tienden a ser ms rpidos en promedio algo lgico pues si son los menos pesados podramos pensar que deben ser los ms rpidos aunque se menciona que la diferencia no es mucha.

La otra columna hace referencia sobre la desviacin tpica un dato importante ya que permitir tener un poco de cuidado al momento de aceptar lo propuesto pues para el caso una desviacin grade puede dar indicios de la no representatividad de las medias.

Tabla 1: Estadsticos descriptivos.Pas de origenMediaDesv. tp.N vlido (segn lista)

No ponderadosPonderados

EE.UU.Consumo (l/100Km)12.983.864250250.000

Potencia (CV)119.5039.755250250.000

Peso total (kg)1122.08268.324250250.000

Aceleracin 0 a 100 km/h (segundos)14.862.809250250.000

Ao del modelo75.483.707250250.000

EuropaConsumo (l/100Km)9.002.1477070.000

Potencia (CV)80.5920.6677070.000

Peso total (kg)811.74164.6837070.000

Aceleracin 0 a 100 km/h (segundos)16.853.0687070.000

Ao del modelo75.533.4847070.000

TotalConsumo (l/100Km)12.113.921320320.000

Potencia (CV)110.9939.820320320.000

Peso total (kg)1054.19280.314320320.000

Aceleracin 0 a 100 km/h (segundos)15.292.979320320.000

Ao del modelo75.493.654320320.000

Tabla 2: Pruebas de igualdad de las medias de los grupos.Lambda de WilksFgl1gl2Sig.

Consumo (l/100Km).82368.3931318.000

Potencia (CV).83662.2571318.000

Peso total (kg).79084.5951318.000

Aceleracin 0 a 100 km/h (segundos).92326.3841318.000

Ao del modelo1.000.0101318.922

La tabla 2 presenta el test de lambda Wilks, al observar los valores de la columna denominada Sig. Permite rechazar la hiptesis de igualdad de las medias entre los grupos para todas las variables a excepcin de la variable Ao del modelo. Posiblemente porque est relacionada con una o ms variables independientes que han sido tomadas para el estudio.

Tabla 3: Matrices de covarianzas poblacionales.Pas de origenConsumo (l/100Km)Potencia (CV)Peso total (kg)Aceleracin 0 a 100 km/h (segundos)Ao del modelo

EE.UU.Consumo (l/100Km)14.931121.430815.857-5.312-9.097

Potencia (CV)121.4301580.4448820.498-80.917-73.321

Peso total (kg)815.8578820.49871997.71-310.871-376.705

Aceleracin 0 a 100 km/h (segundos)-5.312-80.917-310.8717.8924.463

Ao del modelo-9.097-73.321-376.7054.46313.745

EuropaConsumo (l/100Km)4.60932.493213.232-1.587-2.899

Potencia (CV)32.493427.1162142.515-34.064-9.488

Peso total (kg)213.2322142.51527120.5477.05889.631

Aceleracin 0 a 100 km/h (segundos)-1.587-34.06477.0589.4111.530

Ao del modelo-2.899-9.48889.6311.53012.137

TotalConsumo (l/100Km)15.373128.390894.909-5.850-7.761

Potencia (CV)128.3901585.6309418.727-83.815-59.608

Peso total (kg)894.9099418.72778575.72-331.945-277.240

Aceleracin 0 a 100 km/h (segundos)-5.850-83.815-331.9458.8763.831

Ao del modelo-7.761-59.608-277.2403.83113.354

Tabla 4: Prueba de Box sobre la igualdad de las matrices de covarianzas.M de Box66.983

FAprox.6.550

gl110

gl273227.701

Sig..000

Conforme a la informacin presentada en la tabla 4 se puede concluir que se ha de rechazar la hiptesis de la igualdad de las matrices de varianza y covarianza poblacional, algo que se puede corroborar con la informacin de la tabla 3.

Tabla 5: Estadstico Lambda de Wilks global para el modelo generado en cada paso.PasoNmero de variablesLambdagl1gl2gl3F exacta

Estadsticogl1gl2Sig.

11.7901131884.5951318.000.000

22.7752131846.0932317.000.000

33.7403131837.0213316.000.000

44.7294131829.2604315.000.000

La tabla 5 presenta la informacin del estadstico de Lambda pero solo para cuatro variables ya que para el caso variable ao del modelo se deca que no se poda rechazar la hiptesis de igualdad de medias, lo que provoca que aqu no sea tomada en cuenta.

Tabla 6: Matriz de estructura.Funcin

1

Peso total (kg).846

Potencia (CV)a.782

Consumo (l/100Km).761

Aceleracin 0 a 100 km/h (segundos)-.473

Ao del modelo-.009

La tabla 6 contiene los valores de los coeficientes de correlacin brutos variable y la funcin discriminante; la a que se observa a la par de la variable potencia hace referencia a que esta variable no ser utilizada en el anlisis, es decir no es necesaria para construir la funcin discriminante ya que al parecer era la variable que tena un centroide muy cerca del centroide de la variable ao del modelo lo que en su momento no permiti que se rechazara para esta ltima variable la hiptesis de igualdad de medias segn el test de lambda de Wilks.

Tabla 7: Coeficientes de las funciones cannicas discriminantes.Funcin

1

Consumo (l/100Km).197

Peso total (kg).002

Aceleracin 0 a 100 km/h (segundos)-.091

Ao del modelo.171

(Constante)-15.664

La tabla 7 muestra los valores de los coeficientes y la constante de la funcin discriminante, en este caso solo una funcin ya que solo existan dos grupos. La funcin discriminante quedara:

Conclusin

En conclusin se observ que los vehculos del pas de los Estados Unidos son ms pesados, potentes pero menos veloces en promedio con respecto a los vehculos provenientes del continente europeo, todos estos datos se mencionaron en su momento igual que los datos de las desviaciones, pero si se estudiara ms a fondo a las variables seguramente se encontraran valores atpicos que distorsionan las posibles predicciones que se puedan hacer. Por ejemplo si se observa la variable peso se ve que su desviacin es muy alta lo que se podran entender como una no representatividad de la media. Pero como el motivo del anlisis discriminante no tiene este fin por lo cual la mirada debe girar sobre la funcin discriminante hallada en la cual lo nico que falta por mencionar es que la variable consumo tiene una mayor ponderacin sobre ella Aunque hasta ahora solo se ha trabajado el caso prctico de dos grupos, lo cierto es que la tcnica puede utilizarse para efectuar clasificaciones en ms de dos grupos (como se hizo mencin en el marco terico). No obstante la interpretacin con ms de dos grupos la interpretacin de los resultados cambia ligeramente (resultados brindados por el programa estadstico SPSS).Adems con ms de dos grupos es posible obtener ms de una funcin discriminante, en concreto es posible obtener tantas como nmero de grupos menos uno (a no ser que el nmero de variables independientes sea menor que el nmero de grupos, en cuyo caso el nmero de posibles funciones discriminantes ser igual al nmero de variables menos uno).