30
Proyecto de Estadística. Análisis de gráficas y análisis de relaciones entre variables. Proyecto Nº1 del primer parcial. Integrantes: Allan Peñafiel Mera Jarol Alulima Enrique Cañar Eddy Vásquez

Análisis de gráficas y análisis de relaciones entre variables

Embed Size (px)

Citation preview

Page 1: Análisis de gráficas y análisis de relaciones entre variables

Proyecto de Estadística.Análisis de gráficas y análisis de relaciones entre variables.

Proyecto Nº1 del primer parcial.

Integrantes:Allan Peñafiel MeraJarol AlulimaEnrique CañarEddy Vásquez

Page 2: Análisis de gráficas y análisis de relaciones entre variables

Tabla de ContenidosTabla de Contenidos.....................................................................................................................2

Matriz de observaciones..............................................................................................................3

Medidas de tendencia central, medidas de dispersión y cuartiles..............................................4

Analisis de las Ojivas y diagramas de caja....................................................................................5

Diámetro de Cintura.................................................................................................................5

Estatura....................................................................................................................................6

Factor P....................................................................................................................................6

Materias Reprobadas...............................................................................................................8

Materia Aprobadas...................................................................................................................9

Peso........................................................................................................................................10

Promedio General..................................................................................................................11

Análisis de los Histogramas........................................................................................................12

Diámetro de la cintura............................................................................................................12

Estatura..................................................................................................................................13

Factor P..................................................................................................................................14

Materias Aprobadas...............................................................................................................14

Peso........................................................................................................................................16

Promedio General..................................................................................................................17

Análisis de la matriz de varianza y covarianzas y la matriz de correlación.................................19

Análisis de la matriz de correlaciones........................................................................................20

Conclusiones..............................................................................................................................21

Recomendaciones......................................................................................................................21

Resumen....................................................................................................................................22

Referencias bibliográficas...........................................................................................................23

2 Proyecto Nº1Primer Parcial

Page 3: Análisis de gráficas y análisis de relaciones entre variables

Matriz de observacionesPeso Estatura Diámetro de Cintura Promedio General Mat. Aprobadas Mat. Reprobadas Factor P Género

60 158 68 8.3 16 0 16 0

54 163 72 7.7 15 0 10 0

110 158 63 8.73 15 0 6 0

145 169 78 9.1 17 0 9 0

90 160 68 7.26 13 0 7 0

130 170 70 8.28 6 1 11 0

110 153 65 7.35 6 1 8 0

115 155 73 7.01 12 5 12 0

89 160 63 8.1 48 0 8 0

120 165 65 7.9 4 0 13 0

105 162 65 7.69 22 0 16 0

112 155 64 8.14 44 1 9 0

113 152 73 7.03 12 6 9 0

120 160 77 8.54 15 4 7 0

142 166 80 7.79 24 1 8 0

128 159 72 7.05 54 6 7 0

135 155 92 7.5 16 4 6 0

140 165 72 7.3 28 6 10 0

110 160 60 7.09 13 2 8 0

135 148 98 7.67 13 2 5 0

140 168 92 7.19 13 2 11 0

115 167 69 7.8 48 1 10 0

110 165 71 7.2 17 3 9 0

125 166 80 7.1 18 4 15 0

158 158 87 7.86 3 2 7 0

120 158 72 7.1 22 1 7 0

142 149 77 7.95 12 1 6 0

100 158 64 7.72 23 0 6 0

92 164 66 8.39 49 0 10 0

110 152 63 8.33 9 1 9 0

83 162 60 7.7 12 4 5 0

130 152 69 8.35 46 0 8 0

160 180 85 7.47 14 3 12 1

145 170 78 7 3 2 10 1

140 175 83 7.46 12 3 12 1

69 167 86.5 7.51 12 3 9 1

156 170 84 8 15 0 7 1

173 185 87 7 6 2 7 1

155 173 81 7.58 14 2 8 1

120 175 77 7.48 14 2 8 1

150 175 80 6.9 6 3 7 1

68 172 75 7.99 9 0 10 1

80 183 90 7.43 13 2 9 1

122 171 70 7.48 12 2 13 1

115 167 60 8.23 18 0 8 1

120 170 70 8.6 38 0 7 1

180 179 95 7.53 47 0 16 1

150 182 70 7.32 22 5 13 1

180 171 98 7.51 29 0 17 1

130 180 92 7.8 46 1 9 1

118 160 78 7.7 10 3 8 1

165 168 82 8.2 16 2 12 1

140 175 79 7.54 13 3 10 1

160 178 83 7.04 44 2 8 1

140 180 79 7.04 40 8 7 1

135 171 86 7.57 25 3 8 1

180 181 98 7.8 23 1 16 1

131 176 98 7.1 36 4 5 1

154 175 80 7 21 10 21 1

139 167 80 8.2 16 0 11 1

3 Proyecto Nº1Primer Parcial

Page 4: Análisis de gráficas y análisis de relaciones entre variables

Medidas de tendencia central, medidas de dispersión y cuartiles.

Diámetro de cintura Estatura

Peso Materias reprobadas

Materias aprobadas Promedio General

Factor P

4 Proyecto Nº1Primer Parcial

Page 5: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Analisis de las Ojivas y diagramas de caja.Diámetro de Cintura

Gráfico 1

Como podemos apreciar, el comportamiento de la gráfica nos indica que aproximadamente el 32% de los encuestados tiene un diámetro de cintura que va de los 70 a los 80 cm, y sólo un pequeño porcentaje tiene un diámetro inferior a los 60 cm y superior a los 90 cm.

El diagrama de cajas nos muestra, que no existen datos atípicos dentro de esta categoría, y que la mediana es aproximadamente 77 cm. Además que el primer cuartil es 69 cm y el tercer cuartil es 84 cm, datos que también se muestran en la ojiva.

Estatura5 Proyecto Nº1

Primer Parcial

Page 6: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Gráfico 2La grafica de distribución de estatura nos muestra que Q1≈160 por lo que se puede afirmar que el 25% de los encuestados tiene una estatura entre 145 y 160 cm. Además, podemos apreciar que la mayor parte de la población, mide entre 160 y 170 cm y representan aproximadamente el 37.5%, no obstante sólo el 3% mide entre 180 y 190 cm.

En la gráfica no encontramos valores aberrantes, pero sí, el valor de la mediana que es 167cm. También se encuentra el valor del primer y tercer cuartil, cuyos valores son 159 y 174.5 respectivamente.

Factor P

6 Proyecto Nº1Primer Parcial

Page 7: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Gráfico 3Esta gráfica es muy interesante ya que nos indica el estado económico de las personas encuestadas, y valiéndonos del gráfico concluimos que la mayor parte de los encuestados se encuentra entre un factor P que va desde 5 hasta 10 y es alrededor del 47%, con esta información valdría recalcar que la mayoría son de clase media.

Como podemos observar existe un dato atípico o aberrante dentro de la muestra, y es el factor P 21, además se observa el valor de la mediana que es aproximadamente 9.

7 Proyecto Nº1Primer Parcial

Page 8: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Materias Reprobadas

Gráfico 4La gráfica nos indica que aproximadamente el 18% de las personas no tiene materias reprobadas, y más o menos, el mismo porcentaje tiene más de cuatro materias reprobadas. Además se observa que el mayor porcentaje de personas está entre 1 y 5 materias reprobadas.

La mediana de materias reprobadas es 2, y existen dos valores aberrantes dentro de la muestra, cuyos valores son 8 y 10. Se observa que el primer cuartil Q1, es cero, y que el tercer cuartil Q3 es 3.

8 Proyecto Nº1Primer Parcial

Page 9: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Materia Aprobadas

Gráfico 5Para aclarar por qué la ojiva comienza en negativo hemos ubicado una línea roja que en cada observación diferente presenta su aumento proporcional. La línea roja nos indica que aproximadamente el 4% de los estudiantes de la muestra tienen por lo menos 3 materias aprobadas. Y una pequeña cantidad, ha aprobado más de dichas 27. Lo que nos dice este gráfico es que hay mayor población en el ciclo básico que en especialización.

El diagrama de cajas nos muestra algunos datos atípicos, y esto se debe a que la mayoría de los encuestados se encuentra en el ciclo básico, y son pocas las personas encuestadas que están por culminar su carrera. Por eso es que la mediana es aproximadamente 11 materias aprobadas.

9 Proyecto Nº1Primer Parcial

Page 10: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Peso

Gráfico 6

La mayor parte de la población pesa entre 100 y 150 lbs y representan alrededor del 61%, la mediana en este conjunto de observaciones es 129 lbs. También podemos apreciar que son muy pocas las personas con sobrepeso, ya que solo representan un 3%.

Dentro del diagrama se observa que existe un dato atípico cuyo valor es de 54 lbs, el primer cuartil Q1 es aproximadamente 111 lbs, mientras que el tercer cuartil Q3 es 145.

10 Proyecto Nº1Primer Parcial

Page 11: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Promedio General

Gráfico 7

Claramente nos fijamos que la mayor parte del conjunto de observaciones se encuentra con un promedio muy bueno, que va de 7.5 a 8.0 y representan el 36%, no obstante, vale recalcar que son muy pocos los que tienen un promedio inferior a 7.0, ya que son sólo el 10%. También hay que tomar en cuenta que son pocos los que se destacan con un promedio mayor a 8.5, ya que sólo son un 3%.

Como se puede observar no existen datos atípicos dentro de este conjunto de observaciones, además se aprecia que la mediana tiene un valor aproximado de 7.6.

11 Proyecto Nº1Primer Parcial

Page 12: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Análisis de los HistogramasDiámetro de la cintura

Gráfico 8

La mayor parte de este conjunto de observaciones tiene un diámetro de cintura que va de 67.5 a 72.5 cm. Le sigue con un porcentaje muy pequeño los que van de 77.5 a 82.5, estos dos grupos son los más representativos ya que juntos representan casi el 50% del conjunto. Además podemos darnos cuenta que el menor porcentaje está entre los que tienen un diámetro que va de 92.5 a 97.5 cm.

Gráfico 9

12 Proyecto Nº1Primer Parcial

Page 13: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

En el grafico izquierdo, vemos claramente que la mayoría de los encuestados con un diámetro de cintura inferior a los 76 cm, son mujeres, ya que ellas como sabemos, ellas son delicadas en cuanto a este tema. En cambio, en la grafica derecha se aprecia que casi todos tienen un diámetro de cintura superior a los 76 cm, cosa que es entendible ya que los hombres no se preocupan tanto de este tema como las mujeres.

Estatura

Gráfico 10

Son muy pocas las personas que tienen una estatura inferior a los 157.5 cm y superior a los 82.5 cm. Mientras que, la mayor parte de ellos se encuentra entre esos intervalos, destacándose con mayor porcentaje los que miden entre 157.5 y 162.5 cm.

Gráfico 11

13 Proyecto Nº1Primer Parcial

Page 14: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Estas dos gráficas nos muestran la estatura del conjunto de observaciones, separadas por género. En la gráfica del lado izquierdo, que representa a las mujeres, podemos apreciar que la mayoría tiene una estatura inferior a los 168 cm, y son muy pocas las que superan esta estatura, en cambio, en la grafica derecha, que representa a los hombres, la mayor parte supera los 168 cm, y el menor porcentaje de ellos mide menos que dicha estatura. Ahora, si nos fijamos en nuestra vida diaria vamos a darnos cuenta que estos datos son correctos, ya que por lo general, las mujeres son pequeñas en comparación con los hombres.

Factor P

Gráfico 12

Este histograma nos muestra que, la mayor parte de los encuestados tiene un factor P que va de 3.75 a los 13.75, y entre ellos se destacan los que tienen entre 6.25 y 8.75; mientras que son muy pocos los que superan un factor P de 13.75. Lo que esto nos hace concluir es que la mayoría de los encuestados pertenece a la clase media de nuestro país. Y que una pequeña cantidad de ellos, se pueden clasificar como clase alta.

Materias Aprobadas

14 Proyecto Nº1Primer Parcial

Page 15: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Gráfico 13

Podemos observar que la mayoría de las personas se encuentran entre 3 y 27 materias aprobadas, y una pequeña cantidad, ha aprobado más de dichas 27. Lo que nos dice este gráfico es que hay mayor población en el ciclo básico que en especialización.

Gráfico 14

Este histograma nos muestras las materias aprobadas por genero, y si nos damos cuenta, en el gráfico de la izquierda perteneciente al de las mujeres se observa que, las mujeres tienen un rendimiento muy bueno en el ciclo básico, y en los niveles de especialización se destacan muy pocas. De los hombres podemos decir que al principio se destacan aunque a partir de las 13 materias aprobadas son pocos los que se mantienen a un ritmo constante.

15 Proyecto Nº1Primer Parcial

Page 16: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Peso

Gráfico 15

La mayoría de los encuestados se encuentra en el intervalo de 115 a 165 lbs. y dentro de este intervalo hay mas porcentaje entre los que pesan de 135 a 145 lbs. Además son pocas las personas que sobrepasan las 165 y que pesan menos de 115 lbs. Estos datos no indican que la población no tiene sobrepeso ya que no pasan el límite de obesidad.

Gráfico 16

Estas graficas nos muestran los pesos de las personas según su género. Empezando por el gráfico izquierdo perteneciente a las mujeres concluimos que: la mayoría de ellas se encuentra en un intervalo de 110 a 130 lbs. ; una

16 Proyecto Nº1Primer Parcial

Page 17: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

pequeña cantidad sobrepasa las 150 lbs. ; y otra pequeña cantidad tiene un peso inferior a las 90 lbs. Por otra parte, un gran porcentaje de los hombres pesa entra 130 y 170 lbs. ; y en este caso son pocos los que pesan menos de 130 y que pasan las 170 lbs. Haciendo un breve análisis nos damos cuenta que estos datos son verdaderos, ya que muchas mujeres le tomen mucho cuidado a su peso y por lo general son delgadas, en cambio los hombres pierden cuidado con este tema, y es común ver hombres gruesos y pasados de peso.

Promedio General

Gráfico 17

Este gráfico nos muestra que la gran mayoría tiene un promedio de 6.875 a 7.875, además que son pocos los que se destacan en los estudios sacando un promedio superior a dicho 7.875. Lo que más sorprende es que el porcentaje de las personas que supera el promedio de 8.625 es muy bajo, lo que nos indica que son pocos los que verdaderamente le dedican tiempo al estudio.

17 Proyecto Nº1Primer Parcial

Page 18: Análisis de gráficas y análisis de relaciones entre variables

Análisis de gráficas

Gráfico 18

Este histograma nos permite observar el promedio general entre hombres y mujeres. Si nos damos cuenta hay un pequeño porcentaje de mujeres que se destacan con promedios altos mayores a 8.625, mientras que los hombres solo presentan un porcentaje mínimo mayor a 8.375.

18 Proyecto Nº1Primer Parcial

Page 19: Análisis de gráficas y análisis de relaciones entre variables

Análisis de Matrices

Análisis de la matriz de varianza y covarianzas y la matriz de correlación

VARIABLES PESO ESTATURA

DIÁMETRO

CINTURA

PROMEDIO

GENERAL

MATERIAS APROBAD

AS

MATERIAS REPROBAD

AS

FACTOR P

PESO 839,30

ESTATURA 108,48 86,42

DIÁMETRO CINTURA

171,35 44,14 111,67

PROMEDIO GENERAL -2,72 -1,18 -1,44 0,26

MAT. APROBADAS 24,88 11,89 0,37 0,60 185,93MAT. REPROBADAS 11,86 2,95 3,56 -0,64 -0,23 4,67

FACTOR P 18,72 9,39 4,35 -0,14 0,43 0,65 11,13

El análisis de las relaciones entre variables no lo vamos a realizar en matriz de

varianza y covarianza, debido a la poca claridad de sus datos por el uso de

diferentes unidades de medición en cada variable.

Para demostrar esto le pedimos al lector que se fije en la relación que existe

entre el peso y el diámetro de la cintura con la estatura. Donde el peso y la

estatura tienen una covarianza de 108,48 y el diámetro de la cintura con la

estatura tienen una covarianza de 44,14; lo que nos indica que el peso está

más relacionado con la estatura que el diámetro de la cintura. Esto lo

desmentiremos a continuación cuando analicemos la matriz de correlaciones.

19 Proyecto Nº1Primer Parcial

Tabla 1

Page 20: Análisis de gráficas y análisis de relaciones entre variables

Análisis de Matrices

Análisis de la matriz de correlaciones

VARIABLES PESO ESTATURA DIÁMETRO CINTURA

PROMEDIO

GENERAL

MATERIAS APROBADA

S

MATERIAS REPROBADA

S

ESTATURA 0,403

DIÁMETRO CINTURA 0,56 0,449PROMEDIO GENERAL

-0,184 -0,249 -0,267

MAT. APROBADAS 0,063 0,094 0,003 0,086

MAT. REPROBADAS 0,189 0,147 0,156 -0,579 -0,008

FACTOR P 0,194 0,303 0,123 -0,082 0,01 0,091

Para comenzar con este análisis fijémonos en quien guarda más relación con la

estatura, el peso o el diámetro de la cintura. Si miramos la tabla 2 nos queda

claro que más relacionado con la estatura está el diámetro de la cintura que el

peso y así evidenciamos lo poco claro que los datos de la matriz de varianza y

covarianza al momento de realizar un análisis, cuando las variables se

contabilizan en distintas unidades.

Un hecho que no cambia si lo analizas bien sea con la matriz de varianza y

covarianza o con la matriz de correlación es que: si comienzas a comer en

exceso vas a tener que comprar pantalones nuevos.

Según la Matriz de correlación, las relaciones que hay entre las materias aprobadas y reprobadas con el promedio general tienen la peculiaridad de que una relación es directa y la otra indirecta, respectivamente. Algo que es muy lógico, porque si el número de materias aprobadas aumente es comprensible que el promedio general aumente (aunque el aumento no sea cuantioso) y si el número de materias reprobadas aumenta el promedio general disminuye (y la disminución es considerable).

Por otro lado las relaciones que guardan las materias aprobadas y reprobadas

con el factor P, ambas son directas; sin embargo más relacionadas con el

factor P están las materias reprobadas. Lo que nos indica que un estudiante

con un factor P más alto tiende a reprobar más materias que un estudiante que

tiene un factor P más bajo. Curiosamente parece que quienes aprovechan más

la educación son los estudiantes de niveles socioeconómicos más bajos; algo

que es muy perceptible, debido a que un estudiante con un nivel socio

económico bajo anhela mejorar sus condiciones de vida, lo que le implica

esforzarse más académicamente para así poder explotar mejor su profesión.

20 Proyecto Nº1Primer Parcial

Tabla 2

Page 21: Análisis de gráficas y análisis de relaciones entre variables

Conclusiones y recomendaciones

Conclusiones

Después de haber seguido detenidamente este trabajo se pueden palpar

algunas de las tantas aplicaciones de la estadística y visualizar que es

aplicable para cualquier ámbito de la vida. Con esto quiero decir que no solo

tiene aplicaciones empresariales o científicas, sino también cotidianas y

comunes, como hacer relaciones entre los distintos aspectos de los

estudiantes.

El uso de las graficas estadísticas por su sencillez aporta una gran agilidad al

momento de tomar decisiones y llegar a conclusiones bastantes precisas sin

necesitad de recurrir a instrumentos de cálculo como calculadoras o

computadoras.

Recomendaciones

La gran utilidad que nos proporciona la estadística la convierte a sí misma en

una herramienta fundamental en el ámbito laboral. Por lo que es siempre muy

conveniente tomar una actitud vanguardista ante la creciente innovación

tecnología. Conocer el manejo detallado de lo último en software estadístico

siempre va a proporcionar una gran ventaja al momento de realizar análisis.

También es muy importante recordar que al momento de recopilar los datos se

debe tratar, en lo posible, de que las observaciones sean veraces para que al

final los datos muestren valores representativos y no datos atípicos.

21 Proyecto Nº1Primer Parcial

Page 22: Análisis de gráficas y análisis de relaciones entre variables

Resumen

Resumen

Este proyecto es realizado como parte del curso de estadística general para

ingeniería. Desarrollado por un grupo de cuatro estudiantes, con el fin de poner

en práctica lo aprendido en el salón de clases, y darnos cuenta de la

importancia de la estadística en la vida cotidiana, y así poder establecer

relaciones entre variables que no tengan nada en común, como por ejemplo,

entre el peso y el diámetro de cintura.

Recopilamos datos de 60 estudiantes dentro de la universidad, los datos que

se solicitaron a los estudiantes fueron: peso, estatura, diámetro de cintura,

materias aprobadas, materias reprobadas, promedio general, factor p y genero.

Los cuáles fueron ubicados en una tabla de datos para su respectivo análisis,

el cuál consistía en elaborar: histogramas de frecuencias relativas, ojivas,

diagramas de cajas, matrices de varianza y covarianza; con esos datos

pudimos establecer conclusiones sobre cada variable, como por ejemplo,

analizar la mayor cantidad de personas que se encuentran con un promedio

general menor a 7, así como también logramos encontrar datos atípicos en

algunas muestras.

Para poder realizar algunas conclusiones, tuvimos que recurrir a libros

referentes a la materia, para que cualquier persona que desconozca del tema

logre entender lo que tratamos de transmitir. Las gráficas fueron desarrolladas

en Minitab, un programa que nos permite realizar: cálculos, gráficos y

esquemas relacionados con Estadística Descriptiva.

Finalmente, establecimos conclusiones y recomendaciones, sobre lo que

realizamos, valiéndonos de la teoría, y de lo que pensamos que sería útil para

las personas que en un futuro, realicen un proyecto similar.

22 Proyecto Nº1Primer Parcial

Page 23: Análisis de gráficas y análisis de relaciones entre variables

Referencias bibliográficas

Referencias bibliográficas.

PROBABILIDAD Y ESTADÍSTICA: Fundamentos y Aplicaciones.  Autor: Gaudencio Zurita Herrera. ISBN: 9789978310557

INTRODUCCION A LA PROBABILIDAD Y ESTADISTICAde BEAVER, ROBERT J. y BEAVER, BARBARA M. y MENDENHALL, WILLIAM. ISBN: 9789706861955. Nº Edición: 1ª ED. Año de edición: 2003. Plaza edición: MEXICO.

23 Proyecto Nº1Primer Parcial