Upload
luz-miryam
View
676
Download
0
Embed Size (px)
Citation preview
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 1/24
TRABAJO COLABORATIVO N° 2ESTADISTICA
PRESENTADO POR:MARIA EMISLE CORREDOR
COD. 52295983
PRESENTADO A:MILTON FERNANDO ORTEGON
TUTOR
GRUPO 100105_131
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 2/24
INTRODUCCION
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran lavariabilidad de una distribución, indicando por medio de un número, si las diferentespuntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea esevalor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media.
Así se sabe si todos los casos son parecidos o varían mucho entre ellos. Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media delas desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma delas desviaciones es siempre cero, así que se adoptan dos clases de estrategias parasalvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).
Para desarrollar esta actividad se realizo una lectura sobre los conceptos de lasmedidas de dispersión y se tomo los conceptos que a mi criterio tiene mayor relevanciaasí como las ilustraciones de las formulas para dichos procedimientos. Teniendo estoclaro realice un mentefacto conceptual.
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 3/24
OBJETIVOS
Desarrollar un taller de ejercicios sobre los contenidos de la Unidad 2 del curso
de Estadística Descriptiva, los cuales le permitirán profundizar en los temas
tratados.
Aplicar los conceptos aprendidos a algunos de los datos obtenidos en el
CENSO 2005 realizado por le DEPARTAMENTO ADMINISTRATIVO.
Desarrollar destrezas para calcular algunas medidas de dispersión
Comparar las medidas de dispersión y seleccionar la más útil para determinada
aplicación.
Interpretar y utilizar las medidas de dispersión
Reconocer que las medidas de dispersión complementan la descripción que
proporcionan las medidas de tendencia central.
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 4/24
RANGO O RECORRIDO
Se trata de la diferencia entre el límite superior y el límite inferior de un conjunto de datos
VARIANZA
Se define como la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética. Se
simboliza s2 para la varianza muestra y σ2 para la varianza poblacional.
Para datos no agrupados. Para datos agrupados
DESVIACION TIPICA
Esta medida se obtiene extrayendo la raíz cuadrada de la varianza, tomando siempre
valor positivo. Se simboliza por s en la muestra y σ en la población.
Para datos no agrupados Para datos agrupados
N
fxS ∑
=
2
COEFICIENTE DE VARIACION
El coeficiente de variación permite comparar la dispersión entre dos poblaciones distintas e incluso,
comparar la variación producto de dos variables diferentes (que pueden provenir de una misma población).
CV = S x 100%
X
DESVIACION MEDIA
Se define como la media aritmética de las desviaciones respecto a la media, tomadas en
valor absoluto.
Para datos agrupados para datos agrupados
DM = ∑ (X –x) DM = ∑ f. (X – x)
n n
PUNTAJE TIPICO
El puntaje estandarizado mide la desviación de una observación con respecto a la media aritmética, en
unidades de desviación estándar, determinándose así la posición relativa de una observación dentro
del conjunto de datos. Por lo general se simboliza por Z , pero cuando el tamaño de la muestra es
menor de 30, se simboliza por t .
Z = X- x
S
MEDIDAS DE ASIMETRIA APUNTAMIENTO
Coeficiente de Pearson. Asimetría en función deLa media y la moda. Varía entre ±3 yEs 0 en la distribución normal.
As = x- Mo As = 3. (x – Me)
S S
La curtosis es la medida de la
de la curva y está dada por:
Ap = ∑ Z i4 . f.i
n. s4
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 5/24
2. Con el fin de decidir cuantas cajas para atención a los clientes se necesitaran en las
tiendas que construirán en el futuro, una cadena de supermercados quiso obtener
información acerca del tiempo (minutos) requerido para atender los clientes. Serecogieron los siguientes datos correspondientes al tiempo de atención a:
3.6 1.9 2.1 0.3 0.8 0.3 2.5 1.0 1.4 1.8 1.6 1.1 1.83.2 3.0 0.4 2.3 1.8 4.5 0.9 0.7 3.1 0.9 0.7 3.1 1.82.8 0.3 1.1 0.5 1.2 0.6 1.8 3.0 0.8 1.7 1.4 0.3 1.33.6 1.9 2.1 0.3 0.8 0.3 2.5 1.0 1.4 1.8 1.6 1.1 1.82.8 0.3 1.1 0.5 1.2 0.6 1.8 3.0 0.8 1.7 1.4 0.3 1.3
Realizar una tabla de distribución de frecuencias, Calcular varianza, desviación
estándar y coeficiente de variación. Interprete los resultados
RTA/ Tabla distribución de frecuencias
Minutos f Minutos F0.3 9 1.7 2
0.4 1 1.8 8
0.5 2 1.9 2
0.6 2 2.1 2
0.7 2 2.3 1
0.8 4 2.5 2
0.9 2 2.8 21.0 2 3.0 2
1.1 4 3.1 2
1.2 2 3.2 1
1.3 2 3.6 2
1.4 4 4.5 1
1.6 2 TOTAL 65
Varianza
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 6/24
Desviación estándar
Coeficiente de variación
3. En un estudio se registra la cantidad de Horas de T.V. a la semana que ve un grupo
de niños escogidos de un colegio de la localidad de Puente Aranda en Bogotá
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 7/24
Horas deTV
No. deniños
Marca declase x
f .X
3 – 5 16 4 64
5 – 7 13 6 787 – 9 9 8 72
9 – 11 6 10 60
11 – 13 4 12 48
Total 48 40 322
Cantidad de Horas de T.V. a la semana de niños de Puente Aranda
Clases marca declase (xi) frecuenciaabsoluta(ni)
frecuenciaabsolutaacumulada
(Ni)
Frecuenciarelativa (fi) Frecuenciarelativaacumulada
(Fi)
xi * ni ni * Xi2
3 - 5 4 16 16 33,33% 33,33% 64,00 256,00
5 - 7 6 13 29 27,08% 60,42% 78,00 468,00
7 - 9 8 9 38 18,75% 79,17% 72,00 576,00
9 - 11 10 6 44 12,50% 91,67% 60,00 600,00
11 - 13 12 4 48 8,33% 100,00% 48,00 576,00
Total 48 100,00% 322,00 2476,00
a. ¿Cuál es el promedio de horas de tv que ven los niños?
Hallamos la media aritmética:
71.648
322*===
∑ N
ni xi x
Luego el promedio de horas de TV que ven los niños son 6,71 horas
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 8/24
b. Calcule el coeficiente variación intérprete los resultados?
Hallamos la desviación estándar:
( ) ( )( ) 2
2 __ 2
71.648
2476−=−=
∑ x
N
xini s
56.2= s
%100* x
sCV =
%100*71.6
56.2=CV
%15.38=CV
Interpretación: La variación con respecto a la media aritmética es del 38.15%
4. La compañía de electrodomésticos MABE acaba de terminar un estudio sobre la
configuración posible de tres líneas de ensamble para producir el Horno microondas
que más ventas tiene en el mercado. Los resultados acerca del tiempo en minutos que
se demora cada configuración en producir un horno son los siguientes:
Configuración I Tiempo promedio 24.8 min desviación estándar 4.8 min
Configuración II Tiempo promedio 25.5 min varianza 56.25 (des. estándar 7.5min)
Configuración III Tiempo promedio 37.5 min desviación estándar 3.8
¿Qué configuración de línea de ensamble le presenta mejores resultados a la empresa
y Porque?
La configuración I posee el menor tiempo promedio (24.8 min) con una desviación
estándar baja de 4.8 min. Lo cual es ideal para una mayor producción de la compañía
de electrodomésticos MABE.
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 9/24
La configuración I presenta mejores resultados para una mayor producción, ya que el
promedio en tiempo es menor y presenta poca variación con respecto a la media
presentando mayor estabilidad en su producción.
5. Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:
Estatura (X)-- 186- 189- 190- 192- 193- 193- 198- 201- 203- 205-
Pesos (Y) ---85-85- 86- 90- 87- 91- 93- 103- 100- 101-
Para determinar la ecuación de la recta que más se ajusta, trabajamos con el método
de los mínimos cuadrados
ESTATURAX
PESO Y
XY X2
186 85 15810 34596
189 85 16065 35721
190 86 16340 36100192 90 17280 36864
193 87 16791 37249
193 91 17563 37249
198 93 18414 39204
201 103 20703 40401
203 100 20300 41209
205 101 20705 42025
1950 921 179971 380618
La recta de regresión de Y sobre X.
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 10/24
Y^= a + bxDonde:
b: n∑xy - ∑x∑y :
n∑x2- (∑x)2
b = 10 x 179971 – (1950)(921) :
10 * 380618 – (1950)2
b= 1799710 - 1795950
3806180 – 3802500
b = 3760
3680
b= 1.02
a =∑y - b∑x
n
a= 921 – 1.02 (1950)
10
a = 1068
10
a= - 106.8
De modo que la ecuación de la recta ajustada esta dada por: Y^ = 1.02 x – 106.8
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 11/24
Coeficiente de Correlación
Indica el grado de asociación entre las variables, es necesario hallar el error estándar del estimado.
Se =∑ ∑∑ −−= xyb ya y 2
n – 2
)179971)(02.1()921)(8.106(85255−−−=
10 – 2
Se: 42.1835708.9836285255 −+=
8
Se38.47=
8
Se= 2.43
Determinamos s2y, esta es la varianza de la variable dependiente y.
S2y = ∑y2 - ý2
nS2y = 85255 - (92.1)2
10
S2y: 8525.5 – 8482.4
S2y: 43.1
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 12/24
Sacamos el coeficiente de determinación
R2 : 1 – Se2
Sy2
R2 = 1 – (2.43)2
43.1
R2: 1 - 5.90
43.1
R2= - 4.9
43.1
R2= - 0.1136
2 Rr =
1136.0=r
r = 0.33
Según la tabla se da una correlación mínima.
El peso estimado de un jugador que mide 208 cm., lo hayamos reemplazando en la
ecuación estimada la variable independiente por el valor que se pretende y así obtener
el valor de la variable dependiente.
Si Y^ = 1.02 * 208 – 106.8
Y^= 212.16 – 106.8
Y^= 105.36 peso
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 13/24
6. A continuación se presentan las ventas nacionales de móviles nuevos de 1992 a2004 en la siguiente tabla. Obtenga un índice simple para las ventas nacionales
utilizando una base variable:
Año Ventas (millones
de $)
Índice
simple baseVariable
1992 8,8
1993 9,7 110,2
1994 7,3 75,3
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 14/24
1995 6,7 91,8
1996 8,5 126,9
1997 9,2 108,2
1998 9,2 100,0
1999 8,4 91,3
2000 6,4 76,2
2001 6,2 96,9
2002 5,0 80,6
2003 6,7 134,0
2004 7,6 113,4
POBLACIÓN
Población total censada, por sexo, según grupos de edad Total nacional Censo 2005
n Grupos de edad Total Población total
1 85 y más 210.325 4.382.633.853.892
2 80 a 84 278.875 4.100.317.655.759
3 75 a 79 504.438 3.237.700.408.179
4 70 a 74 702.518 2.564.101.196.801
5 65 a 69 921.054 1.911.984.042.302
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 15/24
6 60 a 64 1.104.733 1.437.759.538.815
7 55 a 59 1.450.658 727.849.755.468
8 50 a 54 1.835.340 219.453.938.783
9 45 a 49 2.291.308 156.027.857 2.291.308 Media
10 40 a 44 2.732.504 183.787.881.757
11 30 a 34 2.917.290 376.371.070.750
12 35 a 39 2.919.161 378.670.254.297
13 25 a 29 3.280.767 954.466.255.920
14 20 a 24 3.641.839 1.790.350.744.258
15 15 a 19 3.933.754 2.656.752.939.813
16 0 a 4 4.108.861 3.258.248.422.719
17 5 a 9 4.295.913 3.968.517.746.304
18 10 a 14 4.339.046 4.142.229.898.732
Suma de datos 41.468.384 36.291.351.632.406
N de Datos (n) 18
La media secalculo
Suma de datos /No de datos
Media Aritmética 2303799
= 9.7 x 100% = 110.22%
8.8
Las ventas nacionales de móviles nuevos en 1993 aumentaron en un 10% (110 – 100 )
respecto a las ventas del mismo en 1992.
= 7.3 x 100% = 75.25%
9.7
= 6.7 x 100 % = 91.78%
7.3%
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 16/24
= 8.5 x 100 = 126.86%
6.7
= 9.2 x 100 = 108.23%
8.5
= 9.2 x 100 = 100%
9.2
= 8.4 x 100 = 91.3%
9.2
= 6.4 x 100 = 76.2%
8.4
= 6.2 x 100 = 96.9%
6.4
= 5.0 x 100 = 80.6%
6.2
= 6.7 x 100 = 134%
5
= 7.6 x 100 = 113.43%
6.7
Año Hombres(X)
Mujeres(Y)
X2 Y2 /X-x/ /Y-y/
1973 88 89,6 7.744 8.028 5,10 4,95
1985 93,4 94,8 8.724 8.987 0,30 0,25
1993 94,7 96,3 8.968 9.274 1,60 1,75
2005 96,2 97,5 9.254 9.506 3,10 2,95
7956 372,3 378,2 34.690 35.795 10,10 9,90
a. Medidas de dispersión:
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 17/24
• Varianza para datos no agrupados
( ) 2 __ 2
2 x N
xi s −=
∑
Para los hombres:
1,934
3,372===
∑ N
xi x
6,667.82= x Media aritmética
Reemplazamos los datos obtenidos en la formula:
6,86674
690.342−= s
9.42 = s
Para las mujeres:
55,944
2,378===
∑ N
yi y
7,939.82= y Media aritmética
Reemplazamos los datos obtenidos en la formula:
7,939.84
795.352−= s
1,92= s
Conclusión: Observamos que la las mujeres tiene una variación mayor respecto a loshombres en cuanto al porcentaje de alfabetismo de los 15 a los 24 años. Esto quieredecir que el alfabetismo de las mujeres varía mucho, mientras que los hombres son másconstantes.
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 18/24
• Desviación estándar: es la raíz cuadrada de la varianzaPara los hombres:
2,29,4 == s
Para las mujeres:
01,31,9 == s
Conclusión: Observamos que la desviación estándar de las mujeres es mayor que lade los hombres, entonces el alfabetismo de las mujeres tiene mayor variabilidad que lade los hombres.
Coeficiente de variación:
Para los hombres:
%36,2%1001,93
2,2%100* === x
x
sCV
Para las mujeres:
%18,3%10055,94
01,3%100* === x
x
sCV
Conclusión: Observamos que el coeficiente de variación de las mujeres es mayor que la de loshombres, por tanto la media aritmética de las mujeres no es tan representativa
Coeficiente de variación media
Para los hombres:
Hallamos la desviación media:
N
x X
DM
∑ −
=
__
5,24
10,10== DM
Hallamos el coeficiente de variación media: %100* __
x
DM CVM =
%7,2%100*1,93
5,2==CVM
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 19/24
Para las mujeres:
Hallamos la desviación media:
N
yY
DM
∑ −
=
__
54,24
90,9== DM
Hallamos el coeficiente de variación media: %100* __
y
DM CVM =
%7,2%100*55,94
54,2==CVM
Conclusión: Observamos que el coeficiente de variación media es el mismo parahombres y mujeres,
Medidas de regresión y correlación:Para los hombres:
Año (X) porcentaje(Y)
X*Y X2 Y2
1973 88 173.624 3.892.729 7.744
1985 93,4 185.399 3.940.225 8.724
1993 94,7 188.737 3.972.049 8.968
2005 96,2 192.881 4.020.025 9.254
7956 372,3 740.641 15.825.028 34.690
Hallamos a y b:
( )∑ ∑
∑ ∑ ∑−
−=
22 X X n
Y X XY nb
n
X bY a
∑ ∑−=
( )( ) ( ) ( )
( ) ( ) 222 956.7028.825.154
3.372956.7641.7404
−
−=
−
−=
∑ ∑
∑ ∑ ∑ X X n
Y X XY nb
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 20/24
936.297.63112.300.63
8,018.962.2564.962.2
−
−=b
25,0=b
( ) ( )
4
7,1616
4
956.725,03,372 −=
−=
−=
∑ ∑n
X bY a
2,404−=a
Por tanto la ecuación de la recta es: X Y 25,02,404 +−=
Hallamos ahora el coeficiente de correlación:
El coeficiente de correlación esta dado por: 2 Rr =
r= coeficiente de correlaciónR2= coeficiente de determinación
2
2
2
1 y
e
S
S
R −=
Se2 = varianza del error estimado
Sy2 = varianza de la variable dependiente Y
Dado por
( ) ( ) ( ) ( )
24
641.71025,03,3722,404690.34
2
2
−
−−−
=−
−−
=
∑ ∑ ∑n
XY bY aY
S e
44,11,22
17,4===eS
( ) 1,244,122
==eS
( ) 89,41,934
690.34 22 __
2
2=−=−=
∑Y
N
Y s y
6,089,4
1,211
2
22
=−=−= y
e
S
S R
77,06,02
=== Rr
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 21/24
Este es el coeficiente de correlación, y es una correlación regular
Para las mujeres:
Año (X) porcentaje(Y)
X*Y X2 Y2
1973 89,6 176.781 3.892.729 8.028
1985 94,8 188.178 3.940.225 8.987
1993 96,3 191.926 3.972.049 9.274
2005 97,5 195.488 4.020.025 9.506
7956 378,2 752.372 15.825.028 35.795
Hallamos a y b:
( )∑ ∑
∑ ∑ ∑
−
−=
22 X X n
Y X XY nb
n
X bY a
∑ ∑−=
( )( ) ( ) ( )
( ) ( ) 222 956.7028.825.154
2,378956.7372.7524
−
−=
−
−=
∑ ∑
∑ ∑ ∑ X X n
Y X XY nb
936.297.63112.300.63
2,959.008.3488.009.3
−
−=b
24,0=b
( ) ( )
4
24,1531
4
956.724,02,378 −=
−=
−=
∑ ∑n
X bY a
81,382−=a
Por tanto la ecuación de la recta es: X Y 24,08,382 +−=
Hallamos ahora el coeficiente de correlación:
El coeficiente de correlación esta dado por: 2 Rr =
r= coeficiente de correlaciónR2= coeficiente de determinación
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 22/24
2
2
21
y
e
S
S R −=
Se2 = varianza del error estimado
Sy2 = varianza de la variable dependiente Y
Dado por
( ) ( ) ( ) ( )
24
372.75224,02,3788,382795.35
2
2
−
−−−=
−
−−=
∑ ∑ ∑n
XY bY aY S e
51,13,22
55,4===eS
( ) 28,251,122
==eS
( ) 05,955,944
795.35 22 __
2
2=−=−=
∑Y
N
Y s y
75,005,9
28,211 2
2
2 =−=−= y
e
S
S R
87,075,02
=== Rr
Este es el coeficiente de correlación, y es una correlación aceptable.
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 23/24
CONCLUSION
Las medidas de dispersión miden cuan alejados están un conjunto de valores respectoa su media aritmética. Así, cuanto menos disperso sea el conjunto, más cerca del valor
medio se encontrarán sus valores. Este aspecto es de vital importancia para el estudio
de múltiples sistemas.
5/17/2018 Aporte Tc2 Emily - slidepdf.com
http://slidepdf.com/reader/full/aporte-tc2-emily 24/24
BIBLIOGRAFÍA
Tomada del modulo:
Ortegón Pava Milton Fernando, Modulo de Estadística Descriptiva, Editorial Unad,
Ibagué. Julio 2010, págs. 178