Click here to load reader
Upload
celsoalexanderdiazmarquez
View
52
Download
4
Embed Size (px)
DESCRIPTION
Tecsup
Citation preview
MATEMÁTICAS II
MONOGRAFÍA
“ANÁLISIS DE CASO DE APLICACIÓN RELACIONADO A TÉCNICAS ESTADÍSTICAS”
Integrantes:
ORELLANA ORDOÑEZ, Orlando ROJAS HINOSTROZA , Carlos Enrique
Sección: G2-2-E,F
Profesor:
VIZARRETA GARCÍA, Pedro Luis
2010 - I
CASO ANALÍTICO DE LA EMPRESA REPSOL YPF
La empresa Repsol YPF ha notado un incremento paulatino del consumo de gas en dos sucursales en provincia, las cuales se dedican a distribuir GLP (Glns) a gasocentros, clientes domésticos e industriales. Además, la empresa ha sido informada de que en horas punta no se puede abastecer la demanda existente, por lo cual, la empresa decide programar la ampliación y automatización sólo de una de ellas debido al fondo de inversión que posee. La empresa toma la decisión de elegir a aquella que fue la más homogénea durante los meses de Marzo y Abril de este año, para lo cual, a partir de los datos de consumo que posee, solicita la aplicación de técnicas estadísticas e identificar a la sucursal más homogénea para poder empezar el proyecto de ampliación y automatización de dicha sucursal.
A continuación se muestran los datos informativos de los consumos respectivos:
Contabilización de fechas CONSUMO DE GASSUCURSAL 1
CONSUMO DE GASSUCURSAL 2
(Glns) (Glns)lunes, 01 de marzo de 2010 7,539 11,099
martes, 02 de marzo de 2010 26,043 33,257miércoles, 03 de marzo de
2010 32,616 32,708
jueves, 04 de marzo de 2010 26,399 23,672viernes, 05 de marzo de 2010 32,201 35,411sábado, 06 de marzo de 2010 28,399 20,487
domingo, 07 de marzo de 2010 22,052 22,668lunes, 08 de marzo de 2010 19,441 34,970
martes, 09 de marzo de 2010 27,861 46,701miércoles, 10 de marzo de
2010 27,307 23,103
jueves, 11 de marzo de 2010 35,257 21,627viernes, 12 de marzo de 2010 28,697 11,331sábado, 13 de marzo de 2010 15,174 11,582
domingo, 14 de marzo de 2010 32,458 32,189lunes, 15 de marzo de 2010 12,410 20,289
martes, 16 de marzo de 2010 26,445 20,331miércoles, 17 de marzo de
2010 20,866 22,115
jueves, 18 de marzo de 2010 29,318 31,695viernes, 19 de marzo de 2010 31,426 36,420sábado, 20 de marzo de 2010 36,881 45,860
domingo, 21 de marzo de 2010 27,590 18,864lunes, 22 de marzo de 2010 22,268 33,987
martes, 23 de marzo de 2010 28,457 37,819miércoles, 24 de marzo de
2010 36,981 35,258
jueves, 25 de marzo de 2010 28,825 23,067viernes, 26 de marzo de 2010 35,910 24,267sábado, 27 de marzo de 2010 25,944 20,592
domingo, 28 de marzo de 2010 27,988 34,697lunes, 29 de marzo de 2010 15,563 20,274
martes, 30 de marzo de 2010 25,473 23,052miércoles, 31 de marzo de
2010 35,675 32,290
jueves, 01 de abril de 2010 10,776 11,513viernes, 02 de abril de 2010 28,427 32,415sábado, 03 de abril de 2010 25,217 32,980
domingo, 04 de abril de 2010 20,312 12,427lunes, 05 de abril de 2010 28,825 10,813
martes, 06 de abril de 2010 34,762 32,490miércoles, 07 de abril de 2010 29,073 34,205
jueves, 08 de abril de 2010 23,843 23,713viernes, 09 de abril de 2010 35,810 32,962sábado, 10 de abril de 2010 19,961 27,000
domingo, 11 de abril de 2010 27,000 30,000lunes, 12 de abril de 2010 26,000 32,980
martes, 13 de abril de 2010 26,000 30,000miércoles, 14 de abril de 2010 26,000 20,000
jueves, 15 de abril de 2010 30,000 30,000viernes, 16 de abril de 2010 31,000 30,000sábado, 17 de abril de 2010 25,000 30,000
domingo, 18 de abril de 2010 27,000 30,000lunes, 19 de abril de 2010 30,000 20,274
martes, 20 de abril de 2010 26,000 30,000miércoles, 21 de abril de 2010 26,000 20,000
jueves, 22 de abril de 2010 30,000 30,000viernes, 23 de abril de 2010 31,000 30,000sábado, 24 de abril de 2010 25,000 30,000
domingo, 25 de abril de 2010 27,000 20,000lunes, 26 de abril de 2010 25,000 30,000
martes, 27 de abril de 2010 26,000 30,000miércoles, 28 de abril de 2010 26,000 20,000
jueves, 29 de abril de 2010 30,000 30,000viernes, 30 de abril de 2010 31,000 30,000
SOLUCIÓN DEL CASO REPSOL YPF
Para este problema tenemos que crear las tablas de frecuencias respectivas para cada sucursal, a partir de ello se tiene que hacer los análisis correspondientes e identificar a la menos dispersa.
Sucursal 1
Ordenando los datos tenemos lo siguiente:
Contabilización de fechas CONSUMO DE GAS SUCURSAL 1lunes, 01 de marzo de 2010 7,539jueves, 01 de abril de 2010 10,776lunes, 15 de marzo de 2010 12,410
sábado, 13 de marzo de 2010 15,174lunes, 29 de marzo de 2010 15,563lunes, 08 de marzo de 2010 19,441sábado, 10 de abril de 2010 19,961
domingo, 04 de abril de 2010 20,312miércoles, 17 de marzo de
2010 20,866
domingo, 07 de marzo de 2010 22,052lunes, 22 de marzo de 2010 22,268jueves, 08 de abril de 2010 23,843sábado, 17 de abril de 2010 25,000sábado, 24 de abril de 2010 25,000lunes, 26 de abril de 2010 25,000
sábado, 03 de abril de 2010 25,217martes, 30 de marzo de 2010 25,473sábado, 27 de marzo de 2010 25,944
lunes, 12 de abril de 2010 26,000martes, 13 de abril de 2010 26,000
miércoles, 14 de abril de 2010 26,000martes, 20 de abril de 2010 26,000
miércoles, 21 de abril de 2010 26,000martes, 27 de abril de 2010 26,000
miércoles, 28 de abril de 2010 26,000martes, 02 de marzo de 2010 26,043jueves, 04 de marzo de 2010 26,399martes, 16 de marzo de 2010 26,445domingo, 11 de abril de 2010 27,000domingo, 18 de abril de 2010 27,000domingo, 25 de abril de 2010 27,000
miércoles, 10 de marzo de 2010 27,307
domingo, 21 de marzo de 2010 27,590martes, 09 de marzo de 2010 27,861
domingo, 28 de marzo de 2010 27,988sábado, 06 de marzo de 2010 28,399
viernes, 02 de abril de 2010 28,427martes, 23 de marzo de 2010 28,457viernes, 12 de marzo de 2010 28,697jueves, 25 de marzo de 2010 28,825
lunes, 05 de abril de 2010 28,825miércoles, 07 de abril de 2010 29,073jueves, 18 de marzo de 2010 29,318jueves, 15 de abril de 2010 30,000lunes, 19 de abril de 2010 30,000jueves, 22 de abril de 2010 30,000jueves, 29 de abril de 2010 30,000viernes, 16 de abril de 2010 31,000viernes, 23 de abril de 2010 31,000viernes, 30 de abril de 2010 31,000
viernes, 19 de marzo de 2010 31,426viernes, 05 de marzo de 2010 32,201
domingo, 14 de marzo de 2010 32,458miércoles, 03 de marzo de
2010 32,616
martes, 06 de abril de 2010 34,762jueves, 11 de marzo de 2010 35,257
miércoles, 31 de marzo de 2010 35,675
viernes, 09 de abril de 2010 35,810viernes, 26 de marzo de 2010 35,910sábado, 20 de marzo de 2010 36,881
miércoles, 24 de marzo de 2010 36,981
Tenemos que desarrollar la tabla de distribución de frecuenciasPodemos decir que:El alcance es:
A=[7,539 ;36,981 ]La longitud de dicho alcance viene dada por:
l=36,981−7,539=29442Numero de datos es: 61
Aplicamos la Regla De SturgesK=1+3.3× log 61K=6.892≈7
Si K=7, entonces
W=29,4427
=4,206
LK=7,539+4206×7
LK=36,981
Este valor llega a incluir al mayor valor de los datos de consumo (36,981), por lo tanto consideramos la distribución de 7 intervalos y cerrado al final.
Llenamos la tabla de distribución de frecuencias tomando en consideración los datos hallados.
Consumo (Glns) Ii ni xi hi Hi Ni 100hi% 100Hi%
[ 7,539;11,745> 2 9,642 0.0328 0.0328 2 3.28% 3.28%[11,745;15,951> 3 13,848 0.0492 0.082 5 4.92% 8.20%[15,951;20,157> 2 18,054 0.0328 0.1148 7 3.28% 11.48%[20,157;24,363> 5 22,260 0.0820 0.1968 12 8.20% 19.68%[24,363;28,569> 26 26,466 0.4262 0.623 38 42.62% 62.30%[28,569;32,775> 16 30,672 0.2623 0.8853 54 26.23% 88.53%[32,775;36,981] 7 34,878 0.1147 1 61 11.47% 100.00%
TOTAL 61 155,820 1.0000 100.00%
Tabla 1. Tabla de distribución de frecuencias
Damos a conocer las gráficas estadísticas para la apreciación del caso REPSOL YPF, todo ello a partir de los datos de la Tabla 1.
0 [ 7,539;11,745> [11,745;15,951> [15,951;20,157> [20,157;24,363> [24,363;28,569> [28,569;32,775> [32,775;36,981]0
5
10
15
20
25
30
23
2
5
26
16
7
HISTOGRAMA
Intervalos de clase
ni
Figura 1. Histograma con su respectivo polígono de frecuencia
0 [ 7,539;11,745> [11,745;15,951> [15,951;20,157> [20,157;24,363> [24,363;28,569> [28,569;32,775> [32,775;36,981]0
10
20
30
40
50
60
70
2
57
12
38
54
61
DIAGRAMA ESCALONADO
Intervalos de Clase
ni
Figura 2. Diagrama escalonado con ojiva
A partir de la tabla de distribución de frecuencias, obtenemos la siguiente tabla:
Consumo (Glns) Cantidad(ni) xi xi.ni ni.xi²[ 7,539;11,745> 2 9,642 19284 185,936,328[11,745;15,951> 3 13,848 41544 575,301,312[15,951;20,157> 2 18,054 36108 651,893,832[20,157;24,363> 5 22,260 111300 2,477,538,000[24,363;28,569> 26 26,466 688116 18,211,678,056[28,569;32,775> 16 30,672 490752 15,052,345,344[32,775;36,981] 7 34,878 244146 8,515,324,188
TOTAL 61 155,820 1,631,250 45,670,017,060Tabla 2. Tabla para el cálculo de estadígrafos de dispersión
Esta tabla nos facilitará los cálculos para hallar las medidas de dispersión, así como de algunos estadígrafos de posición, como la media.
De esta manera empezamos a calcular:
La Media:
X̄=∑i=1
n
xi∗ni
∑i=1
n
ni
X̄= 1,631,25061
X̄= 26 ,741. 803 Glns (No olvidar que la media lleva las unidades correspondientes de lo que analizamos).
A continuación calculamos:
La Varianza:
V=s2=1n∑i=1
k
x i2n i−¿❑2 ¿
V=145,670,017,06061
−26,741.8032
V=¿33, 564,776.57 (La varianza no tiene unidades)
A partir de ello hallamos la desviación típica: S(x)S ( x )=√V
S ( x )=¿5,793.512Glns (La desviación típica tiene unidades)
Finalmente calculamos el coeficiente de variación: C.V.
C .V .=S (x )❑
C .V .= 5,793.51226,741.803
C .V .=0.216646259
En porcentaje sería aproximadamente 21.66%
Sucursal 2
Ordenando los datos tenemos lo siguiente:
Contabilización de fechas CONSUMO DE GAS SUCURSAL 2lunes, 05 de abril de 2010 10,813
lunes, 01 de marzo de 2010 11,099viernes, 12 de marzo de 2010 11,331
jueves, 01 de abril de 2010 11,513sábado, 13 de marzo de 2010 11,582domingo, 04 de abril de 2010 12,427
domingo, 21 de marzo de 2010 18,864miércoles, 14 de abril de 2010 20,000miércoles, 21 de abril de 2010 20,000domingo, 25 de abril de 2010 20,000miércoles, 28 de abril de 2010 20,000
lunes, 29 de marzo de 2010 20,274lunes, 19 de abril de 2010 20,274
lunes, 15 de marzo de 2010 20,289martes, 16 de marzo de 2010 20,331sábado, 06 de marzo de 2010 20,487sábado, 27 de marzo de 2010 20,592jueves, 11 de marzo de 2010 21,627
miércoles, 17 de marzo de 2010 22,115domingo, 07 de marzo de 2010 22,668martes, 30 de marzo de 2010 23,052jueves, 25 de marzo de 2010 23,067
miércoles, 10 de marzo de 2010 23,103jueves, 04 de marzo de 2010 23,672jueves, 08 de abril de 2010 23,713
viernes, 26 de marzo de 2010 24,267sábado, 10 de abril de 2010 27,000
domingo, 11 de abril de 2010 30,000martes, 13 de abril de 2010 30,000jueves, 15 de abril de 2010 30,000viernes, 16 de abril de 2010 30,000sábado, 17 de abril de 2010 30,000
domingo, 18 de abril de 2010 30,000martes, 20 de abril de 2010 30,000jueves, 22 de abril de 2010 30,000viernes, 23 de abril de 2010 30,000
sábado, 24 de abril de 2010 30,000lunes, 26 de abril de 2010 30,000
martes, 27 de abril de 2010 30,000jueves, 29 de abril de 2010 30,000viernes, 30 de abril de 2010 30,000jueves, 18 de marzo de 2010 31,695
domingo, 14 de marzo de 2010 32,189miércoles, 31 de marzo de 2010 32,290
viernes, 02 de abril de 2010 32,415martes, 06 de abril de 2010 32,490
miércoles, 03 de marzo de 2010 32,708viernes, 09 de abril de 2010 32,962sábado, 03 de abril de 2010 32,980lunes, 12 de abril de 2010 32,980
martes, 02 de marzo de 2010 33,257lunes, 22 de marzo de 2010 33,987
miércoles, 07 de abril de 2010 34,205domingo, 28 de marzo de 2010 34,697
lunes, 08 de marzo de 2010 34,970miércoles, 24 de marzo de 2010 35,258
viernes, 05 de marzo de 2010 35,411viernes, 19 de marzo de 2010 36,420martes, 23 de marzo de 2010 37,819sábado, 20 de marzo de 2010 45,860martes, 09 de marzo de 2010 46,701
De lo cual podemos decir que:El alcance es:
A=[10,813 ; 46,701 ]La longitud de dicho alcance viene dada por:
l=46,701−10,813=¿35,888
Numero de datos es: 61
Aplicamos la Regla De SturgesK=1+3.3× log 61K=6.892≈7
Si K=7, entonces
W=35,8887
=5,126.85714≈5,127
LK=10,813+5,127×7
LK=46,702
Este valor llega a incluir al mayor valor de los datos de consumo (46,701), por lo tanto consideramos la distribución de 7 intervalos, abierto en el último intervalo.
Tabla de distribución de frecuencias: La llenamos tomando en consideración los datos del problema.
Consumo (Glns) Ii ni xi hi Hi Ni 100hi% 100Hi%
[ 10,813; 15,940> 6 13,376.5 0.0984 0.0984 6 9.84% 9.84%[15,940;21,067> 11 18,503.5 0.1803 0.2787 17 18.03% 27.87%[21,067;26,194> 9 23,630.5 0.1475 0.4262 26 14.75% 42.62%[26,194;31,321> 15 28,757.5 0.2459 0.6721 41 24.59% 67.21%[31,321;36,448> 17 33,884.5 0.2787 0.9508 58 27.87% 95.08%[36,448;41,575> 1 39,011.5 0.0164 0.9672 59 1.64% 96.72%[41,575;46,702> 2 44,138.5 0.0328 1.0000 61 3.28% 100.00%
TOTAL 61 1.0000 100.00%Tabla 3. Tabla de distribución de frecuencias
0 [ 10,813; 15,940>
[15,940;21,067> [21,067;26,194> [26,194;31,321> [31,321;36,448> [36,448;41,575> [41,575;46,702>0
2
4
6
8
10
12
14
16
18
6
11
9
15
17
1
2
HISTOGRAMA
Intervalos de clase
ni
Gráfico 3. Histograma con Polígono de frecuencia
0 [ 10,813; 15,940>
[15,940;21,067> [21,067;26,194> [26,194;31,321> [31,321;36,448> [36,448;41,575> [41,575;46,702>0
10
20
30
40
50
60
70
6
17
26
41
58 5961
DIAGRAMA ESCALONADO
Intervalos de clase
Ni
Gráfico4. Diagrama escalonado con ojiva
A partir de la tabla de distribución de frecuencias, desarrollamos la tabla siguiente tabla:
Consumo (Glns) Cantidad(ni) xi xi.ni ni.xi²[ 10,813;15,940> 6 13,376.5 80,259.0 1,073,584,513.50[15,940;21,067> 11 18,503.5 203,538.5 3,766,174,634.75[21,067;26,194> 9 23,630.5 212,674.5 5,025,604,772.25[26,194;31,321> 15 28,757.5 431,362.5 12,404,907,093.75[31,321;36,448> 17 33,884.5 576,036.5 19,518,708,784.25[36,448;41,575> 1 39,011.5 39,011.5 1,521,897,132.25[41,575;46,702> 2 44,138.5 88,277.0 3,896,414,364.50
TOTAL 61 1,631,159.5 47,207,291,295.25
Tabla 2. Tabla para el cálculo de estadígrafos de dispersión
La cual nos facilitará hallar los cálculos de las medidas de dispersión, así como de algunos estadígrafos de posición como la media.
De esta manera empezamos a calcular:
La Media:
X̄=∑i=1
n
xi∗ni
∑i=1
n
ni
X̄= 1,631,159 .561
X̄= 26 ,740 .32Glns (No olvidar que la media lleva las unidades correspondientes de lo que analizamos)
A continuación calculamos:
La Varianza:
V=s2=1n∑i=1
k
x i2n i−¿❑2 ¿
V=145,670,017,06061
−26,741.8032
V=¿58, 845,307.53 (La varianza no tiene unidades)
A partir de ello hallamos la desviación típica: S(x)
S ( x )=√V
S ( x )=¿7,671.07 Glns (La desviación típica tiene unidades)
Finalmente calculamos el coeficiente de variación: C.V.
C .V .=S (x )❑
C .V .= 7,671.0726,740.32
C .V .=0.286872782
El cual en porcentaje sería aproximadamente 28.68%
COMPARACIÓN: SUCURSAL 1 Y SUCURSAL 2
A través del coeficiente de variación podemos decir que:
Para la sucursal 1:C .V .=0.216646259
En porcentaje sería aproximadamente 21.66%
Para la sucursal 2:C .V .=0.286872782
El cual en porcentaje sería aproximadamente 28.68%
Como muy bien sabemos, a mayor C.V. menos homogeneidad y mayor dispersión.
Por lo tanto, concluimos que la sucursal 1 será la elegida para programar la ampliación y automatización, debido a que su estadígrafo de dispersión es en porcentaje 21.66%, lo cual representa menor dispersión y es más homogéneo con respecto al 28.68% de la sucursal 2.