23

Click here to load reader

Trabajo de Estadística

Embed Size (px)

DESCRIPTION

Tecsup

Citation preview

Page 1: Trabajo de Estadística

MATEMÁTICAS II

MONOGRAFÍA

“ANÁLISIS DE CASO DE APLICACIÓN RELACIONADO A TÉCNICAS ESTADÍSTICAS”

Integrantes:

ORELLANA ORDOÑEZ, Orlando ROJAS HINOSTROZA , Carlos Enrique

Sección: G2-2-E,F

Profesor:

VIZARRETA GARCÍA, Pedro Luis

2010 - I

Page 2: Trabajo de Estadística

CASO ANALÍTICO DE LA EMPRESA REPSOL YPF

La empresa Repsol YPF ha notado un incremento paulatino del consumo de gas en dos sucursales en provincia, las cuales se dedican a distribuir GLP (Glns) a gasocentros, clientes domésticos e industriales. Además, la empresa ha sido informada de que en horas punta no se puede abastecer la demanda existente, por lo cual, la empresa decide programar la ampliación y automatización sólo de una de ellas debido al fondo de inversión que posee. La empresa toma la decisión de elegir a aquella que fue la más homogénea durante los meses de Marzo y Abril de este año, para lo cual, a partir de los datos de consumo que posee, solicita la aplicación de técnicas estadísticas e identificar a la sucursal más homogénea para poder empezar el proyecto de ampliación y automatización de dicha sucursal.

A continuación se muestran los datos informativos de los consumos respectivos:

Contabilización de fechas CONSUMO DE GASSUCURSAL 1

CONSUMO DE GASSUCURSAL 2

(Glns) (Glns)lunes, 01 de marzo de 2010 7,539 11,099

martes, 02 de marzo de 2010 26,043 33,257miércoles, 03 de marzo de

2010 32,616 32,708

jueves, 04 de marzo de 2010 26,399 23,672viernes, 05 de marzo de 2010 32,201 35,411sábado, 06 de marzo de 2010 28,399 20,487

domingo, 07 de marzo de 2010 22,052 22,668lunes, 08 de marzo de 2010 19,441 34,970

martes, 09 de marzo de 2010 27,861 46,701miércoles, 10 de marzo de

2010 27,307 23,103

jueves, 11 de marzo de 2010 35,257 21,627viernes, 12 de marzo de 2010 28,697 11,331sábado, 13 de marzo de 2010 15,174 11,582

domingo, 14 de marzo de 2010 32,458 32,189lunes, 15 de marzo de 2010 12,410 20,289

martes, 16 de marzo de 2010 26,445 20,331miércoles, 17 de marzo de

2010 20,866 22,115

jueves, 18 de marzo de 2010 29,318 31,695viernes, 19 de marzo de 2010 31,426 36,420sábado, 20 de marzo de 2010 36,881 45,860

domingo, 21 de marzo de 2010 27,590 18,864lunes, 22 de marzo de 2010 22,268 33,987

martes, 23 de marzo de 2010 28,457 37,819miércoles, 24 de marzo de

2010 36,981 35,258

Page 3: Trabajo de Estadística

jueves, 25 de marzo de 2010 28,825 23,067viernes, 26 de marzo de 2010 35,910 24,267sábado, 27 de marzo de 2010 25,944 20,592

domingo, 28 de marzo de 2010 27,988 34,697lunes, 29 de marzo de 2010 15,563 20,274

martes, 30 de marzo de 2010 25,473 23,052miércoles, 31 de marzo de

2010 35,675 32,290

jueves, 01 de abril de 2010 10,776 11,513viernes, 02 de abril de 2010 28,427 32,415sábado, 03 de abril de 2010 25,217 32,980

domingo, 04 de abril de 2010 20,312 12,427lunes, 05 de abril de 2010 28,825 10,813

martes, 06 de abril de 2010 34,762 32,490miércoles, 07 de abril de 2010 29,073 34,205

jueves, 08 de abril de 2010 23,843 23,713viernes, 09 de abril de 2010 35,810 32,962sábado, 10 de abril de 2010 19,961 27,000

domingo, 11 de abril de 2010 27,000 30,000lunes, 12 de abril de 2010 26,000 32,980

martes, 13 de abril de 2010 26,000 30,000miércoles, 14 de abril de 2010 26,000 20,000

jueves, 15 de abril de 2010 30,000 30,000viernes, 16 de abril de 2010 31,000 30,000sábado, 17 de abril de 2010 25,000 30,000

domingo, 18 de abril de 2010 27,000 30,000lunes, 19 de abril de 2010 30,000 20,274

martes, 20 de abril de 2010 26,000 30,000miércoles, 21 de abril de 2010 26,000 20,000

jueves, 22 de abril de 2010 30,000 30,000viernes, 23 de abril de 2010 31,000 30,000sábado, 24 de abril de 2010 25,000 30,000

domingo, 25 de abril de 2010 27,000 20,000lunes, 26 de abril de 2010 25,000 30,000

martes, 27 de abril de 2010 26,000 30,000miércoles, 28 de abril de 2010 26,000 20,000

jueves, 29 de abril de 2010 30,000 30,000viernes, 30 de abril de 2010 31,000 30,000

SOLUCIÓN DEL CASO REPSOL YPF

Para este problema tenemos que crear las tablas de frecuencias respectivas para cada sucursal, a partir de ello se tiene que hacer los análisis correspondientes e identificar a la menos dispersa.

Sucursal 1

Page 4: Trabajo de Estadística

Ordenando los datos tenemos lo siguiente:

Contabilización de fechas CONSUMO DE GAS SUCURSAL 1lunes, 01 de marzo de 2010 7,539jueves, 01 de abril de 2010 10,776lunes, 15 de marzo de 2010 12,410

sábado, 13 de marzo de 2010 15,174lunes, 29 de marzo de 2010 15,563lunes, 08 de marzo de 2010 19,441sábado, 10 de abril de 2010 19,961

domingo, 04 de abril de 2010 20,312miércoles, 17 de marzo de

2010 20,866

domingo, 07 de marzo de 2010 22,052lunes, 22 de marzo de 2010 22,268jueves, 08 de abril de 2010 23,843sábado, 17 de abril de 2010 25,000sábado, 24 de abril de 2010 25,000lunes, 26 de abril de 2010 25,000

sábado, 03 de abril de 2010 25,217martes, 30 de marzo de 2010 25,473sábado, 27 de marzo de 2010 25,944

lunes, 12 de abril de 2010 26,000martes, 13 de abril de 2010 26,000

miércoles, 14 de abril de 2010 26,000martes, 20 de abril de 2010 26,000

miércoles, 21 de abril de 2010 26,000martes, 27 de abril de 2010 26,000

miércoles, 28 de abril de 2010 26,000martes, 02 de marzo de 2010 26,043jueves, 04 de marzo de 2010 26,399martes, 16 de marzo de 2010 26,445domingo, 11 de abril de 2010 27,000domingo, 18 de abril de 2010 27,000domingo, 25 de abril de 2010 27,000

miércoles, 10 de marzo de 2010 27,307

domingo, 21 de marzo de 2010 27,590martes, 09 de marzo de 2010 27,861

domingo, 28 de marzo de 2010 27,988sábado, 06 de marzo de 2010 28,399

Page 5: Trabajo de Estadística

viernes, 02 de abril de 2010 28,427martes, 23 de marzo de 2010 28,457viernes, 12 de marzo de 2010 28,697jueves, 25 de marzo de 2010 28,825

lunes, 05 de abril de 2010 28,825miércoles, 07 de abril de 2010 29,073jueves, 18 de marzo de 2010 29,318jueves, 15 de abril de 2010 30,000lunes, 19 de abril de 2010 30,000jueves, 22 de abril de 2010 30,000jueves, 29 de abril de 2010 30,000viernes, 16 de abril de 2010 31,000viernes, 23 de abril de 2010 31,000viernes, 30 de abril de 2010 31,000

viernes, 19 de marzo de 2010 31,426viernes, 05 de marzo de 2010 32,201

domingo, 14 de marzo de 2010 32,458miércoles, 03 de marzo de

2010 32,616

martes, 06 de abril de 2010 34,762jueves, 11 de marzo de 2010 35,257

miércoles, 31 de marzo de 2010 35,675

viernes, 09 de abril de 2010 35,810viernes, 26 de marzo de 2010 35,910sábado, 20 de marzo de 2010 36,881

miércoles, 24 de marzo de 2010 36,981

Tenemos que desarrollar la tabla de distribución de frecuenciasPodemos decir que:El alcance es:

A=[7,539 ;36,981 ]La longitud de dicho alcance viene dada por:

l=36,981−7,539=29442Numero de datos es: 61

Aplicamos la Regla De SturgesK=1+3.3× log 61K=6.892≈7

Si K=7, entonces

W=29,4427

=4,206

Page 6: Trabajo de Estadística

LK=7,539+4206×7

LK=36,981

Este valor llega a incluir al mayor valor de los datos de consumo (36,981), por lo tanto consideramos la distribución de 7 intervalos y cerrado al final.

Llenamos la tabla de distribución de frecuencias tomando en consideración los datos hallados.

Consumo (Glns) Ii ni xi hi Hi Ni 100hi% 100Hi%

[ 7,539;11,745> 2 9,642 0.0328 0.0328 2 3.28% 3.28%[11,745;15,951> 3 13,848 0.0492 0.082 5 4.92% 8.20%[15,951;20,157> 2 18,054 0.0328 0.1148 7 3.28% 11.48%[20,157;24,363> 5 22,260 0.0820 0.1968 12 8.20% 19.68%[24,363;28,569> 26 26,466 0.4262 0.623 38 42.62% 62.30%[28,569;32,775> 16 30,672 0.2623 0.8853 54 26.23% 88.53%[32,775;36,981] 7 34,878 0.1147 1 61 11.47% 100.00%

TOTAL 61 155,820 1.0000 100.00%

Tabla 1. Tabla de distribución de frecuencias

Damos a conocer las gráficas estadísticas para la apreciación del caso REPSOL YPF, todo ello a partir de los datos de la Tabla 1.

Page 7: Trabajo de Estadística

0 [ 7,539;11,745> [11,745;15,951> [15,951;20,157> [20,157;24,363> [24,363;28,569> [28,569;32,775> [32,775;36,981]0

5

10

15

20

25

30

23

2

5

26

16

7

HISTOGRAMA

Intervalos de clase

ni

Figura 1. Histograma con su respectivo polígono de frecuencia

Page 8: Trabajo de Estadística

0 [ 7,539;11,745> [11,745;15,951> [15,951;20,157> [20,157;24,363> [24,363;28,569> [28,569;32,775> [32,775;36,981]0

10

20

30

40

50

60

70

2

57

12

38

54

61

DIAGRAMA ESCALONADO

Intervalos de Clase

ni

Figura 2. Diagrama escalonado con ojiva

A partir de la tabla de distribución de frecuencias, obtenemos la siguiente tabla:

Consumo (Glns) Cantidad(ni) xi xi.ni ni.xi²[ 7,539;11,745> 2 9,642 19284 185,936,328[11,745;15,951> 3 13,848 41544 575,301,312[15,951;20,157> 2 18,054 36108 651,893,832[20,157;24,363> 5 22,260 111300 2,477,538,000[24,363;28,569> 26 26,466 688116 18,211,678,056[28,569;32,775> 16 30,672 490752 15,052,345,344[32,775;36,981] 7 34,878 244146 8,515,324,188

TOTAL 61 155,820 1,631,250 45,670,017,060Tabla 2. Tabla para el cálculo de estadígrafos de dispersión

Esta tabla nos facilitará los cálculos para hallar las medidas de dispersión, así como de algunos estadígrafos de posición, como la media.

De esta manera empezamos a calcular:

Page 9: Trabajo de Estadística

La Media:

X̄=∑i=1

n

xi∗ni

∑i=1

n

ni

X̄= 1,631,25061

X̄= 26 ,741. 803 Glns (No olvidar que la media lleva las unidades correspondientes de lo que analizamos).

A continuación calculamos:

La Varianza:

V=s2=1n∑i=1

k

x i2n i−¿❑2 ¿

V=145,670,017,06061

−26,741.8032

V=¿33, 564,776.57 (La varianza no tiene unidades)

A partir de ello hallamos la desviación típica: S(x)S ( x )=√V

S ( x )=¿5,793.512Glns (La desviación típica tiene unidades)

Finalmente calculamos el coeficiente de variación: C.V.

C .V .=S (x )❑

C .V .= 5,793.51226,741.803

C .V .=0.216646259

En porcentaje sería aproximadamente 21.66%

Page 10: Trabajo de Estadística

Sucursal 2

Ordenando los datos tenemos lo siguiente:

Contabilización de fechas CONSUMO DE GAS SUCURSAL 2lunes, 05 de abril de 2010 10,813

lunes, 01 de marzo de 2010 11,099viernes, 12 de marzo de 2010 11,331

jueves, 01 de abril de 2010 11,513sábado, 13 de marzo de 2010 11,582domingo, 04 de abril de 2010 12,427

domingo, 21 de marzo de 2010 18,864miércoles, 14 de abril de 2010 20,000miércoles, 21 de abril de 2010 20,000domingo, 25 de abril de 2010 20,000miércoles, 28 de abril de 2010 20,000

lunes, 29 de marzo de 2010 20,274lunes, 19 de abril de 2010 20,274

lunes, 15 de marzo de 2010 20,289martes, 16 de marzo de 2010 20,331sábado, 06 de marzo de 2010 20,487sábado, 27 de marzo de 2010 20,592jueves, 11 de marzo de 2010 21,627

miércoles, 17 de marzo de 2010 22,115domingo, 07 de marzo de 2010 22,668martes, 30 de marzo de 2010 23,052jueves, 25 de marzo de 2010 23,067

miércoles, 10 de marzo de 2010 23,103jueves, 04 de marzo de 2010 23,672jueves, 08 de abril de 2010 23,713

viernes, 26 de marzo de 2010 24,267sábado, 10 de abril de 2010 27,000

domingo, 11 de abril de 2010 30,000martes, 13 de abril de 2010 30,000jueves, 15 de abril de 2010 30,000viernes, 16 de abril de 2010 30,000sábado, 17 de abril de 2010 30,000

domingo, 18 de abril de 2010 30,000martes, 20 de abril de 2010 30,000jueves, 22 de abril de 2010 30,000viernes, 23 de abril de 2010 30,000

Page 11: Trabajo de Estadística

sábado, 24 de abril de 2010 30,000lunes, 26 de abril de 2010 30,000

martes, 27 de abril de 2010 30,000jueves, 29 de abril de 2010 30,000viernes, 30 de abril de 2010 30,000jueves, 18 de marzo de 2010 31,695

domingo, 14 de marzo de 2010 32,189miércoles, 31 de marzo de 2010 32,290

viernes, 02 de abril de 2010 32,415martes, 06 de abril de 2010 32,490

miércoles, 03 de marzo de 2010 32,708viernes, 09 de abril de 2010 32,962sábado, 03 de abril de 2010 32,980lunes, 12 de abril de 2010 32,980

martes, 02 de marzo de 2010 33,257lunes, 22 de marzo de 2010 33,987

miércoles, 07 de abril de 2010 34,205domingo, 28 de marzo de 2010 34,697

lunes, 08 de marzo de 2010 34,970miércoles, 24 de marzo de 2010 35,258

viernes, 05 de marzo de 2010 35,411viernes, 19 de marzo de 2010 36,420martes, 23 de marzo de 2010 37,819sábado, 20 de marzo de 2010 45,860martes, 09 de marzo de 2010 46,701

De lo cual podemos decir que:El alcance es:

A=[10,813 ; 46,701 ]La longitud de dicho alcance viene dada por:

l=46,701−10,813=¿35,888

Numero de datos es: 61

Aplicamos la Regla De SturgesK=1+3.3× log 61K=6.892≈7

Si K=7, entonces

W=35,8887

=5,126.85714≈5,127

LK=10,813+5,127×7

Page 12: Trabajo de Estadística

LK=46,702

Este valor llega a incluir al mayor valor de los datos de consumo (46,701), por lo tanto consideramos la distribución de 7 intervalos, abierto en el último intervalo.

Tabla de distribución de frecuencias: La llenamos tomando en consideración los datos del problema.

Consumo (Glns) Ii ni xi hi Hi Ni 100hi% 100Hi%

[ 10,813; 15,940> 6 13,376.5 0.0984 0.0984 6 9.84% 9.84%[15,940;21,067> 11 18,503.5 0.1803 0.2787 17 18.03% 27.87%[21,067;26,194> 9 23,630.5 0.1475 0.4262 26 14.75% 42.62%[26,194;31,321> 15 28,757.5 0.2459 0.6721 41 24.59% 67.21%[31,321;36,448> 17 33,884.5 0.2787 0.9508 58 27.87% 95.08%[36,448;41,575> 1 39,011.5 0.0164 0.9672 59 1.64% 96.72%[41,575;46,702> 2 44,138.5 0.0328 1.0000 61 3.28% 100.00%

TOTAL 61 1.0000 100.00%Tabla 3. Tabla de distribución de frecuencias

0 [ 10,813; 15,940>

[15,940;21,067> [21,067;26,194> [26,194;31,321> [31,321;36,448> [36,448;41,575> [41,575;46,702>0

2

4

6

8

10

12

14

16

18

6

11

9

15

17

1

2

HISTOGRAMA

Intervalos de clase

ni

Gráfico 3. Histograma con Polígono de frecuencia

Page 13: Trabajo de Estadística

0 [ 10,813; 15,940>

[15,940;21,067> [21,067;26,194> [26,194;31,321> [31,321;36,448> [36,448;41,575> [41,575;46,702>0

10

20

30

40

50

60

70

6

17

26

41

58 5961

DIAGRAMA ESCALONADO

Intervalos de clase

Ni

Gráfico4. Diagrama escalonado con ojiva

A partir de la tabla de distribución de frecuencias, desarrollamos la tabla siguiente tabla:

Consumo (Glns) Cantidad(ni) xi xi.ni ni.xi²[ 10,813;15,940> 6 13,376.5 80,259.0 1,073,584,513.50[15,940;21,067> 11 18,503.5 203,538.5 3,766,174,634.75[21,067;26,194> 9 23,630.5 212,674.5 5,025,604,772.25[26,194;31,321> 15 28,757.5 431,362.5 12,404,907,093.75[31,321;36,448> 17 33,884.5 576,036.5 19,518,708,784.25[36,448;41,575> 1 39,011.5 39,011.5 1,521,897,132.25[41,575;46,702> 2 44,138.5 88,277.0 3,896,414,364.50

TOTAL 61 1,631,159.5 47,207,291,295.25

Tabla 2. Tabla para el cálculo de estadígrafos de dispersión

La cual nos facilitará hallar los cálculos de las medidas de dispersión, así como de algunos estadígrafos de posición como la media.

Page 14: Trabajo de Estadística

De esta manera empezamos a calcular:

La Media:

X̄=∑i=1

n

xi∗ni

∑i=1

n

ni

X̄= 1,631,159 .561

X̄= 26 ,740 .32Glns (No olvidar que la media lleva las unidades correspondientes de lo que analizamos)

A continuación calculamos:

La Varianza:

V=s2=1n∑i=1

k

x i2n i−¿❑2 ¿

V=145,670,017,06061

−26,741.8032

V=¿58, 845,307.53 (La varianza no tiene unidades)

A partir de ello hallamos la desviación típica: S(x)

S ( x )=√V

S ( x )=¿7,671.07 Glns (La desviación típica tiene unidades)

Finalmente calculamos el coeficiente de variación: C.V.

C .V .=S (x )❑

C .V .= 7,671.0726,740.32

C .V .=0.286872782

El cual en porcentaje sería aproximadamente 28.68%

Page 15: Trabajo de Estadística

COMPARACIÓN: SUCURSAL 1 Y SUCURSAL 2

A través del coeficiente de variación podemos decir que:

Para la sucursal 1:C .V .=0.216646259

En porcentaje sería aproximadamente 21.66%

Para la sucursal 2:C .V .=0.286872782

El cual en porcentaje sería aproximadamente 28.68%

Como muy bien sabemos, a mayor C.V. menos homogeneidad y mayor dispersión.

Por lo tanto, concluimos que la sucursal 1 será la elegida para programar la ampliación y automatización, debido a que su estadígrafo de dispersión es en porcentaje 21.66%, lo cual representa menor dispersión y es más homogéneo con respecto al 28.68% de la sucursal 2.

Page 16: Trabajo de Estadística