86
UNIVERSIDAD SURCOLOMBIANA MODULO DE ESTADISTICA RELACIONAL Figura 1. Regresion 0 50 100 150 200 250 300 1990 1995 2000 2005 2010 Año Inventario PROFESOR: JAIME POLANIA PERDOMO NEIVA, 2012

CURSO DE ESTADÍSTICA RELACIONAL

Embed Size (px)

Citation preview

UNIVERSIDAD SURCOLOMBIANA

MODULO DE

ESTADISTICA RELACIONAL

Figura 1. Regresion

0

50

100

150

200

250

300

1990 1995 2000 2005 2010

Año

Inv

en

tari

o

PROFESOR: JAIME POLANIA PERDOMO

NEIVA, 2012

2

INTRODUCCION

Muchas empresas y organismos se ven enfrentados con el desafiante problema de pronosticar el nivel futuro de alguna actividad económica; predicciones de ventas, empleo, ingresos, población y muchos otros factores económicos que son elementos esenciales en la planificación de actividades futuras. ¿Cómo se hacen estas predicciones? Ellos deben basarse en hechos pasados y presentes. Estos hechos son representados habitualmente por medio de observaciones hechas en períodos consecutivos de tiempo. Este conjunto de observaciones se denomina SERIES CRONOLÓGICAS. El modulo tiene como objetivo enseñar al estudiante las técnicas estadísticas de regresión y correlación y técnicas para la descomposición de una serie cronológica y El primer capítulo explica la técnica de regresión y correlación para dos y tres variables. El segundo capítulo contiene los métodos para Determine la tendencia de una serie cuando esta afectada por esta componente. El segundo capítulo trata de la componente estacional para series mensuales o trimestrales. El tercer capítulo trata de los movimiento irregulares de una serie anual Espero que los lectores de este modulo aprendan y aclaren conceptos para el tratamiento de una serie cronológica.

3

UNIDAD I.

REGRESION Y CORRELACION

Al analizar los datos para las ciencias económicas con frecuencia se encuentra que resulta conveniente saber la relación que existe entre dos variables, por ejemplo; es posible que se tenga interés en Determine la relación entre los gastos e ingresos de las familias en el Huila; en que cantidad, los costos y la cantidad de computadores producida en ciertas fábricas; la cantidad de empleados y el total artículos producidos por la fábrica; ganancia anual en empresas farmacéuticas y el presupuesto dedicado a la investigación; el tiempo que un vendedor le dedica al cliente y el monto de compra del cliente, etc. La naturaleza y la intensidad de las relaciones entre las variables como estas, pueden examinarse por medio del análisis de regresión y correlación, dos técnicas estadísticas que, aunque relacionadas, tienen propósitos diferentes. El análisis de regresión es útil para averiguar la forma probable de la relación de las dos variables (directa, inversa) y al mismo tiempo se utiliza para estimar un valor desconocido de la una de las variables. El objeto final de la regresión es predecir o estimar el valor de una variable dependiente (Y), correspondiente a un valor dado para una variable independiente (X). La correlación se refiere a la medición de la intensidad (fuerza) de relación entre las variables. Cuando se calcula la medida de correlación a partir de un conjunto de datos, el interés se centra en el grado de en que se relacionan las dos variables.

4

1. EL MODELO DE REGRESION LÌNEAL SIMPLE

1.1 INTRODUCCION

Como se dijo anteriormente el análisis de regresión establece la relación cuantitativa (en forma de ecuación) entre variables. Cuando se analizan dos variables que posiblemente se relacionen se denomina regresión, y sí su tendencia es aproximadamente lineal, entonces nos encontramos con un modelo de regresión lineal simple. Cuando se ha establecido la relación, es posible predecir el valor de una de las variables, si se conoce el valor de la otra variable. La variable que se predice se denomina dependiente y se nota como Y, en tanto que la variable conocida se denomina independiente y se designa como X. Cuando se dispone de los datos necesarios para Determine la relación que existe entre las dos variables, puede ser establecida gráficamente o matemáticamente (método de los mínimos cuadrados). El método gráfico consiste en elaborar un gráfico de puntos (este se denomina nube de puntos o diagrama de dispersión). Con los datos reales y al tanteo se puede Determine la mejor recta que ajusta los datos de la muestra real y además permite al investigador ver la relación entre las dos variables, por ejemplo de tiene la información de la tabla 1.1: Elaborando la gráfica y utilizando el método gráfico, en la figura No.1.1 las mejores rectas que se ajustan: puede ser la recta M1 o la recta M2, etc. es decir de acuerdo al investigador traza la recta que él cree que más se ajusta a los datos.

1.1.1 EL MÉTODO DE LOS MINIMOS CUADRADOS Es el método común para obtener la recta que más se ajusta a los datos de la muestra. El método de los mínimos cuadrados parte del principio de que: "la mejor recta que se ajusta a los datos es aquella que minimiza las diferencias de los cuadrados entre los valores observados y los valores estimados."

Tabla No.1.1 Ingresos y Gastos mensuales de seis empleados en una empresa (en cientos de miles de pesos).

Ingresos Gastos

4 2.0

5 2.5

6 3.0

7 3.5

8 4.0

9 5.0

X Y

0)ˆ( 2YY , donde Y = valor real Y de estimadoValor Y

5

^ Y = valor estimado Bajo este principio reemplazando en la fórmula anterior el valor estimado Y por la ecuación de la línea recta Y= ß0 + ß1X e igualando a cero la igualdad, luego derivando parcialmente con respecto a X y luego con respecto a Y, se obtiene las siguientes ecuaciones normales: Y = nß0 + ß1 X

XY = ßo X + ß1 X2

Figura 1.1. Rectas que más se ajustan.

La relación lineal entre dos variables queda representada por la línea recta, cuya ecuación general es: Y = ßo + ß1 X donde; Y = Variable dependiente X = Variable independiente ßo = Coeficiente de posición o valor independiente ß1 = Coeficiente de regresión (pendiente) En general para hallar la recta, se conoce los valores X, Y, y se desconocen ßo y B1. Para interpretar los parámetros betas se deben tener en cuenta el signo y sí: ß1 > 0. Por cada unidad que aumenta la variable X, la variable independiente Y aumenta en ß1 . ß1 < 0. Por cada unidad que disminuye (aumenta) la variable dependiente X, la variable independiente Y aumenta (disminuye) en ß1. ßo. Es el valor promedio inicial que toma la variable X. Nota: Para Determine un análisis de regresión se deben seguir los siguientes pasos:

Conocer valores para las variables X, Y. Graficar los datos para Determine aproximadamente la tendencia. Escribir el modelo (lineal, exponencial, parabólico) según la tendencia vista en paso anterior. Determine los parámetros betas por medio de las ecuaciones normales o formulas que se deducen

de las ecuaciones normales. Justificar el modelo. Uno de los métodos aproximado y no muy potente es hallar el coeficiente de

determinación.

6

Realice las estimaciones solicitadas. APLICACION: Estimar el gasto mensual de los empleados en una Empresa comercial que cuenta con un salario mensual de $850.000. Para estimar el gasto se cuenta con la información de la tabla 1.2.:

Tabla 1.2.Ingresos y Gastos mensuales de seis empleados en la empresa (en cientos de miles de pesos).

No Empleado Ingresos(X) Gastos(Y)

1 4.0 2.0

2 5.0 2.5

3 6.0 3.0

4 7.0 3.5

5 8.0 4.0

6 9.0 5.0

SOLUCION: A. Los datos tienen una variable dependiente Y = gasto mensual (ciento de miles de pesos), y la

variable independiente X = ingreso mensual (ciento de miles de pesos). B. Graficar los datos. Observando la tendencia es aproximadamente una tendencia lineal ( figura 3.) C. La ecuación a Determine es:

Y = ßo + ß1 X D. Determine los betas, utilizando la formula que se deduce de las ecuaciones normales, anteriormente

mencionadas que son. Y = nß0 + ß1 X XY = ßo X + ß1 X2

Despejando las ecuaciones normales se obtiene que

221

))((

XXn

YXXYn

n

X

n

Y

1

0

Para encontrar los valores de Y, n , XY, y X² , elaborar la tabla No.1.3 . Donde:

Y = 20, X = 39 n = 6 XY = 133 y X² = 271

542857.0

39271*6

)20*39(3*6))((222

1

XXn

YXXYn

36.06

39*542857.0

6

201

0 n

X

n

Y

7

Tabla 1.3. Cálculos para Determine beta cero y beta uno.

X Y XY X2

4 2.0 8.0 16

5 2.5 12.5 25

6 3.0 18.0 36

7 3.5 24.5 49

8 4.0 32.5 64

9 5.0 45.0 81

39 20 133.0 271

Por tanto la ecuación de regresión es:

Y = -0.36 + 0.542857X

Interpretación: B1 = 0.542857 "Por cada cien mil que tenga de ingreso mensual los empleados en la Empresa, los gastos aumentará en $54.285.70." Grafique la recta que más se ajusta por el método de los mínimos cuadrados, a la ecuación anterior se reemplaza los valores reales de X para obtener los Y estimados (Y). Los datos resultantes se presentan en la tabla 1.4 y gráfico 1.2. Para estimar el valor solicitado, debemos justificar el modelo determinando sí la variable independiente en que porcentaje participa explicando las variaciones de la variable Y. Uno de los métodos menos potentes para justificar el modelo es calculando el coeficiente de determinación. Otro método es el de calcular el error estándar de estimación. Tabla 1.4. Gastos mensuales estimados de los empleados en la Empresa

Ingresos Gastos Y

4 2.0 1.8095

5 2.5 2.3524

6 3.0 2.8952

7 3.5 3.4381

8 4.0 3.9810

9 5.0 4.5238

ERROR ESTANDAR DE LA ESTIMACION. Sy,x Mide la diferencia entre los valores reales (y) y los valores estimados por el modelo lineal(Ŷ).

2

ˆ1

2

n

YYSyx

n

i

8

El error estándar de la estimación se utiliza para medir la variabilidad entre los valores observados en la muestra y los valores estimados por el modelo. En otras palabras entre más pequeño sea Sy,x mucho mejor es el modelo para realizar los pronósticos. Como ejemplo se determina el Sy,x par los ingresos y gastos de los administradores de empresas. Para Determinar Sy,x elaboro la tabla 1.5.

Reemplazando en la formula:

2738.0

26

3000.0

2

ˆ

1

2

n

YY

Syx

n

i

Tabla 5. Calculo de la sumatoria para Determine el error estándar de estimación.

X Y Y

2)( YY

4 2.0 1.8095 0.0363

5 2.5 2.3524 0.0218

6 3.0 2.8952 0.0110

7 3.5 3.4381 0.0038

8 4.0 3.9810 0.0004

9 5.0 4.5238 0.2268

Total 0.3000

Gráfico 1.2. Recta estimada (Y)

Ejercicio: En cinco empresas de Software se desea examinar la relación entre el número de empleados y el total de micros producidos mensualmente, en las cinco empresas.

No. De micros 15 25 10 30 14

No. De empleados 2 4 1 6 2

0

0,5

1

1,5

2

2,5

3

3,5

4

4,5

5

1 2 3 4 5 6

Y

Yest

9

Determine la relación entre el número de micros producidos mensualmente y el total de empleados. Al mismo tiempo calcular el error estándar de la estimación para evaluar el modelo.

1.2.CORRELACION LÌNEAL SIMPLE La correlación mide el grado o intensidad con que se relacionan las variables. Este coeficiente de correlación notado por “r” es importante porque determina sí el modelo hallado es el que más se ajusta a los datos.

2222 * YYnXXn

YXXYnr

El coeficiente de correlación ” r” puede tomar cualquier valor entre -1 y +1, inclusive. Un r igual a -1 o a +1 indica correlación perfecta (el signo indica sí la relación es directa o inversa). Sí no existe en absoluto el r debe ser cercano a cero lo cual indica que la relación es poco intensa o débil. Coeficientes de correlación superiores a +0.75 o -0.75 indica una correlación muy intensa. El concepto de muy fuerte o muy débil del r, no tiene un significado preciso. Una medida que tiene significado más exacto es el COEFICIENTE DE DETERMINACION r², y se calcula elevando el coeficiente de correlación al cuadrado. La interpretación del r² es; es el porcentaje de la variación de la variable dependiente Y que queda explicada por las variaciones de la variable independiente X. El coeficiente de determinación se calcula de la siguiente forma:

N

i

n

i

YY

YY

SCT

SCEr

1

2

1

2

2

ˆ

Donde SCT es la suma de cuadrados total y es la cantidad de desviación total de la variable dependiente Y. Sí usted divide a SCT por n entonces obtiene la varianza de Y. SCE es variación total de los datos aplicando el modelo hallado. Entre más pequeña sea esta SCE, el modelo es mas adecuado para Determine las relaciones y las estimaciones. Otra forma de calcular r es elevada al cuadrado el coeficiente de correlación.

22 rr

Nota1 : Consideramos que el modelo teórico se ajusta a la información cuando re > 0.75. Nota 2. A la raíz cuadrada del coeficiente de determinación se denomina el coeficiente de correlación y se nota por " r ". APLICACION: Determine sí el modelo anteriormente hallado (ingresos y gastos) es bueno para realizar las estimaciones. SOLUCION: El modelo determinado es: Y = -0.36 + 0.542857X

10

Tabla 1.5. Cálculos necesarios para el coeficiente de correlación

X Y Y

2)ˆ( YY 2)ˆ( YY

4 2.0 1.81 2.31 1.77

5 2.5 2.35 0.96 0.69

6 3.0 2.90 0.19 0.11

7 3.5 3.44 0.01 0.03

8 4.0 3.98 0.42 0.45

9 5.0 4.5 1.43 2.79

Total 5.32 5.83

Con los datos de la tabla 1.5, continuamos calculado los datos para hallar 2)ˆ( YY y. Luego determine el re

y observe sí es bueno o no para realizar las estimaciones. Entonces

9125.0

83.5

32.5ˆ

1

2

1

2

2

N

i

n

i

YY

YY

SCT

SCEr

Interpretación : El 91.25% de las variaciones de los ingresos mensuales de los administradores de empresas son explicados por las variaciones de los gastos mensuales que tienen. ^ Para determinar los Y estimados reemplazo cada valor X en la ecuación HI-0.36+ 0.542857X NOTA: Cuando una variable es tratada a través del tiempo, la variable tiempo la consideramos como independiente (X) y al primer periodo (mes, día, año, etc.) se le asigna el valor de cero y a cada mes, día, año, siguiente se le aumenta una unidad. LABORATORIO No. 1 0) Leer apuntes. 1) Con el tiempo, la cantidad de leche producida por una vaca decrece de que esta da a luz. El granjero desea expresar esta relación por medio de una ecuación que se ajuste a los siguientes datos. LITROS POR DIA 12 11 8 9 8 7 NUMERO DE DIAS 10 30 40 50 55 65 a) Interprete ß1 sí se puede. 2) Un fabricante de ropa quiere expresar la relación entre la fuerza de ruptura de una fibra sintética y el diámetro de ésta. Por medio de un estudio se lograron los siguientes datos:

FUERZA DE RUPTURA (gramos).

49 80 140 220 250

DIAMETRO DE FIBRA (Cm) 0.1 0.2 0.3 0.4 0.5

a) Interprete los parámetros betas.b) Calcule r² e interpretar. 3) Como propietario de la empresa de ventiladores el VELOZ. La empresa tiene 8 plantas y quiere estimar los costos generales según el número de ventiladores producidos. Usted recoge la siguiente información mensual

11

que describe los costos generales (en miles de pesos) y el total de ventiladores (en miles) producidos en las 8 plantas:

Planta 1 2 3 4 5 6 7 8

Gastos 100 85 75 600 55 40 35 30

No. Ventiladores 10 9 8 8 7 7 6 5

a) Interprete los parámetros betas. b) Calcule r² e interpretar. C) Estimar el costo mensual para una planta que produce mensualmente 8.500 ventiladores. 4) ¿ Cuál es el objetivo (uso) del análisis de regresión y el análisis de la correlación? 5) Como gerente mercadeo de Idema. Determino la siguiente ecuación de regresión para el precio por bulto y demanda mensual de arroz: Y = 0.2 - 110 X Donde: X = Precio del bulto de arroz (en cientos de pesos). Y = Demanda mensual de bultos de arroz. Interprete beta uno. 6) Los datos siguientes representan los pesos de Juan Prieto según la edad. Los valores de X denotan la edad en que se le tomó el peso y los valores de Y denotan los pesos EN kilos obtenidos por Juan: X:AÑOS 10 15 17 22 25. Y:PESO: 50 54 56 58 59. A. Estimar el peso de Juan Prieto cuando tenia 16 años. B. Interprete los BETAS. C. Calcule e interprete el coeficiente de determinación.

7) La siguiente información es el total de micros producidos por 5 fabricas en el país con sus respectivos costos de producción:

COSTOS (en millones $)

2 3 4 3.8 3.5 3.4

TOTAL DE MICROS MENSUALES (en miles de unidades)

15 25 35 45 50 54

Estimar los costos de una empresa que produce 48.000 micros. Interprete los parámetros. 8) Cierto tecnólogo en sistemas quiere demostrar que los digitadores cometen mas errores a medida que aumenta el tiempo de trabajo. Selecciona aleatoriamente 6 digitadores y obtiene los siguientes resultados:

TIEMPO DE TRABAJO (en horas) 4 5 6 7 8 9 10 11 12 TOTAL DE ERRORES 5 7 9 12 14 16 16 18 20

Justifique la afirmación del tecnólogo, con base a un análisis de regresión y correlación. 9) Se quiere demostrar si existe alguna relación entre el tiempo necesario (segundos) para que un cliente espere en la bomba de gasolina y la cantidad de gasolina que compra (en galones). Seleccionaron aleatoriamente 10 vehículos y se obtuvo la siguiente información:

Tiempo 30 50 70 90 110 145 150

Cantidad 1 2 3 4 5 6 7

12

2. MODELO DE REGRESION PARABOLICA

2.1 INTRODUCCION

En el análisis de regresión y correlación se analizó el modelo lineal simple (tendencia lineal), ahora trataremos modelos no lineales. A continuación se describen el modelo parabólico, las ecuaciones normales (para Determine los parámetros betas) y el coeficiente de determinación: MODELO PARABOLICO:

Y = ß0 + ß1 X + ß2 X2

ECUACIONES NORMALES:

n

i

n

i

n

iO

XXnY1

2

21

11

n

i

n

i

n

iO

n

i

XXXXY1

3

21

2

111

n

i

n

i

n

iO

n

i

XXXYX1

4

21

3

11

2

1

2

COEFICIENTE DE DETERMINACION

N

i

n

i

YY

YY

SCT

SCEr

1

2

1

2

2

ˆ

EJERCICIO: La siguiente información es el total de empleados y número de artículos (diariamente) producidos en 5 empresas del país.

TOTAL DE EMPLEADOS 4 6 8 11 13

PRODUCCION DIARIA(en miles de unidades)

40 35 20 35 42

Estime el total de artículos producidos diariamente una de las cinco empresas cuando tenga 17 empleados Solución. a) Identifique la variable dependiente y la variable independiente:

13

X = total de empleados en la empresa Y = total de artículos producidos diariamente (en miles). b) Identifique la tendencia (método gráfico o el coeficiente de determinación. En el gráfico 5 se identifica una tendencia parabólica.

Figura 5. Empleados y artículos producidos en cinco empresas. c) Halle el modelo: Como el modelo tiende a una parábola entonces es: Y = ß0 + ß1 X + ß2 X

2 Utilizo las ecuaciones normales para Determine los parámetros betas: ECUACIONES NORMALES:

n

i

n

i

n

iO

XXnY1

2

21

11

n

i

n

i

n

iO

n

i

XXXXY1

3

21

2

111

n

i

n

i

n

iO

n

i

XXXYX1

4

21

3

11

2

1

2

Para Determine las sumatorias las obtengo de los datos reales y algunos cálculos adicionales, como lo muestra la tabla 2.1. Reemplazando los datos de la tabla 6 en las ecuaciones normales:

172 = 5 ß0 + 42 ß1 + 406 ß2 1461= 42 ßo + 406 ß1 +4320 ß2

14513 = 406 ßo + 4320 ß1 +48850 ß2

14

TABLA 2.1. CALCULO DE LAS ECUACIONES NORMALES

_____________________________________________ X Y X2 X3 X4 XY X2Y _____________________________________________ 4 40 16 64 256 160 640 6 35 36 216 1296 210 1260 8 20 64 512 4096 160 1280 11 35 121 1331 14641 385 4235 13 42 169 2197 28561 546 7098 ______________________________________________ 42 172 406 4320 48850 1461 14513

______________________________________________ Para solucionar estos sistemas de ecuaciones, utilizó cualquier método conocido (determinantes, sustitución, eliminación) y se obtiene que los valores de: ßo = 82.36 ß1 = - 13.54 ß2 = 0.815 Entonces la ecuación es: Y =82.36 -13.54 X + 0.815 X2 Ahora, calcular el r² para Determine en que porcentaje explica las variaciones de la variable X en Y (ver formula):

N

i

n

i

YY

YY

SCT

SCEr

1

2

1

2

2

ˆ

Determine lo valores estimados y luego el promedio aritmético de la variable dependiente Y. A continuación se presenta algunos cálculos de lo Y estimados y la media: Cuando X = 4, reemplazo en la ecuación para estimar Y, entonces

Y Y = 82.31 - 13.54(4) + 0.81(4)² = 41.16 Cuando X = 6, reemplazo en la ecuación para estimar Y, entonces

Y 82.31 - 13.54(6) + 0.81(6)² = 30.28 y así sucesivamente para todos los valores de X (ver tabla 2.2). Para la media aritmética:

n

YY

n

ii

1=172/5=34.4 Con los datos de la tabla 2.1, reemplazo en r²:

15

N

i

n

i

YY

YY

SCT

SCEr

1

2

1

2

2

ˆ

= 74.020.297

03.222

Interpretación: El 74% de las variaciones de la producción de artículos producidos diariamente en las cinco empresas, son explicadas por las variaciones del total empleado en ellas.

Tabla 2.2. Cálculo de sumatorias para r² _________________________________________________

22 )Y-(Y )Y-Y( Y Y X

_____________________________________________ 4 40 41.16 45.69 31.36 6 35 30.28 16.97 0.36 8 20 25.88 72.59 207.36 11 35 31.43 8.92 0.36 13 42 43.23 77.96 57.76

_____________________________________________ 42 172 222.03 297.20

_________________________________________________

Ahora, calculo la estimación para una empresa que tiene 17 empleados. Como el modelo es: Y =82.36 -13.54 X + 0.815 X2 entonces reemplazo a X por 17: ^ Y = 82.36 - 13.54 (17) + 0.815 (17)² = 87.715 Se estima que para una empresa que cuenta con 17 empleados, la producción diaria es de 87715 articulo

16

3. MODELO DE REGRESION EXPONENCIAL

3.1 INTRODUCCION Un tercer modelo es la tendencia exponencial. A continuación se describen el modelo exponencial, las ecuaciones normales (para Determine los parámetros betas) y el coeficiente de determinación: MODELO EXPONENCIAL:

Y = ß0 ß1

X

El modelo exponencial se puede llevar a un modelo lineal aplicando logaritmos al modelo. Y = ß0 ß1

X , entonces log Y = log ß0 + X log ß1

ECUACIONES NORMALES:

1

1 1

logloglog

n

i

n

io

XY

1

1 1

2

1

logloglog

n

i

n

io

n

i

XXYX

COEFICIENTE DE DETERMINACION

N

i

n

i

YY

YY

SCT

SCEr

1

2

1

2

2

ˆ

Ejemplo: Determine el modelo Exponencial con su respectivo r² para los siguientes datos:

X 10 12 14 16 18

Y 1.0 1.5 2.1 3.0 7.0

X 10 12 14 16 18 Y 1.0 1.5 2.1 3.0 7.0 Calculo del modelo exponencial Primer paso: determine los parámetros betas para el modelo: Y = ß0 ß1

X o log Y = log ß0 + X log ß1

Los betas se determinan con las siguientes ecuaciones normales:

17

1

1 1

logloglog

n

i

n

io

XY

1

1 1

2

1

logloglog

n

i

n

io

n

i

XXYX

Para Determine las sumatorias creo la tabla 3.1. Tabla 3.1. cálculos de sumatorias para las ecuaciones normales. ____________________________________ X Y Log Y X log Y X² ____________________________________ 10 1.0 0 0 100 12 1.5 0.17609 2.11308 144 14 2.1 0.32221 4.51094 196 16 3.0 0.47712 7.63392 256 18 7.0 0.84509 15.21162 324 20 11.0 1.04139 20.82780 400 ________________________________________ 90 25.6 2.86190 50.29736 1420 __________________________________________ Reemplazo las ecuaciones normales: 2.8619 = 6 log ß0 + 90 log ß1 50.29736 = 90 log ß0 + 1420 log ß1 Para solucionar estos sistemas de ecuaciones, utilizó cualquier método conocido (determinantes,sustitución, eliminación) y se obtiene que los valores de: log ßo = -1.10191 log ß1 = 0.10526 La ecuación exponencial en forma logaritmica es: log Y = log ßo + log ß1 X , entonces log Y = -1.10191 + 0.10526 X Para llevarla a la forma exponencial: Y = ß0 ß1

X determino los antilogaritmos a los parámetros betas que son: log ßo = -1.10191 log ß1 = 0.10526 antilog ( -1.10191 ) = 0.07908 antilog( 0.10526 ) = 1.27426 Entonces la ecuación es:

Y = 0.07908 (1.27426 )X Calculo del coeficiente de determinación r² : Para Determine el r² se utiliza la siguiente formula:

18

N

i

n

i

YY

YY

SCT

SCEr

1

2

1

2

2

ˆ

^ Primer paso: Para Determine los Y estimados utilizo el modelo exponencial:

Y = 0.07908 (1.27426 )X Reemplazo cada valor de X en la ecuación, por ejemplo, para un valor de X = 10, el valor estimado es:

Y = 0.07908 (1.27426 )10 = 0.89, así sucesivamente. Los valores de y estimado se encuentran en la tabla 9.

Segundo paso: Calcule el promedio aritmético de Y:

n

YY

n

ii

1= 25.6/6 = 4.26

Tercer paso: calcule

n

i

YY

1

Los valores se relacionan en la tabla 3.2.

Tabla 3.2. Calculo de sumatorias para r² _________________________________________________

22 )Y-(Y )Y-Y( Y Y X

_____________________________________________ 10 1.0 0.89 11.35 10.62 12 1.5 1.44 7.95 7.61 14 2.1 2.35 3.64 4.66 16 3.0 3.82 0.19 1.58 18 7.0 6.20 3.76 7.50

20 11.0 10.07 33.75 45.42 ________________________________________________ 60.64 77.39 ________________________________________________

_ Cuarto paso: calcule ( Y - Y )². Los valores se relacionan en la tabla 3.2.

Quinto paso: Reemplace la formula:

N

i

n

i

YY

YY

SCT

SCEr

1

2

1

2

2

ˆ

78.039.77

64.60

19

LABORATORIO 2. 0) Leer apuntes. 1) Con el tiempo, la cantidad de leche producida por una vaca decrece de que esta da a luz. El granjero desea expresar esta relación por medio de una ecuación que se ajuste a los siguientes datos. LITROS POR DIA 12 11 8 9 8 7 NUMERO DE DIAS 10 30 40 50 55 65 a) Interprete ß1 sí se puede. 2) Un fabricante de ropa quiere expresar la relación entre la fuerza de ruptura de una fibra sintética y el diámetro de ésta. Por medio de un estudio se lograron los siguientes datos:

FUERZA DE RUPTURA (gramos).

49 80 140 220 250

DIAMETRO DE FIBRA (Cm) 0.1 0.2 0.3 0.4 0.5

a) Interprete los parámetros BETAS. b) Calcule r² e interpretar. 3) Como propietario de la empresa de ventiladores el VELOZ. La empresa tiene 8 plantas y quiere estimar los costos generales según el número de ventiladores producidos. Usted recoge la siguiente información mensual que describe los costos generales (en miles de pesos) y el total de ventiladores (en miles) producidos en las 8 plantas:

Planta 1 2 3 4 5 6 7 8

Gastos 100 85 75 600 55 40 35 30

No. Ventiladores 10 9 8 8 7 7 6 5

a) Interprete los parámetros betas. b) Calcule r² e interpretar. c) Estimar el costo mensual para una planta que produce mensualmente 8.500 ventiladores. 4) ¿ Cual es el objetivo (uso) del análisis de regresión y el análisis de la correlación. 5) Los datos siguientes representan los pesos de Juan Prieto según la edad. Los valores de X denotan la edad en que se le tomó el peso y los valores de Y denotan los pesos EN kilos obtenidos por Juan:

X: AÑOS 10 15 17 22 25. Y: PESO: 50 54 56 58 59.

A. Estimar el peso de Juan Prieto cuando tenia 16 años. B. Interprete los BETAS. C. Calcule e interprete el coeficiente de determinación. 6),. La siguiente información es el total de micros producidos por 5 fabricas en el país con sus respectivos costos de producción:

COSTOS (en millones $)

2 3 4 3.8 3.5 3.4

TOTAL DE MICROS MENSUALES (en miles de unidades)

15 25 35 45 50 54

Estimar los costos de una empresa que produce 48.000 micros. Interprete los parámetros. 7) Cierto tecnólogo en sistemas quiere demostrar que los digitadores cometen mas errores a medida que aumenta el tiempo de trabajo. Selecciona aleatoriamente 6 digitadores y obtiene los siguientes resultados:

TIEMPO DE TRABAJO (en horas) 4 5 6 7 8 9 10 11 12 TOTAL DE ERRORES 5 7 9 12 14 16 16 18 20

Justifique la afirmación del tecnólogo, con base a un análisis de regresión y correlación.

20

8) Se quiere demostrar si existe alguna relación entre el tiempo necesario (segundos) para que un cliente espere en la bomba de gasolina y la cantidad de gasolina que compra (en galones). Seleccionaron aleatoriamente 10 vehículos y se obtuvo la siguiente información:

Tiempo 30 50 70 90 110 145 150

Cantidad 1 2 3 4 5 6 7

21

4. REGRESION Y CORRELACION LÌNEAL MULTIPLE. 4.1 INTRODUCCION Al realizar un análisis de regresión, cuando se consideran más de dos variables nos encontramos con un modelo de regresión lineal múltiple. El modelo general para K variables se define como:

Y = ß0 + ß1 X1 + ß2 X2 + ß3 X3 +...+ ßK XK Para determinar los parámetros betas, al considerar mas de tres variables se deben tener conocimientos de matrices y vectores. En este modulo se considera solamente un modelo lineal múltiple para tres variables. A continuación se describe el modelo con sus respectivas ecuaciones normales y el coeficiente de determinación:

MODELO: Y = ß0 + ß1 X1 + ß2 X2 INTERPRETACION DE LOS PARAMATROS BETAS

ß1 > 0. Por cada unidad que aumente la variable dependiente X1, entonces la variable dependiente Y aumenta en ß1, sí se mantiene constante ß2. ß1 < 0. Por cada unidad que disminuya (aumente) X1, entonces la variable dependiente Y aumenta (disminuye) en ß1, sí se mantiene constante X2. ß2 > 0. Por cada unidad que aumente la variable dependiente X2, entonces la variable dependiente Y aumenta en ß2, sí se mantiene constante X1. ß2 < 0. Por cada unidad que disminuya (aumente) X2, entonces la variable independiente Y aumenta (disminuye) en ß2, sí se mantiene constante X1.

ECUACIONES NORMALES:

n

i

n

i

n

iO

XXnY1

221

111

n

i

n

i

n

iO

n

i

XXXXYX1

2121

2

111

11

1

n

i

n

i

n

iO

n

i

XXXXYX1

2

221

2111

21

2

22

COEFICIENTE DE DETERMINACION MÚLTIPLE

N

i

n

i

YY

YY

SCT

SCEr

1

2

1

2

2

ˆ

Aplicación: La siguiente información son: los ingresos, gastos y ahorros mensuales de nueve jefe de hogar en el barrio los Cámbulos (en cientos de miles de pesos): INGRESOS 8.0 8.5 7.5 8.3 9.2 9.5 7.6 8.2 9.3 GASTOS 6.0 6.2 5.8 6.1 6.5 6.9 5.9 6.3 6.0 AHORROS 05 0.6 0.4 0.5 0.7 0.8 0.4 0.6 0.8 Con base a la información anterior estime los ahorros de un jefe de hogar del barrio los Cámbulos que tiene un ingreso mensual y un gasto mensual de $875.000 y $635.000 respectivamente. De acuerdo a la pregunta anterior se debe realizar un análisis de regresión y correlación lineal múltiple para el pronostico. El primer paso identifique las variables independientes y la dependiente. INGRESOS = X1 GASTOS = X2 AHORROS= Y Segundo paso: Determine los parámetros betas por medio de las ecuaciones normales para hallar el modelo: Y = ß0 + ß1 X1 + ß2 X2 ECUACIONES NORMALES:

n

i

n

i

n

iO

XXnY1

221

111

n

i

n

i

n

iO

n

i

XXXXYX1

2121

2

111

11

1

n

i

n

i

n

iO

n

i

XXXXYX1

2

221

2111

21

2

Los valores de la sumatorias se obtienen en la tabla 4.1.

23

Tabla 4.1. Calculo de sumatorias para determinar los betas ____________________________________________________

1X

2X Y YX

1 YX

2

2

1X

21XX

2

2X

____________________________________________________ 8.0 6.0 0.5 4.00 3.00 64.00 48.00 36.00 8.5 6.2 0.6 5.10 3.72 72.25 52.70 38.44 7.5 5.8 0.4 3.00 2.32 56.25 43.50 33.64 8.3 6.1 0.5 4.15 3.05 68.89 50.63 37.21

9.2 6.5 0.7 6.44 4.55 84.64 59.80 42.25 9.5 6.9 0.8 7.60 5.52 90.25 65.55 47.61 7.6 5.9 0.4 3.04 2.36 57.76 44.84 34.81 8.2 6.3 0.6 4.92 3.78 67.24 51.66 39.69 9.3 6.0 0.8 7.44 4.80 86.49 55.80 36.00 ____________________________________________________ 76.1 55.7 5.3 45.69 33.10 647.77 472.48 345.65

_____________________________________________________ Reemplazando las ecuaciones normales: 5.3 = 9 ßo + 76.1ß1 + 55.7ß2 (1) 45.69 = 76.1ßo + 647.77ß1 + 472.48ß2 (2) 33.1 = 55.7ßo + 472.48ß1 + 345.65 ß2 (3) Empleando el método de eliminación para solución de ecuaciones simultaneas que consiste en llevar de un sistema de 3 incógnitas a una ecuación con dos incógnitas y por último llevarlo a un sistema de una incógnita. A continuación se realiza los pasos: 5.3 = 9 ßo + 76.1ß1 + 55.7ß2 (1) 45.69 = 76.1ßo + 647.77ß1 + 472.48ß2 (2) 33.1 = 55.7ßo + 472.48ß1 + 345.65 ß2 (3) Para llevarlo a un sistema de dos incógnita a la ecuación (1) la multiplicamos por 76.1 y a la segunda ecuación se multiplica por -9, los resultados son: 403.33 = 684.9 ßo + 5791.21 ß1 + 4238.77 ß2 (1) -411.21 =-684.9 ßo - 5829.93 ß1 - 4252.32 ß2 (2) Sumando estas dos ecuaciones, aparece la ecuación 4: -7.88 = - 38.72ß1 - 13.55 ß2 (4) Ahora se coge la ecuación (1) y la (3) y se multiplica por 55.7 y -9 respectivamente: 295.21 = 501.3 ßo + 4238.77 ß1 + 3102.49 ß2 (1) -297.9 =-501.3 ßo - 4252.32 ß1 - 3110.85 ß2 (3)

24

Sumando estas dos ecuaciones, aparece la ecuación 5: -2.69 =-13.55 ß1 - 8.36 ß2 (5) Ahora igualamos las ecuaciones (4) y (5) para eliminar ß1, multiplicando por 13.55 y -38.72 respectivamente las ecuaciones: -106.77 = - 524.65ß1 - 183.60 ß2 (4) 104.15 = 524.65 ß1 + 323.69 ß2 (5) Sumando estas dos ecuaciones, aparece una ecuación con una incógnita: -262 = 140.09 ß2, entonces despejando ß2,, entonces ß2 = -0.02 Reemplazando ß2 en la ecuación (4) tenemos: -7.88 = - 38.72ß1 - 13.55 (-0.02) (4) Entonces: ß1 = 0.21 Remplazando en la ecuación (1) tenemos: 295.21 = 501.3 ßo + 4238.77 (0.21) + 3102.49 (-0.02), entonces: ßo = -0.98 El modelo parabólica de esta información es: Y = -0.98+ 0.21 X1 - 0.02 X2 Ahora se debe calcular el coeficiente de determinación múltiple:

N

i

n

i

YY

YY

SCT

SCEr

1

2

1

2

2

ˆ

Para calcular R² primero determino los Y estimados, reemplazando cada valor de

X1 y X2 en la ecuación, por ejemplo para la primera pareja X1 = 8.0 y X2 = 6.0 entonces: Y = -0.98+ 0.21 (8.0) - 0.02 (6.0)=0.52 Los demás valores se encuentran en la tabla 4.2.

Tabla 4.2. Calculo de sumatorias para Determine R² ____________________________________________________

1X

2X Y Y 2ˆ YY 2

YY

____________________________________________________ 8.0 6.0 0.5 0.52 0.0049 0.0081 8.5 6.2 0.6 0.60 0.0001 0.0001 7.5 5.8 0.4 0.41 0.0324 0.0361 8.3 6.1 0.5 0.56 0.0009 0.0081 9.2 6.5 0.7 0.73 0.0196 0.0121 9.5 6.9 0.8 0.79 0.0400 0.0441 7.6 5.9 0.4 0.43 0.0256 0.0361 8.2 6.3 0.6 0.54 0.0025 0.0001 9.3 6.0 0.8 0.76 0.0289 0.0441 ____________________________________________________

76.1 55.7 5.3 0.1549 0.1889 ____________________________________________________

Para calcular el numerador del coeficiente de determinación múltiple reemplazo a cada valor de Y estimado y le resta la media aritmética y la diferencia la elevo al cuadrado, por ejemplo para la el primer valor de la

tabla 4.2: 21ˆ YY = ( 0.52 - 0.59 )² = 0.0049 Donde: 59.0

9

3.51

n

YY

n

ii

De la misma forma se hace para el denominador y para el primer valor es:

25

2

1YY = ( 0.5 - 0.59 )² = 0.0081 Reemplazando las sumatorias de la tabla 4.2:

82.0

1889.0

1549.0ˆ

1

2

1

2

2

N

i

n

i

YY

YY

SCT

SCEr

Como el R² es bastante bueno, calcular el pronostico solicitado con los siguientes datos :

INGRESOS = 875.000 GASTOS = 635.000 AHORRO ESTIMADO= Y ?

Reemplazando en la ecuación : Y = -0.98+ 0.21 X1 - 0.02 X2 , entonces:

Y = -0.98+ 0.21 (8.75) - 0.02 (6.35) = 0.7305 Para un jefe de hogar que cuenta con ingreso mensual de $875.000 y unos gastos mensuales de $635.000, el ahorro mensual se estima ende $73.050. Nota: a la raíz cuadrada del coeficiente de determinación múltiple se denomina coeficiente de correlación

múltiple y se nota por R. Para el ejemplo anterior el R es: 9056.082.02 RR

4.2. LA MATRIZ DE CORRELACION En el análisis de correlación los programas estadísticos de las computadoras determinan la matriz de correlación en las cuales los elementos de las matrices son los coeficientes de correlación parciales para cada par de variables. Sí un modelo de regresión múltiple tiene 5 variables (incluyendo la dependiente) entonces la matriz de correlación (ver figura 4.1) tiene una matriz de (5*5). En la figura 4.1 el coeficiente de correlación r4.3 significa la correlación entre la variable 4 y la variable 3. Este coeficiente de correlación r4.3 es el mismo r3.4. La primera fila y la primera columna es la numeración de las variables analizadas. Por lo general la variable 1 es la variable dependiente y la demás las independientes. Esta matriz sirve como indicador para identificar VARIABLE 1 2 3 4 5 1 r1.1 r1.2 r1.3 r1.4 r1.5 2 r2.1 r2.2 r2.3 r2.4 r2.5 3 r3.1 r3.2 r3.3 r3.4 r3.5 4 r4.1 r4.2 r4.3 r4.4 r4.5 5 r5.1 r5.2 r5.3 r5.4 r5.5

Figura 4.1. Matriz de correlación. las posibles variables predictoras (independientes) para el modelo. Un ejemplo hipotético puede ser (Ver figura 4.2).

1 2 3 4 1 1 0.28 0.83 0.94 2 0.28 1 -0.25 0.32 3 0.83 -0.25 1 0.76 4 0.94 0.32 0.76 1

Figura 4.2. Matriz de correlación para un modelo de 4 variables.

26

El modelo para esta matriz de correlación es: Y = ß0 + ß1 X1 + ß2 X2 + ß3 X3 En la figura 4.2 la variable Y equivale a la variable 1, la variable independiente X1 es igual a la variable 2 en la matriz y así sucesivamente. En la figura 5, las posibles variable independientes predictora son las 3 y la 4. Entonces el modelo es: Y = ß0 + ß3 X3 + ß4 X4 ya que la variable X1 no se incluye en el modelo por tener un coeficiente de correlación bajo (r2.1). 4.3 MULTICOLÌNEALIDAD La multicolìneaidad aparece cuando hay una alta correlación entre dos variables independientes en un modelo de regresión lineal múltiple. Esta multicolìnealidad sugiere que las dos variables independientes son dependientes y no es posible distinguir que cantidad de efecto observado se debe a una de las variables de predicción. En la figura 4.3 se observa la multicolìnealidad entre la variable predictoras 3 y 4 ( r3.4 = 0.76 ) De acuerdo a la matriz de correlación y a la multicolìnealinidad se concluye que para seleccionar variables predictoras debe tener en cuenta: a) la variable predictora debe tener una alta correlación con la variable dependiente. 1 2 3 4 1 1 0.28 0.83 0.94 2 0.28 1 -0.25 0.32 3 0.83 -0.25 1 0.76 4 0.94 0.32 0.76 1

Figura 4.3. Matriz de correlación para un modelo de 4 variables.

b) Las variables independiente no debe estar altamente correlacionadas. De acuerdo a los dos criterios anteriores las variables independientes que se deben tener en cuenta para el modelo definitivo es X3, ya que X1 no se tiene en cuenta por tener una baja correlación con la variable dependiente Y (r2.1), y X4 por tener una alta correlación con X3. LABORATORIO 3. 1) En que consiste la multicolìnealidad. 2) ¿Cuál es la diferencia entre un coeficiente de determinación y uno de regresión?3) ¿ A que se debe que en una matriz de correlación, la diagonal principal debe ser 1? 3) La siguiente ecuación se obtuvo con el fin de estimar el ingreso mensual de los hogares del municipio de Yaconi. Y = 80 + 20X1 + 1.5X2 - 89X3 + 145,2X4 X1 = edad del jefe de hogar (años) X2 = Salario mensual del jefe del hogar (en miles de $) X3 = total de persona que conforman el hogar X4 = total de personas del hogar que trabajan Y = Ingreso total mensual del hogar (en miles de $). Interprete los betas 4) las notas definitivas de estadísticas obtenidas por 8 estudiantes de la Surcolombiana se supone que están relacionadas por las notas obtenidas en exámenes de español y el total de clases pérdidas en química (falta de asistencia) por el estudiante. A continuación se relaciona la información:

Nota de estadística 4.5 3.8 3.9 4.7 4.5 4.6 4.8 2.8 Nota de matemáticas 3.2 2.8 2.9 3.2 2.9 3.4 3.5 2.2

27

No. de clases perdidas 2 8 6 3 7 4 3 10 a) Determine la ecuación, evaluarla y analizar los betas. b) sí el error estándar de estimación es:

kn

YYS

xy

Donde : K es el numero de variables n: tamaño de la muestra

¿ Determine el error estándar de estimación. 5) Para estimar el peso final de un administrador (kg.) como función del peso inicial (kg.) que tenia al empezar la dieta y la cantidad de alimento consumido (en libras) en un período determinado. Se registraron los siguientes datos ________________________________________________________ Peso inicial 70 75 80 85 90 95 Peso final 67 72 75 79 84 75 Alimento consumido 20 19 18 24 19 15 _________________________________________________________ ¿ Determine la ecuación, evaluarla y analizar los betas. ¿Que puede concluir? 6) La siguiente información es el total de vehículos, los gastos en mantenimiento y el total de kilómetros recorridos anualmente en siete empresas del país: ___________________________________________________ Total de vehículos 4 6 8 10 12 13 15 16 Gastos anuales(en mill$) 1 2 3 4 5 6 7 8 Total de kilom. recorrido. (en miles de kilómetros) 2 4 6 8 9 10 11 12 __________________________________________________ a) Determine la ecuación, evaluarla y analizar los betas. b) Determine el error estándar de estimación. 7) La siguiente matriz es de correlación: La matriz de correlación, la variable dependiente es la variable 1. a) ¿ Cuales variables de predicción son buenas para el modelo? b) ¿ Existen problemas de multicolinealidad en este ejemplo? c) ¿ Qué variables deben incluirse en el modelo final? 1 2 3 4 5 6 7 1 1 0.83 0.44 -0.79 0.78 -0.90 0.88 2 0.83 1 0.32 -0.22 0.54 -0.33 0.28

3 0.44 0.32 1 0.04 0.88 0.53 0.32 4 -0.79 -0.22 0.04 1 0.03 0.35 0.28 0.28

5 0.78 0.54 0.88 0.03 1 0.87 0.11 6 -0.90 -0.33 0.53 0.35 0.87 1 0.16 7 0.88 0.28 0.32 0.28 0.11 0.16 1

28

UNIDAD II

5. SERIES CRONOLÓGICAS

INTRODUCCION Muchas empresas y organismos se ven enfrentados con el desafiante problema de pronosticar el nivel futuro de alguna actividad económica; predicciones de ventas, empleo, ingresos, población y muchos otros factores económicos que son elementos esenciales en la planificación de actividades futuras. ¿Como se hacen estas predicciones? Ellos deben basarse en hechos pasados y presentes. Estos hechos son representados habitualmente por medio de observaciones hechas en períodos consecutivos de tiempo. Este

conjunto de observaciones se denomina series cronológicas.

5.1 CONCEPTOS GENERALES Se entiende como serie cronólogica (tiempo) una colección de datos la cuál se clasifican a traves del tiempo. Algunos ejemplos son: - Total de empleados en la industria petrolera en Colombia durante el período 1970-2004 - Producto interno Bruto del pais 1975-2002. - Producción agropecuaria en el departamento del Huila 1980 - 2004. - Dinero en circulación de un país X, 1972-2003. - Producción mensual de arroz en el departamento del Huila 1987 - 2004. Las series cronológicas se representan de manera gráfica, por un figura de línea, donde los períodos se sitúan en el eje horizontal y los valores de la variable en el eje vertical (ver figura 5.1). Nota: Las observaciones en una serie cronológica pueden hacerse para diferentes períodos de tiempo; estas pueden ser; años, semstres, bimestre, meses, semanas, días.

29

V │

A │

R │

I │

A │

B │

L │

E │

─────┼────┬────┬────┬────┬────┬───┬────┬───┬──

│ AÑO, MES, TRIMESTRE

Figura 5.1. Representación gráfica de las series cromológicas.

5.2 NATURALEZA DE LAS VARIACIONES EN LAS SERIES CRONOLÓGICAS: Una serie cronológica es un conjunto de observaciones hechas en diversos períodos de tiempo. Las observaciones se representan por valores numéricos que frecuentemente varían de un período a otro y muchas veces es imposible visualizar sus diferentes componentes. Un aspecto básico del estudio de las series cronológicas es analizar la naturaleza de estas variaciones. El objetivo al analizar una serie cronológica es descomponer la serie para observar cada fuente de variación y así tener una mejor idea de las causas de las variaciones de la serie. También con la descomposición de la serie, facilita el proceso de la determinación de los pronósticos, ya que entendiendo los movimientos de la serie las estimaciones resultan más sencillas. Las variaciones de una serie cronológica se clasifican en sistematica y aleatorias. Las variaciones sistematicas ocurren con regularidad, pudiendo por lo tanto ser medidas estadísticamente y predecirse su ocurrencia futura; por otra parte las variaciones ALEATORIAS son causadas por sucesos aislados como guerras, huelgas, terremotos, etc.; en consecuencia no pueden ser predichas. Las variaciones sistemáticas se clasifican en: tendencia secular, variaciones cíclicas, variaciones estacionales y las variaciones irregulares . . Generalmente una serie cronológica se ve como el resultado de cuatro componentes: La tendencia secular (T), la variación estacional (E), las fluctuaciones cíclicas o movimientos cíclicos (C) y las variaciones irregulares (I). Al analizar las relaciones de estas componentes, puede formarse un modelo de una SERIE DE TIEMPO que ayudará a separar estas componentes y formular predicciones con respecto de Y. Los modelos de las SERIES DE TIEMPO usualmente son aditivos de la forma Y=T+E+C+I o multiplicativo de la forma Y=TxExCxI. donde: Y = valor real de la variable de interés T = tendencia secular E = variaciones estacionales

30

C = componente estacional I = componente irregular Para un modelo aditivo se supone que los cuatro componentes son independientes entre sí, mientras que para el multiplicativo se encuentran relacionadas entre sí. A continuación someramente se explican las componentes y más adelante se tratan profundamente componente por componente. TENDENCIA SECULAR: Es la componente a largo plazo (entre 20 a 100 años) de tiempo que representa el crecimiento o disminución de la serie a largo plazo. Las causas de esta tendencia son; crecimiento de la población, cambio de hábito, cambios tecnologicos, gusto de consumidores e inflación, etc.. La tendencia en una gráfica se visualiza mediante un crecimiento o descenso largo y suave ( Figura 5.2).

VARIACIONES ESTACIONALES. Cuando las observaciones en una serie cronológica son hechas en intervalos inferiores a un año (semanas, meses, trimestres). Ellos pueden mostrar variaciones estacionales que se repitan de la misma manera y con la misma regularidad año tras año. Por ejemplo sí analizamos mensualmente una serie de varios años , la componente estacional mide la variabilidad de la serie cada enero, cada febrero cada marzo, etc. La figura 5.3. Muestra el comportamiento de la cantidad mensual de sillas producidas por la empresa Ram en los años 2001 y 2002 (datos hipotéticos). Este es un ejemplo clásico de variacion estacional; mientras la producion de sillas ventas se mantienen a un mismo nivel de enero a marzo y mayo a septiembre, en los meses de abril y octubre la producción es alta debido a que esos meses la empresa se prepara para mantener una gran cantidad de inventario para las ventas en junio y diciembre donde hay mayor dinero circulante. VARIACIONES CÍCLICAS. Son también llamados ciclos. Indican los ascensos y descensos de las actividades, celebradas de un valor normal. Las flutuaciones cíclicas se observan como fluctuaciones alrededor de la tendencia (ver figura 5.4). Algunos economistas creen por ejemplo, que las actividades comerciales sufren cierto tipo de movimiento oscilatorio cada 12 a 15 años. Durante este período un ciclo completa cuatro fases: Prosperidad, Recesividad, Depresión y Recuperación (figura 4).

5.2.1. ANALISIS DE LA TENDENCIA SECULAR (T): La tendencia secular notada por T, describe el movimiento general de una serie cronológica durante un período relativamente largo. Los periodos son entre 10 y 30 en años. Este movimiento en general queda bien

31

descrito mediante una línea recta y en otros, queda descrito por alguna otra de cierto tipo característico de curva. La más importante de tipo curvilíneo es la curva exponencial (o del interés compuesto). Aquí planteamos la tendencia lineal y la exponencial.

Para determinar la tendencia existen varias técnicas. Se aplicaran dos métodos para analizar la tendencia: método de la regresión y el método de promedios móviles.

32

5.2.1.1. METODO DE REGRESION - MODELO LINEAL SIMPLE - Cuando se analizan los datos reales de una muestra en cierta variable y presentan la tendencia, se debe buscar el modelo más aproximado para estimar la tendencia. Como se sabe el modelo puede ser lineal, exponencial, cuadratico, etc. A continuación la formula para estimar una tendencia cuando el comportamiento es lineal: Y= ßo + ß1X donde Y= Es el valor de tendencia en el período T X= La medida en años, semestres, meses, etc. Por el método del mínimo cuadrado y despejando los valores para determinar los parametros ßo y ßi son:

221

))((

XXn

YXXYn

n

X

n

Y

1

0

APLICACION: Para el consumo de Bavaria (en decenas de millones) durante el período 1980-1987 de la tabla 5.1, determinar la tendencia si se presenta. Tabla 5.1. Consumo de Bavaria en el dpto del Huila . 1980-1987 ┌─────────────┬─────────────────────────────────────────────┐

│ AÑOS │ 80 81 82 83 84 85 86 87 │

│ │ │

├─────────────┼─────────────────────────────────────────────┤

│ CONSUMO │ │

│dece. millón │ 7.0 7.3 7.5 7.9 8.1 9.1 10.0 10.9 │

└─────────────┴─────────────────────────────────────────────┘

El primer paso para determinar si hay tendencia o no, es graficando las dos variables. Observando la figura 5.5, parece tener una tendencia lineal. El segundo paso es determinar los valores de ßo y ß1 para la ecuación Y= ßo + ß1X

221

))((

XXn

YXXYn

n

X

n

Y

1

0

33

Utilizando las formulas para los betas o la calculadora, los resultados son: sumatorias anteriores se obtienen en la tabla 5.2 o utilizando la calculadora. Determinadas las sumatorias reemplazamos en las formulas de ßo y ß1:

28X 1402X 2228X

8.67Y 2.260XY

545.0)28(140*8

28*8.672.260*821

57.68

28*545.0

8

8.670

La ecuación queda de la siguiente forma: Y= ßo + ß1X = 6.57 + 0.54 X r2 = 0.92

Grafico 5,5. Consumo de Bavaria en el dpto del

Huila. 1980-1987 (en decenas de millón)

0

2

4

6

8

10

12

80 81 82 83 84 85 86 87 88

Año

Co

ns

um

o

34

El siguiente paso es determinar la tendencia. ¿Cómo se determina?. Consiste en reemplazar la ecuación los

valores de X, para estimar Y (tabla 5.4). Tabla 5.3. Calculo de sumatorias para determinar los parámetros betas. _____________________________________________

AÑO X Y X² YX

_____________________________________________

80 0 7.0 0 0

81 1 7.3 1 7.3

82 2 7.5 4 15.0

83 3 7.9 9 23.7

84 4 8.1 16 32.4

85 5 9.1 25 45.5

86 6 10.0 36 60.0

87 7 10.9 49 76.3

28 67.8 140 260.2 _____________________________________________

Tabla 5.4. Valores estimados de Y. ┌─────────────────────────────────────────────────────────┐

│ │

│ Y= 7.0 7.3 7.5 7.9 8.1 9.1 10.0 10.9 │

│ │

│ │

│ Y = 6.57 7.11 7.66 8.20 8.75 9.29 9.84 10.38 │

└─────────────────────────────────────────────────────────┘

Ejercicio: Graficar los valores de X,Y, Y Si a los valores reales (Y) le restamos los valores de tendencia se obtendrá los valores destendenciados. A continuación se muestra la deducción:

Y= T+S+C+I , pero en series anuales no influye las VARIACIONES ESTACIONALES, entonces el modelo es: Y-T= C+I. Esta fórmula no da un número que denota los efectos combinados de los componentes cíclicos e irregulares y se presentan a continuación (tabla 5.5)

Tabla 5.5. Valores destendenciados

AÑO 80 81 82 83 84 85 86 87

CONSUMO Y 7.0 7.3 7.5 7.9 8.1 9.1 10.0 10.9

TENDENCIA

TY ˆ

6.57 7.11 7.66 8.20 8.75 9.29 9.84 10.38

5.3 METODO DE PROMEDIO MÓVIL Es un método sencillo y directo, carece de interés técnico y teórico. No es muy aceptable, porque presenta las siguientes desventajas:

35

Pierde información en los extremos. No tiene soporte matemático y por lo tanto, no es capaz de proyectar la información.

PASOS: Para obtener un PROMEDIO MÓVIL de tres años se deben seguir los siguientes pasos: a. Calcular los totales móviles de tres años. El procesos es sumar los tres primeros valores del los tres primeros años (7.0+7.3+7.5) y el resultado (21.8) centrarlo en el segundo año. Este es el primer total móvil

de tres años. Luego se abandona el valor del primer año y se suma el valor del cuarto año (7.3+7.5+7.9) para formar el segundo total móvil de tres años y este valor (22.7) se centra en el tercer año. El cálculo se continúa hasta el final de la serie (ver tabla 5.6, columna tercera). b. Calcular los PROMEDIOS MÓVILES de tres años, dividiendo cada uno de los totales de tres años, entre tres (ver tabla 5.6). Tabla 5.6. Calculo de promedio móvil de tres años para el Consumo de Bavaria 1980-1987

AÑO CONSUMO TOTAL MÓVIL PROMEDIO MÓVIL

1980 7.0

1981 7.3 21.8 7.3

1982 7.5 22.7 7.6

1983 7.9 23.5 7.8

1984 8.1 25.1 8.4

1985 9.1 27.2 9.1

1986 10.0 30.0 10.0

1987 10.9

5.4 VARIACIONES ESTACIONALES (S) Se presentan regularmente dentro de un año y se repite año tras año. El figura 8, puede visualizar la VARIACION ESTACIONAL. La causa de la presencia de esta variación son las estaciones, época festiva (junio-diciembre). Estas variaciones se presentan en series donde el tiempo puede ser: meses, bimestres, trimestres,etc . Las VARIACIONES ESTACIONALES se pueden aislar en una serie con el fin de poder ver la composición de las series sin presencia de las VARIACIONES ESTACIONALES. También sirve para proyectar racionalmente para cada estación. Al eliminar las VARIACIONES ESTACIONALES, se obtienen los índices estacionales que son indicadores de la componente estacional. Existen varios métodos para obtener los índices estacionales: Método de los promedios simples. Cociente con respecto a promedios móviles. Método de razón con respecto a la tendencia. De los tres métodos enunciados anteriormente se aplicará el último método.

5.4.1. Método de razón con respecto a la tendencia Para determinar los índices estacionales (IE) se deben seguir los siguientes pasos: a. Determine la ecuación de tendencia anual para los totales anuales de los años analizados. b. Cambie de base anual a base mensual. c. Determinar el valor de tendencia mensual para cada mes de la serie. d. Dividir los valores reales de cada mes por el respectivo valor de tendencia. e. Determine la razón promedio de cada mes.

36

f. Calcule el índice estacional. Ejercicio: Determine las VARIACIONES ESTACIONALES a los datos de la tabla 5.7. Tabla 5.7. Consumo de cerveza Poker en el Huila. 1986- 1988

(en decenas de miles de botellas )

Mes 1986 1987 1988

Enero 60.3 72.3 61.3

Febrero 62.4 48.4 63.4

Marzo 68.1 61.8 69.1

Abril 70.6 66.9 71.6

Mayo 70.1 75.4 76.1

Junio 84.3 85.7 99.2

Julio 69.5 71.5 60.5

Agosto 66.2 67.1 70.7

Septiembre 75.4 78.5 74.9

Octubre 76.8 86.2 78.7

Noviembre 75.4 77.4 80.4

Diciembre 115.2 116 102.5

TOTAL 1986 = 894.3 1987 = 907.2 1988 = 908.5

Pasos a seguir: a. Determine la ecuación de tendencia anual. El consumo anual de cerveza Porker es:

AÑO CONSUMO 1986 894.3

1987 907.2

1988 908.5

La ecuación a determinar es: Y= ßo + ß1X. Utilizando la calculadora: Y= 896.23 + 7.1 X r²=0.81 b. Cambiar la ecuación a base mensual cuyo origen es enero de 1986. Para determinar la ecuación mensual es:

Figura 5,6 Consumo de cerveza. 1986 - 1989

0

50

100

150

200

250

300

350

400

Enero febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre

Co

nsu

mo

1988

1987

1986

37

14412

1

OY Origen 1986 junio-julio X= 1 mes Y= consumo mensual

144

1.7

12

23.896Y XY 05.069.74 Origen 1986 junio 15-julio 15 X= 1 mes

Y= consumo mensual Pero debemos llevar el origen a enero:

42.74)2

15(05.069.74

O

Y

Entonces la ecuación mensual es:

Y= 74.42 + 0.05X Origen: enero de 1986 X= Unidad 1 mes. Y= Consumo mensual. c. Determinar el valor de TENDENCIA MENSUAL: Para determinar el valor de TENDENCIA MENSUAL se utiliza la ecuación _________________ Y= 74.42 + 0.05X Origen: enero de 1986 _________________ X= Unidad de X 1 mes. Y= Consumo mensual. Reemplazando el valor de X en la ecuación anterior, entonces los resultados se encuentran n la tabla 5.8. Tabla 5.8. Consumo de cerveza Poker en el Huila. 1986- 1988

Valores de tendencia

Mes 1986 1987 1988

Enero 74.42 75.02 75.62

Febrero 74.47 75.07 75.67

Marzo 74.52 75.12 75.72

Abril 74.57 75.17 75.77

Mayo 74.62 75.22 75.82

Junio 74.67 75.27 75.87

Julio 74.72 75.32 75.92

Agosto 74.77 75.37 75.97

Septiembre 74.82 75.42 76.02

Octubre 74.87 75.47 76.07

Noviembre 74.92 75.52 76.12

Diciembre 74.97 75.57 76.17

d. Dividir los valores reales de cada mes por el respectivo valor de tendencia, es decir Y/(T). Los resultados estan en la tabla 5.9. Ejemplo: Para enero de 1986 es: Y enero 60.3 ENERO= -------------- = ------------ = 0.81 ( T)enero 74.42

38

Tabla 5.9. Participación de la tendencia

Mes 1986 1987 1988

Enero 0.81 0.96 0.81

febrero 0.84 0.64 0.84

Marzo 0.91 0.82 0.91

Abril 0.95 0.89 0.94

Mayo 0.94 1.00 1.00

Junio 1.13 1.14 1.31

Julio 0.93 0.95 0.80

Agosto 0.89 0.89 0.93

Septiembre 1.01 1.04 0.99

Octubre 1.03 1.14 1.03

Noviembre 1.01 1.02 1.06

Diciembre 1.54 1.54 1.35

e. Determine la razón promedio mensual: Las VARIACIONES ALEATORIAS de la serie se eliminan promediando las tres razones de cada mes. Así para el mes de enero, la media aritmética se calcula sumando los meses de enero de cada año y dividendo por tres ( tabla 5.10, columna 2): R enero= 0.81 + 0.96 + 0.81 = 2.58 = 0.86 3 3 Tabla 5.10. Razón promedio e índice estacional

Mes Razón promedio Indice estacional %

Enero 0.86 86.14

febrero 0.77 77.13

Marzo 0.88 88.15

Abril 0.93 93.16

Mayo 0.98 98.16

Junio 1.19 119.20

Julio 0.89 89.15

Agosto 0.90 90.15

Septiembre 1.01 101.17

Octubre 1.07 107.18

Noviembre 1.03 103.17

Diciembre 1.47 147.25

Total 11.98 1200.00

Si bien la razón media son medidas satisfactorias las VARIACIONES ESTACIONALES (columna 3, tabla 5.10), no cumple el requisito, que la sumatoria de todos los meses debe ser igual a 12. Para ajustarlo se distribuye el faltante proporcionalmente. Cómo?. Se 12 por el total de la columna de razón media y luego se multiplíca esta constante por cada una de las razones medias multiplicada por 100. Como resultado aparece el índice estacional para cada mes (columna 3, tabla 5.10). Indice para el mes i= Constante * razón media del mes i * 100. Donde:

39

12 Constante = ------------------------------ = 1,001669449 Total de razón medias Ejemplo: calculo del índice estacional de enero: 12 Constante= --------- = 1,001669449 11.98 Indice para el mes de enero= Constante * razón media de enero * 100 Indice para el mes de enero = (1,001669449) * 0.86 * 100 = 86.14% Interpretación del índice estacional: Como cada índice es un porcentaje , con el promedio del año igual a 100% ; esto es, cada índice mensual indica el nivel de ventas, producción u otra variable en relación con el promedio anual de 100.0 . Con base a lo anterior el índice del mes de enero (86.14%) de la tabla 5.10 se interpreta de la siguiente forma: El consumo de cerveza Poker en el mes de enero esta por lo general 3,86% abajo del promedio de consumo del año en el Huila.

Para el índice del mes de junio se afirma ; que el consumo de cerveza para el mes de junio esta en un 19.20% arriba del promedio del consumo anual de cerveza Poker en el Huila. 5.5 USO DE LOS INDICES ESTACIONALES Los I.E. se utilizan para estimar las variables para cualquier mes especifico. Para estimar el consumo de cerveza Poker para marzo de 1989 se siguen los siguientes pasos: a. Determine el valor de la tendencia para el mes específico. b. Multiplique el valor de tendencia (y) para el mes específico por el correspondiente índice estacional del mes (ajuste por estacionalidad). Para nuestro ejemplo, se aplicaran los dos pasos: a. Valor de tendencia para el mes de marzo de 1989 es :

Figura 5,8. Indice estacional para el consumo de

cerveza Poker en el Huila

0,00

50,00

100,00

150,00

200,00

Ene

ro

febr

ero

Mar

zoAbr

il

May

o

Junio

Julio

Ago

sto

Sep

tiem

bre

Octub

re

Nov

iem

bre

Diciem

bre

Ind

ice

40

aplicando la ecuación: Y= 74.42 + 0.05X Origen: enero de 1986 X= Unidad de X 1 mes. Y= Consumo mensual. ^ Y = 74.42 + 0.05(38) = 76.32 b. El consumo de cerveza Poker para marzo de 1989 es: Tendencia * índice estacional = 76.32 * 0.8815 = 67,27608 Entonces se pronostica que el consumo de cerveza Poker para el mes de marzo de 1989 es de 672761 botellas . EJERCICIOS: Estimar, utilizando los datos de la siguiente tabla la venta anual automóviles para el mes de octubre de 2006 ( tabla 5.11). Tabla 5.11.Ventas mensuales, en miles de millones de dólares ┌───────────┬─────────┬────────┬─────────────────────────────┐

│ MES │ 1998 │ 1999 │ 2000 2001 2002 │

├───────────┼─────────┼────────┼────────┬─────────┬──────────┤

│ ENERO │ 2.7 │ 2.8 │ 2.9 │ 3.0 │ 3.1 │

│ │ │ │ │ │ │

│ FEBRERO │ 2.6 │ 2.7 │ 2.8 │ 2.5 │ 2.9 │

│ │ │ │ │ │ │

│ MARZO │ 3.2 │ 3.3 │ 3.4 │ 3.5 │ 3.6 │

│ │ │ │ │ │ │

│ ABRIL │ 3.3 │ 3.4 │ 3.5 │ 3.6 │ 3.7 │

│ │ │ │ │ │ │

│ MAYO │ 3.2 │ 3.3 │ 3.5 │ 3.6 │ 3.7 │

│ │ │ │ │ │ │

│ JUNIO │ 4.0 │ 4.1 │ 4.2 │ 4.3 │ 4.4 │

│ │ │ │ │ │ │

│ JULIO │ 2.7 │ 2.8 │ 2.8 │ 2.9 │ 2.9 │

│ │ │ │ │ │ │

│ AGOSTO │ 2.5 │ 2.4 │ 2.5 │ 2.6 │ 2.7 │

│ │ │ │ │ │ │

│SEPTIEMBRE │ 3.2 │ 3.3 │ 3.2 │ 3.5 │ 3.7 │

│ │ │ │ │ │ │

│ OCTUBRE │ 3.0 │ 3.1 │ 3.2 │ 3.3 │ 3.4 │

│ │ │ │ │ │ │

│NOVIEMBRE │ 3.0 │ 3.2 │ 3.3 │ 3.4 │ 3.5 │

│ │ │ │ │ │ │

│DICIEMBRE │ 4.1 │ 4.2 │ 4.3 │ 4.4 │ 4.5 │

└───────────┴─────────┴────────┴────────┴─────────┴──────────┘

5.6 MOVIMIENTOS CICLICOS E IRREGULARES Las fluctuaciones cíclicas son también llamadas ciclos, e indican los ascensos y descensos de las actividades alrededor de un valor normal. La duración de cada ciclo es no fijo, y relativamente corto (duración de varios

41

años). Comúnmente estas variaciones no se pueden apartar de las de naturaleza irregular, por lo que se analizaran juntas. Con los datos de la tabla 5.12 y su respectiva figura 5.9. se observa una fluctuación cíclica. Los movimientos irregulares (I) son aquellos movimientos diferentes a los vistos anteriormente y son causados por fenómenos naturales (accidentes) tales como: terremotos, erupciones de volcanes, guerras, sequías, etc.

Tabla 5.12. Ventas anuales de una Cía. en millones de pesos para el período 1975-1989

Año 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89

Ventas 7 6 2 4 8 16 13 14 17 20 23 19 25 28 32.5

Las fluctuaciones cíclicas (C) fluctúan desigualmente y no es fácil de controlar, es por esto importante. Las fluctuaciones cíclicas pueden ser medidas en datos anuales o en datos clasificados en unidades de tiempo menores de un año.

Grafico 5,9.Ventas anuales de una Cia (en mill $) 1975-1989

0

5

10

15

20

25

30

35

75 77 79 81 83 85 87 89 91

Año

Ven

tas

Las variaciones estacionales y los movimientos irregulares se eliminan cuando la serie es clasificada en años. El modelo multiplicativo Y= T*S*C*I queda de la forma Y= T*C. 5.6.1 MEDICION DE LOS MOVIMIENTOS CICLICOS EN SERIES ANUALES Como se dijo anteriormente los movimientos irregulares y las variaciones estacionales no influyen en series anuales, entonces el modelo multiplicativo es de la forma Y= TC . Despejando a C, queda de la siguiente forma: C= Y/T . Es decir, son medidas por la razones de Y con respecto a T. Estas razones son llamadas "Datos Ajustados por Tendencia Secular". Como ejercicio se toma los datos de la tabla 26 y se calcula las fluctuaciones cíclicas. Como la serie es anual, no influyen las variaciones estacionales y las irregulares. La ecuación Y= TC ,

entonces

T

YC .Averiguado la tendencia por el método de regresión y es:

Y = 2.07 + 1.94 X R² = 0.8998 Donde: Y=Ventas en millones de $ Unidad de X = 1 año origen 1.975

42

Los valores de YT ˆ son mostrados en la tabla 5.13.Después de determinar la tendencia se calcula la razón Y/T, los cuales esta en la tabla 26. Tabla 5.13. Ventas anuales de una Cía. en millones de pesos para el período 1975-1989

Año 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89

Ventas 7 6 2 4 8 16 13 14 17 20 23 19 25 28 32.5

La ecuación de tendencia es: Y= 2.07+1.94X r² = 0.8998 Origen 1975 Y= millones de $ X= 1 año

Nota:

T

YC significan el % con respecto a la tendencia. En el figura 5.10 muestra la tendencia y las

fluctuaciones cíclicas. Tabla 5.14 calculo de la tendencia y las variaciones cíclicas

Año 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89

Ventas 7 6 2 4 8 16 13 14 17 20 23 19 25 28 32.5

Tendencia 2.07 4.01 5.95 7.88 9.82 11.76 13.7 15.63 17.57 19.51 21.45 23.38 25.32 27.26 29.20

C 3.38 1.50 0.34 0.51 0.81 1.36 0.95 0.90 0.97 1.03 1.07 0.81 0.98 1.03 0.03

Para determinar que significa la C, se observa que C = Y/T . Si al C lo multiplicamos por 100 da un porcentaje que se denomina el índice cíclico. Este índice cíclico es la posición de cada valor de Y relativo a la recta de tendencia. De acuerdo a lo anterior para las ventas de 1980 el índice cíclico es de 136 % (se obtiene al multiplicar por 100 el C). Esta posición significa que para 1980 el valor de Y (ventas) era el 136% de la recta de tendencia. Para 1986 el índice fue de 23.28% e indica que para las ventas de 1986 fue del 23.28% de la recta de tendencia. En otras palabras se puede interpretar que las ventas para 1980 aumentaron en un 36% (136% - 100) de lo que se esperaba según la estimación de la tendencia y para 1986 disminuyo en un 76.72% (100% - 23.28%) de lo que se esperaba según la estimación de la tendencia.

Grafico 5,10. Ventas anuales de una Cia (en mill $) 1975-1989

0

5

10

15

20

25

30

35

75 77 79 81 83 85 87 89 91

Año

Ve

nta

s

43

43

Ejercicios 1).La siguiente información son el total de bicicletas (decenas de miles) de la empresa VELOZ durante el período 1986-2005.

Año 86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04 05

Ventas 4 5 7 8 9 10 9 8 7 6.5 6 5 6 7 8 9 10 9.8 9 8

Determine las fluctuaciones CÍCLICAS e interprete algunas de ellas.

2) Los inventarios mensuales (en cientos de miles) de cuadernos de la fabrica de papeles Blanquillo durante en año

1999 al 2002 están a continuación.

Mes 1999 2000 2001 2002

Enero 200 205 207 210

Febrero 100 101 103 106

Marzo 99 100 101 102

Abril 98 100 99 100

Mayo 250 252 254 258

Junio 101 102 104 106

Julio 99 100 99 102

Agosto 98 99 97 96

Septiembre 97 98 96 94

Octubre 251 252 254 258

Noviembre 100 101 102 104

Diciembre 99 100 99 101

Estime el inventario de cuadernos de la empresa Blanquillo para el mes de septiembre del 2007

3) El total de empleados de la empresa Rical para el periodo 1991 a 2002 están a continuación.

Año No. de empleados

1991 250

1992 248

1993 245

1994 240

1995 235

1996 225

1997 220

1998 210

1999 205

2000 204

2001 202

2002 200

44

44

Estime el total de empleados para el año 2005, utilizando el método de regresión. b) El método de pomedio móviles.

4) La zapatería La Mejor fundada en 1990, presenta la producción anual ( en miles de pares de zapatos):

Año 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04

Producción 1.0 1.5 1.7 1.8 2.0 2.2 2.5 2.9 3.4 3.8 4.2 4.9 6.0 7.0 7.9

a) Estime la producción para el año 2007 utilizando el método de regresión. b) Estime la producción para el año

2008 utilizando el método de promedios móviles. 5). El total de empleados de la multinacional COMPUTY durante el periodo 1998 a 2004 estan a continuación:

Año 1998 1999 2000 2001 2002 2003 2004

Empleados 55 115 300 1000 1800 1995 3250

Por el método de regresión estime el total de empleados para esta empresa en el año 2008. 6) Para el problema 4 determine las variaciones cíclicas por el método de los residuos. 7) Las ventas por estaciones del almacen Rey estan a continuación:

Año Primavera Verano Otoño Invierno

2001 77 105 76 130

2002 74 109 73 129

2003 82 104 81 127

2004 86 103 85 123

a).Estime las ventas para otoño del 2006 por el método de razón con respecto a la tendencia. B) Estime las ventas para el invierno otoño del 2007 por el método de promedios móviles. 8) la constructora El Edificador cuenta con los datos trimestrales del total de viviendas construidas en los últimos seis años.

Año Primer trimestre Segundo trimestre Tercer trimestre Cuarto Trimestre

1999 10 18 5 25

2000 11 19 4 26

2001 12 20 5 27

2002 12 20 4 26

2003 13 21 5 25

2004 14 21 5 27

Estime el total de viviendas que construiría en el tercer trimestre de2008.

45

45

VI. NÚMEROS ÍNDICES (N.I.) Un número índice es una cifra relativa con una base igual al 100% o un múltiplo de 100%, tales como 10 y 100. Se usa para mostrar las variaciones que sufre una variable a través del tiempo con respecto a un valor de la misma, denominada base, la cual es tomada como punto de referencia.

Para determinar el período base, se darán algunos criterios para su selección:

La base de un N.I. debe corresponder a un período normal. Se entiende como período normal, época en que

no hayan ocurrido acontecimientos extraordinarios (sequías, huelgas, cambios muy grandes en los precios o superproducción).

Elegir como base el promedio de todo el período. Elegir como base el promedio de cierto número de años. En índices ponderados, la base corresponde al año en que se empezó a construir. En una serie corta, el período base corresponderá al primer año de la serie.

De acuerdo a la composición de los índices estos pueden ser simples o compuestos.

6.1 NUMERO ÍNDICES SIMPLES El número índice es simple cuando es construido para un producto o artículo individual. Para determinar un número índice simples de precio, cantidad o de valor se divide el valor del período en estudio por el valor, precio o cantidad del período fijo (Base), multiplicando luego por 100. La fórmula general es:

100*0

0X

XI TT

Donde: XT: cantidad, precio o valor del periodo t Xo: cantidad, precio o valor del período base.

TI 0 : índice de un artículo período T, con base en el período cero (Base).

Las fórmulas para precios, cantidad y de valor:

100*0

0p

pp TT 100*

0

0q

qq TT 100*

00

0qq

qpV TTT

Ejemplo : El precio del kilo de queso en cierto departamento para 1981 fue de $ 209 y en 1985 fue de $ 409. Calcular el índice de precios para 1985 con respecto a 1981

%69.195100*209

409100*

81

8585

81 p

pp

INTERPRETACIÓN: El precio de kilo de queso para el departamento aumentó en un 95.69% en 1985 con respecto al año de 1981.

46

46

Los índices simples pueden ser de base fija o de base variable.

6.1.1. NÚMEROS ÍNDICES DE BASE FIJA Son índices que se calculan a una serie cronológica, tomando como base un período fijo.

100*0

0X

XI TT

6.1.2. NÚMEROS ÍNDICES SIMPLES DE BASE VARIABLE Se obtienen dividiendo el precio, la cantidad o el valor de un artículo en una serie en el período t, por el precio, la cantidad o el valor del artículo en el período t - 1.

100*1

1

T

TT

TX

XI

Ejemplo: Para la tabla 6.1 determine los índices de base fija y de base variable.

Para calcular el índice de base fija para el año 1990 es: %100100*156

156100*

90

9090

90 p

pp

Para calcular el índice de base fija para el año de 1991 es: %97.133100*156

209100*

90

9191

90 p

pp

Tabla 6.1. Precio de la libra de papa en el departamento del Roció 1990 - 1996 __________________________________________________________________ Año Precio Base fija=1990 Base variable

$ Indice % Indice % ____________________________________________________________________ 1990 156 100.00 - 1991 209 133.97 133.97 1992 271 129.67 129.66 1993 294 140.66 108.49 1994 339 162.20 115.31 1995 409 195.70 120.65 1996 480 229.66 117.35

__________________________________________________________________ INTERPRETACIÓN: El precio de la libra de papa el departamento del Rocío aumentó en un 33.97% en 1991 con respecto al año 1990. 4 Para calcular de precio de la libra de papa para 1990 con respecto a 1989 (índice base variable) es:

?100*..

156100*

89

9090

89 conocesenop

pp

47

47

Para calcular el índice de precio de la libra de papa para 1994 con respecto a 1993 (índice base variable) es:

%31.115100*294

339100*

93

9494

93 p

pp

INTERPRETACIÓN: El precio de la libra de papa en el departamento del Rocío aumentó en un 15.31% en el año de 1994 con respecto al año de 1993.

6.2 NUMERO ÍNDICES COMPUESTO (PARA UN GRUPO DE ARTÍCULOS) Los números índices compuestos se usan para mostrar colectivamente los cambios de los productos relativos de los precios, cantidades o valores de varios artículos. Existen muchos índices compuestos y se pueden construir de diferentes maneras. Nos dedicaremos a analizar los siguientes:

Índices simples de agregados Índices de promedio simple de relativos Índices de agregados ponderados

Índice de promedios ponderados relativos 6.2.1 ÍNDICES SIMPLES DE AGREGADOS Consiste en comparar los totales de los precios del período en estudio con el total de los precios de los artículos del

período base. Para el cálculo de este índice primero agregamos los diversos precios o cantidades para cada unidad

de tiempo para determinar la suma total del período base y de estudio. A continuación se divide el total de cada

período dado por el total del período base, multiplicado por 100. La fórmula es:

100*0

0P

PP tt

100*

0

0

Q

QQ tt

Ejemplo: Suponga que una empresa manufacturera produce tres tipos de bienes A, B,C. El precio se define como el precio de venta media anual y la producción se refiere a la producción anual (en miles). La empresa desea medir los cambios en sus precios de ventas y en el volumen físico de la producción año en año. Los datos se presentan a continuación. Tabla 6.2. Precio y producción de tres artículos 1996-1998 ________________________________________________________________________________ Artículo Unidad Precio $ Cantidad 1996 1997 1998 1996 1997 1998 ________________________________________________________________________________ A Onza 1.00 1.25 1.50 10000 12500 13000 B Tonelada 10.00 11.75 13.50 1000 1100 1250 C Libra 4.00 5.00 4.50 500 500 400 ________________________________________________________________________________ 15.00 18.00 19.50 11500 14100 14650

________________________________________________________________________________ Para calcular el índice de precio simple agregado para 1997 con respecto a 1996 es:

48

48

%120100*15

18100*

96

9797

96

P

PP

Ejercicio propuesto .Calcule los siguientes índices simple agregado 88

86P ,

88

86Q

El índice de precio o cantidad simple agregativo no se usa comúnmente. Se construye bajo el supuesto de que cada artículo es igualmente importante. Además tiene la desventaja que un bien con un precio alto domina el índice.

6.2.2 NUMERO ÍNDICES DEL PROMEDIO SIMPLE DE RELATIVOS Como su nombre lo indica, consiste en promediar precios o cantidades relativas. Las formulas están a continuación:

100*0

0n

P

P

P

t

t

100*0

0n

Q

Q

Q

t

t

Para calcular el índice de precios se siguen los siguientes pasos: a) Obtener los precios relativos. Consiste en dividir el precio de cada artículo en su período t, por el precio del período base ( Po ). b) Sumar los relativos del año y el total dividirlo por el número de artículos. Ejemplo : Calcular el índice de precio del promedio simple de relativos para el año 1998. Tomar como base 1996, de la tabla 6.2. Tabla 63. Calculo de índices del promedio simple de relativos

Artículo P98/P96

A 1.5

B 1.35

C 1.125

3.975

%5.1323

975.3100*96

98

98

96

n

P

P

P

Significa que los precios de las ventas anuales han aumentado en promedio del 32.5% en la empresa manufacturera en el período 1998 con respecto al año 1996. Este índice tiene la ventaja de que no está influido por las unidades en que se cotizan los precios o por el nivel absoluto de los precios individuales. El mismo criterio para las cantidades. El índice de promedio simple de relativo tiene la desventaja de que todos los relativos tienen igual importancia. Ejercicio: Calcular e interpretar los índices de promedio simple de cantidad del año 1997 con respecto al año 1996. Lo mismo para el de precios.

49

49

6.2.3 ÍNDICES DE AGREGADOS PONDERADOS Consiste en darle un peso mayor a un artículo más que a otros (Ponderación); se utilizan para mostrar colectivamente los cambios relativos en los precios o cantidades. Los índices utilizados en Colombia son de esta clase. Si deseo saber el aumento o disminución de los precios año tras año que influye en el costo de la vida, no debemos analizar un solo artículo, ya que nosotros, gastamos más dinero en alimentación que en transporte. Este es el criterio que utiliza el Departamento Administrativo Nacional de Estadística - DANE - para construir el ÍNDICE DE PRECIO AL CONSUMIDOR - I.P.C. -. A continuación se presentan algunos índices.

ÍNDICE DE LASPEYRES

El índice de precios de LASPEYRES se obtiene cuando se utiliza como ponderaciones las cantidades consumidas del período base. Se define como la relación entre los precios promedio ponderados por las cantidades del período base.

100*00

00

QP

QPL t

tP

100*

00

00

QP

QPL t

tQ

Ejemplo: Suponga que el señor Luis Alberto Rojas desea construir el número índice de LASPEYRES (precios) para tres artículos de alimentación de 1999 usando los artículos de 1997 como base. El precio promedio por unidad y las cantidades mensuales consumidas están en la tabla 6.4. Tabla 6.4. Cantidad y precio de tres artículos para alimentación el señor Luis Alberto Rojas __________________________________________________________________ Articulo Cantidad Precio Uni- Precio Uni- Cantidad Mensual 1987 tario 1987 tario 1989 Mensual 1989 ___________________________________________________________________ HUEVO 30 Unidades $ 30 Unidad $ 45 Unidad 30 Unidades LECHE 20 Litros $ 85 Litro $ 100 Litro 22 Litros CARNE 22 Libras $500 Libra $ 600 Libra 20 Libras _____________________________________________________________________

%69.121100*13600

16550100*

9797

97999997

QP

QPL

P

(ver calculo tabla 6.5)

INTERPRETACIÓN: Los precios de los tres alimentos del señor Luis Alberto Rojas aumentaron en un 21.69 % de 1999 con respecto a los precios de 1997, si se mantiene las misma cantidades consumidas del año 1997. Tabla 6.5. Calculo de las sumatorias para los índices de Laspeyres, Pashee y Fisher. ________________________________________________________________________________ ARTICULO p99q97 p97q97 p99q99 p97q99 ________________________________________________________________________________ Huevo 1350 900 1350 900 Leche 2000 1700 2200 1870 Carne 13200 11000 12000 10000 __________________________________________________________________________________ 16550 13600 15550 12770

__________________________________________________________________________________

50

50

Ejercicio: Determinar el índice de cantidad de Laspeyres para 1999 con respecto a 1997 utilizando la información de la tabla 6.4.

ÍNDICE DE PAASCHE Se obtiene para precios cuando se utiliza como ponderaciones las cantidades del período en estudio. Para cantidad se obtiene cuando se utiliza como ponderaciones los precios del periodo en estudio. Las formulas son:

100*0

0

t

tttP

QP

QPP

100*

0

0

QP

QPQ

t

tttP

Se define como la relación entre los que se gastaría actualmente y lo que se hubiera gastado en el período base, para mantener el nivel material actual. Ejemplo: Determinar el índice de precios de Paasche para el año 1999 con respecto al año 1997, utilizando la información de la tabla 4

%77.12112770

15550100*

9997

99999997

QP

QPP

P

Ejemplo : Determinar el índice de cantidad de Paasche para el año 1999 con respecto al año 1997, utilizando la información de la tabla 4

ÍNDICE IDEAL DE FISHER (F) Se define como el promedio geométrico de los índices de Laspeyres y Paasche. Las formulas para los índices de precio y de cantidad están a continuación.

tPtPtP

PLF 000 *

tQtQtQ

PLF 000 *

El índice de Fisher de precios para 1999 con respecto a los precios de 1997 de la tabla 4 es:

%73.12169.121*77.121*9997

9997

9997

PPP

PLF

INTERPRETACIÓN: Los precios de los tres alimentos del señor Luis Alberto Rojas aumentaron en un 21.69 % de 1999 con respecto a los precios de 1997, si se mantiene las misma cantidades consumidas del año 1999.

51

51

Ejercicio. Calcule el índice de Ficher de cantidad para 1999 con respecto a las cantidades de 1997 con la información de la tabla 4.

2.4. USOS DEl ÍNDICE DE PRECIOS AL CONSUMIDOR (IPC) El Departamento Administrativo nacional de Estadística Dane, es el encargado de elaborar en Colombia el

Índice del Precios al consumidor. Esta dependencia publica mensualmente el IPC en el Boletín Estadístico y

contiene en una de sus páginas el IPC a nivel nacional, a nivel de ingresos medios y a nivel de ingresos

bajos. Además se encuentran discriminados por sectores de: alimentos, vivienda, vestuario y calzado (tabla

6). Esto Índices se encuentra por meses y por años. Las variaciones son anuales, mensuales y año

transcurrido. A continuación se interpretan algunos de ellos.

ÍNDICE A NIVEL NACIONAL. ÍNDICE PARA ENERO DE 1997= 588.31%. Significa que el costo de vida o los precios aumentaron un 488.31% entre diciembre 1988 y enero de 1997. ÍNDICE MENSUAL MES DE MARZO DE 1997=1.55%. El costo de vida para el mes de abril fue de 1.55%. ÍNDICE AÑO TRANSCURRIDO, MES DE ABRIL = 8.18%. El costo de vida o los precios aumentaron entre enero de 1977 y abril el 8.18%. ÍNDICE DOCE MESES, MES DE FEBRERO DE 1997 = 19.58%. Los precios aumentaron entre el mes de febrero de 1996 y el mes de febrero de 1997 en un 19.58%. Además de medir las variaciones de los precios de los artículos en la canasta familiar del colombiano (aumento del costo de vida) este índice tienen otras aplicaciones. El IPC sirve para deflacionar las ventas, u otras series, para determinar el salario real, para determinar el poder de compra y otras aplicaciones. A continuación se muestran algunas aplicaciones.

2.4.1 Deflactación: Tal vez el uso más importante de los índices en el análisis económico es para deflactar. La deflactación consiste en eliminar la influencia de precios, es decir, expresar cifras nominales (valores corrientes de cada año) a precios constantes. También se utiliza para deflacionar las ventas, para conocer el poder de compra y para establecer los incrementos en el costo de vida. En términos económicos la deflactación consiste en convertir los valores nominales o corrientes de dichas cifras o valores monetarios de igual poder adquisitivo. El uso de la deflactación se utiliza para comparar como ha sido el crecimiento de los salarios con respecto al costo de vida. Por ejemplo, aunque los ingresos de las personas puedan estar creciendo teóricamente durante cierto número de años, sus ingresos reales pueden en verdad estar disminuyendo debido al aumento de costo de de vida.

Determinación del Salario Real:

IPC

NOMINALSALARIOSR

. Donde SR= Salario Real IPC= Índice de precios al consumidor

52

52

Ejemplo: El señor Yesit Cano es un empleado de la Caja Armal, está interesado en analizar su sueldo desde el inicio de labores hasta el mes de enero de 1996. Cuando inició sus labores con la empresa en el mes de enero de 1996 el salario mensual fue de 1000 dólares. Para febrero de 2001, el salario mensual fue de 2000 dólares. Además, se tiene que el IPC para los mismos meses y años fueron 203.5 y 1360.0 Para determinar si ha prosperado su sueldo mensual, se determinará el Salario Real para 1996. Si el Salario Real es superior a lo que ganaba en 1996, significa que ha mejorado su situación económica ya que estamos llevando el salario de 2001 a precios de 1996. Para determinar el Salario Real determinamos el aumento del IPC entre 1996 a 2001 tomando como base el IPC del 1996.

68.65.203

1360

96

0101

96 IPC

IPCIPC

Ahora llevamos el salario nominal del 2001 a salarios de enero de 1996.

4.29968.6

2000SR

Que significa 299.4 dólares? Significa que el señor Yesit Cano tiene un salario mensual de 2000 dólares en 2001, el cuál equivale a precios de 1996 a 299.4 dólares. Concluye que la situación económica del señor Yesit ha empeorado.

Índice de Poder Adquisitivo actual del $1 (IPA):

IPCIPA

100

Nota: también se relaciona con el poder adquisitivo del dólar. Ejemplo: Suponga que para el mes de marzo de 1993, el IPC de un país fue de 137.0. El período base del IPC fue enero de 1992, sí calculamos IPA para este mes es:

73.0137

100100

IPCIPA

0.73 indica que en marzo de 1993 el poder adquisitivo era de 0.73. Esto significa que un dólar tenía un valor

de sólo 73 centavos en término de su poder de compra relativo al periodo base (enero de 1992).

Índice de Poder adquisitivo del Dinero (PC):

El IPC también se utiliza para determinar el poder adquisitivo del dinero.

100*1$

IPCPC

Ejemplo: Si el IPC para un 1995 en un país es 223.5 (base 1975) entonces el índice del poder adquisitivo

del peso es : ctvPC .45.0100*5.223

1

53

53

Significa que el Poder Adquisitivo del peso en ese año es de 80 centavos comparado con el período base. Es decir que el poder adquisitivo del dinero se redujo casi a la mitad. O se puede decir que en 1999 el valor del peso es 45 centavos en término de pesos de 1975

Porcentaje de Desvalorización (%D):

)1(100% 0

II

ID

Porcentaje de Alza de tipo de Cambio (%ALZA)

)1(100%0

I

TALZA I

Donde Ti= Tipo de cambio del período de estudio To= Tipo de cambio del período base

Porcentaje de Devaluación (%DEV)

)1(100% 0

II

TDEV

EJERCICIOS 1. Para la siguiente tabla calcular (base 1995) el índice de precios agregados y el de cantidades. _______________________________________________________________________________ PRECIO UNITARIO $ CANTIDAD ______________________________________________________ ARTICULO UNIDAD 1995 2001 1995 2001 _____________________________________________________________________________ A LIBRA 0.50 0.65 4500 400 B TONELADA 50 52 50 65 C GALON 1.50 2 1250 1500 D YARDA 4 5.50 400 350 E ONZA 0.25 0.15 80000 120000 ________________________________________________________________________________ 2. A los siguientes salarios nominales calcular e interpretar a. Los salarios reales para cada año tomando como base 1982. b. El poder adquisitivo con base 1978.

54

54

_________________________________________________________________ AÑO SALARIO NOMINAL INDICE (1978=100) _________________________________________________________________ 1982 23.200 320 1983 23.550 325 1984 28.600 328 1985 33.800 350 1986 44.000 360 __________________________________________________________________ 3. El índice de precio al consumidor de Febrero de 1987 fue de 801.5 determinar el poder adquisitivo para ese mes con respecto al período base del índice. Interpretar. 4. Suponga que tiene una fábrica y quiere determinar el índice de empleo y el índice de mano de obra para el período 1998-2001. Para ello cuenta con la siguiente información: Para enero de 1998 pagó un total de $2'500.000 a 10 empleados en nómina. En diciembre de 2001 pagó $4'200.000 a 18 empleados en nómina. Interpretar los índices. 5. Deflactar la siguiente serie cronológica de las cantidades pagadas por cierta compañía a beneficiario de seguros duran e el período 1984-1988 tomando como deflactor el índice de costo de vida. ________________________________________________________ AÑO 1984 1985 1986 1987 1988 __________________________________________________________ CANTIDAD (MILL) 420 550 630 720 860 _________________________________________________________ IPC 1978= 100 302 331 362 391 418 _________________________________________________________ 6. Si usted ingresó a una empresa en 1981 con un sueldo de 740 dólares. Cuánto debería estar ganando en Febrero de 1991, de tal manera que su poder adquisitivo no se hubiera deteriorado. Ayuda: IPC81= 482.5 IPC91=1214.2 7) La librería El Matemático se creo en 1998. Un cuadro resumen sobre el total de libros vendidos están a continuación:

Año 1999 2000 2001 2002 2003 2004

Total de libros

25550 28355 29320 24210 29311 21322

a)..El propietario de la librería esta interesado en determinar como han variado sus ventas en comparación al año de creación. b) En que año existió se incremento mayor las ventas con respecto al año anterior, ¿ porqué? 8) Los precios y las cantidades vendidas de cuatro productos de la ferretería El Encanto en el periodo 2000-2004 estan a continuación:

Producto Unidad Precio (Dólares) Cantidad

2000 2001 2002 2003 2004 2000 2001 2002 2003 2004

Martillo Docena 1 1.25 1.30 1.24 1.50 1000 1500 1250 1300 1320

Cal Arroba 3 4 5 5 4 350 380 375 285 350

Cemento Bulto 15 18 14 13 10 4500 4550 5500 5545 6575

Puntillas Libra 0.25 0.35 0.4 0.45 0.58 2222 3222 3245 4554 4589

Calcule e interprete el indice: a) de precio simple agregado para 2004 con respecto a 2000 b) de promedio simple de relativos para el año 2004. Tomar como base 2000 c) de precio de Laspeyres para 2004 con respecto a 2000 d) de precio de Paasche para 2004 con respecto a 2000 e) de precio de Ficher para 2004 con respecto a 2000 f) de cantidad simple agregado para 2004 con respecto a 2000 g) de promedio simple

55

55

de relativos para el año 2004. Tomar como base 2000 h) de cantidad de Laspeyres para 2004 con respecto a 2000 i) de cantidad de Paasche para 2004 con respecto a 2000 j) de cantidad de Ficher para 2004 con respecto a 2001 k) Calcule e interprete el indice: l) de precio simple agregado para 2003 con respecto a 2001 m) de promedio simple de relativos para el año 2003. Tomar como base 2001 c) de precio de Laspeyres para 2003 con respecto a 2001 n) de precio de Paasche para 2003 con respecto a 2001. o) de precio de Ficher para 2003 con respecto a 2001 p) de cantidad simple agregado para 2003 con respecto a 2001 q) de promedio simple de relativos para el año 2003. Tomar como base 2001 r) de cantidad de Laspeyres para 2003 con respecto a 2001. s) de cantidad de Paasche para 2003 con respecto a 2001 t) de cantidad de Ficher para 2003 con respecto a 2001.

56

56

VII. PROBABILIDAD 7.1 CONCEPTOS GENERALES En los temas anteriores se centro en la estadística descriptiva la cuál se explicaron las técnicas para organizar, resumir y analizar información. Ahora se pasa a la segunda fase de la estadística que es el cálculo de la probabilidad de que algo ocurrirá. La teoría de la probabilidad proporciona la base para la inferencia estadística. Esta teoría tiene sus raices en los juegos del azar, cuando lanzamos una moneda o estamos en un juego de cartas, no es posible predecir de antemano el resultado (cara, sello, as de corazón, trébol, etc.). Esta imposibilidad de predicción constituye la aleatoriedad, el elemento que caracteriza la falta de certeza. Por otra parte, existe entre los diversos resultados de los juegos al azar una simetría recíproca que nos hace considerar todos éstos resultados como equivalentes desde el punto de vista del juego (para un jugador es igualmente favorable arriesgar su apuesta a uno de los resultados posibles). El capítulo trata éste tipo de fenómenos y se formulan modelos matemáticos que sirven para investigar en forma bastante precisa, los fenómenos. 7.1.1.EXPERIMENTO ALEATORIO No existe una definición bastante simple para esta clase de experimento, pero con algunos ejemplos ilustraremos el concepto: Ejemplo 1: Lanzar una moneda dos veces y contar el número total de sellos obtenidos. Ejemplo 2: Lanzar un dado y observar el número que aparece en la cara superior. Ejemplo 3: Fabrican bombillas, luego prueban su duración en un portalámparas y anotar el tiempo transcurrido en horas hasta que se quema. Ejemplo 4: Se fabrica fusibles en un período de tiempo determinado y seleccionar un fusible y observar si es defectuoso. Los experimentos anteriores tienen en común las siguientes propiedades:

Cada experimento tiene varios resultados posibles que pueden especificarse (tabla 7.1.).

La incertidumbre de cada experimento . Para el experimento 4 no estamos seguros si el fusible seleccionado sea defectuoso o no; al lanzar el dado no sabemos si caerá el número 1,2,.....6.

El experimento se puede repetir indefinidamente sin cambiar las condiciones.

Si el experimento se repite un gran número de veces aparece un modelo definido de regularidad.

Esta regularidad permite la construcción del modelo matemático; por ejemplo si lanzamos una moneda varias veces la proporción de caras será aproximadamente igual a la de sellos.

57

57

Tabla No. 7.1. Resultados posibles de los experimentos E1....E4. __________________________________________________ Experimento Resultados posibles (E) (S) __________________________________________________ Ejemplo No.1 (cc,cs,sc,ss) Ejemplo No.2 (1,2,3,4,5,6) Ejemplo No.3 (T/T<0) Donde T= tiempo de duración Ejemplo No.4 Defectuoso o no defectuoso _________________________________________________________________

7.1.2 Espacio muestral Es el conjunto de todos los resultados posibles de un experimento aleatorio lo designa como S ( tabla 6). 7.1.3 Suceso o evento Es un subconjunto de los resultados posibles del experimento aleatorio; por ejemplo algunos sucesos de los experimentos notados de la tabla 6 son: A1= [ que ocurran dos caras ] , entonces A1= [ cc ] A2= Un número impar ocurre esto es A2= [1,3,5].

7.1.4 Operaciones de sucesos

Si A y B son suceso, AUB es el suceso que ocurre si A y solo si A o B (o ambos) ocurren.

Si a y B son sucesos A B es el suceso que ocurre si y solo si A y B ocurren.

Si A es un suceso, A’ es suceso que ocurre si y solo si A no ocurren

Si A1,A2...An, es cualquier colección infinita numerable de sucesos entonces U Ai es el suceso que

ocurre si y solo todos los sucesos Ai ocurren.

Si A1 A2......An... es cualquier colección infinita numerable de sucesos, entonces n

i

Ai1

es el

suceso que ocurre si y sólo si al menos uno de los sucesos de Ai ocurren. Esta operación se puede

generalizar hasta infinito

Si A1 A2......An... es cualquier colección infinita numerable de sucesos, entonces n

i

Ai1

es el

suceso que ocurre si y sólo si todos los sucesos ocurren. Esta operación se puede generalizar hasta

58

58

infinito

7.1.5 Definición de probabilidad Existen varias definiciones de probabilidad. La mas sencilla es la siguiente:" La probabilidad de que se presente determinado suceso (A) es igual al cociente del número de casos que son favorables a este suceso, por el número total de casos posibles (S) con tal de que todos estos casos sean mutuamente simétricos".

posiblescasosdeTotal

AeventoalfavorablesCasosAP

...

....)(

Ejemplo. Se lanza un dado, ¿cuál es la probabilidad de obtener un seis? Solución. Definir el siguiente suceso: A={ salga un seis } El espacio muestral para el experimento es: [1,2,3,4,5,6] .Aplicando definición de probabilidad:

167.06

1

...

....)(

posiblescasosdeTotal

AeventoalfavorablesCasosAP

7.1.5.1. PROPIEDADES DE LA PROBABILIDAD

a) Sea E un experimento aleatorio y S un espacio muestral. Si A es un suceso asociado a S, entonces 0 P (A) 1Significa que cuando se calcule cualquier probabilidad ésta

se encuentra en el intervalo cerrado (0 y 1). b) P(S) = 1. Significa que la probabilidad de que salga el espacio muestral es igual a la unidad. c) Si A y B son sucesos mutuamente excluyente (A B = 0 ) entonces: P(AUB) = P(A) + P(B)

d) Si A1 A2......An... son sucesos mutuamentes excluyentes entonces

n

i

n

i

AiPAiP11

)()( = 1

Ejemplo En un poker extraer una carta. Cuál es la probabilidad de que salga un as o un rey? Solución: Definimos los sucesos A = as R=rey Los dos sucesos son mutuamente excluyentes porque una carta al mismo tiempo no puede ser as y rey.Para obtener la probabilidad de que salga un as o un rey, se aplica la propiedad "c"de la probabilidad: P ( A U R ) = P (A) + P (R) = _4_ + 4 = 8 = 0.154 52 52 52

59

59

Ejemplo: Lanzar un dado no cargado, cuál es la probabilidad de que salga un número par o un número impar? Solución: Definir los siguientes sucesos: I = Impar = [1,3,5] M = Par = [2,4,6] Los dos sucesos son mutuamente excluyentes aplicando la propiedad número 3 de la probabilidad:

P ( I U M ) = P(I) + P(M) = 3 + 3 = 1

6 6 Hay que notar el suceso ( I U M ) es equivalente al espacio muestral. Teorema 7.1. Si es el conjunto vacío, entonces P() = 0

TEOREMA 7.2. Si A’ es el suceso complementario de A, entonces P(A’)= 1 - P(A) Teorema 7.3. Si A y B son dos sucesos cualesquiera entonces: P(AUB) = P(A) + P(B) - P(A B)

Ejemplo: Un ingeniero entra a una librería. La probabilidad de que compre un libro de matemáticas es 0.60, la probabilidad de que compre un libro de ingeniería es 0.5 y la probabilidad de que compre un libro de matemáticas e ingeniería es 0.40. Cuál es la probabilidad de que compre un libro de matemáticas o de Ingeniería o ambos? Solución. Sean los sucesos: M = El Ingeniero compra un libro de matemáticas. E = El Ingeniero compra un libro de Ingeniería.

Aplicando el teorema 7.3. P(MUE) = P(M) + P(E) - P(M E) P(MUE) = 0.6 + 0.5 - 0.4 = 0.7

Ejemplo: Suponga que la distribución de los empleados de la empresa petrolera Petra está clasificados por sexo y dependencia donde labora ( tabla 7.2). Tabla 7.2. Clasificación de los empleados por sexo y dependencia. Empresa Petra.2005 __________________________________________________________________ (D) (T) (A) Sexo Producción Mantenimiento Administración Total __________________________________________________________________ (V) Varones 20 10 10 40

(M) Mujeres 30 20 10 60

Total 50 30 20 100 __________________________________________________________________ Hay que elegir un empleado para enviarlo a EE. UU. Cuál es la probabilidad de que sea:a) un varón? b) una mujer y que trabaje en mantenimiento. c) No trabaje en producción 40 Solución: P(V) = ----- = 0.4 100

60

60

b) P(M T) = 20.0100

20)( TMP

c) P(no trabaje en producción) D=trabaje en producción

D´= no trabaje en producción 5.0100

501)(1)( ' DPDP

EJERCICIOS

1) Un reparador de televisores ha mezclado accidentalmente 3 tubos malos con 20 buenos. Sí no puede determinar por examen visual que tubo es bueno: A) cual es la probabilidad de que seleccione un tubo bueno. b) cual es la probabilidad de que seleccione un tubo malo. 2) Se efectúa una encuesta entre 56 empleados de una planta acerca de la conveniencia de la afiliación del sindicato. Los resultados de la encuesta se encuentran a continuación: _________________________________________________________________ CAPATACES TRABAJ. FIJOS TRABAJ. TEPORALES CONVENIENCIA __________________________________________________________________ A FAVOR DE AFILIACION 1 25 4 CONTRA LA AFILIACION 3 10 6 SIN OPINION 1 4 2 _________________________________________________________________ Si seleccionamos un trabajador aleatoriamente, ¿ cual es la probabilidad de que: a) se oponga a la afiliación. b) sea un trabajador fijo. c) sea un trabajador temporal sin opinión. d) Este a favor o sin opinión. e) Este a favor de la afiliación o sea temporal. d) Que haya opinado. e) que sea capataz y este en contra de la afiliación. f) NO sea un trabajador temporal. 3) Julio baja dos papayas biches y las envuelve en papel periódico, luego las guarda en un canasto. Despues de una semana observa el estado de las papayas. Describa el espacio muestral del estado de las papayas.

4) En una empresa textil existen los siguientes empleados que se encuentran clasificados por el color de la piel y el partido político que milita. Sí se selecciona un empleado al azar, cuál es la probabilidad de que sea: a) blanco b) liberal o tenga el color de la piel blanca. c) liberal y amarillo d) conservador y sea negro e) negro o blanco f) no sea liberal f) sea liberal. ___________________________________________________ PARTIDO COLOR DE LA PIEL NEGRO BLANCO AMARILLO _____________________________________________________ LIBERAL 10 25 15 CONSERVADOR 20 30 18 OTROS 19 26 32 _________________________________________________________

61

61

5) Un artículo proveniente de una área de producción son señalado como defectuosos (d) o no defectuosos

(N), los artículos son observados y anotada su condición. Este análisis continua hasta que sean elaborados consecutivamente 2 defectuoso o hayan sido inspeccionados 4 artículos (cualquier situación que se presente primero). Describa el espacio muestral para este experimento. 6) De 100 personas que presentaron solicitud para un puesto de contador en una empresa grande el año pasado 40 tenían alguna experiencia de trabajo y 30 tenían un certificado profesional. Sin embargo, 20 de los solicitantes tenían tanto experiencia de trabajo como certificado y por ello están incluidos en ambos conteos. Cuál es la probabilidad de que un solicitante elegido al azar 7) Cuando un Ingeniero efectúa una llamada telefónica es posible que obtenga la comunicación inmediatamente o por el contrario tenga que esperar. Describa el espacio muestral. 8) Un dado es balanceado de tal forma que la probabilidad de cada una de sus caras sea proporcional al número de puntos de dicha de cara. Cual es la probabilidad de obtener un número impar en un lanzamiento. 9). En cierta universidad el 39% de los estudiantes tiene el cabello rubio, el 19% tiene los ojos azules y el 4.5% tiene los ojos azules y el cabello rubio. Selecciona una persona al azar. Halle la probabilidad de que: a)Tenga el cabello rubio o los ojos azul? b) Tenga solo el cabello rubio pero no los ojos azul? 10). El 35% de los contadores públicos ven el programa Informe Financiero, el 42% ven el programa Defalcos mundiales y el 10% ven ambos programas. Selecciona un contador público al azar,halle la probabilidad de que:a)¿Presencie programa Informe Financiero o el programa Defalcos mundiales? b)No presencie ninguno de los dos programas?

7.1.2 EVENTOS DEPENDIENTE E INDEPENDIENTES 7.2.1 EVENTOS DEPENDIENTE Dos o mas eventos son dependiente cuando un evento afecta el resultado del siguiente evento. Ejemplo; la selección de dos artículos de un lote de producción, utilizando la selección sin reemplazamiento (sin sustitución). 7.2.1.1. PROBABILIDAD CONDICIONAL La probabilidad condicional de un evento B dado que el evento A sucedió es igual a la probabilidad de A B

,dividida entre la probabilidad de A siempre que la probabilidad de B no sea cero.

A

BAPABP

)()/(

Para toda P(B) 0

Ejemplo: Suponga que entre los empleados de la empresa Petra (tabla 7.2) se elige un empleado de sexo femenino, cuál es la probabilidad de que el empleado trabaje en mantenimiento. Solución: Aplicando el teorema 2.1.4 P( M T ) (20/100) 20

P[M / T] = --------------- = ------------- = -----= =0.667 P ( T ) (30/100) 30 PARTICION: los sucesos B1, B2 , B3, ...... BK, representan una partición del espacio muestral S. a) Bi Bj = 0 para todo i diferente de j.

62

62

b) U Bi = S c) P( Bi ) 0 para todo i.

Figura 1. Partición Sea B1, B2 , B3, ...... BK, sucesos representan una partición del espacio muestral S, y A un evento cualesquiera asociado a S (ver figura 1). Entonces A= AB1 + A B2 + AB3, + .....+A BK

Como AB1, ............ ABK son mutuamente excluyentes entonces:

P(A)= P(AB1 )+ P(A B2 )+P( AB3, )+ .....+P(A BK)

Por definición de probabilidad condicional: P(A)= P(A/B1 ) P(B1) + P(A/B2 ) P(B2) P(A/ B2 )+ P(A/B3 ) P(B3) + .....+P(A/Bk ) P(Bk) A la anterior formula se denomina probabilidad total. Ejemplo: Para el puesto de presidente de la asociación de contadores públicos han sido nominados tres ingenieros de diferentes universidades. La probabilidad de que elijan al contador público de UCC es de 0.6 ; la probabilidad de que sea elegido un contador público de la USCO es de 0.25 y la probabilidad de que sea elegido uno de la CORHUILA es de 0.15. Sí se elige al de la UCC la probabilidad de que aumente la cuota de afiliación es de 0.85. Si eligen al de la USCO la probabilidad de que aumente la cuota de afiliación es de 0.5 y si eligen al de la CORHUILA la probabilidad de que aumente la cuota de afiliación es de 0.2. ¿ Cuál es la probabilidad de que haya un aumento en la cuota de afiliación en la asociación de contadores públicos?. Solución.: La pregunta P(de que haya un aumento en la cuota de afiliación en la asociación de ingenieros industriales). Sea los eventos: A= aumento en la cuota de afiliación B1 = se elige al ing. de la UCC B2 = se elige al contador público de la USCO B3 = se elige al contador público de la CORHUILA

B1

B2

B3 Bk

63

63

P(A) = ? Como A esta conformado con la partición de Bi entonces aplicando la formula de probabilidad total: P(A)= P(A/B1 ) P(B1) + P(A/B2 ) P(B2) P(A B2 )+ P(A/B3 ) P(B3)

Donde: P( B1 )= 0.6 P( B2 ) = 0.25 P( B3 )= 0.15 P(A/B1 ) = 0.85 P(A/B2 )= 0.5 P(A/B3 )= 0.2 . Entonces P(A)= P(A/B1 ) P(B1) + P(A/B2 ) P(B2) + P(A/B3 ) P(B3) P(A) = 0.85*0.6 + 0.5*0.25 + 0.2*0.15 = 0.665 Algunas veces se debe determinar un probabilidad condicional como función del la partición por ejemplo en la elección al candidato de la asociación, si se preguntara si se aumento la cuota de afiliación cual es la probabilidad de que se haya elegido al contador público de la USCO. P(B2/A ) = ?. Cuando sucede este caso se debe utilizar el teorema de Bayes. Teorema de Bayes. Sea B1, B2 , B3, ...... BK, sucesos representan una partición del espacio muestral S, y A un evento cualesquiera asociado a S, entonces:

)()/(....)3

()3

/()2

()2

/()1

()1

/(

)()/(

)/(

KBP

KBAPBPBAPBPBAPBPBAP

iBP

iBAP

Ai

BP

Ejemplo: Para el ejercicio anterior si se aumento la cuota de afiliación cual es la probabilidad de que se haya elegido al contador público de la USCO. Solución. P( aumento la cuota de afiliación, cual es la probabilidad de que se haya elegido al contador público de la USCO). Sea: A= aumento en la cuota de afiliación B1 = se elige al contador público de la UCC B2 = se elige al contador público de la USCO B3 = se elige al contador público de la CORHUILA P(B2/A ) = ? Aplicando el teorema de Bayes:

64

64

)()/(....)3

()3

/()2

()2

/()1

()1

/(

)()/(

)/(

KBP

KBAPBPBAPBPBAPBPBAP

iBP

iBAP

Ai

BP

Siendo i = 2. Entonces

)3

()3

/()2

()2

/()1

()1

/(

)2

()2

/(

)/2

(BPBAPBPBAPBPBAP

BPBAP

ABP

Donde: P( B1 )= 0.6 P( B2 ) = 0.25 P( B3 )= 0.15 P(A/B1 ) = 0.85 P(A/B2 )= 0.5 P(A/B3 )= 0.2 . Entonces 0.5 * 0.25 0.125 P(B2 / A) = ______________________________=___________= 0.188 0.85 * 0.6 + 0.5 * 0.25 + 0.2 * 0.15 0.665 7.2.2. EVENTOS INDEPENDIENTES Definición: Dos o más eventos son independientes, si el resultado de los eventos en ningún modo se afecta uno de otro. La probabilidad de que ambos eventos independientes A y B ocurrán es: P(AB) = P(A) P(B)

Ejemplo: Cuál es la probabilidad de obtener dos caras si se lanza sucesivamente dos veces una moneda? Solución: C1 = Obtener cara en el primer lanzamiento. C2 = Obtener cara en el segundo lanzamiento. Los anteriores sucesos son independientes es decir si se obtiene una cara en el primer lanzamiento no va a influir en el resultado del segundo lanzamiento. Aplicando la fórmula de independencia:

25.04

1

2

1*

2

1)2()1()21( CPCPCCP

7.3. TECNICAS DE CONTEO Esta técnicas son útiles cuando los espacios muestrales son grandes y se necesita contar el número de eventos que satisfacen algunas condiciones. El primer concepto a definir es el factorial. FACTORIAL: Dado un entero positivo n, el producto de todos los números enteros de n hasta 1 se llama factorial de n y se escribe n! y la formula general es:

n! = n(n-1)(n-2)(n-3)..........1

65

65

Ejercicio: Calcular 7! Aplicando la formula anterior : 7! = 7*6*5*4*3*2*1 = 5040 Por definición 0! = 1 Otra propiedad de n! es:

n! = n(n-1)! = n(n-1)(n-2)! =.......... Por ejemplo: 6! = 6*5*4! PERMUTACION : una permutación es un arreglo ordenado de objetos. Designemos por n el número objetos diferentes de los cuales se va a obtener un arreglo ordenado y por r el número de objetos en el arreglo. El número de permutaciones de n objetos tomados r a la vez, se nota como nPr y se define como:

)!(

!Pr

rn

nn

Ejemplo: La junta directiva de la asociación de contadores públicos va a ser elegida. Los cargos son: presidente, secretario y tesorero. Hay de seis candidatos para ocupar los cargos. Cuántos grupos diferentes se puede formar para ocupar los cargos?. Solución: como los cargos son tres y hay disponibles seis candidatos entonces me interesa el orden. Por ejemplo si los candidatos son : Roberto, Ana, Pablo, Cecilia, Carlos y José, entonces un grupo puede ser: Presidente secretario tesorero Presidente secretario tesorero Ana Pablo Carlos Pablo Ana Carlos GRUPO I GRUPO II Observe que el grupo uno es diferente al grupo dos aunque sean los mismo candidatos pero no ocupan el mismo orden. Significa que si me interesa el orden. Como interesa el orden debo calcular una permutación :

)!(

!Pr

rn

nn

Donde: n = 6 r =3, entonces:

120!3

1*2*3*4*5*6

!36

!6

)!(Pr

rn

nn Hay 120 grupos o arreglos diferentes

COMBINACIONES : una combinación es un arreglo de objetos diferentes sin tener en cuenta el orden. El número de combinaciones de n objetos tomados r a la vez se escribe nCr y se define como:

)!(!

!

rnr

nCrn

Ejemplo: Suponga que hay 12 personas para formar un comité de tres personas para hablar con el director

66

66

de Hocol. ¿ Cuántos comité diferentes se pueden formar? Solución: como un comité formado por ejemplo por Juán, Pablo y Sofía. Ellos van hablar con el director. Si invierto el orden por ejemplo, Pablo, Sofia y Juán, entonces es el mismo comité ya que cumple la misma función. Entonces no interesa el orden. En nuestro caso n = 12 y r =3:

220

!3123

!12

)!(!

!

rnr

nCrn

EJERCICIO

1) Sí para el problema 2 de la página 5 seleccionan un capataz, cual es la probabilidad de que este encontrar de la afiliación. 2) Sí para el problema 2 de la página 5 seleccionamos un empleado que no dio su opinión, cual es la probabilidad de que el sea un trabajador fijo. 3) Dos divisiones de productos distintos de una empresa grande son productos marinos y equipos de oficina. Se estima que la probabilidad de que productos marinos tengan un margen de utilidad de cuando menos 10% en este año fiscal es de 0.30, la probabilidad de que la división de equipo de oficina tengan un margen de utilidad de cuando menos el 10% es de 0.20 y la probabilidad de que ambas divisiones tengan un margen de utilidad de cuando menos del 10% es 0.06. a) Determine la probabilidad de que la división de equipos de oficina tengan un margen de utilidad de cuando menos 10%, dado que la división de productos marinos alcanza ese criterio de utilidad. 4) Se estima que la probabilidad de que aumente las ventas de automóviles en el siguiente mes es de 0.40. Se estima que la probabilidad de que aumenten las ventas de refacciones es de o.50. Se estima que la probabilidad de que ambas industrias experimenten un aumento en las ventas es de 0.10. ¿ Cuál es la probabilidad de que (a) hayan aumentado las ventas de automóviles durante el mes, dado que existe información de que han aumentado las ventas de refacciones, (b) hayan aumentado las ventas de refacciones, dado que existe información de que aumentaron las ventas de automóviles durante el mes?. 5) La junta directiva de la compañía JR consta de 15 miembros, ¿ de cuantas formas se puede elegir presidente, vicepresidente y secretario? 6) Un club tiene 10 miembros. ¿ De cuantas formas se puede elegir una junta directiva de 4 miembros 7) A los habitantes de una gran ciudad se le hizo una encuesta con el propósito de determinar el número de lectores del TIEMPO. Los resultados son los siguientes: 20% de los habitantes lee el TIEMPO, el 16% leen el ESPECTADOR, y un 1% leen ambos periódicos. Si se selecciona al azar a un lector del TIEMPO, cual es la probabilidad de que también lea el ESPECTADOR. b) Si se selecciona al azar a un lector del espectador cual es la probabilidad de que también lea el TIEMPO. 5) En un día lluvioso la probabilidad de que Pedro llegue tarde a clase es de 0.8, mientras que en un día de sol, la probabilidad de que llegue tarde es solo 0.1, y la probabilidad de que llegue tarde cualquier día (lluvioso-sol) es de 0.3. (a) Cual es la probabilidad de que Pedro llegue tarde si esta haciendo sol o este lloviendo. 6) Una profesor ha estado enseñado la asignatura calculo por muchos años. Sabe que el 75% de los estudiantes hacen la tarea determino que de los estudiantes que hacen la tarea el 85% aprobarán el curso. De aquellos estudiantes que no realizan la tarea, 60% aprobarán el curso. A) Mario rojas tomó la asignatura calculo con el profesor y aprobó la materia. Cuál es la probabilidad de que sí haya hecho las tareas. B) Si un estudiante tomo la asignatura calculo con el profesor Cuál es la probabilidad de que haya hecho las tareas. 8) La siguiente tabla muestra a cuatro proveedores ropa de trabajo a la empresa Petroleun. El cuadro muestra las cantidades adquiridas a cada proveedor y el porcentaje de materia prima defectuosa que cada uno proporciona. PROVEEDOR %ADQUIRIDO % DEFECTUOSO

67

67

Ropeiro 30 25 Salas 24 1.73 Reino 29 2.8 Carla 17 0.98 a) La ropa usada hoy resulto defectuosa, cuál es la probabilidad de que la haya comprado al proveedor Reino. b) Cual es la probabilidad de que la ropa salga defectuosa. 9) La gobernación del Huila utiliza tres hoteles locales para proporcionar alojamiento a sus invitados en la noche. Por experiencia se sabe que al 20% de los visitante se le asigna habitación en el hotel Tumburuaga, al 50% en el hotel Plaza y al 30% en el hotel Chicala.Sí existe una falla en el servicio de plomería en el 5% de los cuartos del hotel Tumbuaragua, en el 4.5% de cuartos del hotel Plaza y un 7.5% de los cuartos del hotel Chicala, ¿ cuál es la probabilidad que a) ¿ cuál es la probabilidad que a un invitado de la gobernación se le asigne un cuarto con problemas de plomería ?.b) ¿ cuál es la probabilidad que A un invitado de la gobernación con un cuarto que tenga problemas de plomería se le asigne acomodo en el hotel Plaza? 10) En Manizalez (universitario) los estudiantes se distribuyen d la siguiente manera: el 19% estudian arquitectura, el 36% medicina y el 45% economía. El porcentaje de alumnos que finalizan sus estudios en cada caso es del 4%, 11% y del 16%.a) Sí elijo un alumno al azar, determinar la probabilidad de que haya acabado los estudios. b) Si elijo un estudiante de arquitectura, cuál es la probabilidad de que no acabe los estudios. 11)La fábrica de enlatados produce 6000 envases diarios. La máquina A produce 3500 de estos envases, de los que el 2.3% son defectuosos y la máquina B produce los 1500 restantes de los que se sabe que el 3.9% son defectuosos. Determinar la probabilidad de que un envase elegido al azar sea defectuoso 12) Como almacenista de n almacén recibo pedidos de cierto artículo de 3 proveedores distintos (A, B y C). El 40% del total se lo compra a A, mientras que a B y C se lo compro 30% a cada uno. El porcentaje de artículos en malas condiciones que proporciona A, B y C son de 4%, 11% y 13%, respectivamente. Si los artículos se almacenan sin importar quién es el proveedor y selecciono uno al azar: a)Determine la probabilidad de que sea defectuoso. b) Si es defectuoso, ¿cuál es la probabilidad de que haya sido despachado por el proveedor B?

7.4 Variable Aleatoria Definición: Es un variable cuyos valores numéricos quedan determinados por los resultados de un experimento aleatorio. Por ejemplo se lanzan tres monedas no cargadas. Los resultados posibles del experimento junto con el número de caras asociadas con cada resultado se enumeran en la tabla 3. La variable X representa el número de caras obtenidas al lanzar TRES monedas y es una variable aleatoria que toma los siguientes valores: X = [ 0 , 1 , 2 , 3 ] Es importante distinguir entre la variable aleatoria y los valores numéricos que ella puede tomar. Para ésto notaremos la variable aleatoria por la letra mayúscula X y el valor que ella tome con la letra minúscula x. Tabla 3. Resultados de lanzar tres monedas

Resultado X=Número de caras

SSS 0

SCS 1

SSC 1

CSS 1

CSC 2

CCS 2

CCC 3

7.4.1 Esperanza Matemática o valor esperado E [ X ],

68

68

Definición: Sea X una variable aleatoria discreta, se define la esperanza matemática a la suma del producto de cada valor puntual que toma la variable aleatoria por su correspondiente probabilidad de ocurrencia:

n

iii

xXPxXE1

)(

Sea X una variable aleatoria contínua, se define la esperanza matemática como:

dxxfXE

Nota: A la colección de pares [ xi, p(xi) ] se le denomina distribución de probabilidad, y se nota de la siguiente forma: Notación de P(xi) = P(X = xi) Ejemplo: Calcular el valor esperado de la tabla número 3. Para calcular el valor esperado se determino los valores en la tabla 7.4.

carasxXPxXEn

i

ii ..5.18

12)(

1

Interpretación: Si lanzamos simultáneamente 3 monedas el promedio de caras es de 1.5. Nota: La columna (1) da todos los valores posibles de la variable aleatoria X y la columna 2 da su correspondiente probabilidades y la columna 3 da al producto de cada valor de la variable aleatoria por su correspondiente probabilidad (distribución de probabilidad)

Tabla 7.4. Calculo de la esperanza matematica

Xi=Número de caras (1) P(xi)=P(X=xi) (2) xi*P(xi) (3) 0 1/8 0

1 3/8 3/8

2 3/8 6/8

3 1/8 3/8

Total 1 12/8

Ejemplo: Las ventas por hora de una máquina automática pueden ser 20,21,22 cajetillas de cigarrillos con probabilidades de 0.3, 0.5 y 0.2 respectivamente, cuál es la venta por hora esperada para ésta máquina? Solución:

X= Número de cajetillas P(X= xi) xi* P(X= xi) 20 0.3 6.0

21 0.5 10.5

22 0.2 4.4

Total 1.0 20.9

E[X]= xi P(xi) = 20.9

Interpretación: La venta promedio por hora de ésta máquina es de 20.9 21 cajetillas.

69

69

1.4.2 Varianza

Definición: Sea X una variable aleatoria. Definimos la varianza de X, denotada por 2 como sigue:

XEXE 22 La raíz cuadrada positiva de 2 se llama desviación estándar de X y se nota por

.

Ejemplo: Calcular la varianza y la desviación estándar alejemplo anterior (venta de cajetillas en la máquina automática).

Solución: XEXE 22 E[X2] = (20)2 (0.3) + (21)2 (0.5) + (22)2 (0.2) = 437.3

(E[x])2 = (20.9)2 = 436.81 2 = 437.3 - 436.81 = 0.49

La desviación estándar es:

= 7.049.02

EJERCICIO 1) Sea X= número de caras obtenidas al lanzar tres monedas. Si salen dos o más caras se recibe $200, si no, hay que pagar $100. ¿ Cuál es la ganancia esperada ?. 2) Se ha determinado que las ventas en expendio de publicaciones de una revista mensual tiene la siguiente distribución de probabilidad : -------------------------------------------------------------------------------------- Número de revistas 15 16 17 18 19 20 --------------- -------------------------------------------------------------------------- probabilidad 0.05 0.10 0.25 0.30 0.20 0.10 ------------------------------------------------------------------------------------------ Calcule la venta promedio mensual de revista y su desviación estándar 3) La junta directiva de la compañia JR consta de 15 miembros, ¿ de cuantas formas se puede elegir presidente, vicepresidente y secretario ? 4) Un club tiene 10 miembros . ¿ De cuantas formas se puede elegir una junta directiva de 4 miembros 5) La siguiente tabla muestra la distribución de las ventas diarias del almacén YA, con sus respectivas probabilidades: ____________________________________________________ VENTAS (MILLONES $) 10 20 30 40 PROBABILIDAD 0.30 0.2 0.4 0.1 ______________________________________________________ Calcular el promedio de ventas diarias del almacén y su desviación estándar. 1.5 Distribuciones de probabilidad para algunas variables aleatorias

70

70

En ésta sección se presentan ciertos modelos matemáticos que sirven para representar un gran número de fenómenos que cumplen ciertas condiciones. Definición: La distribución de probabilidad es una tabla, gráfica o formula que se usa para especificar todos los valores posibles de una variable aleatoria junto con sus probabilidades respectivas. Algunas distribuciones son : La distribución Binomial La distribución Multinomial Distribución de probabilidad para variables La distribución Poisson aleatorias discretas La distribución Geométrica La distribución Hipergeométrica Etc La distribución Normal La distribución Normal Estándar Distribución de probabilidad para variables La distribución Exponencial aleatoria continúas La distribución Gamma Etc 1.5.1 La distribución Binomial La distribución Binomial se obtiene del experimento que cumple las siguientes condiciones: a- Cada ensayo (experimento) conduce a uno de dos resultados posibles mutuamente exclusivos. Uno de los resultados posibles se denota (arbitrariamente) como Exito y el otro se de nota como fracaso. b- La probabilidad de Exito denotado por P, permanece constante de ensayo a ensayo. La probabilidad de Fracaso, 1-P, se denota por Q. c- Los ensayos son independientes es decir el resultado de cualquier ensayo particular no es afectado por el otro ensayo. Sea X una variable Binomial (es decir que cumpla las condiciones anteriores) basada en n repeticiones entonces:

xnxQPx)!(nx!

n!)(

Xn CxXP o

xnQxPx)!(nx!

n!)(

xXP

x)!(nx!

n!

xnC donde x es = 0 1....n

Ejemplo: El ejemplo tradicional es el lanzamiento de una moneda. Se lanza la moneda 30 veces: a) Cuál es la probabilidad de obtener exactamente 3 caras. b) Cuál es la probabilidad de obtener por lo menos 3 caras. Solución: El experimento consiste en el lanzamiento de la moneda. Cada lanzamiento (ensayo) produce 2

71

71

resultados posibles: cara o sello. La probabilidad de éxito P permanece constante de ensayo a ensayo, es decir P = 1/2 y es la probabilidad de obtener sello. Los ensayos son independientes, en otras palabras si en el primer lanzamiento sale cara, en el segundo lanzamientos se puede obtener cualquiera de los 2 resultados posibles. Como el experimento cumple las condiciones anteriores entonces la variable aleatoria X = (Número de caras obtenidas) se distribuye binonialmente y la:

000022687.010*2687.22

1

2

1)3( 5

3303

330

CXP

Respuesta: La probabilidad de obtener exactamente tres caras en 30 lanzamientos es de 2.2687 X 10-5 b- P(X ≥3) = ? Solución: P( X ≥ 3) = 1 - P( X ≤ 2), Donde P ( X≤ 2 ) = P (X = 0) + P ( X = 1 ) + P ( X = 2) entonces :

10

0300

03010*31323.9

2

1

2

10(

CXP

8

1301

13010*79397.2

2

1

2

1)1(

CXP

7

2302

23010*05125.4

2

1

2

1)2(

CXP

Luego, P ( X≤ 2 ) = 9.31323 * 10-10 + 2.79397 * 10-8 + 4.05125 * 10-7 P ( X≤ 2 ) = 4.33996 * 10-7 Entonces la P ( X ≥ 3) = 1 - 4.33996 * 10-7 = 0.99

Respuesta: La probabilidad de obtener por lo menos tres caras en 30 lanzamientos es de 0.99. TEOREMA 7.4 . Sí X es una variable aleatoria distribuída binomialmente, el valor esperado y varianza es:

nPXE nPQ2

Aplicación: La probabilidad de que un prospecto de ventas elegido al azar realiza una compra es de 0.20,. Sí realiza 15 visitas de prospecto, cual es la venta promedio y su desviación estándar ? Solución: Como la variable X = número de ventas, se distribuye en forma binomial, entonces

72

72

nPXE nPQ2 Como n = 15 y P =020 q = 0.80 entonces E [X] = 15 * 0.20 = 3.0

nPQ2 = 15 * 0.20 * 0.80 = 2.4 s = 24.0 = 0.49

1.5.2. La distribución Poisson La distribución Poisson es otra distribución de naturaleza discreta. Esta distribución es aplicable a procesos (experimento) en los que ocurren en determinado sucesos por unidad de espacio, tiempo, área y volumen. La variable aleatoria X en una distribución Poisson representa el número de resultados que ocurren en un intervalos de tiempo dado (segundos, minuto, hora, día) o en una región(espacio) o volumen específico). Sí una variable aleatoria X se distribuye en forma Poisson, entonces la probabilidad de obtener exactamente x resultados en un intervalo de tiempo, espacio o volumen es:

x

x

exXP

!)(

Para X= 0, 1, 2, 3,........K

Donde: = Tasa media de ocurrencia de los sucesos por cualquier unidad de tiempo,

espacio o volumen. X= Número de ocurrencias del suceso en una unidad de tiempo, espacio o volumen. Ejemplo : El gerente de un banco sabe por experiencia que entre la 9:00 y 10:00 de la mañana, la tasa media de llegada de los clientes es de 60 por hora. El desea determinar la probabilidad de que: a) lleguen dos clientes por minuto entre las 9:00 y 10:00 de la mañana. b) Lleguen a lo máximo clientes por minuto entre las 9:00 y 10:00 de la mañana. Solución: a) lleguen dos clientes por minuto entre las 9:00 y 10:00 de la mañana. Sea X = total de clientes por minuto que llegan al banco entre las 9:00 y 10:00 de la mañana = promedio de llegada de los clientes por minuto

= 60 clientes/60 minutos = 1 cliente por minuto

La variable aleatoria se distribuye en forma Poisson ( número de sucesos por unidad de tiempo) entonces para determinar la probabilidad de lleguen dos clientes por minuto entre las 9:00 y 10:00 de la mañana se aplica la siguiente formula.

x

x

exXP

!)(

Reemplazando:

73

73

P ( X = 2 ) = (e-1 * 1²) /2! = 0.183 b) lleguen a lo máximo dos clientes por minuto entre las 9:00 y 10:00 de la mañana. Solución: P ( X 2) = P(X=0) + p(X=1) + p(X=2) = 0.3679 + 0.3679 + 0.183 = 0.9188

TEOREMA 7.5. Sea X una variable aleatoria distribuida en forma Poisson, entonces el valor esperado y su varianza es igual a Landa ( ) E [ X ] = ² =

EJERCICIOS 1) Una empresa que fabrica bombillos sabe por experiencia que la probabilidad de que salga un bombillo

defectuoso es de 0.03. Como usted es el contador de la empresa selecciona 12 bombillos, cual es la probabilidad de que salgan 3 defectuosos

2) El 90% de los artículos que produce una máquina son buenos. Sí seleccionamos aleatoriamente 10 artículos producido por la máquina, cuál es la probabilidad de que a) exactamente 2 de ellos sean buenos b) Menos de dos sean buenos c) A lo máximo uno sea bueno

3) El 4% de los ingenieros industriales son de sexo femenino. Sí seleccionamos aleatoriamente 12 ingenieros industriales, cuál es la probabilidad de que exactamente 3 de ellos sean de sexo femenino. b) Ninguno sea mujer c) Mas de uno sea mujer d) menos de 3 sean mujeres e) dos sean hombres. f) mas de uno sea hombre. 4) El número de accidentes por año en la ciudad de Descanso es de 4 por cada 100000 habitante. Hallar la probabilidad de que en esa ciudad ocurran por cada 100000 habitantes: a) dos accidentes por año. b) un accidente por año. c) a lo máximo un accidente por año. d) menos de dos accidentes por año. e) mas de un accidente por año. f) como mínimo un accidente por año. g) Entre uno accidentes y tres accidentes por año. 5) Al bombero de una surtidora de gasolina se le paga de acuerdo al número de automóviles que atienda. la probabilidad de que atienda un día ordinario es de 6/8 y en un día festivo es de 4/8. El pago por atender un automóvil en día festivo es de $0.20 y en un día ordinario es de $0.10. Encuentre la ganancia esperada para el bombero 6) En una estación de gasolina se sabe que el promedio de vehículos que llegan por hora es de 30. Cuál es la probabilidad de que una hora lleguen: a) 3 vehículos. b) Menos de dos vehículos. c) Ningún vehículo d) mas de 1 vehículos. e) Como mínimo dos vehículos. c) un vehículo. 7) Para el ejercicio anterior determine la media y la varianza. 8) En el conmutador de la universidad entran en promedio 2.2 llamadas por minuto. Encuentre la probabilidad de: a) No entre llamadas b) no mas de dos llamadas entren en un minuto cualquiera. c) No entre mas de 1 llamadas d) Mas de 12 llamadas entren en un periodo de 6 minutos. f) Determine el promedio de llamadas que entran en media hora. 9) Se sabe que un máquina produce diariamente el 2% de los artículo defectuosos. Si seleccionan 12 artículos, cual es la probabilidad de que: a) Al menos uno sea defectuoso. b) Ninguno sea defectuoso. c) Uno sea defectuoso. d) mas de uno sea defectuoso e) Uno sea bueno. f) Promedio de artículos defectuosos. g) Desviación estándar de artículos defectuosos A continuación se describen algunas distribuciones de probabilidad para variable continua. 7.5.3. LA DISTRIBUCIÓN EXPONENCIAL.

74

La distribución exponencial es una variable aleatoria continua mide el tiempo transcurrido entre ocurrencias. Esta distribución esta relacionada con la distribución Poisson que es discreta, mientras que la distribución exponencial es continua ya que la variable tiempo es continua. La distribución exponencial se utiliza mide el tiempo de atención para ser atendido en una entidad bancaria, un supermercado, en una estación de gasolina, etc, es decír esta distribución se utilizan como modelo para representar tiempos de funcionamiento o tiempos de espera. Una variable aleatoria continua se distribuye en forma exponencial si su función de densidad es

Para calcular cualquier probabilidad de una variable continua esta se representa una area en el plano y por consiguiente hay que calcular la integral entre los tiempos o tiempo solicitado en la espera. Para disminuir el tiempo en la solución de cualquier ejemplo se ha elaborado una tabla acumulativa de la distribución exponencial (anexo 2).

1. Ejemplo: El cajero del supermercado YA atiende en promedio 4 cliente cada cinco minuto minutos. a) ¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3 minutos?

b) ¿Cuál es la probabilidad de que una persona sea atendida entre 3 minutos y 5 minutos? c) ¿Cuál es la probabilidad de que una persona se demore mas de 4 minutos en ser atendida? Solución: a) ¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3 minutos? P(una persona sea atendida antes de que transcurran 3 minutos)

Sea T= tiempo de atención. ?)3( TP

Se sabe que

5

4 reeplazando la integral

3

0

3*5

4

5

4)3( dteTP Para evitar la integración utilizo la tabla exponencial del

anexo 2, el cual tienen la ?)3( TP para un t específico.

Utilizando la tabla se busca 4.23*5

4t y la probabilidad es

b) ¿Cuál es la probabilidad de que una persona sea atendida entre 3 minutos y 5 minutos? P(una persona sea atendida entre 3 minutos y 5 minutos)

Sea T= tiempo de atención. ?)53( TP

Se sabe que

5

4 . Par utilizar la tabla exponencial (anexo 2) realizo la siguiente conversión:

75

)3()5()53( TPTPTP

?)5( TP para un 45*5

4 entonces 982.0)5( TP

?)3( TP para un 4.23*5

4 entonces 909.0)3( TP

Luego 073.0909.0982.0)53( TP

c) ¿Cuál es la probabilidad de que una persona se demore mas de 4 minutos en ser atendida?

041.0959.01)4(1)4( TPTP

2.34*5

4

Teorema 1.6. Sea T una variable aleatoria continua distribuida en forma exponencial, entonces, el valor esperado y su varianza es:

1TE y

2

2 1

EJERCICIOS

1). En el aeropuerto el Veloz llegan en promedio 2 aviones por día. ¿ Cuál es la probabilidad de que , después de la llegada de un avión, tenga que esperar a lo máximo tres días para la llegada del siguiente avión?. 2). En una estación de gasolina llegan en promedio 4 clientes cada hora.. Determine la probabilidad de que el bombero de la estación tenga que esperar entre dos y tres minutos para que le soliciten el servicio. 3.En el banco Tacaño llegan en promedio 15 clientes cada media hora. Determine la probabilidad de que

el tiempo entre un cliente y otro que llegan al banco Tacaño este entre tres y cinco minutos. 4). Un contador público por experiencia sabe que el promedio de errores en el libro mayor es de 2 error por cada 20 páginas. Si un auditor le revisa el libro diario del año 2004, ¿ cuál es la probabilidad de que el primer error este: a) en las primeras 10 página b) este entre las páginas 14 y 16.

7.5.3 LA DISTRIBUCION NORMAL El modelo probabilístico más frecuentemente usado en las decisiones económicas, sociales, etc, es la distribución normal, la cual puede ser presentada en forma general o estándar. La importancia de la distribución reside en sus convenientes propiedades matemáticas que llevan directamente a muchas partes de la teoría de la estadística disponible como base para la práctica en su totalidad como aproximación a otra distribuciones en su aplicación a muchas variables aleatorias que, o

76

bien están distribuidas aproximadamente de manera normal, o bien que se puede transformar fácilmente para aproximarlas a variables normales. Definición: Sea X la variable aleatoria continua que toma todos los valores reales entre --∞<X<∞ se dice que tiene distribución normal si su función de densidad de probabilidad f(X) es de la forma:

2

2

1

22

1)(

X

eXf

los parámetros (media) deben satisfacer las condiciones - < < y (desviación estándar)

> 0 La gráfica de la distribución normal produce la conocida curva en forma de campana que se muestra en la figura 7.2.

Figura 7.2. La distribución normal

7.5.3.1 Propiedades de la distribución normal a) Es simétrica respecto a la media ( ), es decir la curva hacia cualquiera de los dos lados de , es una

imagen reflejada de la del otro lado. b) La media, la mediana y la moda son iguales c) El área total de la curva por encima del eje x es una unidad. Debido a la simetría ya mencionada, el 50% del área está hacia la derecha de una perpendicular levantada en la media y el 50% está hacia la izquierda. d) Sí se levantan perpendiculares a una distancia de una desviación estándar de la media, en ambas direcciones, el área encerrada por estas perpendiculares, el eje X y la curva será aproximadamente el 68% del área total. Sí se levantan perpendiculares a dos desviaciones estándar hacia cada uno de los lados de la media, se encerrará aproximadamente el 95% del área total, y sí se levantan perpendiculares a tres desviaciones estándar a lado y lado de la media, se encerrará aproximadamente el 99.7% del área total ( figura 7.3).

Figura 7.3. Subdivisión del área bajo la curva normal

77

b) La distribución normal queda completamente determinada por los parámetros y decir cualquier cambio de desplaza la distribución normal, mientras que un cambio

de , únicamente altera la forma de la distribución ( figura 7.4 y 7.5).

Figura 7.4. Subdivisión del área bajo la curva normal con medias diferentes La última propiedad de la distribución normal implica, que en realidad esta es una familia de distribuciones. La más importante de está familia es la distribución normal estándar o unitaria

Figura 7.5. Distribución normal con varianzas diferentes

7.5.4 LA DISTRIBUCION NORMAL ESTANDAR ( Z ) Sea X una variable aleatoria contínua y Z = X - , / ,Entonces Z se distribuye en forma normal estándar con

media = 0 y 2 = 1 y su función de densidad de probabilidad es de la forma:

2

2

2

1)(

Z

eZf

La figura 7.6. se muestra la gráfica de la distribución normal estándar.

Figura 7.6. Distribución normal estándar

78

La distribución normal estándar posee las mismas propiedades de la distribución normal . Para encontrar la probabilidad de cualquier valor de Z entre un punto o dos se utiliza la tabla del anexo 1. El cuerpo de la tabla del anexo 1 está el área bajo la curva entre cero y un valor de Zi . El valor de Zi esta en la primera columna y en la primera fila de la tabla. El área sombreada de la figura7.7 presenta el área ( o probabilidad) es la dada en la tabla para valores de Z entre cero y Z0

Figura 7.7. Area dada en anexo 1. P ( 0<Z < Zi) Ejercicio: Dada una distribución normal estándar, encontrar: a) P( 0 < Z < 2.20 ) b) P( -0.56 < Z < 0) c) P ( Z > 1.56 ) d) P( 0 < Z < 2.32 ) e) P ( Z < - 1.50) Solución: Para encontrar estas probabilidades (áreas) es importante hacer la figura de la distribución normal estándar y sombrear el área que solicitan: a) P( 0 < Z < 2.20 ). ¿ Como se encuentra esta área. En el anexo. se localiza el valor de Z igual a 2.20 es decir, el 2.2 en la primera columna y el cero en la primera fila, y leer el valor correspondiente en la intercesión del cuerpo del anexo. La figura 7.8 muestra el área solicitada.

Figura 7.8. Area solicitada b) P(-0.56 < Z < 0) Esta probabilidad se encuentra de la misma forma que en el punto a. Es decir cualquier valor negativo de Z se trata como positivo. Buscando el valor 0.56 en la tabla 1, la probabilidad es de 0.21.23. ( figura 7.9).

Figura 7.9. Area solicitada c) P ( Z > 1.56 ) . Observando la figura 7.9. el área sombreada es diferente a la que se presenta en el anexo. Debe llevarse a esa forma , ¿ como ? . Como la mitad del área de la normal vale 0.5 por propiedad, entonces: P ( Z > 1.56 ) = 0.5 - P ( 0 < Z < 1.56 ) = 0.5 - 0.4406= 0.0594 e) P ( Z < - 1.50). Para hallar esta probabilidad el valor de z se vuelve positivo y se le da el mismo tratamiento del punto c. Entonces P ( Z < - 1.50) = P ( Z > 1.50 ) = 0.5 - P ( 0 < Z < 1.50 ) = 0.5 - 0.4332 =0.0668

79

EJERCICIOS PROPUESTOS: Determine las siguientes probabilidades: a) P( 0 < Z < 4.20 ) b) P( 2 < Z < 3.06) c) P ( Z < 1.567) d) P( -1.35 < Z < 2.32 ) e) P ( Z < -14.0) 7.8.3. Aplicaciones de la distribución normal 1) Los contadores públicos mantienen en promedio una contabilidad de tres años con una desviación estándar de 0.5 años. Suponga que el tiempo de duración de llevar las contabilidades de los contadores públicos está distribuida aproximadamente en forma normal. Determine la probabilidad de que un contador público dure; a) mas de 3.5 años en llevar una contabilidad. b) menos de 3.4 años en llevar una contabilidad. c) mas de 2.3 años en llevar una contabilidad. e) entre 2.5 y 3.3 años en llevar una contabilidad. Solución La pregunta es determinar la probabilidad de que un contador público dure; mas de 3.5 años en llevar una contabilidad mas de 3.5 años. La notación es: P(un contador público dure mas de 3.5 años en llevar una contabilidad). Entonces definir la variable aleatoria X, donde X = tiempo de duración en llevar una contabilidad Reemplazando la pregunta P ( X > 3.5 ) = ?. Para encontrar la P ( X > 3.5 ), es necesario hacer la figura 7.10.El enunciado del problema da los siguientes valores: = 3 años y = 0.5 y P ( X > 3.5 ) se debe realizar una integral. Para evitar la integración la llevamos a

Figura 7.10 Distribución del tiempo de llevar la contabilidad

Una distribución normal estándar (Z) mediante el siguiente cambio de variable:

xZ .A continuación se

realiza el cambio: P ( X > 3.5 ) = P ( Z > 3.5 - 3.0 ) = P ( Z > 1 ). Gráficamente se presenta la figura 7.11. 0.5

Figura 7.11. Cambio de variable

80

Para hallar P ( Z > 1 ) en el anexo 1 debe hacerse de la siguiente forma: P ( Z > 1 ) = 0.5 – valor de la tabla de 1 P P( Z > 1 ) = 0.5 - 0.1583 = 0.3417 b) Menos de 3.4 años. Para encontrar la P ( X < 3.4 ), donde X = tiempo de duración en llevar una contabilidad, es necesario hacer la figura 7.12 .El enunciado del problema da los siguientes valores: = 3 años y = 0.5 y P(

X<3.4) se debe realizar una integral. Para evitar la integración la llevamos a una distribución normal estándar (Z)

Figura 7.12. Distribución del tiempo de llevar la contabilidad

mediante el siguiente cambio de variable:

xZ A continuación se realiza el cambio:

P ( X < 3.5 ) = 5.0

3034 Z = P ( Z < 0.8). Gráficamente se presenta la figura 7.13.

Figura 7.13. Cambio de variable de la normal a la estándar Para hallar P ( Z < 0.8) en el anexo 1. debe hacerse de la siguiente forma: P ( Z < 0.8 ) = 0.5 + valor de la tabla de 0.8 = 0.5 + 0.2881 = 0.7881. En la figura 7.14 se observa el cambio de variable. c) Mas de 2.3 años Solución : Para encontrar la P ( X > 2.3 ), donde X es el tiempo de llevar la contabilidad. El enunciado del problema da los siguientes valores: = 3 años y = 0.5

y P ( X > 2.3 ) se debe realizar una integral. Para evitar la integración la llevamos a una distribución normal estándar

(Z) mediante el siguiente cambio de variable:

xZ A continuación se realiza el cambio:

P ( X > 2.3 ) = P ( Z > 2.3 - 3.0 ) = P ( Z > -1.4 ). 0.5 Para hallar P ( Z > -1.4 ) en la tabla 1. debe hacerse de la siguiente forma: P ( Z > -1.4 ) = 0.5 + valor tabla de 1.4 = 0.5 - 0.4192 =0.0808 e) Entre 2.5 y 3.3 años

81

Para encontrar la P (2.5 < X < 3.3 ), definir X como el tiempo de llevar la contabilidad. El enunciado del problema da los siguientes valores: = 3 años y = 0.5 y P (2.5 < X < 3.3 ) se debe realizar una integral. Para evitar la

integración la llevamos a una distribución normal estándar (Z) mediante el siguiente cambio de variable: z = x - / .

A continuación se realiza el cambio: P (2.5 < X < 3.3 ) = P (2.5 -3.0 < Z < 3.3 - 3.0) = P ( -1 < Z < 0.6 ) 0.5 0.5 Para hallar P ( -1 < Z < 0.6 ) en el anexo 1 debe hacerse de la siguiente forma: P ( -1 < Z < 0.6 ) = valor tabla de 1 + valor tabla de 0.6 P ( -1 < Z < 0.6 ) = 0.3413 + 0.2257 = 0.567 EJERCICIOS 1) Determinar el área bajo la curva normal estándar. a) P ( Z >1.78 ) b) P ( Z < 2.35 ) c) P ( -1.56 < Z < 2.98 ) d) P (Z< - 1.43 ) e) P (0.89<Z<3.04 ) f) P (-2.3 < Z < 4.1 ) 2) Pruebas realizadas en bombillas eléctricas de cierta marca, indican que el período de duración se distribuye normalmente con media igual a 1862 horas y desviación estándar de 68 horas. Estimar el porcentaje de bombillas que duren: a) mas de 1890 horas, b) menos de 1780 horas, c) entre 1870 y 1880 horas, d) mas de 1790 horas , e) entre 1785 y 1883 horas. 3) Se sabe que el peso de la guanábana está distribuidas normalmente con un peso medio de 4 libras. El 15% de las guanábanas pesan menos de 3 libras. Cual es la desviación estándar 4) La duración de ciertas pilas para radio transistor, está distribuida normalmente; si el 2.28% duran más de 4.26 meses y 5.36% duran menos de 1.25 meses. Determine la duración media y la desviación estándar. 5) Una fábrica de cemento empaca su producto en bolsas cuyos pesos se saben que son distribuidos normalmente, con una media de 50 kilos y una Barinas de 4 kilos. Encuentre la probabilidad de sacar una bolsa que contenga; a) por lo menos 51 kilo, b) como máximo 52 kilos, c) de 49 a 51 kilo. 6. Los salario de los contadores públicos se distribuyen normalmente con una desviación estándar de $10.000. Por experiencia se sabe que 12% de los salarios más bajos de los contadores públicos son de $550.000. Determinar el salario promedio de los contadores públicos. 7.La edad de los equinos en el Huila se distribuyen normalmente con una edad media de 6 años y una desviación estándar de 0.5 año.¿ Que porcentajes de equinos tienen una edad entre 5 y 6.1 años? 8.La longitud de los tornillos que produce una maquina se distribuye normalmente, con un diámetro promedio de 13.0 mm y una varianza de 0.01. Determinar la probabilidad de que un tornillo elegido al azar tenga un diámetro entre 12.8 y 13.3 mm ?. 9.El salario mensual de los contadores públicos se distribuye normalmente con un salario promedio mensual de 1500 Euros. El 4.01 % de los salarios de contadores públicos son superiores a 1510 Euros. Cuál es la desviación estándar ? 10.La edad de los contadores públicos se distribuye normalmente con edad media de 35 años y una desviación estándar de 2 años. a) Que porcentajes de contadores públicos tienen más de 41 años. b) Que porcentajes de contadores públicos tienen entre 32 y 39 años. 11) La vida útil de las llantas panteras se distribuye normalmente con una duración media de 28000 kilómetros y una desviación estándar de 3000 kilómetros. Si la fabrica no desea reemplazar más del 4% de las llantas vendidas, ¡ qué tiempo de garantía debe ofrecer?. 12) El tiempo de tramitar papeles para la legalización de un vehículo en las oficinas de transito se

82

distribuye normalmente con una media de 5 horas y una desviación de 1 hora. Determinar el porcentaje de legalizaciones que duran: a) mas de 7 horas b) menos de 4 horas c) A lo máximo 3 horas d) Mas de 3.5 horas. 13) El tiempo que utilizan para graduarse como profesionales en cierta universidad se distribuye normalmente con una media de 6 años y una desviación estándar de 1 año. a) Que porcentajes de estudiantes de la universidad duran a lo máximo 7 años para graduarse. b) Que porcentajes de estudiantes de la universidad duran por lo mínimo 6.5 años para graduarse. c) Que porcentajes de estudiantes de la universidad duran entre 6 y 8 años para graduarse. d) Que porcentajes de estudiantes de la universidad duran entre 5 y 7.5 años para graduarse. e) Cuanto t tiempo dura en graduarse el 15% de los estudiantes de mas bajo rendimiento académico. f) Cuanto t tiempo dura en graduarse el 12% de los estudiantes de mejor rendimiento académico. 14). Cierto restaurante de la ciudad, la distribución de los almuerzo diario que vende es aproximadamente de forma normal con un promedio diario de 200 almuerzo y una desviación estándar de 10 almuerzo. Para cualquier día especifico cuantos almuerzo debe hacer el restaurante de manera que la probabilidad de quedarse sin almuerzos sea menor al 0.05.

83

ANEXO 1. DISTRIBUCIÓN NORMAL ESTÁNDAR

Zi)ZP(0 )0( ZZiP

Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0369 0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0753 0.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141 0.3 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517 0.4 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879 0.5 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224 0.6 .2257 .2291 .2324 .2357 .2389 ,2422 .2454 .2486 .2518 .2549 0.7 .2580 .2612 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852 0.8 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3106 .3133 0.9 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389 1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621 1.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830 1.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015 1.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177 1.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319 1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441 1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545 1.7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633 1.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4706 1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767 2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817 2.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857 2.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890 2.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916 2.4 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936 2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .4952 2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964 2,7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974 2.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .4981 2.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986 3.0 .49865 .49869 .49874 .49878 .49882 .49886 .49889 .49893 .49897 .49900 3.1 .49903 .49906 .49910 .49913 .49916 .49918 .49921 .49924 .49926 .49929 3.2 .49931 .49934 .49936 .49938 .49940 .49942 .49944 .49946 .49948 .49950 3.3 .49952 .49953 .49955 .49957 .49958 .49960 .49961 .49962 .49964 .49965 3.4 .49966 .49968 .49969 .49970 .49971 .49972 .49973 .49974 .49975 .49976 3.5 .49977 .49978 .49978 .49979 .49980 .49981 .49981 .49982 .49983 .49983 3.6 .49984 .49985 .49985 .49986 .49986 .49987 .49987 .49988 .49988 .49989 3.7 .49989 .49990 .49990 .49990 .49991 .49991 .49992 .49992 .49992 .49992 3.8 .49993 .49993 .49993 .49994 .49994 .49994 .49994 .49995 .49995 .49995 3.9 .49995 .49995 .49996 .49996 .49996 .49996 .49996 .49996 .49997 .49997

84

ANEXO 2. DISTRIBUCION EXPONENCIAL

La tabla da la probabilidad de observar un valor de T, F(T)=P( T t ) y y un T especifico. _____________________________________________________________

T F(T) T F(T) T F(T) T F(T) _____________________________________________________________ 0,0 0,000 2,5 0,918 5,0 0,9933 7,5 0,99945 0,1 0,095 2,6 0,926 5,1 0,9939 7,6 0,99950 0,2 0,181 2,7 0,933 5,2 0,9945 7,7 0,99955 0,3 0,259 2,8 0,939 5,3 0,9950 7,8 0,99959 0,4 0,330 2,9 0,945 5,4 0,9955 7,9 0,99963 0,5 0,393 3,0 0,950 5,5 O,9959 8,0 0,99966 0,6 0,451 3,1 0,955 5,6 0,9963 8,1 0,99970 0,7 0,503 3,2 0,959 5,7 0,9967 8,2 0,99972 0,8 0,551 3,3 0,963 5,8 0,9970 8,3 0,99975 0,9 0,593 3,4 0,967 5,9 0,9973 8,4 0,99978 1,0 0,632 3,5 0,970 6,0 0,9975 8,5 0,99980 1,1 0,667 3,6 0,973 6,1 0,9978 8,6 0,99982 1,2 0,699 3,7 0,975 6,2 0,9980 8,7 0,99983 1,3 0,727 3,8 0,978 6,3 0,9982 8.8 0,99985 1,4 0,753 3,9 0,980 6,4 0,9983 8,9 0,99986 1,5 0,777 4,0 0,982 6,5 0,9985 9,0 0,99989 1,6 0,798 4,1 0,983 6,6 0,9986 9,1 0,99989 1,7 0,817 4,2 0,985 6,7 0,9988 9,2 0,99990 1,8 0,835 4,3 0,986 6,8 0,9989 9,3 0,99991 1,9 0,850 4,4 0,988 6,9 0,9990 9,4 0,99992 2,0 0,865 4,5 0,989 7,0 0,9991 9,5 0,99992 2,1 0,878 4,6 0,990 7,1 0,9992 9,6 0,99993 2,2 0,889 4,7 0,991 7,2 0,9993 9,7 0,99994 2,3 0,900 4,8 0,992 7,3 0,9993 9,8 0,99994 2,4 0,909 4,9 0,993 7,4 0,9993 9,9 0,99995 _____________________________________________________________

85

FORMULAS DE PROBABILIDAD

posiblescasosdeTotal

AeventoalfavorablesCasosAP

...

....(

Propiedades. 1). 0 P (A) 1 2) P(S) = 1

TEOREMA 1. Si es el conjunto vacío entonces P() = 0

TEOREMA 2. Si A’ es el suceso complementario de A entonces P(A’)=1- P(A) TEOREMA 3. Si A y B son dos sucesos cualesquiera entonces: P(AUB) = P(A) + P(B) - P(A B)

PROBABILIDAD CONDICIONAL )(

)()/(

AP

BAPABP

PROBABILIDAD TOTAL

)()/(..)3

()3

/()2

()2

/()1

()1

/()(K

BPK

BAPBPBAPBPBAPBPBAPAP

TEOREMA DE BAYES

)()/(..)3

()3

/()2

()2

/()1

()1

/(

)()/()/(

KBP

KBAPBPBAPBPBAPBPBAP

iii

BPBAPABP

Esperanza Matemática o valor esperado E [ X ]= Xi P ( xi )

Varianza 222 XEXE

BINOMIAL

xnxQPx)!(nx!

n!)(

xXP DONDE

x)!(nx!

n!

xnC

E [X] = nP ² = nPQ

DISTRIBUCION GEOMETRICA : 1)( xPQxXP

P

XE1

2

2 1

P

P

POISSON e-- X

P ( X= x) = ________ E [ X ] = ² = X ! La distribución Exponencial : Manejo de tabla . E [ X ] = 1/ ² =1/ 2

La distribución Normal estándar

-XZ

86