Modulo De Metodos Cuantitativos En Investigacion[1]

Preview:

DESCRIPTION

 

Citation preview

Métodos cuantitativos

Universidad Nacional de Colombia

Maestría en Admón.Métodos cuantitativos

Objetivos del Análisis de Riesgo El análisis de riesgo permite:

Medir la Probabilidad de Ocurrencia de un resultado.

Construir la Distribución de Probabilidades del indicador (VPN, TIR, ROI, CAE)

Determinar las variables mas sensibles del proyecto

Estimar el riesgo asociado a decisiones tomadas.

Por que? Medición del Riesgo

Riesgo: Variabilidad de los flujos de caja de un proyecto o del valor del activo. Mientras mas grande, mayor es el riesgo. Esto en última instancia se manifiesta sobre la variabilidad de los rendimientos del proyecto/ activo.

El analista puede modelar la distribución de probabilidades del criterio de decisión (VPN, TIR, ROI, etc) . Herramientas:

Evaluación con Variables Aleatorias Simulación Monte Carlo. Árboles de Decisión

Medición del Riesgo La esperanza del valor medio (VPN, TIR,

ROI, etc) esta dada por:

Para medir la variabilidad del indicador o de los flujos de caja podemos usar:

P. XX VAR(X) ó

N

XX VAR(X) i

2N

1i

-i

2N

1i

-i

P . X E(x) ó N

XX i

N

1i

i

N

1

i

i

Medición del Riesgo La desviación típica se utilizara para determinar

las probabilidades de ocurrencia de un hecho. El coeficiente de variación es otra medida de

riesgo que permite discriminar el riesgo en función del valor esperado, es adecuado cuando se tienen varias alternativas. Nos permite medir la dispersión relativa de los datos en torno a la media.

X

σCV

Medición del Riesgo Para medir la probabilidad de que el VPN o TIR

sea superior o inferior a cierto monto de referencia se procede a estandarizar la variable de interés usando la relación:

σ

X - XZ

Donde Z es la variable estandarizada que sigue una distribución N(0,1) y de la tabla de la distribución normal se lee la probabilidad.

Selección de una Distribuciones de Probabilidad

La asignación de las distribuciones de probabilidad puede realizarse:

Realizando muestreos de la variable y graficando los datos.

Consultando expertos en el tema específico.Asignación subjetiva según experiencia del

analistaSelección según el nivel de incertidumbre.Seleccionar la distribución según la

característica de la variable.

Distribuciones de probabilidad

Lo mas conveniente es ajustar una distribución teórica a los datos, hacer una prueba de bondad de ajuste y luego muestrear desde la distribución empírica en el proceso de simulación.

Para seleccionar la adecuada distribución podemos partir de la forma del histograma de los datos y luego buscar una particular distribución o hacer uso del resumen estadístico para sacar información adicional acerca de la naturaleza de la distribución.

Distribución Empírica (Discreta)

Para simular la V.A. (x) se establece en que rango de probabilidades se encuentra el número aleatorio generado y así determinar el valor de la V.A. (esto puede hacerse usando la herramienta de Excel: Generación de números aleatorios)

Distribución Empírica (Discreta)

Por ejemplo si la variable aleatoria Vida Útil solo puede tomar valores de (3,5,7,10) con probabilidades (0.2, 0.4, 0.25, 0.15) respectivamente, la asignación de números aleatorios se haría de la siguiente forma:

Vida Útil Probabilidad f(x)

Prob. Acumulada F(x)

Números Aleatorios

3 0,25 0,47 0,25

10 0,15total 1

Distribución Empírica (Discreta)

El uso de distribuciones empíricas tiene inconvenientes:

Los datos empíricos pueden no reflejar adecuadamente la población bajo estudio debido al error muestral

Se excluyen valores muestrales Debido al error muestral otros datos pueden ocurrir y

la distribución no reflejaría estos valores. Una forma de superar estos inconvenientes es

ajustar una distribución teórica a los datos, hacer una prueba de bondad de ajuste y luego muestrear desde la distribución empírica en el proceso de simulación.

Distribución Binomial

La variable aleatoria (x) representa el número de éxitos en un numero fijo (n) de intentos. experimentos de Bernulli.

La probabilidad de estos resultados en cada ensayo es constante y los ensayos son independientes

Probabilidad de éxito (P), probabilidad de fracaso q=(1-P):

n.p.q σy n.p μ

n,1,2,......x si p-1px

n p(x) x-nx

Distribución Geométrica e Hipergeométrica

Distribución Geométrica: describe el número de intentos hasta que el primer éxito ocurre. El único parámetro es la probalidad de éxito “p”.

Distribución Hipergeométrica: similar a la binomial, describe el número de veces que un evento ocurre en un número fijo de ensayos. La diferencia es que la probabilidad va cambiando a medida se realizan los ensayos. Parámetros son: Tamaño población, tamaño muestra, y probabilidad.

Distribución de Poisson

La distribución de Poisson describe el número de veces “x” que un evento ocurre en un intervalo dado. Por ejemplo, el ritmo promedio al que llegan los vehículos a un peaje, demanda promedio de un artículo en un inventario, demanda promedio de un articulo en un almacén, etc.

Caracterizado por un valor lambda , igual a el número de ocurrencias por unidad de tiempo.

1,2,...x !

xe

xPx

Distribución Normal

Describe muchos fenómenos aleatorios que ocurren en la vida diaria.

Es simétrica y su media es igual a la mediana. El Rango de “x” no esta limitado pero los

valores se centran alrededor de la media.

N

X

N

X (X)

x- 2

)(

N

1i

i

2N

1i

-i

2

2/ 22

xexf

Distribución Normal

Diferente media Igual desviación

Igual media Dif. desviación

Distribución Normal Estándar

σ

X - XZ

Distribución Normal Estándar

1

0

Probabilidades normales para valores seleccionados de Z

Distribución Lognormal

Se usa en situaciones donde los valores se sesgan positivamente. Por ejemplo precios de acciones, valuación de seguros, etc.

La variable incierta puede incrementarse sin limite pero no puede caer por debajo de cero.

La variable se sesga positivamente pero la mayoría de valores se encuentran cerca al limite inferior.

El Ln de la variable incierta produce una distribución normal.

Si el coeficiente de variación CV>30% es mejor usar la distribución Lognormal.

Distribución Uniforme

La variable aleatoria se mueve entre un valor mínimo y máximo todas con igual nivel de probabilidad .

Se usa frecuentemente cuando hay poco conocimiento de la variable.

Parámetros:

12a)-(b

σy 2

ba μ

2

b x a a-ba-x

F(x) :aAcumulativFuncion

b x a a-b

1 f(x) :adprobabilid deFunción

a-bc-d

d)xp(c

f(x)

a bc d

Distribución Uniforme

Si no utilizamos la función de Excel para generar una salida uniforme, podemos utilizar la siguiente relación y general la V.A. De interés :

X=a+ALEATORIO()*(b-a)

Generación de Distribuciones de probabilidad

La generación de las distribuciones de probabilidad se basa en la generación de números aleatorios. Los paquetes tienen generadores de números aleatorios distribuidos uniformemente entre 0 y 1. U(0,1)

Función de Excel: +Aleatorio()

Generación de Distribuciones de probabilidad

Los paquetes también generan distribuciones de probabilidad especificas para lo cual solo hay que ingresar los parámetros de la distribución.

En Excel por el menú: “Herramienta-análisis de Datos”, podemos utilizar la opción “Generación de Números aleatorios”

Esta herramienta permite generar distribuciones Discreta, normal, Bernulli, poisson, Uniforme y binomial para lo cual pide los parámetros.

Pruebas de Bondad de Ajuste

Son importantes para seleccionar una adecuada distribución a los datos, las pruebas mas usadas son:

Chi-Cuadrado : valores de p mayores de 0.05 generalmente indican un ajuste cercano.

Kolmogorov-Smirnov: valores menores de 0.03 generalmente indican un buen ajuste.

Anderson-Darling: valores menores de 1.5 generalmente indican un buen ajuste

ANÁLISIS DE DECISIONES

El análisis de decisiones se puede emplear para determinar estrategias óptimas cuando quien debe tomar decisiones tiene que enfrentarse ante varias alternativas de decisión y un patrón incierto o lleno de riesgos de eventos futuros.

ESTRUCTURACIÓN DEL PROBLEMA DE DECISIÓN

Empresarios manizaleños han diseñado varios proyectos de condominios. Las unidades individuales tendrán un precio entre 300,000 a 1,200,000 dólares dependiendo del piso en el cual esté localizada la unidad, su superficie en pies cuadrados, y características opcionales como chimeneas y grandes terrazas entre otros aspectos.

La empresa desarrolló planos arquitectónicos preliminares para tres tamaños de proyecto: 6 pisos con 30 unidades, 12 pisos con 60 unidades y 18 pisos con 90 unidades. El éxito financiero del proyecto dependerá de manera importante de la decisión que tome la empresa en relación con el tamaño del proyecto de los condominios

Estados de la naturalezaEn el análisis de decisiones, los eventos

futuros no controlables que afectan el resultado asociado con una alternativa de decisión reciben el nombre de ESTADOS DE LA NATURALEZA.

La lista de estados posibles de la naturaleza incluye todo lo que puede ocurrir y los estados individuales de la naturaleza se definen de manera que, de hecho solo uno ocurrirá.

Estados de la naturaleza del proyecto

s1 = una elevada aceptación del mercado, y de ahí una demanda sustancial de las unidades. s2 = una baja aceptación del mercado y, por lo tanto, una demanda limitada de las unidades.

Tabla o matriz de pagos

Dadas las tres alternativas de decisión y los dos estados de la naturaleza, ¿qué tamaño de dominio se deberá seleccionar? Para responder a esta pregunta, se necesitará información sobre la utilidad asociada con cada una de las combinaciones de alternativa de decisión y de la naturaleza.

Por ejemplo, ¿qué utilidad se obtendrá si construye un complejo de dominios grande (d3) y la aceptación del mercado resulta elevada (s1)? Pero, ¿qué le ocurrirá a la utilidad si se construye un complejo de condominios grande (d3) y la aceptación en el cado resulta baja (s2)?

Tabla o matriz de pagos para el proyecto del condominio

Árbol de decisión para el proyecto

Como ayuda el análisis de decisiones?

El primer paso en el procedimiento de análisis de decisiones es identificar las alternativas de decisión que están en consideración que son tres:

d1 = un complejo pequeño de condominios con 6 pisos y 30 unidades

d2 =un complejo medio de condominios con 12 pisos y 60 unidades

d3 = un complejo grande de condominios con 18 pisos y 90 unidades

Toma de decisiones con probabilidades

SIMULACIÓN

APLICACIONES DE LA TEORIA DE LA PROBABILIDAD

SIMULACION.

Es uno de los procedimientos cuantitativos mas ampliamente utilizados en la toma de decisiones; sirve para aprender lo relacionado con un sistema real mediante la experimentación con el modelo que lo representa.

El modelo de simulación contiene las expresiones matemáticas y las relaciones lógicas que, dados los valores de las entradas, describen la forma de calcular el valor de los resultados

Aplicaciones:

Introducción de nuevos productos.

Políticas de inventarios.Flujo de la circulación (vías).Líneas de espera.

Entradascontrolables

SalidaModelo

Entradas probabilísticas

Diagrama de un modelo de simulación

Introducirproducto

utilidad(249-c1-c2)x-1000.000

Costo deMano de Obra directaC1

Modelo de utilidad de producto X

Costo de componentes c2

Demandadel primerAño (x)

Precio de venta = 249

Distribución de la probabilidad del costo de mano de obra directa por unidad para el producto X

COSTO DE MANO DE OBRA DIRECTA

PROBABILIDAD

43 dólares 0.1

44 dólares 0.2

45 dólares 0.4

46 dólares 0.2

47 dólares 0.1

Distribución de frecuencia para los 500 números aleatorios generados por computadora

Intervalo Frecuencia0.0 pero inferior a 0.1 53

0.1 pero inferior a 0.2 47

0.2 pero inferior a 0.3 56

0.3 pero inferior a 0.4 44

0.4 pero inferior a 0.5 43

0.5 pero inferior a 0.6 49

0.6 pero inferior a 0.7 54

0.7 pero inferior a 0.8 52

0.8 pero inferior a 0.9 53

0.9 pero inferior a 1.0 49

Total 500

Distribución y probabilidad uniforme para el costo de componentes por unidad

80 90 100

1/20

Costo de componente por unidad

Distribución de probabilidad normal de la demanda del primer año

Desviación std4500 unidades

15000

Número de unidades vendidas

INTERVALOS DE LOS NUMEROS ALEATORIOS PARA LA GENERACION DE VALORES DEL COSTO DIRECTO DE MANO DE OBRA POR UNIDAD PARA

EL PRODUCTO X

Costo de Mano de obra por unidad

Probabilidad Intervalos de los números aleatorios

43 dólares 0.1 0.0 pero inferior a 0.1

44 dólares 0.2 0.1 pero inferior a 0.3

45 dólares 0.4 0.3 pero inferior a 0.7

46 dólares 0.2 0.7 pero inferior a 0.9

47 dólares 0.1 0.9 pero inferior a 1.0

HISTOGRAMA DE 500 NÚMEROS ALEATORIOS

0,0000 0,2000 0,4000 0,6000 0,8000 1,0000

0

5

10

15

20

25

Fre

cu

en

cia

Mean = 0,5067Std. Dev. = 0,2853789N = 500

Generación aleatoria de 10 valores para el costo de mano de obra directa por unidad

Ensayo Número aleatorio Costo de M de O. D

1 0.9109 47

2 0.2841 44

3 0.6531 45

4 0.0367 43

5 0.3451 45

6 0.2757 44

7 0.6859 45

8 0.6246 45

9 0.4936 45

10 0.8077 46

Generación aleatoria de 10 valores para el costo de componentes por unidad

Ensayo Número aleatorio Costo de componentes

1 0.2680 85.36

2 0.5842 91.68

3 0.6675 93.35

4 0.9280 98.56

5 0.4180 88.36

6 0.7342 94.68

7 0.4325 88.65

8 0.1186 82.37

9 0.6944 93.89

10 0.7869 95.74

Generación aleatoria de 10 valores para la demanda del primer año

Ensayo Número aleatorio Costo de componentes

1 0.7005 17.366

2 0.3204 12.900

3 0.8968 20.686

4 0.1804 10.888

5 0.4346 14.259

6 0.9605 22.904

7 0.5646 15.732

8 0.7334 17.804

9 0.0216 5.902

10 0.3218 12.918

Ejecución del modelo de simulaciónParámetros del modelo:

Precio de venta: 249 umCostos Administrativos: 400.000

umPublicidad: 600.000 um

Utilidad=(249-c1-c2)*X-1000.000Utilidad=(249-47-85.36)17366-1000.000Utilidad=1.025.570 um

Resultados de la simulación para 10 ensayos

Ensayo Costo de MOD

Costo de componentes

Unidades vendidas

Utilidad

1 47 85.36 17366 1.025.570

2 44 91.68 12900 461.828

3 45 93.35 20686 1.288.906

4 43 98.56 10888 169.807

5 45 88.36 14259 648.911

6 44 94.68 22904 1.526.769

7 45 88.65 15732 814.686

8 45 82.37 17804 1.165.501

9 45 93.89 5902 -350.131

10 46 95.74 12918 385.585

Total 449 912.64 151359 7.137.432

Promedio 44.90 91.26 15.136 713.743

ESTADÍSTICAS DESCRIPTIVAS PARA 500 ENSAYOS DE LA SIMULACIÓN DEL PRODUCTO X

ESTADÍSTICAESTADÍSTICA VALORVALORTamaño de la muestra 500Utilidad Media $698.457Utilidad Mediana $709.695Desviación STD $520.485Utilidad mínima $-785.234Utilidad máxima $2.367.058Numero de perdidas 51Probabilidad de perdida 0.102

HISTOGRAMA DE LA UTILIDAD SIMULADA PARA 500 ENSAYOS

TEST DE HIPOTESISOtra manera de hacer inferencia, es

plantear una hipótesis estadística sobre algún parámetro poblacional.

Por ejemplo, un investigador quiere estimar el promedio de gastos mensuales de las familias en Manizales. El parámetro, es la media poblacional (μ). El podría plantear que la media es 850.000. Dado que no puede encuestar las 100.000 familias que hay en Manizales, debe tomar una muestra (representativa) y por medio de análisis de inferencia estadística, aceptara o rechazara la hipótesis.

TIPOS DE HIPOTESISHIPOTESIS NULA. H0

HIPOTESIS ALTERNTIVA. H1

La hipótesis alternativa se refiere a la hipótesis del investigador. La hipótesis nula es la negación de la alternativa.

H0: μ = 850.000

H1: μ ≠ 850.000

DECISIONES SOBRE LA HIPOTESIS NULA

HIPOTESIS NULA CIERTA

HIPOTESIS NULA FALSA

ACEPTAR DECISION CORRECTA

ERROR TIPO II

Probabilidad β

RECHAZAR ERROR TIPO I

Probabilidad α

DECISION CORRECTA

AREAS DE ACEPTCION Y RECHAZO DE Ho

Pasos para probar una hipótesis1. Plantear la hipótesis2. Determinar el nivel de significación (α)3. Establecer los valores críticos (Zc, tc, 2,

F)4. Calcular los valores reales de (Zc, tc, 2,

F)Tomar la decisión comparando los valores

críticos con los reales.

CONTINUACION DEL EJEMPLO DE LOS INGRESOS DE LAS FAMILIAS EN MANIZALES

Paso 1

H0: μ = 850.000H1: μ ≠ 850.000Paso 2 α= 10%Paso 3

El investigador para probar la hipótesis toma una muestra de 10 familias y encontró que la media de los ingresos era de $700.000 con una des. std de $300.000

Calculo de los valores reales de z

58.110/000.300

000.850000.700

Z

Z

QUE DECISION TOMA EL INVESTIGADOR?

ACEPTA LA HIPOTESIS NULA?RECHAZA LA HIPOTESIS NULA?

DECISION CORRECTA

Zr = -1.57

PRUEBAS DE HIPOTESIS PARA DIFERENCIAS A. DIFERENCIA DE MEDIASH0: μ1 = μ2

H1: μ1 ≠ μ2

2

22

1

21

21210

)()(

nn

XXZ

Si no conocemos las varianzas, la distribución sigue una t Student por lo tanto el estadístico de prueba seria:

21

2121

11

)()(

nnDSC

XXt

2

)1()1(

21

222

211

nn

snsnDSC

OFERTA SALARIAL (MILLONES DE PESOS)

HOMBRES MUJERES

2.62 2.26

2.47 2.36

2.84 2.93

2.17 2.23

2.86 2.62

2.93 2.59

2.83 2.85

2.43 2.13

Análisis descriptivo según Statgraphics.

hombres mujeres ------------------------------------------------------------n 8 8

Media 2,64125 2,49625

varianza 0,0720125 0,0881125 Desv std 0,268351 0,296837 Mínimo 2,17 2,13 Maximo 2,93 2,93 Rango 0,76 0,8

Diagrama de caja para comparación de medias

Box-and-Whisker Plot

2,1

2,3

2,5

2,7

2,9

3,1

Hombres Mujeres

POBLACION 1 POBLACION 3POBLACION 2

SON IGUALES LOS INGRESOS EN LAS TRES POBLACIONES ?

= =

? ?

ANALISIS DE VARIANZASe emplea cuando se tiene mas de dos

poblaciones y se quiere comparar si hay diferencias estadísticamente significativas en sus promedios. El test de hipótesis que se plantes es:

Por lo menos dos promedios son diferentes:1H

3210 H

3210 H

COMPARACION DE MULTIPLES MUESTRAS

INGRESOS 1 INGRESOS 2 INGRESOS 3

28 22 33

37 27 29

34 29 39

29 20 33

31 18 37

33 30 38

TABLA ANOVAFUENTE DE VARIACION

SUMA DE CUADRADOS

SC

GRADOS DE LIBARTAD

GL

CUADRADOS MEDIOS

CM

F P VALOR

ENTRE GRUPOS

SCA K-1 CMA

SCA/GL

CMA/CME

DENTRO GRUPOS

SCE n-K CME

SCE/GL

TOTAL SCT n-1

Tabla ANOVA

Análisis de Varianza ----------------------------------------------------------------------------- Fuente de SC GL CM F-Ratio P-Value variación ----------------------------------------------------------------------------- Entre grupos 354,111 2 177,056 10,45 0,0014 Dentro grupos 254,167 15 16,9444 ----------------------------------------------------------------------------- Total 608,278 17

Comparamos el F calculado con el F dado en la tabla.

Aceptamos Ho ?

Box-and-Whisker Plot

PROVEEDOR 1 PROVEEDOR 2 PROVEEDOR318

22

26

30

34

38

42

ANALISIS DE REGRESION

Definición:El termino regresión fue introducido por

Francis Galton quien en un articulo famoso planteo que a pesar de la presencia de una tendencia en la que padres de estatura alta tenían hijos altos y los padres de estatura baja tenían hijos bajos, la estatura promedio de los niños nacidos de padres de una estatura dada tendía a moverse o “regresar” hacia la estatura promedio de la población total[1].

[1] Francis Galton, “Family Líquenes in Stature”. Proceedings of Royal Society, London, vol 40, 1886. pg. 42-72

INTERPRETACION MODERNA DE LA REGRESIÓN.

Se puede decir que la regresión trata del estudio de la dependencia de la variable dependiente, respecto de una o más variables (las variables explicativas) con el objetivo de estimar y/o predecir la media o valor promedio poblacional de la primera en términos de lo valores conocidos o fijos (en muestras repetidas) de las últimas.

Ingreso

3002001000

Consum

o

200

180

160

140

120

100

80

60

40

ii XXYE 10)/(

33

2210 XXXY

0,00 20,00 40,00 60,00 80,00 100,00

V1

0,00

200,00

400,00

600,00

800,00V

AR

00

003

R2 cuadrático =1

Variable dependiente promedio:

n

tyny

1

1

Desviación estándar de la variable dependiente

1

)(1

2

n

yyDS

n

tt

Estadístico F

n

tteSCR

1

2

)/(

)1/()(

knSCR

KSCRSCEF

Suma de cuadrados de residuales

0...210 kH

00 unmenosAlH

Probabilidad del estadístico F

kn

es

n

tt

e 1

2

2

Error estándar de la regresión

n

tt

n

tt

yy

eR

1

2

1

2

2

)(1

R2, Coeficiente de Determinación

n

tt

n

tt

yyn

ekn

R

1

2

1

2

2

)(1

1

1

1

R2 ajustado, Coeficiente de Determinación ajustado 

ttt xy 10

ttt 1

),0( 2 Niidt

n

tt

tt

e

ee

DW

1

2

21)(

Estadístico de Durbin Watson 

Modelado y pronóstico de la tendenciaModelado de la tendencia.

Evolución lenta y a largo plazo de las variables que se desean modelar y pronosticar, causadas por la lenta evolución de las preferencias, tecnologías, etc.

150000

160000

170000

180000

190000

200000

1990 1991 1992 1993 1994

1 5 9 13

17

21

25

29

33

37

41

45

49

53

57

61

65

69

73

77

81

85

89

93

97

Número secuencial

-20,00

0,00

20,00

40,00

60,00

80,00VAR00001

VAR00002

Tendencia=10-0.25*T

Tendencia=-50+0.8*T

TENDENCIAS LINEALES CRECIENTE Y DECRECIENTE