30
istemas de ayuda a la decisión odelización de la incertidumbre Indice 1) Sucesos aleatorios. Espacio muestral. 2) Operaciones con sucesos. 3) Enfoques de la Probabilidad. 4) Axiomas de Kolmogorov. 5) Axiomas de la Probabilidad subjetiva. 6) Resultados básicos con probabilidades. 7) Variables aleatorias. 8) Educción de probabilidades.

Sistemas de ayuda a la decisión Modelización de la incertidumbre Indice 1) Sucesos aleatorios. Espacio muestral. 2) Operaciones con sucesos. 3) Enfoques

  • View
    217

  • Download
    3

Embed Size (px)

Citation preview

Sistemas de ayuda a la decisión Modelización de la incertidumbre

Indice

1) Sucesos aleatorios. Espacio muestral. 2) Operaciones con sucesos. 3) Enfoques de la Probabilidad. 4) Axiomas de Kolmogorov.5) Axiomas de la Probabilidad subjetiva. 6) Resultados básicos con probabilidades.7) Variables aleatorias. 8) Educción de probabilidades.

•El concepto de variable aleatoria permite pasar de los resultados experimentales (E) a una función numérica (real) de los resultados

•Dado el espacio probabílistico (E, A, P), la aplicación : E , () es un variable aleatoria si x , { E: () x} es un suceso, -1((-,x]) A, -Álgebra

•La probabilidad definida sobre sucesos se transforma en probabilidad de que la variable aleatoria tome valores en (-,x], P( x)

•Se trata de un cambio de lenguaje: antes el algebra de Boole y ahora la Teoría de Funciones del Análisis (herramientas matemáticas: funciones de variable real, cálculo diferencial e integral,.....)

Modelización de la incertidumbre

Variables aleatorias

•Modelización: Abstracción

Modelo de distribución de probabilidad: especifiación de los posibles valores de la variable aleatoria con sus probabilidades

•Notación: X, Y,... variables aleatorias. X()=x, Y()=y,.... número asociado al resultado E, cuantificación

•Lenguaje de sucesos de probabilidad de funciones reales

Sucesos Variable aleatoria - Venta de un producto número de productos vendidos - Llegada de un cliente número de clientes atendidos - Tamaño de un e-mail número de kbytes enviados por e-mail - Fallo de un dispositivo número de horas hasta el fallo de un dispositivo - Curación de un paciente número de años de supervivencia post-tratamiento - Incendio forestal número de hectáreas quemadas (+localización)

Modelización de la incertidumbre

Variables aleatorias

•Diferencias entre Estadística Descriptiva y Cálculo de Probabilidades:

- La variable estadística es descriptiva, analiza hechos.

- La variable aleatoria es probabilista, analiza causas potenciales, sobre el futuro, no hechos, el proceso generador de los hechos, datos

•Tipos de variables aleatorias: asociación entre resultado y un número real

- Discreta: toma un conjunto de valores finito o infinito numerableCardinal(E) N

- Continua: toma valores en un intervalo, Cardinal() potencia del continuo

Modelización de la incertidumbre

Variables aleatorias

•La variable aleatoria no se presta al Análisis Real pues son funciones reales de sucesos (conjuntos) y no de variable real, sobre

•Se introduce la función de distribución de la variable aleatoria :F: [0,1], F(x) = P(() x)

•Propiedades:

1. 0 F(x) 1, x

2. lim x - F(x) = 0, lim x + F(x) = 1

3. x1 < x2 F(x1) F(x2), monotonía no decreciente

4. lim x a+ F(x) = F(a), a , continuidad por la derecha

5. P(a b) = F(b) – F(a), probabilidad de un intervalo

Modelización de la incertidumbre

Variables aleatorias. Función de distribución

•La variable aleatoria se dice discreta si toma valores en un conjunto numerable {x1,x2,…xn,…}, finito o infinito. Si pi = P( xi) 0, i=1,2,…n,…

1. i pi = 12. P( xn) = n

i pi

•Se define la función de probabilidad de la variable aleatoria :

P(=x) = P({ E: ()=x})

•Asignación de probabilidad a los sucesos elementales sobre los que la variable aleatoria toma el valor x. Masa de probabilidad puntual

•Se obtiene la función de distribución de la variable aleatoria :

F(x) = P( xj) = P({ E: () xj}) = xj x P(=xj) = xj x Pj

La F(x) de una variable aleatoria discreta es escalonada

Modelización de la incertidumbre

Variables aleatorias discretas

Modelización de la incertidumbre

Variables aleatorias discretas Binomial

Número de aciertos al observarB resultados dicotómicos o serie de Bernoulli.B=1, distribución de Bernoulli

La probabilidad de observar un número de aciertos en B ensayos independientes con unaproporción de aciertos A

Hipergeométrica: Binomial en un contexto de muestreo de n elementoscon reemplazamiento, Np aciertos,Nq fallos, N=Np+Nq y n PDF = CNp

yCNqn-x/CN

n

Mean = np, Variance = npq(N-n)/(N-1)

Multinomial: resultados en más de dos clases o categorías.

Modelización de la incertidumbre

Variables aleatorias discretas

Geométrica

Número de ensayos independientes hasta el primer acierto, con una propociónA de acierto

Versión discreta de la distribucióncontinua Exponencial

Modelización de la incertidumbre

Variables aleatorias discretas

Binomial Negativa

Número de ensayos hasta completar B aciertos en una serie de Bernoulli.

B=1, distribución geométrica.

Modelización de la incertidumbre

Variables aleatorias discretas

Poisson

Número de eventos en unperiodo de tiempo (soporte) dado con una tasa fija y estable (A) .

Soporte continuo: tiempo,longitud, superficie,…

Modelización de la incertidumbre

Variables aleatorias discretasLogarítmica

Número de eventos en un periodo de tiempo dado.

Número de artículos adquiridospor un comprador en un periodode tiempo dado.

Modelización de la incertidumbre

Variables aleatorias continuas

•Una variable aleatoria es continua si toma valores en un intervalo (xa,xb) Se dice absolutamente continua si P(x x+dx) = f(x)dx, donde f es su función de densidad (generaliza el histograma con infinitas clases)

•Propiedades:

1. f(x) 0, x2. +

- f(x)dx = 13. F(x) = P(- x) = x

- f(t)dt 4. f(x) = dF(x)/dx

el modelo de probabilidad se define con f o F.

•Los puntos o valores discretos de la variable aleatoria continua no tienen masa de probabilidad. La probabilidad de un valor x=a es la del intervalo [a-1/2,a+1/2]

•La probabilidad de un intervalo [a,b] es P(a b) = ba f(t)dt

•Variable aleatoria mixta: F(x) = F1(x)+(1 - )F2(x), 0 1, F1 vad, F2 vac

F(x) x

f(x)

Modelización de la incertidumbre

Variables aleatorias continuas

Algunas distribuciones continuas:

Antilognormal, HalfNormal(A,B), Bell curve, HyperbolicSecant(A,B), Beta(A,B,C,D), Inverse Gaussian, Bilateral exponential, InverseNormal(A,B),Bradford(A,B,C), Laplace(A,B), Burr(A,B,C,D), Logistic(A,B), Cauchy(A,B), LogLogistic, Chi(A,B,C), LogNormal(A,B), Chi-square, LogWeibull, Cobb-Douglas, Lorentz, Cosine(A,B), Maxwell, Double-exponential, Negative exponential, DoubleGamma(A,B,C), Nakagami(A,B,C), DoubleWeibull(A,B,C), Non-central Chi, Erlang, Normal(A,B), Error function, Pareto(A,B), Exponential(A,B), Power-function, Extreme-value Rayleigh, ExtremeLB(A,B,C), Reciprocal(A,B), Fisher-Tippett Rectangular, Fisk(A,B,C) Sech-squared, FoldedNormal(A,B), Semicircular(A,B), Frechet StudentsT(A,B,C), Gamma(A,B,C), Triangular(A,B,C), Gaussian, Uniform(A,B), GenLogistic(A,B,C), Wald, Gompertz, Weibull(A,B,C), Gumbel(A,B)

Modelización de la incertidumbre

Variables aleatorias continuas

La distribución de erroresde observaciones físicasque manifiesta ruido blancoen la medida

Distribución simétrica

Asociadas a la distribuciónNormal están las Distribuciones Chi-cuadrado y t-student

Modelización de la incertidumbre

Variables aleatorias continuas

Distribución asociadaal soporte continuo deLa variable aleatoria discreta de Poisson

Caso particular de ladistribución Gamma yWeibull

Tiempo de vida o entrefallos de procesos sinmemoria

Modelización de la incertidumbre

Variables aleatorias continuas

C=1, distribución Exponencial

Modela distribucionescuya asimetria es muysignificativa

Con C grande se aproxima a la Normal

Modelización de la incertidumbre

Variables aleatorias continuas

C=1, distribuciónExponencial

Generalización de la Distribución Exponencial

Modelización de tiemposen fiabilidad de sistemas

Modelización de la incertidumbre

Variables aleatorias continuas

Describe la ignorancia dentrode un intervalo

Los números pseudo-aleatoriosque se generan en las simulaciones son uniformes en el intervalo [0,1]Posteriomente se utilizan paragenerar valores del procesoaleatorio de interés.

Modelización de la incertidumbre

Variables aleatorias continuas

Estimación bayesiana

Distribución de probabilidad de los parámetros de un Modelo

Modelización de la incertidumbre

Variables aleatorias. Características

•Esperanza E[X], medida de centralización, promedio de los valores de la variable con su probabilidad (va discreta) o densidad de probabilidad (va continua).Es un operador lineal E[aX+b]=aE[X]+b, E[h(X)] = +

- h(t)f(t)dt

•Varianza Var(X), medida de dispersión asociada a la Esperanza Var(X) = 2 = E[(X-E[X])2], promedio con su probabilidad (va discreta) o densidad de probabilidad (va continua). Var(X) = E[X2-E[X]2]. Var((aX+b) = a2Vax(X)

•Cuantiles de orden p [0,1], valores de la variable aleatoria que son la raizde la ecuación F(xp) = p, p {1/4,1/2,3/4} xp cuartiles,p {1/10,1/5,…9/10} xp deciles, p {1/100,1/50,…99/100} xp percentiles

•Momentos de orden k: 0,1,3,4,5,…E[Xk], k = E[(X-E[X])k], E[(X-x*)k]. CAs = 3 / 3, CAp = (4 / 4) – 3, CV = /

Mediana: cuartil x1/2, Moda: Máximo de Pj (va discreta) o de f(x) (va continua)

Tipificación: va X, Y=(X-E[X])/Var(X) presenta E[Y]=0 y Var(Y)=1.

Modelización de la incertidumbre

Variables aleatorias

•Teorema de Markov

Dada la variable aleatoria y g() 0, K > 0,

P(g() K) E[g()]/K

•Desigualdad de Chebyschev

Dadas E[] y de cualquier variable aleatoria, K > 0

P(| - E[]| < K ) 1 – 1/K2

P(| - E[]| K ) < 1/K2

Modelización de la incertidumbre

Educción de probabilidades

•Estimación de probabilidades

•Estimación objetiva (frecuencia relativa) y subjetiva (expertos)

• Asignación de probabilidades: tarea compleja.

Métodos rigurosos y sistemáticos

Métodos directos e indirectos

Probabilidades para variables discretas y continuas

Morgan y Henrion (1990)

Modelización de la incertidumbre

Educción de probabilidades. Métodos de asignación

Datos.

•Momentos (Pearson)Los k parámetros son funciones de los momentos m1,…mkLos momentos muestrales definen k ecuaciones.Estimaciones insesgadas (E[’]= ), efiecientes (min Var()),consistentes (E[’n] )y robustas ((1-)f(X)+ g(X)). ECM(’) = E[(- ’)2]

EMV (Fisher)Maxima verosimilitud, estimar los parámetros de la distribución que maximizan la probabilidad de la muestra observada. Se supone que los datos son variables aleatorios identicamente distribuidas e independientes. Estimaciones insesgadas (E[’]= )

•Otros métodos.

Modelización de la incertidumbre

Educción de probabilidades. Métodos de asignación

•Discretas

Asignación directa (simple y poco fiable)

Asignación basada en apuestas (motivación económica, punto de indiferencia, favorable desfavorable favorable …. Convergencia)

Asignación basada en loterías (comparar sorteos con uno de referencia)

Representación con árboles de sucesos

•Continuas

Utilizar los métodos anteriores para asignar ciertas probabilidades acumuladas y ajustar una función de distribución

Solicitar ciertos cuantiles (percentiles y cuartiles) y ajustar la F

Modelización de la incertidumbre

Educción de probabilidades

Otros métodos - mejoras

•Método de la probabilidad: sesgo de confianza y anclaje, construir la F en ciertos intervalos, contrastar y revisar los resultados

•Método de las alturas relativas: escalas termométricas. Pj, f(x)

•Método de Raiffa-Schlaifer: moda, hipótesis de apuntamiento elevado y probabilidad baja de valores alejados de la moda

•Descomposición y asignación de probabilidades: puede ser en principiomás sencillo asignar probabilidades condicionadas y tendencias.Árboles de probabilidad – escenarios condicionantes

Modelización de la incertidumbre

Educción de probabilidades. Métodos de asignación

Modelización de la incertidumbre

Educción de probabilidades

•Fases de educciónAdquisición de conocimiento (PROBABILISTICO) – Inteligencia Artificial.Marco: encuesta / entrevista + diseño y preparación y ejecución y análisis

1. Motivación: importancia y propósito2. Estructuración: definición de las variables y distribuciones de interés. Escalas, tablas, parametros, características, funciones,…Dependencias.3. Condicionamiento: identificar sesgos y las causas (experto, técnicas,…)

•Tarea compleja en tiempo.

•SRI: fases 1, 2, 3 y4. Codificación: valores extremos (sesgos), redundancia (inconsistencias),revisión, sensibilidad del experto al nivel de información o evidencia5. Verificación: refleja la asignación las creencias del experto?Cuestionario derivado del modelo de probabilidad asignado.

Modelización de la incertidumbre

Educción de probabilidades. Métodos de asignación

Modelización de la incertidumbre

Educción de probabilidades

•Comparativa de métodos.

- Depende del problema, del experto/decisor

- Recomendado: utilizar variso métodos.

•Contraste de Consistencia de los resultados o juicios.Las inconsistencias pueden resolverse o no en el marco del modelo.

•Contraste de Coherencia entre sucesos complementarios. El espacio muestraltiene probabilidad 1.

•Calibración: ensayar el método/técnica en un problema sencillo no trivialantes de atacar la asignación en el problema real

Modelización de la incertidumbre

Educción de probabilidades. Métodos de asignación

Modelización de la incertidumbre

Educción de probabilidades

Sucesos muy rarosAsignación de probabilidades pequeñas de sucesos sin precentes.Estimaciones subjetivas muy sensibles al sesgo (infra/sobrestimación)Difícil discriminar ordenes de magnitud en las probabilidad pequeñas.

•Procedimientos de asignación: descomposición e identificación de factoresque determinan escenarios con probabilidades significativas del suceso raro

•Arboles de sucesos: árboles de probabilidad, etapa ~ factor. El Cálculo de Probabilidades suministra la probabilidad global a partir de las de los factores. Sucesos raros (sr) hojas

•Arboles de fallos: descomposición causaldel suceso raro. Causas hojas.

Modelización de la incertidumbre

Educción de probabilidades. Métodos de asignación

sr1

¬sr

sr2

¬sr¬sr

¬sr

sroy

c1 c3c2

c32c31

Modelización de la incertidumbre

Educción de probabilidades

• Heurísticas y sesgos

1. Disponibilidad de la heurística. Recuerdos fuertes, Imaginación, correlaciones falsas

2. Representividad de la heuristica. Ignorancia de las tasas frecuencia, secuencias de artefactos o patrones previos,ignorancia de la regresión a la media, conjunción de falacias

3. Ajuste de la heurística.Insuficiencia, sobreestimación de conjunción de eventos, infraestimación de disyunciones de eventos.

4. Otros sesgos en los juicios.Sobre estimar los sucesos deseables, propagar la covarianza entre sucesos

• Calidad de los juicios probabilísticos: expertos reales, problemas reales no delaboratorio, asignación comprensible, motivación, frecuencia ~ probabilidad

Modelización de la incertidumbre

Educción de probabilidades. Métodos de asignación

Modelización de la incertidumbre

Educción de probabilidades. Discretización

•Características de variables aleatorias continuas

Simulación, integración, discretización

•Discretización: perdida de información mínima

Por niveles en cada nivel la media o mediana

Uniforme, ajuste de error

No Uniforme, para variables aleatorias multidimensionales

Divergencia de Kullback y Leibler