38
Variable Aleatoria Continua. Principales Distribuciones Definición de v. a. continua Función de Densidad Función de Distribución Características de las v.a. continuas Principales Distribuciones continuas Ejercicios

distribuciones continuas

Embed Size (px)

DESCRIPTION

inferencia estadistica, distribuciones probabilisticas

Citation preview

Page 1: distribuciones continuas

Variable Aleatoria Continua.Principales DistribucionesDefinición de v. a. continuaFunción de DensidadFunción de DistribuciónCaracterísticas de las v.a. continuasPrincipales Distribuciones continuasEjercicios

Page 2: distribuciones continuas

Definición de v. a. continuaLas variables aleatorias continuas se definen sobre espacios muestrales infinitos

no numerables, es decir, toman un número de valores infinito. Se representan mediante letras mayúsculas y pueden tomar como posibles valores:

X = x1, x2, ... , xi , ... , xn, … Se suele comentar que las variables aleatorias discretas son el resultado de

contar (edad de una persona, nº de hijos, nº de hermanos, nº de veces que aparece cara en un lanzamiento de moneda, nº de puntos de un dado, etc…), mientras que las variables aleatorias continuas son el resultado de medir (velocidad media de un automóvil, talla y peso de una persona, etc…)

Ejemplo: Si consideramos la variable aleatoria altura de las personas españolas mayores

de 21 años, esta variable puede tomar infinitos valores, ya que entre cualesquiera dos valores, digamos 163.5 y 164.5, pueden darse infinitos valores de altura, uno de los cuales es exactamente el 164.

Page 3: distribuciones continuas

Función de Densidad: f(x)Definición

Es una función no negativa de integral 1. Piénsalo como la generalización del

histograma con frecuencias relativas para variables continuas.

¿Para qué lo voy a usar? Nunca lo vas a usar directamente. Sus valores no representan

probabilidades.

Page 4: distribuciones continuas

Función de Densidad: f(x)¿Para qué sirve la f. densidad?Muchos procesos aleatorios vienen descritos por variables de forma que son conocidas las probabilidades en intervalos.

La integral definida de la función de densidad en dichos intervalos coincide con la probabilidad de los mismos.

Es decir, identificamos la probabilidad de un intervalo con el área bajo la función de densidad.

Page 5: distribuciones continuas

Función de Densidad: f(x)Sea (Ω, (Ω), P) un espacio de probabilidad y X una v. a. c. Se llama función de ℘

densidad, f(x), a una función real no negativa, tal que a, b R, con -∞ ≤ a ≤ b ≤ ∞:

y que verifica:(i) f(x) 0 (ii) Gráficamente se representa mediante una curva.

Observación f(x) no representa la probabilidadde nada, es sólo al integrar cuandoobtenemos probabilidades.

Page 6: distribuciones continuas

Función de Distribución, F(x)Es la función que asocia a cada valor de una variable, la probabilidad acumulada de los valores inferiores o iguales.

Piénsalo como la generalización de lasfrecuencias acumuladas. Diagrama integral.

A los valores extremadamente bajos les corresponden valores de la función de distribución cercanos a cero.

A los valores extremadamente altos les corresponden valores de la función de distribución cercanos a uno.

Lo encontraremos en los artículos y aplicaciones en forma de “p-valor”, significación,…

No le deis más importancia a este comentario ahora. Ya os irá sonando conforme avancemos.

Page 7: distribuciones continuas

Función de Distribución, F(x)Sea (, (), P) un espacio de probabilidad, X v. a. continua, xi i = 1 .. los

valores que toma y f(x) la función de densidad de X.

Se llama función de distribución (acumulativa) de la v.a.c. X, F(x), a la probabilidad de que X sea menor o igual que x; es decir:

Que cumple las siguientes propiedades: (i) F(- ) = 0 (iii) F() = 1 (v) F es monótona no decreciente, es decir, si xi xj entonces F(xi) F(xj) (vi) F es continua(vii) Si f(x) es continua, entonces F(x) es derivable y

(viii) P(a X b) = F(b) - F(a) =

Page 8: distribuciones continuas

Función de Distribución, F(x)Gráficamente resulta:

Page 9: distribuciones continuas

Características de las v.a. continuasSe trata de resumir la información de una variable aleatoria en un conjunto de

medidas (números).

Esperanza: Sea X una v. a. c. El valor esperado o esperanza matemática de X, denotada

por E(X) o por µ, se define como:

E(X) es un valor fijo que depende de la distribución de probabilidad de X. Está medida en las mismas unidades que X.

Propiedades de la esperanza: (i) Si C es una constante, entonces E(C) = C. (ii) Linealidad: E(aX + b) = aE(X) + b, a, b (iii) Si g(X) es una función de X, entonces:

(iv) Si g(X), h(X) son funciones de X, entonces E[g(X)+h(X)]=E[g(X)]+E[h(X)] (v) |E[g(X)]| E[|g(X)|]

Page 10: distribuciones continuas

Características de las v.a. continuasVarianza:Sea X una v. a. d. La varianza de X se denota con Var(X), V(X) o 2 y se

define como

La raíz cuadrada positiva de la varianza se llama desviación típica y se denota con . Tanto la varianza como la desviación típica miden la dispersión de la v.a. respecto a su media.

Observaciones: - La varianza y la desviación típica son cantidades positivas. - La desviación típica está medida en las mismas unidades que la v.a.

Propiedades de la varianza: (i) Si C es una constante, V(C)=0 (ii) V(X) = E(X2) - E2(X) (iii) Si a y b son constantes: V(aX+b) = a2 V(X) La desviación media se define como la esperanza de |X-µ|.

dxxfXXV )()()( 2

Page 11: distribuciones continuas

Principales DistribucionesComo ocurría con las variables aleatorias discretas, en la práctica, la función de densidad de la mayoría de las variables continuas se ajusta a un modelo teórico expresado mediante una fórmula concreta. Veremos los más habituales.

V.A. CONTINUAS

Normal N(, )

Chi-Cuadrado de Pearson 2

t de Student

F de Fisher-Snedecor

Page 12: distribuciones continuas

Principales DistribucionesDistribución Normal N(,) Es el modelo de distribución más utilizado en la práctica, ya que:1. Multitud de fenómenos se comportan según una distribución normal.

(distribución de pesos, alturas, coeficientes de inteligencia, errores en la medida, etc…)

2. Es la distribución muestral de varios estadísticos maestrales, tales como la media, etc…

3. Es una buena aproximación de otras distribuciones (así la distribución de una variable binomial, de Poisson, etc… son aproximadamente normales).

Se dice que una variable aleatoria continua sigue una distribución normal si su función de densidad viene dada por la expresión:

2

21

21)(

x

exf

Page 13: distribuciones continuas

Principales DistribucionesEsta distribución viene definida por dos parámetros:: es el valor medio de la distribución y es precisamente donde se sitúa el centro de la curva (de la campana de Gauss).: es la desviación típica. Indica si los valores están más o menos alejados del valor central

N(μ, σ): Interpretación geométrica

Podéis interpretar la media como un factor de traslación.

Y la desviación típica como un factor de escala, grado de dispersión,…

Page 14: distribuciones continuas

Principales DistribucionesLos puntos de inflexión de la fun. de densidad están a distancia σ de μ.Si tomamos intervalos centrados en μ, y cuyos extremos están…

a distancia σ, tenemos probabilidad 68%a distancia 2 σ, tenemos probabilidad 95%a distancia 2’5 σ tenemos probabilidad 99%

N(μ, σ): Interpretación probabilista

Entre la media y una desviación típica tenemos siempre la misma probabilidad: aprox. 68%

Entre la media y dos desviaciones típicas aprox. 95%

Page 15: distribuciones continuas

Principales DistribucionesSe caracteriza porque la gráfica de la función de densidad forma una curva, simétrica respecto a un valor central que coincide con la media de la distribución, y se extiende sin límite, tanto en la dirección positiva como negativa del eje X, de forma asintótica (campana de Gauss).

La función de densidad es simétrica, mesocúrtica y unimodal.Media, mediana y moda coinciden.

Por ser función de densidad, el área total encerrada bajo la curva y sobre el eje X es igual a 1. Un 50% de los valores están a la derecha de este valor central y otro 50% a la izquierda.

Page 16: distribuciones continuas

Principales DistribucionesLa curva de cualquier función de densidad está construida de tal modo que el área bajo la curva, limitada por los dos puntos x = a y x = b es igual a la probabilidad de que la variable aleatoria X asuma un valor entre x = a y x = b.

No es posible calcular la probabilidad de un intervalo simplemente usando la primitiva de la función de densidad, ya que no tiene primitiva expresable en términos de funciones ‘comunes’.

Page 17: distribuciones continuas

Principales DistribucionesEs posible transformar todas las observaciones de cualquier v. a. X con distribución normal N(μ, σ), mediante una traslación μ, y un cambio de escala σ, a un nuevo conjunto de observaciones de una variable aleatoria normal Z con media 0 y varianza 1 Z=N(0,1). Esta distribución normal se denomina normal tipificada, y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución.

Para transformar una v. a. X en una normal tipificada se crea una nueva variable (Z) que será:

Por tanto:

bZaPbXaP

xZPxXP i

i

)(

)(

xz

Page 18: distribuciones continuas

Principales Distribuciones¿Cómo se trabaja con la tabla de la normal tipificada?

La columna de la izquierda indica el valor cuya probabilidad acumulada queremos conocer. La primera fila nos indica el segundo decimal del valor que estamos consultando. Los valores del interior de la tabla representan áreas (o probabilidades)Llamaremos z al punto del eje OX que deja a su izquierda un área en la curva, es decir

Como la curva normal es simétrica respecto a su media y esta, en el caso de la normal tipificada (que es la tabulada) es 0, se verifica

Hay ocasiones en que estamos interesados en conocer el punto del eje OX que deja a su izquierda , bajo la curva normal tipificada, un área . En estos casos buscamos en el interior de la tabla el valor más cercano a , y las coordenadas de la fila-columna de la posición de ese valor nos da el punto buscado.

)( zZP

1zz

Page 19: distribuciones continuas

Principales DistribucionesZ es normal tipificada.

Calcular P [Z<1,85]

Solución: 0,968 = 96,8%

Page 20: distribuciones continuas

Principales DistribucionesZ es normal tipificada.

Calcular P[Z<-0,54]

Solución: 1-0,705 = 0,295

Page 21: distribuciones continuas

Principales Distribuciones

Z es normal tipificada.

Calcular P[-0,54<Z<1,85]

Solución: 0,968-0,295= 0,673

Page 22: distribuciones continuas

Principales DistribucionesAproximación de la Binomial a la Normal.Distribución Binomial:

Si n es pequeña Las probabilidades se obtienen de la fórmula de la binomial o de su tabla acumulada.

Si n es grande Las probabilidades se obtienen por aproximación.

Aproximación discreta (la de Poisson) para aproximar probabilidades de la binomial cuando n es grande y p cercana a 0 ó a 1 (1-p cercano a 0).

Aproximación continua (la normal) para aproximar probabilidades de la binomial es excelente cuando n es grande (n >30) pero sigue siendo buena para valores relativamente pequeños de n, siempre y cuando p esté cercano a 0.5. (np y nq ambos 5).Cuidado con las probabilidades asociadas a los puntos extremos de los intervalos considerados Corrección de continuidad

Page 23: distribuciones continuas

Principales DistribucionesEjemplo:

Una prueba de opción múltiple tiene 200 preguntas, cada una con 4 posibles respuestas, de las cuales sólo 1 es la correcta. ¿Cuál es la probabilidad de que un alumno que contesta al azar 80 de ellas acierte entre 25 y 30? La probabilidad de una respuesta correcta para cada una de las 80 respuestas es p=1/4.

X = nº de respuestas correctas de las 80 contestadas XB(80, ¼)

P(25 X 30)=

Usamos la aproximación a la normal con = np = 80. ¼ = 20 y

Se necesita conocer el área entre 24.5 y 30.5 (por la corrección de continuidad). Los correspondientes valores de Z son:

873.343

4180 npq

30

254

1,80;x

xb

71.2873.3

205.30

16.1873.3

205.24

2

1

Z

Z

Page 24: distribuciones continuas

Principales DistribucionesLa probabilidad de responder correctamente de 35 a 30 preguntas la

proporciona el área comprendida entre estos dos valores bajo la curva de la normal estándar

1196.08770.09966.0)16.1()71.2(

)71.216.1(41,80;)3025(

30

25

ZPZP

ZPxbXPx

Page 25: distribuciones continuas

Principales DistribucionesDistribución Chi - Cuadrado de Pearson 2

k

Tiene un sólo parámetro denominado grados de libertad.

La función de densidad es asimétrica positiva. Sólo tienen densidad los valores positivos.

La función de densidad se hace más simétrica incluso casi gausiana cuando aumenta el número de grados de libertad.

Normalmente consideraremos anómalos aquellos valores de la variable de la “cola de la derecha”.

Page 26: distribuciones continuas

Principales DistribucionesDistribución Chi - Cuadrado de Pearson 2

k

Page 27: distribuciones continuas

Principales DistribucionesAproximación de 2 a la Normal

Page 28: distribuciones continuas

Principales DistribucionesDistribución t de Student tk

Tiene un parámetro denominado grados de libertad.

Cuando aumentan los grados de libertad, más se acerca a N(0,1).

Es simétrica con respecto al cero.

Se consideran valores anómalos los que se alejan de cero (positivos o negativos).

Page 29: distribuciones continuas

Principales DistribucionesDistribución t de Student tk

Page 30: distribuciones continuas

Principales DistribucionesDistribución F de Fisher-Snedecor Fk1,k2

Tiene dos parámetros denominados grados de libertad.

Sólo toma valores positivos. Es asimétrica.

Normalmente se consideran valores anómalos los de la cola de la derecha.

Page 31: distribuciones continuas

Principales DistribucionesDistribución F de Fisher-Snedecor Fk1,k2

Page 32: distribuciones continuas

EjerciciosEjercicio 4.1La variable X=" nº de centímetros a que un dardo queda del centro" al ser

tirado por una persona, se observó que tenía por función de densidad f(x): k 0<x<10

0 restantes casos Se pide:

a) Hallar k para que f(x) sea función de densidad. Representarlab) Hallar la función de distribución. Representarlac) Media, Varianza y Desviación Típica.d) P(X1)e) Probabilidad de acertar en la diana.

Ejercicio 4.2Se emplean calibradores para rechazar todos los componentes en los cuales

haya cierta dimensión cuya medida no esté dentro de las especificaciones 1.5 d. Se sabe que esta medida tiene una distribución normal con media 1.5 y desviación estándar de 0.2. Determine el valor de d, de modo que las especificaciones cubran el 95% de las medidas.

Page 33: distribuciones continuas

EjerciciosEjercicio 4.3En la observación del nº de glóbulos rojos (en millones) de los habitantes de

una gran ciudad se observó que seguían aproximadamente una distribución normal de media 4.5 y desviación típica 0.5.

Se pide calcular:a) Probabilidad de que un habitante tomado al azar tenga más de cinco

millones de glóbulos rojos.b) Tanto por ciento de la ciudad con menos de 3.75 millonesc) Nº de glóbulos rojos del 20 por 100 más alto de la ciudadd) Nº de glóbulos rojos del 10 por 100 más bajo de la ciudade) Nº de glóbulos rojos del 80 por 100 más próximo a la media

Page 34: distribuciones continuas

EjerciciosEjercicio 4.4Un biólogo comprobó que la probabilidad de que al inyectar a una rata un

determinado producto sobreviviera después de una semana era de 0.5. Si el biólogo inyectó el producto a un lote de 100 ratas.

Se pide calcular:a) Probabilidad de que vivan más de 65b) Probabilidad de que vivan entre 40 y 60c) Probabilidad de que vivan menos de 30d) Probabilidad de que vivan más de 45. ¿Qué significa esta

probabilidad?

Ejercicio 4.5Una variable aleatoria sigue una distribución 2 de Pearson. Se pide

calcular:a) Los puntos críticos: 2 0.90;5 2 0.01;26 2 0.025;8 2 0.08;10

b) Las probabilidades: P(28 3.49); P(2

8 15.51); P(210 4);

P(220 29);

Page 35: distribuciones continuas

Ejercicios Ejercicio 4.6Una variable aleatoria sigue una distribución t de StudentSe pide calcular:

a) Los puntos críticos: t 0.20;20 t 0.99;10 t 0.25;10 b) Las probabilidades: P(t10 1.372); P(t8 1.2); P(-0.5 t6

0.6); P(|t24|>2)

Ejercicio 4.7Una variable aleatoria sigue una distribución F de Fisher-SnedecorSe pide calcular:

a) Los puntos críticos: F0.1;10,12 F0.05;5,24 F 0.90;28,30 b) Las probabilidades: P(2 F10;20 2.25)

Page 36: distribuciones continuas

EjerciciosEjercicio 4.8La población de sujetos tallados en el servicio militar se distribuye en X:

altura N (1,69; 0,01) y en Y: peso N (68,2; 1,80). Suponiendo que ambas variables son independientes en la población y que seleccionamos una muestra aleatoria de 10 sujetos:

a) ¿Cuál es la probabilidad de que su estatura esté comprendida entre 1,65 y 1,70 m.?

b) ¿Cuál es la probabilidad de que su altura y peso sean superiores a 1,72 m. y 65 kg.?

c) ¿Cuáles son los pesos que delimitan al 50 por 100 central de los sujetos?

d) Si creamos la nueva variable: W = 2 ·X: Calcule E(W), σ2(W) y P(3,32 ≤ W ≤ 3,40)

Page 37: distribuciones continuas

EjerciciosEjercicio 4.9La variable extroversión (X) se distribuye según el modelo normal con

media 50 y desviación típica 10. Conteste a las siguientes preguntas:a) Probabilidad de que los sujetos obtengan como mucho una puntuación

de 35b) Probabilidad de que los sujetos obtengan una puntuación mayor de 60

en extroversiónc) Calcule la puntuación en extroversión que deja por debajo de sí al

80% de los sujetosd) Probabilidad de observar un valor comprendido entre 42 y 59e) Calcule la puntuación que corresponde al centil 90 en directas,

diferenciales y típicasf) Calcule los valores que acotan el 50% central de sujetosg) Calcule la puntuación S que corresponde al centil 75 (siendo S= 2·zi+5)h) Si se extrae una muestra aleatoria de 25 alumnos, ¿cuál es la

probabilidad de que su media aritmética sea mayor de 55?

Page 38: distribuciones continuas

EjerciciosEjercicio 4.10 La variable U se distribuye según 2 con 9 grados de libertad, la variable V

se distribuye según t de student con 15 grados de libertad y la variable W se distribuye según F de Snedecor con 6 y 8 grados de libertad.

Según esto conteste a las siguientes preguntas:a) Probabilidad de que la variable U adopte como mucho el valor 8b) Puntuación U tal que la probabilidad de obtener como máximo

ese valor sea 0,70c) Probabilidad de observar valores en la variable V entre -1,341 y

2,602d) Calcular la puntuación V que corresponde al centil 80e) Probabilidad de que la variable W adopte como mínimo el valor

4,65f) Puntuación W que corresponde a la probabilidad acumulada de

0,90