5. Distribuciones continuas

Preview:

DESCRIPTION

muy buen documento

Citation preview

Distribuciones continuas

Distribución uniforme

Distribución uniforme de probabilidad,

Una variable aleatoria uniforme tiene igual oportunidad de tomar cualquier valor dentro de un intervalo especificado a lo largo de una escala continua,

Una función de densidad de probabilidad f(x) para una variable aleatoria, que es igualmente probable que tome cualesquiera de los valores dentro de un intervalo dado, se denomina distribución uniforme de probabilidad,

0,25

Área de probabilidad

f(x)

x

intervalo

a b

La altura precisa de la función de densidad de probabilidad uniforme, f(x), para diferentes valores, x, de la variable aleatoria uniforme,

f(x)

x

intervalo

a b

0,25

f(x) =1

b - asi a < x < b

f(x) = 0 de otra formaf(x) =

1

3 - 1

f(x) =1

2

Calcular la altura

f(x)

x

intervalo

a b

0,25

La probabilidad se mide una vez más por el área arriba del intervalo de valores x que es de interés, Si se acumular valores x de izquierda a derecha, se obtiene la fórmula:

P(X < x) = x - ab - a

x

P(X < x) = 1,5 - 13 - 1 = 0,5

2 = 0,25

Calculo de la media y la desviación estándar de la distribución uniforme,

f(x)

x

intervalo

a b

0,25

x

µx = a + b

21 + 3

=2

=4

2= 2

σx2 = (b – a)2

12 =(3 – 1)2

12 = 0,333

σx = 0,333√ = 0,5774,

Media:

Varianza:

Desviación estándar:

Distribución exponencial

Distribución exponencial

Recuerda que la distribución de poisson proporciona información de probabilidades de acontecimientos en, espacio o tiempo, como: las llegadas de camiones a una caseta de cobro, las personas que llegan a un banco, el número de defectos por metro cuadrado en una tela de alambre, …

Pero no todas las personas están interesadas en los tiempo de llegadas, como los clientes que consideran el tiempo en que tardan ser atendidos; a estos, se les provee un tiempo de servicio, con distribución exponencial.

La probabilidad de encontrar intervalos especificados de, tiempo o espacio, entre acontecimientos consecutivos se puede describir por la distribución de probabilidad exponencial.

Las frecuencias mas grandes de los intervalos de los tiempos de entre llegadas, o el número de fallas en una área especificada, están ubicadas en los primeros intervalos de la gráfica exponencial.

En la medida que los intervalos de, tiempo o espacio, se van alejando hacia el infinito (+∞), la frecuencia de los acontecimientos van disminuyendo conforme una función exponencial.

+∞

Estos intervalos de valor menor, son más probables que sucedan

Los intervalos de mayor valor, son más probables que no sucedan

Los valores X de los intervalos son positivos hasta el infinito

La función densidad f(x), es una asíntota que tiende acercarse al eje horizontal; va hasta el infinito, y jamás lo toca.

La fórmula:

Función de densidad de probabilidad exponencial f(x) = λ*e-λx

λ es la taza rapidez del proceso, cuando mayor sea λ, menor será µx = σx y menos dispersa la distribución, es decir:

λ = 0,5 λ = 1

λ = 2 λ = 3

Donde x > 0 y λ > 0

µx = 1λ

La fórmula:

Función de densidad de probabilidad exponencial f(x) = λ*e-λx

λ es la taza o rapidez del proceso, cuando mayor sea λ, menor será µx = σx y menos dispersa la distribución, es decir:

Donde x > 0 y λ > 0

λ y x, ambas deben estar expresadas en las mismas unidades: minutos, segundos, horas, metros cuadrados, o unidades lineales, etc,

Si las unidades de x está definida en 100,000 horas, las unidades de λ también debe definirse igual, por ejemplo:

x = 15 x 105 horas λ = 0,25 x 105 horas,

La constante e = 2,71828

µx = 1λ

x = 25 x m2 λ = 2 x m2,

La fórmula:

Función de densidad de probabilidad exponencial f(x) = λ*e-λx

λ es la taza o rapidez del proceso, cuando mayor sea λ, menor será µx = σx y menos dispersa la distribución, es decir:

Donde x > 0 y λ > 0

µx = 1λ

El área total bajo la función de densidad f(x), desde 0 hasta + ∞, es igual a 1,

1

+ ∞

La fórmula:

Función de densidad de probabilidad exponencial f(x) = λ*e-λx

λ es la taza o rapidez del proceso, cuando mayor sea λ, menor será µx = σx y menos dispersa la distribución, es decir:

Donde x > 0 y λ > 0

µx = 1λ

+ ∞

Se pueden encontrar varias probabilidades en áreas bajo la curva, para diferentes límites de la variable aleatoria exponencial X:

Encontrar el área bajo la función densidad de probabilidad exponencial, a la izquierda de un valor dado por la variable aleatoria exponencial x, con la siguiente fórmula:

P(X < x) = 1 – e-λx o P(X < x) = 1 – e-x/µx

x

P(X < x)

La fórmula:

Función de densidad de probabilidad exponencial f(x) = λ*e-λx

λ es la taza o rapidez del proceso, cuando mayor sea λ, menor será µx = σx y menos dispersa la distribución, es decir:

Donde x > 0 y λ > 0

µx = 1λ

+ ∞

Se pueden encontrar varias probabilidades en áreas bajo la curva para diferentes límites de la variable aleatoria exponencial X,

Encontrar el área bajo la función densidad de probabilidad exponencial, a la derecha de un valor dado por la variable aleatoria exponencial x, con la fórmula (complemento):

P(x < X) = e-λx = P(x < X) = e-x/µ x

x

P(x < X)

Encontrar la probabilidad exponencial indicada por el área bajo la curva dentro del intervalo específico (x1 < X < x2)

P(x1 < X < x2) = F(x2) – F(x1) Probabilidad de densidad acumulada desde 0 hasta la variable aleatoria x1

P(X < x2) = 1 – e-λxF(x2) = 2

P(X < x1) = 1 – e-λxF(x1) = 1

x2

F(x2)

F(x1)

x1

F(x2) – F(x1) = P(x1 < X < x2)Se restan ambas probabilidades acumuladas para encontrar la probabilidad que ocurra un evento entre el intervalo específico,

1 – e-λx – (1 – e-λx ) = – e-λx + e-λx 2 21 1

F(x2) – F(x1)

Probabilidad de densidad acumulada desde 0 hasta la variable aleatoria x2

Ejemplo:Sea X = el tiempo entre dos llegadas sucesivas a la ventanilla de autopago de un banco local; y si X tiene una distribución exponencial con λ = 1, calcule lo siguiente:

a) Tiempo de llegada entre dos llegadas sucesivas,

b) La desviación estándar del tiempo entre dos llegadas sucesivas,

σx = µx = 1/λ = 1/1 = 1

c) P(X ≤ 4)P(X ≤ 4) = 1 – e-4/1 = 1 – 0,01832 = 0,98168,

λ = 1, taza o razón de entre llegadas,

µx = 1/λ = 1/1 = 1Promedio de entre llegadas,

x = 4

c) p(2 ≤ X ≤ 5)

F(5) – F(2) = - e-5 + e-2 = 0,1286

2 5

F(5) – F(2)

F(5)

F(2)

c) p(2 ≤ X ≤ 5)

Usando las tablas:

F(-λx)

F(-5,00) = 0,9933

F(-2,00) = 0,8647

Se restan: 0,9933- 0,8647

0,1286p(2 ≤ X ≤ 5) =

En excel está la función EXP()

EXP() se la restas a 1

F(x): = 1 – EXP(-λx)

λ = 1/µx

λ = 1/1

µx = 1

Distribución gamma

La función Gama,Para definir la familia de distribuciones gama, primero se tiene que introducir la función,

Con α > 0, la función gama ᴦ(α) se define como:

ᴦ(α) = ʃ0

xα – 1 e-x dx

Las propiedades más importantes:

1) Con cualquier α > 1, ᴦ(α) = (α – 1)*ᴦ(α – 1) **integración por partes**

2) Con cualquier entero positivo, n, ᴦ(n) = (n – 1)!

3) ᴦ(1/2) = (π)1/2

Ejemplo: α = n = 4

ᴦ(4) = ʃ0

x4 – 1 e-x dx = –x3e-x - 3x2e-x - 6xe-x - 6e-x

0

= –∞3e-∞ - 3∞2e-∞ - 6∞e-∞ - 6e-∞ - –03e-0 – 3*02e-0 – 6-0e-0 - 6e-0[ ]0 0 0 0 0 0 0 -6

= 6

ᴦ(4) = (4 – 1)! = 3! = 3*2*1 = 6

Se multiplican lo signos: - * - = +

Se deriva Se deriva Se deriva

Se integra Se integra Se integraSe integra

Se copia

Ejemplos:

Otros valores α > 0

En excel se calcula ᴦ(α) con las dos funcionesGAMMA,LN,EXACTO() Y EXP(), con el siguiente formato:

=EXP(GAMMA,LN,EXACTO(1/2))

=EXP(GAMMA,LN,EXACTO(3/2))

=EXP(GAMMA,LN,EXACTO(5/2))

=EXP(GAMMA,LN,EXACTO(7/2))

O bien, primero calcula con GAMMA,LN,EXACTO() y después usa EXP(), como te indico:

Distribución gamma,Se dice que una variable aleatoria continua X tiene una distribución gama si la función densidad de probabilidad de X es:

f(x; α, β) = 1βα ᴦ(α)

xα-1 e-x/β

Donde los parámetros α y β satisfacen α ≥ 0 y β ≥ 0,

La distribución estándar gama tiene β = 1

La distribución exponencial se deriva de considerar α = 1 y β = 1/λ,

Para varios pares (α, β)

β=1

La media y varianza de una variable aleatoria X que tiene la distribución gama estándar,

E(x) = µ = α*β

V(x) = σ2 = α*β2

Cuando X es una variable aleatoria gama estándar, la función de distribución acumulada de X,

F(x; α) = ʃ 0

x yα -1 e-y

ᴦ(α)dy = 1 – e-x ΣK = 0

α - 1xk

k!

Con esta fórmula se elabora la tabla

Te anexo la hoja electrónica de la tabla, da click aquí con el ratón para verla,

Tabla de la distribución Gama estándar, Calculada en excel,

Ejemplo:Suponga que el tiempo de reacción X de un individuo seleccionado al azar a un estímulo tiene una distribución gama estándar con α = 2, Como: P(3 ≤ X ≤ 5) = F(5;2) – F(3; 2)

F(5;2) = 0,960

F(3; 2) = 0,801

F(5;2) = 0,960

F(3; 2) = 0,801

Se restan:

0,159

Es la probabilidad de tiempo de reacción de entre 3 y 5 segundos,

Calculada en excel,¿Cuál es la probabilidad de que el tiempo de reacción sea de más de 4 segundos?

P(4 < X) = 1 – P(X ≤ 4) = 1 – F(4; 2)

F(4; 2) = 0,908

P(4 < X) = 1 – 0,908 = 0,0902

x β α P(X ≤ x)5 1 2 0,959572323 1 2 0,80085173Se restan: 0,15872059

En excel está la función DISTR,GAMMA:La distribución estándar gama tiene β = 1

Si X tiene una distribución gama con parámetros α y β, entonces con cualquier x > 0, la función de distribución acumulativa de X es:

P(X ≤ x) = F(x; α; β) = F(x/β; α)

Suponga que el tiempo de sobrevivencia de un ratón macho seleccionado al azar expuesto a 240 radiaciones gama tiene una distribución gama con α = 8 y β = 15,

El tiempo de sobrevivencia esperado: E(x) = µ = α*β = 8 * 15 = 120

σ2 = α*β2La desviación estándar: = 8 * 152 = 1800√ √ √ = 42,43

Cual es la probabilidad que viva entre 60 y 120 semanas

P(60 ≤ X ≤ 120) = P(x ≤120) – P(x ≥ 60) = F(120/β; α) – F(60/β; α) = F(120/15; 8) – F(60/15; 8)

Calculada en excel,P(60 ≤ X ≤ 120) = F(120/15; 8) – F(60/15; 8)

F(8; 8) F(4; 8)

F(8; 8) = 0,547

F(4; 8) = 0,051

F(8; 8) = 0,547

F(4; 8) = 0,051

Se restan:

0,496

Es la probabilidad que el ratón viva entre 60 y 120 semanas,

Calculada en excel,La probabilidad de que por lo menos viva 30 semanas,

P(30 ≤ X) = 1 – P(X < 30)

F(x/β; α)

F(30/15; 8)

F(2; 8)

F(2; 8) = 0,001

P(30 ≤ X) = 1 – 0,001 = 0,999

En excel está la función DISTR,GAMMA:

x β α P(X ≤ x)120 15 8 0,5470391960 15 8 0,05113362

Se restan: 0,49590557

Distribución Weibull

Distribución WeibullSe dice que una variable aleatoria X tiene una distribución Weibull con parámetros α y β (α > 0, β > 0) si la función probabilidad de X es:

f(x; α, β) = αβα

xα – 1 e-(x/β)α

Datos observados

Se relacionan con datos particulares de α y β

Cuando α = 1 la función de probabilidad se reduce a λ = 1/β

α y β pueden variar para obtener diferentes familias de distribuciones weibull,

El cálculo de la media y la desviación estándar requieren de la distribución gama,

µ = β*ᴦ(1 + 1/α)

σ2 = β2 * { ᴦ(1 + 2/α) – [ᴦ(1 + 1/α)]2}

= β* EXP(GAMMA,LN,EXACTO(1 + 1/α))Acuérdate que:

= β2 *EXP(GAMMA,LN,EXACTO(1 + 2/α)) - POTENCIA(EXP(GAMMA,LN,EXACTO(1 + 1/α)),2)

Está elevado al cuadrado, usa función de excel POTENCIA(número;2)

Si α = 2 y β = 10, calcula la media con las funciones de excel,

µ = 10*ᴦ(1 + 1/2) = 10* EXP(GAMMA,LN,EXACTO(1 + 1/2))

En años recientes la distribución Weibull ha sido utilizada para modelar emisiones de varios contaminantes de motores,

Sea X la cantidad d emisiones de NOx (g/gal) de un motor de cuatro tiempos de un tipo seleccionado al azar y suponga que X tiene una distribución weibull con α = 2 y β = 10,

Cual es la probabilidad P(X ≤ 10) = F(10; 2, 10) = 1 – e-(10/10)2 = 1 – e-1 = 0,632

Cual es la probabilidad P(X ≤ 25) = F(25; 2, 10) = 1 – e-(25/10)2 = 1 – e-6,5 = 0,998

Cual es la probabilidad P(10 < X ≤ 25)

Se restan: F(25; 2, 10)

F(10; 2, 10)

=

=

0,998

0,632

0,366

La función de distribución acumulativa de una variable aleatoria de Weibull con parámetros α y β,

F(x; α, β) = 1 – e- (x/β)α

para x ≥ 0

Ejemplo:

Distribución t de Student

Distribución t de student

Aparenta una distribución normal,

Esta distribución se utiliza para muestras son pequeñas, n,

La distribución de probabilidad es igual: T = X - µ

S/(n1/2)

El resultado en el cual están basadas las inferencias introduce una nueva familia de distribuciones de probabilidad llamada familia de distribuciones t,

Se rige por los grados de libertad n – 1, gl; en griego se denota ν, que son enteros positivos 1, 2, 3, …; cada valor diferente de ν corresponde a una distribución t diferente,

Teorema:

Cuando X es la media de una muestra aleatoria de tamaño n tomada de una distribución normal con media µ, la variable aleatoria

tiene una distribución de probabilidad llamada distribución t con n – 1 grados de libertad gl,

T = X - µ

S/(n1/2)

Media de la poblaciónMedia de la muestra

Desviación estándar de la muestra,Tamaño de la muestra

Distribución de probabilidad t

Propiedades de distribución t,

Sea tv, la curva de función de densidad para el grado de libertad v,

1. Cada curva tv tiene la forma de una campana y con su centro en cero,

2. Cada curva tv está más esparcida que la curva (z) normal estándar,

3. Conforme v se incrementa, la dispersión tv correspondiente disminuye,

4. A medida que v -> ∞, la secuencia de curvas tv tiende a la curva normal estándar (así que la curva z a menudo se llama curva t con grado de libertad = ∞,

Intervalo de confianza t para una muestra,

α/2α/2

Intervalo de confianza100*(1 - α)%

+∞-∞ 100 %

α

Intervalo de confianza100*(1-α)%

+∞-∞ 100 %

curva tv

curva tvtα,v Área bajo la curva

Tα/2,v Área bajo la curva

Valor crítico:

Valor crítico:

Grados de libertad del lado derecho,

Intervalo de confianza con grados de libertad hacia la derecha

Intervalo de confianza con grados de libertad hacia ambos lados

Grados de libertad del lado derecho,

Grados de libertad del lado izquierdo,

Sean x y s la medida y la desviación estándar muestrales calculadas con los resultados de una muestra aleatoria tomada de una población normal con media µ, Entonces un intervalo de confianza de 100*(1 – α)% para µ es

x ± t α/2 , n - 1 *s

n√

Para el límite superior x + t α/2 , n - 1 *s

n√

Para el límite inferior x - t α/2 , n - 1 *s

n√

Como parte de un proyecto más grande para estudiar el comportamiento de paneles de revestimiento sometidos a esfuerzo, un componente estructural extensamente utilizado en Estados Unidos reportó sobre varias propiedades mecánicas de especímenes de madera de pino escosés, Considere las siguientes observaciones de módulo de elasticidad (Mpa) obtenidas un minuto después de cargar una configuración,

10490 16620 17300 1548012790 17260 13400 1390013630 13260 14370 1170015470 17840 14070 14760

Se calcula la media de la muestra

x = 14,521.25

Ejemplo:

x = Σ

i = 1

n

xi

n=

10,490+ 16,620 + … + 14,070 + 14,07616

=

El tamaño de la muestra, n = 16

Se calcula la desviación estándar:

s = Σ x2 - (Σ x )2n

n(n – 1)√x x2

10,490 110,040,10012,790 163,584,10013,630 185,776,90015,470 239,320,90016,620 276,224,40017,260 297,907,60013,260 175,827,60017,840 318,265,60017,300 299,290,00013,400 179,560,00014,370 206,496,90014,070 197,964,90015,480 239,630,40013,900 193,210,00011,700 136,890,00014,760 217,857,600

232,340 3,437,847,000

Σ x Σ x2

(Σ x)2 = (232,340)2 = 53,981,875,600

n * (Σ x2) = 16 * 3,437,847,000 = 55,005,552,000

(Σ x)2 = 53,981,875,600

n * (Σ x2) = 55,005,552,000

1.023.676.400

Se restan

Varianza

1.023.676.400

n(n – 1)=

1.023.676.400

16(16 – 1)s2 = = 4,265.32

s = √ 4,265.32 = 2,065.26

Se le resta 1 por ser muestra pequeña.123456789

10111213141516

menos

El nivel de confianza de 95% para un intervalo bilateral, Entonces: α = 1 – 0.95 = 0.05,

α/2 = 0.025α/2 = 0.025

Intervalo de confianza 95%

+∞-∞ 100 %

tα,v Área bajo la curva

Valor crítico:

Como es bilateral, los grados de libertad se divide para ambos lados: α/2 = 0.025.

Se calcula el valor crítico

tα,v = t0.025, 15Valor crítico:

Buscar en la tabla:

Tα/2,v = t0.025, 15Valor crítico:

Buscar en la tabla t de student:

t0.025, 15 = 2.131

n-1 = 16 – 1 = 15

α = 1 – 0.95 = 0.05

α/2 = 0.05/2 = 0.025

Nivel de confianza

Calcular el intervalo de confianza

x ± t α/2 , n - 1 *s

n√

Para el límite superior

x + t α/2 , n - 1 *s

n√Para el límite inferior

x - t α/2 , n - 1 *s

n√

= 14,521.25 ± (2.131)2,065.26

(16)1/2

= 14,521.25 + (2.131)2,065.26

(16)1/2

= 14,521.25 - (2.131)2,065.26

(16)1/2

= 15,621.52

= 13,420.98

x≤13,420.98 ≤ 15,621.52

El intervalo es muy ancho debido a la gran variabilidad de los datos de una muestra pequeña.

Valor crítico obtenido de la tabla t de student

Para tener mas precisión se usa el intervalo de predicción (IP) para una sola observación que tiene que ser seleccionado de una distribución de población normal es:

x ± t α/2 , n - 1 * s * n√1 + 1

x + t α/2 , n - 1 * s * n√1 + 1

x - t α/2 , n - 1 * s * n√1 + 1

= 14,521.25 ± 2.131 * 2,065.26 √(1 + 1/16)

14,521.25 + 2.131 * 2,065.26 √(1 + 1/16)=

14,521.25 - 2.131 * 2,065.26 √(1 + 1/16)=

Límite superior:

Límite inferior:

= 19,274.9

=9,767.55x≤ ≤ 19,274.99,767.55

Para determinar en el futuro la elasticidad de una viga:

El intervalo es mas ancho que el intervalo de confianza, por lo que es mas difícil de predeterminar la elasticidad de la madera.

Ancho del intervalo de confianza = 13,420.9815,621.52 = 2,200.54

19,274.9 9,767.55Ancho del intervalo IP = = 9,507.35

2,200.54

9,507.35= 4.32

Se compara ambos intervalos:

El intervalo IP es cuatro veces mayor que el intervalo de confianza lo que no es posible predecir el futuro de la elasticidad de una viga.

Ejercicios:Determina el valor crítico t que capturará el área deseada de la curva t con cada unto de los siguientes casos:

a) Área central = 0.95, gl = 10.b) Área central = 0.99, gl = 50.

Busca en la tabla t de student.

c) Área de cola superior = 0.01, gl = 25

d) Área de cola inferior = 0.025, gl = 5

Grados de polimerización de especímenes de papel para los cuales la concentración de tiempos de viscosidad cayeron en un rango medio. resolviendo con las funciones de excel.

a) Calcular el intervalo de confianza de 95% bilateral

b) Suponer que el 440 es un valor factible

c) Ver si el 450 es un valor factible

Si es factible, está dentro del rango430.51 ≤ x ≤ 446.81.

No es factible, está fuera del rango430.51 ≤ x ≤ 446.81.

Función: PROMEDIO()

Función: =DESVEST.M(B2:B18) -> «de la muestra»

430.51 ≤ x ≤ 446.81.

Para corregir deformidades nasales congénitas se utiliza rinoplastia de aumento mediante implante de silicón. El éxito del procedimiento depende de varias propiedades biomecánicas de periostio y fascia nasales humanas. Se hiso una muestra de 15 adultos (recién fallecidos), la deformación de falla media (en porcentaje) fue de 25.0 y la desviación estándar de 3.5.

a) Suponiendo una distribución normal de la deformación de falla, estime la deformación promedio verdadera en una forma que transmita información acerca de precisión y confiabilidad.

b) Pronostique la deformación para un solo adulto en una forma que transmita información sobre precisión IP y confiabilidad. ¿Cómo se compara la predicción con la estimación calculada en el inciso a)?

Has el siguiente ejercicio:

La prueba Chi cuadrada

Un método estadístico, llamado técnica ji cuadrada, tiene cuatro aplicaciones principales:

1. Probar la supuesta independencia de dos variables cualitativas de una población.

2. Hacer inferencias sobre más de dos proporciones de una población.

3. Hacer inferencias sobre la varianza de la población.

4. Realizar pruebas de bondad de ajuste para evaluar la credibilidad de que los datos muestrales vienen de un población cuyos elementos se ajustan a un tipo específico de distribución de probabilidad.

Fórmula:Se usa para evaluar la independencia o dependencia entre dos variables cualitativas.

χ2 = Σ (fo – fe)2

fe

En donde:

fo = Es la frecuencia observada.

fe = Es la frecuencia esperada relacionada.

Procedimiento:1. Formular dos hipótesis opuestas.

a) H0 = La relación entre variables son independientes.b) HA = Las dos variables son dependientes.

χ2 = Σ (fo – fe)2

fe

2. Seleccionar un estadístico prueba. Seleccionamos.

3. Derivar una regla de decisión.a) Se fija el nivel de significancia α

b) Grados de libertad = (renglones – 1)(columnas – 1).c) En base a éstos, el valor crítico es Χ2

α, n-1

Señala la columna

El tamaño de la muestra menos uno indica los grados de libertad.

d) Se acepta Ho si: Χ2α, gl ≤ valor crítico obtenido de la tabla.

En caso contrario se acepta HA

Por ejemplo:

Valor crítico o punto crítico Χ2α, gl

Área de aceptación de la hipótesis nula, Ho

Área de rechazo de la Ho

Valor crítico o punto crítico Χ2α, gl

Área de aceptación de la hipótesis nula, Ho

Área de rechazo de la Ho

4. Tomar una muestra, calcular el estadístico de prueba y confrontarlo con la regla de decisión.

χ2 = Σ (fo – fe)2

fe

Si el estadístico de pruebaestá ubicado antes del valor crítico se acepta Ho,

de lo contrario se rechaza.

1. Con la hipótesis nula Ho se indica que las dos variables, (A) las causas de accidentes y (B) la licencia de piloto, son independientes con la relación a los accidentes aéreos..

2. La HA la hipótesis alternativa indica que son dependientes.

De modo que si al hacer la prueba de la ji cuadrada cae antes del punto crítico entonces se acepta la hipótesis nula, de lo contrario se rechaza y se acepta la alternativa.

Ejemplo:Supongamos que la Federal de aviación desea determinar si hubo alguna conexión entre las causas oficiales de accidentes de aviación y el tipo de licencia que poseían los pilotos involucrados.

El punto crítico, es el criterio para tomar como referencia para determinar si rechaza o se acepta la hipótesis nula. Este se calcula de las tablas de distribución de la χ2

α, gl, como se verá mas adelante.

n (A) Causas del accidente

(B) Licencia del piloto

totalEstudiante o particular

Comercial o línea de transporte

1 Tormenta eléctrica 50 20 702 Hielo 40 10 503 Falla del equipo 25 6 314 Error del controlador 25 5 305 Incapacidad del piloto. 80 6 866 Otras. 30 3 33

250 50 300

La experiencia de los últimos cinco años, se resume en la siguiente tabla:

Esta es una muestra las causas de los accidentes posibles.

Las dos variables son: (A) causas del accidente y (B) licencia del piloto.

Frecuencias observadas fo.

Frecuencias esperadas fe.

n Causas del accidente

Licencia del piloto

totalEstudiante o particular

Comercial o línea de

transporte

1 Tormenta eléctica 58,33 11,67 702 Hielo 41,67 8,33 503 Falla del equipo 25,83 5,17 314 Error del controlador 25,00 5,00 305 Incapacidad del piloto. 71,67 14,33 866 Otras. 27,50 5,50 33

250,00 50,00 300

Calcular las frecuencias esperadas:

fe =

Ejemplo:

250300 * 70 = 58.33

fe =50

300 * 70 = 11.67

De este modo se calculan las demás fe:

Obtener las frecuencias observadas fo, con estas, calcular la frecuencias esperadas.

Las frecuencias observadas y frecuencias esperadas se juntan para determinar si tienen independencia las variables: (A) causas de accidentes y (B) licencia de piloto.

no. causas del accidente licencia de pilotoFrecuencias Desviación Desviacion2 Desviacion2

estandarfo fe (fo - fe) (fo - fe)2 [(fo - fe)2]/fe

1 Tormenta eléctrica Estudiante o paticular 50,00 58,33 -8,33 69,39 1,19Comercial o línea de transporte 20,00 11,67 8,33 69,39 5,95

2 Hielo Estudiante o particular 40,00 41,67 -1,67 2,79 0,07Comercial o línea de transporte 10,00 8,33 1,67 2,79 0,33

3 Falla del equipo Estudiante o particular 25,00 25,83 -0,83 0,69 0,03Comercial o línea de transporte 6,00 5,17 0,83 0,69 0,13

4 Error del controlador Estudiante o paticular 25,00 25,00 0,00 0,00 0,00Comercial o línea de transporte 5,00 5,00 0,00 0,00 0,00

5 Incapacidad del piloto Estudiante o paticular 80,00 71,67 8,33 69,39 0,97Comercial o línea de transporte 6,00 14,33 -8,33 69,39 4,84

6 Otras. Estudiante o paticular 30,00 27,50 2,50 6,25 0,23Comercial o línea de transporte 3,00 5,50 -2,50 6,25 1,14

χ2 = 14.873. Derivar una regla de decisión (punto crítico).

a) El nivel de significancia α = 0.95

b) Grados de libertad = (número de renglones – 1)(número de columnas – 1).

gl = (6 – 1)(2 – 1) = 5*1 = 5.

c) Obtener el punto crítico χ20.05, 5 = 11.07

Grados de libertadNivel de significancia: α

Valor crítico

El estadístico de prueba χ2 = 14.88

Como el estadístico de prueba resultó después del valor crítico en la área de rechazo, entonces la hipótesis nula es rechazada.

Recommended