49
Лекция 4. Доверительные интервалы Буре В.М., Грауэр Л.В. ШАД Санкт-Петербург, 2013 Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 1 / 49

2013 03 13_statistics_lecture04

Embed Size (px)

Citation preview

Page 1: 2013 03 13_statistics_lecture04

Лекция 4. Доверительные интервалы

Буре В.М., Грауэр Л.В.

ШАД

Санкт-Петербург, 2013

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 1 / 49

Page 2: 2013 03 13_statistics_lecture04

Cодержание

Содержание

1 Доверительные интервалыОбщая схема построения доверительных интерваловАсимптотические доверительные интервалыРаспределения статистик для выборок из нормальной генеральнойсовокупностиРаспределение СтьюдентаCтатистика ПирсонаТочные доверительные интервалы для нормальной генеральнойсовокупности

2 Гамма-распределение

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 2 / 49

Page 3: 2013 03 13_statistics_lecture04

Доверительные интервалы Общая схема построения доверительных интервалов

Общая схема построения доверительных интервалов

Пусть задана генеральная совокупность ξ с функцией распределенияFξ(x). Имеется выборка X[n] = (X1, . . . ,Xn) из этой генеральнойсовокупности и неизвестный параметр распределения θ ∈ Θ ⊂ R.

Определение 1

Пусть для некоторого α ∈ (0, 1) существуют статистики S−(X[n], α) иS+(X[n], α) такие, что

P{S−(X[n], α) < θ < S+(X[n], α)

}= 1− α,

тогда интервал(S−(X[n], α),S+(X[n], α)

)называется доверительным

интервалом для параметра θ с уровнем доверия (1− α).

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 3 / 49

Page 4: 2013 03 13_statistics_lecture04

Доверительные интервалы Общая схема построения доверительных интервалов

Укажем общий метод построения доверительных интервалов, которыйбудет использован далее.Пусть известна статистика Y (S(X[n]), θ), содержащая оцениваемыйпараметр θ и его точечную оценку S(X[n]) со следующими свойствами:

1 Функция распределения FY (x) случайной величины Y известна ине зависит от θ.

2 Функция Y (S(X[n]), θ) непрерывна и строго монотонна по θ.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 4 / 49

Page 5: 2013 03 13_statistics_lecture04

Доверительные интервалы Общая схема построения доверительных интервалов

Зададим уровень значимости α.Обычно доверительный интервал строят так, чтобы дополнительныеинтервалы (− inf, S−(X[n], α)), (S+(X[n], α),+ inf) накрывали θравновероятно (с вероятностью α/2).

Находим квантили yα/2 и y1−α/2 распределения случайной величиныY порядка α/2 и 1− α/2 и далее получаем

P(yα/2 < Y (S(X[n]), θ) < y1−α/2) = F (y1−α/2)− F (yα/2) = 1− α.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 5 / 49

Page 6: 2013 03 13_statistics_lecture04

Доверительные интервалы Общая схема построения доверительных интервалов

Пусть для опреденности, функция Y (S(X[n]), θ) строго возрастает поθ. Тогда обратная функция Y−1(y) для Y (S(X[n]), θ) также будетстрого возрастающей. Тогда неравенство

yα/2 < Y (S(X[n]), θ) < y1−α/2 (1)

эквивалентно неравенству

Y−1(yα/2) < θ < Y−1(y1−α/2). (2)

Получаем доверительный интервал для θ

P(S−(X[n], α) < θ < S+(X[n], α)) = 1− α,

где S−(X[n], α) = Y−1(yα/2), S+(X[n], α) = Y−1(y1−α/2).Для случая строгого убывания Y (S(X[n]), θ) по θ знаки неравенства в(1), (2) будут противополжного смысла.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 6 / 49

Page 7: 2013 03 13_statistics_lecture04

Доверительные интервалы Асимптотические доверительные интервалы

Асимптотические доверительные интервалы

Определение 2

Пусть для некоторого α ∈ (0, 1) существуют статистики S−(X[n], α) иS+(X[n], α) такие, что

limn−→∞

P{S−(X[n], α) < θ < S+(X[n], α)

}= 1− α,

тогда интервал(S−(X[n], α), S+(X[n], α)

)называется асимптотическим

(приближенным) доверительным интервалом.

Построение асимптотических доверительных интервалов основано наасимптотически нормальных оценках.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 7 / 49

Page 8: 2013 03 13_statistics_lecture04

Доверительные интервалы Асимптотические доверительные интервалы

Предположим, что оценка θ̂ = θ̂(X[n]) является асимптотическинормальной, т. е.

√n(θ̂ − θ)

d−−−−→n−→∞

ς ∼ N(0, σ2),

где дисперсия σ2(θ) — коэффициент асимптотического рассеивания.Предположим, что функция σ2(θ) непрерывна на Θ и отлична от нулядля любого θ ∈ Θ.

Лемма 1

Случайный вектор (√n(θ̂ − θ), θ̂)

d−−−→n→∞

(ζ, θ), где ζ подчиняется

нормальному распределению N(0, σ2(θ)).

ДоказательствоПокажем, что характеристическая функция случайного вектора(√n(θ̂ − θ), θ̂) удовлетворяет условию:

ϕ(√n(θ̂−θ),θ̂)(t1, t2) −−−−→

n−→∞ϕ(ζ,θ)(t1, t2) = Ee it1ζ+it2θ.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 8 / 49

Page 9: 2013 03 13_statistics_lecture04

Доверительные интервалы Асимптотические доверительные интервалы

Действительно,

ϕ(√n(θ̂−θ),θ̂)(t1, t2) = Ee it1

√n(θ̂−θ)+i(t2θ̂±θt2) =

= Eei√n(θ̂−θ)(t1+

t2√n

)e it2θ = e it2θϕ√n(θ̂−θ)(t1 +

t2√n

) =

= e it2θ

({ϕ√n(θ̂−θ)(t1 +

t2√n

)− ϕζ(t1 +t2√n

)

}+ ϕζ(t1 +

t2√n

)

).

При этом, ϕζ(t1 + t2/√n) −−−→

n→∞ϕζ(t1), так как любая

характеристическая функция равномерно непрерывна.Имеет место сходимость:

ϕ√n(θ̂−θ)(t1 +t2√n

)− ϕζ(t1 +t2√n

) −−−→n→∞

0,

так как при любом t: ϕ√n(θ̂−θ)(t)→ ϕζ(t), и сходимость равномернана любом конечном промежутке.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 9 / 49

Page 10: 2013 03 13_statistics_lecture04

Доверительные интервалы Асимптотические доверительные интервалы

Следовательно, выполняется сходимость:

ϕ(√n(θ̂−θ),θ̂)(t1, t2) −−−→

n→∞e it2θϕζ(t1) = Ee it2θ+iζt1 = ϕ(ζ,θ)(t1, t2).

Лемма доказана.

Рассмотрим функцию от двух переменных H(x1, x2) = x1/σ(x2), онанепрерывна на R×Θ. Случайный вектор (ζ, θ)T ∈ R×Θ,следовательно, можем воспользоваться теоремой непрерывности:

H(√n(θ̂n − θ), θ̂n)

d−−−→n→∞

H(ζ, θ) =ζ

σ(θ)∼ N(0, 1).

Таким образом, имеет место сходимость:√n(θ̂ − θ)

σ(θ̂)

d−−−→n→∞

η ∼ N(0, 1).

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 10 / 49

Page 11: 2013 03 13_statistics_lecture04

Доверительные интервалы Асимптотические доверительные интервалы

Тогда справедливо следующее соотношение:

P{−z1−α2<

√n(θ̂ − θ)

σ(θ̂)< z1−α

2} −−−−→

n−→∞1− α =

1√2π

z1−α2∫−z1−α2

e−y2

2 dy ,

где z1−α2— квантиль стандартного нормального распределения уровня

1− α/2, то есть, F (z1−α2

) = 1− α/2, где F (x) — функциястандартного нормального распределения.Получаем асимптотический доверительный интервал с уровнемдоверия 1− α:

P{θ̂ − z1−α2

σ(θ̂)√n< θ < θ̂ + z1−α

2

σ(θ̂)√n} ≈ 1− α.

Ширина доверительного интервала характеризует точностьинтервальной оценки.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 11 / 49

Page 12: 2013 03 13_statistics_lecture04

Доверительные интервалы Асимптотические доверительные интервалы

Пример 1Рассмотрим схему Бернулли, в которой n испытаний. Пусть m — числоуспехов. Выборка X[n] = (a1, . . . , an) состоит из последовательностинулей и единиц, тогда функция правдоподобия имеет вид:

L(X[n], p) = pmqn−m, p ∈ Θ = (0, 1),

где m — число единиц в выборке. Логарифмическая функцияправдоподобия имеет вид:

ln L = m ln p + (n −m) ln(1− p).

Найдем оценку максимального правдоподобия:

∂ ln L

∂p=

m

p− n −m

1− p=

m −mp − np + mp

p(1− p)= 0.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 12 / 49

Page 13: 2013 03 13_statistics_lecture04

Доверительные интервалы Асимптотические доверительные интервалы

Следовательно, получаем оценку:

p̂ =m

n.

Убеждаемся, что p̂ максимизирует функцию правдоподобия:

∂2 ln L

∂p2= −m

p2− n −m

(1− p)2< 0.

Следовательно, p̂ = mn — точка максимума или оценка по методу

максимального правдоподобия.Нетрудно показать, что оценка p̂ асимптотически нормальна:

√n(mn− p)

=m − np√

n=

n∑i=1

ξi − np

√n

=

=

n∑i=1

(ξi − p)

√n

d−−−→n→∞

ζ ∼ N(0, pq),

где P{ξi = 1} = p, P{ξi = 0} = q = 1− p, σ2 = pq = p(1− p).Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 13 / 49

Page 14: 2013 03 13_statistics_lecture04

Доверительные интервалы Асимптотические доверительные интервалы

Воспользуемся доказанным утверждением:√n(θ̂ − θ)

σ(θ̂)

d−−−→n→∞

η ∼ N(0, 1).

Тогда имеет место сходимость:√n(mn − p)√mn (1− m

n )

d−−−→n→∞

η ∼ N(0, 1).

Следуя приведенным выше рассуждениям, получаем доверительныйинтервал с уровнем доверия 1− α для вероятности p:(

m

n− z1−α

2

√mn (1− m

n )√n

,m

n+ z1−α

2

√mn (1− m

n )√n

)

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 14 / 49

Page 15: 2013 03 13_statistics_lecture04

Доверительные интервалыРаспределения статистик для выборок из нормальной

генеральной совокупности

Распределения статистик для выборок из нормальнойгенеральной совокупности

Пусть имеется генеральная совокупность ξ ∼ N(a, σ2) и выборка X[n]

из этой генеральной совокупности. Если ξ — гауссова случайнаявеличина, то функция плотности ее распределения имеет вид:

fξ(x) =1√2πσ

e−(x−a)2

2σ2 , x ∈ R,

а если ξ — гауссов случайный вектор, то

fξ(x) =1

(2π)n2

√|Σ|

e−12

(x−a)T Σ−1(x−a), x ∈ Rm.

В первом случае предполагается, что σ2 > 0, а во-втором, чтоdet |Σ| 6= 0.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 15 / 49

Page 16: 2013 03 13_statistics_lecture04

Доверительные интервалыРаспределения статистик для выборок из нормальной

генеральной совокупности

Любому распределению взаимно однозначно соответствуетхарактеристическая функция. С помощью метода характеристическихфункций легко получить, что компоненты гауссова случайного векторанезависимы тогда и только тогда, когда ковариационная матрица Σдиагональна или, другими словами, когда равны нулю попарныековариации всех компонент.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 16 / 49

Page 17: 2013 03 13_statistics_lecture04

Доверительные интервалыРаспределения статистик для выборок из нормальной

генеральной совокупности

Лемма 2

Пусть ζ — случайный вектор размерности m, подчиняющийсямногомерному нормальному распределению N(a,Σ), пусть A — любаяматрица размерности n ×m, b — вектор размерности n × 1. Тогдавектор η = Aζ + b подчиняется нормальному распределениюN(Aa + b;AΣAT

).

ДоказательствоРассмотрим

ϕη(t) = Ee itT η = e it

TbEe i(tTA)ζ = e it

Tbϕζ(tTA) =

= Ee itT (Aa+b)− 1

2tTAΣAT t ,

где Aa + b — математическое ожидание, AΣAT — ковариационнаяматрица случайного вектора η.Лемма доказана.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 17 / 49

Page 18: 2013 03 13_statistics_lecture04

Доверительные интервалыРаспределения статистик для выборок из нормальной

генеральной совокупности

Лемма 3

Пусть ξ ∼ N(0, σ2En

)и ξ̄ = 1

n

∑ni=1 ξi — среднее арифметическое.

Тогда ξ̄ и вектор(ξ1 − ξ̄, . . . , ξn − ξ̄

)взаимно независимы.

ДоказательствоВозьмем любой элемент вектора, например, ξk − ξ̄, и проверим егонезависимость с ξ̄. Рассмотрим разность:

ξk − ξ̄ = ξk −1

n

n∑i=1

ξi = −1

nξ1 − . . .−

1

nξk−1 +

n − 1

nξk−

− 1

nξk+1 − . . .−

1

nξn =

(−1

n, . . . ,−1

n,n − 1

n,−1

n, . . .− 1

n

)ξ,

ξ̄ =1

nξ1 + . . .+

1

nξn =

(1

n, . . . ,

1

n

)ξ,(

− 1n , . . . ,−

1n ,

n−1n ,− 1

n , . . . ,−1n

1n ,

1n , . . . ,

1n

)ξ =

(ξk − ξ̄ξ̄

).

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 18 / 49

Page 19: 2013 03 13_statistics_lecture04

Доверительные интервалыРаспределения статистик для выборок из нормальной

генеральной совокупности

Тогда по лемме 2 получаем:(ξk − ξ̄ξ̄

)∼ N

( (00

),

(σ2

1 00 σ2

2

) ),

где σ21 = n−1

n σ2, σ22 = 1

nσ2, внедиагональные элементы равны нулю,

поскольку

σ2

(−1

n, . . . ,−1

n,n − 1

n,−1

n, . . . ,−1

n

)(1

n, . . . ,

1

n

)T

=

= σ2−(n − 1) + (n − 1)

n2= 0.

Лемма доказана

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 19 / 49

Page 20: 2013 03 13_statistics_lecture04

Доверительные интервалыРаспределения статистик для выборок из нормальной

генеральной совокупности

Лемма 4

Пусть ξ = (ξ1, . . . , ξm)T ∼ N(0,Em), CCT = CTC = Em и η = Cξ.

Тогда τ =m∑

k=1

ξ2k − η2

1 − . . .− η2r подчиняется распределению

хи-квадрат с m − r степенями свободы, и случайные величиныη1, . . . , ηr взаимно независимы с τ .

ДоказательствоИз леммы 2 следует, что η ∼ N(0,Em×m). Как легко видеть, имеетместо равенство:

m∑i=1

ξ2i = ξT ξ = ξTCTCξ = ηTη =

m∑i=1

η2i .

Следовательно, справедливо равенство:m∑i=1

ξ2i − η2

1 − . . .− η2r =

m∑j=r+1

η2j ,

полученное равенство доказывает лемму.Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 20 / 49

Page 21: 2013 03 13_statistics_lecture04

Доверительные интервалы Распределение Стьюдента

Распределение Стьюдента

Определение 3

Пусть заданы случайные величины ζ ∼ N(0, 1) и τk ∼ χ2k . Пусть

случайные величины ζ и τk взаимно независимы. Распределениеслучайной величины

ξ =ζ√τkk

называется распределением Стьюдента с k степенями свободы иобозначается через Tk .

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 21 / 49

Page 22: 2013 03 13_statistics_lecture04

Доверительные интервалы Распределение Стьюдента

Замечание 1Очевидно, что если ζ ∼ N(0, 1) и ζ1,. . .,ζk — взаимно независимыеслучайные величины, подчиняющиеся стандартному нормальномураспределению, независимые с ζ, тогда

ζ√ζ2

1 +...+ζ2k

k

∼ Tk .

Лемма 5Пусть ζ = η/ξ, где η, ξ — взаимно независимые случайные величины.Пусть ξ

п.н.> 0, fξ(x), fη(y) — плотности распределения ξ и η

соответственно, тогда плотность распределения fζ(z) дроби ζ имеетвид:

fζ(z) =

∞∫0

xfξ(x)fη(zx)dx .

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 22 / 49

Page 23: 2013 03 13_statistics_lecture04

Доверительные интервалы Распределение Стьюдента

ДоказательствоНайдем функцию распределения случайной величины ζ:

Fζ(z) = P{ζ ≤ z} =

∫{(x ,y): y

x≤z,x>0}

fξ(x)fη(y)dxdy =

=

∞∫0

zx∫−∞

fξ(x)fη(y)dydx =

∞∫0

fξ(x)

z∫−∞

fη(xs)xds

dx .

Положим s = y/x , dy = xds. Меняем порядок интегрирования:

Fζ(z) =

z∫−∞

∞∫0

xfξ(x)fη(xs)dx

ds.

Полученное равенство доказывает лемму.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 23 / 49

Page 24: 2013 03 13_statistics_lecture04

Доверительные интервалы Распределение Стьюдента

Лемма 6

Пусть η ∼ N(0, 1), ξ =√τ , τ ∼ χ2

k . Пусть случайные величины η и τвзаимно независимы. Тогда случайная величина ζ = η/ξ имеетплотность распределения следующего вида:

fζ(z) =Γ(k+1

2 )√πΓ(k2 )

1

(1 + z2)k+1

2

ДоказательствоРаспределение хи-квадрат с k степенями свободы представляет собойгамма-распределение с параметрами формы k/2 и масштаба 1/2:

fτ (x) =

( 12 )

k2xk2−1

Γ( k2

)e−

x2 , x > 0;

0, x ≤ 0.

Как легко заметить, имеет место равенство:

P{√τ ≤ x} = P{τ ≤ x2},

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 24 / 49

Page 25: 2013 03 13_statistics_lecture04

Доверительные интервалы Распределение Стьюдента

тогда

f√τ (x) = 2xfτ (x2) =

{1

2k2−1

xk−1

Γ( k2

)e−

x2

2 , x > 0;

0, x ≤ 0.

Следовательно, имеют место равенства:

fζ(z) =

∞∫0

xfξ(x)fη(zx)dx =1

2k2−1Γ(k2 )

√2π

∞∫0

xke−x2

2 e−z2x2

2 dx =

=1

2k−1

2 Γ(k2 )√π

∞∫0

xke−x2

2(z2+1)dx =

=1

√πΓ(k2 )

1

(z2 + 1)k+1

2

∞∫0

uk+1

2−1e−udu,

где u = x2(z2 + 1)/2, xdx = du/(z2 + 1), причем,∞∫0

uk+1

2−1e−udu = Γ

(k+1

2

).

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 25 / 49

Page 26: 2013 03 13_statistics_lecture04

Доверительные интервалы Распределение Стьюдента

Следствие 1Плотность распределения Стьюдента с k степенями свободы имеетвид:

f (z) =Γ(k+1

2 )√πkΓ(k2 )

1

(1 + z2/k)k+1

2

. (3)

ДоказательствоДля доказательства достаточно заметить, что случайная величина√kζ подчиняется распределению Стьюдента с k степенями свободы и

f√kζ(z) = 1√kfζ( z√

k).

Замечание 2Можно показать, что для плотности f (z) из выражения (3) имеетместо сходимость:

f (z) −−−→k→∞

1√2π

e−z2

2 .

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 26 / 49

Page 27: 2013 03 13_statistics_lecture04

Доверительные интервалы Cтатистика Пирсона

Статистика Пирсона

Пусть задана генеральная совокупность ξ с функцией распределенияFξ и выборка X[n] = (X1, . . . ,Xn). Разобьем числовую ось на rнепересекающихся интервалов: −∞ = a0 < a1 < . . . < ar =∞.Обозначим через ∆1 = (−∞, a1], ∆2 = (a1, a2], . . ., ∆r = (ar−1,∞).Пусть pi = Fξ(ai )− Fξ(ai−1) — вероятность того, что случайнаявеличина ξ попадет в интервал ∆i ,

∑ri=1 pi = 1. Пусть ni —

количество элементов выборки X[n], попавших в ∆i . Определимстатистику χ2 следующим образом:

χ2 =r∑

i=1

(ni − npi )2

npi, (4)

где ni — частота (количество элементов выборки, попавших в ∆i ), npi— ожидаемое количество наблюдений в интервале ∆i .

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 27 / 49

Page 28: 2013 03 13_statistics_lecture04

Доверительные интервалы Cтатистика Пирсона

Определение 4

Статистики вида 4 называются статистиками χ2 или статистикамиПирсона.

Покажем, что статистика Пирсона может быть преобразована кстатистике первого типа:

χ2 =r∑

i=1

(ni − npi )2

npi= n

r∑i=1

(1√pi

nin−√pi

)2

=

= nr∑

i=1

n∑j=1

1√piI {Xj ∈ ∆i} −

√pi

2

. (5)

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 28 / 49

Page 29: 2013 03 13_statistics_lecture04

Доверительные интервалы Cтатистика Пирсона

Рассмотрим статистику первого типа

S(X[n]) = h(1

n

n∑j=1

g(Xj)),

где в качестве h возьмем функцию h(t1, . . . , tr ) = =r∑

i=1

(ti −√pi)2,

g(x) = (g1(x), . . . , gr (x)) и gi (x) = 1√piI {x ∈ ∆i}, i = 1, . . . , r .

Получаем, что

1

n

n∑j=1

g(Xj) =

(1√p1

n1

n, . . . ,

1√pr

nrn

).

Таким образом, статистика χ2 представляет собой произведениеконстанты n на статистику первого типа. Следовательно, можновоспользоваться теоремой 8 (Л2) о предельном распределениистатистик первого типа.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 29 / 49

Page 30: 2013 03 13_statistics_lecture04

Доверительные интервалы Cтатистика Пирсона

Очевидно, что a = (a1, . . . , ar ) = (Eg1(ξ), . . . ,Egr (ξ)) = (√p1, . . . ,

√pr ),

при этом h′(a) = 0, 12h′′(a) = Er , где Er — единичная матрица порядка

r . Из теоремы 8 (Л2) получаем, что

χ2(X[n])d−−−→

n→∞ζT ζ = ζ2

1 + . . .+ ζ2r ,

где ζ ∼ N(0,Dg(ξ)). Вычислим ковариационную матрицу Dg(ξ):

Dg(ξ) = E{g(ξ)gT (ξ)

}− Eg(ξ) (Eg(ξ))T ,

после дополнительных преобразований получаем

Dg(ξ) = Er − (√p1, . . . ,

√pr )T (

√p1, . . . ,

√pr ) .

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 30 / 49

Page 31: 2013 03 13_statistics_lecture04

Доверительные интервалы Cтатистика Пирсона

Пусть C — ортонормированная матрица CCT = CTC = Er .Зафиксируем первую строку c1 = (

√p1, . . . ,

√pr ) матрицы C .

Остальные строки будем искать методом ортогонализацииГрамма-Шмидта.Случайный вектор η = Cζ подчиняется многомерному нормальномураспределению N(0,CDg(ξ)CT ), при этом из выбора матрицы C

следует, что Dη1 = 0, кроме того, Eη1 = 0, следовательно, η1п.н.= 0.

CDg(ξ)CT =

0 00 . . . 00. . .0

Er−1

.

Как легко видеть,ηTη = ζTCTCζ = ζT ζ = η2

1 + η22 + . . .+ η2

r = ζ21 + ζ2

2 + . . .+ ζ2r .

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 31 / 49

Page 32: 2013 03 13_statistics_lecture04

Доверительные интервалы Cтатистика Пирсона

Следовательно, распределения сумм одинаковы, поэтому

χ2 d−−−→n→∞

η21 + . . .+ η2

r ,

но η21 + . . .+ η2

rп.н.= η2

2 + . . .+ η2r , тогда

χ2 d−−−→n→∞

η22 + . . .+ η2

r ,

где η2, . . . , ηr — взаимно независимые одинаково распределенныеслучайные величины, ηi ∼ N(0, 1), i = 2, . . . , r , η1

п.н.= 0.

Определение 5

Пусть δ1, . . . , δk — взаимно независимые одинаково распределенныестандартные гауссовы случайные величины, тогда распределениеслучайной величины δ2

1 + . . .+ δ2k , называется распределением χ2 с k

степенями свободы (или распределением Пирсона с k степенямисвободы).

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 32 / 49

Page 33: 2013 03 13_statistics_lecture04

Доверительные интервалы Cтатистика Пирсона

Проведенные рассуждения доказывают следующую теорему.

Теорема 1

Статистика χ2, определяемая равенством (4), асимптотическираспределена по закону хи-квадрат с r − 1 степенью свободы, то есть

χ2 =r∑

i=1

(ni − npi )2

npi

d−−−→n→∞

τ,

где τ подчиняется распределению хи-квадрат с r − 1 степеньюсвободы.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 33 / 49

Page 34: 2013 03 13_statistics_lecture04

Доверительные интервалы Cтатистика Пирсона

Замечание 3

Нетрудно заметить, что к статистике χ2, определяемой формулой (4),можно прийти, исходя из генеральной совокупности, подчиняющейсяполиномиальному распределению с r возможными исходами, гдевероятности p1, p2,. . .,pr представляют собой вероятности появлениясоответствующих исходов (

∑ri=1 pi = 1), n — число испытаний, n1 —

количество появлений первого исхода, n2 — количество появленийвторого исхода, . . ., nr — количество появлений исхода с номером r ,∑r

i=1 ni = n. В статистическом эксперименте непосредственнонаблюдается выборка частот (n1, n2, . . . , nr ).Утверждение теоремы 1 сохраняется и для рассматриваемогополиномиального распределения.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 34 / 49

Page 35: 2013 03 13_statistics_lecture04

Доверительные интервалыТочные доверительные интервалы для нормальной

генеральной совокупности

Точные доверительные интервалы для нормальнойгенеральной совокупности

Теорема 2

Пусть задана выборка X[n] из генеральной совокупности ξ ∼ N(a, σ2).Справедливы следующие утверждения:

1 Статистика X̄−aσ

√n подчиняется стандартному нормальному

распределению.

2 Если s̃2 = 1n−1

n∑i=1

(Xi − X̄ )2, тогда статистика X̄−as̃

√n подчиняется

распределению Стьюдента с n − 1 степенью свободы.3 Статистика (n−1)s̃2

σ2 подчиняется распределению хи-квадрат с n − 1степенью свободы.

4 Если s2 = 1n

n∑i=1

(Xi − a)2, тогда статистика ns2

σ2 подчиняется

распределению хи-квадрат с n степенями свободы.

ДоказательствоВ лемме 2 было показано, что линейное преобразование не меняет типнормального распределения и изменяет только параметры. Тогдаутверждение 1 теоремы очевидно.Очевидно, что

s̃2 =1

n − 1

n∑i=1

(Xi − X̄ )2 =

=1

n − 1

n∑i=1

(Xi − a)2 − n

(1

n

n∑i=1

(Xi − a)

)2 =

=1

n − 1

n∑i=1

(Xi − a)2 −

1√n

n∑j=1

(Xj − a)

2 .

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 35 / 49

Page 36: 2013 03 13_statistics_lecture04

Доверительные интервалыТочные доверительные интервалы для нормальной

генеральной совокупности

Тогда справедливо равенство:

(n − 1)s̃2

σ2=

n∑i=1

(Xi − a

σ

)2

n∑j=1

1√n

Xj − a

σ

2

.

Введем обозначение:

δ =

X1−aσ. . .Xn−aσ

,

при этом δ подчиняется многомерному нормальному распределению спараметрами (0,En).Рассмотрим строку (1/

√n, . . . , 1/

√n) = C1. При этом, нетрудно

заметить, что C1CT1 = 1, тогда методом ортогонализации

Грама-Шмидта последовательно получим n − 1 строку C2, . . . ,Cn.Строки будут ортогональными и нормированными. Составим матрицу:

C =

C1

. . .Cn

.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 36 / 49

Page 37: 2013 03 13_statistics_lecture04

Доверительные интервалыТочные доверительные интервалы для нормальной

генеральной совокупности

Рассмотрим преобразование Cδ = η, из лемм 2 и 4 следует:

(n − 1)s̃2

σ2=

n∑i=1

δ21 − η2

1 ∼ χ2n−1,

где δi = Xi−aσ , η1 =

∑nj=1

1√n

Xj−aσ =

∑nj=1

1√nδi = C1δ. Утверждение 3

теоремы доказано.В лемме 3 было доказано, что (X1 − X̄ , . . . ,Xn − X̄ ) и X̄ − a взаимнонезависимы. Рассмотрим дробь Стьюдента:

X̄−aσ

√n√

1n−1

(n−1)s̃2

σ2

=X̄ − a

√n ∼ Tn−1.

Таким образом, доказано утверждение 2 теоремы.Утверждение 4 следует из определения:

ns2

σ2=

n∑i=1

(Xi − a)2

σ2=

n∑i=1

(Xi − a

σ

)2

∼ χ2n.

Теорема доказана.Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 37 / 49

Page 38: 2013 03 13_statistics_lecture04

Доверительные интервалыТочные доверительные интервалы для нормальной

генеральной совокупности

Точные доверительные интервалы для нормальной генеральнойсовокупности можно построить по следующим правилам:

Если a неизвестно, σ2 известно, тогда

P

{X̄ − σ√

nz1− ε

2< a < X̄ +

σ√nz1− ε

2

}= 1− ε,

где z1− ε2— квантиль стандартного нормального распределения.

Если a неизвестно, σ2 неизвестно, то доверительный интервал дляa будет иметь вид:

P

{X̄ − s̃√

nt1− ε

2< a < X̄ +

s̃√nt1− ε

2

}= 1− ε,

где t1− ε2— квантиль распределения Стьюдента с n − 1 степенью

свободы.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 38 / 49

Page 39: 2013 03 13_statistics_lecture04

Доверительные интервалыТочные доверительные интервалы для нормальной

генеральной совокупности

Если a неизвестно, σ2 неизвестно, необходимо построитьдоверительный интервал для σ2. Пусть ε = ε1 + ε2. Пусть u1−ε2 —квантиль распределения хи-квадрат с n − 1 степенью свободыуровня 1− ε2, uε1 — квантиль распределения хи-квадрат с n − 1степенью свободы уровня ε1, тогда доверительный интервал дляσ2 будет следующим:

P

{(n − 1)s̃2

u1−ε2

< σ2 <(n − 1)s̃2

uε1

}= 1− ε.

Если a известно, σ2 неизвестно, тогда доверительный интервалстроится также, как и в случае 3, только в качестве статистикирассматривается статистика ns2/σ2 из пункта 4 теоремы 2. Пустьvε1 — квантиль распределения хи-квадрат с n степенями свободыуровня ε1, v1−ε2 — квантиль распределения хи-квадрат с nстепенями свободы уровня 1− ε2, тогда доверительный интервалдля σ2 будет

P

{ns2

v1−ε2

< σ2 <ns2

vε1

}= 1− ε,

здесь ε = ε1 + ε2.Обычно, при построении доверительных интервалов длядисперсии выбирают ε1 = ε2 = ε/2.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 39 / 49

Page 40: 2013 03 13_statistics_lecture04

Гамма-распределение

Гамма-распределение

Плотность распределения случайной величины ξ, соответствующаястандартному гамма-распределению с параметром формы p,определяется формулой:

fξ(x) =

{xp−1

Γ(p) e−x , x > 0

0, x 6 0.

Нетрудно заметить, что fξ(x) ≥ 0 и∫ +∞−∞ fξ(x)dx = 1.

Гамма-функция определяется следующим образом

Γ(p) =

∞∫0

xp−1e−xdx , p > 0.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 40 / 49

Page 41: 2013 03 13_statistics_lecture04

Гамма-распределение

Свойства гамма-функции:Справедливы равенства:

Γ(1) = 1, Γ(2) = 1,

Γ

(1

2

)=

+∞∫0

x−12 e−xdx = 2

+∞∫0

e−xd(x12 ) = 2

+∞∫0

e−y2dy =

=

+∞∫−∞

e−y2dy =

+∞∫−∞

e−y2dy

2

12

=

+∞∫−∞

+∞∫−∞

e−y2e−x

2dxdy

12

=√π,

При p > 1, интегрируя по частям, нетрудно получить равенство:

Γ(p) = (p − 1)Γ(p − 1).

Если n ∈ N, то Γ(n) = (n − 1)!.Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 41 / 49

Page 42: 2013 03 13_statistics_lecture04

Гамма-распределение

Рассмотрим случайную величину η = ξ/λ, параметр λ > 0, нетруднополучить выражение для плотности распределения, соответствующегогамма-распределению G (λ, p) с параметром формы p и параметроммасштаба λ:

fη(x) =

{λpxp−1

Γ(p) e−λx , x > 0

0, x 6 0.(6)

Если в формуле 6 положить λ = 1, то получим плотностьстандартного гамма-распределения, а если в формуле (6) положитьp = 1, то получим плотность экспоненциального распределения.

Лемма 7

Пусть δ — случайная величина, подчиняющаяся стандартномунормальному распределению, δ ∼ N(0, 1), тогда случайная величинаδ2 подчиняется гамма-распределению с параметрами p = 1/2, λ = 1/2.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 42 / 49

Page 43: 2013 03 13_statistics_lecture04

Гамма-распределение

Доказательство

Пусть δ ∼ N(0, 1), то есть, fδ(x) = 1√2πe−

x2

2 . Функцию распределенияслучайной величины δ обозначим через

Φ(y) =1√2π

y∫−∞

e−t2

2 dt.

Найдем функцию распределения случайной величины δ2:

P{δ2 ≤ y} = P(−√y ≤ δ ≤ √y) = Φ(√y)− Φ(−√y),

дифференцируя, найдем плотность распределения для y > 0:

fδ2(y) =1

2

1√y

1√2π

e−y2 +

1

2

1√y

1√2π

e−y2 =

= (1

2)

12 y−

12

1√πe−

y2 =

( 12

)12 y−

12

Γ( 12

)e−

y2 , y > 0;

0, y < 0.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 43 / 49

Page 44: 2013 03 13_statistics_lecture04

Гамма-распределение

Следовательно, случайная величина δ2 подчиняетсягамма-распределению с параметрами p = 1/2, λ = 1/2.

Лемма 8

Пусть заданы взаимно независимые случайные величиныξ1 ∼ G (λ, p1), ξ2 ∼ G (λ, p2), тогда ξ = ξ1 + ξ2 ∼ G (λ, p1 + p2).

ДоказательствоОчевидно, что

P{ξ ≤ y} =

∫∫{(x1,x2)|x1+x2≤y}

fξ1(x1)fξ2(x2)dx1dx2 =

=

+∞∫−∞

fξ1(x1)

y−x1∫−∞

fξ2(x2)dx2dx1.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 44 / 49

Page 45: 2013 03 13_statistics_lecture04

Гамма-распределение

Сделаем замену переменных: u = x1 + x2, du = dx2, тогда

P{ξ ≤ y} =

+∞∫−∞

fξ1(x1)

y∫−∞

fξ2(u − x1)dudx1 =

=

y∫−∞

+∞∫−∞

fξ1(x1)fξ2(u − x1)dx1du.

Получили формулу свертки для плотности суммы двух независимыхслучайных величин:

fξ(u) =

+∞∫−∞

fξ1(x1)fξ2(u − x1)dx1 =

u∫0

fξ1(x1)fξ2(u − x1)dx1 =

=

u∫0

λp1+p2

Γ(p1)Γ(p2)xp1−1

1 (u − x1)p2−1e−λx1e−λ(u−x1)dx1 =

=λp1+p2e−λu

Γ(p1)Γ(p2)

u∫0

xp1−11 (u − x1)p2−1dx1.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 45 / 49

Page 46: 2013 03 13_statistics_lecture04

Гамма-распределение

Сделаем замену переменных под знаком интеграла: x1 = su, s ∈ (0, 1),dx1 = uds, тогда

fξ(u) =λp1+p2e−λu

Γ(p1)Γ(p2)up1+p2−1

1∫0

sp1−1(1− s)p2−1ds =

=

{cup1+p2−1e−λuλp1+p2 , u > 0;0, u ≤ 0,

где c = (∫ 1

0 sp1−1(1− s)p2−1ds)/(Γ(p1)Γ(p2)). Найдем c из условиянормировки:

c

+∞∫0

λp1+p2up1+p2−1e−λudu = 1.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 46 / 49

Page 47: 2013 03 13_statistics_lecture04

Гамма-распределение

Сделаем замены переменных: x = λu, u = x/λ, du = dx/λ, тогда

c

+∞∫0

xp1+p2e−xdx = cΓ(p1 + p2) = 1

илиc =

1

Γ(p1 + p2).

Плотность fξ(x) имеет вид:

fξ(x) =

{λp1+p2

Γ(p1+p2)xp1+p2−1e−λx , x > 0

0, x 6 0.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 47 / 49

Page 48: 2013 03 13_statistics_lecture04

Гамма-распределение

В ходе доказательства леммы 8 получено тождество, связывающеебета-функцию с гамма-функциями:

B(p1, p2) =

1∫0

sp1−1(1− s)p2−1ds =Γ(p1)Γ(p2)

Γ(p1 + p2).

Следствие 2Пусть случайные величины δi ,i = 1, . . . ,m взаимно независимы,одинаково распределены и подчиняются стандартному нормальномураспределению, δi ∼ N(0, 1). Тогда δ2

1 + ...+ δ2m ∼ G ( 1

2 ,m2 ).

Доказательство следует из лемм 7, 8.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 48 / 49

Page 49: 2013 03 13_statistics_lecture04

Гамма-распределение

Замечание 4Доказано важное утверждение: распределение хи-квадрат с mстепенями свободы является частным случаем гамма распределения спараметрами p = 1/2, λ = m/2.

Если случайная величина τ подчиняется распределению хи-квадрат сm степенями свободы, то ее плотность имеет вид:

fτ (x) =

x

m2−1e−

12x

2m2 Γ(m2 )

, x > 0;

0, x ≤ 0.

Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 49 / 49