Upload
cs-center
View
1.027
Download
0
Embed Size (px)
Citation preview
Лекция 4. Доверительные интервалы
Буре В.М., Грауэр Л.В.
ШАД
Санкт-Петербург, 2013
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 1 / 49
Cодержание
Содержание
1 Доверительные интервалыОбщая схема построения доверительных интерваловАсимптотические доверительные интервалыРаспределения статистик для выборок из нормальной генеральнойсовокупностиРаспределение СтьюдентаCтатистика ПирсонаТочные доверительные интервалы для нормальной генеральнойсовокупности
2 Гамма-распределение
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 2 / 49
Доверительные интервалы Общая схема построения доверительных интервалов
Общая схема построения доверительных интервалов
Пусть задана генеральная совокупность ξ с функцией распределенияFξ(x). Имеется выборка X[n] = (X1, . . . ,Xn) из этой генеральнойсовокупности и неизвестный параметр распределения θ ∈ Θ ⊂ R.
Определение 1
Пусть для некоторого α ∈ (0, 1) существуют статистики S−(X[n], α) иS+(X[n], α) такие, что
P{S−(X[n], α) < θ < S+(X[n], α)
}= 1− α,
тогда интервал(S−(X[n], α),S+(X[n], α)
)называется доверительным
интервалом для параметра θ с уровнем доверия (1− α).
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 3 / 49
Доверительные интервалы Общая схема построения доверительных интервалов
Укажем общий метод построения доверительных интервалов, которыйбудет использован далее.Пусть известна статистика Y (S(X[n]), θ), содержащая оцениваемыйпараметр θ и его точечную оценку S(X[n]) со следующими свойствами:
1 Функция распределения FY (x) случайной величины Y известна ине зависит от θ.
2 Функция Y (S(X[n]), θ) непрерывна и строго монотонна по θ.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 4 / 49
Доверительные интервалы Общая схема построения доверительных интервалов
Зададим уровень значимости α.Обычно доверительный интервал строят так, чтобы дополнительныеинтервалы (− inf, S−(X[n], α)), (S+(X[n], α),+ inf) накрывали θравновероятно (с вероятностью α/2).
Находим квантили yα/2 и y1−α/2 распределения случайной величиныY порядка α/2 и 1− α/2 и далее получаем
P(yα/2 < Y (S(X[n]), θ) < y1−α/2) = F (y1−α/2)− F (yα/2) = 1− α.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 5 / 49
Доверительные интервалы Общая схема построения доверительных интервалов
Пусть для опреденности, функция Y (S(X[n]), θ) строго возрастает поθ. Тогда обратная функция Y−1(y) для Y (S(X[n]), θ) также будетстрого возрастающей. Тогда неравенство
yα/2 < Y (S(X[n]), θ) < y1−α/2 (1)
эквивалентно неравенству
Y−1(yα/2) < θ < Y−1(y1−α/2). (2)
Получаем доверительный интервал для θ
P(S−(X[n], α) < θ < S+(X[n], α)) = 1− α,
где S−(X[n], α) = Y−1(yα/2), S+(X[n], α) = Y−1(y1−α/2).Для случая строгого убывания Y (S(X[n]), θ) по θ знаки неравенства в(1), (2) будут противополжного смысла.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 6 / 49
Доверительные интервалы Асимптотические доверительные интервалы
Асимптотические доверительные интервалы
Определение 2
Пусть для некоторого α ∈ (0, 1) существуют статистики S−(X[n], α) иS+(X[n], α) такие, что
limn−→∞
P{S−(X[n], α) < θ < S+(X[n], α)
}= 1− α,
тогда интервал(S−(X[n], α), S+(X[n], α)
)называется асимптотическим
(приближенным) доверительным интервалом.
Построение асимптотических доверительных интервалов основано наасимптотически нормальных оценках.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 7 / 49
Доверительные интервалы Асимптотические доверительные интервалы
Предположим, что оценка θ̂ = θ̂(X[n]) является асимптотическинормальной, т. е.
√n(θ̂ − θ)
d−−−−→n−→∞
ς ∼ N(0, σ2),
где дисперсия σ2(θ) — коэффициент асимптотического рассеивания.Предположим, что функция σ2(θ) непрерывна на Θ и отлична от нулядля любого θ ∈ Θ.
Лемма 1
Случайный вектор (√n(θ̂ − θ), θ̂)
d−−−→n→∞
(ζ, θ), где ζ подчиняется
нормальному распределению N(0, σ2(θ)).
ДоказательствоПокажем, что характеристическая функция случайного вектора(√n(θ̂ − θ), θ̂) удовлетворяет условию:
ϕ(√n(θ̂−θ),θ̂)(t1, t2) −−−−→
n−→∞ϕ(ζ,θ)(t1, t2) = Ee it1ζ+it2θ.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 8 / 49
Доверительные интервалы Асимптотические доверительные интервалы
Действительно,
ϕ(√n(θ̂−θ),θ̂)(t1, t2) = Ee it1
√n(θ̂−θ)+i(t2θ̂±θt2) =
= Eei√n(θ̂−θ)(t1+
t2√n
)e it2θ = e it2θϕ√n(θ̂−θ)(t1 +
t2√n
) =
= e it2θ
({ϕ√n(θ̂−θ)(t1 +
t2√n
)− ϕζ(t1 +t2√n
)
}+ ϕζ(t1 +
t2√n
)
).
При этом, ϕζ(t1 + t2/√n) −−−→
n→∞ϕζ(t1), так как любая
характеристическая функция равномерно непрерывна.Имеет место сходимость:
ϕ√n(θ̂−θ)(t1 +t2√n
)− ϕζ(t1 +t2√n
) −−−→n→∞
0,
так как при любом t: ϕ√n(θ̂−θ)(t)→ ϕζ(t), и сходимость равномернана любом конечном промежутке.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 9 / 49
Доверительные интервалы Асимптотические доверительные интервалы
Следовательно, выполняется сходимость:
ϕ(√n(θ̂−θ),θ̂)(t1, t2) −−−→
n→∞e it2θϕζ(t1) = Ee it2θ+iζt1 = ϕ(ζ,θ)(t1, t2).
Лемма доказана.
Рассмотрим функцию от двух переменных H(x1, x2) = x1/σ(x2), онанепрерывна на R×Θ. Случайный вектор (ζ, θ)T ∈ R×Θ,следовательно, можем воспользоваться теоремой непрерывности:
H(√n(θ̂n − θ), θ̂n)
d−−−→n→∞
H(ζ, θ) =ζ
σ(θ)∼ N(0, 1).
Таким образом, имеет место сходимость:√n(θ̂ − θ)
σ(θ̂)
d−−−→n→∞
η ∼ N(0, 1).
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 10 / 49
Доверительные интервалы Асимптотические доверительные интервалы
Тогда справедливо следующее соотношение:
P{−z1−α2<
√n(θ̂ − θ)
σ(θ̂)< z1−α
2} −−−−→
n−→∞1− α =
1√2π
z1−α2∫−z1−α2
e−y2
2 dy ,
где z1−α2— квантиль стандартного нормального распределения уровня
1− α/2, то есть, F (z1−α2
) = 1− α/2, где F (x) — функциястандартного нормального распределения.Получаем асимптотический доверительный интервал с уровнемдоверия 1− α:
P{θ̂ − z1−α2
σ(θ̂)√n< θ < θ̂ + z1−α
2
σ(θ̂)√n} ≈ 1− α.
Ширина доверительного интервала характеризует точностьинтервальной оценки.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 11 / 49
Доверительные интервалы Асимптотические доверительные интервалы
Пример 1Рассмотрим схему Бернулли, в которой n испытаний. Пусть m — числоуспехов. Выборка X[n] = (a1, . . . , an) состоит из последовательностинулей и единиц, тогда функция правдоподобия имеет вид:
L(X[n], p) = pmqn−m, p ∈ Θ = (0, 1),
где m — число единиц в выборке. Логарифмическая функцияправдоподобия имеет вид:
ln L = m ln p + (n −m) ln(1− p).
Найдем оценку максимального правдоподобия:
∂ ln L
∂p=
m
p− n −m
1− p=
m −mp − np + mp
p(1− p)= 0.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 12 / 49
Доверительные интервалы Асимптотические доверительные интервалы
Следовательно, получаем оценку:
p̂ =m
n.
Убеждаемся, что p̂ максимизирует функцию правдоподобия:
∂2 ln L
∂p2= −m
p2− n −m
(1− p)2< 0.
Следовательно, p̂ = mn — точка максимума или оценка по методу
максимального правдоподобия.Нетрудно показать, что оценка p̂ асимптотически нормальна:
√n(mn− p)
=m − np√
n=
n∑i=1
ξi − np
√n
=
=
n∑i=1
(ξi − p)
√n
d−−−→n→∞
ζ ∼ N(0, pq),
где P{ξi = 1} = p, P{ξi = 0} = q = 1− p, σ2 = pq = p(1− p).Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 13 / 49
Доверительные интервалы Асимптотические доверительные интервалы
Воспользуемся доказанным утверждением:√n(θ̂ − θ)
σ(θ̂)
d−−−→n→∞
η ∼ N(0, 1).
Тогда имеет место сходимость:√n(mn − p)√mn (1− m
n )
d−−−→n→∞
η ∼ N(0, 1).
Следуя приведенным выше рассуждениям, получаем доверительныйинтервал с уровнем доверия 1− α для вероятности p:(
m
n− z1−α
2
√mn (1− m
n )√n
,m
n+ z1−α
2
√mn (1− m
n )√n
)
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 14 / 49
Доверительные интервалыРаспределения статистик для выборок из нормальной
генеральной совокупности
Распределения статистик для выборок из нормальнойгенеральной совокупности
Пусть имеется генеральная совокупность ξ ∼ N(a, σ2) и выборка X[n]
из этой генеральной совокупности. Если ξ — гауссова случайнаявеличина, то функция плотности ее распределения имеет вид:
fξ(x) =1√2πσ
e−(x−a)2
2σ2 , x ∈ R,
а если ξ — гауссов случайный вектор, то
fξ(x) =1
(2π)n2
√|Σ|
e−12
(x−a)T Σ−1(x−a), x ∈ Rm.
В первом случае предполагается, что σ2 > 0, а во-втором, чтоdet |Σ| 6= 0.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 15 / 49
Доверительные интервалыРаспределения статистик для выборок из нормальной
генеральной совокупности
Любому распределению взаимно однозначно соответствуетхарактеристическая функция. С помощью метода характеристическихфункций легко получить, что компоненты гауссова случайного векторанезависимы тогда и только тогда, когда ковариационная матрица Σдиагональна или, другими словами, когда равны нулю попарныековариации всех компонент.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 16 / 49
Доверительные интервалыРаспределения статистик для выборок из нормальной
генеральной совокупности
Лемма 2
Пусть ζ — случайный вектор размерности m, подчиняющийсямногомерному нормальному распределению N(a,Σ), пусть A — любаяматрица размерности n ×m, b — вектор размерности n × 1. Тогдавектор η = Aζ + b подчиняется нормальному распределениюN(Aa + b;AΣAT
).
ДоказательствоРассмотрим
ϕη(t) = Ee itT η = e it
TbEe i(tTA)ζ = e it
Tbϕζ(tTA) =
= Ee itT (Aa+b)− 1
2tTAΣAT t ,
где Aa + b — математическое ожидание, AΣAT — ковариационнаяматрица случайного вектора η.Лемма доказана.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 17 / 49
Доверительные интервалыРаспределения статистик для выборок из нормальной
генеральной совокупности
Лемма 3
Пусть ξ ∼ N(0, σ2En
)и ξ̄ = 1
n
∑ni=1 ξi — среднее арифметическое.
Тогда ξ̄ и вектор(ξ1 − ξ̄, . . . , ξn − ξ̄
)взаимно независимы.
ДоказательствоВозьмем любой элемент вектора, например, ξk − ξ̄, и проверим егонезависимость с ξ̄. Рассмотрим разность:
ξk − ξ̄ = ξk −1
n
n∑i=1
ξi = −1
nξ1 − . . .−
1
nξk−1 +
n − 1
nξk−
− 1
nξk+1 − . . .−
1
nξn =
(−1
n, . . . ,−1
n,n − 1
n,−1
n, . . .− 1
n
)ξ,
ξ̄ =1
nξ1 + . . .+
1
nξn =
(1
n, . . . ,
1
n
)ξ,(
− 1n , . . . ,−
1n ,
n−1n ,− 1
n , . . . ,−1n
1n ,
1n , . . . ,
1n
)ξ =
(ξk − ξ̄ξ̄
).
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 18 / 49
Доверительные интервалыРаспределения статистик для выборок из нормальной
генеральной совокупности
Тогда по лемме 2 получаем:(ξk − ξ̄ξ̄
)∼ N
( (00
),
(σ2
1 00 σ2
2
) ),
где σ21 = n−1
n σ2, σ22 = 1
nσ2, внедиагональные элементы равны нулю,
поскольку
σ2
(−1
n, . . . ,−1
n,n − 1
n,−1
n, . . . ,−1
n
)(1
n, . . . ,
1
n
)T
=
= σ2−(n − 1) + (n − 1)
n2= 0.
Лемма доказана
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 19 / 49
Доверительные интервалыРаспределения статистик для выборок из нормальной
генеральной совокупности
Лемма 4
Пусть ξ = (ξ1, . . . , ξm)T ∼ N(0,Em), CCT = CTC = Em и η = Cξ.
Тогда τ =m∑
k=1
ξ2k − η2
1 − . . .− η2r подчиняется распределению
хи-квадрат с m − r степенями свободы, и случайные величиныη1, . . . , ηr взаимно независимы с τ .
ДоказательствоИз леммы 2 следует, что η ∼ N(0,Em×m). Как легко видеть, имеетместо равенство:
m∑i=1
ξ2i = ξT ξ = ξTCTCξ = ηTη =
m∑i=1
η2i .
Следовательно, справедливо равенство:m∑i=1
ξ2i − η2
1 − . . .− η2r =
m∑j=r+1
η2j ,
полученное равенство доказывает лемму.Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 20 / 49
Доверительные интервалы Распределение Стьюдента
Распределение Стьюдента
Определение 3
Пусть заданы случайные величины ζ ∼ N(0, 1) и τk ∼ χ2k . Пусть
случайные величины ζ и τk взаимно независимы. Распределениеслучайной величины
ξ =ζ√τkk
называется распределением Стьюдента с k степенями свободы иобозначается через Tk .
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 21 / 49
Доверительные интервалы Распределение Стьюдента
Замечание 1Очевидно, что если ζ ∼ N(0, 1) и ζ1,. . .,ζk — взаимно независимыеслучайные величины, подчиняющиеся стандартному нормальномураспределению, независимые с ζ, тогда
ζ√ζ2
1 +...+ζ2k
k
∼ Tk .
Лемма 5Пусть ζ = η/ξ, где η, ξ — взаимно независимые случайные величины.Пусть ξ
п.н.> 0, fξ(x), fη(y) — плотности распределения ξ и η
соответственно, тогда плотность распределения fζ(z) дроби ζ имеетвид:
fζ(z) =
∞∫0
xfξ(x)fη(zx)dx .
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 22 / 49
Доверительные интервалы Распределение Стьюдента
ДоказательствоНайдем функцию распределения случайной величины ζ:
Fζ(z) = P{ζ ≤ z} =
∫{(x ,y): y
x≤z,x>0}
fξ(x)fη(y)dxdy =
=
∞∫0
zx∫−∞
fξ(x)fη(y)dydx =
∞∫0
fξ(x)
z∫−∞
fη(xs)xds
dx .
Положим s = y/x , dy = xds. Меняем порядок интегрирования:
Fζ(z) =
z∫−∞
∞∫0
xfξ(x)fη(xs)dx
ds.
Полученное равенство доказывает лемму.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 23 / 49
Доверительные интервалы Распределение Стьюдента
Лемма 6
Пусть η ∼ N(0, 1), ξ =√τ , τ ∼ χ2
k . Пусть случайные величины η и τвзаимно независимы. Тогда случайная величина ζ = η/ξ имеетплотность распределения следующего вида:
fζ(z) =Γ(k+1
2 )√πΓ(k2 )
1
(1 + z2)k+1
2
ДоказательствоРаспределение хи-квадрат с k степенями свободы представляет собойгамма-распределение с параметрами формы k/2 и масштаба 1/2:
fτ (x) =
( 12 )
k2xk2−1
Γ( k2
)e−
x2 , x > 0;
0, x ≤ 0.
Как легко заметить, имеет место равенство:
P{√τ ≤ x} = P{τ ≤ x2},
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 24 / 49
Доверительные интервалы Распределение Стьюдента
тогда
f√τ (x) = 2xfτ (x2) =
{1
2k2−1
xk−1
Γ( k2
)e−
x2
2 , x > 0;
0, x ≤ 0.
Следовательно, имеют место равенства:
fζ(z) =
∞∫0
xfξ(x)fη(zx)dx =1
2k2−1Γ(k2 )
√2π
∞∫0
xke−x2
2 e−z2x2
2 dx =
=1
2k−1
2 Γ(k2 )√π
∞∫0
xke−x2
2(z2+1)dx =
=1
√πΓ(k2 )
1
(z2 + 1)k+1
2
∞∫0
uk+1
2−1e−udu,
где u = x2(z2 + 1)/2, xdx = du/(z2 + 1), причем,∞∫0
uk+1
2−1e−udu = Γ
(k+1
2
).
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 25 / 49
Доверительные интервалы Распределение Стьюдента
Следствие 1Плотность распределения Стьюдента с k степенями свободы имеетвид:
f (z) =Γ(k+1
2 )√πkΓ(k2 )
1
(1 + z2/k)k+1
2
. (3)
ДоказательствоДля доказательства достаточно заметить, что случайная величина√kζ подчиняется распределению Стьюдента с k степенями свободы и
f√kζ(z) = 1√kfζ( z√
k).
Замечание 2Можно показать, что для плотности f (z) из выражения (3) имеетместо сходимость:
f (z) −−−→k→∞
1√2π
e−z2
2 .
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 26 / 49
Доверительные интервалы Cтатистика Пирсона
Статистика Пирсона
Пусть задана генеральная совокупность ξ с функцией распределенияFξ и выборка X[n] = (X1, . . . ,Xn). Разобьем числовую ось на rнепересекающихся интервалов: −∞ = a0 < a1 < . . . < ar =∞.Обозначим через ∆1 = (−∞, a1], ∆2 = (a1, a2], . . ., ∆r = (ar−1,∞).Пусть pi = Fξ(ai )− Fξ(ai−1) — вероятность того, что случайнаявеличина ξ попадет в интервал ∆i ,
∑ri=1 pi = 1. Пусть ni —
количество элементов выборки X[n], попавших в ∆i . Определимстатистику χ2 следующим образом:
χ2 =r∑
i=1
(ni − npi )2
npi, (4)
где ni — частота (количество элементов выборки, попавших в ∆i ), npi— ожидаемое количество наблюдений в интервале ∆i .
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 27 / 49
Доверительные интервалы Cтатистика Пирсона
Определение 4
Статистики вида 4 называются статистиками χ2 или статистикамиПирсона.
Покажем, что статистика Пирсона может быть преобразована кстатистике первого типа:
χ2 =r∑
i=1
(ni − npi )2
npi= n
r∑i=1
(1√pi
nin−√pi
)2
=
= nr∑
i=1
n∑j=1
1√piI {Xj ∈ ∆i} −
√pi
2
. (5)
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 28 / 49
Доверительные интервалы Cтатистика Пирсона
Рассмотрим статистику первого типа
S(X[n]) = h(1
n
n∑j=1
g(Xj)),
где в качестве h возьмем функцию h(t1, . . . , tr ) = =r∑
i=1
(ti −√pi)2,
g(x) = (g1(x), . . . , gr (x)) и gi (x) = 1√piI {x ∈ ∆i}, i = 1, . . . , r .
Получаем, что
1
n
n∑j=1
g(Xj) =
(1√p1
n1
n, . . . ,
1√pr
nrn
).
Таким образом, статистика χ2 представляет собой произведениеконстанты n на статистику первого типа. Следовательно, можновоспользоваться теоремой 8 (Л2) о предельном распределениистатистик первого типа.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 29 / 49
Доверительные интервалы Cтатистика Пирсона
Очевидно, что a = (a1, . . . , ar ) = (Eg1(ξ), . . . ,Egr (ξ)) = (√p1, . . . ,
√pr ),
при этом h′(a) = 0, 12h′′(a) = Er , где Er — единичная матрица порядка
r . Из теоремы 8 (Л2) получаем, что
χ2(X[n])d−−−→
n→∞ζT ζ = ζ2
1 + . . .+ ζ2r ,
где ζ ∼ N(0,Dg(ξ)). Вычислим ковариационную матрицу Dg(ξ):
Dg(ξ) = E{g(ξ)gT (ξ)
}− Eg(ξ) (Eg(ξ))T ,
после дополнительных преобразований получаем
Dg(ξ) = Er − (√p1, . . . ,
√pr )T (
√p1, . . . ,
√pr ) .
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 30 / 49
Доверительные интервалы Cтатистика Пирсона
Пусть C — ортонормированная матрица CCT = CTC = Er .Зафиксируем первую строку c1 = (
√p1, . . . ,
√pr ) матрицы C .
Остальные строки будем искать методом ортогонализацииГрамма-Шмидта.Случайный вектор η = Cζ подчиняется многомерному нормальномураспределению N(0,CDg(ξ)CT ), при этом из выбора матрицы C
следует, что Dη1 = 0, кроме того, Eη1 = 0, следовательно, η1п.н.= 0.
CDg(ξ)CT =
0 00 . . . 00. . .0
Er−1
.
Как легко видеть,ηTη = ζTCTCζ = ζT ζ = η2
1 + η22 + . . .+ η2
r = ζ21 + ζ2
2 + . . .+ ζ2r .
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 31 / 49
Доверительные интервалы Cтатистика Пирсона
Следовательно, распределения сумм одинаковы, поэтому
χ2 d−−−→n→∞
η21 + . . .+ η2
r ,
но η21 + . . .+ η2
rп.н.= η2
2 + . . .+ η2r , тогда
χ2 d−−−→n→∞
η22 + . . .+ η2
r ,
где η2, . . . , ηr — взаимно независимые одинаково распределенныеслучайные величины, ηi ∼ N(0, 1), i = 2, . . . , r , η1
п.н.= 0.
Определение 5
Пусть δ1, . . . , δk — взаимно независимые одинаково распределенныестандартные гауссовы случайные величины, тогда распределениеслучайной величины δ2
1 + . . .+ δ2k , называется распределением χ2 с k
степенями свободы (или распределением Пирсона с k степенямисвободы).
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 32 / 49
Доверительные интервалы Cтатистика Пирсона
Проведенные рассуждения доказывают следующую теорему.
Теорема 1
Статистика χ2, определяемая равенством (4), асимптотическираспределена по закону хи-квадрат с r − 1 степенью свободы, то есть
χ2 =r∑
i=1
(ni − npi )2
npi
d−−−→n→∞
τ,
где τ подчиняется распределению хи-квадрат с r − 1 степеньюсвободы.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 33 / 49
Доверительные интервалы Cтатистика Пирсона
Замечание 3
Нетрудно заметить, что к статистике χ2, определяемой формулой (4),можно прийти, исходя из генеральной совокупности, подчиняющейсяполиномиальному распределению с r возможными исходами, гдевероятности p1, p2,. . .,pr представляют собой вероятности появлениясоответствующих исходов (
∑ri=1 pi = 1), n — число испытаний, n1 —
количество появлений первого исхода, n2 — количество появленийвторого исхода, . . ., nr — количество появлений исхода с номером r ,∑r
i=1 ni = n. В статистическом эксперименте непосредственнонаблюдается выборка частот (n1, n2, . . . , nr ).Утверждение теоремы 1 сохраняется и для рассматриваемогополиномиального распределения.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 34 / 49
Доверительные интервалыТочные доверительные интервалы для нормальной
генеральной совокупности
Точные доверительные интервалы для нормальнойгенеральной совокупности
Теорема 2
Пусть задана выборка X[n] из генеральной совокупности ξ ∼ N(a, σ2).Справедливы следующие утверждения:
1 Статистика X̄−aσ
√n подчиняется стандартному нормальному
распределению.
2 Если s̃2 = 1n−1
n∑i=1
(Xi − X̄ )2, тогда статистика X̄−as̃
√n подчиняется
распределению Стьюдента с n − 1 степенью свободы.3 Статистика (n−1)s̃2
σ2 подчиняется распределению хи-квадрат с n − 1степенью свободы.
4 Если s2 = 1n
n∑i=1
(Xi − a)2, тогда статистика ns2
σ2 подчиняется
распределению хи-квадрат с n степенями свободы.
ДоказательствоВ лемме 2 было показано, что линейное преобразование не меняет типнормального распределения и изменяет только параметры. Тогдаутверждение 1 теоремы очевидно.Очевидно, что
s̃2 =1
n − 1
n∑i=1
(Xi − X̄ )2 =
=1
n − 1
n∑i=1
(Xi − a)2 − n
(1
n
n∑i=1
(Xi − a)
)2 =
=1
n − 1
n∑i=1
(Xi − a)2 −
1√n
n∑j=1
(Xj − a)
2 .
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 35 / 49
Доверительные интервалыТочные доверительные интервалы для нормальной
генеральной совокупности
Тогда справедливо равенство:
(n − 1)s̃2
σ2=
n∑i=1
(Xi − a
σ
)2
−
n∑j=1
1√n
Xj − a
σ
2
.
Введем обозначение:
δ =
X1−aσ. . .Xn−aσ
,
при этом δ подчиняется многомерному нормальному распределению спараметрами (0,En).Рассмотрим строку (1/
√n, . . . , 1/
√n) = C1. При этом, нетрудно
заметить, что C1CT1 = 1, тогда методом ортогонализации
Грама-Шмидта последовательно получим n − 1 строку C2, . . . ,Cn.Строки будут ортогональными и нормированными. Составим матрицу:
C =
C1
. . .Cn
.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 36 / 49
Доверительные интервалыТочные доверительные интервалы для нормальной
генеральной совокупности
Рассмотрим преобразование Cδ = η, из лемм 2 и 4 следует:
(n − 1)s̃2
σ2=
n∑i=1
δ21 − η2
1 ∼ χ2n−1,
где δi = Xi−aσ , η1 =
∑nj=1
1√n
Xj−aσ =
∑nj=1
1√nδi = C1δ. Утверждение 3
теоремы доказано.В лемме 3 было доказано, что (X1 − X̄ , . . . ,Xn − X̄ ) и X̄ − a взаимнонезависимы. Рассмотрим дробь Стьюдента:
X̄−aσ
√n√
1n−1
(n−1)s̃2
σ2
=X̄ − a
s̃
√n ∼ Tn−1.
Таким образом, доказано утверждение 2 теоремы.Утверждение 4 следует из определения:
ns2
σ2=
n∑i=1
(Xi − a)2
σ2=
n∑i=1
(Xi − a
σ
)2
∼ χ2n.
Теорема доказана.Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 37 / 49
Доверительные интервалыТочные доверительные интервалы для нормальной
генеральной совокупности
Точные доверительные интервалы для нормальной генеральнойсовокупности можно построить по следующим правилам:
Если a неизвестно, σ2 известно, тогда
P
{X̄ − σ√
nz1− ε
2< a < X̄ +
σ√nz1− ε
2
}= 1− ε,
где z1− ε2— квантиль стандартного нормального распределения.
Если a неизвестно, σ2 неизвестно, то доверительный интервал дляa будет иметь вид:
P
{X̄ − s̃√
nt1− ε
2< a < X̄ +
s̃√nt1− ε
2
}= 1− ε,
где t1− ε2— квантиль распределения Стьюдента с n − 1 степенью
свободы.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 38 / 49
Доверительные интервалыТочные доверительные интервалы для нормальной
генеральной совокупности
Если a неизвестно, σ2 неизвестно, необходимо построитьдоверительный интервал для σ2. Пусть ε = ε1 + ε2. Пусть u1−ε2 —квантиль распределения хи-квадрат с n − 1 степенью свободыуровня 1− ε2, uε1 — квантиль распределения хи-квадрат с n − 1степенью свободы уровня ε1, тогда доверительный интервал дляσ2 будет следующим:
P
{(n − 1)s̃2
u1−ε2
< σ2 <(n − 1)s̃2
uε1
}= 1− ε.
Если a известно, σ2 неизвестно, тогда доверительный интервалстроится также, как и в случае 3, только в качестве статистикирассматривается статистика ns2/σ2 из пункта 4 теоремы 2. Пустьvε1 — квантиль распределения хи-квадрат с n степенями свободыуровня ε1, v1−ε2 — квантиль распределения хи-квадрат с nстепенями свободы уровня 1− ε2, тогда доверительный интервалдля σ2 будет
P
{ns2
v1−ε2
< σ2 <ns2
vε1
}= 1− ε,
здесь ε = ε1 + ε2.Обычно, при построении доверительных интервалов длядисперсии выбирают ε1 = ε2 = ε/2.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 39 / 49
Гамма-распределение
Гамма-распределение
Плотность распределения случайной величины ξ, соответствующаястандартному гамма-распределению с параметром формы p,определяется формулой:
fξ(x) =
{xp−1
Γ(p) e−x , x > 0
0, x 6 0.
Нетрудно заметить, что fξ(x) ≥ 0 и∫ +∞−∞ fξ(x)dx = 1.
Гамма-функция определяется следующим образом
Γ(p) =
∞∫0
xp−1e−xdx , p > 0.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 40 / 49
Гамма-распределение
Свойства гамма-функции:Справедливы равенства:
Γ(1) = 1, Γ(2) = 1,
Γ
(1
2
)=
+∞∫0
x−12 e−xdx = 2
+∞∫0
e−xd(x12 ) = 2
+∞∫0
e−y2dy =
=
+∞∫−∞
e−y2dy =
+∞∫−∞
e−y2dy
2
12
=
+∞∫−∞
+∞∫−∞
e−y2e−x
2dxdy
12
=√π,
При p > 1, интегрируя по частям, нетрудно получить равенство:
Γ(p) = (p − 1)Γ(p − 1).
Если n ∈ N, то Γ(n) = (n − 1)!.Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 41 / 49
Гамма-распределение
Рассмотрим случайную величину η = ξ/λ, параметр λ > 0, нетруднополучить выражение для плотности распределения, соответствующегогамма-распределению G (λ, p) с параметром формы p и параметроммасштаба λ:
fη(x) =
{λpxp−1
Γ(p) e−λx , x > 0
0, x 6 0.(6)
Если в формуле 6 положить λ = 1, то получим плотностьстандартного гамма-распределения, а если в формуле (6) положитьp = 1, то получим плотность экспоненциального распределения.
Лемма 7
Пусть δ — случайная величина, подчиняющаяся стандартномунормальному распределению, δ ∼ N(0, 1), тогда случайная величинаδ2 подчиняется гамма-распределению с параметрами p = 1/2, λ = 1/2.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 42 / 49
Гамма-распределение
Доказательство
Пусть δ ∼ N(0, 1), то есть, fδ(x) = 1√2πe−
x2
2 . Функцию распределенияслучайной величины δ обозначим через
Φ(y) =1√2π
y∫−∞
e−t2
2 dt.
Найдем функцию распределения случайной величины δ2:
P{δ2 ≤ y} = P(−√y ≤ δ ≤ √y) = Φ(√y)− Φ(−√y),
дифференцируя, найдем плотность распределения для y > 0:
fδ2(y) =1
2
1√y
1√2π
e−y2 +
1
2
1√y
1√2π
e−y2 =
= (1
2)
12 y−
12
1√πe−
y2 =
( 12
)12 y−
12
Γ( 12
)e−
y2 , y > 0;
0, y < 0.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 43 / 49
Гамма-распределение
Следовательно, случайная величина δ2 подчиняетсягамма-распределению с параметрами p = 1/2, λ = 1/2.
Лемма 8
Пусть заданы взаимно независимые случайные величиныξ1 ∼ G (λ, p1), ξ2 ∼ G (λ, p2), тогда ξ = ξ1 + ξ2 ∼ G (λ, p1 + p2).
ДоказательствоОчевидно, что
P{ξ ≤ y} =
∫∫{(x1,x2)|x1+x2≤y}
fξ1(x1)fξ2(x2)dx1dx2 =
=
+∞∫−∞
fξ1(x1)
y−x1∫−∞
fξ2(x2)dx2dx1.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 44 / 49
Гамма-распределение
Сделаем замену переменных: u = x1 + x2, du = dx2, тогда
P{ξ ≤ y} =
+∞∫−∞
fξ1(x1)
y∫−∞
fξ2(u − x1)dudx1 =
=
y∫−∞
+∞∫−∞
fξ1(x1)fξ2(u − x1)dx1du.
Получили формулу свертки для плотности суммы двух независимыхслучайных величин:
fξ(u) =
+∞∫−∞
fξ1(x1)fξ2(u − x1)dx1 =
u∫0
fξ1(x1)fξ2(u − x1)dx1 =
=
u∫0
λp1+p2
Γ(p1)Γ(p2)xp1−1
1 (u − x1)p2−1e−λx1e−λ(u−x1)dx1 =
=λp1+p2e−λu
Γ(p1)Γ(p2)
u∫0
xp1−11 (u − x1)p2−1dx1.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 45 / 49
Гамма-распределение
Сделаем замену переменных под знаком интеграла: x1 = su, s ∈ (0, 1),dx1 = uds, тогда
fξ(u) =λp1+p2e−λu
Γ(p1)Γ(p2)up1+p2−1
1∫0
sp1−1(1− s)p2−1ds =
=
{cup1+p2−1e−λuλp1+p2 , u > 0;0, u ≤ 0,
где c = (∫ 1
0 sp1−1(1− s)p2−1ds)/(Γ(p1)Γ(p2)). Найдем c из условиянормировки:
c
+∞∫0
λp1+p2up1+p2−1e−λudu = 1.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 46 / 49
Гамма-распределение
Сделаем замены переменных: x = λu, u = x/λ, du = dx/λ, тогда
c
+∞∫0
xp1+p2e−xdx = cΓ(p1 + p2) = 1
илиc =
1
Γ(p1 + p2).
Плотность fξ(x) имеет вид:
fξ(x) =
{λp1+p2
Γ(p1+p2)xp1+p2−1e−λx , x > 0
0, x 6 0.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 47 / 49
Гамма-распределение
В ходе доказательства леммы 8 получено тождество, связывающеебета-функцию с гамма-функциями:
B(p1, p2) =
1∫0
sp1−1(1− s)p2−1ds =Γ(p1)Γ(p2)
Γ(p1 + p2).
Следствие 2Пусть случайные величины δi ,i = 1, . . . ,m взаимно независимы,одинаково распределены и подчиняются стандартному нормальномураспределению, δi ∼ N(0, 1). Тогда δ2
1 + ...+ δ2m ∼ G ( 1
2 ,m2 ).
Доказательство следует из лемм 7, 8.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 48 / 49
Гамма-распределение
Замечание 4Доказано важное утверждение: распределение хи-квадрат с mстепенями свободы является частным случаем гамма распределения спараметрами p = 1/2, λ = m/2.
Если случайная величина τ подчиняется распределению хи-квадрат сm степенями свободы, то ее плотность имеет вид:
fτ (x) =
x
m2−1e−
12x
2m2 Γ(m2 )
, x > 0;
0, x ≤ 0.
Буре В.М., Грауэр Л.В. (ШАД) Лекция 4. Доверительные интервалы Санкт-Петербург, 2013 49 / 49