Upload
cs-center
View
429
Download
0
Embed Size (px)
Citation preview
Лекция 6. Критерии согласия.
Грауэр Л.В., Архипова О.А.
CS Center
Санкт-Петербург, 2016
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 1 / 34
Cодержание
Содержание
1 Критерии согласия для простых гипотезКритерий согласия ПирсонаКритерий согласия КолмогороваКритерий Крамера-Мизеса-СмирноваКритерий Андерсона-Дарлинга
2 Критерий согласия хи-квадрат для сложных гипотез
3 Критерии нормальностиГрафические методыКритерий Жарка-БераКритерий ЛиллиефорсаКритерий Шапиро-Уилка
4 Критерии однородности: продолжениеКритерий однородности Колмогорова–СмирноваКритерий однородности хи-квадрат
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 2 / 34
Критерии согласия для простых гипотез Критерий согласия Пирсона
Критерий согласия Пирсона (критерий χ2) для простойгипотезы
Один из типов гипотез — гипотезы согласия. Методы проверки этихгипотез — критерии согласия.
Пусть задана генеральная совокупность ξ, функция распределения Fξ,которой взаимно однозначно соответствует распределениюгенеральной совокупности Pξ, и выборка X[n] = (X1, . . . ,Xn).Пусть проверяется гипотеза согласия H0 : Fξ = F0, при этомпредполагается, что F0(x) известна.Сформулируем альтернативную гипотезу: H1 : Fξ 6= F0.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 3 / 34
Критерии согласия для простых гипотез Критерий согласия Пирсона
Числовую ось разбиваем на r промежутков−∞ = a0 < a1 < . . . < ar =∞, ∆i = (ai−1, ai ], r = 1,∞, r , и построимстатистику χ2:
χ2(X[n]) =r∑
i=1
(ni − np(0)i )2
np(0)i
.
где p(0)i = F0(ai )− F0(ai−1).
Если H0 верна, тогдаχ2(X[n])
d−−−→n→∞
ζ,
где ζ подчиняется распределению хи-квадрат с r − 1 степенямисвободы.Если верна гипотеза H1, то
χ2 п.н.−−−−→n−→∞
∞.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 4 / 34
Критерии согласия для простых гипотез Критерий согласия Пирсона
Выберем вероятность α ∈ (0, 1).
Область (C (r − 1, 1− α),∞), где C (r − 1, 1− α) — квантиль порядка1− α распределения χ2 с r − 1 степенями свободы, являетсякритической для гипотезы H0.
Если χ2(X[n]) > C (r − 1, 1− α), то H0 отклоняется, аесли χ2(X[n]) ≤ C (r − 1, 1− α), то для отклонения нет оснований.
p − value = PH0{η > χ2(X[n])} = 1− Fχ2r−1
(χ2(X[n])
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 5 / 34
Критерии согласия для простых гипотез Критерий согласия Колмогорова
Критерий согласия Колмогорова
Пусть задана генеральная совокупность ξ, функция распределения Fξ,которой взаимно однозначно соответствует распределение Pξ, ивыборка X[n] = (X1, . . . ,Xn).Выдвинем нулевую гипотезу H0 : Fξ = F0, H1 : Fξ 6= F0.Дополнительно наложим ограничение: функция F0(x) непрерывна наR.
Рассмотрим статистику Колмогорова:
Dn(X[n]) = supx∈R|F ∗n (x)− F0(x)| . (1)
Если верна гипотеза H0, то Dn(X[n])п.н.−−−→
n→∞0.
Если верна гипотеза H1, т. е. Fξ ≡ G 6= F0, тогда
Dn(X[n])п.н.−−−→
n→∞supx∈R|G (x)− F0(x)| > 0.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 6 / 34
Критерии согласия для простых гипотез Критерий согласия Колмогорова
При условии справедливости гипотезы H0 распределение статистикиDn(X[n]) не зависит от конкретного вида F0.
Лемма 1
Если гипотеза H0 верна, и F0(x) — непрерывная функция на R, тогдараспределение статистики
Dn = supx∈R
∣∣F ∗n (x ; x[n])− F0(x)∣∣
не зависит от закона распределения генеральной совокупности.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 7 / 34
Критерии согласия для простых гипотез Критерий согласия Колмогорова
При больших n применяется асимптотический подход
Теорема 1 (А.Н. Колмогорова)
Если гипотеза H0 верна, и F0(x) — непрерывная функция на R, тогдаимеет место сходимость:
P{√nDn(X[n]) 6 z} −−−→
n→∞K (z) = 1 + 2
∞∑m=1
(−1)me−2m2z2.
Находим константу d1−α как решение следующего уравнения:
K (d1−α) = 1− α.
Правило проверки гипотез будет следующим.
Если√nDn(X[n]) ∈ (d1−α,∞), тогда гипотеза H0 отвергается,
если√nDn(X[n]) /∈ (d1−α,∞), тогда гипотеза H0 принимается.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 8 / 34
Критерии согласия для простых гипотез Критерий согласия Колмогорова
Статистику Dn(X[n]) можно вычислить с помощью простоговычислительного алгоритма:
Dn(X[n]) = max16i6n
[i
n− F0(X(i)),F0(X(i))− i − 1
n
],
где X(1) < . . . < X(n) — вариационный ряд, построенный по выборкеX[n].
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 9 / 34
Критерии согласия для простых гипотез Критерий Крамера-Мизеса-Смирнова
Критерий ω2 (критерий Крамера-Мизеса-Смирнова)
Пусть задана генеральная совокупность ξ с функцией распределенияFξ и выборка X[n] = (X1, . . . ,Xn) из этой генеральной совокупности.Выдвинем нулевую гипотезу H0 : Fξ = F0, при конкурирующейгипотезе H1 : Fξ 6= F0.Статистика критерия имеет вид:
ω2n =
1
12n+
n∑i=1
{F0(X(i))− 2i − 1
2n
}2
,
где X(1) < . . . < X(n) — вариационный ряд, построенный по выборкеX[n].При справедливости гипотезы H0 и непрерывности функции F0
распределение статистики омега-квадрат зависит только от n и независит от F0.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 10 / 34
Критерии согласия для простых гипотез Критерий Крамера-Мизеса-Смирнова
При малых n имеются таблицы критических точек, а для большихзначений n следует использовать предельное (при n→∞)распределение статистики ω2
n.
Важное с теоретической точки зрения свойство критериев, основанныхна Dn и ω2
n: они состоятельны против любой альтернативной гипотезыFξ 6= F0.Статистический критерий для проверки гипотезы H0 называютсостоятельным против альтернативной гипотезы H1, если вероятностьотвергнуть H0, когда на самом деле верна H1, стремится к 1 принеограниченном увеличении объема наблюдений.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 11 / 34
Критерии согласия для простых гипотез Критерий Андерсона-Дарлинга
Критерий Андерсона-Дарлинга
Пусть задана генеральная совокупность ξ с функцией распределенияFξ и выборка X[n] = (X1, . . . ,Xn) из этой генеральной совокупности.Выдвинем нулевую гипотезу H0 : Fξ = F0, при конкурирующейгипотезе H1 : Fξ 6= F0.Статистика критерия имеет вид
S = −n − 2n∑
i=1
[2i − 1
2nln(F0(x(i))) +
(1− 2i − 1
2n
)ln(1− F0(x(i)))
]Нулевая гипотеза отклоняется на уровне значимости α, если S > Sα,где Sα — критическое значение распределения a2.
Для проверки нормальности распределения существует модификациядля проверки сложной гипотезы.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 12 / 34
Критерий согласия хи-квадрат для сложных гипотез
Критерий согласия хи-квадрат для сложных гипотез
В критерии согласия хи-квадрат реализуется следующая схема.Выдвигаются гипотезы:
H0: Fξ(x) ≡ F (x) — нулевая гипотеза.H1: Fξ(x) 6= F (x) — альтернативная гипотеза.
В прикладных задачах, как правило, известна не сама функцияраспределения, а параметрическое семейство, которому онапринадлежит: {
F (·/θ) : θ = (θ1, . . . , θl) ∈ Θ ⊂ Rl}.
Таким образом, проверяемая гипотеза принимает вид:
H0 : Fξ ∈{F (·/θ) : θ ∈ Θ ⊂ Rl
}.
Альтернативная гипотеза H1 примет вид: гипотеза H0 не верна.Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 13 / 34
Критерий согласия хи-квадрат для сложных гипотез
Разобьем числовую ось на k промежутков: ∆1, . . ., ∆k таким образом,что
⋃i ∆i = R, ∆i ∩∆j = ∅, i 6= j .
Получаем набор частот: n1, . . ., nk ,∑k
i=1 ni = n.Каждому промежутку ∆1, . . ., ∆k сопоставим вероятности: p1(θ), . . .,pk(θ).
Теорема 2 (Теорема Фишера)
Пусть Θ – открытое множество в Rl . Пусть выполнены условия:1 Для любого θ ∈ Θ:
∑ki=1 pi (θ) = 1.
2 Для любого θ ∈ Θ: pi (θ) > c > 0 для любого i = 1, k .3 Для любого θ ∈ Θ существуют и непрерывны производные:∂pi (θ)/∂θj , ∂2pi (θ)/(∂θu∂θv ) для любого i = 1, . . . , k ,u, v , j = 1, . . . , l .
4 Для любого θ ∈ Θ матрица(∂pi (θ)∂θj
)i ,j=1,k
имеет ранг l .
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 14 / 34
Критерий согласия хи-квадрат для сложных гипотез
Пусть θ̂ — оценка, найденная методом максимального правдоподобияпо выборке n1, . . . , nk , т. е. θ̂ = arg max
θ∈ΘL({ni}, θ), где
L({ni}, θ) =n!
n1! · . . . · nk !
k∏i=1
pnii (θ),
или θ̂ — оценка по методу минимума хи-квадрат:
θ̂ = arg minθ∈Θ
k∑i=1
(ni − npi (θ))2
npi (θ).
Тогда, если гипотеза H0 верна, то
χ2(θ̂) =k∑
i=1
(ni − npi (θ̂))2
npi (θ̂)
d−−−→n→∞
ζ ∼ χ2k−l−1.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 15 / 34
Критерий согласия хи-квадрат для сложных гипотез
Критическая область для гипотезы H0 при использовании статистикиχ2(θ̂) имеет вид: S = (u1−α,k−l−1,∞), где u1−α,k−l−1 — квантильуровня 1− α распределения хи-квадрат с k − l − 1 степенями свободы.Вероятность ошибки первого рода приближенно равна α.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 16 / 34
Критерии нормальности
Критерии нормальности
Пусть задана генеральная совокупность ξ, функция распределения Fξи выборка X[n] = (X1, . . . ,Xn).Выдвигаются гипотезы:
нулевая гипотеза H0: ξ ∼ N(a, σ)
альтернативная гипотеза H1: ξ имеет иное распределение.
Если нулевая гипотеза принимается, то при дальнейшем анализеданных можно использовать более мощные параметрические методы,в противном случае стоит воспользоваться непараметрическимиметодами.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 17 / 34
Критерии нормальности Графические методы
Графические методы
Гистограммы
Стоит обратить внимание на симметричность и куполообразностьграфикаГистограммы информативны при больших объемах выборок
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 18 / 34
Критерии нормальности Графические методы
QQ-графикиКвантиль-Квантиль график (QQ-plot) показывает взаимосвязь междузначениями наблюдаемых и теоретических квантилей.
Если данные нормальны, то точки графика располагаются вдольпрямой
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 19 / 34
Критерии нормальности Критерий Жарка-Бера
Критерий Жарка-Бера
Проверяемая нулевая гипотеза является сложной. Статистикакритерия Жарка-Бера имеет вид
JB =n
6
(Sk2 +
1
4K 2
),
где
Sk =µ̂3
s3, s2 =
1
n
n∑i=1
(xi − x̄)2, µ̂3 =1
n
∑i = 1n(xi − x̄)3
K =µ̂4
s4− 3, µ̂4 =
1
n
n∑i=1
(xi − x̄)4
При уровне значимости α критическая область S = (C1−α,+∞).
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 20 / 34
Критерии нормальности Критерий Жарка-Бера
Если верна нулевая гипотеза, то статистика JB имеет асимптотическоераспределение χ2 с 2 степенями свободы
JBd−−−→
n→∞ζ ∼ χ2(2)
Следуя данному асимптотическому свойству статистики JB , в качествеC1−α можно взять квантиль распределения χ2 с 2 степенями свободыпорядка 1− α.
Однако при малых n использование квантилей хи-квадрат приведет кбольшой ошибке 1го рода. Асимптотическим свойствам статистикирекомендуется пользоваться при n > 2000.
При малых n рекомендуется моделировать квантили C1−α методомМонте-Карло.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 21 / 34
Критерии нормальности Критерий Лиллиефорса
Критерий Лиллиефорса
Критерий Лиллиефорса - модификация критерия Колмогорова дляпроверки нормальности распределения. При этом проверяемая нулеваягипотеза является сложной.Статистика критерия
D(X[n]) = supx∈R
∣∣F ∗n (x ,X[n])− Φ(x)∣∣ ,
где Φ(x) — функция нормального распределения с параметрами x̄ и s̃2
Распределение статистики критерия при условии выполнения нулевойгипотезы называется "распределением Лиллиефорса". Оно смещено всторону меньших значений по сравнению с распределениемКолмогорова в силу построения оценок неизвестных параметров потой же выборке, что используется при проверке нормальности.
Критическая область критерия S = (C1−α,+∞), значения C1−αрассчитываются методом Монте-Карло (либо используютсяспециальные таблицы)
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 22 / 34
Критерии нормальности Критерий Шапиро-Уилка
Критерий Шапиро-Уилка
Проверяемая нулевая гипотеза является сложной. Статистикакритерия Шапиро-Уилка имеет вид
W =1
S2
[t∑
i=1
ai (x(n−i+1) − x(i))
]2
,
где S2 =∑n
i=1(xi − x̄)2,∑ti=1 ai (x(n−i+1) − x(i)) - оценка среднеквадратического отклонения
Ллойда, коэффициенты ai берутся из таблиц, t = n/2 при четном n,t = (n − 1)/2 при нечетном n.
Статистика W при выполнении нулевой гипотезы имеет табличноераспределение.Критические значения статистики Wα также находятся из таблиц.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 23 / 34
Критерии нормальности Критерий Шапиро-Уилка
Если W <Wα, то нулевая гипотеза о нормальности распределенияотклоняется при уровне значимости α.
Приближённая вероятность получения эмпирического значения W приH0 вычисляется по формуле
z = γ + η ln
(W − ε1−W
),
где γ, η, ε — табличные коэффициенты.
Критерий Шапиро-Уилка является наиболее мощным критерием дляпроверки нормальности, но имеет ограниченную применимость.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 24 / 34
Критерии однородности: продолжение Критерий Колмогорова–Смирнова
Критерий однородности Колмогорова–Смирнова
Пусть имеется две выборки X[n] = {X1, . . . ,Xn} и Y[m] = {Y1, . . . ,Ym}из генеральных совокупностей ξ и η соответственно.Объемы выборок могут быть различны, но, не нарушая общности,предположим, что m 6 n.Функции распределения этих генеральных совокупностей равны F (x) иG (x) соответственно. Наложим дополнительное ограничение: функциираспределения F (x) и G (x) непрерывны.
Критерий Колмогорова–Смирнова проверяет гипотезу о равенствефункций распределения двух генеральных совокупностей ξ и η, изкоторых извлечены выборки X[n] и Y[m] соответственно:H0 : F (x) = G (x) для всех x ∈ R,при альтернативной H1 : F (x) 6= G (x).
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 25 / 34
Критерии однородности: продолжение Критерий Колмогорова–Смирнова
Критерий основан на использовании эмпирических функцийраспределения F ∗n (x) и G ∗m(x).
Теорема 3
ПустьDm,n = sup
x∈R
∣∣G ∗m(x ,Y[m])− F ∗n (x ,X[n])∣∣ .
Если истинная функция распределения F0(x) = F (x) = G (x)непрерывна, тогда
P0
{√mn
m + nDm,n 6 z
}−→ K (z) =
∞∑j=−∞
(−1)je−2j2z2(2)
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 26 / 34
Критерии однородности: продолжение Критерий Колмогорова–Смирнова
Статистика Смирнова определяется следующей формулой:
Dm,n = sup|x |<∞
|G ∗m(x)− F ∗n (x)| (3)
На практике значение статистики Dm,n рекомендуется вычислять поформулам:
D+m,n = max
16r6m
[ rm− F ∗n (y(r))
]= max
16s6n
[G ∗m(x(s))− s − 1
n
], (4)
D−m,n = max16r6m
[F ∗n (y(r))− r − 1
m
]= max
16s6n
[ sn− G ∗m(x(s))
], (5)
Dm,n = max(D+m,n,D
−m,n), (6)
где X(s) и Y(r) — элементы вариацонных рядов X(1) 6 X(2) 6 . . . 6 X(n)
и Y(1) 6 Y(2) 6 . . . 6 Y(m), построенных по выборкам X1, . . . ,Xn иY1, . . . ,Ym.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 27 / 34
Критерии однородности: продолжение Критерий Колмогорова–Смирнова
При справедливости нулевой гипотезы и неограниченном увеличенииобъемов выборок исправленная статистика√
mn
m + nDm,n (7)
асимптотически подчиняется распределению Колмогорова с функциейраспределения K (z) из правой части (2).Критическая область для гипотезы H0 при использовании статистики(7) имеет вид: S = (k1−α,∞), где k1−α — квантиль уровня 1− αраспределения Колмогорова (2).
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 28 / 34
Критерии однородности: продолжение Критерий однородности хи-квадрат
Критерий однородности хи-квадрат
С помощью критерия χ2 можно анализировать однородность любогоконечного числа выборок.Пусть имеется s независимых выборок, содержащих соотвественноn1, n2, . . . , ns элементов: ξ1 : X 1
[n1], . . . , ξs : X s[ns ]. Сформулируем
гипотезы:H0 — выборки взяты из одной и той же совокупностиFξ1 = . . . = Fξs = Fξ,H1 — выборки взяты из разных генеральных совокупностей.
Каждую выборку разобьем на k групп ∆i , i = 1, . . . , k .Пусть nij — число элементов j-ой выборки, попавших в множество ∆i ,i = 1, . . . , k , j = 1, . . . , s.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 29 / 34
Критерии однородности: продолжение Критерий однородности хи-квадрат
Пусть вероятность попадания случайной величины ξ в множество ∆i
равна pi : pi = P(ξ ∈ ∆i ), i = 1, . . . , k .
Пусть nj =k∑
i=1
nij — общее число элементов j-ой выборки, j = 1, . . . , s.
Если гипотеза H0 верна, то относительная частотаnijnj
попадания
элементов j-ой выборки в множество ∆i будет близка к вероятности pi .Статистикой критерия является величина
k∑i=1
njpi
(nijnj− pi
)2
=k∑
i=1
(nij − njpi )2
njpi,
а для всех выборокs∑
j=1
k∑i=1
(nij − njpi )2
njpi. (8)
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 30 / 34
Критерии однородности: продолжение Критерий однородности хи-квадрат
Вероятности pi , i = 1, . . . , k , неизвестны. Их оценки находим методоммаксимума правдоподобия.
p̂i =νin, νi =
s∑j=1
nij , i = 1, . . . , k .
Подставляя полученные оценки в (8) вместо вероятностей pi получаем
χ2 = ns∑
j=1
k∑i=1
(nij − njνi/n)2
njνi= n
s∑j=1
k∑i=1
(n2ij)
2
njνi− 1
(9)
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 31 / 34
Критерии однородности: продолжение Критерий однородности хи-квадрат
Статистика (9) асимпотитически при n→∞ распределена по законуχ2 с числом степеней свободы r = (s − 1)(k − 1).Критическая область для гипотезы H0 при использовании статистики9 имеет вид: S = (χ2
1−α,∞), где χ21−α — квантиль уровня 1− α
распределения χ2.
В случае проверки гипотезы об однородности двух выборок (s = 2)статистика принимает вид
χ2 = n1n2
k∑i=1
1
νi
(ni1n1− ni2
n2
)2
=k∑
i=1
1
ni1 + ni2
(ni1
√n2
n1− ni2
√n1
n2
).
Число степеней свободы статистики χ2 равно r = k − 1.
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 32 / 34
Критерии однородности: продолжение Критерий однородности хи-квадрат
Большев Л. Н., Смирнов Н. В.Таблицы математической статистики. —М.: Изд. Наука, 1983.
Тюрин Ю. Н., Макаров А. А.Статистический анализ опытных данныхна компьютере. — Под ред. В.Э. Фигурнова. М.: ИНФРА-М, 1998.
Холлендер М., Вулф Д.Непраметрические методы статистики. — М.:Финансы и статистика, 1983. — 518 с.
Greenwood P. E., Nikulin M. S.A Guide to Chi-Squared Testing. New York,John Wiley & Sons, Inc., 1996.
Кобзарь А.И.Прикладная математическая статистика
Грауэр Л.В., Архипова О.А. (CSC) Критерии согласия. Санкт-Петербург, 2016 33 / 34