44
Лекция 5. Параметрические и непараметрические критерии однородности Грауэр Л.В., Архипова О.А. CS Center Санкт-Петербург, 2015 Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 1 / 44

Математическая статистика, весна 2015: Критерии однородности

Embed Size (px)

Citation preview

Page 1: Математическая статистика, весна 2015: Критерии однородности

Лекция 5. Параметрические и непараметрическиекритерии однородности

Грауэр Л.В., Архипова О.А.

CS Center

Санкт-Петербург, 2015

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 1 / 44

Page 2: Математическая статистика, весна 2015: Критерии однородности

Cодержание

Содержание

1 Проверка гипотез о равенстве параметров двух нормально распределенныхгенеральных совокупностей

Критерий ФишераКритерий Стьюдента

2 Однофакторный дисперсионный анализ

3 Непараметрические критерии однородностиКритерий однородности ВилкоксонаКритерий Манна-Уитни

4 Непараметрические критерии анализа парных повторных наблюденийКритерий знаковКритерий знаковых ранговых сумм Вилкоксона

5 Критерий Краскела-Уоллиса

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 2 / 44

Page 3: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез...

Проверка гипотез о равенствепараметров двух нормальнораспределенных генеральных

совокупностей

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 3 / 44

Page 4: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Фишера

Критерий Фишера

Пусть имеются две независимые генеральные совокупности η свыборкой X[m] и ξ с выборкой Y[n]. Будем считать, что η подчиняетсянормальному распределению N(a1, σ

21) и ξ подчиняется нормальному

распределению N(a2, σ22), причем, математические ожидания a1, a2 и

дисперсии σ21 и σ2

2 неизвестны.Сформулируем нулевую и альтернативную гипотезы:

H0 : σ21 = σ2

2.H1 : σ2

1 6= σ22.

Альтернативная гипотеза является двусторонней.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 4 / 44

Page 5: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Фишера

Тогда(m − 1)s2

X/σ21 ∼ χ2

m−1,

(n − 1)s2Y /σ

22 ∼ χ2

n−1,

где

s2X =

1

m − 1

m∑i=1

(Xi − X )2,

s2Y =

1

n − 1

n∑i=1

(Yi − Y )2.

В соответствии с определением распределения Фишера:

Fm−1,n−1 =s2X

s2Y

σ22

σ21

∼ Fm−1,n−1.

Тогда при справедливости нулевой гипотезы:

s2X

s2Y

∼ Fm−1,n−1.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 5 / 44

Page 6: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Фишера

Пусть uα2, u1−α

2— квантили распределения Фишера Fm−1,n−1. Можно

сформулировать критерий проверки гипотезы H0 при альтернативе H1

с вероятностью ошибки первого рода α (уровнем значимостикритерия):

Если s2X

s2Y∈ [uα

2, u1−α

2], то принимается гипотеза H0.

Если s2X

s2Y/∈ [uα

2, u1−α

2], то принимается гипотеза H1.

Если альтернативная гипотеза H1 односторонняя, т. е. σ21 > σ2

2, то вкачестве критической области для нулевой гипотезы рассматриваетсяS = (u1−α,+∞), где α — вероятность ошибки первого рода. Случайσ2

2 > σ21 сводится к предыдущему переменой мест выборок.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 6 / 44

Page 7: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Критерий Стьюдента

Пусть заданы независимые случайные величины η ∼ N(a1, σ21) с

выборкой X[m] и ξ ∼ N(a2, σ22) с выборкой Y[n]. Сформулируем

нулевую и альтернативную двустороннюю гипотезы:H0 : a1 = a2.H1 : a1 6= a2.

Рассмотрим три случая:1 Дисперсии σ2

1, σ22 известны.

2 Дисперсии неизвестны, но есть основания считать, чтоσ2

1 = σ22 = σ2.

3 Дисперсии неизвестны и неравны σ21 6= σ2

2.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 7 / 44

Page 8: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Дисперсии σ21, σ

22 известны

1) Дисперсии σ21, σ

22 известны, тогда используем статистику

X − Y√σ2

1m +

σ22n

∼ N(0, 1),

при условии, что верна гипотеза H0.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 8 / 44

Page 9: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Получаем критерий с вероятностью ошибки первого рода α:Если справедливо неравенство:∣∣X − Y

∣∣√σ2

1m +

σ22n

6 u1−α2,

то принимается гипотеза H0, где u1−α2— квантиль уровня 1− α/2

стандартного нормального распределения.Если справедливо неравенство:∣∣X − Y

∣∣√σ2

1m +

σ22n

> u1−α2,

то принимается гипотеза H1.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 9 / 44

Page 10: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Для правосторонней альтернативной гипотезы H1 : a1 > a2

критическая область для H0 будет выглядеть следующим образом:

S = (u1−α,+∞).

Для левосторонней альтернативной гипотезы H1 : a1 < a2 критическаяобласть для H0 будет следующей:

S = (−∞, uα).

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 10 / 44

Page 11: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Дисперсии неизвестны, но σ21 = σ2

2 = σ2

2) Дисперсии неизвестны, но есть основания считать, чтоσ2

1 = σ22 = σ2.

Статистики(m − 1)s2

X

σ2,

(n − 1)s2Y

σ2

взаимно независимы и имеют распределения χ2m−1 и χ2

n−1

соответственно, тогда статистика

s2X (m − 1) + s2

Y (n − 1)

σ2

подчиняется распределению хи-квадрат с m + n − 2 степенямисвободы.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 11 / 44

Page 12: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Если верна гипотеза H0, то статистика

t(0)n+m−2 =

X − Y√m+nmn

√s2X (m−1)+s2

Y (n−1)m+n−2

подчиняется распределению Стьюдента Tn+m−2 с n + m − 2 степенямисвободы.

Если верна гипотеза H1, то статистика

tn+m−2 =X − Y + (a2 − a1)√m+nmn

√s2X (m−1)+s2

Y (n−1)m+n−2

подчиняется распределению Стьюдента Tn+m−2 с n + m − 2 степенямисвободы.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 12 / 44

Page 13: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Сформулируем критерий с вероятностью ошибки первого рода α:

Если |t(0)n+m−2| 6 t1−α

2, где t1−α

2— квантиль распределения

Стьюдента с n + m − 2 степенями свободы уровня 1− α/2, топринимается гипотеза H0.

Если |t(0)n+m−2| > t1−α

2, то принимается гипотеза H1.

Для правосторонней альтернативной гипотезы H1 : a1 > a2

критическая область для H0 при использовании статистики t0m+n−2

будет следующей: S = (t1−α,+∞).Для левосторонней альтернативной гипотезы H1 : a1 < a2 критическаяобласть для H0 при использовании статистики t0

n+m−2 будетследующей: S = (−∞, tα).Границы t1−α и tα — квантили распределения Стьюдента с (n + m− 2)степенями свободы уровней 1− α и α соответственно.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 13 / 44

Page 14: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Дисперсии неизвестны и неравны σ21 6= σ2

2

3) Пусть дисперсии неизвестны и неравны σ21 6= σ2

2.Если верна гипотеза H0, то статистика

tK =X − Y√s2Xm +

s2Yn

подчиняется распределению Стьюдента TK с K степенями свободы:

K =

(s2Xm +

s2Yn

)2

(s2X /m)2

m−1 +(s2

Y /n)2

n−1

(1)

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 14 / 44

Page 15: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Сформулируем критерий с вероятностью ошибки первого рода α:Если |tK | 6 t1−α

2, где t1−α

2— квантиль распределения Стьюдента

с K степенями свободы уровня 1− α/2, то принимается гипотезаH0.Если |tK | > t1−α

2, то принимается гипотеза H1.

Для правосторонней альтернативной гипотезы H1 : a1 > a2

критическая область для H0 при использовании статистики tK будетследующей: S = (t1−α,+∞).Для левосторонней альтернативной гипотезы H1 : a1 < a2 критическаяобласть для H0 при использовании статистики tK будет следующей:S = (−∞, tα).Границы t1−α и tα — квантили распределения Стьюдента с Kстепенями свободы уровней 1− α и α соответственно.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 15 / 44

Page 16: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Критерий Стьюдента для парных выборок

Пусть задана двумерная случайная величина (η, ξ) с парной выборкой(X ,Y )[n]. Сформулируем нулевую и альтернативную двустороннююгипотезы:

H0 : a1 = a2.H1 : a1 6= a2.

a1 — математическое ожидание η, a2 — математическое ожидание ξ.

Рассмотрим случайную величину ζ = η − ξ.Тогда Zi = Xi − Yi , i = 1, . . . , n, — выборка наблюдений случайнойвеличины ζ.Проверяемые гипотезы примут вид

H0 : a = 0.H1 : a 6= 0.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 16 / 44

Page 17: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Z =1

n

n∑i=1

(Xi − Yi ) = X − Y ,

S2Z =

1

n − 1

n∑i=1

((Xi − Yi )− Z )2.

Отметим, что в случае положительной корреляции между η и ξдисперсия Z меньше, чем в случае независимых случайных величин

D(Z ) = D(X ) + D(Y )− 2KX ,Y .

Пусть ζ ∼ N(a, σ).Если верна гипотеза H0, то статистика

tn−1 =Z

SZ/√n

подчиняется распределению Стьюдента Tn−1 с n − 1 степенямисвободы.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 17 / 44

Page 18: Математическая статистика, весна 2015: Критерии однородности

Проверка гипотез... Критерий Стьюдента

Сформулируем критерий с вероятностью ошибки первого рода α:Если |tn−1| 6 t1−α

2, где t1−α

2— квантиль распределения

Стьюдента с n − 1 степенями свободы уровня 1− α/2, топринимается гипотеза H0.Если |tn−1| > t1−α

2, то принимается гипотеза H1.

Для правосторонней альтернативной гипотезы H1 : a1 > a2

критическая область для H0 при использовании статистики tn−1 будетследующей: S = (t1−α,+∞).Для левосторонней альтернативной гипотезы H1 : a1 < a2 критическаяобласть для H0 при использовании статистики tn−1 будет следующей:S = (−∞, tα).Границы t1−α и tα — квантили распределения Стьюдента с n − 1степенями свободы уровней 1− α и α соответственно.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 18 / 44

Page 19: Математическая статистика, весна 2015: Критерии однородности

Однофакторный дисперсионный анализ

Однофакторный дисперсионный анализ

Однофакторный дисперсионный анализ является обобщениемT -критерия для двух выборок из генеральной совокупности.Пусть число выборок k > 2:

X11 X12 . . . X1k

X21 X22 . . . X2k...

......

Xn11 Xn22 . . . Xnkk

N(a1, σ2) N(a2, σ

2) . . . N(ak , σ2)

Пусть все выборки взаимно независимы между собой, при этомвыборка (X1i , . . . ,Xni i ) взята из генеральной совокупности сраспределением N(ai , σ

2). Элементы каждой выборки тоже, конечно,взаимно независимы.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 19 / 44

Page 20: Математическая статистика, весна 2015: Критерии однородности

Однофакторный дисперсионный анализ

Выдвигается гипотеза H0 : a1 = a2 = . . . = ak при альтернативнойгипотезе H1, которая заключается в отрицании гипотезы H0.

Рассмотрим следующие величины:

X·j =1

nj

nj∑i=1

Xij , X·· =1

N

k∑j=1

nj∑i=1

Xij , N =k∑

j=1

nj ,

где j — номер выборки.Независимо от справедливости гипотезы H0:

nj∑i=1

(Xij − X·j)

σ2∼ χ2

nj−1.

Следовательно,

S1 =k∑

j=1

nj∑i=1

(Xij − X·j)2

σ2∼ χ2

N−k .

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 20 / 44

Page 21: Математическая статистика, весна 2015: Критерии однородности

Однофакторный дисперсионный анализ

Рассмотрим величину

(X·j − aj)

σ

√nj ∼ N(0, 1).

Пусть гипотеза H0 верна. Рассмотри статистику S2 следующего вида:

S2 =1

σ2

k∑j=1

nj(X·j − X··)2.

S2 =1

σ2

k∑j=1

nj(X·j − X··)2 =

=k∑

j=1

[√nj(X·j − a)

σ

]2

k∑j=1

√njN

√nj(X·j − a)

σ

2

∼ χ2k−1

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 21 / 44

Page 22: Математическая статистика, весна 2015: Критерии однородности

Однофакторный дисперсионный анализ

Cтатистики S1 и S2 взаимно независимы.При выполнении гипотезы H0 статистика

F =S2/(k − 1)

S1/(N − k)∼ Fk−1,N−k

подчиняется распределению Фишера с k − 1 и N − k степенямисвободы числителя и знаменателя соответственно.Заметим, что статистика F не зависит от σ2.Большие значения статистики F свидетельствуют против нулевойгипотезы, поэтому критическая область S для H0 с вероятностьюошибки первого рода α имеет вид: S = (u1−α,k−1,N−k ;∞), гдеu1−α,k−1,N−k — квантиль уровня 1− α распределения ФишераFk−1,N−k .

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 22 / 44

Page 23: Математическая статистика, весна 2015: Критерии однородности

Однофакторный дисперсионный анализ

Метод линейных контрастов

Если нулевая гипотеза отклоняется, то требуется определить, какие именногруппы имеют значимое различие средних.Линейный контраст Lk определяется как линейная комбинация

Lk =k∑

j=1

cjaj ,

где cj , j = 1, . . . , k , — задаваемые константы, причем∑k

j=1 cj = 0.Оценка линейного контраста имеет следующий вид:

Lk =k∑

j=1

cj Xj .

Оценка дисперсии Lk вычисляется по формуле:

S2Lk

=k∑

j=1

c2j

njσ2 =

S1σ2

N − k

k∑j=1

c2j

nj=

k∑j=1

nj∑i=1

(Xij − X·j)2

N − k

k∑j=1

c2j

nj.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 23 / 44

Page 24: Математическая статистика, весна 2015: Критерии однородности

Однофакторный дисперсионный анализ

Доверительный интервал для Lk имеет вид(Lk − SLk

√(k − 1)u1−α,k−1,N−k ,

Lk + SLk

√(k − 1)u1−α,k−1,N−k

), (2)

где u1−α,k−1,N−k — квантиль распределния Фишера с (k − 1,N − k)степенями свободы уровня 1− α.

Лемма 1 (Метод Шеффе)

Для любой совокупности векторов (c1, . . . , ck):∑k

j=1 cj = 0,вероятность одновременного выполнения неравенств∣∣∣∣∣∣

k∑j=1

cj(aj − Xj)

∣∣∣∣∣∣ < SLk

√(k − 1)u1−α,k−1,N−k

не меньше 1− α.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 24 / 44

Page 25: Математическая статистика, весна 2015: Критерии однородности

Однофакторный дисперсионный анализ

Нулевая гипотеза для контраста H0 : Lk = 0 принимается на уровнезначимости α, если ноль содержится в доверительном интервале дляLk с доверительной вероятностью 1-α.

Рассмотрим нулевые гипотезы H rs0 : ar = as , s 6= r против

двусторонних альтернативных гипотез H rs1 : ar 6= as , s 6= r .

Гипотеза H rs0 : ar = as равносильна гипотезе H rs

0 : Lkrs = 0 с линейнымконтрастом вида

Lkrs = ar − as , cr = 1, cs = −1, cj = 0, j 6= r , j 6= s.

Гипотеза H rs0 принимается, если ноль содержится в доверительном

интервале (2) для контраста Lkrs , в противном случае H rs0 отклоняется.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 25 / 44

Page 26: Математическая статистика, весна 2015: Критерии однородности

Непараметрические критерии однородности

Непараметрические критерииоднородности

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 26 / 44

Page 27: Математическая статистика, весна 2015: Критерии однородности

Непараметрические критерии однородности

Пусть имеются две независимые выборки X[n] = (X1, . . . ,Xn) иY[m] = (Y1, . . . ,Ym) из двух генеральных совокупностей снепрерывными функциями распределения равными соответственно Fи G . Сформулируем гипотезы:

H0 : F (x) = G (x) для всех x ∈ R.H1 : F (x) > G (x) для всех x ∈ R — правосторонняяальтернативная гипотеза.H

′1 : F (x) 6 G (x) для всех x ∈ R — левосторонняя

альтернативная гипотеза.H

′′1 : F (x) 6= G (x) для всех x ∈ R — двусторонняя альтернативная

гипотеза (т.е. выполнена H1 или H′1).

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 27 / 44

Page 28: Математическая статистика, весна 2015: Критерии однородности

Непараметрические критерии однородности Критерий однородности Вилкоксона

Критерий однородности Вилкоксона

Без ограничения общности будем считать, что m 6 n. Составимобъединенную выборку Z[n+m] = (X[n],Y[m]). Построим вариационныйряд объединенной выборки:

z(1) < z(2) < . . . < z(m+n).

Если распределения генеральных совокупностей непрерывны, тосовпадения возможны только с нулевой вероятностью. В дальнейшембудем предполагать, что совпадений нет.Найдем, какие места занимают в вариационном ряду, построенном пообъединенной выборке, элементы выборки Y[m]. Назовем эти номерарангами элементов выборки Y[m] в объединенной выборке Z[n+m]:

rank(Y1) = s1, rank(Y2) = s2, . . . , rank(Ym) = sm.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 28 / 44

Page 29: Математическая статистика, весна 2015: Критерии однородности

Непараметрические критерии однородности Критерий однородности Вилкоксона

Рассмотрим статистку критерия:

W =m∑i=1

si .

Статистика W находится в промежутке

[m(m + 1)/2;mn + m(m + 1)/2].

Распределение статистики Вилкоксона W является симметричнымотносительно середины данного промежутка при условиисправедливости нулевой гипотезы H0.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 29 / 44

Page 30: Математическая статистика, весна 2015: Критерии однородности

Непараметрические критерии однородности Критерий однородности Вилкоксона

Если справедлива альтернативная гипотеза H1, то чаще будутвстречаться события xi < yj , то есть, распределение статистики Wперестанет быть симметричным относительно середины и будетсдвинуто вправо.Если справедлива альтернативная гипотеза H

′1, то распределение

статистики W будет сдвинуто влево, так как чаще будут выполнятьсясобытия xi > yj .Если выбрана альтернативой гипотеза H1, то критическая область длянулевой гипотезы H0 будет иметь вид:

S =

[c1,mn +

m(m + 1)

2

].

Если выбрана альтернативой гипотеза H′1, то критическая область для

нулевой гипотезы H0 будет иметь вид:

S =

[m(m + 1)

2, c2

].

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 30 / 44

Page 31: Математическая статистика, весна 2015: Критерии однородности

Непараметрические критерии однородности Критерий однородности Вилкоксона

Если выбрана альтернативой гипотеза H′′1 , то критическая область для

нулевой гипотезы H0 будет иметь вид:

S =

[m(m + 1)

2, c3

]∪[c4,mn +

m(m + 1)

2

].

В качестве искомых констант выбираются квантили распределения.При этом, константы c1 и c2 симметричны относительно серединыпромежутка [m(m + 1)/2,mn + m(m + 1)/2]. Также симметричноотносительно середины этого промежутка расположены константы c3 иc4.Общее требование заключается в том, что вероятность попаданиястатистики W в критическую область при условии справедливостинулевой гипотезы H0 должна быть равна заданному значению α:

P0{W ∈ S} = α.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 31 / 44

Page 32: Математическая статистика, весна 2015: Критерии однородности

Непараметрические критерии однородности Критерий однородности Вилкоксона

Для больших объемов выборок можно воспользоваться асимптотическимисвойствами статистикиW : Нормированная и центрированная статистикаВилкоксона:

W =W − m(m+n+1)

2√mn(m+n+1)

12

асимптотически имеет стандартное нормальное распределение. Нулеваягипотеза (против альтернативы H ′′1 ) отвергается, если |W | > u1−α/2 ,где uα есть α-квантиль стандартного нормального распределения.В случае совпадающих наблюдений выражение в знаменателе необходимозаменить на следующее:

mn(n + m + 1)

12

[1−

∑ki=1 ti (t

2i − 1)

(n + m)(n + m − 1)(n + m + 1)

]1/2

.

Здесь k - количество только тех связок, в которые входят ранги какодной, так и другой выборок, t1, . . . , tk - их размеры. Совпадения, целикомсостоящие из элементов одной и той же выборки, на величину W невлияют.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 32 / 44

Page 33: Математическая статистика, весна 2015: Критерии однородности

Непараметрические критерии однородности Критерий Манна-Уитни

Критерий Манна-Уитни

Будем проверять те же нулевую и альтернативные гипотезы, что и вкритерии Вилкоксона.Запишем статистику критерия Манна-Уитни:

U =n∑

i=1

m∑j=1

I{Xi < Yj},

где

I{Xi < Yj} =

{1, Xi < Yj ;0, Xi > Yj .

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 33 / 44

Page 34: Математическая статистика, весна 2015: Критерии однородности

Непараметрические критерии однородности Критерий Манна-Уитни

Находим в таблице [3] критические значения распределения уровня αстатистики Манна-Уитни U при условии справедливости гипотезыоднородности H0: Uleft = Uα,n,m, Uright = Vα,n,m и сравниваем с нимистатистику критерия.Если U > Uright , то нулевая гипотеза отвергается в пользуправосторонней альтернативной гипотезы H1.Если U 6 Uleft , то нулевая гипотеза отвергается в пользулевосторонней альтернативной гипотезы H

′1.

Для случая двусторонней альтернативы H′′1 находятся точки

Uright = Vα/2,n,m и Uleft = Uα/2,n,m, и нулевая гипотеза H0 отвергаетсяпри выполнении любого из неравенств: U > Uright , U 6 Uleft .

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 34 / 44

Page 35: Математическая статистика, весна 2015: Критерии однородности

Непараметрические критерии однородности Критерий Манна-Уитни

Взаимосвязь критериев Вилкоксона и Манна-Уитни

Статистики Вилкоксона и Манна-Уитни связаны между собойследующим соотношением:

W = U +m(m + 1)

2.

Полученная формула позволяет пересчитывать значение однойстатистики в другую и пользоваться тем распределением, котороеболее удобно для вычислений.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 35 / 44

Page 36: Математическая статистика, весна 2015: Критерии однородности

Парные повторные наблюдения

Непараметрические критерии анализа парных повторныхнаблюдений

Рассмотрим две зависимые выборки: X[n] = (X1, . . . ,Xn) иY[n] = (Y1, . . . ,Yn) из генеральных совокупностей с функциямираспределения равными соответственно F (x) и G (x), которые считаемнепрерывными.Выборки имеют одинаковый объем, и зависимость носит следующийхарактер. Внутри каждой из выборок элементы независимы, но Xi и Yi

— зависимые наблюдения. Чаще всего i означает номер объекта, а Xi

и Yi — два наблюдения над одним и тем же объектом до и посленекоторого воздействия.Сформулируем гипотезы:

H0 : F (x) = G (x) для всех x ∈ R.H1 : F (x) > G (x) для всех x ∈ R.H

′1 : F (x) 6 G (x) для всех x ∈ R.

H′′1 : F (x) 6= G (x) для всех x ∈ R.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 36 / 44

Page 37: Математическая статистика, весна 2015: Критерии однородности

Парные повторные наблюдения Критерий знаков

Критерий знаков

Составим разности zi = Xi − Yi . Случайные величины zi , i = 1, . . . , n,взаимно независимы и одинаково распределены. Переформулируемгипотезы:

H0 : P{zi < 0} = P{zi > 0} = 1/2.H1 : P{zi < 0} > P{zi > 0}.H

′1 : P{zi < 0} < P{zi > 0}.

H′′1 : P{zi < 0} 6= P{zi > 0}.

Так как в гипотезах фигурируют вероятности, то можемрассматривать схему Бернулли, где событие zi < 0 означает успех.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 37 / 44

Page 38: Математическая статистика, весна 2015: Критерии однородности

Парные повторные наблюдения Критерий знаков

Cтатистика критерия:

L =n∑

i=1

I{zi < 0}.

При выполнении гипотезы H0 статистика L подчиняетсябиномиальному распределению с вероятностью успеха p = 1/2.Критическая область для нулевой гипотезы при выборе

альтернативной гипотезы H1 имеет вид: (c1, n];альтернативной гипотезы H

′1 имеет вид: [0, c2);

альтернативной гипотезы H′′1 имеет вид: [0, c3) ∪ (c4, n].

Для нахождения констант c1, c2, c3, c4 можно использовать таблицывероятностей биномиального распределения, следуя общему правила:попадание статистики критерия L в критическую область при условиивыполнения гипотезы H0 равно α.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 38 / 44

Page 39: Математическая статистика, весна 2015: Критерии однородности

Парные повторные наблюдения Критерий знаковых ранговых сумм Вилкоксона

Критерий знаковых ранговых сумм Вилкоксона

Составим разности zi = Xi − Yi . Предполагаем, что величины zi независят друг от друга. Рассмотрим случаи, когда zi < 0 и zi > 0.Рассмотрим гипотезы:

H0 : P{zi < 0} = P{zi > 0} = 1/2.H1 : P{zi < 0} > P{zi > 0}.H

′1 : P{zi < 0} < P{zi > 0}.

H′′1 : P{zi < 0} 6= P{zi > 0}.

Построим вариационный ряд из модулей разностей:|z1|, . . ., |zn|.Сопоставим каждому элементу вариационного ряда ранг:s1 = rank(|z1|), . . ., sn = rank(|zn|).

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 39 / 44

Page 40: Математическая статистика, весна 2015: Критерии однородности

Парные повторные наблюдения Критерий знаковых ранговых сумм Вилкоксона

Составим ранговую статистику

U =n∑

i=1

Ψi si , где Ψi =

{1, zi > 0;0, zi < 0.

Используем таблицы [3] для нахождения критических значенийстатистики U и сравним их с полученным значением статистики.При выборе левосторонней альтернативы H1 критическая областьимеет вид: [0, c1].При выборе правосторонней альтернативы H

′1 критическая область

имеет вид: [c2, n(n + 1)/2].При выборе двусторонней альтернативы H

′′1 критическая область

имеет вид: [0, c3] ∪ [c4, n(n + 1)/2].Вероятность попадания статистики критерия U в критическую областьпри условии выполнения гипотезы H0 равно α.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 40 / 44

Page 41: Математическая статистика, весна 2015: Критерии однородности

Критерий Краскела-Уоллиса

Критерий Краскела-Уоллиса

Пусть имеются k независимых выборок X 1[n] = (X 1

1 , . . . ,X1n1

),X 1

[n] = (X 21 , . . . ,X

2n2

), . . . , X k[n] = (X k

1 , . . . ,Xknk

) из k > 2 генеральныхсовокупностей с непрерывными функциями распределения равнымисоответственно F1, F2, . . . , Fk .

Сформулируем гипотезы:H0 : F1(x) = F2(x) = . . . = Fk(x) для всех x ∈ R.H1 : F1(x) = F2(x − δ2) = . . . = Fk(x − δk) для всех x ∈ R

Упорядочим все N =∑k

i=1 ni элементов выборок по возрастанию иобозначим R j

i ранг j-го элемента i-й выборки в полученномвариационном ряду.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 41 / 44

Page 42: Математическая статистика, весна 2015: Критерии однородности

Критерий Краскела-Уоллиса

Статистика критерия Краскела-Уоллиса для проверки гипотезы оналичии сдвига в параметрах положения сравниваемых выборок имеетвид

H =k∑

i=1

(1− ni

N

) Ri − N+12√

(N−ni )(N+1)12ni

12

=12

N(N + 1)

k∑i=1

R2i

ni− 3(N + 1),

где

Ri =

ni∑j=1

R ji ; Ri =

Ri

ni.

При наличии одинаковых значений величин из разных выборокнеобходимо использовать модифицированную статистику

H∗ = H

1−

q∑j=1

Tj

N3 − N

−1

,

где Tj = t3j − tj , tj — размер j-й группы одинаковых элементов; q —

количество групп одинаковых элементов.Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 42 / 44

Page 43: Математическая статистика, весна 2015: Критерии однородности

Критерий Краскела-Уоллиса

Гипотеза сдвига отклоняется на уровне значимости α, если H ≥ Hα,где Hα — критическое значение, при k ≤ 5 и ni ≤ 15 вычисляемое потаблицам.При ni ≥ 15 справедлива аппроксимация распределения статистики Hχ2(k − 1) -распределением с k − 1 степенями свободы, т.е.нулевая гипотеза отклоняется, если H ≥ χ2

k−1,α.

При больших значениях n можно воспользоваться аппроксимациейИмана-Давенпорта.В соответстви с ней нулевая гипотеза сдвига отклоняется сдостоверностью α, если J ≥ Jα, где

J =H

2

(1 +

N − k

N − 1− H

)Jα =

{(k − 1)Fα(k − 1;N − k) + χ2

α(k − 1)}, χ2

α(k − 1)— критическоезначение статистики хи-квадрат, Fα(k − 1;N − k) — критическоезначение статистики Фишера с k − 1 и N − k степенями свободы.

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 43 / 44

Page 44: Математическая статистика, весна 2015: Критерии однородности

Критерий Краскела-Уоллиса

Литература

Большев Л. Н., Смирнов Н. В.Таблицы математической статистики. —М.: Изд. Наука, 1983.

Тюрин Ю. Н., Макаров А. А.Статистический анализ опытных данныхна компьютере. — Под ред. В.Э. Фигурнова. М.: ИНФРА-М, 1998.

Холлендер М., Вулф Д.Непраметрические методы статистики. — М.:Финансы и статистика, 1983. — 518 с.

Greenwood P. E., Nikulin M. S.A Guide to Chi-Squared Testing. New York,John Wiley & Sons, Inc., 1996.

Крамер Г.Математические методы статистики. М.: Мир, 1975

Грауэр Л.В., Архипова О.А. (CSC) о равенстве параметров... Санкт-Петербург, 2015 44 / 44