50
Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИИ, ОСНОВННЫЕ НА ОТНОШЕНИИ ПРАВДОПОДОБИЯ

Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Embed Size (px)

DESCRIPTION

Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИИ, ОСНОВННЫЕ НА ОТНОШЕНИИ ПРАВДОПОДОБИЯ. Книга Бытие, глава 8 Воды убывали; ворон; выпуск голубя (1-14) … - PowerPoint PPT Presentation

Citation preview

Page 1: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ

ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ.

КРИТЕРИИ, ОСНОВННЫЕ НА ОТНОШЕНИИ

ПРАВДОПОДОБИЯ

Page 2: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Книга Бытие, глава 8Воды убывали; ворон; выпуск голубя (1-14)

8 Потом выпустил от себя голубя, чтобы видеть, сошла ли вода с лица земли,9 но голубь не нашел места покоя для ног своих и возвратился к нему в ковчег, ибо вода была еще на поверхности всей земли; и он простер руку свою, и взял его, и принял к себе в ковчег.10 И помедлил еще семь дней других и опять выпустил голубя из ковчега.11 Голубь возвратился к нему в вечернее время, и вот, свежий масличный лист во рту у него, и Ной узнал, что вода сошла с земли.12 Он помедлил еще семь дней других и выпустил голубя; и он уже не возвратился к нему.13 Шестьсот первого года к первому дню первого месяца иссякла вода на земле; и открыл Ной кровлю ковчега и посмотрел, и вот, обсохла поверхность земли.14 И во втором месяце, к двадцать седьмому дню месяца, земля высохла.

2

Page 3: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

3

Проверка гипотезы о виде распределения

Пусть x1, x2, x3,… - последовательность независимых наблюдений

случайной величины ξ.

Гипотезы о виде распределения ξ:

0 0 0

1 1 1

: ( ) ( , )

: ( ) ( , )

H f x f x

H f x f x

• Критерий Неймана-Пирсона (1933)

• Критерий Вальда (1947)

• Проблема Кифера-Вейсса (1957)

• Критерий Айвазяна (1965)

• Критерий Лордена (1976)

Page 4: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

4

1c

n

n

1 2 3 4 5 6

0c

H1

0H

0 ( )0 0: , ln

1H nn c c

* ( )0 1: n

n c c

Области принятия проверяемых гипотез и область неопределенности:

Статистика критерия:1( )

1 0

( )ln

( )

nn

i

f xif xi

0 ( )1 1

1: , lnH n

n c c

Критерий Вальда (SPRT)

Абрахам Вальд (1902-1950)

Page 5: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Теорема 1. (А. Вальд, Дж. Вольфовиц, 1948)

Пусть T – последовательный критерий отношения вероятностей с критическими границами - < c0 < 0 < c1 < + , с вероятностями ошибок первого и второго рода и , а Т- другой критерий с вероятностями ошибок первого и второго рода и .

Если

и и (1)

E[n|H0]< и E[n|H1]< (2)

Тогда

E[n|H0] E[n|H0] и E[n|H1] E[n|H1] (3)

Г. Саймонс (1976) доказал возможность заменить условие (1) на (4)

+ + (4)

5

Оптимальность критерия Вальда

Page 6: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

1. Проверка сложной гипотезы

J. Kiefer and L. Weiss. Some properties of Generalized Sequential Probability Ratio Tests.Ann. Math. Stat., 28(1):57–75, March 1957.

2. Нарушение предположений об независимости наблюдений

Matthew Finkelman (2008): The Wald–Wolfowitz Theorem Is Violated in Sequential Mastery Testing, Sequential Analysis: Design Methods and Applications, 27:3, 293-303

6

Потеря оптимальности критерия Вальда

Page 7: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

7

Средний объем выборки в критерии Вальда

0 1

0 1 0 1

10 1 1 0 1 0

0

2 ( , ) 2 ( , )( , ) ( , )

( , ) ( , )

( , ) ( ) ln ( ) ( )

H HE n E nH H H H

fH H f f dx H H

f

Теорема 2. (Вальда, 1947)

Оценка снизу среднего числа наблюдений для любого последовательного критерия с вероятностями ошибок α и β имеет вид:

Теорема 3. (С.А. Айвазян, 1959).

Если f0(x)=f1(x) и 1 0, то при выполнении ряда условий

0 1

0 1

1

0

( , ) ( , )( , ) ( , )

( ) ( )

( )1( , ) (1 ) ln ln , ( ) ( ) ln

1 ( )

H H

i i

E n E nH H

f xx xx y x x H f x dx

y y f x

Page 8: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

8

Распределение объема выборки в критерии Вальдапри проверке гипотез «нормальное-логистическое»

0

1

0 1

( ) 0.010496503

( ) 0.01436227472

( , ) 0.0248587772

0.05

( , ) ( , ) 2,649995

H

H

H H

0

1

( , ) 252

( , ) 184

( , ) 213i

H

H

H

E n

E n

E n

Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1)

Page 9: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

9

Усечение последовательного критерия отношения правдоподобия

1. Потеря оптимальности

2. Нестатистические причины прекращения эксперимента Высокая стоимость экспериментов Этические причины в клинических испытаниях …

Page 10: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

10

Обобщенный последовательный критерий отношения правдоподобия (GSPRT)

L. Weiss. Testing one simple hypothesis against another // Ann. Math. Stat., 24(1953): pp. 273-281.

0 ( )0: ( )H n

n c n

* ( )0 1: ( ) ( )n

n c n c n

Области принятия проверяемых гипотез и область неопределенности:

0 ( )1: ( )H n

n c n

Page 11: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

11

Armitage, P. (1957). Restricted sequential procedures. Biometrika, 44, 9–56.

Page 12: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

12

Hemanta K. Baruah & G.P. Bhattacharjee (1980): A generalization ofanderson's modified sequential probability ratio test, Journal of Statistical Computation and Simulation, 11:3-4, 197-208

Page 13: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

13

Jennison C., Turnbull B.W.: Group sequential methods with applications to clinical trials. Boca Raton, Chapman & Hall, 2000.

Page 14: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

14

n

1c

1 2 3 4 5 6

0c n*

n

H1

H0

0 ( )0 0

1: 1 , 2ln

*H nn

nc c

n

Области принятия проверяемых гипотез и область неопределенности:

1 ( )1 1

1: 1 , 2ln

*H nn

nc c

n

* ( )

0 1: 1 1nn

n nc c

n n

10 1 1 0

0

( , ) ( ) lnf

H H f f dxf

- граница усечения

Критерий Айвазяна

0 1

8ln(min( , ))

( , )n

H H

Айвазян С.А.

Anderson, T.W. (1960). A modification of the sequential probability ratio test to reduce the sample size. Ann. Math. Statist., 31, 165–197.Айвазян С.А. Различение близких гипотез о виде распределения в схеме обобщенного последовательного критерия // Теория вероятностей и ее применения Том X, №4 (1965) с. 713-725

Page 15: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

15

( )0

1 1 0 0: , ln1

nHn c c

Области принятия проверяемых гипотез и область неопределенности:

2 2 0 1: (1 )H f f f

2 0 2 1: ( , ) ( , )f f f f

( )1

0 0 1 1

1: , ln

nHn c c

* ( ) ( )0 0 1 1 1 0: , :n n

n c c

Статистики критерия: 2 1( ) ( )0 1

1 10 2

( ) ( )ln , ln

( ) ( )

n nn n

i i

f x f xi if x f xi i

0 2 2 1| , |H H H H

Критерий Лордена (2-SPRT)

Гарри Лорден

Page 16: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

16

Оценивание точных критических границ методом Монте-Карло

В работе Canner, P.L. (1977). Monitoring treatment differences in long-term clinical trials. Biometrics, 33, 603–615. применялся метод Монте-Карло для нахождения точных критических границ в последовательном критерии для биномиального закона распределения.

В работах Гродзенской И.С. (2004) применялся метод Монте-Карло для сравнения критериев Вальда, Айвазяна, Лордена и Павлова.

Постовалов С. Н. Проверка простых и сложных гипотез с использованием последовательного критерия Вальда// ДОКЛАДЫ АН ВШ РФ. - 2011. - № 2(17). - С.140-150.

Постовалов С. Н. Проверка простых и сложных гипотез с использованием последовательных критериев Лордена и Айвазяна / С. Н. Постовалов, М. Р. Шахмаметова // Научный вестник НГТУ. - Новосибирск, 2011. - № 3 (44). - C. 17-28.

Page 17: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

1

0 0 0 0 1 01 1

1 | ,i

i ji j

P H H P с с с H

1

1 1 1 0 1 11 1

1 | , |i

i ji j

P H H P с с с H

Но это представляет собой сложную задачу, т.к. i j если i>j.зависит от

Если нам нужно найти точные границы, мы должны вычислить вероятности ошибок первого и второго рода:

Вычисление вероятностей ошибок первого и второго рода для критерия Вальда

17

Page 18: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

1. Выбирается область моделирования. 2. Строится сетка с маленьким шагом на выбранной области.3. Моделируется случайная величина по H0 .4. Вычисляется статистика критерия. 5. Проверяется условие выхода для каждой точки сетки (с0,с1). 6. Если для какой-то точки сетки условие выхода не выполнено, то перейти на шаг 3.7. Шаги 3-6 повторяются N раз.

8. Для каждой точки сетки вероятность ошибки вычисляется по формуле

18

0 1( , )число ошибок

c cN

Вычисление вероятностей ошибок первого и второго рода для критерия Вальда методом Монте-Карло

Page 19: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Какое число повторений надо взять, чтобы отклонение эмпирической вероятности ошибки первого рода от истинного значения не превосходило заданного уровня ?Согласно центральной предельной теореме

где m – количество ошибок первого рода в серии из N повторов.Отсюда

Например, если тогда

19

22

(1 ),N t

2 ( ) 1 ,m

P Ф NN

2

11 t

0.99, 0.01, 0.15 8 460N

Выбор числа повторений N

Page 20: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

20

2

0

1 ( ): ( ) exp , 0

22

xH f x

Нормальный закон распределения:

Логистический закон распределения:

3

1 2

3

e: ( )

31 e

x

xH f x

Проверяемые гипотезы

Page 21: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Критерий Лордена

min(α,β) 0.05 0.1 0.15

n* 964 741 610

Критерий Айвазяна

2

0

1 ( ): ( ) exp , 0

22

xH f x

3

1 2

3

e: ( )

31 e

x

xH f x

2 0 2 1 2 0 1

10 1 1 0

0

: ( , ) ( , ), (1 )

0.5526149445( , ) ( ) ln

f f f f f f f

fH H f f dx

f

21

Расчет параметров критериев Лордена и Айвазяна

0 1( , ) 0.0248587772H H

Page 22: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

(с0, с1)

0

1

: (0,1)

: 0,1

H N

H Log

22

Page 23: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

(с0, с1)

0

1

: (0,1)

: 0,1

H N

H Log

23

Page 24: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

24

Вычисление точных критических границ для критерия Вальда

Page 25: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

α β 0.15 0.10 0.05 0.010.15 -1.67, 1.42 -2.07, 1.47 -2.74, 1.52 -4.33, 1.56

0.10 -1.72, 1.81 -2.12, 1.86 -2.80, 1.91 -4.39, 1.95

0.05 -1.78, 2.48 -2.18, 2.54 -2.85, 2.59 -4.45, 2.63

0.01 -1.82, 4.11 -2.22, 4.17 -2.89, 4.23 -4.48, 4.26

25

Вычисление точных критических границ для критерия Вальда

Page 26: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

26

Вычисление точных критических границ для критерия Лордена

Page 27: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

α β 0.15 0.10 0.05 0.010.15 -1,18;0,95 -1,47; 1,02 -2,00; 1,14 -3,24; 1,29

0.10 -1,25; 1,23 -1,56; 1,31 -2,10; 1,44 -3,36; 1,62

0.05 -1,36; 1,75 -1,68; 1,86 -2,23; 1,98 -3,53; 2,21

0.01 -1,50; 2,98 -1,85; 3,11 -2,43; 3,29 -3,77; 3,55

27

Вычисление точных критических границ для критерия Лордена

Page 28: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

28

Вычисление точных критических границ для критерия Айвазяна, n*=964

Page 29: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

α β 0.15 0.10 0.05 0.010.15 -1,9; 1,59 -2,48; 1,68 -3,69; 1,81 ----

0.10 -2,02; 2,11 -2,61; 2,20 -3,89; 2,35 ----

0.05 -2,15; 3,12 -2,82; -4,14;3,48 ----

0.01 --- --- ---- ----

29

Вычисление точных критических границ для критерия Айвазяна, n*=964

Page 30: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

30

Распределение объема выборки в критерии Вальдапри использовании приближенных границ

0

1

0 1

( ) 0.010496503

( ) 0.01436227472

( , ) 0.0248587772

0.05

( , ) ( , ) 2,649995

H

H

H H

0

1

( , ) 252

( , ) 184

( , ) 213i

H

H

H

E n

E n

E n

Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1)

Page 31: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

31

Распределение объема выборки в критерии Вальдапри использовании оценок точных границ

Средний объем выборки по 100000 реализаций равен 251 (при H0) и 206 (при H1) Сокращение среднего объема выборки на 6% (при H0) и на 11% (при H1)

0,05089

0,05006

0,04712

0,03467

Page 32: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

32

Распределение объема выборки в критерии Лорденапри использовании оценок точных границ

Ср. объем выборки по 100000 реализаций равен 367 (при H0) и 318 (при H1) – приб.Ср. объем выборки по 100000 реализаций равен 268 (при H0) и 223 (при H1) –точн.Сокращение среднего объема выборки на 27% (при H0) и на 30% (при H1)

0,04986

0,05038

0,02469

0,01776

Page 33: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

33

Распределение объема выборки в критерии Айвазянапри использовании оценок точных границ (n*=964)

Ср. объем выборки по 100000 реализаций равен 355 (при H0) и 312 (при H1) – приб.Ср. объем выборки по 100000 реализаций равен 265 (при H0) и 214 (при H1) –точн.Сокращение среднего объема выборки на 25% (при H0) и на 31% (при H1)

0,04999

0,0513

0,03026

0,02044

Page 34: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

34

267

355367

251265 268

0

50

100

150

200

250

300

350

400

Критерий Вальда Критерий Айвазяна Критерий Лордена

Ср

едн

ий

об

ъем

вы

бо

рки

СОВ, приближенные границы

СОВ точные границы

Сравнение среднего объема выборки для разных критериев (при H0, вероятности ошибок первого и

второго рода равны 0.05)

Page 35: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

35

Сравнение распределений объема выборки для разных критериев (при H0, вероятности ошибок первого и

второго рода равны 0.05) – приближенные границы

Page 36: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

36

Сравнение распределений объема выборки для разных критериев (при H0, вероятности ошибок первого и

второго рода равны 0.05) – точные границы

Page 37: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

37

Сравнение среднего объема выборки для разных критериев (при H1, вероятности ошибок первого и

второго рода равны 0.05)

232

312 318

206 214223

0

50

100

150

200

250

300

350

Критерий Вальда Критерий Айвазяна Критерий Лордена

Ср

едн

ий

об

ъем

вы

бо

рки

СОВ, приближенные границы

СОВ точные границы

Page 38: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

38

Пусть x1, x2, x3,… - последовательность независимых

наблюдений случайной величины ξ, подчиненной

нормальному закону распределения N(,).

Гипотезы о параметрах распределения ξ:

0 0

1 1 0

: , 0

: , 0

H

H

Параметр - неизвестен, альтернатива не фиксирована (1-неизвестна)

01t

Sn

Статистика критерия имеет вид:

Гипотеза H0 не отвергается, если 11

1

2nt F

где Fn-1 – функция распределения Стьюдента с (n-1) степенью свободы

У. Госсет

Page 39: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

39

Гипотезы о параметрах распределения ξ:

00

01 1

: , 0

: : , 0

H

H

Параметр - неизвестен, альтернатива не фиксирована (1-неизвестна)

Статистика критерия имеет вид:

2 2

0 02 21 101

2002

10

1 1 1 1exp exp

2 2 2

1 1exp

2

n n

i ini in

nn

ini

x x dp

px d

Page 40: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

40

Гипотезы Н0 принимается, если

1

0

1n

n

pA

p

Гипотезы Н1 принимается, если

1

0 1n

n

pB

p

Производятся дополнительные наблюдения до тех пор, пока выполняются неравенства

1

0

n

n

pB A

p

;

Page 41: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

41

Вычисление оценок точных критических границ

Page 42: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

0 : 0H 1 : 1.H

Таблица 1. Приближенные критические границы (B,A)

α β 0,01 0,05 0,1 0,15

0,1 0.01, 9.9 0.06, 9.5 0.11, 9 0.17, 8.5

0,15 0.01, 6.6 0.06, 6.33 0.12, 6 0.18, 5.66

Таблица 2. Оценки точных критических границ

α β 0,01 0,05 0,1 0,15

0,1 0.15, 5.44 0.32, 4.68 0.44, 4.14 0.52, 3.72

0,15 0.15, 3.65 0.32, 3.14 0.44, 2.77 0.53, 2.50

Вычисление оценок точных критических границ при

Page 43: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Есть зависимость от расстояния между гипотезами

Есть зависимость от ,

43

Проблемы при оценивании точных границ последовательного t-критерия

1 0.7H 1 0.75H 1 1H

1 2H 1 15H

Границы [B,A]

0.02, 6.18 0.15, 5.40 0.15, 5.44 0.65, 3.01 0.78, 1.65

0.5 0.6 0.7

Границы [B,A] 0.39, 4.95 0.25, 5.34 0.15, 5.44

Page 44: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Обзор последовательных критериев проверки гипотез

Алгоритм построения оценок точных критических границ методом Монте-Карло

Сравнение среднего объема выборки

Проверка сложных гипотез. Последовательный t-критерий Стьюдента

Группированные и цензурированные наблюдения

Применение последовательных критериев

44

План выступления

Page 45: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

45

Использование последовательных критериев по случайно цензурированным наблюдениям

• Для всех наблюдений известно время начала наблюдения;Для всех наблюдений известно время начала наблюдения;• Для всех наблюдений известно время окончания наблюдения, Для всех наблюдений известно время окончания наблюдения, либо время выбытия из-под наблюдения;либо время выбытия из-под наблюдения;• Выбор выбывших наблюдений производится случайно.Выбор выбывших наблюдений производится случайно.

Page 46: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Введем обозначение:

тогда статистика критерия

или

46

1

1 0

( )

( )

ki

ki i

p x

p x

1

1 0

( )ln

( )

ki

k

i i

p x

p x

( ), x-не цензурированное наблюдение( )

{ } 1 ( ), x-цензурированное наблюдениеj

jj j

f xp x

P x F x

, j=0,1j=0,1..

Модификация критерия Вальда по случайно цензурированным наблюдениям

Page 47: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

47

• Задачи приемочного контроля качества

Вальд А. Последовательный анализ. //М.: Физматгиз, 1960. - 325 с.

Page E.S. Continuous inspection schemes // Biometrika, 1954, v. 41, p. 100-114.

Актуальные области применения процедуры последовательной проверки гипотез о виде

распределения

• Задачи статистического управления технологическими операциями

Бендерский А.М. Статистическое регулирование технологических процессов методом кумулятивных сумм. – М.: Знание, 1973 – 70 c.

Page 48: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

48

Актуальные области применения процедуры последовательной проверки гипотез о виде

распределения

• Задачи построения рациональных планов испытаний на надежность

Гродзенская И. С., Гродзенский С. Я., Томилин Н. А. Рационализация контроля надежности элементов и систем // Наукоемкие технологии, 2003, № 2, с. 85-87.

• Клинические испытания

Armitage P. Sequential medical trials. Oxford: Blackwell, 1961. 105 p.

Page 49: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

49

• Радиолокационные задачи различения сигнала при наличии помех в системах, основанных на накоплении полезного сигнала

Гродзенская И. С. Разработка и исследование методов обнаружения радиосигналов при наличии помех на основе оптимальных статистических последовательных критериев // Тезисы докладов Научно-технической конференции студентов, аспирантов и молодых специалистов МИЭМ. – М.: МИЭМ, 2006, с. 257.

Актуальные области применения процедуры последовательной проверки гипотез о виде

распределения

Page 50: Лекция  1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ  ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

1. Использование оценок точных критических границ дает ощутимый выигрыш в среднем числе наблюдений, особенно для модификаций критерия Вальда – критериев Айвазяна и Лордена.

2. В рассмотренном примере в случае использования приближенных критических границ несколько лучше работает критерий Айвазяна, однако при использовании оценок точных критических границ критерии Айвазяна и Лордена становятся практически эквивалентными.

3. Вычисление оценок точных критических границ требует определенных вычислительных затрат, а также разработки программного обеспечения, поэтому применять этот метод имеет смысл в случае проведения дорогостоящих, трудоемких и длительных экспериментов.

4. Нахождение оценок точных критических границ возможно и в более сложных случаях: при проверке сложных гипотез, при цензурировании и при группировании наблюдений.

50

Заключение