20
[Введите текст] Тема 8 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Лекция 16 9.4. Критерий значимости проверки статистических гипотез при принятии решений 9.5. Сравнение средних и дисперсий нормальных генеральных совокупностей (малые независимые выборки) Лекция 17 9.6. Сравнение дисперсии по выборкам одинакового объема (критерий Кочрена) 9.7. Определение типа распределения с помощью критерия Пирсона ("хи-квадрат") 9.8. Определение типа распределения с помощью критерияКолмогорова

Проверка статистических гипотез

Embed Size (px)

Citation preview

[Введите текст]

Тема 8

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Лекция 16

9.4. Критерий значимости проверки статистических гипотез

при принятии решений

9.5. Сравнение средних и дисперсий нормальных

генеральных совокупностей (малые независимые выборки)

Лекция 17

9.6. Сравнение дисперсии по выборкам одинакового объема

(критерий Кочрена)

9.7. Определение типа распределения с помощью

критерия Пирсона ("хи-квадрат")

9.8. Определение типа распределения с помощью

критерияКолмогорова

[Введите текст]

Лекция 16

9.4. Критерий значимости проверки статистических гипотез

при принятии решений

Говоря об основных задачах математической статистики, мы уже

отмечали, что наряду со статистической оценкой параметров, задачи

проверки гипотез составляют один из важнейших разделов

математической статистики. Далее мы увидим, что оба этих раздела

математической статистики тесно взаимосвязаны.

Поскольку на практике, как следует из предыдущего раздела, мы

имеем дело с выборочными данными, характеризующими реальный

процесс или систему, то, вообще говоря, основные выборочные

характеристики будут различны. Возникает вопрос: создается ли различие

сравниваемых выборочных характеристик случайными колебаниями или

оно обусловлено действительным их различием.

Для того, чтобы ответить на этот вопрос, выдвигают гипотезу 0H

(предположение) о том, что исследуемые характеристики не отличаются.

Гипотезу 0H называют нулевой гипотезой.

Так как отклонение R одной выборочной характеристики от другой

является случайной величиной, то оно имеет вполне определенное

распределение (оно либо известно, либо им задаются). По этому

распределению определяют предельные значения отклонений R . Если

мера отклонения исследуемых характеристик, определенная по

результатам наблюдений (эксперимента), не превышает это критическое

значение, то считают, что характеристики одинаковы. Критерий проверки

обычно выбирают таким, чтобы вероятность P = ε отвергнуть гипотезу

была малой, когда гипотеза верна,т.е.

}{ RRP .

[Введите текст]

Такую вероятность ε называют уровнем значимости (или когда ее выра-

жают в процентах, – процентным уровнем значимости). Отвечающую ей

область больших отклонений называют критической областью, а само

правило проверки – критерием значимости.

Проверка гипотезы 0H осуществляется следующим образом.

1.Задаются уровнем значимости, отвечающим событиям, которые

при действии реального комплекса условий исследований считаются

(с некоторым риском) практически невозможными.

2. Определяется критическое отклонение R по соответствующему

распределению с вероятностью, равной ε.

3. Если значение меры отклонения R, вычисленное по данным

наблюдений, окажется больше критического значения R , то мы бракуем

гипотезу 0H , так как это событие практически невозможно. В том случае,

если оно меньше, то можно утверждать, что принимаемая гипотеза не

противоречит результатам наблюдений (эксперимента).

Следует отметить, что статистическая проверка гипотезы

относительно некоторой совокупности экспериментальных данных сама

по себе не дает доказательств, правильна или ложна эта гипотеза.

Подобная проверка указывает лишь на степень согласия гипотезы с

результатами эксперимента. Мы можем признавать допустимость

гипотезы по крайней мере до тех пор, пока более обстоятельные

исследования (например, по большему материалу или с помощью других

критериев) не приведут нас к противоположному заключению.

Поскольку выборка результатов наблюдений состоит из конечного,

зачастую даже из малого количества наблюдений, по которым мы судим о

процессе в целом, то существует риск допустить ошибку, т.е. риск

ложного суждения. Такой риск уменьшается с возрастанием числа

[Введите текст]

наблюдений, но существует всегда. Оценить же вероятность того, что

гипотеза будет принята, если она не верна, вообще говоря, невозможно,

так как для этого необходимо рассмотреть все прочие (альтернативные)

гипотезы, число которых может быть бесконечным. Поэтому, если ε

достаточно мало, то мы вправе на практике (на основе принципа

практической уверенности) исключить возможности редких событий.

Обычно в качестве практически невозможных событий принимают

такие события, вероятность которых не превышает ε = 0,05 – 0,01.

Дозволенная степень риска, связанная с пренебрежением событий с малой

вероятностью, обусловливается практической важностью последствий,

вытекающих из наступления таких событий, и диктуется конкретными

требованиями к задачам оценки характеристик процессов и систем. Если в

одних случаях считается возможным пренебречь событиями, имеющими

вероятность появления меньше 0,05, то в других, например, когда идет

речь об успешной посадке пассажирского самолета, нельзя пренебрегать

обстоятельствами, которые могут появиться с вероятностью равной 710 .

Следует отметить, что чем меньше выбирается уровень значимости ε, тем

меньше возможность забраковать гипотезу, когда она верна, или, как

говорят, совершить ошибку первого рода. В то же время с уменьшением

уровня значимости (с расширением области допустимых значений)

увеличивается вероятность принятия проверяемой гипотезы, когда она не

верна, т.е. увеличивается вероятность ошибки второго рода.

Отметим, что для проверки статистических гипотез используются и

другие критерии, использующие так называемые левосторонние и

двусторонние критические области, которые выходят за рамки

настоящего курса.

[Введите текст]

9.5. Сравнение средних и дисперсий нормальных

генеральных совокупностей (малые независимые выборки)

Пусть имеется две группы наблюдений, характеризующие реальный

процесс (систему) nxxx ,...,, 21 и myyy ,...,, 21 , представляющие собой

выборки соответственно объемом n и m .

Требуется установить, значимо или незначимо отличаются

выборочные средние x , y и дисперсии 22 , yx SS , найденные по

независимым малым выборкам объемов n и m .

Для установления этого предполагаем, что измеряемая величина

имеет нормальный закон распределения.

Выдвигаем гипотезы 10H и 2

0H о том, что истинные средние yx mm ,

и дисперсии22 , yx (средние и дисперсии генеральной совокупности)

одинаковы:

2220

10 :,: yxyx HmmH .

В качестве меры отклонения выборочных средних с учетом

различного объема выборок n и m , а также различной выборочной

дисперсии 22 , yx SS берется величина

mn

mnnm

mSnS

yxt

yx

)2(

22.

Величина t имеет распределение Стьюдента. Для проверки гипотезы

10H задаемся доверительным уровнем значимости ε и для числа k = n + m

степеней свободы по таблице распределения Стьюдента при ε /2 , для

односторонней критической области определяется критическое значение

2/t . Если t < 2/t , то гипотеза 10H о незначимости отличия двух

выборочных средних с вероятностью Р = 1– ε принимается. В противном

случае гипотеза10H отвергается.

[Введите текст]

Для проверки гипотезы 20H в качестве меры отклонения

выборочной дисперсии при значениях, например 22yx SS , рассматривается

величина

2

2

y

x

S

SF ,

которая распределена по закону Фишера (F-распределению). Затем для

доверительного уровня значимости ε и числа степеней свободы 11 nk ,

12 mk ( 1k соответствует объему выборки, имеющей максимальную

дисперсию) по таблице распределения Фишера для ε /2 , соответственно

для односторонней критической области, определяется критическое

значение 2/F . Если F < 2/F , то гипотеза 20H об однозначности

дисперсии с вероятностью Р = 1– ε принимается. При нарушении

неравенства можно утверждать, что дисперсии 22 , yx SS существенно

отличаются при переходе от одной совокупности измерений к другой.

Следует отметить, что с увеличением надежности (уменьшением ε)

величина t будет увеличиваться, и поэтому мы будем чаще принимать

гипотезу о том, что средние yx mm , одинаковы. При этом мы будем в

небольшом числе случаев принимать гипотезу о равенстве средних даже в

том случае, когда они в действительности различны, причем это число

будет расти с уменьшением ε.

Аналогичные рассуждения справедливы и для сравнения дисперсий.

В том случае, когда число степеней свободы k = n + m – 2 > 30, при

сравнении средних удовлетворительные результаты получаются и без

предположения о нормальном распределении измеряемых величин. При

этом величина t определяется по формуле:

mSnS

yxt

yx // 22

.

[Введите текст]

При сравнении дисперсий предположение о нормальном

распределении можно опустить, если n + m > 100.

Пример: Проверить возможность замены сотового заполнителя из

материала А1Т толщиной 0,08 мм и ячейкой 7 мм сотовым заполнителем

из материала АМТН толщиной 0,05 мм и ячейкой 5 мм по результатам

испытаний образцов на смятие.

Решение. По результатам испытаний n = 19 образцов с сотовым

заполнителем из материала А1Т и испытаний n = 18 образцов из

материала АМТН вычисляются выборочные оценки средних и дисперсии:

1x = 2,37 кг/см , 21S = 3.29, 2x = 4,77 кг/см , 2

2S = 0,57.

Сравнение сотовых заполнителей ведется на основе проверки

гипотез 10H и 2

0H по значениям выборочных средних и дисперсии. Для

этого определяем значения t и F по формулам

20,51819

)21819(1819

57,01829,319

77,1437,12

t ;

77,557,0

29,3F .

Для доверительного уровня значимости ε = 0,05 по таблице

распределения Стьюдента для односторонней критической области,

соответствующей ε /2 и числа степеней свободы k = 19 + 18 – 2 = 35

определяется критическое значение 2/t = 2,03 , а по таблице

распределения Фишера для числа степеней свободы 1k = 18 и 2k = 17 для

уровня значимости ε = 0,05 определяется критическое значение F = 2,15.

Из сравнения величин t > 2/t и F > F видно, что замену сотового

заполнителя можно провести, так как образцы из материала АМТН имеют

более высокий показатель на сжатие ( 2x = 4,77 кг/см) и более стабильные

результаты по разбросу (22S = 0,57).

[Введите текст]

Пример: По результатам 58 -ми замеров в некоторых точках

отклонений профиля крыла от его теоретического контура для двух

крыльев были определены их выборочные средние и дисперсии:

1x = 0,67 мм , 21S = 1,20, 2x = 0,45 мм , 2

2S = 1,52.

Требуется определить, одинаково в целом выполнены крылья или

неодинаково.

Решение. Сравнение крыльев ведется по средним отклонениям

профиля крыла и дисперсии отклонений. Определяем величины t и F по

формулам

02,158/52,158/20,1

45,067,0

t , 27,1

20,1

52,1F

Для доверительного уровня значимости ε = 0,05 по таблице рас-

пределения Стьюдента для числа степеней свободы k = 58 +58 – 2 = 114

определяется критическое значение 2/t = 1,98, а по таблице

распределения Фишера для числа степеней свободы 1k = 57 и 2k = 57

определяется критическое значение F = 1,56.

Сравнивая величины t < 2/t , F < F приходим к выводу, что в

среднем крылья выполнены одинаково.

[Введите текст]

Лекция 17

9.6. Сравнение дисперсии по выборкам одинакового объема

(критерий Кочрена)

Пусть имеется r независимых выборок одинакового объема n и по

ним найдены выборочные дисперсии 222

21 ,...,, rSSS с одинаковым числом

свободы 1 nk .

Требуется проверить гипотезу: значимо или незначимо отличаются

между собой дисперсии 222

21 ,...,, rSSS , т.е.

rH 210 :

В качестве проверки нулевой гипотезы применим критерий Кочрена:

r

ii

i

S

SG

1

2

2max

Величина G имеет распределение Кочрена.

Критерием проверки того, что дисперсии однородны, служит

сопоставление величины G , подсчитанной по экспериментальным

данным, с критическим значением G , которое соответствует заданному

уровню значимости ε, числу сравниваемых дисперсий r и числу степеней

свободы 1 nk .

Если G < G , то считают, что истинные дисперсии одинаковы.

В противном случае этого утверждать нельзя.

Пример: По результатам замеров отклонений профиля крыла от его

теоретического контура в n = 58 точках на 34 крыльях вычислены

выборочные дисперсии 2iS , i = 1,...,34, представленные в таблице

[Введите текст]

Выборочные дисперсии 2iS

1,23 0,66 0,90 0,95 0,90 0,68 1,01 1,52 0,98

0,44 0,82 0,41 0,83 84 1,19 1,52 0,37 0,89

1,76 0,50 0,55 1,05 0,65 0,49 1,03 0,90 1,03

0,85 0,97 0,36 0,47 0,35 0,70 0,71

51,2834

1

2 i

iS

Можно ли утверждать, что выборочные дисперсии 2iS , характеризу-

ющие разброс отклонений профиля крыла от его теоретического контура,

одинаковы?

Решение. Определяем по таблице максимальную дисперсию

2iS , = 1,76 и вычисляем величину G : 062,0

51,28

76,1max

1

2

2

r

ii

i

S

SG .

По таблице распределения Кочрена для доверительного уровня

значимости ε = 0,01, числа выборочных дисперсий r = 34 и числа степеней

свободы k = 58 – 1 = 57 определяется критическое значение G = 0,0659.

Так как G < G , то разброс отклонений профиля крыла можно

считать одинаковым.

9.7. Определение типа распределения с помощью

критерия Пирсона ("хи-квадрат")

Ранее при проверке различных статистических гипотез

неоднократно делалось предположение о типе распределения

исследуемых величин (случайной величины Х ). Поэтому возникает

задача проверки типа распределения. Задача нахождения типа

[Введите текст]

распределения имеет большое значение при решении задач теории

надежности, массового обслуживания и других, где требуется

прогнозирование появления тех или иных событий.

Проверка гипотезы о предполагаемом законе распределения

проводится так же, как и проверка гипотезы параметров распределения по

критерию согласия .

Имеется несколько критериев согласия для проверки гипотезы

закона распределения: -критерий Пирсона, Колмогорова, Смирнова и

другие. Мы ограничимся рассмотрением критерия Пирсона, который

основан на сравнении эмпирических (наблюдаемых) и теоретических

(вычисленных на основе предполагаемого распределения) частот.

Сравнение частот по критерию согласия позволяет на основе

результатов экспериментов ответить на вопрос: случайно расхождение

частот или неслучайно?

Возможно, что расхождение частот случайно (незначимо), и это

объясняется либо малым числом наблюдений, либо способом их

группировки, либо другими причинами. При этом эмпирические и

теоретические частоты соответствуют предполагаемому распределению.

Возможно, что расхождение частот неслучайно (значимо), и

объясняется тем, что эмпирические частоты не соответствуют

предполагаемому теоретическому закону распределения.

Определение типа распределения можно разбить на два этапа.

Выдвижение предположения о типе распределения.

Проверка этого предположения.

В некоторых случаях на основе предыдущих исследований уже

предполагается тип распределения, поэтому задача сводится только к его

проверке.

[Введите текст]

Рассмотрим задачу проверки статистической гипотезы о нормальном

распределении.

В общем случае исследование нормального закона распределения

начинается с построения гистограммы.

1) Весь интервал наблюдаемых значений случайной величины Х –

выборки nxxx ,...,, 21 объема n, делят на r частичных интервалов ( 1, jj xx )

одинаковой длины. Находят середины частичных интервалов

2/)( 1*

jjj xxx . В качестве частоты *jn варианты *

jx принимают число

вариант, которые попали в j-ый интервал. В итоге получают

последовательность равноотстоящих вариант **2

*1 ,...,, rxxx и соответствую-

щих им частот **2

*1 ,...,, rnnn , сумма которых равна

r

jj nn

1

* .

2) Если основные параметры распределения m и 2 неизвестны, то

вместо них используют их выборочные оценки x и 2S . Вычисляют

выборочную среднюю *x , выборочную дисперсию 2*S и нормируют

случайную величину Х. Переходят к нормированной случайной величине

** /)( SxXZ и вычисляют концы интервалов ( 1, jj zz ):

** /)( Sxxz jj , **

11 /)( Sxxz jj ,

при этом наименьшее значение случайной величины Z , т.е.. 0z , полагают

равным « »,а наибольшее, т.е. 1rz , полагают равным «+ ».

3) Используя функцию Лапласа Ф(z) вычисляют теоретические

вероятности jp попадания Х в интервалы ( 1, jj xx ) по равенству

)()( 1 jjj zФzФp

и находят теоретические частоты jj npn . При этом необходимо следить,

чтобы jnp ≥ 5. Если это условие не соблюдается, то необходимо

увеличить длину интервалов разбиения.

[Введите текст]

4) Для нахождения меры отклонения эмпирических частот от частот

предполагаемого нормального распределения используется величина

r

j j

jj

np

npn

1

2*2

)( ,

которая распределена по закону «хи-квадрат» с числом степеней свободы

srk 1 , где r – число групп (частичных интервалов), а s – число

параметров предполагаемого распределения (в частности, для

нормального распределения s = 2 (параметры m и 2 )). Если, например,

предполагают, что генеральная совокупность распределена по закону

Пуассона, то s = 1 (так как этот закон харктеризуется параметром ). Для

равномерного закона распределения s = 0.

Критерием проверки (значимости) служит сопоставление величины 2 ,

подсчитанной для значений частот *jn с табличным значением 2

,

которое соответствует заданному уровню значимости ε и числу степеней

свободы k = r – 3.

Если окажется, что 2 < 2 , то говорят, что данные не

противоречат выдвинутой гипотезе о нормальном распределении

случайной величины Х. В противном случае этого утверждать нельзя, так

как распределение существенно отличается от предполагаемого.

Необходимо отметить, что величина 2 имеет «хи-квадрат»

распределение при достаточно больших n , однако удовлетворительные

результаты при проверке гипотезы получаются уже при n > 100 .

Пример: Требуется проверить гипотезу о нормальном

распределении отклонений замеров профиля крыла от его теоретического

контура в n = 58 точках на 34 крыльях.

[Введите текст]

Решение. После выполнения пунктов 1 – 3 для подсчитанных

значений x = 0,45 мм., 2S = 1,52, S = 2S = 1,233 мм необходимые

данные с промежуточными расчетами приведены в форме таблицы.

п/п

Граница

интервала

jx

*jn S

xxz

j

j

*

Ф( jz )

jp

jnp

2

0

1 2 3 4 5 6 7

1

2

3

4

5

6

7

8

- ∞ : -2,5

-2,5 : -1,5

-1,5 : -0,8

-0,8 : 0,0

0,0 : 1,0

1,0 : 1,8

1,8 : 3,0

3,0 : ∞

0

4

7

13

15

8

11

0

- ∞ : -2,389

-2,389 : -1,579

-1,579 : -1,012

-1,012 : -0,364

-0,364 : 0,445

0,445 : 1,093

1,093 : 2,065

2,065 : ∞

0,0000

0,0082

0,0571

0,1562

0,3594

0,6700

08621

0,9803

1,0000

0,0082

0,0489

0,0991

0,2032

0.3106

0,1921

0,1182

0,0197

0,4756

2,8362

5,7478

11,786

18,014

11,142

6,8556

1,1426

0,4756

0,4776

0,2728

0,1251

0,5045

0,8859

2,5054

1,1426

Сумма 58 1,0000 58 6,3895

Для проверки гипотезы нормального распределения определяем

значение 2 по сумме 7-й колонки таблицы: 2 = 6.3895.

Задаемся доверительным уровнем значимости ε = 0,05 и по таблице

«хи-квадрат» распределения для числа степени свободы

32161 srk определяем критическое значение 2 = 7,9.

Поскольку 2 < 2 , то делаем вывод, что отклонения профиля

крыла от его теоретического контура распределены по нормальному

закону.

[Введите текст]

9.8. Определение типа распределения с помощью

критерия Колмогорова

Критерием согласия Колмогорова называют критерий проверки

гипотезы о предполагаемом законе неизвестного распределения F(x).

Критерий А. Н. Колмогорова применяется для проверки

гипотезы о непрерывной функции распределения случайной величины X.

Пусть заранее известно, что функция распределения

исследуемой случайной величины X – непрерывная. Выдвинем гипотезу

xF0 XH ,

то есть предположение, что функцией распределения случайной величины

является выбранная нами из каких-то соображений непрерывная функция

F(x).

Требуется принять или отклонить эту гипотезу по реализации

n1

n x,...,xx случайной выборки n

n ,...,1

независимых

измерений X.

Для решения этой задачи введем статистику n критерия

проверки гипотезы 0H в виде случайной величины:

xFxFΧΤ n

~sup

x

,

где xF~

– статистическая функция распределения.

Реализация t статистики nΧΤ , соответствующая выборке

n1,..., xxxn , может быть найдена по формуле

xFxF

x

t -max

,

где xF – реализация статистической функции распределения xF~

.

Доказано, что ( если H – истинна) DΤ . Здесь D – случайная

величина, распределенная по известному закону Колмогорова. Для этой

[Введите текст]

величины, используя таблицы или формулы распределения Колмогорова,

можно найти t из условия:

tD ,

где – вероятность практически невозможного события, и,

следовательно, событие tD – практически невозможное.

Из предыдущих соотношений следует: [ если 0H - истинна]

t , то есть: [если 0H - истинна] [ t - практически

невозможно].

Теперь с точностью до принципа практической уверенности можно

утверждать, что если гипотеза 0H истинна, то реализации t статистики Т

не могут превосходить границы t . Далее по закону контрапозиции

математической логики находим, что с той же точностью из неравенства

tt следует ложность гипотезы 0H . Итак, с точностью до принципа

практической уверенности имеем:

( 0H – истинна) tt ;

tt ( 0H – ложна).

Из этих соотношений следует, что неравенство tt необходимо

для принятия, а неравенство

tt достаточно для отклонения

гипотезы Н (с точностью до принципа практической уверенности).

Руководствуясь этими соображениями, принимают следующее

правило решения поставленной задачи:

tt ( 0H – принять);

tt ( 0H – отклонить),

которое называют критерием согласия Колмогорова проверки гипотезы о

непрерывной функции распределения случайной величины. Алгоритм его,

очевидно, состоит в следующем:

[Введите текст]

1. Провести независимые n-кратные измерения случайной

величины X с непрерывной функцией распределения и получить

выборку n1

n x,...,xx .

2. Исключить из выборки грубые ошибки.

3. Построить реализацию xF статистической функции

распределения.

4. Выдвинуть гипотезу F(x) о функции распределения случайной

величины X.

5. Вычислить параметр t по формуле 2.

6. Задать вероятность практически невозможного события и

из таблиц распределения Колмогорова найти параметр t .

7. Принять или отклонить гипотезу xF0 XH .

Доказано, что критерий А. Н. Колмогорова состоятельный и

в общем случае смещенный. Он более чувствителен к различию

гипотез, поэтому при прочих равных условиях может применяться

для меньших объемов выборки. Поскольку результат проверки

критерия t зависит от наибольших различий xF и F(x), то нет

необходимости построения xF и F(x) на всем диапазоне изменения

x; достаточно ограничиться областью наибольших различий xF и

F(x). Недостатком критерия является то, что точность его выводов

нарушается, если в формировании гипотезы о F(x) используются

характеристики эмпирических распределений, так как в этом случае

статистика Т зависит от F(x). Известные неудобства доставляет

также значительная трудоемкость построения статистики А. Н.

Колмогорова.

Пусть выборка xn=(x1,…,xn) измерений случайной величины Х

n c

неизвестной функцией распределения F(x), о которой выдвинута основная

гипотеза Но: F(x)= Fо(x). Предполагается, что F0(x) - непрерывная

[Введите текст]

нормально распределенная функция. Статистикой критерия является

величина

Dn = Dn (x)= )()(~

0sup xFxFõ

, которая представляет собой

наибольшее отклонение статистической функции распределения )(~

xF от

теоретической функции распределения F0(x).

Реализация t статистики Dn (x), соответствующая выборке

xn=(x1,…,xn), может быть найдена по формуле:

t = )()(*0max xFxF

õ

, где F*(x)- реализация статистической

функции распределения )(~

xF .

Для вычисления значений функции распределения F0(x) требуется

нормализовать выборку значений случайной величины Х, т.е. перейти к

случайной величине Y, которая является нормированной случайной

величиной Х: yi=(xi- x )/ S.

Далее необходимо задать вероятность а практически невозможного

события, заключающегося в том, что оценка функции распределения

отклонится от значения функции принятой в качестве гипотезы, на

величину большую, чем t.: P( atTa ) .

Затем необходимо задать Fо(x) в виде непрерывной функции,

рассчитать величину t, определить t.

Значение параметра t. Выбирается из таблицы Колмогорова, исходя

из значений вероятности а и объема выборки n.

Принять или отклонить гипотезу Н0 по решающему правилу:

Если (t< t), гипотеза Н0 принимается,

Если (t>= t), гипотеза Н0 отклоняется.

[Введите текст]

У п р а ж н е н и я

1. Случайная величина Х имеет нормальное распределение с известным

средним квадратическим отклонением 3 . Найти доверительные интервалы для

оценки неизвестного математического ожидания m по выборочным средним x , если

объем выборки 36n и задана надежность оценки 0,95. Ответ 3,12 < m <5,09.

2. Количественный признак Х генеральной совокупности распределен

нормально. По выборке объема 16n вычислены выборочные среднее 2,20x и

среднее квадратическое отклонение 8,0s . Оценить неизвестное математическое

ожидание m при помощи доверительного интервала с надежностью 0,95. Ответ

19,774 < m <20,626.

3. Количественный признак Х генеральной совокупности распределен

нормально. По выборке объема 25n найдено выборочное среднее квадратическое

отклонением 8,0s . Определить доверительный интервал покрывающий среднее

квадратическое отклонением .с надежностью 0,95. Ответ 0,544 < <1,056.

4. По двум независимым малым выборкам с объемами 51 n , 62 n найдены

выборочные средние 3,31 x , 48,22 x и дисперсии 25,021 S , 108,02

2 S . При

уровне значимости 0,05 проверить нулевую гипотезу: 210 : mmH .

5. По четырем независимым малым выборкам одинакового объема 17n из

нормальных генеральных совокупностей найдены дисперсии: 0,26; 0,36; 0,40; 0,42.

Требуется при уровне значимости 0,05 проверить нулевую гипотезу об однородности

генеральных дисперсий и оценить генеральную дисперсию.

6. Найти теоретические частоты по заданному интервальному распределению

выборки объема n = 200, предологая, что генеральная совокупность распеделена

нормально. Данные приведены в таблице

Номер

интервала

Границы

интервала

Частота Номер

интервала

Границы

интервала

Частота

I ix 1ix in i

ix 1ix in

1

2

3

4

5

4

6

8

10

12

6

8

10

12

14

15

26

25

30

26

6

7

8

9

14

16

18

20

16

18

20

22

21

24

20

13

n = 200

Контрольные вопросы

Доверительные интервалы параметров распределения

1. Что называется доверительным интервалом?

2. Что называется доверительным уровнем значимости?

3. Чем характеризуется точность оценки параметра распределения случайной

величины?

4. Чем характеризуется надежность оценки параметра распределения

случайной величины?

[Введите текст]

5. Запишите доверительный интервал для оценки математического ожидания

с известной дисперсией.

6. Поясните, почему при построении доверительного интервала оценки

математического ожидания с известной дисперсией используется функция

Лапласа.

7. Запишите доверительный интервал для оценки математического ожидания

с неизвестной дисперсией.

8. Поясните, почему при построении доверительного интервала оценки

математического ожидания с неизвестной дисперсией используется

функция распределения Стьюдента.

9. Как строится доверительный интервал для оценки дисперсии нормального

распределения при неизвестном математическом ожидании?

Проверка статистических гипотез при принятии решений

1. Как определяется нулевая гипотеза?

2. Что понимается под критерием значимости проверки статистических

гипотез?

3. Напишите формулы для сравнения средних и дисперсий двух нормальных

генеральных совокупностей соответственно по критерию Стьюдента и

Фишера.

4. Как сравниваютя дисперсии нескольких независимых выборк одинакового

объема?

5. Поясните, как определяется тип распределения по критерию Пирсона

(критерию «хи-квадрат»).