42

Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские
Page 2: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

2 © Иванов О.В., 2005

Статистическая гипотеза

Статистической гипотезой (statistical hypothesis) мы называем любое предположение о свойствах и характеристиках исследуемых генеральных совокупностей, которое может быть проверено на основе анализа выборок.

Page 3: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские
Page 4: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

4 © Иванов О.В., 2005

Как проверяют статистические гипотезы

Проверка статистических гипотез состоит из шести этапов.

Нам необходимо изучить каждый сначала теоретически, а затем применять в различных задачах.

Page 5: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

5 © Иванов О.В., 2005

1. Основная и альтернативная гипотезы

Проверяемая гипотеза в статистике называется основной (или нулевой) гипотезой. Основная гипотеза H0 подлежит проверке, по результатам которой ее можно принять либо отклонить. «Принять» означает «не получить убедительных аргументов для отклонения гипотезы».

Альтернативная гипотеза H1 принимается только тогда, когда есть убедительное статистическое доказательство для отклонения основной гипотезы.

Принять основную гипотезу

H0

Принять альтернативную гипотезу H1

Page 6: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

6 © Иванов О.В., 2005

Ситуация А. Новая методика преподавания

Исследователь хочет проверить, повлияет ли новая методика преподавания на уровень успеваемости студентов. Повысится или понизится успеваемость у студентов, прослушавших курс по новой методике?

Исследователю известно, что средняя успеваемость без нововведений составляет 4,23 балла. Гипотезы в этом случае будут сформулированы следующим образом:

Н0: µ = 4,23 Н1: µ ≠ 4,23

Page 7: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

7 © Иванов О.В., 2005

Ситуация Б. Аккумуляторы для ноутбуков

Производители аккумуляторных батарей для ноутбуков утверждают, что разработали принципиально новый тип батареи, которая существенно дольше может работать без подзарядки. Из предыдущих исследований известно, что среднее время работы существующих аккумуляторов составляет 2,5 часа, после чего их требуется заряжать.

Гипотезы будут сформулированы так:

Н0: µ ≤ 2,5 Н1: µ > 2,5

Page 8: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

8 © Иванов О.В., 2005

Ситуация В. Расходы на канцелярию

Менеджер бюро переводов хочет снизить расходы компании на канцелярские принадлежности. В среднем эти расходы составляют 5 300 рублей в неделю. После принятия определенных мер по экономии бумаги и скрепок менеджер хотел бы проверить, снизились ли расходы или остались на прежнем уровне.

Гипотезы будут записаны так:

Н0: µ ≥ 5300 Н1: µ < 5300

Page 9: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

9 © Иванов О.В., 2005

Три вида критериев

От решаемой задачи зависит, какой из критериев будет выбран:

Двусторонний Левосторонний Правосторонний Н0: = Н0: ≥ Н0: ≤ Н1: ≠ Н1: < Н1: >

Page 10: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

10 © Иванов О.В., 2005

Ошибки первого и второго рода

Ошибка первого рода (type I error) происходит, если мы отвергаем верную нулевую гипотезу.

Ошибка второго рода (type II error) происходит, если мы принимаем нулевую гипотезу, когда она неверна.

Основная гипотеза верна

Основная гипотеза неверна

Мы приняли основную гипотезу Верное решение Ошибка II рода

Мы отклонили основную гипотезу Ошибка I рода Верное решение

Page 11: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

11 © Иванов О.В., 2005

2. Уровень значимости гипотезы

Уровнем значимости (level of significance) гипотезы называют вероятность совершить ошибку первого рода, то есть отклонить верную нулевую гипотезу.

Обозначение: α.

Значение α обычно выбирается небольшим: 10%, 5% или 1%.

Page 12: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

12 © Иванов О.В., 2005

3. Статистика - критерий проверки гипотезы

Статистика (критерий, statistical test) есть специальная функция от элементов выборки, по значениям которой принимают решение о принятии или отклонении основной гипотезы.

Статистика зависит от выборки, поэтому является случайной функцией.

Page 13: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

13 © Иванов О.В., 2005

4. Критическая область

Множество значений статистики включает две области: Область принятия гипотезы, то есть множество тех значений статистики, при которых гипотеза H0 принимается, Критическую область, то есть множество тех значений статистики, при которых гипотеза H0 отклоняется и принимается альтернативная гипотеза.

Область принятия гипотезы

Критическая область

Критическая область

Возможные значения статистики

Page 14: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

14 © Иванов О.В., 2005

Критические значения

Критические значения (critical value(s)) отделяют критическую область от области принятия гипотезы.

Область принятия гипотезы

Критическая область

Критическая область

Возможные значения статистики

Критические значения

Page 15: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

15 © Иванов О.В., 2005

Вид критической области

Двусторонняя критическая область

Левосторонняя критическая

область

Правосторонняя критическая область

Критическая область строится, исходя из имеющихся знаний о законе распределения статистики, и зависит от: •  объема выборки, •  уровня значимости, задаваемого исследователем, •  вида альтернативной гипотезы.

Page 16: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

16 © Иванов О.В., 2005

5-6. Вычисление статистики и вывод

После построения критической области вычисляют значение статистики по выборке и сравнивают его с критической областью.

Если значение статистики попало в область принятия гипотезы, то гипотеза H0 принимается

Если значение статистики попало в критическую область, то гипотеза H0 отклоняется и принимается альтернативная

гипотеза H1

Page 17: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

17 © Иванов О.В., 2005

Последовательность действий

Шаг 1. Сформулировать основную и альтернативную гипотезы.

Шаг 2. Задать уровень значимости α. Шаг 3. По таблице найти критические значения и построить

критическую область. Шаг 4. По выборке сосчитать значение статистики. Шаг 5. Сравнить полученное значение с критической

областью. Если значение попало в критическую область – отклонить основную гипотезу, не попало – принять.

Шаг 6. Написать ответ.

Page 18: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские
Page 19: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

19 © Иванов О.В., 2005

Постановка задачи

Имеется генеральная совокупность с нормальным законом распределения. Параметры (µ, σ).

Требуется на основе анализа простой случайной выборки проверить гипотезу о среднем значении генеральной совокупности µ.

Page 20: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

20 © Иванов О.В., 2005

Метод

Используем общий принцип проверки статистических гипотез.

Page 21: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

21 © Иванов О.В., 2005

Гипотезы

Нулевая и альтернативная гипотезы могут быть трех разных видов:

I II III

Нулевая гипотеза: Нулевая гипотеза: Нулевая гипотеза:

Альтернативная гипотеза:

Альтернативная гипотеза:

Альтернативная гипотеза:

Page 22: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

22 © Иванов О.В., 2005

Статистика (σ известно)

В качестве статистики выбираем следующую функцию:

где - выборочное среднее - гипотетическое генеральное среднее - генеральное стандартное отклонение - объем выборки

Page 23: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

23 © Иванов О.В., 2005

Распределение статистики

Формула для статистики представляет собой выражение:

Используемая статистика имеет нормальное распределение. При проверке гипотезы пользуемся известными нам свойствами нормального закона.

Page 24: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

24 © Иванов О.В., 2005

I – Левосторонняя критическая область

Альтернативная гипотеза:

Критическое значение находим по таблице

z-значений

Уравнение критической области:

Page 25: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

25 © Иванов О.В., 2005

II – Правосторонняя критическая область

Уравнение критической области:

Альтернативная гипотеза:

Критическое значение находим по таблице

z-значений

Page 26: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

26 © Иванов О.В., 2005

III – Двусторонняя критическая область

Уравнение критической области:

Альтернативная гипотеза:

Критическое значение находим по таблице

z-значений

Page 27: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

27 © Иванов О.В., 2005

Пример. Чем занимаются старшеклассники

В одном из журналов утверждается, что старшеклассники смотрят телевизор меньше других.

Известно, что люди проводят перед телевизором в среднем 29,4 часа в неделю со стандартным отклонением 2 часа.

Случайная выборка из 25 старшеклассников имеет среднее 27 часов. Необходимо проверить утверждение на уровне значимости α = 0,01.

Page 28: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

28 © Иванов О.В., 2005

Решение

Шаг 1. Основная и альтернативная гипотезы: Н0: µ ≥ 29,4 Н1: µ < 29,4

Шаг 2. Задан уровень значимости α = 0,01. Шаг 3. По таблице находим критическое значение z = -2,33.

Критическая область левосторонняя. Шаг 4. По выборке вычисляем значение статистики:

Page 29: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

29 © Иванов О.В., 2005

Решение

Шаг 5. Сравним полученное значение с критической областью. Полученное значение статистики попало в критическую область. Отклоняем основную гипотезу.

Шаг 6. Старшеклассники значимо меньше смотрят телевизор, чем обычные жители.

Page 30: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские
Page 31: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

31 © Иванов О.В., 2005

Если σ неизвестно …

Предыдущая проверка гипотезы о среднем проводилась при условии, что нам известно стандартное отклонение генеральной совокупности σ.

Теперь рассмотрим проверку гипотезы, если стандартное отклонение неизвестно.

Page 32: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

32 © Иванов О.В., 2005

Постановка задачи…

… осталась прежней:

Page 33: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

33 © Иванов О.В., 2005

Гипотезы

… тоже прежние:

Page 34: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

34 © Иванов О.В., 2005

Метод

Используем общий принцип проверки статистических гипотез.

Page 35: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

35 © Иванов О.В., 2005

Статистика (σ неизвестно)

В качестве статистики выбираем следующую функцию:

где - выборочное среднее - гипотетическое генеральное среднее - выборочное стандартное отклонение - объем выборки

Page 36: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

36 © Иванов О.В., 2005

Распределение статистики

Используемая статистика имеет t-распределение c количеством степеней свободы df = n – 1:

Критические значения будем искать при помощи таблиц распределения Стьюдента.

Page 37: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

37 © Иванов О.В., 2005

I – Левосторонняя критическая область

Уравнение критической области:

Альтернативная гипотеза:

Критическое значение находим по таблице

t-значений.

Page 38: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

38 © Иванов О.В., 2005

II – Правосторонняя критическая область

Уравнение критической области:

Альтернативная гипотеза:

Критическое значение находим по таблице

t-значений

Page 39: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

39 © Иванов О.В., 2005

III – Двусторонняя критическая область

Уравнения критической области:

Альтернативная гипотеза:

Критическое значение находим по таблице

t-значений

Page 40: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

40 © Иванов О.В., 2005

Пример. Уровень преступности

За последние 20 лет средний уровень преступности в городе N составляет 399,40 преступлений на 100 тысяч жителей. Руководство города заявило в печати, что преступность находится на среднем региональном уровне.

Если известно, что средний уровень преступности в регионе составляет 394,82 со стандартным отклонением 8,93, требуется проверить справедливость утверждения на уровне значимости 5%.

Page 41: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

41 © Иванов О.В., 2005

Решение

Шаг 1. Основная и альтернативная гипотезы: Н0: µ ≤ 394,82 Н1: µ > 394,82

Шаг 2. Задан уровень значимости α = 0,05. Шаг 3. По таблице находим критическое значение t = 2,093.

Критическая область левосторонняя. Шаг 4. По выборке вычисляем значение статистики:

Page 42: Статистическая - WordPress.com...2012/02/07  · Менеджер бюро переводов хочет снизить расходы компании на канцелярские

42 © Иванов О.В., 2005

Решение

Шаг 5. Сравним полученное значение с критической областью. Полученное значение 2,234 статистики попало в критическую область. Отклоняем основную гипотезу.

Шаг 6. Отличие в уровне преступности от регионального является статистически значимым на уровне 5%.