38
Статистическое моделирование экспериментального плана Лекция №3

Статистическое моделирование экспериментального плана

  • Upload
    wirt

  • View
    60

  • Download
    0

Embed Size (px)

DESCRIPTION

Статистическое моделирование экспериментального плана. Лекция №3. Анализ таблиц с одним входом Однофакторный дисперсионный анализ для несвязных выборок Оценка контрастов post hoc и планируемое сравнение групп. Вопросы для обсуждения. Вопрос №1. Анализ таблиц с одним входом. - PowerPoint PPT Presentation

Citation preview

Page 1: Статистическое моделирование экспериментального плана

Статистическое моделирование экспериментального планаЛекция №3

Page 2: Статистическое моделирование экспериментального плана

Вопросы для обсуждения

1. Анализ таблиц с одним входом

2. Однофакторный дисперсионный анализ для несвязных выборок

3. Оценка контрастов post hoc и планируемое сравнение групп

Page 3: Статистическое моделирование экспериментального плана

ВОПРОС №1Анализ таблиц с одним входом

Page 4: Статистическое моделирование экспериментального плана

Экспериментальный план

• Подготовка и проведение эксперимента предполагает выделение независимой переменной, описывающей характер экспериментального воздействия, и измерение зависимой переменной.

• Независимая переменная, как правило, описывается номинативной или порядковой шкалой.

• Зависимая переменная, в идеале, должна быть задана в метрической шкале.

Page 5: Статистическое моделирование экспериментального плана

Межгрупповой план

• С точки зрения математической статистики, простейшим экспериментальным планом является межгрупповой план.

• В межгрупповом плане уровни (значения) независимой переменной варьируются между группами испытуемых, т.е. в каждой экспериментальной группе уровень (значение) независимой переменной оказывается неизменным для всех испытуемых.

• Результаты межгруппового эксперимента могут быть представлен в виде таблицы с одним входом.

Page 6: Статистическое моделирование экспериментального плана

Таблица с одним входом

Уровни независимой переменной T

1 ... j ... k

x11   xj1   xk1

.

. .

.

. .

.

. .

x1n ... xjn ... xkn

Page 7: Статистическое моделирование экспериментального плана

Сравнение нескольких выборок (Winer, 1962)

Первая группа

Вторая группа Третья группа

3 4 65 4 72 3 84 8 68 7 74 4 93 2 109 5 94.750 4.625 7.750

Page 8: Статистическое моделирование экспериментального плана

Анализ дисперсии

Общая дисперсия

Внутригрупповая дисперсия

Межгрупповая дисперсия

Page 9: Статистическое моделирование экспериментального плана

Внутригрупповой суммарный квадрат

2

_ jijjgroupwithin TxSSSS

SS SS x Tpooled j ij j

2

Где - среднее по группе испытуемых, т.е.

Page 10: Статистическое моделирование экспериментального плана

Межгрупповой суммарный квадрат

2

_ GTnSS jgroupbetween

Где - среднее значение зависимой переменной по всем выборкам, т.е.

Page 11: Статистическое моделирование экспериментального плана

Общий суммарный квадрат

SS X Gtotal ij 2

Page 12: Статистическое моделирование экспериментального плана

По нашим данным…

• Суммарный разброс данных внутри экспериментальных групп оказался равным 85,875

• Разброс данных между экспериментальными группами оказался равным 50,125

• Общий разброс данных по экспериментальной выборке составил 136

• Т.е. SStotal = SSwithin_group + SSbetwееn_group

Page 13: Статистическое моделирование экспериментального плана

Степени свободы

• Непосредственное сравнение внутригруппового и межгруппового квадратов является некорректным, т.к. эти статистики имеют различное число степеней свободы.

• Число степеней свободы может быть оценено путем вычитания числа линейных ограничителей статистики из числа элементов, для которых оценивается дисперсия.

Page 14: Статистическое моделирование экспериментального плана

Подсчет степеней свободы

• Число степеней свободы для статистики SSbeetwеn_group

равно k-1

• Число степеней свободы для статистики SSwithin_group

равно k(n-1)

• Число степеней свободы для статистики SStotal будет равно kn-1

• Заметим, что dftotal = dfwithin_group + dfbeetwеn_group

Page 15: Статистическое моделирование экспериментального плана

df по нашим данным…

• Число степеней свободы для внутригрупповой оказалось равным 21

• Число степеней свободы для межгруппового суммарного квадрат оказалось равным 2

• Общее число степеней свободы – 23

Page 16: Статистическое моделирование экспериментального плана

Средний квадрат

• В дисперсионном анализе дисперсия обозначается термином средний квадрат

• Средний квадрат находится путем деления суммарного квадрата на соответствующее ему число степеней свободы:

Page 17: Статистическое моделирование экспериментального плана

Найдем средние квадраты

• 25,06

Page 18: Статистическое моделирование экспериментального плана

Сравнение дисперсий

Для сравнения внутригрупповой и межгрупповой дисперсий применим F-тест Фишера:

groupwithin

groupbetween

MS

MSnkkF

_

_)1(,1

Page 19: Статистическое моделирование экспериментального плана

Итоговые результаты

Источник дисперсии

SS df MS F

Между группами 50,125 2 25,06 6,13

Внутри групп 85,875 21 4,09

Общий 136,00 23 5,91

• F(2, 21) = 6,13; p<0,01• Таким образом, исходя из полученных данных мы

можем сделать вывод о статистически надежных (достоверных) различиях между группами

Page 20: Статистическое моделирование экспериментального плана

ВОПРОС №2Однофакторный дисперсионный анализ для несвязных выборок

Page 21: Статистическое моделирование экспериментального плана

Таблица с одним входом

Уровни независимой переменной T

1 ... j ... k

x11   xj1   xk1

.

. .

.

. .

.

. .

x1n ... xjn ... xkn

Page 22: Статистическое моделирование экспериментального плана

Р. Фишер (1890-1962)

Д и с п е р с и о н н ы й а н а л и з ( A N O VA )

Page 23: Статистическое моделирование экспериментального плана

Структурная модель

Фиксированная• Модель с одним

случайным признаком• Независимая переменная

является фиксированной, т.е. принимает в эксперименте все возможные значения

• Зависимая переменная случайна

Случайная• Модель с двумя

случайными признаками• Независимая переменная

является случайной, т.е. принимает в эксперименте лишь некоторые возможные значения

• Зависимая переменная случайна

Page 24: Статистическое моделирование экспериментального плана

Фиксированная модель

• Всякое конкретное значение зависимой переменной, полученное в эксперименте, состоит из нескольких аддитивных частей:

xij= μ+τj+ij

• Здесь xij - значение зависимой переменной для i-ого испытуемого в j-ой группе, μ – популяционная средняя (математическое ожидание зависимой переменной), τj – эффект независимой переменной на j-ом уровне, ij – случайная экспериментальная ошибка.

Page 25: Статистическое моделирование экспериментального плана

Уточнения

• Поскольку значение τj внутри экспериментальной группы постоянно, внутригрупповая дисперсия (σ2

j) должна быть равна дисперсии экспериментальной ошибки (σ2

εj).

• Дисперсия ошибки не зависит от эффекта независимой переменной.

• Иными словами, предполагается, что величина ε постоянна для всех экспериментальных групп, т.е. справедливо соотношение σ2

j = σ2εj

• Экспериментальная ошибка распределена по нормальному закону с математическим ожиданием 0 и дисперсией σ2

εj

Page 26: Статистическое моделирование экспериментального плана

Тогда…

2

22

_

_

222222

_

_2

222

11)(

)(

11

n

MS

MSE

nnnk

n

k

nMSE

MSE

kk

groupwithin

groupbetween

jjgroupbetween

groupwithin

jj

Page 27: Статистическое моделирование экспериментального плана

Гипотезы

Нулевая - H0

• τ1 = τ2 = … = τj = .. = τk

• E(F) = 1

Альтернативная - H0

• τ1 ≠ τ2 ≠ … ≠ τj ≠ .. ≠ τk

• E(F) > 1

2

22

_

_)(

n

MS

MSEFE

groupwithin

groupbetween

Page 28: Статистическое моделирование экспериментального плана

Случайная модель

• Единственное отличие модели с двумя случайными признаками состоит в том, что в ней ожидаемое значение для статистики MSbetween group равно (1-k/K)n+σ2

ε, где K - общее число уровней независимой переменной в генеральной совокупности, а k - число уровней независимой переменной, выбранных для эксперимента.

• Поскольку в реальном эксперименте k практически всегда много меньше K, дробь k/K оказывается величиной настолько незначительной, что ею можно пренебречь.

• Таким образом, модель с двумя случайными признаками может быть сведена к фиксированной модели.

Page 29: Статистическое моделирование экспериментального плана

ВОПРОС №3Оценка контрастов post hoc и планируемое сравнение групп

Page 30: Статистическое моделирование экспериментального плана

Множественное сравнение

Априорное

• Предполагает наличие математическое модели, описывающей характер связи независимой и зависимой переменных

• Обозначается как планируемое сравнение групп

Апостериорное

• Осуществляет выделение контрастных групп на основе уже полученных данных

• Обычно обозначается как анализ post hoc

Page 31: Статистическое моделирование экспериментального плана

Анализ Post Hoc

• Анализ post hoc является аналогом t-теста Стьюдента, т.е. осуществляет попарного сравнение групп, однако в отличие от t-теста оценивает внутригрупповую дисперсию по всем данным:

• Разработаны несколько вариантов тестов post hoc. Отличия между ними заключаются, главным образом, в способах оценки надежности (значимости) данной статистики

Page 32: Статистическое моделирование экспериментального плана

Тесты Post Hoc

1. Метод наименьших значимых различий (LSD)

2. Тест Шеффе (Scheffé)

3. Тест Тьюки (Tukey)

4. Тест Дункана (Duncan)

5. Тест Бонферрони (Bonferroni)

Page 33: Статистическое моделирование экспериментального плана

Метод наименьших значимых различий

• Метод наименьших значимых различий (LSD) был разработан Р. Фишером и является аналогом t-теста

• Оценка значимости статистики t’ осуществляется на основе двустороннего теста Стьюдента.

• Использование данного метода оценки контрастных групп связано с повышенным риском ошибки первого рода, т.е. это наиболее либеральный тест

Page 34: Статистическое моделирование экспериментального плана

Тест Шеффе

• Тест Шеффе (Scheffé) считается наиболее консервативным.

• Полученное значение t’ сравнивается с критическим значением, которое находится на основе критического значения F-распределения с соответствующими экспериментальной модели степенями свободы:

Page 35: Статистическое моделирование экспериментального плана

Тьюки, Дункан, Бонферрони…

• Тесты Тьюки (Tukey), Дункана (Duncan), Бонферрони (Bonferroni) и т.п. являются, как правило оптимальным выбором, являясь менее консервативными по сравнению с тестом Шеффе, при этом не тяготея к ошибке первого рода

Page 36: Статистическое моделирование экспериментального плана

Априорные контрасты

• Планируемое сравнение осуществляется на основе метода априорных контрастов.

• Контрастом называется сумма (где - коэффициенты контраста такие, что

Page 37: Статистическое моделирование экспериментального плана

Априорные контрасты: пример

• Предположим, что переменная Y линейно зависит от переменной X

• Если имеются данные, относящиеся к четырем группам испытуемых, то коэффициенты контраста могут быть заданы следующим образом: -1,5 -0,5 0,5 1,5

1 2 3 4

1,5

-1,5

0,5

-0,5

X

Y

Page 38: Статистическое моделирование экспериментального плана

www.ebbinghaus.ru