Статистическое моделирование экспериментального плана

Статистическое моделирование экспериментального планаЛекция №3

Вопросы для обсуждения

1. Анализ таблиц с одним входом

2. Однофакторный дисперсионный анализ для несвязных выборок

3. Оценка контрастов post hoc и планируемое сравнение групп

ВОПРОС №1Анализ таблиц с одним входом

Экспериментальный план

• Подготовка и проведение эксперимента предполагает выделение независимой переменной, описывающей характер экспериментального воздействия, и измерение зависимой переменной.

• Независимая переменная, как правило, описывается номинативной или порядковой шкалой.

• Зависимая переменная, в идеале, должна быть задана в метрической шкале.

Межгрупповой план

• С точки зрения математической статистики, простейшим экспериментальным планом является межгрупповой план.

• В межгрупповом плане уровни (значения) независимой переменной варьируются между группами испытуемых, т.е. в каждой экспериментальной группе уровень (значение) независимой переменной оказывается неизменным для всех испытуемых.

• Результаты межгруппового эксперимента могут быть представлен в виде таблицы с одним входом.

Таблица с одним входом

Уровни независимой переменной T

1 ... j ... k

x11 xj1 xk1

.

. .

.

. .

.

. .

x1n ... xjn ... xkn

Сравнение нескольких выборок (Winer, 1962)

Первая группа

Вторая группа Третья группа

3 4 65 4 72 3 84 8 68 7 74 4 93 2 109 5 94.750 4.625 7.750

Анализ дисперсии

Общая дисперсия

Внутригрупповая дисперсия

Межгрупповая дисперсия

Внутригрупповой суммарный квадрат

2

_ jijjgroupwithin TxSSSS

SS SS x Tpooled j ij j

2

Где - среднее по группе испытуемых, т.е.

Межгрупповой суммарный квадрат

2

_ GTnSS jgroupbetween

Где - среднее значение зависимой переменной по всем выборкам, т.е.

Общий суммарный квадрат

SS X Gtotal ij 2

По нашим данным…

• Суммарный разброс данных внутри экспериментальных групп оказался равным 85,875

• Разброс данных между экспериментальными группами оказался равным 50,125

• Общий разброс данных по экспериментальной выборке составил 136

• Т.е. SStotal = SSwithin_group + SSbetwееn_group

Степени свободы

• Непосредственное сравнение внутригруппового и межгруппового квадратов является некорректным, т.к. эти статистики имеют различное число степеней свободы.

• Число степеней свободы может быть оценено путем вычитания числа линейных ограничителей статистики из числа элементов, для которых оценивается дисперсия.

Подсчет степеней свободы

• Число степеней свободы для статистики SSbeetwеn_group

равно k-1

• Число степеней свободы для статистики SSwithin_group

равно k(n-1)

• Число степеней свободы для статистики SStotal будет равно kn-1

• Заметим, что dftotal = dfwithin_group + dfbeetwеn_group

df по нашим данным…

• Число степеней свободы для внутригрупповой оказалось равным 21

• Число степеней свободы для межгруппового суммарного квадрат оказалось равным 2

• Общее число степеней свободы – 23

Средний квадрат

• В дисперсионном анализе дисперсия обозначается термином средний квадрат

• Средний квадрат находится путем деления суммарного квадрата на соответствующее ему число степеней свободы:

Найдем средние квадраты

• 25,06

Сравнение дисперсий

Для сравнения внутригрупповой и межгрупповой дисперсий применим F-тест Фишера:

groupwithin

groupbetween

MS

MSnkkF

_

_)1(,1

Итоговые результаты

Источник дисперсии

SS df MS F

Между группами 50,125 2 25,06 6,13

Внутри групп 85,875 21 4,09

Общий 136,00 23 5,91

• F(2, 21) = 6,13; p<0,01• Таким образом, исходя из полученных данных мы

можем сделать вывод о статистически надежных (достоверных) различиях между группами

ВОПРОС №2Однофакторный дисперсионный анализ для несвязных выборок

Таблица с одним входом

Уровни независимой переменной T

1 ... j ... k

x11 xj1 xk1

.

. .

.

. .

.

. .

x1n ... xjn ... xkn

Р. Фишер (1890-1962)

Д и с п е р с и о н н ы й а н а л и з ( A N O VA )

Структурная модель

Фиксированная• Модель с одним

случайным признаком• Независимая переменная

является фиксированной, т.е. принимает в эксперименте все возможные значения

• Зависимая переменная случайна

Случайная• Модель с двумя

случайными признаками• Независимая переменная

является случайной, т.е. принимает в эксперименте лишь некоторые возможные значения

• Зависимая переменная случайна

Фиксированная модель

• Всякое конкретное значение зависимой переменной, полученное в эксперименте, состоит из нескольких аддитивных частей:

xij= μ+τj+ij

• Здесь xij - значение зависимой переменной для i-ого испытуемого в j-ой группе, μ – популяционная средняя (математическое ожидание зависимой переменной), τj – эффект независимой переменной на j-ом уровне, ij – случайная экспериментальная ошибка.

Уточнения

• Поскольку значение τj внутри экспериментальной группы постоянно, внутригрупповая дисперсия (σ2

j) должна быть равна дисперсии экспериментальной ошибки (σ2

εj).

• Дисперсия ошибки не зависит от эффекта независимой переменной.

• Иными словами, предполагается, что величина ε постоянна для всех экспериментальных групп, т.е. справедливо соотношение σ2

j = σ2εj

• Экспериментальная ошибка распределена по нормальному закону с математическим ожиданием 0 и дисперсией σ2

εj

Тогда…

2

22

_

_

222222

_

_2

222

11)(

)(

11

n

MS

MSE

nnnk

n

k

nMSE

MSE

kk

groupwithin

groupbetween

jjgroupbetween

groupwithin

jj

Гипотезы

Нулевая - H0

• τ1 = τ2 = … = τj = .. = τk

• E(F) = 1

Альтернативная - H0

• τ1 ≠ τ2 ≠ … ≠ τj ≠ .. ≠ τk

• E(F) > 1

2

22

_

_)(

n

MS

MSEFE

groupwithin

groupbetween

Случайная модель

• Единственное отличие модели с двумя случайными признаками состоит в том, что в ней ожидаемое значение для статистики MSbetween group равно (1-k/K)n+σ2

ε, где K - общее число уровней независимой переменной в генеральной совокупности, а k - число уровней независимой переменной, выбранных для эксперимента.

• Поскольку в реальном эксперименте k практически всегда много меньше K, дробь k/K оказывается величиной настолько незначительной, что ею можно пренебречь.

• Таким образом, модель с двумя случайными признаками может быть сведена к фиксированной модели.

ВОПРОС №3Оценка контрастов post hoc и планируемое сравнение групп

Множественное сравнение

Априорное

• Предполагает наличие математическое модели, описывающей характер связи независимой и зависимой переменных

• Обозначается как планируемое сравнение групп

Апостериорное

• Осуществляет выделение контрастных групп на основе уже полученных данных

• Обычно обозначается как анализ post hoc

Анализ Post Hoc

• Анализ post hoc является аналогом t-теста Стьюдента, т.е. осуществляет попарного сравнение групп, однако в отличие от t-теста оценивает внутригрупповую дисперсию по всем данным:

• Разработаны несколько вариантов тестов post hoc. Отличия между ними заключаются, главным образом, в способах оценки надежности (значимости) данной статистики

Тесты Post Hoc

1. Метод наименьших значимых различий (LSD)

2. Тест Шеффе (Scheffé)

3. Тест Тьюки (Tukey)

4. Тест Дункана (Duncan)

5. Тест Бонферрони (Bonferroni)

Метод наименьших значимых различий

• Метод наименьших значимых различий (LSD) был разработан Р. Фишером и является аналогом t-теста

• Оценка значимости статистики t’ осуществляется на основе двустороннего теста Стьюдента.

• Использование данного метода оценки контрастных групп связано с повышенным риском ошибки первого рода, т.е. это наиболее либеральный тест

Тест Шеффе

• Тест Шеффе (Scheffé) считается наиболее консервативным.

• Полученное значение t’ сравнивается с критическим значением, которое находится на основе критического значения F-распределения с соответствующими экспериментальной модели степенями свободы:

Тьюки, Дункан, Бонферрони…

• Тесты Тьюки (Tukey), Дункана (Duncan), Бонферрони (Bonferroni) и т.п. являются, как правило оптимальным выбором, являясь менее консервативными по сравнению с тестом Шеффе, при этом не тяготея к ошибке первого рода

Априорные контрасты

• Планируемое сравнение осуществляется на основе метода априорных контрастов.

• Контрастом называется сумма (где - коэффициенты контраста такие, что

Априорные контрасты: пример

• Предположим, что переменная Y линейно зависит от переменной X

• Если имеются данные, относящиеся к четырем группам испытуемых, то коэффициенты контраста могут быть заданы следующим образом: -1,5 -0,5 0,5 1,5

1 2 3 4

1,5

-1,5

0,5

-0,5

X

Y

www.ebbinghaus.ru

Documents

Статистическое моделирование экспериментального плана