13
Современный подход в оценке групповых повторяющихся измерений по шкалам Лайкерта GE E

Оценка повторяющихся измерений методом GEE

Embed Size (px)

Citation preview

Page 1: Оценка повторяющихся измерений методом GEE

Современный подход в оценке групповых повторяющихся

измерений по шкалам Лайкерта

GEE

Page 2: Оценка повторяющихся измерений методом GEE

Типичный вопрос в анкете

2

Образец 1 Образец 2 Образец 3

Мне нравится запах

Мне нравится цвет

Мне нравится вкус

Каждый респондент оценивает набор характеристик И делает это одинаково по очереди в

отношении нескольких образцов

Если один и тот же респондент повторяет одно и тоже измерение, то такие измерения называются «Повторяющиеся измерения» (Repeated Measures). Так как каждый образец оценивается по группе характеристик, такое измерение также является групповым.

21 3

Page 3: Оценка повторяющихся измерений методом GEE

Типичный результат

Образец 1 Образец 2 Образец 3

Мне нравится запах 4,6 4,1 3,2Мне нравится цвет 3,2 4,7 4Мне нравится вкус 4 4,5 3,1…

Обычно в результате исследования по шкале Лайкерта (например, от 1 до 5) мы видим средние значения и процент положительных оценок.

или по строкам, отвечая на вопрос, «какой образец лучше для каждой характеристике»

по столбцам, отвечая на вопрос «какая характеристика для каждого образца была оценена выше»

Оценку статистической значимости различий можно провести:

Page 4: Оценка повторяющихся измерений методом GEE

Проблемы

• НЕ ПОЛУЧАЕМ ДОСТОВЕРНЫЙ ОТВЕТ НА ПРОСТОЙ ВОПРОС «КАКОЙ ОБРАЗЕЦ ЛУЧШЕ»?*

• УЧИТЫВАЕМ АБСОЛЮТНЫЕ ОЦЕНКИ, НО НЕ ОЦЕНИВАЕМ, СТАВИЛ ЛИ ОДИН И ТОТ ЖЕ РЕСПОНДЕНТ ОЦЕНКИ ВЫШЕ ИЛИ НИЖЕ В ОТНОШЕНИИ КАЖДОГО ОБРАЗЦА

*Особенно когда много образцов и много разнонаправленных отличий.

Page 5: Оценка повторяющихся измерений методом GEE

Какой образец лучше?

Образец 1 Образец 2 Образец 3

Мне нравится запах 4,5 4,4 4,4Мне нравится цвет 4,6 4,5 4,5Мне нравится вкус 4,7 4,6 4,6…

Частая ситуацияРазличия в каждой характеристике слабы, чтобы увидеть статистическую значимость. Но тренд прослеживается!

Проблема в том, что при сравнении по строкам не учитывается групповой характер тестирования.!

Page 6: Оценка повторяющихся измерений методом GEE

Пример

Один грибок на 100м2 еще не грибной лес. Вероятность случайности очень высока

Page 7: Оценка повторяющихся измерений методом GEE

Пример contd.

Но если такие полянки постоянно повторяются, то это уже точно грибной лес!

Page 8: Оценка повторяющихся измерений методом GEE

Оценки выше или ниже

23

45

23

45

Респонденты в городе А оценивали красный образец выше, чем синий на 1 балл

BA

Респонденты в городе B оценивали красный образец выше, чем синий на 1 балл

Кажется, что оценки красного образца в городе B значительно выше, чем в городе А (5>3). На самом деле, оценка красного образца относительно синего не отличается.

Δ1

Δ1

Page 9: Оценка повторяющихся измерений методом GEE

Современный способ

GEEGeneralized Estimating Equations (Обобщенные оценочные уравнения).Для учета порядковой шкалы в уравнении используется порядковая логит-связь

• Наиболее совершенный из современных способов анализа • Правильно учитывает групповое тестирование и повторяющийся

характер измерений• Учитывает вероятность более высокой или более низкой оценки

вместо абсолютных значений по каждому респонденту• Отвечает на простой вопрос «Какой образец лучше?» наиболее

точно

Page 10: Оценка повторяющихся измерений методом GEE

ReportingПолучаемый результат наглядно показывает, какой образец лучше, с учетом оценок по всем характеристикам

0.1

1

10

1.16

0.69

1.04

0.29 1

A B C D EБазовый образец. Значение всегда =1

Высота столбика показывает, НА сколько образец был оценен хуже или лучше, чем базовый. Визуально высота столбика соответствует разнице данного образца и базового уровняЦифра 0,29 показывает, ВО сколько раз у

этого образца больше шанс получить более высокую оценку. Значения меньше 1 означают оценки хуже, чем у базового в 1/n раз. В данном случае 1/0,29=3,4 раза. У этого образца шанс получить оценку хуже в 3,4 раза больше, чем у базового образца.

Так как отличия ВО сколько, а не НА сколько, шкала логарифмическая

Серый цвет столбика означает статистически незначимые различия между данным образцом и базовым

Page 11: Оценка повторяющихся измерений методом GEE

Reporting contd.

A B C D EШанс получить более высокую оценку 1,157 0,694 1,041 0,286 1

Вероятность незначимости*18,6% 0% 70,1% 0% .

Цветовое кодирование: Базовый образецЗначимо хуже базового образцаЗначимо лучше базового образца

*«Вероятность незначимости» (p-value) означает вероятность того, что найденные в процессе эксперимента незначимости произошли по случайности и не будут распространяться на всю генеральную совокупность. Вероятность незначимости напрямую связана с силой различий. Сильные различия наверняка будут значимы, а значимость слабых различий зависит от размера выборки.Традиционно, чтобы различия были значимыми, вероятность незначимости не должна превышать 5%.

Если цифра шанса меньше 1, то образец хуже базового. Чем цифра меньше, тем различия сильней. Если цифра шанса больше, 1, то образец лучше базового. Чем больше цифра, тем сильней отличия.

Page 12: Оценка повторяющихся измерений методом GEE

A B C D E0.1

1

10

ЕкатеринбургНовосибирск

Reporting contd.Также возможна сегментация по городам или любому другому признаку

A B C D E

Page 13: Оценка повторяющихся измерений методом GEE

Спасибо!