Download ppt - Занятие 7

Transcript
Page 1: Занятие  7

1

Занятие Занятие 77

Трансформация данных. Непараметрические Трансформация данных. Непараметрические критерии.критерии.

Page 2: Занятие  7

2

Требования к выборке для проведения

параметрических тестов

1. Случайность измерений (randomness)

2. Независимость измерений (independence)

3.3. ГомогенностьГомогенность дисперсии (homogeneity = homoscedasticity)

4. Соответствие нормальному распределениюнормальному распределению

5. Для факторной ANOVA – аддитивность (пояснить с табличкой)

Повторение из предыдущих занятийТрансформация данных

Page 3: Занятие  7

3

Параметрические тесты:

нулевая гипотеза формулируется о конкретных ПАРАМЕТРАХ РАСПРЕДЕЛЕНИЯ и/или эти параметры входят в формулу статистики критерия.Параметры: среднее значение, стандартное отклонение, дисперсия…

Почему при проведении параметрических тестов важно соблюдать условия?

Нарушим условие соответствия выборки нормальному распределению и проведём одновыборочный t-тест (односторонний)!

Трансформация данных

Page 4: Занятие  7

4

HH00: μ ≤ 90 г;

HH1 1 : μ > 90 гПусть σ известна.

Распределение статистики критерия не будет нормальным, если в выборке не нормальное распределение.

Пусть наше распределение скошено. Z-распределение тоже будет скошено!

z

р=0.05

0 1 2-1-2

р>0.05

критическое значение

Вероятность, что среднее в выборке попадёт в критическую область (рассчитанную для нормального распределения), будет выше, чем 0.05 – увеличится ошибка 1-го рода

Трансформация данных

Page 5: Занятие  7

5

Основной вывод:пренебрежения условиями использования параметрических тестов может увеличивать ошибку 1-го рода.

(Неизвестно, насколько)

Примечание: слабые отклонения от нормального распределения не очень страшны (в силу Центральной предельной теоремы), а для больших выборок ими можно пренебречь (кроме регрессионного анализа).

ANOVA устойчива к отклонениям от нормального распределения, особенно если выборки одинаковы по размеру.

Трансформация данных

Page 6: Занятие  7

6

Какие бывают распределения:

Равномерное (uniform)

Может быть и дискретным, и непрерывным

Трансформация данных

Page 7: Занятие  7

7

Пример: рассмотрим выводки из 6 детёнышей каждый.Возможное соотношение самцов и самок в выводке:

6:0; 5:1; 4:2; 3:3; 2:4; 1:5; 0:6

Биномиальное распределение

Трансформация данных

Page 8: Занятие  7

8

Биномиальное распределение

Количество самцов в выводке из 6 зверьков

Ве

роят

ност

ь та

кого

вы

вод

ка

распределение количества самцов в N выводков (независимых случайных экспериментов) из n = 6 зверьков, таких что вероятность рождения самца постоянна и равна p, а вер-ть рождения самки q = 1 - p.

Трансформация данных

Биномиальному распределению обычно соответствуют доли, частоты, пропорции

Если р мало, ситуация лучше описывается распределением Пуассона

Isaac Newton

Page 9: Занятие  7

9

Распределение Пуассона

2

Показывает вероятность того или иного количества независимых друг от друга редких и случайных событий (особей, контактов, мутаций и пр.) на заданном интервале времени (участке пространства, объёме...).

λ = μ

Siméon Denis Poisson

Распределению Пуассона соответствуют частоты, количества случайно распределённых объектов

Трансформация данных

Page 10: Занятие  7

10

Распределение ПуассонаСравнение распределения объектов во времени и пространстве со случайным распределением (testing for randomness)

2 2 2

Важно: следует задавать размер элементарной единицы пространства (времени и пр.), напр., квадрата, так, чтобы μ ≈ 1

Трансформация данных

Page 11: Занятие  7

11

Экспоненциальное распределениеХорошо описывает распределение промежутков времени (расстояний) между случайными событиями с заданной средней частотой событий.

Трансформация данных

Page 12: Занятие  7

12

Другие распределения

Логнормальное, Гамма, геометрическое, отрицательное биномиальное, гипергеометрическое и др.

Page 13: Занятие  7

13

Если распределение отлично от нормального, выборки не гомогенны, факторы мультипликативны, можно

ТРАНСФОРМИРОВАТЬ данные

значение признака

част

от

а

част

от

а

значение признака

Трансформация данных

Прекрасное свойство: часто трансформация данных приводит одновременно к нормальному распределению, гомогенности и аддитивности

Page 14: Занятие  7

14

1. Логарифмическая трансформация (logarithmic transformation):

•Делает симметричным скошенное вправо (positively skewed) распределение.•Используется в случае, когда среднее значение в группе прямо пропорционально стандартному отклонению.

ii XX lg 1lg ii XX

Если в результате логарифмирования получилось нормальное распределение, исходное распределение было логнормальным.

Трансформация данных

Page 15: Занятие  7

15

2. Извлечение квадратного корня (square root transformation)

• Используется, когда среднее значение в группе прямо пропорционально дисперсии.

• обычно такое явление свойственно выборкам из распределения Пуассона (т.е., данные представляют собой количества случайных событий, объектов…)

ii XX

5,0 ii XX

Например, количество социальных контактов в час.

Трансформация данных

Page 16: Занятие  7

16

3. Арксинусная трансформация (arcsine transformation)• применяется для процентов и долей (Xi ≤ 1),

которые обычно формируют биномиальное распределение.

ii XX arcsin

Например, мы исследуем долю самцов или долю переживших зиму детёнышей в выводках сурков.

Прочие трансформации см. Zar, 2010 (1999)

Трансформация данных

Page 17: Занятие  7

17

Трансформация данных

4. Box-Cox transformation

Универсальная трансформация данных, в которой программа методом проб подбирает наилучшие параметры и способ трансформации для конкретных данных (ищется особый параметр λ)

Page 18: Занятие  7

18

Box-Cox transformation

Page 19: Занятие  7

19

Обычно параметрические методы не годятся, если данные РАНГОВЫЕ: неизвестно, насколько одно значение отличается от другого.НО:

Непараметрические методы

Zar, 2010

Page 20: Занятие  7

20

Если наше распределение не удовлетворяет условиям параметрических тестов и трансформация не помогает или невозможна, наш выбор -

Непараметрические методы (Непараметрические методы (nonparametric methodsnonparametric methods))

Свойства распределения неизвестны, и параметры распределения (среднее, дисперсию и т. п.) мы использовать не использовать не можемможем

Основной подход – ранжированиеранжирование (ranking) наблюдений (выстраиваем их по порядку от самого маленького значения к наибольшему).

подразумевается, что сравниваемые распределения имеют одинаковую форму и дисперсию.

= “distribution-free” tests

Page 21: Занятие  7

21

Мы исследуем два редких вида сумчатых. Хотим сравнить размеры выводков у этих зверей.

Фактор – вид. Группы: 1. длинноухие; 2. пятнистыеЗависимая переменная – размер выводка

длинноухий пятнистый

Непараметрические методыСравнение 2-х независимых групп

Page 22: Занятие  7

22

Сравнение 2-х независимых групп:Манн-Уитни тест (Mann-Whitney U-test)

Н0: размер выводка у длинноухих сумчатых такой же, как и у пятнистых.Н1: размер выводка не одинаков у этих видов.

Мы ничего не говорим про параметры распределений!

Непараметрические методы

Тест Манна-Уитни можно использовать и для ранговых, и для непрерывных переменных.

Page 23: Занятие  7

23

Непараметрические критерии

длинноухие пятнистыеразмер ранг размер ранг

8 15.5 4 5

7 13 7 13

4 5 5 8.5

7 13 8 15.5

9 17.5 3 2

3 2 3 2

5 8.5 5 8.5

6 11 4 5

9 17.5

5 8.5

111.5 59.5

Это непараметрический аналог двухвыборочного t-теста. РанжируемРанжируем данные от меньшего к большему (игнорируя деление на группы).Число 3 встретилось трижды (это называется связанные ранги, tied ranks):ранги у них будут одинаковы = (1+2+3)/3=2

Page 24: Занятие  7

24

111

211 2

)1(R

nnnnU

222

212 2

)1(R

nnnnU

Статистика критерия:

n1 и n2 – размер выборок,R1 и R2 – суммы рангов в выборках.

Статистикой критерия Uobs будет меньшее из этих двух значений. Причём Н0 мы отвергнем в случае, если оно будет МЕНЬШЕ критического значения Ucv. (т.е., это исключение среди прочих критериев).

Непараметрические методы

Page 25: Занятие  7

25

Непараметрические критерии

Если выборки удовлетворяют требованиям для параметрических тестов, мощность теста Манна-Уитни = 95% от мощности t-теста.М-У тест один из самых мощных среди непараметрических тестов!

Альтернативная процедура – применить ранговую трансформацию к исходным данным (т.е., проранжировать измерения как для М-У теста) и провести двухвыборочный t-тест уже над рангами (Zar, 2010).

Только М-У тест (но не t-тест) пригоден для проверки необычной гипотезы о том, что значения в одной группе отличаются от значений в другой группе в a раз (достаточно умножить значения в соответствующей группе на a и дальше провести стандартный М-У тест).

Page 26: Занятие  7

26

Непараметрические критерии

Если размеры выборок больше 20, распределение статистики U приближается к нормальному со средним

221nn

U

U

Uobsobs

Uz

Поэтому считается значение

И сравнивается с критическим значением для нормального распределения Z (наблюдаемое z должно быть по модулю больше критического).

Поэтому для маленьких выборок в статье можно приводить только U, а для больших выборок нужно приводить и U, и z.

Тест может быть односторонним и двусторонним

Page 27: Занятие  7

27

Сравнение 2-х независимых групп:

Тест Колмогорова-Смирнова (Kolmogorov-Smirnov two-sample test): отличается от М-У теста тем, что М-У более чувствителен к различиям средних значений, медианы и т.п., а К-С тест более чувствителен к различиямразличиям распределений по форме.по форме.

Тест Вальда-Вольфовица (Wald-Wolfowitz Runs Test) – данные сортируются по зависимой переменной и оцениваются последовательности элементов из разных групп. Как и К-С тест, чувствителен к различиямразличиям распределений по форме.по форме.

Непараметрические критерии

Манн-Уитни тест более мощный, чем эти тесты.

Page 28: Занятие  7

28

Mann-Whitney U-testKolmogorov-Smirnov two-sample testWald-Wolfowitz Runs Test

Page 29: Занятие  7

29

Отвергаем Н0: М-У тест показал, что размеры выводков у разных видов неодинаковые

Просто результаты М-У теста

Результаты М-У теста с поправкой на наличие tied ranks

Точное значение р для небольших выборок без tied ranks

В отличие от К-С и В-В тестов.

Page 30: Занятие  7

30

Сравнение 2-х связанных группКритерий Вилкоксона (Wilcoxon matched pair test)

Изучаем утконосов, и хотим знать – различается ли отношение самки к самцу и самца к самке в парах

Мы считаем частоту дружелюбных контактов со стороны самки к самцу и наоборот. У каждого самца есть по жене, а у каждой самки – по мужу.

Непараметрические методы

Page 31: Занятие  7

31

Фактор – пол. (1. самцы; 2. самки)Зависимая переменная – частота инициирования дружелюбных контактов.

Непараметрические методы

Н0: количество контактов в популяции, из которой мы получили выборку самцов, такое же, как и в популяции, из которой выборка самок.Н1: количество контактов не одинаково.

Page 32: Занятие  7

32

1.Считают разностиразности между значениями в парах;

2. исключают нулевые разностиразности;

3.присуждают абсолютным значениям (по модулюпо модулю) разностей рангиранги;

4. суммируютсуммируют отдельно ранги положительных и отрицательных разностей;

5.Наименьшая из этих сумм - статистика Т.

6. Отвергаем Н0, если Т меньше Tcv.

21 iii XXD

Непараметрические методы

Аналог t-теста для двух связанных выборок, мощность – около 95% мощности t-теста . При числе пар >100 Т

апроксимируется нормальным распределением.

самец самка

1 пара 356 3632 пара 351 3613 пара 353 3584 пара 355 3565 пара 354 3596 пара 355 355

Page 33: Занятие  7

33

Wilcoxon matched pair test

Число дружелюбных контактов у самцов и самок в парах было неодинаковым

Page 34: Занятие  7

34

Непараметрические критерии

Сравнение 2-х связанных групп: Знаковый тест (Sign test)

Считают разности в парах, но не ранжируют их, а просто определяют число положительных и отрицательных разностей (нули исключают). Сравнивают их соотношение с 1:1. (биномиальным тестом)

Подходит для случаев, когда точные значения переменной не известны.

Имеет низкую мощность, поэтому применяется только в больших выборках (больше 20 пар).

Page 35: Занятие  7

35

Непараметрические критерии

Сравнение ≥3-х независимых группТест Крускала-Уоллиса (Kruskal-Wallis test)

Мы получили возможность включить в работу третий, особенно редкий вид сумчатого. Теперь нас интересует, различается ли количество пищи, которую съедают за день особи этих видов.

Фактор – вид. Группы: 1. длинноухие; 2. пятнистые; 3. хвостатые

Page 36: Занятие  7

36

Непараметрические критерии

Критерий Крускал-Уоллиса (Kruskal-Wallis test)

Непараметрический аналог One-way ANOVA на 95% настолько же мощный, как и ANOVA; для 2-х групп идентичен Манн-Уитни тесту; подразумевает сходство форм распределений и равенство дисперсий в группах (хотя бы на глаз)

Page 37: Занятие  7

37

1. все значения ранжируются от меньшего к большему (игнорируя деление на группы);

2. Считается сумма рангов в каждой группе;3. считается статистика H(df, N).

)1(3)1(

122

Nn

R

NNH

j

j

сумма рангов в каждой группе

размер группыобщий размер выборки

Н0: распределение в популяциях, из которых мы получили выборки, одинаковое.Н1: распределения не одинаковые.

Непараметрические критерии

Page 38: Занятие  7

38

Непараметрические критерии

При маленьких выборок и 3-5-и групп считается Н-статистика.

Для больших выборок (или >5-и групп) Н апроксимируется распределением χ2.

Критерий Крускал-Уоллиса (Kruskal-Wallis test)

Page 39: Занятие  7

39

Непараметрические критерии

Сравнение ≥2-х независимых групп Медианный тест (Median test)

Считается общая медиана для всех групп (получается, что это не непараметрический тест, а distribution-free).

Затем критерием χ2 (см. Частотные критерии) сравнивают числа значений, которые большебольше и которые меньшеменьше общей медианы в каждой из групп (табличка 2 х k).

Подходит для выборок, в которых часть наблюдений часть наблюдений выходит за пределы шкалы выходит за пределы шкалы (или их точные значения неизвестны).

Но имеет очень низкую мощность – лишь 67% мощности Манн-Уитни теста или теста Крускалла-Уоллеса. Рекомендуется для групп с n ≥ 20.

Page 40: Занятие  7

40

Kruskal-Wallis testMedian test

Page 41: Занятие  7

41

Доля растительной пищи отличалась между разными видами

Page 42: Занятие  7

42

Непараметрические критерии

Критерий Крускал-Уоллиса (Kruskal-Wallis test)

Как и в ANOVA, после сравнения нескольких групп имеет смысл провести пост-хок тест (апостериорное сравнение), по аналогии с тестом Тьюки, чтобы выяснить какие же группы различаются.

Такие тесты существуют – Nemenyi test, Dunn’s test (Zar, 1999 или 2010).

И они есть в Statistica начиная с 8-й версии!

Page 43: Занятие  7

43

Пост-хок тест для непараметрической ANOVA

Page 44: Занятие  7

44

Непараметрические критерииСравнение ≥3 связанных групп

Критерий Фридмана (Friedman ANOVA)

У утконосов родились детёныши, и мы хотим знать, изменилась ли упитанность самокупитанность самок после беременностибеременности и после выкармливания потомства (мы оценивали её в баллах).

1. состояние до беременности;2. после рождения детей;3. после выкармливания детёнышей

мамамама

мама

детёныш

детёныш

папа

Page 45: Занятие  7

45

Непараметрические критерии

Критерий Фридмана (Friedman ANOVA) для двух групп эквивалентен Знаковому тесту (sign test); по сравнению с аналогичными параметрическими тестами, для 2-х групп имеет всего 64% мощности, для 3-х – 72%, для 100 стремится к 95%.

Основан на том, что значения ранжируются меньшего к большему внутри каждой строки. Потом суммируют ранги для каждого столбца и считают статистику χ2

r, которая имеет распределение χ2.

Нулевая и альтернативная гипотезы - по аналогии с предыдущими тестами, о сходстве выборок.

Page 46: Занятие  7

46

Friedman ANOVA

мама

папа

Page 47: Занятие  7

47

Отвергаем Н0 – состояние самок изменялось

Page 48: Занятие  7

48

Требование к выборке для тестирования гипотезы о коэффициенте корреляции Пирсона:

Для каждого X значения Y должны быть распределены нормально, и для каждого Y все X должны иметь нормальное распределение -

част

от

а

значение признака

Непараметрические критерии

двумерное нормальное распределение (bivariate normal distribution)

Ранговые корреляции

Page 49: Занятие  7

49

Непараметрические критерии

Трансформация данных в регрессионном анализе и корреляциях

Применяется таким же образом, как и для других критериев, НО основанием для применения должны служить несоответствие нормальному распределению и гетерогенность дисперсий, а не нелинейность связи!

Если распределения нормальны и дисперсии гомогенны, нельзя использовать трансформацию данных для получения линейной регрессии из нелинейной.

Page 50: Занятие  7

50

Коэффициент корреляции Спирмана (Spearman rank order correlation)

Связана ли дистанция расселения с индексом упитанности у мышей?

Переменные – 1. дистанция расселения; 2. индекс упитанности

Непараметрические критерии

Page 51: Занятие  7

51

Коэффициент корреляции Спирмана:

1. Ранжируем данные для каждой переменной от меньшего к большему;

2. Если встретились одинаковые значения (tied ranks), присваиваем им средние ранги;

3. Считаем разности рангов в каждой паре данных;4. Считаем коэффициент rs

)1(

61

2

2

nn

Dr i

s

разности рангов

число строк (размер выборки)

Непараметрические критерии

Page 52: Занятие  7

52

Лучший для дробных количественных признаков. Размер выборки ≥ 10.

H0 : ρs=0H1: ρs≠0

Статистика критерия – сам коэффициент корреляции Спирмана (имеет t-распределение)

Коэффициент Спирмана – аналог коэффициента корреляции Пирсона, стремится к нему в больших выборках. Мощность – около 91% коэффициента Пирсона.

Непараметрические критерии

Page 53: Занятие  7

53

Spearman Rank Order Correlations

Page 54: Занятие  7

54

Отвергаем Н0:Оказалось, что дистанция расселения положительно связана с упитанностью у мыши.

Spearman Rank Order Correlations

Page 55: Занятие  7

55

Коэффициент корреляции Кендалла (Kendall’s coefficient of rank correlation, Kendall-τ)

Связана ли дистанция расселения с упитанностью у экзотических зелёных мышей?

Он оценивает разность между вероятностью того, что порядок данных в обеих переменных одинаков, и вероятностью того, что порядки разные.Считается совсем не так, как коэффициент Спирмана.

Только для ранговых переменных! Для количественных лучше коэффициент Спирмана, особенно для больших выборок

Непараметрические критерии

Page 56: Занятие  7

56

Гамма-статистика (Gamma)

Почти как коэффициент корреляции Кендалла, её лучше использовать, если в выборке много совпадающих значений (tied ranks) - она их учтёт.Ближе к коэффициенту Кендалла (тоже оценивает вероятность совпадений).

Непараметрические критерии

Page 57: Занятие  7

57

Kendall’s coefficient of rank correlation, Kendall-τ

Отвергаем Н0: дистанция расселения у зелёных мышей отрицательно связана с упитанностью.

Page 58: Занятие  7

58

Коэффициент конкордантности Кендалла (Kendall’s coefficient of concordance): ≥2 переменных

Переменных может быть 3 и более. Значения ранжируются внутри каждой переменной, и считается общая статистика W, она примерно соответствует среднему коэффициенту корреляции Спирмана для всех пар переменных.

Петя Гриша Гурвинек

Непараметрические критерии

Одна из задач – оценка согласия экспертов, например, детей, оценивающих вкус 6 типов пирожных.

Page 59: Занятие  7

59

Коэффициент конкордантности Кендалла

Нестандартная организация таблицы!

Page 60: Занятие  7

60

Гипотезу о 0 ≤ W ≤ 1Чем ближе коэффициент к 1, тем выше корреляция.Чем ближе к нулю, тем меньше связь переменных (например, согласие экспертов).

Page 61: Занятие  7

61

Итак, при выборе теста важно, что:

1.Параметрические тесты более мощные, чем непараметрические;

2.Непараметрические безопаснее в плане ошибки 1-го рода;

3.Чем больше размер выборки, тем менее критичны требования к распределению (по Центральной предельной

теореме); для выборок N ≥ 100 используют параметрические тесты даже при больших отклонениях от нормального распределения (кроме регрессий).

4.АНОВА не очень чувствительна к отклонениям от нормального распределения (для одинаковых по размеру групп).

Page 62: Занятие  7

62

Сравнение 2-х индексов Шеннона

Считают t-статистику (Zar, 2010, p. 174)

Где

df=

И сравнивают с табличным tcv

Дополнение на всякий случай

Page 63: Занятие  7

63

Задания.1.Издатели хотят узнать, насколько наличие цветных картинок в

статье помогает воспринимать текст. Выбрали 13 студентов, и каждому дали два текста одинаковой сложности - с цветными и чёрно-белыми картинками. Потом попросили оценить сложность текста по 10-бальной шкале. Влияют ли цветные картинки на восприятие текста? Н0? Статистический критерий?

2.Доктор Ворнер изучает, какие ярлычки с предупреждением об опасности лучше действуют (опасность оценивают по 20-бальной шкале). Он выбрал 40 добровольцев, разбил их на 4 группы, и показал им 4 типа ярлычков – красные (обычный шрифт), красные (жирный шрифт), чёрные (курсив), чёрные (заглавные буквы). Предыдущее исследование показало, что цвет ярлыка важнее, чем шрифт. Так ли это?

3.исследователь хочет узнать, насколько мнения мужчин сходны, когда они оценивают привлекательность женщин. Он выбрал двух добровольцев и показал им по 20 фотографий с девушками, попросив оценить их привлекательность от 1 до 10. Статистический критерий? Изменится ли выбор критерия, если добровольцев будет четверо?

Page 64: Занятие  7

64


Recommended