Занятие 7

Занятие Занятие 77

Трансформация данных. Непараметрические Трансформация данных. Непараметрические критерии.критерии.

Требования к выборке для проведения

параметрических тестов

1. Случайность измерений (randomness)

2. Независимость измерений (independence)

3.3. ГомогенностьГомогенность дисперсии (homogeneity = homoscedasticity)

4. Соответствие нормальному распределениюнормальному распределению

5. Для факторной ANOVA – аддитивность (пояснить с табличкой)

Повторение из предыдущих занятийТрансформация данных

Параметрические тесты:

нулевая гипотеза формулируется о конкретных ПАРАМЕТРАХ РАСПРЕДЕЛЕНИЯ и/или эти параметры входят в формулу статистики критерия.Параметры: среднее значение, стандартное отклонение, дисперсия…

Почему при проведении параметрических тестов важно соблюдать условия?

Нарушим условие соответствия выборки нормальному распределению и проведём одновыборочный t-тест (односторонний)!

Трансформация данных

HH00: μ ≤ 90 г;

HH1 1 : μ > 90 гПусть σ известна.

Распределение статистики критерия не будет нормальным, если в выборке не нормальное распределение.

Пусть наше распределение скошено. Z-распределение тоже будет скошено!

р=0.05

0 1 2-1-2

р>0.05

критическое значение

Вероятность, что среднее в выборке попадёт в критическую область (рассчитанную для нормального распределения), будет выше, чем 0.05 – увеличится ошибка 1-го рода

Основной вывод:пренебрежения условиями использования параметрических тестов может увеличивать ошибку 1-го рода.

(Неизвестно, насколько)

Примечание: слабые отклонения от нормального распределения не очень страшны (в силу Центральной предельной теоремы), а для больших выборок ими можно пренебречь (кроме регрессионного анализа).

ANOVA устойчива к отклонениям от нормального распределения, особенно если выборки одинаковы по размеру.

Какие бывают распределения:

Равномерное (uniform)

Может быть и дискретным, и непрерывным

Пример: рассмотрим выводки из 6 детёнышей каждый.Возможное соотношение самцов и самок в выводке:

6:0; 5:1; 4:2; 3:3; 2:4; 1:5; 0:6

Биномиальное распределение

Количество самцов в выводке из 6 зверьков

роят

ност

ь та

кого

вод

распределение количества самцов в N выводков (независимых случайных экспериментов) из n = 6 зверьков, таких что вероятность рождения самца постоянна и равна p, а вер-ть рождения самки q = 1 - p.

Биномиальному распределению обычно соответствуют доли, частоты, пропорции

Если р мало, ситуация лучше описывается распределением Пуассона

Isaac Newton

Распределение Пуассона

Показывает вероятность того или иного количества независимых друг от друга редких и случайных событий (особей, контактов, мутаций и пр.) на заданном интервале времени (участке пространства, объёме...).

λ = μ

Siméon Denis Poisson

Распределению Пуассона соответствуют частоты, количества случайно распределённых объектов

Распределение ПуассонаСравнение распределения объектов во времени и пространстве со случайным распределением (testing for randomness)

Важно: следует задавать размер элементарной единицы пространства (времени и пр.), напр., квадрата, так, чтобы μ ≈ 1

Экспоненциальное распределениеХорошо описывает распределение промежутков времени (расстояний) между случайными событиями с заданной средней частотой событий.

Другие распределения

Логнормальное, Гамма, геометрическое, отрицательное биномиальное, гипергеометрическое и др.

Если распределение отлично от нормального, выборки не гомогенны, факторы мультипликативны, можно

ТРАНСФОРМИРОВАТЬ данные

значение признака

част

Прекрасное свойство: часто трансформация данных приводит одновременно к нормальному распределению, гомогенности и аддитивности

1. Логарифмическая трансформация (logarithmic transformation):

•Делает симметричным скошенное вправо (positively skewed) распределение.•Используется в случае, когда среднее значение в группе прямо пропорционально стандартному отклонению.

ii XX lg 1lg ii XX

Если в результате логарифмирования получилось нормальное распределение, исходное распределение было логнормальным.

2. Извлечение квадратного корня (square root transformation)

• Используется, когда среднее значение в группе прямо пропорционально дисперсии.

• обычно такое явление свойственно выборкам из распределения Пуассона (т.е., данные представляют собой количества случайных событий, объектов…)

5,0 ii XX

Например, количество социальных контактов в час.

3. Арксинусная трансформация (arcsine transformation)• применяется для процентов и долей (Xi ≤ 1),

которые обычно формируют биномиальное распределение.

ii XX arcsin

Например, мы исследуем долю самцов или долю переживших зиму детёнышей в выводках сурков.

Прочие трансформации см. Zar, 2010 (1999)

4. Box-Cox transformation

Универсальная трансформация данных, в которой программа методом проб подбирает наилучшие параметры и способ трансформации для конкретных данных (ищется особый параметр λ)

Box-Cox transformation

Обычно параметрические методы не годятся, если данные РАНГОВЫЕ: неизвестно, насколько одно значение отличается от другого.НО:

Непараметрические методы

Zar, 2010

Если наше распределение не удовлетворяет условиям параметрических тестов и трансформация не помогает или невозможна, наш выбор -

Непараметрические методы (Непараметрические методы (nonparametric methodsnonparametric methods))

Свойства распределения неизвестны, и параметры распределения (среднее, дисперсию и т. п.) мы использовать не использовать не можемможем

Основной подход – ранжированиеранжирование (ranking) наблюдений (выстраиваем их по порядку от самого маленького значения к наибольшему).

подразумевается, что сравниваемые распределения имеют одинаковую форму и дисперсию.

= “distribution-free” tests

Мы исследуем два редких вида сумчатых. Хотим сравнить размеры выводков у этих зверей.

Фактор – вид. Группы: 1. длинноухие; 2. пятнистыеЗависимая переменная – размер выводка

длинноухий пятнистый

Непараметрические методыСравнение 2-х независимых групп

Сравнение 2-х независимых групп:Манн-Уитни тест (Mann-Whitney U-test)

Н0: размер выводка у длинноухих сумчатых такой же, как и у пятнистых.Н1: размер выводка не одинаков у этих видов.

Мы ничего не говорим про параметры распределений!

Тест Манна-Уитни можно использовать и для ранговых, и для непрерывных переменных.

Непараметрические критерии

длинноухие пятнистыеразмер ранг размер ранг

8 15.5 4 5

7 13 7 13

4 5 5 8.5

7 13 8 15.5

9 17.5 3 2

3 2 3 2

5 8.5 5 8.5

6 11 4 5

9 17.5

111.5 59.5

Это непараметрический аналог двухвыборочного t-теста. РанжируемРанжируем данные от меньшего к большему (игнорируя деление на группы).Число 3 встретилось трижды (это называется связанные ранги, tied ranks):ранги у них будут одинаковы = (1+2+3)/3=2

Статистика критерия:

n1 и n2 – размер выборок,R1 и R2 – суммы рангов в выборках.

Статистикой критерия Uobs будет меньшее из этих двух значений. Причём Н0 мы отвергнем в случае, если оно будет МЕНЬШЕ критического значения Ucv. (т.е., это исключение среди прочих критериев).

Если выборки удовлетворяют требованиям для параметрических тестов, мощность теста Манна-Уитни = 95% от мощности t-теста.М-У тест один из самых мощных среди непараметрических тестов!

Альтернативная процедура – применить ранговую трансформацию к исходным данным (т.е., проранжировать измерения как для М-У теста) и провести двухвыборочный t-тест уже над рангами (Zar, 2010).

Только М-У тест (но не t-тест) пригоден для проверки необычной гипотезы о том, что значения в одной группе отличаются от значений в другой группе в a раз (достаточно умножить значения в соответствующей группе на a и дальше провести стандартный М-У тест).

Если размеры выборок больше 20, распределение статистики U приближается к нормальному со средним

Uobsobs

Поэтому считается значение

И сравнивается с критическим значением для нормального распределения Z (наблюдаемое z должно быть по модулю больше критического).

Поэтому для маленьких выборок в статье можно приводить только U, а для больших выборок нужно приводить и U, и z.

Тест может быть односторонним и двусторонним

Сравнение 2-х независимых групп:

Тест Колмогорова-Смирнова (Kolmogorov-Smirnov two-sample test): отличается от М-У теста тем, что М-У более чувствителен к различиям средних значений, медианы и т.п., а К-С тест более чувствителен к различиямразличиям распределений по форме.по форме.

Тест Вальда-Вольфовица (Wald-Wolfowitz Runs Test) – данные сортируются по зависимой переменной и оцениваются последовательности элементов из разных групп. Как и К-С тест, чувствителен к различиямразличиям распределений по форме.по форме.

Манн-Уитни тест более мощный, чем эти тесты.

Mann-Whitney U-testKolmogorov-Smirnov two-sample testWald-Wolfowitz Runs Test

Отвергаем Н0: М-У тест показал, что размеры выводков у разных видов неодинаковые

Просто результаты М-У теста

Результаты М-У теста с поправкой на наличие tied ranks

Точное значение р для небольших выборок без tied ranks

В отличие от К-С и В-В тестов.

Сравнение 2-х связанных группКритерий Вилкоксона (Wilcoxon matched pair test)

Изучаем утконосов, и хотим знать – различается ли отношение самки к самцу и самца к самке в парах

Мы считаем частоту дружелюбных контактов со стороны самки к самцу и наоборот. У каждого самца есть по жене, а у каждой самки – по мужу.

Фактор – пол. (1. самцы; 2. самки)Зависимая переменная – частота инициирования дружелюбных контактов.

Н0: количество контактов в популяции, из которой мы получили выборку самцов, такое же, как и в популяции, из которой выборка самок.Н1: количество контактов не одинаково.

1.Считают разностиразности между значениями в парах;

2. исключают нулевые разностиразности;

3.присуждают абсолютным значениям (по модулюпо модулю) разностей рангиранги;

4. суммируютсуммируют отдельно ранги положительных и отрицательных разностей;

5.Наименьшая из этих сумм - статистика Т.

6. Отвергаем Н0, если Т меньше Tcv.

21 iii XXD

Аналог t-теста для двух связанных выборок, мощность – около 95% мощности t-теста . При числе пар >100 Т

апроксимируется нормальным распределением.

самец самка

1 пара 356 3632 пара 351 3613 пара 353 3584 пара 355 3565 пара 354 3596 пара 355 355

Wilcoxon matched pair test

Число дружелюбных контактов у самцов и самок в парах было неодинаковым

Сравнение 2-х связанных групп: Знаковый тест (Sign test)

Считают разности в парах, но не ранжируют их, а просто определяют число положительных и отрицательных разностей (нули исключают). Сравнивают их соотношение с 1:1. (биномиальным тестом)

Подходит для случаев, когда точные значения переменной не известны.

Имеет низкую мощность, поэтому применяется только в больших выборках (больше 20 пар).

Сравнение ≥3-х независимых группТест Крускала-Уоллиса (Kruskal-Wallis test)

Мы получили возможность включить в работу третий, особенно редкий вид сумчатого. Теперь нас интересует, различается ли количество пищи, которую съедают за день особи этих видов.

Фактор – вид. Группы: 1. длинноухие; 2. пятнистые; 3. хвостатые

Критерий Крускал-Уоллиса (Kruskal-Wallis test)

Непараметрический аналог One-way ANOVA на 95% настолько же мощный, как и ANOVA; для 2-х групп идентичен Манн-Уитни тесту; подразумевает сходство форм распределений и равенство дисперсий в группах (хотя бы на глаз)

1. все значения ранжируются от меньшего к большему (игнорируя деление на группы);

2. Считается сумма рангов в каждой группе;3. считается статистика H(df, N).

)1(3)1(

сумма рангов в каждой группе

размер группыобщий размер выборки

Н0: распределение в популяциях, из которых мы получили выборки, одинаковое.Н1: распределения не одинаковые.

При маленьких выборок и 3-5-и групп считается Н-статистика.

Для больших выборок (или >5-и групп) Н апроксимируется распределением χ2.

Сравнение ≥2-х независимых групп Медианный тест (Median test)

Считается общая медиана для всех групп (получается, что это не непараметрический тест, а distribution-free).

Затем критерием χ2 (см. Частотные критерии) сравнивают числа значений, которые большебольше и которые меньшеменьше общей медианы в каждой из групп (табличка 2 х k).

Подходит для выборок, в которых часть наблюдений часть наблюдений выходит за пределы шкалы выходит за пределы шкалы (или их точные значения неизвестны).

Но имеет очень низкую мощность – лишь 67% мощности Манн-Уитни теста или теста Крускалла-Уоллеса. Рекомендуется для групп с n ≥ 20.

Kruskal-Wallis testMedian test

Доля растительной пищи отличалась между разными видами

Как и в ANOVA, после сравнения нескольких групп имеет смысл провести пост-хок тест (апостериорное сравнение), по аналогии с тестом Тьюки, чтобы выяснить какие же группы различаются.

Такие тесты существуют – Nemenyi test, Dunn’s test (Zar, 1999 или 2010).

И они есть в Statistica начиная с 8-й версии!

Пост-хок тест для непараметрической ANOVA

Непараметрические критерииСравнение ≥3 связанных групп

Критерий Фридмана (Friedman ANOVA)

У утконосов родились детёныши, и мы хотим знать, изменилась ли упитанность самокупитанность самок после беременностибеременности и после выкармливания потомства (мы оценивали её в баллах).

1. состояние до беременности;2. после рождения детей;3. после выкармливания детёнышей

мамамама

мама

детёныш

папа

Критерий Фридмана (Friedman ANOVA) для двух групп эквивалентен Знаковому тесту (sign test); по сравнению с аналогичными параметрическими тестами, для 2-х групп имеет всего 64% мощности, для 3-х – 72%, для 100 стремится к 95%.

Основан на том, что значения ранжируются меньшего к большему внутри каждой строки. Потом суммируют ранги для каждого столбца и считают статистику χ2

r, которая имеет распределение χ2.

Нулевая и альтернативная гипотезы - по аналогии с предыдущими тестами, о сходстве выборок.

Friedman ANOVA

мама

папа

Отвергаем Н0 – состояние самок изменялось

Требование к выборке для тестирования гипотезы о коэффициенте корреляции Пирсона:

Для каждого X значения Y должны быть распределены нормально, и для каждого Y все X должны иметь нормальное распределение -

част

двумерное нормальное распределение (bivariate normal distribution)

Ранговые корреляции

Трансформация данных в регрессионном анализе и корреляциях

Применяется таким же образом, как и для других критериев, НО основанием для применения должны служить несоответствие нормальному распределению и гетерогенность дисперсий, а не нелинейность связи!

Если распределения нормальны и дисперсии гомогенны, нельзя использовать трансформацию данных для получения линейной регрессии из нелинейной.

Коэффициент корреляции Спирмана (Spearman rank order correlation)

Связана ли дистанция расселения с индексом упитанности у мышей?

Переменные – 1. дистанция расселения; 2. индекс упитанности

Коэффициент корреляции Спирмана:

1. Ранжируем данные для каждой переменной от меньшего к большему;

2. Если встретились одинаковые значения (tied ranks), присваиваем им средние ранги;

3. Считаем разности рангов в каждой паре данных;4. Считаем коэффициент rs

разности рангов

число строк (размер выборки)

Лучший для дробных количественных признаков. Размер выборки ≥ 10.

H0 : ρs=0H1: ρs≠0

Статистика критерия – сам коэффициент корреляции Спирмана (имеет t-распределение)

Коэффициент Спирмана – аналог коэффициента корреляции Пирсона, стремится к нему в больших выборках. Мощность – около 91% коэффициента Пирсона.

Spearman Rank Order Correlations

Отвергаем Н0:Оказалось, что дистанция расселения положительно связана с упитанностью у мыши.

Spearman Rank Order Correlations

Коэффициент корреляции Кендалла (Kendall’s coefficient of rank correlation, Kendall-τ)

Связана ли дистанция расселения с упитанностью у экзотических зелёных мышей?

Он оценивает разность между вероятностью того, что порядок данных в обеих переменных одинаков, и вероятностью того, что порядки разные.Считается совсем не так, как коэффициент Спирмана.

Только для ранговых переменных! Для количественных лучше коэффициент Спирмана, особенно для больших выборок

Гамма-статистика (Gamma)

Почти как коэффициент корреляции Кендалла, её лучше использовать, если в выборке много совпадающих значений (tied ranks) - она их учтёт.Ближе к коэффициенту Кендалла (тоже оценивает вероятность совпадений).

Kendall’s coefficient of rank correlation, Kendall-τ

Отвергаем Н0: дистанция расселения у зелёных мышей отрицательно связана с упитанностью.

Коэффициент конкордантности Кендалла (Kendall’s coefficient of concordance): ≥2 переменных

Переменных может быть 3 и более. Значения ранжируются внутри каждой переменной, и считается общая статистика W, она примерно соответствует среднему коэффициенту корреляции Спирмана для всех пар переменных.

Петя Гриша Гурвинек

Одна из задач – оценка согласия экспертов, например, детей, оценивающих вкус 6 типов пирожных.

Коэффициент конкордантности Кендалла

Нестандартная организация таблицы!

Гипотезу о 0 ≤ W ≤ 1Чем ближе коэффициент к 1, тем выше корреляция.Чем ближе к нулю, тем меньше связь переменных (например, согласие экспертов).

Итак, при выборе теста важно, что:

1.Параметрические тесты более мощные, чем непараметрические;

2.Непараметрические безопаснее в плане ошибки 1-го рода;

3.Чем больше размер выборки, тем менее критичны требования к распределению (по Центральной предельной

теореме); для выборок N ≥ 100 используют параметрические тесты даже при больших отклонениях от нормального распределения (кроме регрессий).

4.АНОВА не очень чувствительна к отклонениям от нормального распределения (для одинаковых по размеру групп).

Сравнение 2-х индексов Шеннона

Считают t-статистику (Zar, 2010, p. 174)

Где

И сравнивают с табличным tcv

Дополнение на всякий случай

Задания.1.Издатели хотят узнать, насколько наличие цветных картинок в

статье помогает воспринимать текст. Выбрали 13 студентов, и каждому дали два текста одинаковой сложности - с цветными и чёрно-белыми картинками. Потом попросили оценить сложность текста по 10-бальной шкале. Влияют ли цветные картинки на восприятие текста? Н0? Статистический критерий?

2.Доктор Ворнер изучает, какие ярлычки с предупреждением об опасности лучше действуют (опасность оценивают по 20-бальной шкале). Он выбрал 40 добровольцев, разбил их на 4 группы, и показал им 4 типа ярлычков – красные (обычный шрифт), красные (жирный шрифт), чёрные (курсив), чёрные (заглавные буквы). Предыдущее исследование показало, что цвет ярлыка важнее, чем шрифт. Так ли это?

3.исследователь хочет узнать, насколько мнения мужчин сходны, когда они оценивают привлекательность женщин. Он выбрал двух добровольцев и показал им по 20 фотографий с девушками, попросив оценить их привлекательность от 1 до 10. Статистический критерий? Изменится ли выбор критерия, если добровольцев будет четверо?

Занятие 7

Documents

ЗАНЯТИЕ 4

Java осень 2014 занятие 7

Курс ПРР 1 модуль занятие 7 "Развитие познавательных способностей часть 1"

«Необыкновенное занятие»

Занятие 7. Анатомическое строение стебляold.gsu.by › biglib › GSU › Биологический...Ботаника. Анатомия вегетативных

Проектирование интерфейсов весна 2014 занятие 7

Практическое занятие

Cпецкурс 2014, занятие 7. Web-приложения

ВВОДНОЕ ЗАНЯТИЕ

Проектирование программных систем. Занятие 7

Занятие № 4

1. Цели освоения дисциплины...6. Занятие 6 2 7 2 8 Проверка отчёта по задачам 7. Занятие 7 2 8 2 10 Проверка отчёта

Занятие 1. Все начинается с желаний · 2017. 7. 10. · Занятие 1. Все начинается с желаний Сколько раз за последнее

тренинг зрения занятие 7

Внеклассное занятие

Стажировка-2013, разработчики, занятие 7. Web, HTTP

Первое занятие

Факультативное занятие-тренинг "Эффективная коммуникация" 2 занятие

Конкурсное занятие

ОГЛАВЛЕНИЕ...ЗАНЯТИЕ 9..... 26 ЗАНЯТИЕ 10 ..... 30 ЗАНЯТИЕ 12 ..... 35 ЗАНЯТИЕ 13 ... К равна 9,3∙10 – 3 с – 1, а при 318 К