Статистический анализ количественных и...

Preview:

Citation preview

Статистический анализ количественных и качественных признаков

План лекции

Программные средства статистической обработки результатов медико-биологического исследования

Этапы статистической обработки

Элементы описательной статистики

Элементы доказательной статистики

ПРОГРАММНЫЕ СРЕДСТВА

СТАТИСТИЧЕСКОЙ ОБРАБОТКИ

Microsoft Excel

Специализированные пакеты

Последовательность действий при статистическом анализе данных

1.Подготовка данных – формирование массива, чистка, контроль корректности загрузки

2.Исследование типа распределения

3.Описательная статистика

4.Аргументированный выбор соответствующего статистического метода

Сравнение групп с использованием соответствующего статистического метода

Исследование взаимосвязи с использованием соответствующего статистического метода

ПОДГОТОВКА ДАННЫХ ДЛЯ

ОБРАБОТКИ ПАКЕТАМИ ПРИКЛАДНЫХ СТАТИСТИЧЕСКИХ ПРОГРАММ

Представление данных

Данные представляют в виде таблицы:

столбцы - Переменные,

строки – Наблюдения

Наиболее часто используемые форматы для переменных:

Текст (пол, характер процесса и т.д.)

Число

Дата

Пример таблицы

ФИО

пол: 1- м; 2- д

Апгар на 1 мин

коды: 0 (<5); 1 (=5-6); 2 (>6)

Апгар на 2 мин

(балл)

вес при рождении

(гр)

длина при рождении

(см)

окружность головы при рождении

(см)

окружность груди при рождении

(см)

Patient 1 1 1 6 630 29,5 24,5 18

Patient 2 1 1 6 1136 35 26 22

Patient 3 1 0 4 2360 43 32 31

Patient 4 1 0 6 650 30 26 20

Patient 5 1 0 5 1330 39 31 28

Patient 6 1 1 7 670 31 23 18

Patient 7 2 2 8 2140 39 31 29

Patient 8 2 2 8 1450 40 28 24

Patient 9 2 1 7 1202 36 20 25

……. …. …. … … … … …

Patient 20 2 2 8 2520 47 33 30

Группирующие переменные

Проверка корректности данных

Артефакты

Ошибки распознавания формата данных при импорте

Различия в задании одинаковых по смыслу текстовых переменных

ИССЛЕДОВАНИЕ ТИПА

РАСПРЕДЕЛЕНИЯ

Значение вида распределения параметра

Распределение параметра – совокупность

частот встречаемости интервалов его

значений в исследуемой выборке.

Вид распределения влияет на выбор статистического метода:

Нормальное распределение – параметрические методы

Любое другое распределение – непараметрические методы

Нормальное распределение Параметры нормального распределения:

среднее значение (M) ; стандартное отклонение (σ)

Нормальное распределение

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 3 6 9 12 15 18 21 24 27

Плотность

ГРАФИК ПЛОТНОСТИ

НОРМАЛЬНОГО

РАСПРЕДЕЛЕНИЯ С

ПАРАМЕТРАМИ:

M = 12; Ϭ = 3 Ϭ =3 Ϭ =3

M M- σ M+ σ

12 15 9

Количественные данные

Нормальное распределение

Распределение отличное от нормального

Исследование типа распределения

Как узнать? • Визуальная оценка

• Сравнение среднего и медианы

• Проверка гипотез

Проверка статистической гипотезы о виде распределения Н0 – исследуемое распределение соответствует нормальному закону распределения

Если вероятность случайного отличия мала (Р – значение меньше 0,05), то отличие признается достоверным (не случайным) - распределение признака не является нормальным.

Используемые критерии:

Колмогорова-Смирнова (K-S)

Лилиефорса (Liliefors)

Шапиро-Уилка (Shapiro-Wilk).

ОПИСАТЕЛЬНАЯ

СТАТИСТИКА

Количественные данные

Нормальное распределение

Распределение отличное от нормального

Число наблюдений

Среднее (M)

Среднее квадратичное отклонение (S)

Число наблюдений

Медиана (Me)

Верхний и нижний квартили

Описание количественных признаков

«Ящик с усами»

Ящик с усами, диаграмма размаха — график, использующийся в описательной статистике, компактно изображающий одномерное распределение вероятностей.

Частоты встречаемости значения признака:

Абсолютная частота – число объектов с определенным значением качественного признака

Относительная частота – отношение числа объектов с каким-либо значением признака к общему числу объектов

Таблица сопряженности

Описание качественных признаков

Конституция Мужчины Женщины всего

Астеники 5 8 13

Нормостеники 25 30 55

Гиперстеники 12 11 23

всего 42 49 91

Качественные данные

Порядковые Номинативные

• параметр положения медиана (Me) и характеристики рассеяния нижний (LQ) и верхний (UQ) квартиль

• относительные частоты встречаемости значения признака

Описание качественных признаков

СРАВНЕНИЕ ГРУПП

С ИСПОЛЬЗОВАНИЕМ СООТВЕТСТВУЮЩЕГО СТАТИСТИЧЕСКОГО МЕТОДА

Проверка статистической гипотезы о различии групп по признаку

Н0 – исследуемые группы не различаются по анализируемому признаку

Н1 – исследуемые группы различаются по анализируемому признаку

Выбор критерия для сравнения групп по количественному признаку

Выборки Число групп

Параметрические (для данных, имеющих нормальное распределение)

Непараметрические (для данных, чьё распределение отличается от нормального или неизвестно)

Не

зав

иси

мы

е

2

t-критерий Стьюдента U-критерий Манна-Уитни,

За

ви

сим

ые

2

t-критерий Стьюдента для зависимых групп

критерий Вилкоксона

Сравнение двух групп по качественному признаку

Выборки Признак бинарный

Признак номинальный

Признак порядковый

Независимые точный критерий Фишера

тест χ2

критерий Манна-Уитни

т е с т χ2

Зависимые Критерий МакНемара

тест χ2

критерий Вилкоксона

Интерпретация результата

Если р>0,05, то нулевая гипотеза об отсутствии различий групп по изучаемому признаку не отклоняется.

Если вероятность случайного отличия мала (Р – значение меньше 0,05), то отличие признается достоверным (не случайным) –

нулевая гипотеза отклоняется (принимается гипотеза о существовании различий групп с уровнем статистической значимости р)

Представление результатов

Для количественных данных: Характер групп и число объектов в каждой из них

Результат проверки распределения на нормальность

Название критерия, используемого для оценки различий групп по определенному признаку

Точное значение р и интерпретация результата

Для качественных данных: Характер групп и число объектов в каждой из них

Название критерия, используемого для оценки различий групп по определенному признаку

Точное значение р и интерпретация результата

ИССЛЕДОВАНИЕ

ВЗАИМОСВЯЗИ ПРИЗНАКОВ В ГРУППЕ

Типы связей между признаками

• Есть ли зависимость между ростом и весом человека? Две количественные переменные

• Есть ли зависимость между ожирением и артериальным давлением человека? Качественная и количественная переменные

• Есть ли взаимосвязь между ожирением и уровнем холестерина в крови? Две качественные переменные

• Корреляция

• Корреляция

• Ассоциация

Характер и силу взаимосвязи признаков в группе характеризует коэффициент корреляции.

Коэффициент корреляции изменяется в интервале от -1 до 1.

Мера взаимосвязи признаков

Проверка статистической гипотезы о взаимосвязи признаков в группе

Н0 – отсутствует взаимосвязь между исследуемыми признаками в группе

Н1 – исследуемые признаки в группе взаимосвязаны

Методы исследования взаимосвязи признаков

Характер и тип распределения признаков

Статистический критерий

Исследование взаимосвязи нормально распределенных количественных

Параметрический метод корреляционного анализа Пирсона

Исследование взаимосвязи: • количественных признаков, чьё

распределение отличается от нормального или неизвестно;

• количественного и качественного порядкового признака;

• двух порядковых признаков

Непараметрический метод корреляционного анализа Спирмена

Оценка коэффициента корреляции

Значение коэффициента корреляции оценивают по силе и знаку. в зависимости от величины модуля коэффициента корреляции:

меньше 0,3 – слабая сила связи; от 0,31 до 0,5 – умеренная; от 0,51 до 0,7 – заметная; 0,71 и больше – высокая.

в зависимости от знака коэффициента корреляции:

положительное число – прямая взаимосвязь отрицательное число – обратная взаимосвязь

Интерпретация результатов

Если р>0,05, то независимо от значения коэффициента корреляции нулевая гипотеза об отсутствии взаимосвязи изучаемых признаков не отклоняется.

Если р<0,05, то нулевая гипотеза об отсутствии взаимосвязи изучаемых признаков отклоняется. В этом случае необходимо оценить значение коэффициента корреляции

Резюме

• Оценка нормальности распределения

• Нормальное распределение

• М(S),

• Критерий Стьюдента

• Корреляция по Пирсону

• Распределение, отличное от нормального

• Мe ( Q1, Q3),

• Критерий Манна-Уитни,

• критерий Вилкоксона

• Корреляция по Спирмену

Количественные данные

• Частота встречаемости

• Номинальные (Mo)

• Порядковые Мe ( Q1, Q3)

• Критерий Фишера,

Метод хи-квадрат,

Корреляция по Спирмену

Качественные данные

СПАСИБО ЗА ВНИМАНИЕ!

Recommended