32
Statistics and how to interpret them CIJ/OSI Investigative Journalism – Public Finance School April 2011 ЦЖР/ИОО Журналистские расследования - Общественная Школа Финансов, Баку, 14-16 апреля 2011 Статистические модули Инструктор: Эд Суирс-Хеннесси

ЦЖР/ИОО Журналистские расследования - Общественная Школа Финансов, Баку, 14-16 апреля 2011

Embed Size (px)

DESCRIPTION

ЦЖР/ИОО Журналистские расследования - Общественная Школа Финансов, Баку, 14-16 апреля 2011. Статистические модули Инструктор: Эд Суирс-Хеннесси. Средняя величина или Среднее значение. Среднее значение вычисляется путём суммирования значений и деления суммы на количество переменных. - PowerPoint PPT Presentation

Citation preview

Page 1: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Statistics and how to interpret them

CIJ/OSI Investigative Journalism – Public Finance School April 2011

ЦЖР/ИОО Журналистские расследования- Общественная Школа Финансов, Баку, 14-16 апреля 2011Статистические модули Инструктор: Эд Суирс-Хеннесси

Page 2: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Средняя величина или Среднее значение

Среднее значение вычисляется путём суммирования значений и деления суммы на количество переменных.

В задаче по математике на «множества», количество правильных ответов из 10 были:

Значения: 3,4,5,5,4,10,4,10,4,6,4,7,10,3,10,5,4,6,10,5

Page 3: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Средняя величина или Среднее значение

Сумма 20 значений составляет 119 Среднее количество 119/20 = 5.95

Page 4: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Мода (Статистика)

Рассортируйте числа в группах, учитывая сколько людей собрали 3 балла, сколько 4 балла и т.д. Это называется распределение чисел.

См. Excel пример

Page 5: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Медиана (Статистика)

Сортируйте значения от меньшего к большему.

Подсчитайте количество значений. Если у вас нечетное число

значений, медианой является среднее значение.

Если число значений четное, медиана является средним числом от двух средних значений.

See Excel examples

Page 6: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Сумма

Данные переменных потока и запаса

Добавьте данные о запасах Будьте осторожны с данными

потока – их можно добавить, но будьте осторожны с описанием.

Page 7: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Население , 2010Азербайджан

8,997,400

Грузия 4,436,400Таджикистан

7,595,000

Украина 45,870,700

Всего 66,899,500

Page 8: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Население, 2010

Процент населения который любит футбол

Азербайджан 8,997,400 30.1

Грузия 4,436,400 25.6

Таджикистан 7,595,000 27.6

Украина 45,870,700 50.3

Всего 66,899,500 Average 33.4

Page 9: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Население, 2010

Процент населения который любит футбол

Азербайджан 8,997,400 30.1

Грузия 4,436,400 25.6

Таджикистан 7,595,000 27.6

Украина 45,870,700 50.3

Всего 66,899,500 Среднее (взвешенное)

43.4

Page 10: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность

Количество между 0 и 1 0 = невозможное событие 1 = определенное событие 0,5 = событие которое может

произойти и непроизойти

Page 11: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность

0 = невозможное событие - все мы позавтракали сегодня в Лондоне

1 = определенное событие - все встали с постели сегодня

0,5 = событие может произойти, или не произойти - монета упала на одну из сторон

Page 12: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность

• Несмещённые кости• Все шесть сторон имеют равную

вероятность выподания• Вероятность = 1 / 6 = 0,1666

Page 13: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность Отметим сумму вероятностей всех вариантов = 1

Page 14: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность - возрастно-половая пирамида

Page 15: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность - эксперименты типа да / нет ; биномиальное распределение

Page 16: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность -Невероятные события; распределение Пуассона

Page 17: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность - Нормальное распределение, например, для зарплаты на определенном уровне

Page 18: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Интерпретация данных, полученных с помощью вопросника Не все люди отвечают Цена опроса высока – поэтому

рассматриваются образцы опросов с малым количеством респондентов

Различные образцы могут давать отличающиеся результаты

Результатам присваивают меру надежности - доверительный интервал.

Page 19: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Интерпретация данных, полученных с помощью вопросника

Реальная стоимость

X Выборочная оценка

X

XX

XXX

X

XX

X

X

X

X

X

XX

X

X

X

X

X

Page 20: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Интерпретация данных, полученных с помощью вопросника

Реальная стоимость

X Выборочная оценка

X

X

X X

XX

X

XX

Page 21: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Интерпретация данных, полученных с помощью вопросника Статистика это среднее арифметическое от

всех наблюдений плюс-минус погрешность измерения

Для 67% доверия к результату???, средний плюс или минус одно (1х) стандартное отклонение.

Для 95% доверия к результату????, средний плюс или минус двукратное (2x) стандартное отклонение.

Для 99% доверия к результату, средний плюс или минус трехкратное (3x) стандартное отклонение.

Page 22: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Интерпретация данных, полученных с помощью вопросника

Пример возраста

Page 23: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Ошибки в данных

Примените проверку смысла (sense check) Если вы не уверены, ищите

альтернативные источники Существует ли показатель предыдущего

года? Является ли изменения по годам

допустимым? Правильно ли отображаются единицы

измерения?

Page 24: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Ошибки в данных

Два примера, где данные не были проверены

1. Население Таджикистана не составляет 7595 млн. (это больше, чем населения земного шара!)

Page 25: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Page 26: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Ошибки в данных

Два примера, где данные не были проверены

1. Население Таджикистана не составляет  7,595,000,000  (это больше, чем населения земного шара!)

2. Ошибка произошла из-за неправильного применения точки и запятой в дробях

Page 27: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Ошибки в данных

Два примера, где данные не были проверены

1. Население Таджикистана не составляет 7,595,000,000

2. Не так много людей нетрудоспособны.

Page 28: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Page 29: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Доверительные интервалы - сравнение результатов

Год Доля курящего населения

Доверительный интервал

2009 32.4 ± 1.2

2010 31.6 ± 1.3

31.2 33.6

32.930.3

Совпадение

Поэтому статистически не значительно

отличается

Page 30: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Индекс

Используется для описания тенденций в экономике, в частности, в ценах и торговле

Полезен для сравнения разрозненных рядов данных.

Позволяет сравнивать перемены во времени относительно постоянной точки.

Page 31: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Население четырех стран- числа

Page 32: ЦЖР/ИОО  Журналистские расследования - Общественная Школа Финансов, Баку,  14-16 апреля 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Население четырех стран- 2006=100