128
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ НЕФТЕГАЗОВЫЙ УНИВЕРСИТЕТ» Институт менеджмента и бизнеса Кафедра экономики, организации и управления производством П. М. Килин, Н. И. Чекмарева СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ДАННЫХ Учебное пособие Тюмень ТюмГНГУ 2013

СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

  • Upload
    others

  • View
    12

  • Download
    0

Embed Size (px)

Citation preview

Page 1: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИФедеральное государственное бюджетное образовательное учреждение

высшего профессионального образования«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ НЕФТЕГАЗОВЫЙ УНИВЕРСИТЕТ»

Институт менеджмента и бизнесаКафедра экономики, организации и управления производством

П. М. Килин, Н. И. Чекмарева

СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ДАННЫХ

Учебное пособие

ТюменьТюмГНГУ

2013

Page 2: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

УДК 311ББК 65.8 К 39

Рецензенты:

профессор, доктор экономических наук С. В. Любимовпрофессор, доктор экономических наук Л. Н. Руднева

Килин П. М. Статистические методы обработки данных: учебное пособие /

П. М. Килин, Н. И. Чекмарева. — Тюмень: ТюмГНГУ, 2013. — 128 с.ISBN 978-5-9961-0796-4

Показывается сущность статистических исследований как применение тео-рии и методов обработки социально-экономической информации в технических и экономических системах. Раскрывается содержание понятий «теория стати-стики, как наука» и «статистические методы обработки информации».

В первом разделе «Основы статистического метода исследований» при-водятся теоретические основы статистики как науки, ее основные категории (статистическая закономерность, статистическая совокупность, признак, вариа-ция) и основные методы сбора и обработки данных (статистическое наблюдение, группировка и сводка данных статистического наблюдения, построение таблиц и графиков для формирования и анализа показателей как «статистических вели-чин» и «статистических распределений»).

Во втором разделе «Статистические методы в практике обработки данных» показываются наиболее важные статистические методы (корреляционно-регрес-сионный анализ, ряды динамики, индексы).

Для студентов, аспирантов и преподавателей высших учебных заведений предлагается в качестве пособия по дис циплинам «Теория статистики», «Стати-стические методы обработки данных», «Методы прикладной статистики в соци-ологии», «Статистика», обучающихся по техническим и экономическим направ-лениям и специальностям.

УДК 311ББК 65.8

ISBN 978-5-9961-0796-4 Федеральное государственноебюджетное образовательное учреждениевысшего профессионального образования«Тюменский государственный нефтегазовыйуниверситет», 2013

©

К 39

Page 3: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

3

СОДЕРЖАНИЕ

Введение ........................................................................................................................ 4

Раздел 1. Основы статистического метода исследований .................................. 5

Тема 1. Теоретические основы статистики как науки ........................................... 5Тема 2. Статистическое наблюдение ..................................................................... 21Тема 3. Cводка и группировка статистических материалов .............................. 29Тема 4. Статистические величины ........................................................................ 40Тема 5. Показатели вариации и статистические распределения ........................ 50

Раздел 2. Статистические методы в практике обработки данных ................. 58

Тема 1. Статистическое изучение взаимосвязей .................................................. 58Тема 2. Изучение динамики общественных явлений .......................................... 83Тема 3. Индексы .................................................................................................... 100

Приложение ............................................................................................................. 119Список литературы ............................................................................................... 126

Page 4: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

4

ВВЕДЕНИЕ

Учебно-практическое пособие по изучению дисциплины, проведению практических занятий, организации самостоятельной работы и выполнению курсовых работ по дисциплине «Статистические методы обработки данных» для студентов, обучающихся по направлению подготовки магистров 131000.68 «Нефтегазовое дело», составлены на основе Основной образовательной про-граммы подготовки магистров по указанному направлению, рабочей програм-мы по дисциплине «Статистические методы обработки данных», утвержденной на кафедре экономики, организации и управления производством Тюменского государственного нефтегазового университета.

Целью преподавания дисциплины «Статистические методы обработки дан-ных» является обеспечение теоретической базы профессиональной подготов-ки магистра в области нефтегазового дела, изучение методов статистического анализа и прогнозирования показателей, отражающих развитие технико-тех-нологических и социально-экономических процессов России и зарубежных го-сударств в конкретных условиях места и времени.

Задачи изучения дисциплины:- формирование у студентов теоретических знаний и практических навы-

ков для проведения статистического исследования на трех его этапах: мас-совое научно организованное наблюдение; группировка и сводка материала; обработка статистических показателей для получения выводов о состоянии явления и закономерностях его развития; изучение количественной стороны массовых явлений технико-технологической и социально-экономической жиз-ни в неразрывной связи с их качественным содержанием;

- изучение общей характеристики показателей рядов распределения и ме-тодов их расчета;

- корреляционно-регрессионный, дисперсионный и спектральный анализ, анализ сезонных и циклических колебаний;

- анализ и прогнозирование технико-экономических показателей с исполь-зованием ПЭВМ;

- применение индексного метода в прогнозировании;- исследование тенденции временного ряда и методов расчета параметров

тренда.Курс «Статистические методы обработки данных» является специальным

разделом курсов «Общая теория статистики» и «Прикладная статистика» и базируется на изучении таких дисциплин, как математическая статистика, теория вероятностей и др. Предлагаемое учебно-практическое пособие помо-жет студентам усвоить теоретический материал и написать курсовую работу. Методика изучения дисциплины «Статистические методы обработки данных» предусматривает чтение лекций, проведение семинарских и практических занятий, самостоятельную работу. Так как данная дисциплина по сути есть другое название дисциплин «Теория статистики», «Статистический анализ», «Методы прикладной статистики в социологии», при ее изучении могут ис-пользоваться любые методические материалы, разработанные, в частности, на кафедре экономики, организации и управления производством Тюменско-го государственного нефтегазового университета, с одной стороны, и может быть рекомендована для студентов всех направлений и специальностей лю-бых технических, гуманитарных и социально-экономических университетов, с другой стороны.

Page 5: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

5

Раздел 1. ОСНОВЫ СТАТИСТИЧЕСКОГО МЕТОДА ИССЛЕДОВАНИЙ

Тема 1. Теоретические основы статистики как науки

Общее представление о статистике и краткие сведения из ее истории. Единицы совокупности, их признаки и классификация. Системы статистических показателей.

Предмет статистической науки и ее методология. Специфиче-ские приемы и методы статистического изучения явлений обще-ственной жизни.

Слово «статистика» многолико, многозначно и согласно одному из ста-тистических терминов многомерно. В настоящее время насчитывается око-ло тысячи определений статистики. Дать определение статистики как науки пытались философы, математики, экономисты, социологи, государствен-ные деятели и, конечно, сами статистики. Сначала статистику определяли как «Staaten Kunde» — государствоведение (описание достопримечательно-стей государств). Оставаясь на протяжении многих лет «государствоведе-нием», статистика постепенно отходила от описания достопримечательно-стей (их тестового изложения). Тем более что с развитием знаний вопросами государствоведения стали заниматься многие науки.

Развитие статистики как науки шло по двум направлениям.Первое на-правление возникло в Германии в XVII веке и известно как государство- ве-дение или описательная школа. Представители (основатели) этого направ-ления Герман Конринг (1606–1681), Готфрид Ахенваль (1719–1772), Август Людвиг Шлецер (1735–1809) не только ввели преподавание этой дисципли-ны в университетах Германии и слово «статистика», но и много сделали для развития науки и признания ее во всем мире. В России представите-лями (последователями) «школы государствоведения» были выдающиеся ученые И. К. Кириллов (1689–1737), В. Н. Татищев (1686–1750), М. В. Ломо-носов (1711–1765), К. Ф. Герман (1767–1838) и К. И. Арсеньев, написавший в 1848 году экономико-географическое исследование «Статистические очерки России».

Второе направление возникло в Англии также в XVII веке и известно под названием «политическая арифметика». Основателем этого направле-ния был и основатель «классической политической экономии» Уильям Пет-ти (1623–1687). Представителями этого направления являются английские ученые Джон Граунт (1620–1674), Эдмунт Галлей, выдающиеся русские ге-ографы и статистики К. И. Арсеньев, К. Ф. Герман, Д. П. Журавский (1810–1856), П. П. Семенов-Тяньшанский (1827–1914).

Page 6: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

6

Современная статистика является синтезом этих направлений и третье-го направления — математико-статистического. Теоретическое обобщение практики учетно-статистических работ, положившем начало теории ста-тистики, сделал в XIX веке известный бельгийский ученый Адольф Кетле (1796–1874). Основным методом выявления закономерностей А. Кетле счи-тал метод средних величин, а теоретической основой статистики — теорию вероятностей. Развитие этого направления связано с именами таких уче-ных, как англичане Ф. Гальтон (1822–1911), К. Пирсон (1857–1957), В. Госсет (1876–1937), Р. Фишер (1890–1968), немец В. Лексис, итальянец К. Джини и многие другие [8]. В России это направление связано с представителями так называемой академической статистики: П. Л. Чебышевым (1821–1894), А. А. Марковым (1856–1922), А. М. Ляпуновым (1857–1918), Ю. Э. Янсо-ном (1835–1893), А. И. Чупровым (1942–1908), А. А. Чупровым (1874–1926), Н. А. Каблуковым (1849–1919), А. А. Кауфманом (1864–1919) [16].

В настоящее время под термином «статистика» чаще всего понимают следующее:

Статистика — одна из общественных наук, имеющая целью сбор, упо-рядочивание, анализ и сопоставление числового представления фактов, от-носящихся к самым разнообразным массовым явлениям. Это вместе с тем учение о системе показателей, то есть количественных характеристик, дающих всестороннее представление об общественных явлениях, о наци-ональном хозяйстве в целом и отдельных его отраслях. Статистика — это эффективное орудие, инструмент познания, используемый в естественных и общественных науках для установления тех специфических закономер-ностей, которые действуют в конкретных массовых явлениях, изучаемых данной наукой.

Статистика — это также одна из форм практической деятельности лю-дей, цель которой — сбор, обработка и анализ массовых данных о тех или иных явлениях. Когда мы говорим: государственная и ведомственная ста-тистика РФ, организация статистики в России, — то имеем в виду особую форму практической деятельности людей.

Статистикой называют также различного рода числовые или, как часто говорят, цифровые данные, характеризующие различные стороны жизни го-сударства: политические отношении, культуру, население, производство и т. д.

Часто слово «статистика» употребляется в качестве более короткого эквивалента для слов «статистические методы». Статистические методы можно охарактеризовать как методы, применяемые при сборе, представ-лении, анализе и интерпретации данных. В качестве примера можно упо-мянуть о методах, применяемых при сборе данных о совокупности сту-дентов вузов, обработке этих данных, обобщении и представлении в виде различных итоговых абсолютных, относительных и средних показателей

Page 7: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

7

с помощью графиков, таблиц. Применение статистических методов особен-но важно там, где из больших массивов данных требуется выделить полез-ную для нас информацию.

Иногда слово «статистика» может употребляться одновременно в не-скольких значениях. Известный английский статистик У. Дж. Рейхман (р. 1920 г.) заметил: «Мы живём в век статистики. Едва ли не в каждом аспек-те явления природы, а также человеческая и прочая деятельность поддаются сейчас измерению при помощи статистических показателей»*. Когда упо-требляют слово «статистика» с тем или иным эпитетом — красноречивая, удручающая и обнадёживающая, — имеют в виду те или иные статистиче-ские данные, способные вызвать определённые эмоции. В этом смысле упо-требил слово «статистика» английский государственный деятель и писатель Б. Дизраэли: «Имеются три рода лжи: ложь, наглая ложь и статистика»**.

Когда итальянский статистик К. Джини пишет, что статистика — это царица не только полной, но и неполной индукции, он имеет в виду не ста-тистическую информацию, а статистический метод умозаключения. Лю-бопытно и высказывание американского экономиста Митчелла: «Стати-стика — это солома, которую я, как и всякий другой экономист, должен спрессовать, чтобы получить брикеты»***.

Многочисленные нелестные эпитеты, адресованные статистике, не за-трагивают непосредственно её как науку, рассматривающую совокупность методов, с помощью которых можно исследовать ту или иную конкретную совокупность социально-экономических явлений. Эти методы и статистиче-ские показатели, рассматриваемые в чистом виде, сами по себе безупречны, но каждый из них имеет свои строго определённые условия и границы при-менения. Даже незначительное нарушение этих условий приводит к сбору недостаточно объективной и удовлетворительной информации. Широко рас-пространённое представление о вседоказанности любого явления с помощью статистики, конечно, слишком преувеличено, однако несомненно и то, что статистические методы могут ввести людей в заблуждение. Иногда одно и то же явление даже квалифицированные специалисты, во всех тонкостях знаю-щие статистику, могут объяснить по-разному, принять ложное утверждение и отвергнуть правильное. Принятие утверждения как истинного в известной мере зависит от субъективных особенностей исследователя. Российские ста-тистики Г. И. Бакланов и Г. С. Кильдишев отмечают, что «осторожный воз-держится от принятия утверждения, а смелый примет его» ****.

* Рейхман У. Дж. Применение статистики. — М.: Статистика, 1969. — с. 11.** Кимбл Г. Как правильно пользоваться статистикой. — М.: Финансы и статистика, 1982. — c. 15.

*** Занимательная статистика / под ред. Г. И. Бакланова, Г. С. Кильдишева. — М.: Статистика, 1980. — c. 10.

**** Занимательная статистика / под ред. Г. И. Бакланова, Г. С. Кильдишева. — М.: Статистика, 1980. — c. 11.

Page 8: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

8

Следовательно, выводы, которые делаются на основании статистических данных, не всегда однозначны. Думается, основная задача и предназначение статистики состоят в том, чтобы помочь людям лучше понять многие совре-менные проблемы нашей жизни. Сила статистики и в том, что она на основе анализа разрозненных, как бы пестрящих случайностями данных помога-ет исследователю проникнуть в существо изучаемых явлений. Прекрасно выразил эту мысль Г. Успенский в рассказе «Четверть лошади»: «А между тем только ведь в этих-то толстых скучных книгах и сказана цифрами та «сущая» правда нашей жизни, о которой мы совершенно отвыкли говорить человеческим языком, и нужно только раз получить интерес к этим дробям, нулям, нуликам, к этой вообще цифровой крупе, которою усеяны статисти-ческие книги и таблицы, так все они, вся эта крупа цифр начнёт принимать человеческие образы и облекаться в картины ежедневной жизни, то есть начнёт получать значение не мёртвых и скучных знаков, а, напротив, значе-ние самого разностороннейшего изображения жизни»*.

Предмет статистики, его определение и основные черты. Под статистикой понимают особую науку, которая имеет свой предмет и спец-ифические методы исследования. Рассмотрим основные черты и особенно-сти предмета статистической науки. Первой особенностью статистики как науки является то, что исследуются не отдельные факты, а массовые со-циально-экономические явления и процессы, выступающие как множества отдельных фактов, обладающих как индивидуальными, так и общими при-знаками. Задача статистического исследования состоит в получении обоб-щающих показателей и выявлении закономерностей общественной жизни в конкретных условиях места и времени, которые появляются лишь в боль-шой массе явлений через преодоление свойственной единичным элементам случайности.

Теоретическую основу любой науки, в том числе и статистики, состав-ляют понятия и категории, в совокупности которых выражаются основные принципы данной науки. В статистике к важнейшим категориям и поняти-ям относятся: совокупность, вариация, признак, закономерность.

Рассмотрим их подробнее. Объект статистического исследования (в ка-ждом конкретном случае) называют статистической совокупностью. Стати-стическая совокупность — это множество (масса) однокачественных (одно-родных) хотя бы по одному какому-либо признаку явлений, существование которых ограничено в пространстве и времени. Статистической совокуп-ностью можно считать, к примеру, совокупность жителей России по состо-янию на 1 января 2013 г., совокупность предприятий сельского хозяйства

* Успенский Г. — ПСС. — Т. 10. — Кн. 2. — М.: Изд-во Академии наук СССР, 1954. — c. 155–156.

Page 9: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

9

Тюменской области, производивших продукцию в 2012 году. Однако стати-стическая совокупность (множество) совсем не обязательно представляет большую численность единиц, в принципе она может быть и очень малень-кой; например, объем совокупности малой выборки может составлять ино-гда 8–10 единиц (выборка называется малой, если число индивидуальных значений признака менее 30).

Важнейшим свойством статистической совокупности является ее не-разложимость. Это означает, что дальнейшее дробление индивидуальных явлений не вызывает потери их качественной основы. Исчезновение или ликвидация одного или ряда явлений не разрушает качественной основы статистической совокупности в целом. Так, население страны или города останется населением, несмотря на постоянно происходящие процессы ме-ханического и естественного движения населения.

Статистическая совокупность — это множество единиц, обладающих массовостью, однородностью, определённой целостностью, взаимозави-симостью состояний отдельных единиц и наличием вариации. Например, в качестве особых объектов статистического исследования, то есть стати-стических совокупностей, могут вступать множества: сельскохозяйствен-ных предприятий, семей, браков, студентов, граждан какой-либо страны. Важно помнить, что статистическая совокупность состоит из реально су-ществующих материальных объектов.

Каждый отдельно взятый элемент данного множества называется едини-цей статистической совокупности. Единицы статистической совокупности характеризуются общими свойствами, качествами, именуемыми в статисти-ке признаками. Под качественной однородностью совокупности понимается сходство единиц (объектов, явлений, процессов) по каким-либо существен-ным признакам, но различающихся по каким-либо другим признакам. Напри-мер, множество сельскохозяйственных предприятий наряду с качественной определённостью (принадлежностью к разряду предприятий, причём опре-делённой отрасли — сельского хозяйства) обладает различиями по размеру земельных угодий, численности работающих, поголовью скота, различной технологической оснащённостью и т. д. Качественная определённость сово-купности хотя и имеет объективную основу, устанавливается в каждом кон-кретном статистическом исследовании в соответствии с его целями и позна-вательными задачами. Совокупность сельскохозяйственных предприятий, качественно однородная с точки зрения одной задачи исследования, может оказаться качественно неоднородной с точки зрения другой задачи, напри-мер, для изучения дифференциации хозяйственных условий и результатов в зависимости от категорий хозяйств по формам собственности.

Единицы совокупности обладают определенными свойствами, каче-ствами. Эти свойства принято называть признаками. Например, призна-ки человека: возраст, образование, занятие, рост, вес, семейное положение

Page 10: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

10

и т. д.; признаки предприятия: форма собственности, специализация (от-расль), численность работников, величина уставного фонда, экономическая эффективность его деятельности и т. д.

Статистика изучает явления через их признаки: чем более однородна совокупность, тем больше общих признаков имеют ее единицы и меньше варьируют их значения. Признаки различаются способами их измерения и другими особенностями, влияющими на приемы статистического изуче-ния. Это дает основание для классификации признаков:

- по характеру их выражения (описательные, количественные);- по способу измерения (первичные или учитываемые, вторичные или

расчетные);- по отношению к характеризуемому объекту (прямые, косвенные);- по характеру вариации (альтернативные, дискретные, непрерывные);- по отношению ко времени (моментные, интервальные).Описательные признаки выражаются словесно: национальность челове-

ка, разновидность почв, материал стен здания. Описательные признаки под-разделяются на номинальные и порядковые. Эти термины взяты из теории измерений. Отличия между ними в том, что номинальные — это описатель-ные признаки, по которым нельзя ранжировать данные, а порядковые — это признаки, по которым можно ранжировать, упорядочивать данные. Напри-мер, пользуясь оценками экспертов, ранжируют фигуристов по технике и ар-тистичности исполнения программы или работников по мастерству и т. д.

Варьирующие признаки могут быть атрибутивными или качественны-ми. Признак называется атрибутивным или качественным, если его отдель-ное значение (варианты) выражаются в виде состояния или свойств прису-щих явлению. Варианты атрибутивных признаков выражаются в словесной форме. Примерами таких признаков могут служить — форма хозяйствова-ния, форма собственности предприятия.

Признак называется количественным, если его отдельное значение вы-ражается в виде чисел. Например: заработная плата, стипендия, возраст, размер основных фондов. Количественные признаки играют преобладаю-щую роль в статистике. Таковы возраст человека, площадь пашни, заработ-ная плата рабочих, население города, доход кооператива и т. д..

По характеру варьирования количественные признаки делятся на дис-кретные и непрерывные. Дискретные — такие количественные признаки, которые могут принимать только вполне определенное, как правило, целое значение. Дискретные признаки, как правило, целочисленные. Это число членов семьи, количество этажей здания, комнат в квартире.

Непрерывными — являются такие признаки, которые в определенных пределах могут принимать значение как целое, так и дробное. К дискрет-ным относятся количественные признаки, которые могут принимать только

Page 11: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

11

отдельные значения, без промежуточных значений между ними. Непрерыв-ные, точнее, непрерывно варьирующие признаки способны принимать лю-бые значения, конечно, в определенных границах. К непрерывным относят-ся расчетные вторичные признаки. Ведь их значения — результат деления, а оно может приводить к любым числам — целым, дробным, иррациональ-ным. На практике значения непрерывных признаков округляют с конечной степенью точности, так что они становятся квазидискретными. С другой стороны, дискретные по существу признаки, например число работников предприятия на 1 января, поголовье коров на ту же дату, имеют такое гро-мадное число возможных значений, что на практике статистика вынуждена обращаться с ними, как с квазинепрерывными.

Первичные признаки характеризуют единицу совокупности в целом. Это абсолютные величины. Они могут быть измерены, сосчитаны, взвеше-ны и существуют сами по себе, независимо от их статистического изучения. Например, площадь пашни, мощность двигателей на предприятии, числен-ность населения города, число автомобилей, произведенных в стране.

Вторичные, или расчетные, признаки не измеряются непосредственно, а рассчитываются. Они являются продуктами человеческого сознания, ре-зультатом познания изучаемого объекта. Например, себестоимость едини-цы продукции, производительность труда, рентабельность, урожайность и т. п. Вторичные признаки представляют собой соотношения первичных признаков: деление объема выпущенной продукции на численность работ-ников дает показатель производительности труда; деление суммы затрат на произведенную продукцию на число единиц данной продукции дает се-бестоимость и т. д. Несмотря на расчетный характер признаков, они тоже имеют объективный характер. Процесс познания есть отражение объектив-ных свойств явлений и процессов, и расчеты, статистические методы позна-ния являются таким же необходимым средством отражения объективных свойств совокупности, как измерение, взвешивание. Вторичный — не оз-начает второстепенный. Термин определяет только путь познания: сначала надо измерить значения первичных признаков, а уже потом, во вторую оче-редь, на основе первичных признаков рассчитать значения вторичных.

Прямые (непосредственные) признаки — это свойства, непосредствен-но присущие тому объекту, который ими характеризуется. Таковы возраст человека, поголовье коров на ферме, объем продукции завода, численность его рабочих.

Косвенные признаки являются свойствами, присущими не самому объ-екту, а другим совокупностям, относящимся к объекту, входящим в него. Например, продуктивность коров как косвенный признак фермы. Хотя про-дуктивность не фермы, а коров — это их прямой признак, но ведь продук-тивность характеризует и ферму, которой принадлежат эти коровы (или

Page 12: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

12

даже целую область). Такова и оплата труда рабочих по отношению к за-воду. Это косвенный признак завода, но очень важный для того, кто соби-рается поступать на работу и выбирает предприятие. Практически деление признаков на прямые и косвенные совпадает с их делением на первичные и вторичные.

Признаки различаются в статистике и по характеру их вариации, т. е. по различиям их значений у разных единиц совокупности. Выделяются аль-тернативные признаки, которые могут принимать только два значения. Та-ковыми являются признаки обладания или необладания чем-то. Например, все садовые участки по признаку наличия посадок вишни можно разделить на имеющие посадки вишни и не имеющие их. Альтернативным признаком являются пол человека, место проживания (город, село).

Моментные признаки характеризуют изучаемый объект в какой-то мо-мент времени, установленный планом статистического исследования. Они существуют на любой момент времени и характеризуют наличие чего-либо: численность населения, стоимость фондов, количество скота, размеры жи-лой площади.

К интервальным относятся признаки, характеризующие результаты процессов. Поэтому их значения могут возникать только за интервал време-ни: год, месяц, сутки, но не на момент времени. Таковы число родившихся, умерших, объем промышленной продукции, надой молока, сумма получен-ной прибыли. Различие между моментными и интервальными признаками существенно при изучении динамики.

Единицы измерения моментных признаков относятся только к харак-теризуемым ими свойствам объектов, а единицы измерения интерваль-ных признаков содержат еще и указание того отрезка времени, за который определено значение признака. Так, стоимость основных производственных фондов предприятия на 1 января выражается в миллионах рублей, а объем продукции за январь — в тысячах или миллионах рублей за месяц.

В зависимости от целей конкретного исследования одни и те же призна-ки в одних случаях могут быть основными, а в других второстепенными. Основные признаки характеризуют главное содержание и сущность изу-чаемого явления или процесса. Второстепенные признаки дают дополни-тельную информацию и непосредственно связаны с внутренним содержа-нием явления.

Единицы совокупности наряду с общими для всех единиц признаками, обусловливающими качественную определённость совокупности, облада-ют индивидуальными особенностями и различиями, отличающими их друг от друга, то есть существует так называемая вариация признаков. Именно наличие вариации предопределяет необходимость статистики.

Количественные изменения значений признака при переходе от од-ной единицы совокупности к другой называются вариацией. Вариация

Page 13: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

13

возникает под воздействием случайных, прежде всего внешних причин. Статистические совокупности имеют определенные свойства, носителя-ми которых выступают единицы (отдельные элементы) совокупности (яв-ления), обладающие определенными признаками. Единицы совокупности обладают как правило многими признаками. Признак — свойство единиц совокупности, выражающее их сущность и имеющее способность варьи-ровать, т. е. изменяться. Признаки, принимающие единичное значение у от-дельных единиц совокупности называются варьирующими, а сами значе-ния вариантами.

Важнейшей категорией статистики является статистическая законо-мерность. Под закономерностью вообще принято называть повторяемость, последовательность и порядок изменений в явлениях. Статистическая же закономерность в статистике рассматривается как количественная законо-мерность изменения в пространстве и времени массовых явлений и процес-сов общественной жизни, состоящих из множества элементов (единиц сово-купности). Она свойственна не отдельным единицам совокупности, а всей их массе, или совокупности в целом. Статистическая закономерность — это форма проявления причинной связи, выражающаяся в последовательности, регулярности, повторяемости событий с достаточно высокой степенью ве-роятности, если причины (условия), порождающие события, не изменяются или изменяются незначительно. Статистические закономерности устанав-ливаются на основе анализа массовых данных.

Статистическая совокупность состоит из единиц совокупности. Каждая единица совокупности представляет собой частный случай проявления из-учаемой закономерности. Объединение единиц в совокупность объектив-но обосновано, это не произвол исследователя. В самом деле, не вызывает сомнения объективность существования таких совокупностей, как маши-ностроительные предприятия, продовольственные магазины, население страны и другие, которые изучает социально-экономическая статистика. Как бы далеко друг от друга ни находились единицы каждой из перечис-ленных совокупностей, они взаимосвязаны. В их существовании, взаимос-вязях, развитии формируются соответствующие закономерности и тенден-ции развития машиностроения, торговли продовольственными товарами, воспроизводства населения и его структуры и т. д.

Статистический показатель — это категория отображающая размеры и количественные соотношения признаков социально-экономических яв-лений и их качественной определенности в конкретных условиях места и времени. Следует различать содержание статистического показателя и его конкретное числовое выражение. Содержание, т. е. качественная опреде-ленность состоит в том, что показатели всегда характеризуют социально- экономические категории (население, экономика, финансовые институты

Page 14: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

14

и т. д.). Количественные размеры статистических показателей, т. е. их чис-ловые значения зависят прежде всего от времени и места объекта, который подвергается статистическому исследованию.

Социально-экономические явления как правило не могут быть охаракте-ризованы каким-либо одним показателем, например, уровнем жизни насе-ления. Для комплексной всесторонней характеристики исследуемых явле-ний необходима научно обоснованная система статистических показателей. Такая система не является постоянной. Она постоянно совершенствуется исходя из потребностей общественного развития.

Статистика позволяет выявить и измерить закономерности развития со-циально-экономических явлений и процессов, взаимосвязей между ними. Познание закономерностей возможно лишь в том случае, если изучаются не отдельные явления, а совокупности явлений — ведь закономерности общественной жизни проявляются в полной мере лишь в массе явлений. В каждом отдельном явлении необходимое — то, что присуще всем явлени-ям данного вида, проявляется в единстве со случайным, индивидуальным, присущим лишь этому конкретному явлению. Так, например, реклама ка-кого-либо товара может не оказать влияния на рост объема продажи этого товара, однако обобщение данных о затратах на рекламу товаров и объеме их реализации показывает наличие прямой связи между этими показателя-ми. Поэтому рекламу и называют «двигателем торговли». Закономерности, в которых необходимость неразрывно связана в каждом отдельном явлении со случайностью и лишь во множестве явлений проявляет себя как закон, называются статистическими.

Предметом статистического изучения всегда выступают совокупности тех или иных явлений, включающие все множество проявлений исследуемой закономерности. Статистические совокупности часто называют массовыми явлениями. Они обладают свойством устойчивости — в течение более или менее длительного промежутка времени их характеристики остаются при-мерно постоянными. Так, доля мальчиков и девочек среди новорожденных, доля лиц разных возрастов среди вступающих в брак и т. д. обнаруживает от года к году не очень значительные колебания. Этот факт представляет громадный интерес. Устойчивость определяет возможность существования и развития общества, на этом свойстве базируются прогнозы, скажем, про-гноз пропорций между отраслями и секторами экономики и т. д.

Каждое единичное явление рассматривается статистикой как особый, частный случай изучаемой закономерности. Статистика дает количествен-ную характеристику исследуемой закономерности, а это возможно лишь при обобщении всего множества ее проявлений, взятых в целом, т. е. на ос-нове совокупности явлений. Количественная характеристика каждого от-дельного явления отражает его сущность. Но эта частная характеристика

Page 15: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

15

ограничена в своем значении для познания закономерности, так как сложи-лась в конкретных условиях и в силу этого соединяет в себе как типичные черты, присущие всем явлениям данного вида, так и случайные, присущие именно этой конкретной единице.

Статистика не связана с каким-либо конкретным измерителем. Она ис-пользует как стоимостные, так и натуральные показатели. Для анализа ди-намики стоимостные показатели выражаются не только в текущих ценах, но и в так называемых неизменных ценах, т. е. ценах, установленных за опреде-ленный период или на определенную дату, применяемых в течение ряда лет для оценки продукции в отдельных отраслях материального производства.

Стоимостное выражение позволяет агрегировать данные: например, рас-считывать валовую продукцию предприятия, объединения, отрасли. Уни-версальным измерителем являются затраты труда в человеко-часах, челове-ко-днях и т. д. При обобщении натуральных показателей могут возникнуть трудности из-за несопоставимости данных. Преодолеть их позволяют ус-ловно-натуральные измерители. Например, рыбные консервы выпускаются в больших и маленьких банках, высоких и низких, причем в разные годы соотношение между ними меняется. Для того чтобы подсчитать, сколько всего произведено консервов, сравнить эту цифру с прошлым периодом, ис-пользуют так называемые условные банки. Чтобы обобщить мощность дви-гателей по совокупности предприятий, их выражают в лошадиных силах, а затем суммируют. Топливо разной теплотворной способности пересчиты-вают в условное топливо; скот (коров, быков и т. д.) пересчитывают условно в крупный рогатый скот и т. д.

Несмотря на материальные различия изучаемых статистикой совокуп-ностей, все они имеют общие черты. Социально-экономические явления отличаются особенно сложной природой. В каждом отдельном явлении од-новременно реализуются различные процессы. Например, работник может рассматриваться как член определенной социально-профессиональной груп-пы, представитель коллектива работников предприятия, на котором он тру-дится, составная часть населения того города, поселка, где он живет, и т. д.

Важнейшая особенность «включенности» единиц в разные процессы состоит в том, что как члены той или иной совокупности они выступают лишь в одной связи, в аспекте одного определенного процесса. Так, если из-учаются численность и состав определенной социально-профессиональной группы, работник рассматривается как единица совокупности, образуемой промышленно-производственным персоналом предприятия, и т. д. Таким образом, решение вопроса о единице и границах изучаемой совокупности определяется целью исследования. Если, например, изучается население как основа формирования трудовых ресурсов, то единицей совокупности будет человек, тогда как при изучении потребления населением единицей

Page 16: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

16

является домохозяйство как потребительская ячейка. Многие социально- экономические проблемы носят комплексный характер. Их исследование требует совместного рассмотрения разных совокупностей. Так, изучение процесса воспроизводства населения предполагает анализ всех основных процессов, в которые вовлечен, с одной стороны, человек как единица сово-купности, с другой -семья. Ведь основные характеристики демографическо-го и социального воспроизводства населения зависят не только от структу-ры населения, но и от состава семей: наличия полной брачной пары, детей, их количества, пола, возраста, прочих родственников.

При одной и той же цели исследования особенности решения вопроса о единице и соответственно об изучаемой совокупности зависят еще и от уровня исследования. Можно изучать, например, производительность тру-да на уровне отрасли, отдельного предприятия, цеха, бригады, наконец, от-дельного рабочего. В каждом случае единица совокупности будет особой: предприятие данной отрасли; рабочий данного предприятия, цеха, брига-ды; отработанный человеко-день (или человеко-час) — при изучении вы-работки отдельного рабочего. Уровень исследования определяет круг вы-двигаемых задач, и, наоборот, задачи исследования определяют уровень его организации. В том, как указана единица совокупности, проявляется непосредственная связанность этих вопросов. При исследовании на любом уровне в качестве единиц выступает то явление, в котором реализуется из-учаемая закономерность, наблюдая за которым, можно проследить ее дей-ствие (в той мере, в какой это возможно в единичном явлении).

Такой подход приводит к еще одному определению единицы: единица совокупности — это предел дробления объекта исследования, при котором сохраняются все свойства изучаемого процесса. Иногда бывает довольно трудно логически обосновать единицу совокупности по той причине, что отсутствуют «естественные» пределы дробления. Например, при изучении влияния удобрений на урожайность определенной культуры в качестве еди-ницы может выступать отдельный массив посевов (поле или делянка), бри-гада, сельскохозяйственное предприятие, район и даже республика. Такая многозначность решений возникает, например, если проводить исследова-ние исключительно с точки зрения природных условий. Если же проводить изучение с точки зрения экономических и организационных факторов, то предельным уровнем дробления является сельскохозяйственное предприя-тие (ферма, товарищество, колхоз и т. д.).

Итак, предметом статистического изучения выступают совокупности — множества однокачественных, варьирующих явлений. В это определение входят три основные черты совокупности любых явлений: во-первых, — это множество явлений; во-вторых, — это множество явлений, объединен-ных общим качеством, представляющих собой проявления одной и той же

Page 17: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

17

закономерности; в-третьих, — это множество варьирующих явлений, отли-чающихся по своим характеристикам. Именно последнее свойство вызыва-ет необходимость изучения всего множества явлений одного вида. Если бы единицы совокупности были полностью тождественны друг другу, то не было бы потребности обращаться к множеству единиц: достаточно лишь изучить одну единицу, чтобы знать все о всех явлениях этого вида. Вариа-ция — основа существования мира и источник его развития. Если бы люди не делились на мужчин и женщин, человечество прекратило бы существо-вание; если бы не было различных мнений — истина была бы недостижи-мой, а жизнь без вариаций — невыносимо скучной!

Второй особенностью статистики как науки является то, что она изучает прежде всего количественную сторону общественных явлений и процес-сов в конкретных условиях места и времени, то есть предметом статистики выступают размеры и количественные соотношения социально-экономиче-ских явлений, закономерности их связи и развития. Например, статисти-ка изучает экономические характеристики производства, распределения и потребления, уровень материального благосостояния населения, явления культурной жизни, численность населения земного шара, его распределе-ние по континентам и странам и т. д.. Другим выражением количественной стороны общественной жизни являются числовые соотношения размеров общественных явлений. Количественная определённость — это объектив-ное свойство предмета познания статистикой. Они меняются (варьируются) от одной единицы совокупности к другой в пространстве и времени. Итак, как было уже сказано, статистику к жизни вызывает вариация явлений. Ко-личественную характеристику статистика выражает через определённого рода числа, которые называются статистическими показателями. Статисти-ческий показатель отражает результат измерения у единиц совокупности и совокупности в целом.

Однако чем же тогда статистика отличается от математики? Основная особенность статистики состоит в том, что она изучает количественную сторону качественно определённых массовых общественных явлений в данных условиях места и времени. При этом качественную определён-ность единичных явлений обычно определяют сопряжённые науки. Так, на-пример, статистика изучает смертность как массовое явление, а факт и при-чину смерти устанавливает медицина. Статистический показатель имеет три обязательных атрибута: количественную определённость, место и вре-мя (момент или период времени).

Третья особенность статистики как науки заключается в том, что она характеризует структуру общественных явлений. Структура — это вну-треннее строение массовых явлений, то есть внутреннее строение стати-стического множества. Статистика должна эту структуру обнаружить, вы-разить и отразить с помощью статистических показателей.

Page 18: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

18

Признаки структуры многообразны, и задача статистики — выбрать наиболее существенные и важные признаки, отражающие структуру соци-ально-экономических явлений. Выбор системы признаков предопределя-ется задачами, стоящими на данный момент, и зависит от условий места и времени.

Таким образом, каждому общественному явлению свойственны измене-ния в пространстве и во времени. Изменения в пространстве, то есть в ста-тике, выявляются посредством анализа структуры общественного явления, а изменения уровня и структуры явления исследуются во времени, то есть в динамике. Такова четвёртая особенность статистики как науки. Анализ динамики включает: установление размера уровня общественных явлений на определённые моменты или промежутки времени и среднего уровня; выяв-ление характера изменений за каждый промежуток времени и в целом; опре-деление величины и темпов изменения; установление основной тенденции изменений, их закономерностей и составление статистического прогноза.

Явления общественной жизни взаимосвязаны и взаимообусловлены: из-менение одних явлений предопределяет другие; например, снижение затрат на сырьё и материалы приводит к снижению себестоимости, и наоборот. Поэтому выявление связей является пятой особенностью статистики как науки, так как познание действительности невозможно без познания всех или, по крайней мере, основных взаимосвязей общественных явлений. Наи-большее значение имеет выявление причинно-следственных связей, чтобы воздействовать на общественные явления с целью их изменения в интере-сах общества.

С помощью специальной методологии статистика определяет количе-ственные связи между общественными явлениями. Учитывая выше сказан-ное, сформулируем определение статистики как науки. Статистика — об-щественная наука, которая изучает количественную сторону качественно определённых массовых социально-экономических явлений и процессов, их структуру и распределение, размещение в пространстве, движение во времени, выявляя действующие количественные зависимости, тенденции и закономерности, причём в конкретных условиях места и времени.

Исходя из характера и основных черт предмета, определим следующие познавательные задачи статистики как науки. Это изучение:

- уровня и структуры массовых социально-экономических явлений;- взаимосвязей массовых социально-экономических явлений и процессов;- динамики массовых социально-экономических явлений.

Таким образом, цель статистического исследования, как и любого науч-ного исследования, — раскрытие сущности массовых явлений и процессов, присущих им закономерностей. Отличительной особенностью этих законо-мерностей является то, что они относятся не к каждой отдельной единице

Page 19: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

19

совокупности, а ко всей массе единиц в целом. Общим принципом, лежа-щим в основе исследования статистических закономерностей, выступает так называемый закон больших чисел (ЗБЧ).

Метод статистики (статистическая методология). Под статистиче-ской методологией понимается система принципов и методов их реализа-ции, направленных на изучение количественных закономерностей, прояв-ляющихся в структуре взаимосвязей и динамике социально-экономических явлений. Важнейшими составными элементами метода статистики и ста-тистической методологии являются массовое статистическое наблюдение, сводка и группировка, а также применение обобщающих статистических показателей и их анализ.

Сущность первого элемента статистической методологии составляет сбор первичных данных об изучаемом объекте. Например: в процессе пере-писи населения страны собираются данные о каждом человеке, проживаю-щем на ее территории, которая заносится в специальный формуляр.

Второй элемент: сводка и группировка представляет собой разделение совокупности данных, полученных на этапе наблюдения на однородные группы по одному или нескольким признакам. Например в результате груп-пировки материалов переписи населения делится на группы (по полу, возра-сту, населению, образованию и т. д.).

Сущность третьего элемента статистической методологии заключа-ется в вычислении и социально-экономической интерпретации обобщаю-щих статистических показателей: абсолютных и относительных величин, средних величин и показателей вариации, исследование корреляции связей, проведение дисперсионного и регрессионного анализа взаимосвязанных показателей, расчет показателей динамики, индексов и т. д.. Три основных элемента статистической методологии составляют также три стадии любо-го статистического исследования.

Актуальность и значимость статистики особенно возросли на современ-ном этапе. Существенное изменение общественной и социально-экономи-ческой жизни России вызвало потребность в коренном совершенствовании социально-экономической статистики, комплексном пересмотре всей систе-мы учёта и статистики в стране, а также необходимость расширения воз-можности получения объективной аналитической информации о состоянии и развитии социально-экономических процессов для принятия решения на всех уровнях управления, обеспечения международной сопоставимости ре-зультатов государственных статистических наблюдений, внедрения надна-циональных стандартов в статистическую практику.

Page 20: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

20

Основными задачами статистики в условиях развития в России рыноч-ных отношений являются следующие:

1. Совершенствование учета и отчетности и сокращение на этой основе документооборота.

2. Усиление работы по контролю за достоверностью статистической ин-формации, предоставляемой предприятиям, учреждениям и организациям всех отраслей экономики и форм собственности.

3. Повышение своевременности статистической информации как в по-ступающий статистический орган, так и предоставляемые ими структуры государственной власти и управления.

4. Углубление аналитических функций, разрабатываемых статистиче-ских данных, формирование тематики проводимых статистических в соот-ветствии с текущими задачами социально-экономическом развитии страны.

5. Дальнейшее развитие и совершенствование статистической методоло-гии на основе все более широкого внедрения ПЭВМ в практику статистиче-ского анализа и прогнозирования.

Контрольные вопросы и задания1. Что означает термин «статистика»?2. Чем обусловлено возникновение и развитие статистической практики и науки?3. Что является предметом исследования статистической науки? Приведите приме-

ры явлений общественной жизни , изучаемой статистикой.4. В чем состоит специфика предмета статистического изучения?5. Дайте определение статистического показателя и укажите их виды.6. В чем заключается сущность статистической методологии?7. Каковы особенности статистического метода исследования?8. Перечислите стадии статистического исследования и раскройте их основное со-

держание.9. Какова роль и значение математики в статистическом исследовании?10. Перечислите части (разделы) статистической науки и объясните, чем вызвано

выделение самостоятельных статистических дисциплин.11. Каковы принципы организации статистики в России в настоящее время?12. Какие задачи стоят перед государственной статистикой России?13. Назовите организацию, возглавляющую статистическую деятельность в Россий-

ской Федерации.14. Каковы задачи ведомственной статистики и чем объясняется возрастание ее роли

в современных условиях?15. Назовите основные этапы в организации государственной статистики в России.16. Перечислите основные функции Федеральной службы государственной стати-

стики (Росстат).

Page 21: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

21

Тема 2. Статистическое наблюдение

Формирование информационной базы статистического исследо-вания. Этапы статистического наблюдения. Программно-методоло-гические и организационные вопросы статистического наблюдения.

Виды статистического наблюдения и их особенности. Источни-ки, методы и способы собирания статистических сведений. Объект наблюдения. Программа наблюдения. Инструментарий наблюдения и контроль результатов наблюдения. Методы проверки достоверно-сти статистических данных.

Понятие о выборочном наблюдении и его теоретические основы. Простая случайная выборка. Репрезентативность выборки. Виды вы-борочного наблюдения. Определение ошибки выборочной средней и частоты при разных видах выборки и способах отбора.

Определение необходимой численности выборки. Малые выбор-ки. Закон распределения Стьюдента. Статистическая проверка гипо-тез (общие понятия. выбор критической области). Проверка гипотезы о принадлежности «выделяющихся» наблюдений исследуемой гене-ральной совокупности. Элементы дисперсионного анализа. Различ-ные формы организации выборочного наблюдения. Практика приме-нения выборочного метода наблюдения.

Статистическое исследование включает в себя три этапа или стадии:- cтатистическое наблюдение;- первичная обработка, сводка и группировка результатов наблюдения;- анализ сводных данных с помощью обобщающих показателей и осо-

бых приемов (методов).Статистическое наблюдение — это массовое, планомерное, научно ор-

ганизованное наблюдение за явлениями социальной и экономической жиз-ни, которое заключается в регистрации отобранных признаков у каждой единицы совокупности.

Примером статистического наблюдения являются опросы общественно-го мнения, которые особенно популярны стали в России в последние годы. Такое наблюдение принимается с целью выявления отношения людей к не-которым представляющим интерес вопросам или спорным событиям. Изу-чение общественного мнения входит в основу общей системы исследования рынка и является его важной составной частью. Такое наблюдение требует опроса ряда лиц по заранее определенной программе.

Статистическое наблюдение может проводиться органами государствен-ной статистики, научно-исследовательскими институтами, экономически-ми службами банков, бирж, фирм.

Page 22: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

22

Процесс проведения статистического наблюдения включает следующие этапы:

- подготовка наблюдения;- проведение массового сбора данных;- подготовка данных к автоматизированной обработке;- разработка предложений по совершенствованию статистического на-

блюдения.Любое статистическое наблюдение требует тщательной, продуманной

подготовки. От нее во многом будут зависеть надежность и достоверность информации, своевременность ее получения. Подготовка статистического наблюдения — процесс, включающий разные виды работ. Сначала необхо-димо решить методологические вопросы, важнейшими из которых являют-ся определение цели и объекта наблюдения, состава признаков, подлежащих регистрации; разработка документов для сбора данных; выбор отчетной единицы и единицы, относительно которой будет проводиться наблюде-ние, а также методов и средств получения данных. Кроме методологиче-ских необходимо решить проблемы организационного характера, например определить состав органов, проводящих наблюдение; подобрать кадры для проведения наблюдения; составить календарный план работ по подготовке, проведению и обработке материалов наблюдения; провести тиражирование документов для сбора данных.

Проведение массового сбора данных включает работы, связанные не-посредственно с заполнением статистических формуляров. Он начинается с рассылки переписных листов, анкет, бланков, форм статистической отчет-ности и заканчивается их сдачей после заполнения в органы, проводящие наблюдение. Собранные данные на этапе их подготовке к автоматизирован-ной обработке подвергаются арифметическому и логическому контролю. Оба эти контроля основываются на знании взаимосвязей между показате-лями и качественными признаками.

На заключительном этапе проведения наблюдения анализируются при-чины, которые привели к неверному заполнению статистических бланков, и разрабатываются предложения по совершенствованию наблюдения. Это очень важно для организации будущих обследований.

Получение сведений в ходе статистического наблюдения требует нема-лых затрат финансовых и трудовых ресурсов, а также времени. По форме организации статистическое наблюдение может быть проведено через от-четность и специально организованные обследования, среди которых важ-нейшими являются переписи, отражающие состояние изучаемой совокуп-ности на определенный момент времени. Дата, на которую регистрируются факты, называется критическим моментом. Период, в течение которого проводится сбор данных, называется временем наблюдения. Информация

Page 23: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

23

может быть получена разными способами: путем непосредственного изме-рения (подсчета, взвешивания и т. д.), путем опроса и пр.

По охвату единиц наблюдаемого объекта наблюдение может быть сплошным (когда обследуются все единицы совокупности) и несплошным, которое может организовано как исследование основного массива, анкет-ное, выборочное или монографическое.

Программно-методологические и организационные вопросы стати-стического наблюдения. Цель наблюдения. Статистические наблюдения чаще всего преследуют практическую цель — получение достоверной ин-формации для выявления закономерностей развития явлений и процессов. Например, целью микропереписи населения России в 1994 г. было получе-ние данных о численности, составе населения, условиях его проживания. Задача наблюдения предопределяет его программу и формы организации. Неясно поставленная цель может привести к тому, что в процессе наблю-дения будут собраны ненужные данные или, наоборот, не будут получены сведения, необходимые для анализа.

Объект и единица наблюдения. Отчетная единица. При подготовке на-блюдения кроме цели следует точно определить, что именно подлежит об-следованию, т. е. установить объект наблюдения. Под объектом наблюдения понимается некоторая статистическая совокупность, в которой протекают исследуемые социально-экономические явления и процессы. Например, со-вокупность физических лиц, физические лица, юридические лица. Едини-цей наблюдения называют составной элемент объекта, являющийся носи-телем признаков, подлежащих регистрации. Отчетной единицей выступает объект, от которого поступают данные об единице наблюдения.

Программа статистического наблюдения. Всякое явление обладает множеством различных признаков. Собирать информацию по всем призна-кам нецелесообразно, а часто и невозможно. Поэтому необходимо отбирать те признаки, которые являются существенными для характеристики объ-екта исходя из цели исследования. Для определения состава регистрируе-мых признаков разрабатывают программу наблюдения. Программа наблю-дения — это перечень признаков (или вопросов), подлежащих регистрации в процессе наблюдения. От того, насколько хорошо разработана программа статистического наблюдения, во многом зависит качество собранной ин-формации.

Организационные вопросы статистического наблюдения включают в себя решение таких важных моментов, как определение:

- субъекта наблюдения;- места и времени наблюдения;- организационной формы, вида и способа наблюдения.

Page 24: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

24

Определение субъекта наблюдения сводится к решению вопроса о том, кто будет осуществлять наблюдение: специальные органы, общественность или все население, которому счетчики раздают опросные листы а затем со-бирают заполненными (саморегистрация). Выбор места и времени проведе-ния обследования зависит главным образом от цели наблюдения. Органи-зационная форма, вид и способ наблюдения (экспедициооный, явочный или иной) выбираются в зависимости от наличных ресурсов и их соответствия потребностям и целям наблюдения.

Требования к качеству материалов наблюдения, проводимых государ-ственными органами, определяются нормами Федерального закона «Об официальном статистическом учете и системе государственной статистики в Российской Федерации» и состоят в обеспечении достоверности, полноты, сопоставимости и своевременности материалов наблюдения.

Достоверность означает соответствие зарегистрированной информации реальным фактам. Отклонения данных наблюдения от действительных фак-тов называются ошибками регистрации, которые могут носить случайный и систематический характер.Случайные ошибки взаимно погашаются, суще-ственно не искажая итоговые показатели. Систематические ошибки (особен-но преднамеренные) могут значительно исказить показатели и потому под-лежат сокращению в процессе совершенствования учета и статистики. При несплошных наблюдениях возникают ошибки репрезентативности, расчет которых составляет содержание важнейших подготовительных и заключи-тельных статистических работ при организации выборочного наблюдения.

Принцип полноты материалов предполагает охват наблюдением всех на-меченных к обследованию единиц наблюдения и получение ответов на все вопросы программы. Если не обеспечена полнота учета, то возможна кор-ректировка итогов путем «досчета».

Сопоставимыми являются материалы наблюдения, полученные по еди-ной методике, по одинаковому кругу единиц, за одни и те же сроки, на од-ной и той же территории. Для приведения данных к сопоставимому виду необходимо все несоответствия устранить путем расчета относительных величин или смыкания рядов совокупностей.

Принцип своевременности означает необходимость проведения наблю-дения и предоставления пользователям сводных итогов в такие сроки, в пре-делах которых информация не устаревает, сохраняет актуальность и отве-чает потребностям пользователя. В целях обеспечения методологического единства статистических работ Росстат разрабатывает и публикует методи-ческие комплексы для различных видов наблюдения, соблюдение которых является обязательным.

Page 25: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

25

Выборочное наблюдение. Суть выборочного наблюдения заключается в том, что из генеральной совокупности (количества единиц N) случайно отбирается n единиц, составляющих выборочную совокупность. Для ото-бранных единиц рассчитываются обобщенные характеристики (средние или относительные показатели), а затем результаты выборочного обследо-вания распространяются на всю генеральную совокупность.

Проведение статистического наблюдения на выборочной основе позво-ляет решать задачи:

- обеспечение значительной экономии затрат труда, времени, материаль-ных и финансовых ресурсов при сборе первичных данных;

- уменьшение информационной нагрузки на респондентов;- сокращение количества ошибок регистрации;- привлечение к работе персонала более высокой квалификации;- получение данных по объектам, по которым сплошное наблюдение не-

возможно (например, невозможно провести лабораторный анализ качества всей массы полезных ископаемых в разведанном месторождении).

Виды выборочного наблюдения могут быть классифицированы по ряду признаков:

- по единицам отбора — (единица наблюдения и серия (гнездо));- по повторности отбора — (бесповторная и повторная);- по способу отбора единиц — (собственно случайный и систематический);- по типам (стратам) — (стратифицированная и нестратифицированная);- по числу ступеней — (одноступенчатая и многоступенчатая);- по фазам выборки — (однофазная и многофазная);- по взаимопроникновению — без взаимопроникновения и взаимопрони-

кающая).Основной задачей при выборочном наблюдении является определение

ошибок выборки, то есть возможных расхождений между выборочной сред-ней и генеральной средней. Различают среднюю и предельную ошибки вы-борки. Средняя ошибка выборки (μ) характеризует среднюю величину рас-хождения между выборочной и генеральной средней и представляет собой по форме и содержанию среднее квадратическое отклонение возможных значений выборочной средней от генеральной.

В математической статистике доказано, что средняя ошибка выбороч-ной средней при повторном отборе определяется по формуле:

где σ 2 — дисперсия изучаемого показателя в генеральной совокупности; n — объем (численность) выборки.

nσµ

2=

Page 26: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

26

При бесповторном отборе формула приобретает вид:

)1(2

Nn

n−= σμ ,

где N — численность генеральной совокупности. Следовательно, средняя ошибка выборки зависит от дисперсии изу-

чаемого признака (прямо пропорциональна, чем больше вариация, тем больше ошибка) и объема выборки (чем она меньше абсолютно и относи-тельно (по доле в генеральной совокупности), тем больше ошибка.

Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки.

)1(2

Nn

ntt −==Δ σμ — (для бесповторного отбора);

ntt σμ ==Δ — (при повторном отборе),

где ∆ — предельная ошибка выборки; μ — средняя ошибка выборки; t — коэффициент доверия, то есть показатель, зависящий от вероятности (P), с которой предельная ошибка определяется.

Согласно закону нормального распределения вероятность P может быть найдена как функция от t с помощью интеграла Лапласа, значения ко-торого приводятся в учебниках [1,9,13]. Так, при t = 1 вероятность P = 0,683. Это означает, что с вероятностью 0,683 (или 68,3%) можно гарантировать, что отклонение генеральной средней от выборочной не превысит однократ-ной средней ошибки μ, то есть что в генеральной совокупности среднее зна-чение признака (xг ) будет находиться в пределах Δ+≤≤Δ− xxx ~~ , то есть μμ +≤≤− xxx ~~ .

При t = 2 вероятность P =0, 954. Это означает, что с вероятностью 0,954 (или с ошибкой менее 5 %) можно гарантировать, что отклонение ге-неральной средней (xг) от выборочной (xв) не превысит двукратной средней ошибки 2μ, то есть что в генеральной совокупности среднее значение при-знака (xг ) будет находиться в пределах μμ 2~2~ +≤≤− xxx .

При t = 3 вероятность P =0, 998. Это означает, что с вероятностью 0,998 (или ошибкой менее 1 %) можно гарантировать, что отклонение ге-неральной средней от выборочной не превысит трехкратной средней ошибки μ, то есть что в генеральной совокупности среднее значение при-знака (xг ) будет находиться в пределах μμ 3~3~ +≤≤− xxx .

Наряду с абсолютной величиной предельной ошибки в статистиче-ской практике рассчитывается относительная ошибка — процентное от-ношение абсолютной ошибки к исследуемому показателю (средней вели-

чине x~ ): %100~xабс

отнΔ=Δ

Page 27: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

27

Выборка считается репрезентативной, если относительная предельная ошибка не превышает 5 %.

Если n < 20, то выборка считается малой, и при определении пре-дельной ошибки необходимо учитывать два момента. Во-первых, в форму-ле средней ошибки в знаменателе принимается не n, а n-1. Во-вторых, при нахождении вероятности допуска той или иной ошибки и определении до-верительных интервалов исследуемого показателя в генеральной совокуп-ности пользуются таблицами вероятности Стьюдента, приводимыми в учебниках [1, 13 и др.], где P = S (t,n) определяется в зависимости от объ-ема выборки n и коэффициента доверия t.

Формулы предельной ошибки позволяют решить три задачи: 1. Определить доверительные пределы для генеральной средней (или

другого показателя, например, доли w): μμ txxtx +≤≤− ~~ ; или μμ twxtw +≤≤− .

2. Определить вероятность P допуска той или иной заданной предель-ной ошибки Δ . В этом случае определяется t как отношение предельной ошибки Δ к средней ошибке μ и по таблицам вероятностей (в зависимости от t и n) находится вероятность P.

3. Определить необходимую численность выборки (n), обеспечиваю-щую заданную точность с определенной вероятностью. Формула для n оп-ределяется из соответствующих формул для предельной ошибки. Напри-мер, для определения средней x~ из формулы предельной ошибки имеем:

Δ=

2

22σtn — при повторном отборе;

σσ

222

22

tNtNn+Δ

= — при бесповторном отборе.

Рассмотрим решение задач с применением предельной ошибки вы-борки.

Задача 1. Методом собственно случайной выборки обследована жир-ность молока у 100 коров. По данным выборки средняя жирность оказа-лась равной 3,64 %, а дисперсия составила 2,56. Определить: а) среднюю ошибку выборки; б) с вероятностью, равной 0.9545, предельные значения генеральной средней.

Решение.

А. По условию n =100, σ 2 = 2,56 и формуле n

t σμ = получим:

μ = 100:56,2 = 1,6:10 = 0,16 %. Б. По приложению 2 в [13] для значения вероятности P =0.9545 нахо-

дим, что t равно 2. Отсюда t μ = 2 × 0,16 = 0, 32 или 3,64 - 0.32 ≤ x ≤ 3,64 + 0.32.

Page 28: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

28

Следовательно, предельные значения жирности молока (или довери-тельный интервал генеральной средней) находятся в пределах от 3.32 % до 3,96 %.

Задача 2. Сколько рабочих завода нужно обследовать в порядке слу-чайной выборки для определения средней заработной платы, чтобы с веро-ятностью, равной 0.954, можно было гарантировать ошибку не более 50 руб.? Предполагаемое среднее квадратическое отклонение заработной пла-ты σ = 200 руб.

Решение. Для Р= 0,954, t = 2. Рассчитаем n по формуле Δ

=2

22σtn =22

× 2002 : 502=64 человека. Следовательно, нужно обследовать в порядке случайной выборки для

определения средней заработной платы всех рабочих завода всего 64 чело-века, чтобы с вероятностью, равной 0.954, можно было гарантировать ошибку не более 50 руб.

Контрольные вопросы и задания

1. В чем состоит роль статистического наблюдения в комплексном экономико-статистическом исследовании?

2. В чем состоят задачи статистического наблюдения? 3. Какие существуют источники и способы сбора статистических данных? 4. Каковы основные направления реконструкции статистического наблюдения

с целью совершенствования информационной базы статистики? 5. Назовите основные программно-методологические вопросы статистического на-

блюдения. 6. Какие требования предъявляются к материалам статистического наблюдения? 7. Какие задачи призваны решать экономические переписи? 8. Поставьте цель, определите объект, единицу наблюдения, конкретные признаки.

Составьте программу специального статистического наблюдения. 9. Какое наблюдение называется выборочным? 10. Назовите задачи выборочного наблюдения? 11. Что характеризует средняя ошибка выборки? 12. Какие задачи решаются при использовании выборочного наблюдения? 13. Что может служить основой формирования выборки: а) предприятий, организа-

ций; б) домохозяйств; в) взрослого населения? 14. Как определяется предельная ошибка выборки? 15. Как определить объем (необходимую численность) выборки? 16. Назовите важнейшие области применения выборочного метода в практике госу-

дарственной статистики. 17. Перечислите виды выборочного наблюдения.

Page 29: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

29

Тема 3. Сводка и группировка статистических материалов

Задачи и значение сводки. Статистические показатели как ин-струмент сводки. Системы показателей. Порядок проведения, ос-новные этапы, организация и техника сводки. Статистические та-блицы и их виды.

Виды и задачи группировок. Понятия группировочных призна-ков и системы группировок. Техника выполнения группировки. Интервалы при группировках и их виды. Границы интервалов.

Графическое представление статистических данных. Основные виды графических изображений. Приемы графического изображе-ния структуры совокупности, распределения, взаимосвязи между явлениями, изменения явлений во времени, территориальных срав-нений.

Вторым этапом статистического исследования и одним из основных и наиболее распространенных методов обработки и анализа первичной ста-тистической информации является сводка и группировка данных.

Статистическая сводка — это научно организованная обработка ма-териалов наблюдения, включающая в себя систематизацию, группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет производных показателей.

Основные задачи статистической сводки следующие:- обработать данные статистического наблюдения;- дать характеристику всей совокупности фактов при помощи обобщаю-

щих показателей.Cтатистическая сводка включает этапы:- предварительный контроль материалов;- группировка показателей по заданным признакам, определение произ-

водных показателей (определение группировочного признака; выбор числа групп; отбор экономически зависимых между собой показателей для характе-ристики выделенных групп и подгрупп явлений и объекта изучения в целом);

- составление таблиц и графиков (разработка макетов статистических таблиц и выбор видов графиков).

Результатом сводки является система взаимосвязанных обобщающих показателей. Под статистическим показателем понимается числовая ха-рактеристика, относящаяся к совокупности в целом или к какой-либо ее части, полученная путем агрегирования материалов статистического на-блюдения с применением научно обоснованных методов и алгоритмов их расчета. Важнейшие принципы проведения сводки:

- расчет обобщающих показателей производится в пределах группы од-нородных единиц совокупности;

Page 30: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

30

- для раскрытия изучаемой закономерности необходимо рассчитать си-стему взаимосвязанных показателей;

- должна быть обеспечена сопоставимость показателей системы, что предполагает их методологическое единство, единые хронологические и территориальные границы;

- система должна включать необходимый и достаточный для познания закономерности круг показателей.

Основные виды статистических показателей, разграничиваемые по сле-дующим основаниям:

- по характеру решаемых задач (средние величины; показатели доли группы в общей совокупности; показатели вариации; индексы; показатели динамики; показатели корреляции, регрессии и других индикаторов взаи-мосвязей факторных и результативных признаков);

- по методике расчета (абсолютные и относительные величины);- по степени сложности применяемых методов (методы описательной

статистики и эконометрические методы);- по ориентации во времени (параметры прошлого периода, текущего со-

стояния и прогноз на предстоящий период);- по степени объективности (объективная документированная статисти-

ческая информация, экспертные оценки специалистов, опрос мнений насе-ления и должностных лиц, показатели, полученные путем косвенных рас-четов).

Статистическую сводку можно классифицировать по ряду признаков (табл. 1):

- по глубине материала (простая или сложная);- по форме обработки материалов (централизованная или децентрализо-

ванная);- по технике выполнения (автоматизированная или ручная).Виды сводок статистического наблюдения приведены в табл. 1.Основным и важнейшим моментом сводки является группировка, т. е.

объединение статистических данных в однородные по определенным при-знакам группы. Статистическая группировка это разделение единиц изу-чаемой совокупности на качественно однородные группы по значениям од-ного или нескольких признаков в целях выделения типов явлений, изучения их структуры и взаимосвязи.

Задачи, решаемые с помощью метода группировок:- выделение социально-экономических типов явлений;- изучение структуры явления и структурных сдвигов, происходящих в нем;- выявление связи и зависимости между явлениями.

Page 31: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

31

Таблица 1.Виды сводок статистического наблюдения

Вид сводки Характеристика

Простая Операция подсчета общих итогов по совокупности единиц наблюдения

Сложная

Комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов в виде статистических таблиц

ЦентрализованнаяСводка, при которой весь первичный материал поступает в одну организацию, подвергается в ней обработке от начала до конца

ДецентрализованнаяОтчеты предприятий сводятся статистическими органами субъектов РФ, а полученные итоги обрабатываются Росстатом и определяются обобщающие показатели по стране

Механизированная Сводка, при которой все операции осуществляются с помощью компьютера

Ручная Сводка, при которой все операции осуществляются вручную

В соответствии с этими задачами различают три вида группировки:- типологическая — разбивка разнородной совокупности на качествен-

но однородные группы и выявление на этой основе экономических типов явлений;

- структурная — группировка, которая предназначена для изучения со-става однородной совокупности по какому-либо варьирующему признаку или нескольким признакам;

- аналитическая — группировка, выявляющая взаимосвязи между из-учаемыми признаками. Особенности аналитической группировки: едини-цы группируются по факторному признаку, каждая группа характеризуется средними величинами результативного признака.

Особой разновидностью типологической группировки являются обще-российские классификаторы.

Построение статистических группировок осуществляется в следующем порядке:

- выбор группировочного признака;- определение числа групп;- расчет ширины интервала;- определение признаков, которые в комбинацииГруппировочным называется признак, по которому осуществляется раз-

биение единиц совокупности на отдельные группы. В качестве группиро-вочного могут выступать как количественные, так и качественные признаки (альтернативные, атрибутивные или порядковые). Если признак количе-ственный, то число групп зависит от степени вариации группировочного

Page 32: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

32

признака: чем она больше, тем больше можно образовать групп. Если при-знак атрибутивный, то число групп определяется числом градаций атри-бутивного признака (например, группировка населения по полу предпола-гает только две группы).

По способу построения группировки бывают простые и комбинацион-ные. Если в основание группировки положен один признак, то группировка называется простой, если несколько — сложной: комбинационной и много-мерной. Комбинационные группировки строятся путем разбиения груп-пы на подгруппы в соответствии с дополнительными признаками. Много-мерные группировки формируются с помощью специальных алгоритмов, когда определяются скопления в N-мерном пространстве, где каждый объ-ект — точка.

После того как определено основание группировки, решается вопрос о количестве групп, на которые необходимо разбить изучаемую совокуп-ность. Число групп зависит:

- от задач исследования;- от группировочного признака;- от объема совокупности;- от степени вариации группировочного признака.Если основанием группировки служит количественный признак, то для

определения количества групп (группировка с равными интервалами) мож-но воспользоваться формулой американского ученого Стерджесса:

n=1+3,322 lgN,где n — число групп;N — число единиц совокупности.Когда определено число групп, то следует установить интервалы груп-

пировки. Интервал группировки это значения варьирующего признака, лежащие в определенных границах. Интервал имеет величину (ширину), верхнюю и нижнюю границы или хотя бы одну из них. Нижняя граница интервала — это минимальное значение признака, верхняя граница — наибольшее значение признака в интервале. Величина интервала {шири-на) представляет собой разность между верхней и нижней границами ин-тервала.

В зависимости от величины интервалы группировки бывают равные и неравные, в зависимости от наличия границ — открытые и закрытые (табл. 2).

Page 33: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

33

Таблица 2Виды интервалов группировки

Интервал ХарактеристикаРавный Применяется в тех случаях, когда вариация признака происходит

в сравнительно узких границах более или менее равномерноНеравный Применяется в тех случаях, когда размах вариации признака

в совокупности велик и значения признака варьируют неравномерно. Неравные интервалы делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные

Открытый Интервал, у которого указана только одна граница: верхняя — у первого, нижняя — у последнего

Закрытый Интервал, у которого есть верхняя и нижняя границы

Формула для определения величины равного интервала группы имеет вид:

где h — величина (ширина) интервала группы; n — числа групп; minmax, XX — максимальное и минимальное значения признака в cовокупности.

При нахождении величины интервала следует учитывать определенные правила:

1. Если величина интервала, рассчитанная по формуле (2), имеет один знак до запятой (например, 0,7; 0,58; 2,359), то полученное значение следует округ-лить до десятых (в приведенном примере это будут значения 0,7; 0,6; 2,4);

2. Если величина интервала, рассчитанная по формуле (2), имеет две зна-чащие цифры до запятой и несколько после запятой (например, 11,2; 23,385), то это значение следует округлить до целого числа (в указанном примере это будут значения 11; 23);

3. Если величина интервала, рассчитанная по формуле, представляет со-бой трехзначное число (например, 123; 757), то это значение целесообразно округлить до ближайшего числа, кратного 10 (в приведенном примере это будут значения 120; 760);

4. Если интервалы групп закрытые и основанием группи ровки слу-жит непрерывный признак, то нижняя граница формируется по принципу «включительно», а верхняя — по принципу «исключительно» (например, если нижняя граница i — группы равна 50, а верхняя — 100, то единица совокупности со значением признака, равным 100, попадет в группу i + 1);

5. Если значение признака совпадает с границами интерва лов, то можно использовать открытые интервалы, введя слова «до», «менее» и «более»;

6. Если в основании группировки лежит дискретный признак, то верх-няя граница i-гo интервала равна нижней границе (i + 1) -го интервала, уве-личенной на 1.

,minmax

nXXh −

=

Page 34: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

34

Статистический ряд распределения. Для изучения структуры той или иной совокупности строят статистические ряды распределения, ха-рактеризующие распределение единиц совокупности по одному признаку. Статистический ряд распределения это упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирую-щему признаку. В зависимости от признака, положенного в основу образо-вания ряда распределения, различают атрибутивные и вариационные. Сле-довательно, бывают следующие виды рядов распределения:

- атрибутивные (группы строятся по качественному признаку);- вариационные (группы строятся по количественному признаку);- дискретные (группы строятся по признаку, изменяющему дискретно);- интервальные (группы строятся по признаку, принимающему в опре-

деленном интервале любые значения).В ряду распределения отличают элементы:- варианты (обозначаются x, xi) — отдельные возможные значения при-

знаков;- частоты (обозначаются f, fi или m, mi) — числа, которые показывают,

насколько часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем.

Частоты, выраженные в долях единицы или в процентах к итогу, назы-ваются частостями (обозначаются w, wi); соответственно сумма частостей равна 1, или 100 %.

Вариационные ряды могут быть построены по самым разным объектам. Так, объектом распределения могут служить и временные периоды (меся-цы, годы) и территориальные единицы.

Графическое изображение рядов распределения позволяет наглядно представить их характеристики. Вариационные ряды изображают с помо-щью полигона (преимущественно дискретные) и гистограммы (интерваль-ные ряды). Для построения полигона и гистограммы используется прямоу-гольная система координат, на оси абцисс которой строится шкала значений вариантов (или их интервалы), а на оси ординат-частот или частостей. Ана-лиз рядов распределения сопровождается их графическим изображением. Именно по графикам можно судить о форме распределения. Для этой цели строят полигон, кумуляту, гистограмму и огиву распределения.

Полигон — ломаная кривая, строящаяся на основе прямоугольной си-стемы координат, когда по оси X откладываются значения варьирующего признака, а по оси У — частоты или частости. Полигон используется при изображении дискретных вариационных рядов. При помощи кумуляты изображается ряд накопленных частот, которые определяются путем после-довательного суммирования частот по группам. Накопленные частоты по-казывают, сколько единиц совокупности имеют значения признака не боль-ше, чем рассматриваемое значение.

Page 35: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

35

Исходные данные примера построения таблицы распределения семей по числу детей приведены в табл. 3, соответствующие графики (полигон и ку-мулята) на рис. 1 и 2.

Таблица 3.Распределение семей по числу детей

Группы семей по числу детей Численность семей, % к итогу Накопленные частости, % 0 20,5 20,51 38,6 59,1 2 27,4 86,53 8,3 94,8

4 и более 5,2 100,0 Итого 100,0

Если при графическом изображении вариационного ряда в виде кумуля-ты оси поменять местами, то получим огиву.

Гистограмма применяется для изображения интервального вариацион-ного ряда. При построении гистограммы на оси абсцисс откладываются ве-личины интервалов, а частоты изображаются прямоугольниками, постро-енными на соответствующих интервалах (табл. 4, рис. 3).

Рис. 1. Полигон распределения семей по числу детей

Page 36: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

36

Таблица 4.Распределение рабочих по стажу работы

Группы рабочих по стажу работы, лет Численность рабочих, в % к итогу0-5 4,8 5-10 10,2 10-15 18,4 15-20 23,6 20-25 29,1 25-30 10,3

30 и более 3,6 Итого 100,0

Рис. 2. Кумулята распределения семей по числу детей

Рис. 3. Гистограмма распределения рабочих по стажу работы

Page 37: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

37

Гистограмма может быть преобразована в полигон распределения. Для этого середины верхних сторон прямоугольников необходимо соединить прямыми линиями.

Результаты сводки и группировки материалов статистического наблю-дения, как правило, оформляются в виде таблиц.

Статистические таблицы. Статистическая таблица это форма рацио-нального и наглядного изложения результатов сводной обработки матери-алов статистического наблюдения. Основные элементы статистической та-блицы:

- подлежащее — объект исследования (перечень единиц статистической совокупности или их групп по каким-либо признакам);

- сказуемое — система показателей, которыми характеризуется объект исследования, т. е. подлежащее.

Подлежащее обычно располагается в левой части таблиц, сказуемое — в верхней части таблицы в виде названия граф (столбцов) (табл. 5). Вид ста-тистической таблицы зависит от построения подлежащего. Различают сле-дующие виды статистических таблиц:

- простые (в подлежащем дается перечень каких-нибудь объектов или территориальных единиц);

- групповые (подлежащее, т. е. объект исследования, подразделяется на группы по какому-либо одному признаку);

- комбинационные (подлежащее разделяется на группы по двум и более признакам).

Таблица 5.Основа статистической таблицы

Содержание строк Наименование граф (верхние заголовки) Итоговая графа А 1 2 . . . n-1 n

Наименование строк (боковые заголовки) Итоговая строка

Разработка сказуемого таблицы, может быть, простой и сложной. Про-стая разработка сказуемого означает последовательное перечисление по-казателей, характеризующих подлежащее. При сложной разработке ска-зуемого признаки, характеризующие подлежащее, берутся в сочетании, комбинации. Основными приемами, определяющими технику формирова-ния статистических таблиц, являются следующие:

1. Цифровой материал необходимо излагать таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением строк слева на-право и сверху вниз.

2. Заголовок таблицы и названия граф и строк должны быть четкими, краткими, лаконичными, представлять собой законченное целое, органично

Page 38: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

38

вписывающееся в содержание текста.В названии таблицы должны найти отражение объект, признак, время, и место совершения события.

3. Информация, располагаемая в столбцах (графах) таблицы, завершает-ся итоговой строкой.

4. Графы и строки должны содержать данные, соответствующие постав-ленным в подлежащем и сказуемым показателям.

5. Числа целесообразнее по возможности округлять. Округление чисел в пределах одной и той же графы или строки следует проводить с одинако-вой степенью точности.

Анализ статистических таблиц проводится в двух направлениях:- структурный анализ (совокупности и единиц наблюдения, формирую-

щих ее; признаков и их комбинации, формирующих подлежащее и сказуе-мое таблицы, вида таблицы, решаемых задач);

- содержательный анализ (анализ отдельных групп подлежащего по со-отвествующим признакам сказуемого, выявление соотношений и пропор-ций между группами явлений по признакам, сравнительный анализ и фор-мулировка выводов, установление закономерностей и определение резервов развития изучаемого объекта).

Анализ признаков и групп необходимо начинать с изучения абсолют-ных величин, затем связанных с ними относительных величин.

Анализ данных таблиц может быть дополнен расчетными относитель-ными и средними величинами, графиками, диаграммами и т.д., если этого требуют задачи исследования.

Графический метод в статистике. Графиком в статистике называется условные изображения статистических данных в виде различных геометри-ческих образов (точек, линий, фигур и т. д.). Главное достоинство графиков — наглядность — используется в целях:

а) популяризации данных и облегчения их восприятия неспециалистами;б) обобщения и анализа статистических данных;в) контроля точности расчетов и вычислений.

В настоящее время в связи с внедрением в практику статистической рабо-ты математических методов и современных компьютеров графики строят-ся с использованием пакетов прикладных программ компьтерной графики. Наиболее распространенными пакетами прикладных программ являются: Excel, Stat Graff, Super call, Hazard graphics и др.

Существуют общие правила построения графиков [9, c. 65–68]. Каждый график состоит из графического образа и вспомогательных элементов:

а) экспликация графика– словесное описание содержания графика (за-головок, подписи вдоль масштабных шкал и пояснения к отдельным частям);

б) пространственные ориентиры — системы координатных сеток;в) масштабные ориентиры, определяемые масштабом графика (мерой

Page 39: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

39

перевода числовой величины в графическую) и системой масштабных шкал (линии, отдельные точки которой могут быть прочитаны как определенные числа): прямолинейных и криволинейных (дуговых и круговых);

г) поле графика, характеризующееся форматом (размером и пропорци-ями) — пространство, в котором размещаются образующие график геоме-трические знаки;

Графический образ (основа графика) — это геометрические знаки, то есть совокупность точек, линий фигур, с помощью которых изображаются статистические показатели.По форме графического образа статистические графики бывают [9, c. 65–68]:

- линейные (статистические кривые);- плоскостные (секторные и фигурные; полосовые; столбиковые и ква-

дратные; круговые; фоновые и точечные);- объемные (поверхностные распределения).По способу построения и задачам изображения статистические графики

подразделяются на [9, c. 68–87]:- диаграммы (сравнения, динамики, структуры, взаимосвязи, степени

выполнения плана);- статистические карты (картограммы (фоновые и точечные) и карто-

диаграммы (столбиковые и квадратные; круговые; фигурные; полосовые)).

Контрольные вопросы и задания1. В чем состоит значение метода группировок в анализе статистических данных? 2. Какие виды группировок Вы знаете? 3. Какие основные задачи решаются исследователем с помощью метода группировок? 4. Какова роль и значение классификаций? Приведите примеры важнейших классифи-

каций. 5. Какие группировки называют комбинационными?. Приведите пример. 6. В чем состоят особенности многомерной классификации? 7. Какие основные проблемы подлежат решению при группировке статистических данных? 8. Как выполняется группировка, если группировочный признак является дискретным? 9. В каких случаях необходимо определить интервалы группировки по количествен-

ным признакам? 10. От чего зависит решение вопроса об определении числа групп и границ интервалов

между ними? 11. Каковы функции статистических таблиц? 12. Какие могут быть выделены виды статистических таблиц? 13. С какой целью строятся графики в экономико-статистических исследованиях? 14. От чего зависит выбор вида графического представления данных? 15. В каких целях используются секторные и столбиковые диаграммы? Приведите при-

меры. 16. Постройте график , характеризующий структуру студентов групп по успеваемости

в сессию.

Page 40: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

40

Тема 4. Статистические величины

Общие принципы построения статистических показателей. Абсо-лютные величины, их виды, значение и единицы измерения.

Понятие об относительных величинах. Виды относительных ве-личин, способы их расчета и формы выражения. Выбор оснований при построении относительных величин.

Виды средних величин и их значение в социально-экономических исследованиях. Средняя арифметическая и другие степенные средние.

Статистический показатель — обобщающая количественная характери-стика изучаемого объекта или его свойства в условиях качественной опреде-ленности. Качественная определенность показателя заключается в том, что он непосредственно связан с внутренним содержанием изучаемого явления или процесса, его сущностью. В отличие от признака показатель получает-ся расчетным путем (от простого подсчета единиц совокупности и сумми-рования значений признака до более сложных вычислений.

В зависимости от методов расчета обобщающие показатели могут быть аб-солютными, относительными или средними. Любой показатель должен быть точно определенным, что выдвигает ряд требований к его наименованию:

- статистическая структура показателя;- его содержание;- позиция в классификации, совокупность объектов;- единица измерения;- время;- специальные уточнения.В зависимости от охвата единиц совокупности показатели подразделя-

ются на индивидуальные, характеризующий отдельную единицу совокуп-ности, и сводные, характеризующие группу или всю совокупность в целом. Сводные показатели подразделяются на объемные и расчетные.

Объемные показатели получают путем сложения значений признака от-дельных единиц совокупности. Полученная величина, называемая объемом признака, может выступать в качестве объемного абсолютного показателя, а может сравниваться с другими объемными показателями для получения объемных относительных показателей и объемных средних показателей (например, фондовооруженность или средняя стоимость основных фондов).

Расчетные показатели, вычисляемые по различным формулам, служат для решения отдельных статистических задач. Они также могут быть абсо-лютными, относительными или средними.

Абсолютные величины отражают физические параметры изучаемых статистикой процессов и явлений, а также объем совокупности (число ее

Page 41: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

41

единиц). Абсолютные показатели всегда являются именованными числами и могут выражаться в натуральных, трудовых или стоимостных единицах измерения.

Относительные величины представляют собой результат деления од-ного абсолютного показателя на другой и выражают соотношение между количественными характеристиками процессов и явлений. Различают от-носительные показатели динамики, структуры, координации, сравнения, расчетного задания и выполнения его, интенсивности.

Средние величины. Для изучения закономерностей развития соци-ально-экономических явлений в статистике используются средние величи-ны. Широкое применение средних величин обусловлено их незаменимостью в анализе явлений общественной жизни. Так, одна из задач органов стати-стики — характеристика уровня жизни населения в целом, а в частности — уровня его доходов по социальным группам. Сравнение индивидуальных доходов каждой семьи рабочего, служащего невозможно. Не представляет интереса и сравнение суммарных доходов отдельных социальных групп, так как эти группы различаются по численности (например, численность рабочих и численность лиц, занятых в предпринимательстве), поэтому при анализе лучше использовать средние величины, а именно среднюю величи-ну доходов на одного человека или на одну семью по каждой группе.

Средняя величина — обобщающая характеристика изучаемого при-знака в исследуемой совокупности. Она отражает его типичный уровень в расчете на единицу совокупности в конкретных условиях места и време-ни, игнорируя различия отдельных единиц. Она служит мерой признака на единицу совокупности (в отличие от относительных величин, служащих мерой соотношения показателей). Важнейшее свойство средней величи-ны заключается в том, что она отражает то общее, что присуще всем еди-ницам исследуемой совокупности. Значения признака отдельных единиц колеблются в ту или иную сторону (от средней) под влиянием множества факторов (существенных и случайных). В средней величине обобщаются индивидуальные значения признака и отражается влияние общих условий, наиболее характерных для данной совокупности в конкретных условиях места и времени. Сущность средней заключается в том, что в ней взаимопо-гашаются отклонения значений признака отдельных единиц совокупности, обусловленных действием случайных факторов, и учитываются изменения, вызванные действием основных факторов.

Условия правильного применения средней величины следующие:- средние величины должны исчисляться только по качественно одно-

родным совокупностям (поэтому метод средних используют в сочетании с методом группировок);

Page 42: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

42

- cредняя должна исчисляться по совокупности, состоящей из достаточ-но большого числа единиц;

- каждая средняя характеризует изучаемую совокупность лишь по ка-кому-то одному признаку. Для всесторонней характеристики необходимо использовать систему взаимосвязанных средних величин.

Средняя должна вычисляться исходя:- из социально-экономического признака, подлежащего осреднению;- из характера исходных статистических данных, по которым определя-

ется средняя;Средние величины, характеризующие совокупность в целом, называют

общими, а средние, отражающие особенность группы-групповыми. Соче-тание общих и групповых средних расширяет границы анализа, позволяет проводить сравнения во времени и пространстве. Форма, вид и методика расчета средней величины зависят от поставленной цели исследования, вида и взаимосвязи изучаемых признаков, а также от характера исходных данных.

Виды средних степенных величин. Средние величины делятся на две основные категории (степенные и структурные).

При расчете средних степенных используют следующие элементы:- варианта (X) — признак, для которого исчисляется средняя величина,

является варьирующим, осредняемым. Единицы варьирующего признака, принимающие определенное числовое выражение, есть варианты;

- число единиц (n) — количество вариант в исследуемой совокупности;- веса, частоты (f) — показатели повторяемости вариант в исследуемой

совокупности.В общем виде формула степенной средней имеет вид:

— cредняя степенная простая,

— средняя степенная взвешенная,

где к — показатель степени.Средняя степенная простая применяется в случае, если каждая вариан-

та Х встречается в совокупности один или одинаковое число раз. Средняя степенная взвешенная применяется в случае, если каждая варианта Х встре-чается в совокупности неодинаковое число раз, т. е. по сгруппированным данным.

k

k

n∑Χ

k

i

ik

ff

∑∑ ⋅Χ

Page 43: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

43

Степенные средние (гармоническая, геометрическая, арифметическая, квадратическая, кубическая, биквадратическая и т.д) могут быть опреде-лены по формулам, зависящим от значения показателя степени применяе-мой средней. С увеличением показателя степени к соответственно увели-чивается средняя величина.

1. Средняя гармоническая : к=-1;

простая: ,

взвешенная: ,

где ; xi — индивидуальное значение признака, вариант; fi — часто-та, или статистический вес варианта; n — число единиц совокупности;

Средняя гармоническая применяется в случае, если известны варьи-рующие обратные значения признака. Ее часто рассматривают как величи-ну, обратную средней арифметической.

2. Средняя геометрическая: к=0; простая: ,

взвешенная: ,

где П — знак умножения. Наиболее широкое применение средняя геометрическая получила для

определения средних темпов изменения в рядах динамики, а также в рядах распределения.

3. Средняя арифметическая: к=1;

простая: ,

взвешенная: .

Средняя арифметическая применяется в тех случаях, когда объем варьирующего признака для всей совокупности образуется как сумма зна-чений признака отдельных ее единиц.

4. Средняя квадратическая: к=2;

простая: ,

взвешенная: .

ix

n1

ixωω

ii fx ⋅=ω

nix∏=Χ

=Χ ∏i if fix

nxi=Χ

=Χi

ii

ffx

22

nx

X i=

2

2

=i

ii

ffx

X

Page 44: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

44

Средняя квадратическая используется при расчете показателей вариации. Для одной и той же совокупности существуют строго определенные

соотношения между разными видами средних. Эти соотношения называют правилом мажорантности средних. Правило мажорантности средних ве-личин (чем выше степень, тем больше величина средней) можно записать в виде:

Средняя величина, являясь характеристикой всей совокупности,

должна ориентироваться на итоговый (определяющий) показатель, свя-занный со всеми единицами совокупности (объем затрат, выручки, фонд зарплаты и т.д.). При замене индивидуальных значений признака их средней величиной определяющий показатель должен сохранять свое зна-чение (средняя арифметическая – общий объем, средняя гармоническая – итоговая величина, обратная индивидуальным значениям признака, средняя геометрическая – сумма произведений исходных величин, сред-няя квадратическая – сумма квадратов исходных величин).

Методика расчета средних степенных приведена в табл. 6. Таблица 6.

Методика расчета средних степенных

Вид средней Формулы расчета показателей Простая средняя Взвешенная средняя

Средняя гармоническая

Средняя геометрическая

Средняя арифметическая

Средняя квадратическая

Средняя кубическая

Средняя биквадратическая

Средняя к-ой степени

скаяквадратическаяарифметиче XX ≤≤≤ скаягеометричекаягармоничес XX

ix

n1

ixωω

ii fx ⋅=ω

nix∏=Χ =Χ ∏i if f

ix

nxi=Χ

⋅=Χ

i

ii

ffx

22

nx

X i= 2

2

=i

ii

ffx

X

33

nx

X i= 3

3

=i

ii

ffx

X

44

nx

X i= 4

4

=i

ii

ffx

X

kk

=Χ k

i

ik

ff

⋅Χ

Page 45: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

45

Средняя арифметическая. Основной формой средних является сред-няя арифметическая. Формула ее прямо отвечает определению средней ве-личины, как обобщенной характеристики единицы совокупности:

или

То есть, все значения единиц нужно просуммировать и разделить на число единиц. В совокупностях, в которых одни и те же значения много-кратно повторяются, проводят группировку данных и объем совокупности определяют путем перемножения (взвешивания) его вариантов на число единиц в группах и только потом суммируют итоги по группам и делят на сумму частот (весов).

Средняя арифметическая является наиболее распространенным видом средних величин. Она обладает рядом математических свойств, которые более полно раскрывают ее сущность и в некоторых случаях используются для упрощения ее расчетов. Основные из них следующие:

1. — сумма отклонений вариант от средней арифме-тической всегда равна нулю. Поэтому среднюю можно назвать центром распределения данных: значения ниже и выше средней величины взаимно уравновешиваются.

2. 2 = min — сумма квадратов отклонений от средней

арифметической меньше суммы квадратов отклонений от любой другой величины А.

3. — Если от каждой варианты отнять какое- либо произвольное число А, то новая средняя уменьшится на то же число.

4. — Если к каждой варианте прибавить какое- либо произвольное число А, то новая средняя увеличится на то же число.

5. — Произведение средней на сумму частот

всегда равно сумме произведений вариант на частоты.

6 . — Если каждую варианту разделить на какое- либо произвольное число, то средняя арифметическая уменьшится во столько же раз.

nxi=Χ

=Χi

ii

ffx

( ) 0=⋅− ifXX

( )AX

ffAX

i

ii −=⋅−

( )AX

ffAX

i

ii +=⋅+

iii fXfX ⋅=⋅

AX

f

fAX

i

ii

=⋅

( ) − XX

Page 46: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

46

7 . — Если каждую варианту умножить на какое- либо произвольное число, то средняя арифметическая увеличится во столько же раз.

8 . — Если все частоты (веса) разделить или умножить на какое-либо число, то средняя арифметическая от этого не из-менится.

С помощью средних обобщают не только абсолютные, но и относи-тельные величины (на основе значений как первичных, так и вторичных признаков. Порядок расчета и форма средней зависят от взаимосвязи изу-чаемых признаков и от того, какими данными располагают. Средние пер-вичных признаков определяются по формуле простой средней путем деле-ния итогового подсчета по характеризуемому признаку на перечневый подсчет, то есть по формуле

(числитель — общая сумма значений усредняемого при-

знака, знаменатель — общее число единиц изучаемой совокупности). Базой для расчета значений вторичного признака является исходное

соотношение первичных признаков, определяющих логическую формулу усредняемого вторичного признака. Далее определяется частное от деле-ния итоговых подсчетов по этим первичным признакам.

В случае, когда один из итоговых показателей не известен, расчет средней производят на основе исходных данных о значении усредняемого вторичного признака каждой отдельной единицы совокупности и связан-ного с ним признака-веса.

Таким образом, средняя вторичного признака имеет вид средней взвешенной. Если известны значения знаменателя исходного отношения, но не известны значения числителя, то среднюю вычисляют по формуле средней арифметической взвешенной:

В противном случае среднюю вычисляют по формуле средней гар-

монической взвешенной:

Для каждого показателя можно составит только одно исходное соот-

ношение для расчета средней (ИСС). Числитель исходного соотношения

( )AX

ffAX

i

ii ⋅=⋅⋅

( )( ) X

AfAfX

i

ii =⋅

⋅⋅

nxi=Χ

=Χi

ii

ffx

ixωω

ii fx ⋅=ω

Page 47: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

47

средней отражает ее определяющий показатель. Например, для расчета средней зарплаты работников предприятия необходимо общий фонд ЗП (определяющий показатель) разделить на число работников.

Мода и медиана, их смысл и значение. Важным видом средних ве-личин являются структурные (непараметрические) средние. Их использу-ют для изучения внутреннего строения и структуры рядов распределения значений признака. К основным видам структурных средних относят моду и медиану.

Мода это величина признака (варианта), которая чаще всего встреча-ется в данной совокупности. В вариационном дискретном ряду модой вы-ступает варианта, имеющая наибольшую частоту.

Медиана это варианта, которая находится в середине ранжированного вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее (вверх и вниз) находится одинаковое количество единиц совокупности. В ранжированных рядах несгруппированных данных медиана равна значе-нию признака, расположенного строго в середине ряда. В случае четного объема ряда медиана равна средней из двух вариантов, находящихся в се-редине ряда. Главное свойство медианы заключается в том, что сумма аб-солютных отклонений значений признака от медианы меньше, чем от лю-бой другой величины:

Рассмотрим определение моды и медианы по несгруппированным данным. Предположим, что 9 торговых фирм города реализуют товар А по следующим оптовым ценам (тыс. руб.):

4,4; 4,3; 4,5; 4,5; 4,3; 4,3; 4,6; 4,2; 4,6. Чаще всего встречается цена 4,3 тыс. руб., эта величина и будет модой.

Для определения медианы необходимо провести ранжирование: 4,2; 4,3; 4,3; 4,3; 4,4; 4,5; 4,5; 4,6; 4,6 Центральной в этом ряду является цена 4,4 тыс. руб., эта величина

и будет медианой. Если ранжированный ряд включает четное число еди-ниц, то медиана определяется как средняя из двух центральных значений.

Например, чтобы дать характеристику среднего дохода группы людей, насчитывающей 10 человек, из которых 9 человек имеют доход от 100 до 500 долл. в месяц, а месячные доходы последнего составляют 50000 долл. (табл. 7-1), лучше всего рассчитать медиану. Она составит 310 долл., как средняя между 5-ым и 6-ым работником.

Медиана (как и мода ) в отличие от средней арифметической не зави-сит от минимального и максимального значений ряда распределения и потому практически выполняет функции средней для неоднородной со-вокупности и в случаях, когда между минимальным и максимальным зна-чениями изучаемого признака имеют место резкие различия (как в приве-денном примере).

=

=−n

ii Mex

1min

Page 48: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

48

Таблица 7-1 № п/п 1 2 3 4 5 6 7 8 9 10

Доход (долл.) 100 150 200 240 300 320 350 400 500 50000

Моду и медиану можно рассматривать как порядковые характеристики значения признака у единицы совокупности, занимающей особое место в ряду распределения. Мода является величиной, вокруг которой группиру-ется наибольшее количество единиц совокупности. Медиана отражает зна-чение признака, сумма отклонений от которого является наименьшей вели-чиной. Средняя арифметическая часто используется как показатель центра распределения, положительные и отрицательные отклонения от которого индивидуальных значений признака взаимно погашаются. При нормальном распределении все эти средние показатели одинаковую величину.

В дискретном вариационном ряду определение медианного значения признака сводится к определению номера медианной единицы ряда по формуле

где n — объем совокупности.

Полученное значение показывает, где точно находится номер медиан-ной единицы (номер середины ряда). Медианное значение характеризуется тем, что его кумулятивная частота (сумма накопленных частот по группам) равна половине суммы всех частот или превышает ее.

Рассмотрим пример расчета моды и медианы по сгруппированным данным в дискретном вариационном ряду. Исходные данные приведены в табл. 7-2.

Таблица 7-2 Определение моды и медианы дискретного вариационного ряда

Цена, руб. за единицу Х

Число торговых предприятий, f

Накопленные частоты, F

52 12 12 53 48 60=12+48 54 56 116=60+56 55 60 176=116+60 56 14 190=176+14

Всего 190

Для определения медианы находят номер медианной единицы ряда по формуле:

5,952

11902

1 =+=+= nN Me

Точная середина находится между 95 и 96 предприятиями упорядо-ченной совокупности. Необходимо определить в какой группе находятся предприятия с этими порядковыми номерами. Это можно сделать, рассчи-тав накопленные частоты. Как видно из таблицы 7-2, эти предприятия

21+= nNme

Page 49: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

49

находятся в третьей группе, в которой товары продали по цене 54 руб за ед.. Следовательно, медиана равна 54 руб за ед. .

А вот мода будет в следующей группе (55 руб. за ед.), так как наи-большая частота (f=60) приходится на эту группу. Модальный интервал в интервальном ряду определяется по наибольшей частоте.

Для определения медианного интервала необходимо рассчитать сум-мы накопленных частот. Медианный интервал характерен тем, что его ку-мулятивная частота равна полусумме всех частот ряда или превышает ее.

Методика расчета моды и медианы в интервальных рядах с равными интервалами приведена в табл. 8.

Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию.

Таблица 8. Методика расчета показателя моды и медианы в интервальных рядах с равными интервалами

Вид средней Методика расчета показателя

Мода

мода вычисляется по формуле: где — минимальная граница модального интервала; — величина модального интервала; — частота модального интервала; — частота интервала, предшествующего модальному интервалу; — частота интервала, следующего за модальным.

Медиана

В интервальном ряду с равными интервалами медиана рас-считывается по формуле где — начальное значение медианного интервала; — величина медианного интервала; — сумма частот ряда; — сумма накопленных частот в интервалах, предшествующих медианному; — частота медианного интервала.

( )( ) ( )11

100

+−

−+−−⋅+=

mmmm

mm

ffffffiXM

i0X

1−mf

1+mf

m

m

f

SfiXMe

−−⋅+=

1

021

0Xi f

1−mS

mf

Page 50: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

50

Контрольные вопросы и задания1. Какова роль статистических показателей в управлении экономикой?2. Какие могут быть выделены группы обобщающих статистических показателей?3. Назовите виды относительных величин и охарактеризуйте их значение.4. Для чего рассчитывают относительные величины координации?5. Почему важно анализировать абсолютные и относительные показатели во взаи-

мосвязи?6. Что представляет собой средняя величина и в чем состоит ее определяющее

свойство?7. Напишите формулу средней арифметической и приведите пример исчисления

средней по формуле:а) средней арифметической простой;б) средней арифметической взвешенной.

8. Какова роль средних величин в обобщении данных статистического наблюдения?9. Для каких целей используется формула средней геометрической?10. Назовите основные свойства средней арифметической .11. В чем различие между степенными и структурными средними?12. Использование моды и медианы и их расчет по несгруппированным данным.

Тема 5. Показатели вариации и статистические распределения

Вариация признака в совокупности и значение ее изучения. Пока-затели размеров вариации: размах, среднее линейное отклонение, дис-персия и среднее квадратическое отклонение, коэффициент вариации.

Основные характеристики и графическое изображение вариацион-ного ряда. Показатели центра распределения: cредняя арифметическая, медиана, мода. Моменты распределения. Изучение формы распределе-ния. Нормальное распределение. Асимметричное распределение. Кри-вые распределения. Критерии согласия. Вариационный ряд и группи-ровка.

Понятие о вариации и задачи ее изучения. Вариацией называ-ется различие значений признака у отдельных единиц изучаемой совокуп-ности в один и тот же период или момент времени. Задачи исследования ва-риации: определение меры вариации, выбор соответствующих измерителей или показателей, характеризущих ее размеры, измерение влияния факторов, ее определяющих. Для решения этих задач все совокупности необходимо упорядочить в ряды распределения. Статистический ряд распределения это упорядоченное распределение единиц изучаемой совокупности на груп-пы по определенному изменяющемуся признаку. В зависимости от признака,

Page 51: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

51

положенного в основу образования ряда распределения, различают атрибу-тивные и вариационные ряды. Атрибутивный ряд — ряд распределения по атрибутивному (качественному) признаку, не имеющему количествен-ной меры. Вариационный ряд — ряд распределения по количественному признаку.

Вариационные ряды могут быть дискретными и интервальными. Дис-кретный ряд распределения — это ряд, в котором варианты выражены це-лым числом. Интервальный ряд распределения — это ряд, в котором зна-чения признака заданы в виде интервала. В составе любого вариационного ряда можно выделить три основных элемента: варианты, частоты, частости. Варианты (X) — это значения варьирующего признака.

Частоты (f) — это число единиц совокупности, обладающих данными значениями варьирующего признака. Частости (w) — это удельные веса (доли) отдельных групп в общей численности совокупности.

Статистический анализ вариации предполагает выполнение следующих основных этапов [8, с.50]:

1. Построение вариационного ряда.2. Графическое изображение вариационного ряда.3. Расчет показателей центра распределения и структурных характери-

стик вариационного ряда.4. Расчет показателей размера и интенсивности вариации.5. Оценка вариационного ряда на асимметрию и экцесс.Для характеристики среднего значения признака в вариационном ряду

используются так называемые показатели центра распределения, к которым относятся средняя арифметическая, мода и медиана (см. раздел 1, тема 3, с. 46–56). Моду и медиану можно определить и графически по гистограмме или кривой распределения и кумуляте.

Для определения по гистограмме нужно взять столбец, имеющий наи-большую высоту, и из его левого верхнего угла провести отрезок в верхний угол последующего столбца, а из правого угла — в верхний правый угол предыдущего. Абцисса точки пересечения отрезков и будет соответствовать модальному значению признака в изучаемой совокупности. Абцисса наивыс-шей точки кривой распределения, соответствующая наибольшей частоте, будет также соответствовать модальному значению признаку совокупности.

Медиану приближенно можно определить по кумуляте. Для этого вы-соту наибольшей ординаты, которая соответствует общей численности со-вокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абцисс, до пересечения ее с кумулятой.Абцисса точки пересечения и является медианой.

Расчет модального и медианного значений для вариационных рядов с не-равными интервалами осуществляется по формулам, аналогичным приве-

Page 52: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

52

денным выше (раздел 1, тема 3), только вместо показателей частот (часто-стей) используются показатели абсолютной или относительной плотности распределения, которые обеспечивают сопоставимость неравных интерва-лов. Показатели плотности распределения находятся как отнощение ча-стот (частостей) к величине интервала h:

- абсолютная плотность распределения f 1 равна:f 1= f / h;

- относительная плотность распределения w 1 равна:w 1 = w / h.

По соотношению характеристик центра распределения можно судить о симметричности эмпирического ряда распределения. Симметричным является распределение, в котором частоты двух вариантов, равноотстоя-щих в обе стороны от центра распределения, равны между собой. В симме-тричном (нормальном) ряду распределения средняя величина x , медиана Ме и мода Мо равны между собой:

x = Ме = Мо.Если x < Ме < Мо, то имеет место левосторонняя асимметрия, при ко-

торой большая часть единиц совокупности имеет значение признака ниже модального. На графике распределения левая ветвь относительно макси-мальной ординаты вытянута меньше, чем правая.

Если x > Ме > Мо, то имееи место правосторонняя асимметрия, при ко-торой большая часть единиц совокупности имеет значение признака боль-ше модального. На графике распределения правая ветвь вытянута больше, чем левая.

Для оценки степени асимметричности применяют моментный и струк-турный коэффициенты асимметрии.

Моментный коэффициент асимметрии As (стандартизованный мо-мент третьего порядка) определяется по формуле:

As = M3 / σ3,

где M3 — центральный момент третьего порядка,где М3=

∑∑ −

ffxx .3)(

Структурный коэффициент асимметрии Пирсона определяется по формуле: Аs = 3( x - Ме)/ σ.

На направление асимметрии указывает знак коэффициента: если Аs < 0, то это левосторонняя асимметрия (ее называют таже отрицательной), при правосторонней асимметрии Аs >0.

Другим свойством рядов распределения является экcцесс. Под экcцес-сом понимают островершинность или плосковершинность распределения по сравнению с нормальным. Экцесс оценивают с помощью центрального момента четвертого порядка М4 по формуле: Es = М4 / σ

4

Page 53: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

53

Показатели размера и интенсивности вариации. Показатели вариа-ции делятся на 2 группы: абсолютные и относительные. К абсолютным показателям относятся: размах колебаний (R), среднее линейное откло-нение, дисперсия, среднее квадратическое (стандартное) отклонение. К относительным показателям вариации относятся: коэффициент ва-риации, относительное линейное отклонение и др.

Размах колебаний, или размах вариации представляет собой раз-ность между максимальным и минимальным значениями признака в изу-чаемой совокупности: . Размах вариации зависит от величины только крайних значений признака, поэтому область его применения огра-ничена достаточно однородными совокупностями. Так как только два зна-чения признака учитываются, причем крайние, размах вариации может быть зависимым от случайных причин.

Среднее линейное отклонение ( ) — сумма всех отклонений, услов-но принятых с одинаковым знаком (по модулю), разделенная на их число. Среднее линейное отклонение более полно характеризует колеблемость признака.

Дисперсия (σ2) — средняя из квадратов отклонений вариантов значе-ний признака от их средней величины .

Среднее квадратическое отклонение ( σ) — квадратный корень из дисперсии. Среднее квадратическое отклонение также, как и среднее ли-нейное отклонение, показывает, на сколько в среднем отклоняется кон-кретное значение признака от среднего их значения. Среднее квадратиче-ское отклонение всегда больше среднего линейного отклонения. Между

ними имеется соотношение .25,1.2

dd == πσ

Зная это соотношение, можно по известному показателю определить неизвестный, например, по определить σ и наоборот. Среднее квадрати-ческое отклонение измеряет абсолютный размер колеблемости и выража-ется в тех же единицах измерения, что и значения признака (в рублях, тон-нах, процентах и т.д.). Оно является абсолютной мерой вариации.

Формулы расчета показателей вариации для несгруппированных и сгруппированных данных приведены в табл. 9.

Для оценки интенсивности вариации, а также для сравнения ее вели-чины в разных совокупностях или по разным признакам используют отно-сительные показатели вариации (коэффициент осцилляции, коэффициент вариации и др.), которые рассчитываются как отношение абсолютных по-казателей к средней величине признака. Коэффициент осцилляции (отно-сительный размах вариации) есть отношение размаха вариации R к сред-ней арифметической x .

xxR minmax −=

d

d

Page 54: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

54

Таблица 9. Методика расчета показателей вариации

Показатель Формулы расчета показателей

для несгруппированных данных для сгруппированных данных

Среднее линейное отклонение

Дисперсия

Среднее квадратическое отклонение

По своему абсолютному значению среднее квадратическое отклоне-ние зависит не только от степени вариации признака, но и от абсолютных уровней вариант и средней. Чтобы сравнивать, нужно найти удельный вес отклонения в среднем арифметическом показателе, выраженный в %, то есть рассчитать относительные показатели вариации.

Линейный коэффициент вариации это отношение среднего линей-ного отклонения к средней арифметической, выраженный в %.

Коэффициент вариации, как отношение среднего квадратического

отклонения к среднему арифметическому, — измеряет колеблемость в от-носительном выражении, относительно среднего уровня .

Также этот показатель используют для характеристики однородности

совокупности. Совокупность считается однородной, если коэффициент ва-риации не превышает 33% (для распределений, близких к нормальному). Чем больше величина коэффициента вариации, тем больше разброс значе-ний признака вокруг средней, тем больше неоднородность совокупности. Существует шкала степени однородности совокупности в зависимости от значений коэффициента вариации.

Коэффициент вариации (%) Степень однородности совокупности До 30 Однородная 30-60 Средняя 60 и более Неоднородная

n

xd

n

iix

=

−= 1

=

=

⋅−= n

ii

n

iii

f

fxd

x

1

1

( )ni

n

ixx −

== 1

2

2σ( )

=

=

⋅= n

ii

n

ii

f

fi xx

1

1

2

( )ni

n

ixx −

== 1

2

σ( )

=

=

⋅= n

ii

n

ii

f

fi xx

1

1

2

σ

%100×=xdV

%100×=x

V σ

Page 55: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

55

Средние величины и показатели вариации могут быть рассчитаны че-рез моменты распределения. Моментом k-го порядка называют среднюю из k-х степеней отклонений вариантов x от некоторой постоянной величи-ны А. Если А= 0, момент называется начальным. Если А= x , момент на-зывается центральным. Если А ≠ 0, момент называют условным, а расчет средних с его использованием называется методом условных моментов. Согласно определению начальный момент первого порядка есть средняя арифметическая, а момент второго порядка — есть дисперсия.

Расчет средней и дисперсии методом условных моментов производит-ся по формулам:

Условный момент первого порядка Условный момент второго порядка

где m1, m2 — условные моменты первого и второго порядка, к — общий множитель.

Также как средняя арифметическая, дисперсия обладает рядом важ-ных свойств, которые используют в статистическом анализе: 1) дисперсия постоянной величины равна нулю; 2) если все варианты значений признака уменьшить на одно и то же число A, то дисперсия не изменится; 3) если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз; 4) дисперсия признака относительно произвольной величины всегда боль-ше дисперсии относительно средней арифметической на квадрат разности между средней и произвольной величиной:

=

=

⋅−

= n

i

i

in

i

i

lf

lf

kAx

m1

11 Ak

f

fm

xx n

ii

n

iii

+⋅==

=

=1

1

1

( )mmk 212

22 −=σ

=

=

=n

i

i

n

i

i

l

li

f

fk

Ax

m1

1

2

2

( ) ( )( )Ax

f

fxxf

fAxn

ii

n

ii

n

ii

n

ii ii

−+

⋅=

=

=

=

= 2

1

1

2

1

1

2

Page 56: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

56

Дисперсионный анализ. Наряду с изучением вариации по всей сово-купности в целом можно изучить количественные изменения по группам, на которые разделяется совокупность, и между группами. Для этого выде-ляют три вида дисперсии: общую, межгрупповую и внутригрупповую.

Общая дисперсия (дисперсия признака по всей изучаемой совокуп-ности) характеризует вариацию признака как результат влияния всех фак-торов, определяющих индивидуальные различия единиц совокупности и может быть рассчитана по формуле:

Вариацию, обусловленную влиянием фактора, положенного в основу

группировки, характеризует межгрупповая дисперсия, которая является мерой колеблемости групповых средних вокруг общей средней и исчисля-ется по формуле:

где m — число групп; — число единиц в группе ; — частная средняя по группе; — общая средняя по всей совокупности единиц. Вариацию, обусловленную влиянием прочих факторов, характеризует

в каждой группе групповая (внутригрупповая) дисперсия: По совокупности в целом вариация значений признака под влиянием

прочих факторов характеризуется средней из групповых дисперсий: Существует закон, связывающий три вида дисперсий. Общая диспер-

сия равна сумме средней из внутригрупповых и межгрупповой дисперсий

=−= =

n

yyn

ii

n

n

ii 1

2

1

2

( )

=

== m

jj

m

jj

f

fyy j

1

1

2

f j

y j

y

( )f

fyy

j

m

jj

j

jij −== 1

2

=

== m

jj

m

jjj

j

f

f

1

1

2

σ

σδσ 222 j+=

Page 57: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

57

Данное соотношение называется правилом сложения дисперсий и используется в ряде методов статистики, в частности при расчете оши-бок выборочного наблюдения (раздел 1, тема 1) и при измерении тесноты связи между признаками (раздел 2, тема 1). Теоретический и практический интерес к этому правилу заключается, во-первых, в том что, зная две вели-чины, на основе приведенного равенства всегда можно определить третью величину, во-вторых, важное значение состоит в том что, зная общую дис-персию и дисперсию групповых средних, можно оценить силу влияния группировочного признака с помощью эмпирического коэффициента де-терминации и эмпирического корреляционного отношения.

Эмпирический коэффициент детерминации равен отношению меж-групповой и общей дисперсии и рассчитывается по формуле:

Он показывает, какая часть (доля) общей вариации изучаемого при-

знака обусловлена вариацией группировочного признака. Эмпирическое корреляционное отношение (ή) представляет собой

корень квадратный из эмпирического коэффициента детерминации и рас-считывается следующим образом:

Оно характеризует влияние признака, положенного в основание груп-

пировки, на вариацию результативного признака (изменяется в пределах от 0 до 1). Если ή = 0, то признак не оказывает влияния на результативный. Если ή = 1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих признаков равно нулю. Промежуточные значения оцениваются в зависи-мости от их близости к предельным значениям.

Контрольные вопросы и задания 1. Что такое размах вариации и в чем его особенности как показателя вариации? 2. Назовите показатели, являющиеся абсолютными характеристиками степени ва-

риации. 3. Что такое размах вариации и в чем его особенности как показателя вариации? 4. Назовите показатели, являющиеся абсолютными характеристиками степени ва-

риации. 5. В чем состоят особенности расчета показателей вариации по сгруппированным

данным? 6. Какое аналитическое значение имеет коэффициент вариации? 7. Что представляет собой дисперсия альтернативного признака? 8. Назовите показатели, относящиеся к квантилям распределения.

σδη 2

22=

σσ

η 2

2

y

yx=

Page 58: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

58

9. Как определяется внутригрупповая дисперсия?10. Что представляет собой правило сложения дисперсий?11. Что характеризует межгрупповая дисперсия, формула ее расчета?12. Что называется эмпирическим корреляционным отношением, и как оно

интерпретируется?13. В чем состоит значение проверки гипотезы о форме распределения?14. Каковы особенности кривых нормального распределения? Их использование

в анализе фактических данных.15. Какие критерии согласия используются наиболее часто?

Раздел 2. СТАТИСТИЧЕСКИЕ МЕТОДЫ В ПРАКТИКЕ ОБРАБОТКИ ДАННЫХ

Тема 1. Статистическое изучение взаимосвязей

Понятие корреляционной связи и предпосылки ее использования. Статистические методы выявления наличия корреляционной связи между двумя признаками. Параллельное рассмотрение значений x и y в каждой из n единиц. Коэффициенты корреляции рангов.

Метод группировок. Корреляционная и групповая таблицы, «поле корреляции». Измерение степени тесноты корреляционной связи в случае парной зависимости. Линейный коэффициент корреляции. Корреляционное отношение.Индекс корреляции. Регрессионный анализ. Уравнение регрессии. Оценка существенности коэффициен-та регрессии и уравнения регрессии.

В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет вы-явить факторы (признаки), оказывающие влияние на вариацию изучаемых явлений и процессов. Признаки по их функциональной роли делятся на два класса (факторные и результативные). Факторные признаки — признаки, выступающие в качестве факторов, обусловливающих изменение других признаков. Результативные признаки — признаки, которые являются ре-зультатом влияния факторов.

В статистике различают функциональную и стохастическую зависи-мости. Функциональная связь характеризуется полным соответствием между изменением факторного признака и изменением результативной величины. Каждому значению признака-фактора соответствуют вполне

Page 59: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

59

определенные значения результативного признака. Стохастическая (ста-тистическая) связь — причинная зависимость проявляется не в каждом отдельном случае, а в общем, в среднем при большом числе наблюдений. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обу-словлено изменением факторных признаков.

Связи между явлениями и их признаками классифицируются:- по степени тесноты: оценивается по величине коэффициента корреля-

ции;- по направлению: прямая и обратная- по аналитическому выражению: прямолинейные (линейные) связи,

которые могут быть приблизительно выражены уравнением прямой; нели-нейные связи, которые выражаются уравнением какой-либо кривой линии.

Изучение корреляционных связей сводится к решению следующих задач:- выявление наличия (или отсутствия) корреляционной связи между из-

учаемыми;- измерение тесноты между двумя (и более) признаками с помощью

специальных коэффициентов (корреляционный анализ);- определение уравнения регрессии (регрессионный анализ).Корреляционный анализ имеет своей задачей количественное опреде-

ление тесноты связи между признаками. Условия правильного применения методов корреляционного анализа:

- однородность единиц, подвергаемых изучению методами корреляци-онного анализа;

- достаточное число наблюдений;- факторные признаки должны быть независимы друг от друга.

Методы выявления корреляционной связи. Для выяления наличия и характера связи в статистике используются ряд методов: рассмотрение паралельных данных (значений x и y) в каждой из n единиц; графический метод; метод аналитических группировок и корреляционных таблиц; рас-чет коэффициентов корреляции [9, c. 202–212].

Параллельное рассмотрение значений x и y в каждой из n единиц. При небольшом числе наблюдений наличие корреляционной связи между двумя призаками можно выявить путем простого параллельного сравнения их значений у отдельных единиц. Для этого единицы наблюдения распола-гают по возрастанию значения факторного признака x и рассматривают по-ведение значений результативного показателя у. Примером может служить приведенные в таблице условные показатели деятельности 10 предприятий (табл. 1).

Page 60: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

60

Таблица 1.Показатели деятельности предприятий *

Предприятия Основные производственные фонды, млн.руб.

Валовый выпуск продукции, млн. руб.

Знаки отклонений

xi yi

1 2 3 4 51 12 28 - -2 16 40 - -3 25 38 - -4 38 65 - -5 43 80 - -6 55 101 + +7 60 95 + -8 80 125 + +9 91 183 + +

10 100 245 + +∑ 520 1000

Средние 52 100*[13, c. 203]

Из таблицы видно, что по мере увеличения значений x увеличиваются и значения y (исключение — 3 и 7 предприятия). В целом же можно сказать, что с ростом объемов основных фондов растет и валовой выпуск продукции предприятий.

Такой вывод о наличии связей обычно сопровождается расчетом других показателей, используемых для измерения направления и тесноты связей: коэффициента Фехнера, ранговых коэффициентов корреляции, линейного коэффициента корреляции.

Коэффициент Фехнера (коэффициент корреляции знаков) основан на сравнении поведения отклонений индивидуальных значений каждого при-знака от своей средней величины (табл. 1, графы 4, 5).При этом во внимание принимаются только знаки отклонений («+»), («-». Определив знаки, рассма-тривают все пары знаков и подсчитывают число их совпадений С и несовпа-дений Н. При таких обозначениях коэффициент Фехнера Кф равен

Кф = ÍCÍC

∑+∑∑−∑

то есть, коэффициент Фехнера равен отношению разности чисел пар совпа-дений и несовпадений знаков к их сумме. Как и любой показатель тесноты связей, коэффициент Фехнера может принимать значение от 0 до ± 1. При этом чем ближе значение к единице, тем больше (теснее) зависисмость меж-ду между x и y.

yy −yy −

Page 61: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

61

В примере число совпадений составило (табл. 1, графы 4, 5) 9, а число несовпадений – 1.

Кф = НCНC

+− = (9-1)/ (9+1) = 0,8.

Такое значение свидельствует о сильной зависимости. Однако так как Кф не учитывает величину отклонений (только знаки), он практически ха-рактеризует не столько тесноту связей, сколько ее наличие и направлен-ность. В примере по значению и знаку (+) Кф можно сказать, что между x и y существует прямая корреляционная связь.

Корреляционную связь между x и y для наглядности можно изобра-зить графически. Для этого, пользуясь прямоугольной системой координат (х — по оси абцисс и y — по оси ординат) каждую пару изображают точ-кой на плоскости. Соединяя последовательно нанесенные точки, получают ломаную линию, называемую эмпирической линией регрессии.

Коэффициенты корреляции рангов. Для измерения тесноты связей часто используются простые по расчету непараметрические показатели, к числу которых, кроме коэффициента Фехнера, относятся коэффициенты корреляции рангов Спирмэна (ρ) и Кендэла (τ ).

Ранг — это порядковый номер, присваиваемый каждому индивиду-альному значению x и y (отдельно) в ранжированном ряду. Нумерация их чаще всего от 1 до n по возрастанию значений признака (или наоборот по убыванию). Ранги признаков x и y обозначают символами Nx и Ny. Сужде-ние о связи между изменениями значений х и у основано на сравнении по-ведения рангов по двум признакам параллельно. Если у каждой пары x и y ранги совпадают, это характеризует максимально тесную прямую связь. Если наоборот, то есть в одном ряду ранги возрастают от 1 до n, а в другом — убывают от n до 1, это максимально возможная обратная связь.

Для расчета коэффициента Спирмэна значения признаков x и y нуме-руют (отдельно) в порядке возрастания от 1 до n, то есть им присваивают определенный ранг (Nx и Ny) — порядковый номер в ранжированном ряду. Затем для каждой пары рангов находят их разность (d = Nx - Ny), и квадра-ты этой разности суммируют. Коэффициент корреляции рангов Спирмэна рассчитывают по формуле:

ρ=1- (6∑d2)/(n3- n), или ρ = 1- )1(

62

2

nnd .

где d — разность рангов x и y; n — число наблюдаемых пар значений x и y. Коэффициент корреляции рангов Спирмэна может принимать значе-

ния от 0 до ± 1. Однако равенство 0 или 1 нельзя расценивать как отсутст-вие связей или свидетельство функциональной связи (как в случае равен-ства 0 или 1 линейного коэффициента корреляции r), так как он учитывает разность только рангов (а не самих значений) x и y. Во всех остальных случаях он близок к r , и благодаря простоте расчета более предпочтите-лен, особенно на начальном этапе выявления наличия связи.

Page 62: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

62*Таблица сконструирована по исходным данным, приведенным в [13, c. 231]

Расчет коэффициента Кендэла начинается также с ранжирования зна-чений признаков x и y. Ранги x (Nx) располагают строго в порядке возрас-тания и параллельно записывают соотвествующие Ny. Для каждого Ny по-следовательно определяют число следующих за ним рангов, превышаю-щих его значение, и число рангов, меньших по значению. Первые учиты-ваются со знаком + и их сумма обозначается буквой Р, вторые учитывают-ся со знаком — и их сумма обозначается буквой Q. Если ранги x и y совпа-дают и число пар равно n, то

Рmax = 2

1( −nn .

Если тенденция обратная, то Q будет иметь такое же максимальное значение по модулю:

maxQ =2

1( −nn .

Если же ранги y не совпадают с рангами x, то суммируются все поло-жительные и отрицательные баллы (S = P+Q); отношение данной суммы S к максимальному значению одного из них и представляет собой коэффи-циент корреляции рангов Кендэла τ , то есть

τ =2/)1( −nn

S или )1(

2−

=nn

Sτ .

Рассмотрим расчет коэффициентов корреляции рангов на условном примере данных о часовой оплате труда x и уровне текучести кадров y (табл. 2).

В графах 1 и 2 приведены исходные значения x и y. В графах 3 и 4 по-ставлены ранги Nx и Ny, полученные путем ранжирования значений x и y в порядке возрастания, и параллельно записанные в соответствии с их зна-чением по Nx. В графе 5 показаны разности рангов d = Nx –Ny, а в графе 6- значения квадратов этих разностей рангов, в итоговой строке по этой графе показана сумма, подставляемая в формулу. В результате расчета получаем:

ρ=1-(6∑d2)/(n3-n)=1-[6*164: (83- 8)]=1-[984:504]=1-1,95=-0,95 Полученное значение коэффициента корреляции рангов Спирмэна

ρ= - 0,95) свидетельствует о сильной обратной связи между x и y. Таблица 2.

Расчет коэффициентов рангов Спирмэна и Кендэла*

X Y Ранги Показатели для расчета коэффициента Спирмэна ρ

Показатели для расчетакоэффициента Кендэла τ

Nx Ny d d2 «+» «-» 1 2 3 4 5 6 7 8

30 34 1 7 -6 36 1 6 40 35 2 8 -6 36 0 6 50 33 3 6 -3 9 0 5 60 28 4 5 -1 1 0 4 70 20 5 3 2 4 1 2 80 24 6 4 2 4 0 2 90 15 7 2 5 25 0 1

100 11 8 1 7 49 - - n=8 ∑ d2=164 P=2 Q= -26

Page 63: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

63

В графах 7 и 8 приведедены баллы со знаком (+ ), то есть число сле-дующих рангов, превышающих данный ранг (графа 7) и число рангов, меньших по значению (графа 8). Их итоги (P =2, Q = -26), необходимые для расчета коэффициента Кендэла, показаны в итоговой строке. Их сумма равна S= P + Q= 2 + (- 26) = - 24. Подставляем их в формулу получим:

)1(2

−=

nnSτ =

78)24(2

⋅−⋅ = - 0857.

Полученное отрицательное значение коэффициента Кендэла τ = - 0857 также характеризует сильную обратную связь между x и y, то есть между уровнем оплаты труда и текучестью кадров.

Метод группировок. При большом числе наблюдений для выявления корреляционной cвязи между двумя количественными показателями x и y удобнее пользоваться методом группировок. Чтобы выявить наличие кор-реляционной связи между x и y строят групповую или корреляционную таблицы. В первом случае проводится группировка по факторному при-знаку x и для каждой выделенной группы рассчитывается среднее значе-ние результативного признака iy . Если y зависит от x, то в изменении среднего значения будет прослеживаться определенная закономерность. Покажем это на том же примере, сгруппировав предприятия (табл. 2-1)

Таблица 2-1 Показатели деятельности предприятий по группам

Основные производственные фонды, млн.руб. xi

Количество предприятий

Валовый выпуск продукции, млн. руб.

fi ∑yi iy 1 2 3 4 Менее 20 1 28 28 21-50 4 223 55,75 51-80 3 321 107 Свыше 80 2 428 214 Итого 8 1000

Из табл. 2-1 видно, что средний выпуск по предприятиям (графа 4) не-уклонно растет от групп с небольшими основными фондами к группам бо-лее крупных предприятий, что подтверждает закономерность, чем больше фондов x , тем больше средний выпуск y.

Если в таблицах группировки осуществляются по двум признакам (количественным), то они называются корреляционными. В подлежащем такой таблицы выделяются группы по факторному признаку x, а в сказуе-мом — группы по результативному признаку (или наоборот), а в клетках таблицы на пересечении x и y показано число случаев совпадения каждого значения x c соответствующим значением y. Рассмотрим построение и ис-пользование корреляцинной таблицы 3 на примере зависимости произво-дительности труда рабочих y (число изделий в час) от стажа работы x (лет). Число рабочих n= 40.

Page 64: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

64

Таблица 3. Корреляционная таблица*

Значение признака xi

Значение признака yi Итого (число единиц)

fx = fj Среднее значение по группам iy 5 1

0 15 20

1 2 3 4 5 6 7 1 1 3 - - 4 8,75 3 2 3 7 - 12 12,08 5 - 3 9 4 16 15,31 7 - - 5 3 8 16,87 Итого (число единиц fy =fi

3 9 21 7 ∑fj = 40 14,00

* [13, c. 207]

В первой строке значению признака x=1 один раз соответствует зна-чение y=5 и три раза y =10. Аналогично во второй строке, где x = 3 , у = 5 соответствует 2 раза, y = 10 – 3 раза и т.д.. В итоговой строке показано распределение всех 40 единиц по признаку y, поэтому и частоты обозначе-ны как fy.

В итоговом столбце (графа 6) показано распределение тех же 40 еди-ниц по признаку x (обозначено fj). Каждая частота внутри таблицы — это fxy. Для каждого j-го значения факторного признака x рассчитаем среднее значение результативного признака iy (графа 7). Например, по первой строке iy = 8,75, по второй строке — 12,08 и т.д.. Это групповые средние результативного признака. Общая средняя рассчитывается по распределе-нию итоговой строки:

y

yi

ffy

= 40

720211591035 ⋅+⋅+⋅+⋅ = 560/40 = 14.

Из таблицы 3. видно, что по мере увеличения значений x групповые средние значения iy увеличиваются от группы к группе, что позволяет сделать вывод о том, что между стажем работы x и производительностью труда y существует корреляционная связь.

О наличии и направлении связи можно судить и по «внешнему виду» таблицы, то есть по расположению в ней частот. Если частоты расположе-ны в клетках беспорядочно, то это свидетельствует об отсутствии связи или незначительной зависимости y от x. Если частоты расположены по диагонали из верхнего левого угла в нижний правый угол, то это свиде-тельствует о прямой линейной зависимости между показателями x и y. Расположение по диагонали из нижнего левого угла в верхний правый свидетельствует об обратной линейной зависимости. В приведенном примере (табл. 2) распределение частот по диагонали из верхнего левого угла в нижний правый угол, свидетельствует о прямой линейной зависи-мости между показателями стажа работы x и производительности труда y.

Page 65: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

65

При построении эмпирической линии регрессии по данным корреляци-онной таблицы в качестве x принимаются значения середины интервалов факторного признака, а в качестве y — групповые средние результативного прзнака iy . Если наличие корреляции выявляется графически, предпочти-тельнее по исходным данным строить «корреляционное поле», а затем на его фоне по средним значениям y — эмпирическую линию регрессии.

Коррекционное поле представляет, по сути, ту же корреляцинную таблицу, только в клетках вместо чисел (частот) проставлены соответст-вующие точки на плоскости пары x и y. Корреляционное поле не только отражает общую зависимость между x и y, но и концентрацию индивиду-альных точек вокруг линии регрессии показателя iy .

На основе аналитических групповых и корреляционных таблиц можно измерить тесноту связи с помощью эмпирического корреляционного от-ношения

σδ

η 2

2

y

эмп x= , j

j

m

f

fyy

−=

2)(1

2δ , i

i

k

y f

fyy

−=

2)(1

2σ ,

где эмпη — эмпирическое корреляционное отношение; δ2 — общая диспер-сия; σy

2 — межгрупповая дисперсия; fj = fx — частота в j — ой группе x; fj = fy — частота в i — ой группе y; m — число групп по факторному признаку x; k — число групп по результативному признаку y; iy — индивидуаль-ные значения результативного признака; y — общее среднее значение ре-зультативного признака; iy — средние значения результативного признака по группам.

Квадрат эмпирического корреляционного отношения, то есть

σδη 2

2

2

y

эмпx

x

= , называется эмпирическим коэффициентом детерминации.

В нашем примере межгрупповая дисперсия равна:

j

j

m

f

fyy

−=

2)(1

2δ =40

2)1487,16(2)1431,15(2)1408,12(2)1475,8( −+−+−+−

=[(-5,25)2 +(-1, 92)2 + (1,31)2+(2,87)2]/40= (27,5625+3,6864 + 1,7161+ 8,2369)/40 = 41,2019/40 =1,0300475;

Page 66: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

66

Общая дисперсия равна:i

i

k

y f

fyy

−=

2)(1

2σ = [3(5-14)2+ 9(10-14)2+ 21(15-14)2

+ 7(20-14)2]/40 = [3(-9)2+ 9(-4)2+ 21(1)2 + 7(6)2]/40= [3*81+ 9*16+ 21 + 7*36]/40=[3*81+ 9*16+ 21 + 7*36]/40 = (243 + 144 + 21 +252)/40 = 660/40 = 16,5;

σδη 2

2

2

y

эмпx

x

= = 1,03/16,5 = 0,062

Извлекая квадратный корень, получим: эмпη = 062,0 = 0.2598.

Полученное значение эмпирического корреляционного отношения эмпη = 0,26 характеризует тесноту связей, как очень слабую (<0,3), то есть

производительность труда хотя и зависит от стажа работников, но значи-тельно больше зависит от других факторов (фондовооруженности, квали-фикации и т.д.).

Изучение связей между качественными показателями Качественные признаки (пол, образование, профессия работников,

форма собственности предприятий и т.д.), взаимосвязи между ними, их влияние на другие показатели (в том числе и количественные) особенно часто приходится изучать при проведении различных социологических ис-следований путем опроса или анкетирования. Если признаки показателей атрибутивные, для изучения связей используют комбинационное распре-деление единиц совокупности по двум (и более) признакам, оформляемое в виде таблиц сопряженности.

Для измерения тесноты связи между группировочными признаками в таблицах взаимной сопряженности используют такие показатели, как ко-эффициент ассоциации Кас, коэффициент контингенции Кконт, коэффициен-ты взаимной сопряженности Пирсона и Чупрова. Первые два применяются лишь для «четырехклеточных» таблиц, а последние — для любой размер-ности. Частоты в первых можно обозначить через a,b,c,d .

Рассмотрим такую таблицу связи «четырех полей» (табл. 4) и рассчи-таем соответствующие коэффициенты.

В условном примере приведены данные о распределении 500 опро-шенных человек по двум показателям: наличие (отсутствие) прививки от гриппа и факт заболевания (незаболевания) гриппом во время эпидемии. Не трудно заметить, что среди сделавших прививку 90 % не заболели гриппом, а среди не сделавших 60 % заболели. Можно предположить , что прививка положительно влияет на предупреждение заболевания и сущест-вует статистическая зависимость между группировочными признаками.

Page 67: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

67

Это суждение можно подкрепить статистическими критериями, например критерием Пирсона χ 2

x

, и приведенными выше коэффициентами .

Коэффициент ассоциации выражается формулой: Кас=

bcadbcad

+− =

12027080301202708030

⋅+⋅⋅−⋅ = - 0.862.

Таблица 4. Таблица четырех полей *

группы лиц Число лиц

Заболевших гриппом

Не заболевших гриппом Итого

Сделавших прививку 30 (a) 270 (b) 300

Не сделавших прививку 120 (c) 80 (d) 200

Итого 150 350 500 Теоретические значения числа лиц Группа I (да) II (нет) ∑ I (да) 30 (90) 270 (210) 300 II (нет) 120 (60) 80 (140) 200 ∑ 150 350 500

* Таблица сконструирована по данным, приведенным в [13, c. 213]

Коэффициент контингенции выражается формулой: Кконт =

))())(( dacadcbabcad

++++− =

3501502003001202708030⋅⋅⋅

⋅−⋅ = - 0,534.

Связь считается достаточно значительной и подтвержденной, если асК > 0,5 или контК >0,3. Поэтому в нашем примере оба коэффициента ха-

рактеризуют достаточно большую обратную зависимость между привив-ками и заболеванием.

Чтобы использовать критерий Пирсона, в таблице взаимной сопря-женности наряду с эмпирическими частотами (или частостями) записыва-ют теоретические частоты, рассчитываемые исходя из нулевой гипотезы, то есть в предположении, что зависимость между признаками отсутствует. При этом теоретические частоты (частости) по строкам (или графам) рас-считывают пропорционально распределению единиц в итоговой строке (или графе). Например, в итоговой строке доля заболевших 0,3 (не забо-левших-0,7). Соответственно в переписанной таблице (нижние строки) теоретические частоты представлены рядом с эмпирическими в скобках.

Критерий Пирсона χ 2

x

рассчитывается по формуле:

χ 2

x

=( )

ijf

iff jij

ji ′

′−

2 или χ 2

x

= Nijf

fijji

−′

2 ,

где N =∑ fij — общее число единиц совокупности;

Page 68: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

68

fij — эмпирические частоты по группам; ijf ′ — теоретические частоты по группам. Подставив соответствующие

данные из таблицы 7, получим:

χ 2

x

= Nijffij

ji

−′

2 = (302/90 + 2702/210 +1202/60 + 802/140) - 500 =142,85.

Рассчитанное (фактическое) значениеχ 2

x

сравнивается с табличным,

определяемым по таблице приложения 4 [13] для заданного уровня значи-мости α и числа степеней свободы ύ = (k1-1)(k2-1), где k1 и k2 — число групп по признакам группировки (число строк и граф в таблице).

В рассматриваеиом примере ύ = (2-10)(2-1) = 1. Приняв уровень зна-чимости α = 0.05, по Приложению 4 [13] находим χ 2

x

табл = 3,84. Так

какχ 2

x

факт > χ 2

x

табл , то выдвинутая нулевая гипотеза отвергается, а это зна-

чит, что существует статистическая зависимость между наличием привив-ки и заболеванием гриппом.

Аналогично рассчитываются теоретические частоты и критерий Пир-сона χ 2

x

и в таблицах взаимной сопряженности большей размерности.

Коэффициент взаимной сопряженности Пирсона рассчитывается на основе показателяχ 2

x

по формуле:

Кп = С =n+χ

χ2

2

= 5008,1428,142

+= 0,46.

Коэффициент взаимной сопряженности Чупрова также рассчитывается на основе показателяχ 2

x

по формуле:

Кч = )1)()(1( 21

2

−− kkn

χ=

)12)(12(50085,142

−−= 0,53,

где n — число единиц наблюдения; k1 и k2-соответственно число строк и столбцов в таблице.

Итак, на основе метода группировок с помощью коэффициентов мо-жет быть измерена теснота связей и между качественными показателями.

Линейный коэффициент корреляции Для измерения тесноты связи между количественными показателями

применяются: ˗ линейный коэффициент корреляции; ˗ теоретическое корреляционное отношение; ˗ индекс корреляции.

Page 69: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

69

При расчете линейного коэффициента корреляции учитываются вели-чины отклонений индивидуальных значений признака от средней, т.е. со-ответственно для факторного и результативного признаков величины

. Однако непосредственно сопоставлять между собой дан-ные абсолютные величины нельзя. Сравнению подлежат отклонения, вы-раженные в долях среднего квадратического отклонения (нормированные отклонения). Рассчитывают среднее произведение нормированных откло-нений, которое называется линейным коэффициентом корреляции: где

После преобразования формула для расчета линейного коэффициента корреляции принимает вид:

Направление связи и степень ее тесноты можно оценить с помощью таблицы 5.

Линейный коэффициент корреляции может принимать любые значе-ния в пределах от -1 до + 1. Чем ближе коэффициент корреляции по аб-солютной величине к 1, тем теснее связь между признаками. Знак при ли-нейном коэффициенте корреляции указывает на направление связи.

Линейный коэффициент корреляции применяется для измерения тес-ноты связи только при линейной форме связи. Равенство r = 0 говорит лишь об отсутствии линейной корреляционной зависимости, но не вообще об отсутствии корреляционной, а тем более статистической зависимости. Величина коэффициента корреляции не является доказательством наличия причинно-следственной связи между исследуемыми признаками, а являет-ся оценкой степени взаимной согласованности в изменениях признаков.

( ) ( )yyxx ii −− и

( ) ( )[ ]σσ

σσyx

n

iii

n

y

i

x

i

nyyxx

yyxx

n

i

r =

−⋅−=

−⋅

==

11

( )n

xxxxn

ii

nni

n

ii

n

ix 2

2

1

2

1

2

1

=−== ==σ

( )n

yyyyn

ii

nni

n

ii

n

iy 2

2

1

2

1

2

1

=−== ==σ

( ) ( )

⋅−

−⋅−

=

====

===

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

iii

yynxxn

yxyxnr

1

2

1

2

1

2

1

2

111

Page 70: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

70

Таблица 5. Линейный коэффициент корреляции для измерения тесноты связей

Значение коэффициента корреляции

Степень тесноты связи Направление связи

линейная связь отсутствует -

очень слабая обратная

очень слабая прямая

слабая обратная

слабая прямая

умеренная обратная

умеренная прямая

тесная обратная

тесная прямая

очень тесная обратная

очень тесная прямая

функциональная линейная обратная

функциональная линейная прямая

Значимость коэффициента корреляции можно исследовать с помощью t-статистики. Пусть по результатам выборочного наблюдения r ≠0. Объяс-няется ли это действительно существующей корреляционной связью меж-ду признаками в генеральной совокупности или является следствием слу-чайности отбора элементов в выборку? В качестве статистического крите-рия для гипотезы Н0 ( коэффициент корреляции в генеральной совокупно-сти равен нулю) обычно используется величина , которая распределена по закону Стьюдента с степенями свобо-ды. Гипотеза Н0 отвергается (т.е. зависимость считается установленной), если t превысит допустимое значение при уровне значимости α и c степенями свободы. Допустимые значения t- критерия Стьюдента при уровне значимости и степенями свободы приводятся в таб-лицах (пример, табл.6).

1,01,0 +≤≤− r1,03,0 −<≤− r

3,01,0 ≤< r3,05,0 −<≤− r

5,03,0 ≤< r5,07,0 −<≤− r

7,05,0 ≤< r7,09,0 −<≤− r

9,01 −<<− r19,0 << r

1−=r1=r

9,07,0 ≤< r

2−= nk

t n 2, −α

α2−= nk

2−= nk

21 2

−−

⋅= nr

rt 2−= nk

Page 71: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

71

Таблица 6 Значения tтабл *

k = n-2

18

α = 0,5 2,10

α=0,01 2,88

19 2,09 2,86 20 2,09 2,85 21 2,08 2,83 22 2,07 2,82 23 2,07 2,81 23 2,06 2,80 24 2,06 2,79 25 2,06 2,78 26 2,05 2,76 28 2,05 2,76 29 2,04 2,75 30 2,02 2,70 40 2,00 2,66 60 1,98 2,62

120 1,96 2,58 * [1, c. 199; 13, c.438]

Уравнение регрессии Определение формы связи и отыскание параметров уравнения назы-

вается нахождением уравнения связи (уравнения регрессии). Найти урав-нение регрессии — значит по эмпирическим данным математически опи-сать изменения взаимно коррелируемых величин. Уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональ-ную связь средней величины результативного признака y со значениями факторного признака x или теоретическую линию регрессии. Рассчитан-ные по уравнению значения результативного признака называются теоре-тическими (обозначаются xy ).

Для характеристики связей экономических показателей используют следующие типы функций:

- линейную xaayx10

+= - гиперболическую ; - степенную ; - показательную ; - параболическую ; - логарифмическую ; - логистическую .

α

( )xaayxln

10ˆ +=

e xaaayx 211ˆ 0

++=

xaxaayx

2210ˆ ++=

xaayx

1

0ˆ +=

xay ax

10ˆ =

aay xx 10ˆ =

Page 72: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

72

Параметры уравнений связи определяют из так называемой системы нормальных уравнений, отвечающих требованию метода наименьших квадратов (МНК). Это требование можно записать как min2( )

1→ −

=

yyi

n

i

,

то есть требуется определить, при каких значениях параметров сумма квадратов отклонений y от xy будет минимальной.

Необходимым условием экстремума является равенство нулю частных производных по параметрам. Приравнивая к нулю частные производные функции по параметрам, получим систему линейных уравнений для нахо-ждения параметров по имеющимся эмпирическим данным:

При линейной зависимости она имеет вид:

=+

=+

===

==n

iii

n

ii

n

ii

n

ii

n

ii

yxxaxa

yxaa n

11

21

10

1110

Необходимые для решения данной системы показатели (суммы) опре-деляются по наблюдаемым эмпирическим данным. Параметр a1 называет-ся коэффициентом регрессии. Он показывает, на сколько в абсолютном выражении изменится результативный показатель y при изменении фак-торного показателя x на единицу.

Рассмотрим расчет параметров уравнения регрессии на примере, ис-ходные данные по которому приведены в табл. 7 (графы 1, 2). Они соот-ветствуют данным, приведенным в табл. 1 (графы 2, 3).

Таблица 7. Расчетная таблица для определения параметров уравнения регрессии

по индивидуальным данным Основные производственные

фонды, млн.руб. xi

Валовый выпуск продукции, млн. руб.

yi x2 xy xy

1 2 3 4 5 12 28 144 336 15 16 40 256 640 24 25 38 625 950 43 38 65 1444 2470 70 43 80 1849 3440 81 55 101 3025 5555 106 60 95 3600 5700 117 80 125 6400 10000 159 91 183 8281 16653 183

100 245 10000 24500 202

∑520 ∑y =1000 ∑ x2 =35624 ∑xy = 70244

∑ xy = 1000

Средние 52 100 120 244

Page 73: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

73

Решение Заполним графы 3-4 таблицы 7, рассчитав соответствующие произве-

дения и просуммировав их. Подставив найденные суммы в систему нор-мальных уравнений получим:

=+

=+

7024435624520

100052010

10

10

aaaa

Решив полученную систему уравнений, найдем, что а0 = -10,24, а1 = 2,12. Коэффициент регрессии, равный а1 = 2,12, показывает, что при изме-нении объема основных фондов (факторного показателя x) на 1 млн. руб. валовый выпуск продукции (результативный показатель y) увеличится на 2,12 млн. руб..

Отсюда искомое уравнение xaayx10

+= = будет

aayx 12,224,10 10+−= .

Подставив в данное уравнение последовательно значения х (12,16, 25 и т.д.), находим xy (графа 5 табл. 7). Его можно использовать и для про-гноза. Например, если объем фондов будет 120 млн руб.,то объем выпуска можно ожидать 244 млн.руб.(см последнюю строку).

Для расчета параметров уравнения по сгруппированным данным стро-ят аналитическую или корреляционную таблицы, где указаны распределе-ния по x и y и, соответственно, их частоты fx и fy. При этом ∑fx = ∑fy = n. Поэтому система нормальных уравнений для расчета параметров линейно-го уравнения регрессии будет иметь вид:

=+

=+

===

==n

ixy

n

i

n

i

n

iy

n

ix

fyxfxafxa

fyfxaa

xx

n

11

21

10

1110

Рассмотрим расчет параметров уравнения регрессии по данным кор-реляционной таблицы на примере, исходные данные по которому приве-дены в табл. 8 . Они соответствуют данным, приведенным в табл. 3. До-полнительно созданные три столбца (графы 7-9) и 2 строки внизу позво-ляют получить все необходимые суммы для расчета параметров.

Подставив полученные суммы в систему уравнений, имеем:

=+

=+

2640904176

56017640

10

10

aaaa

Решив систему, находим параметры: a0 = 8,06, a1 = 1,35. Искомое уравнение будет:

aayx 35,106,8 10+=

По данным корреляционной таблицы легко рассчитать и линейный коэффициент корреляции по формуле:

σσ yx

yxxyrxy

−= .

Page 74: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

74

Таблица 8. Расчетная таблица нахождения параметров уравнения регрессии

по сгруппированным данным Значение признака xi

Значение признака yi Итого fx = fj xfx x2fx xyfxy 5 10 15 20 1 2 3 4 5 6 7 8 9 1 1 3 - - 4 4 4 35 3 2 3 7 - 12 36 108 435 5 - 3 9 4 16 80 400 1225 7 - - 5 3 8 56 392 945 Итого (число единиц fy =fi

3 9 21 7 ∑fj = 40 176 904 2640

yfy 15 90 315 ∑yfy= 560 y =14

y2fy 75 900 4725 ∑y2fy= 8500 212,5

Cредние x =4,4 22,6

Все средние арифметические (числитель ) приведены в таблице, а не-обходимые среднеквадратические отклонения найдем по формулам:

)( 22 yy yyy −=σ = 4,46,22 2− = 1,8

)( 22 yy xxx −=σ = 145,212 2− = 4,06.

Отсюда r = 06,48,1

144,466

⋅−= 0,6. То есть, между производительностью тру-

да y и стажем работников x связь cредняя( умеренная). Рассмотрим решение некоторых задач корреляционно-регрессионного

анализа по теме на примере. Пусть по 10 однотипным предприятиям имеются следующие данные

о выпуске продукции (x) и о расходе условного топлива (y) в тоннах (гра-фы 1 и 2 таблицы 9):

Таблица 9. Расчет показателей корреляционно-регрессионного анализа*

X Y x2 Xy yx = 1,16 +0,547 x y2 1 2 3 4 5 6 5 4 25 20 3,9 16 6 4 36 24 4.4 16 8 6 64 48 5.5 36 8 5 64 40 5.5 25 10 7 100 70 6.6 49 10 8 100 80 6.6 64 14 8 196 112 8.8 64 20 10 400 200 12.1 100 20 12 400 240 12.1 144 24 16 576 384 14.3 256 125 80 1961 1218 80 770 12,5 8,0 196,1 121,8 8,0 77,0 * [1, c. 95-96]

Page 75: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

75

Требуется найти уравнение зависимости расхода топлива от выпуска продукции (или уравнение регрессии y по x) и измерить тесноту связей между ними.

Решение представим в виде методики регрессинно- корреляционного анализа, раскрывающей их суть.

1. Построим уравнение регрессии в форме линейной функции вида yx = a0 + a1 x, параметры уравнения (a0 и a1) найдем из системы нормальных уравнений

1.1. Чтобы получить необходимые для решения показатели введем вспомогательные графы 3 и 4 (x2 и xy) таблицы и в итоговой строке таб-лицы поставим суммы ∑x, ∑y, ∑x2, ∑xy, рассчитанные путем суммирова-ния всех элементов граф. Подставляем их в уравнения и решаем систему:

10 a0 + 125 a1 = 80, 125 a0 +1961a1 = 1218,

Находим а1 и а0.

a1 = (10*1218-125*80): (10*1961- 1252 ) = 2180:3985 = 0,547 a0 = (80:10)- 0,547*125: 10 = 8- 6,84 = 1,16

Отсюда yx = 1,16 +0,547 x. Подставляя в это уравнение последовательно значения x = 5, 6, 8, 10

и т.д., получаем выравненные (теоретические) значения результативного показателя yx (графа 5 таблицы). Величина суммы по графе 5 должна быть близка к сумме по графе 2 (отличаться только за счет округлений при расче-тах), так как по МНК отклонения должны взаимно погаситься по свойству средней арифметической. Сумма выравненных значений в графе 5 (80) точ-но равна сумме эмпирических значений в графе 2 (80), что свидетельстует о возможности аналитического выравнивания по прямой зависимости.

1.2. Для измерения тесноты связи между y и x рассчитаем линейный коэффициент корреляции по самой простой формуле:

rxy σσ

y

xa1=

×−=

==

===n

ii

n

ii

n

ii

n

ii

n

iii

xxn

yxyxna

1

2

1

2

1

111

=+

=+

===

==n

iii

n

ii

n

ii

n

ii

n

ii

yxxaxa

yxaa n

11

21

10

1110

Page 76: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

76

Для расчета дисперсии по y введем вспомогательную графу 6 таблицы (у2) и дополнительную строку средних величин, полученную делением всех сумм на n (10). Находим xy =121,8; x =12,5; y =8; x2 =196,1, y2 = 77,0.

Используя простейшую формулу расчета дисперсии и данные строки средних получим:

(σx)2= 196.1 – 12.52 = 196,1 – 156,25 = 39,85; σx = 6,31. (σy)2 = 77 - 82 = 13; σy = 3,6.

rxy = 0,547* 6,31 : 3,6 = 0,96. Значение линейного коэффициента корреляции (0,96), близкое к еди-

нице, характеризует не только меру тесноты зависимости вариации y от вариации x, но и степень близости этой зависимости к линейной.

Аналогичный результат можно получить и по формуле

Подставив все имеющиеся в таблице показатели, получим rxy = (121,8 - 12.5*8) : (6,31*3,6) = 21,8 : 22,716 = 0,96

Для оценки значимости (существенности) линейного коэффициента необходимо его сопоставить со средней квадратической ошибкой (σr).Для n<30 значимость коэффициента корреляции проверяется на основе t-критерия Стьюдента.

σr =( r21− ) : ( 2−n ) =( 96,01− ): ( 210− ) = 0,1 tфакт = 0.96 : 0,1 = 9,6

По таблице Приложения 9 в [1, с. 199] находим, что при числе степе-ней свободы n-2 (8) и уровне значимости α = 0.05 табличное (критическое) значение tтабл равно 2.306. Поскольку tфакт > tтабл, то линейный коэффици-ент rxy = 0,96 считается значимым , а связь между x и y – реальной.

Следовательно, между выпуском продукции х и расходом условного топлива y в данном примере существует прямая линейная связь, близкая к функциональной.

Выполнить корреляционный и регрессионный анализ можно на пер-сональном компьютере по пакетам прикладных программ Excel, Eviews, Statgraphics и другим. Подробно методика их использования и примеры рассмотрены в [7, c.98-99, 11, с.191-218].

Для данного примера методика расчета по программам парной ли-нейной регрессии с помощью Microsoft Office Excel 2007 включает сле-дующие действия [7, c. 98]:

1. Выбрать Данные — Анализ данных — Регрессия 2. В диалоговом окне Регрессия сделать следующее:

( ) ( )

⋅−

−⋅−

=

====

===

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

iii

yynxxn

yxyxnr

1

2

1

2

1

2

1

2

111

Page 77: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

77

- ввести в окне редактирования Входной интервал Y диапазон зави-симой переменной;

- ввести в окне редактирования Входной интервал X диапазон зави-симой переменной;

- установить флажок Метки, если первая строка содержит названия столбцов;

- установить флажок Константа — ноль, если в уравнении регрессии отсутствует свободный член a;

- ввести в окне редактирования Выходной интервал номер свобод-ной ячейки на рабочем листе;

- Нажать кнопку ОК. При криволинейной зависимости линейный коэффициент корреляции

недооценивает степень тесноты связи и даже может быть равен 0, а потому в таких случаях рекомендуется использовать в качестве показателя степе-ни тесноты связи другие величины.

Корреляционное отношение Согласно правилу сложения дисперсий, общая дисперсия равна

сумме средней из групповых и межгрупповой дисперсий:

Зная общую и межгрупповую дисперсии, можно оценить долю, кото-рую составляет вариация под действием фактора в общей вариации ре-зультативного признака, т.е. найти отношение дисперсий

σδη 2

2

2

y

эмпx

x

=

Эмпирическое корреляционное отношение определяется как корень из этого отношения дисперсий:

σδ

η 2

2

y

эмп x=

где σ2 — общая дисперсия, δ2 — межгрупповая дисперсия, эмпη — эмпири-ческое корреляционное отношение.

Корреляционное отношение равно нулю, когда нет колеблемости в величине средних значений результативного признака по выделенным группам. В тех случаях, когда средняя из групповых дисперсий близка к нулю, т.е. практически вся вариация результативного признака обусловле-на действием фактора , величина корреляционного отношения близка к 1.

Теоретическое корреляционное отношение (индекс корреляции) применяется для измерения тесноты корреляционной связи между призна-ками при любой форме связи, как линейной, так и нелинейной. Данный показатель можно вычислять только после того, как определена теоретиче-

σδσ 222 j+=

σση 2

2

1 j−=

Page 78: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

78

ская линия регрессии. Теоретическое корреляционное отношение рассчи-тывается на основе выравненных (теоретических) значений результативно-го признака xy (по уравнению регрессии). Теоретическое корреляционное отношение представляет собой относительную величину, получаемую в результате сравнения среднего квадратического отклонения в ряду тео-ретических значений результативного признака со средним квадратиче-ским отношением в ряду эмпирических значений (или корень квадратный из отношения дисперсий теоретического и эмпирического ряда значений результативного признака). Оно рассчитывается по формуле:

σδ

η 2

2

y

теорyx=

где теорη — теоретическое корреляционное отношение;

( )nxi

y

n

i

yyx

−== 1

2

2δ — факторная дисперсия, которая характеризует вариа-

цию результативного признака под влиянием признака-фактора. σ 2

y — общая дисперсия, показывающая вариацию результативного при-знака под влиянием всех факторов, вызывающих эту вариацию. Отноше-ние факторной дисперсии к общей дисперсии называется теоретическим коэффициентом детерминации теорη 2 :

σδη 2

2

2

y

теорx= .

Теоретический коэффициент детерминации показывает, какую долю в общей дисперсии результативного признака занимает дисперсия, выра-жающая влияние вариации фактора x на вариацию y. В основе исчисления и эмпирического и теоретического корреляционного отношения лежит правило сложения дисперсии, согласно которому в первом случае общая дисперсия равна сумме межгрупповой дисперсии и средней из групповых, то есть . Во втором случае в качестве межгрупповой дисперсии выступает дисперсия теоретических значений результативного признака, которую можно назвать факторной σ 2

фактор , поскольку она отражает влия-ние фактора x на вариацию y. А вместо средней из групповых дисперсий принимается остаточная дисперсия σ 2

ост x, отражающая влияние на вариа-

цию результативного признака всех остальных факторов (кроме x), не уч-тенных в модели (в уравнении регрессии). Таким образом, общая дисперсия эмпирического ряда y равна сумме факторной и остаточной дисперсий:

σσσ 222

остфакторy x+= ,

σδσ 222 j+=

Page 79: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

79

а теоретическое корреляционное отношение будет исчисляться по формуле:

σδη 2

2

y

фактортеор

x= .

Факторную дисперсию можно выразить как разность σσσ 222

остyфактор x−= .

Если ввести в формулу остаточную дисперсию, которая характеризует вариацию результативного признака под влиянием прочих неучтенных факторов

n

i xост

n

iyy

x

==

1

2

2σ ,

то получим

σδδη 2

22

y

остфактортеор

x−

= или σδη 2

2

1y

осттеоркоррI −== .

В последнем виде корреляционное отношение при криволинейной форме связи называется индексом корреляции I корр.

Индекс корреляции может находиться в пределах от 0 до 1. Если результативный признак всецело зависит от фактора x (т.е. связь

функциональная), то выравненные (теоретические) значения xy совпада-ют с эмпирическими y. Тогда σσ 22

yфактор = , или σ 2

остx=0 и корреляционное

отношение теорη =1, что означает полную зависимость вариации y от ва-риации x. Если же фактор x не оказывает никакого влияния на вариацию y, то общая дисперсия σ 2

y совпадает с остаточной σ 2

остx, то есть σσ 22

остy x= .

И в этом случае теорη = 0. Это означает, что признак y не коррелирован с фактором x.

Чем ближе значения теорη к 1, тем теснее связь между вариацией x и y.

И наоборот, , чем ближе теорη к 0, тем зависимость слабее. Считается, что

если теорη < 0,3, то зависимость малая;

0,3 < теорη < 0,6 — зависимость средняя;

0,6 < теорη < 0,8 — зависимость выше средней;

теорη .> 0,8 — зависимость большая. Рассмотрим корреляционную связь на условном примере параболы 2-

го порядка, отражающей зависимость между урожайностью озимой

Page 80: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

80

пщеницы в ц/ га (y) и количеством внесенных органических удобрений в т/га (x) и рассчитаем индекс корреляции (табл. 10, 10-1).

Таблица 10. Расчетная таблица для определения параметров параболы 2-го порядка*

X y x2 x3 x4 xy x2y xy 1 2 3 4 5 6 7 8 1 16 1 1 1 16 16 16,2 2 19 4 8 16 38 76 18,5 3 20 9 27 81 60 180 20,4 4 22 16 64 256 88 352 21,9 5 23 25 125 625 115 375 23,0 ∑ 15 100 55 225 979 317 1199 100

* [13, c. 250-253 и c. 260-261]

Уравнение параболы имеет вид: xy =a0 + a1x + a2x2.

Параметры найдем по методу наименьших квадратов, для чего ис-пользуем систему нормальных уравнений:

na0 + a1∑x + a2∑x2 = ∑y, a0∑x + a1∑x2 + a2∑x3 =∑xy,

a0∑x2 + a1∑x3 + a2∑x4 = ∑x2y. По данным таблицы 6 (графы 1-7) система уравнений запишется:

5a0 + 15a1 + 55a2 = 100,

15a0 + 55a1 + 225a2 =317,

55a0 + 225a1 + 979a2 = 1199. Решив эту систему, получим:

a0 =13,41, a1 =2,98, a2 = - 0,214.

Отсюда искомое уравнение xy =13,41+ 2,98x – 0,214x2.

Подставив в это уравнение значения x (графа 1) получаем теоретиче-ские значения результативного показателя xy (графа 8).

Для расчета теоретического корреляционного отношения (индекса корреляции) построим таблицу 10-1, взяв исходные данные (графы 1-3) из таблицы 10 (графы 1,2. 8).

Общая средняя урожайность равна (графа2, графа 3):

y = n

n

iy

=1 = 100/5 = 20 ц / га.

Общая дисперсия рассчитывается по формуле (данные в графе 5):

σ 2y =

( )n

n

iyy −

=1

2

= 30/5 = 6.

Page 81: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

81

Таблица 10-1 Расчетная таблица для нахождения корреляционного отношения.

X Y xy y- y (y- y )2 yy x − ) ( )yy x− 2 y- xy (y- xy )2

1 2 3 4 5 6 7 8 9 1 16 16,2 -4 16 -3,8 14,44 -0,2 0,04 2 19 18,5 -1 1 -1,5 2,25 0,5 0,25 3 20 20,4 0 0 0,4 0,16 -0,4 0,16 4 22 21,9 2 4 1,9 3,61 0,1 0,01 5 23 23,0 3 9 3,0 9,00 0 0

∑ 15 100 100 0 30 0 29,46 0 0,46 Средн. 20 20 6 5,892 0,077

Факторная дисперсия рассчитывается по формуле (данные в графе 7).

σ 2y =

( )nx

n

iyy −

=1

2

= 29,46 / 5 = 5,892.

Отсюда теоретическое корреляционное отношение равно:

теорη = σσ

2

2

y

факторx

= 6

892,5x = 0,99.

Полученное значение теорη =0,99 характеризует очень тесную зависи-мость изменения урожайности от изменения количества внесенных удоб-рений.

Такой же результат получим, используя формулу индекса корреляции. Данные для остаточной дисперсии σ 2

ост xрассчитаны в графе 9 табл. 10-1.

Остаточная дисперсия равна:

( )n

yy xост

n

i

x

=

−= 12

2

σ = 0,46/6 = 0,077.

Отсюда

σδη 2

2

1y

осттеоркоррI −== =

6077,01 − = 0,99.

Оценка существенности коэффициента регрессии и уравнения регрессии

Параметры уравнения регрессии представляют собой лишь оценку реальных параметров связи в генеральной совокупности. Поэтому найдя по эмпирическим данным параметры уравнения регрессии, определяют их среднюю ошибку μa и с заданной вероятностью пределы, в которых эти параметры могут находиться. Затем параметры проверяют на существен-ность (значимость) путем сопоставления их значений со средней ошибкой. Это соотношение обозначают t.

ta = a / μa .

Page 82: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

82

Если значение ta >3 при большом числе наблюдений, или tфакт > tтабл при n <30, параметр считается значимым.

Для приведенного примера ( хy = 1,16 +0,547 x , см. стр.86-87) опреде-лим tфакт для коэффициента регрессии а1 по формуле:

ta1 =r

ay

x n2

1

1

2

σσ =

96,0 21

21031,6547,0

6,3 −

−⋅ =28,06,3

828,231,6547,0⋅

⋅⋅ = (9,761/1,008)= 9,683.

Так как tфакт > tтабл (9,683 > 2,306), можно сделать вывод о значимости коэффициента регрессии а1= 0.547.

Наряду с проверкой значимости отдельных параметров осуществляет-ся проверка значимости уравнения регрессии в целом, то есть проверка адекватности модели. Эта задача решается путем расчета F-критерия Фи-шера и сопоставления его с табличным (критическим).

F-критерий Фишера представляет собой отношение факторной дис-персии к остаточной дисперсии, каждая из которых рассчитана на одну степень свободы:

F = )/(

)1/(2

2

mn

m

ост

фактор x

δδ ,

где m — число параметров в уравнении регрессии; (m-1) — число степеней свободы для факторной дисперсии (теоретических значений y); n — число наблюдений; (n-m) — число степеней свободы для остаточной дисперсии.

Часто вместо числа параметров уравнения регрессии m принимается число коэффициентов регрессии k, которое на единицу меньше m, то есть k = m-1. А отношение дисперсий можно заменить корреляционным отно-шением или коэффициентом детерминации r2. Тогда формула критерия Фишера будет иметь вид:

kknF

rr )1(

1 2

2−−=

−.

Расчетное F сопоставляется с табличным, определяемым для числа степеней свободы ύ1 = m-1 и ύ2 =n-m и заданного уровня значимости α. Табличное F приводится в учебниках [13, Приложение 8]. Если Fрасч > Fтабл, уравнение значимо.

Проверим на значимость уравнение регрессии хy = 1,16 +0,547 x, для которого r =0,96, n= 10, m=2:

12210

96,01

96,0 2

2 −−

−=расчF = 0,9216/0,0784*8 = 94.

Fтабл для α = 0, 05, ύ1= 1, ύ2 = 8 равно 5,32. Так как Fрасч > Fтабл , уравне-ние регрессии значимо, то есть зависимость между о выпуском продукции (x) и расходом условного топлива (y) в тоннах (графы 1 и 2 таблицы 2) реальна.

Page 83: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

83

Контрольные вопросы и задания1. В чем состоит отличие между корреляционной и функциональной связью?2. Какие показатели используют для измерения степени тесноты связи между каче-

ственными признаками?3. Как оценить существенность линейного коэффициента корреляции?4. Если в случае линейной зависимости между признаками 60 % вариации резуль-

тативного признака объясняется влиянием факторного признака, чему будет рав-на величина коэффициента корреляции?

5. Какая существует связь между линейным коэффициентом корреляции и коэффи-циентом регрессии?

6. В чем состоит значение уравнения регрессии?7. Что характеризуют параметры уравнения регрессии?8. Как осуществить прогноз значений результативного признака, опираясь на ис-

пользование для этой цели уравнения регрессии?9. Какое значение имеет расчет индекса корреляции?10. Способы расчета средней квадратической ошибки уравнения, ее роль в оценке

надежности уравнения регрессии.11. Как измерить долю общей вариации результативного признака, которая объясня-

ется влиянием вариации факторного признака?

Тема 2. Изучение динамики общественных явлений

Понятие о временных рядах (рядах динамики). Общая характери-стика временных рядов, задачи анализа, требования к исходной ин-формации, составляющие временного ряда, правила построения рядов динамики.

Виды рядов динамики. Сопоставимость уровней и смыкание рядов динамики. Показатели ряда динамики и методы их исчисления. Сред-ний уровень ряда. Абсолютный прирост. Темп роста. Темп прироста.

Выявление и характеристика основной тенденции развития (тренда).Понятие сезонной неравномерности и ее характеристика. Корреля-

ционная зависимость между уровнями различных рядов динамики.

Важнейшая задача статистического анализа- изучение изменения явле-ний во времени для их использования в практике прогнозирования. Про-гнозирование — это оценка будущего на основе всестороннего анализа тенденций развития социально-экономических явлений и их взаимосвязей. Процесс прогнозирования предполагает выявление возможных альтерна-тив развития в перспективе для обоснованного их выбора и принятия оп-тимального решения. Первоначальный этап прогнозирования всегда связан с анализом временных рядов, который позволяет охарактеризовать законо-мерность изменения явления во времени. При изучении рядов динамики необходимо обратить внимание на необходимость сопоставимости уровней

Page 84: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

84

ряда, научиться определять различные виды рядов динамики (моментные, интервальные, ряды относительных и средних величин) и рассчитывать для них простейшие показатели: средний уровень, абсолютные приросты, тем-пы роста и прироста. К числу основных задач, возникающих при изучении динамических рядов, относятся следующие:

- характеристика интенсивности изменений в уровнях ряда от периода к периоду или от даты к дате;

- определение средних показателей временного ряда за тот или иной пе-риод;

- выявление основных закономерностей динамики исследуемого явле-ния на отдельных этапах и в целом за рассматриваемый период;

- выявление факторов, обусловливающих изменение изучаемого объекта во времени;

- прогноз развития явления на будущее.

Понятие рядов динамики, их виды и основные элементыРяд расположенных в хронологической последовательности значений

статистических показателей, представляет собой временной (динамиче-ский) ряд. Ряд динамики состоит из двух элементов:

- показатель времени (t) указывает моменты или периоды времени, к ко-торым относятся приводимые статистические данные;

- уровень ряда (y) — статистические показатели, которые характеризу-ют изучаемый объект на определенный момент или за указанный период времени.

По характеру отображения динамики временные ряды подразделяются на интервальные (за определенный период) и моментные (на определен-ную дату).

Интервальным является ряд динамики, уровни которого характери-зуют накопленный результат изменения явлений за определенные проме-жутки (интервалы, периоды) времени. Используются для описания вели-чин типа экономического потока, операции. Уровни интервальных рядов динамики обладают свойством суммарности (объемы за кварталы можно сложить и получить итог за год). То есть, отличительной особенностью ин-тервальных рядов динамики абсолютных величин является возможность суммирования их уровней. В результате суммирования уровней интер-вального динамического ряда получим накопленные итоги, которые име-ют реальное содержание.

Моментным является ряд, уровни которого характеризуют изучаемое явление в конкретный момент времени. Такие ряды используют для опи-сания величин типа запаса. Сумма уровней моментного ряда динамики не имеет реального содержания (сумма запасов за 2 момента не имеет смысла, но может использоваться для исчисления средних показателей).

Page 85: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

85

В рядах с равностоящими уровнями даты регистрации или окончания периодов представлены через равные следующие друг за другом отрезки времени. В рядах с неравностоящими уровнями этот принцип не соблюда-ется. Ряд динамики, в изменении уровней которого не наблюдается общей направленности (тенденции) является стационарным. Нестационарный ряд, напротив, отличается наличием общей направленности в изменении уровней показателя.

По форме представления уровни в динамическом ряду могут характе-ризоваться абсолютными, средними или относительными величинами. Ряды динамики относительных и средних величин состоят из производных статистических показателей, полученных в результате сопоставления меж-ду собой суммарных абсолютных данных.

Рядом динамики относительных величин называется ряд цифровых данных, характеризующих изменение относительных размеров изучаемых явлений во времени. Рядом динамики средних величин называется ряд цифровых данных, характеризующих изменение среднего размера призна-ка во времени.

Сопоставление уровней и смыкание рядов динамикиВажнейшим требованием к построению ряда динамики является обе-

спечение сопоставимости уровней динамического ряда. Числовые значения того или иного показателя должны быть сравнимы по разным временным интервалам. Несопоставимость уровней ряда динамики может быть обу-словлена разными причинами:

- изменением границ территории;- изменением методологии расчета показателей;- изменением цен для стоимостных показателей;- изменением единиц измерения;- изменением круга охватываемых предприятий за ряд лет;- различной продолжительностью интервалов времени, к которым отно-

сятся уровни.Для устранения несопоставимости используют методы смыкания (с по-

мощью коэффициентов пересчета) или приведения к одному основанию (на основе относительных величин). Особое внимание надо обращать на со-поставимость уровней интервальных и моментных рядов динамики.

Методики приведения показателей рядов динамики к сопоставимости заключаются в том, что:

1. рассчитывается коэффициент перехода из старых границ в новые;2. уровни года, в котором происходили изменения принимают за 100 %,

а остальные уровни ряда пересчитывают в процентах по отношению к этим уровням.

Page 86: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

86

Пример смыкания ряда с использованием коэффициента. В 2004 г. были изменены границы населенного пункта. Данные о численности населения в за 2002–2008 гг. приведены ниже (тыс. чел.):

Численность населения на начало года 2002г. 2003г. 2004г. 2005г. 2006г. 2007г. 2008г.До изменения границ 45,0 45,0 50,0 - - - -После изменения границ - - 70,0 71,3 73,2 74,1 75,0

Требуется привести ряды динамики к сопоставимому виду.Предварительно определим коэффициент пересчета уровней в 2004 г.,

в котором произошло изменение границ населенного пункта:

Умножая на этот коэффициент уровни ряда динамики в старых грани-цах, получаем их сопоставимыми с уровнями в новых границах.

В 2002 г. — 45*1,4=63,0 тыс. чел.В 2003 г. — 48,0*1,4=67,2 тыс. чел.

Годы 2002г. 2003г. 2004г. 2005г. 2006г. 2007г. 2008г.Численность населения на начало года 63.0 67.2 70,0 71,3 73,2 74,1 75,0

Показатели ряда динамики и методы их исчисленияВ результате сравнения уровней получается система абсолютных и отно-

сительных показателей динамики, к числу которых относятся абсолютный прирост, коэффициент роста, темп роста, темп прироста, абсолютное значение одного процента прироста. Если сравнению подлежат несколько последовательных уровней, то возможны два варианта сопоставления:

а) каждый уровень динамического ряда сравнивается с одним и тем же предшествующим уровнем, принятым за базу сравнения. В качестве базисного уровня выбирается либо начальный уровень динамического ряда или же уровень, с которого начинается какой-то новый этап развития явле-ния. Такое сравнение называется сравнением с постоянной базой;

б) каждый уровень динамического ряда сравнивается с непосредствен-но ему предшествующим, такое сравнение называют сравнением с пере-менной базой.

4.1

0.500.70==K

Page 87: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

87

Расчет абсолютных и относительных показателей ряда динамики Показатели ряда динамики могут быть:

- Абсолютные - Абсолютные приросты

- Цепные - Базисные

- Относительные - Цепные

- Темпы (коэффициенты) роста - Темпы (коэффициенты) прироста - Абсолютное значение 1% прироста

- Базисные - Темпы (коэффициенты) роста - Темпы (коэффициенты) прироста

Абсолютный прирост характеризует размер увеличения (уменьше-ния) уровня ряда за определенный период времени и выражает абсолют-ную скорость роста, определяется по формуле:

ΔYi-k = Yi – Yi-k, где i =1,2,3,4….,n, k=1,2,3,4….,m, (1) где ΔYi-k — абсолютный прирост уровня ряда,Yi — уровень ряда в году i,Yi-k — уровень ряда в году i- k,

Если к = 1, то уровень Yk-1 является предыдущим для данного ряда, а аб-солютные приросты будут цепными. Если же (i- к) постоянно для данного ряда (равно 0), то абсолютные приросты будут базисными (ΔYi-k = Yi – Y0).

Коэффициент роста Кp или темп роста Тp выражают интенсивность изменения уровня и рассчитывается по формуле:

kYiYiKp−

= или kYi

YiTp−

= *100 % (2)

где Yi-k =- уровень ряда в году i- k,, Коэффициент (темп) прироста Kпр (Tпр) характеризует относитель-

ную скорость изменения уровня ряда в единицу времени (за период) и оп-ределяется по формуле:

Kпр kYikYi

−−Δ= , или Kпр = Kпрi-к - 1,0,

Tпр kYikYi

−−Δ= *100 %, или Tпр = Tпрi-к - 100 % (3)

Абсолютное значение одного процента прироста представляет со-бой одну сотую часть базисного уровня и рассчитывается по формуле:

/ %/ 11

−−Δ=

TппpYi =0, 01 Yi-1 (4)

Средние характеристики ряда динамики Для обобщающей характеристики динамики исследуемого явления за

ряд периодов определяют различного рода средние показатели. Рассмот-рим две категории этих показателей:

Page 88: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

88

1) средние уровни ряда, 2) средние показатели изменения уровней ряда. Метод расчета среднего уровня ряда динамики зависит от вида вре-

менного ряда. Для интервального ряда динамики абсолютных показателей средний

уровень за период определяется по формуле простой средней арифмети-ческой:

,

где n- число уровней ряда. Если предположить, что в течение времени уровень ряда остается не-

изменным, то средний уровень ряда рассчитывается по формуле средней арифметической взвешенной: , где ti — промежуток времени между уровнями.

При определении средних уровней временного ряда нужно иметь в виду, что средняя будет достаточно надежной характеристикой ряда ди-намики, если она характеризует период с более или менее стабильными условиями развития.

Средний уровень моментного динамического ряда с равными (оди-наковыми) промежутками времени между датами производится по фор-муле (которую принято называть средней хронологической):

Если промежутки времени между датами неодинаковы, то формула

средней хронологической имеет вид:

где ti — промежуток времени между уровнями .

Средний абсолютный прирост рассчитывается как средняя арифмети-ческая из показателей скорости роста за отдельные промежутки времени:

Средний коэффициент роста показывает, во сколько раз в среднем за

отдельные составляющие рассматриваемого периода изменялись уровни динамического ряда. Средний коэффициент роста вычисляется по

nnyyyy

y n

n

ii +++

==

=...

211

12

...2 12

1

++++= −

n

yyyyy

nn

tttt

yyyyyyyyy

nn

nnn

nnn tttt

++++

⋅+

+⋅+

++⋅+

+⋅+

=−

−−

−−

121

11

122

321

21

..22

...22

( ) ( )11

...1

11121

−=

−++−=

Δ=Δ −=

nnny

yyyyyyynnn

n

ii

=

ii

iii

tty

y

Page 89: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

89

формуле средней геометрической из коэффициентов роста за отдельные периоды:

Средний темп роста представляет собой средний коэффициент роста,

выраженный в процентах: Средний темп роста, рассчитанный по данным о конечном и началь-

ном уровнях временного ряда, можно использовать только в случае более или менее равномерного изменения уровней.

Средний параболический коэффициент (темп) роста. Если при рас-чете среднего темпа роста важно обеспечить не только конечный уровень, но и суммарное значение исследуемого показателя за период (например, инвестиции, ввод жилой площади), то средний темп (коэффициент роста) находится из равенства (средней параболической):

(ΣYi ) /Y0 =k + k2+ k3 +….+ kn . Рассмотрим пример расчета основных показателей ряда динамики. Пусть имеются данные производстве зерна в одном из хозяйств за

пять лет (табл. 11, графы 1,2). Рассчитать абсолютные приросты, коэффи-циенты роста и средние показатели.

Таблица 11. Расчет основных показателей динамики

Год Производство зерна, тыс.ц, yi

Абсолютные приросты

ΔYi-k = Yi – Yi-k

Коэффициент роста

kYiYiKp−

=

Коэффициент прироста

Kпр kYikYi

−−Δ= ,

или Kпр = Kпрi-к - 1,01 2 3 4 5

1999 50 - - - 2000 54 4 1,08 0,08 2001 62 8 1,148 0,148 2002 70 8 1, 129 0, 129 2003 80 10 1,123 0,123 ∑, П 316 30 П =1.6 -

Средние 63,2 7,5 1, 125 0, 125

По приведенным формулам рассчитаем абсолютные, относительные и средние показатели. Средний уровень рассчитаем по формуле:

= 316/5 = 63,2 (табл.11, графа 2).

Ежегодные абсолютные приросты находим как разность между двумя уровнями: ΔYi-k = Yi – Yi-k , а средний абсолютный прирост как среднюю арифметическую из показателей скорости роста за отдельные промежутки времени:

1

111

2121 ...... −

− =⋅⋅=⋅⋅⋅= n nn

n

nnn y

yyy

yy

kkkk

%100р ⋅= kТ

nnyyyy

y n

n

ii +++

==

=...

211

Page 90: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

90

(табл., графа 3).

Ежегодные коэффициенты роста (цепные) находим как отношение уровня каждого года к предыдущему:

kYiYiKp−

= , а среднегодовой коэффициент роста рассчитаем как сред-

нюю геометрическую по формуле: (табл., графа 4).

Если расчет среднего темпа роста ведется с ориентацией на конечный результат, то, как видно из таблицы, средний темп роста равен 112,5% (коэффициент роста равен 1,125).

Если ориентация берется на достижение суммарного значения (объе-ма) исследуемого показателя за определенный период, то для расчета среднего коэффициента используется средняя параболическая вида (ΣYi ) /Y0 =k + k2+ k3 +….+ kn , где значение k определяется по специальной таб-лице ( см. [1, приложение 10]). Для n =5 и отношения 316/50 = 6,32 нахо-дим близкое к нему (6,336), которому соответствует k = 1, 08. То есть среднегодовой темп роста объемов производства зерна в хозяйстве за пять лет (период с 1999 по 2003 г.) в приведенном примере по средней парабо-лической составлял всего 108,0%, а среднегодовой темп прироста 8,0% (а не 12, 5 % , как по средней геометрической).

Выявление и характеристика основной тенденции развития (тренда) Уровни ряда динамики формируются под совокупным влиянием мно-

жества факторов и в том числе различного рода случайных обстоятельств. Выявление основной закономерности изменения уровней ряда предполага-ет ее количественное выражение, в некоторой мере свободное от случай-ных воздействий. Выявление основной тенденции развития (тренда) назы-вается в статистике также выравниванием временного ряда, а методы вы-явления основной тенденции — методами выравнивания. Выравнивание позволяет характеризовать особенность изменения во времени данного ди-намического ряда в наиболее общем виде как функцию времени, предпола-гая, что через время можно выразить влияние всех основных факторов. Для выявления тренда существуют методы:

- укрупнение интервала динамического ряда; - метод скользящей средней; - аналитическое выравнивание.

Метод укрупнения интервалов Первоначальный ряд динамики преобразуется и заменяется другим,

показатели которого относятся к большим по продолжительности перио-

( ) ( )11

...1

11121

−=

−++−=

Δ=Δ −=

nnny

yyyyyyynnn

n

ii

1

111

2121 ...... −

− =⋅⋅=⋅⋅⋅= n nn

n

nnn y

yyy

yy

kkkk

Page 91: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

91

дам времени. Вновь образованный ряд может содержать либо абсолютные величины за укрупненные по продолжительности промежутки времени (эти величины получают путем простого суммирования уровней первона-чального ряда абсолютных величин), либо средние величины. При этом отклонения в уровнях, обусловленные случайными причинами, взаимопо-гашаются, сглаживаются и более четко обнаруживается действие основных факторов изменения уровней (общая тенденция).

Метод скользящей средней Для определения скользящей средней формируем укрупненные интер-

валы, состоящие из одинакового числа уровней m. Каждый последующий интервал получаем, постепенно сдвигаясь от начального уровня динамиче-ского ряда на один уровень. Тогда первый интервал будет включать уров-ни ; второй — уровни . Интервал сглаживания «скользит» по динамическому ряду с шагом, равным единице. По сформи-рованным укрупненным интервалам определяем сумму значений уров-ней, на основе которых рассчитываем скользящие средние. Полученная средняя относится к середине укрупненного интервала. Поэтому техниче-ски удобнее укрупненный интервал составлять из нечетного числа уровней ряда. Нахождение скользящей средней по четному числу уровней создает неудобство, вызываемое тем, что средняя может быть отнесена только к середине между двумя датами. В этом случае необходима дополнительная процедура центрирования средних. При использовании приема скользящей средней сглаженный ряд сокращается по сравнению с исходным рядом на один уровень .

Покажем порядок расчета скользящих средних. Имеются данные, характеризующие динамику производства продук-

ции предприятия по месяцам (табл. 12). Требуется произвести сглаживание ряда, применяя трехмесячную скользящую среднюю.

Таблица 12. Расчет скользящих средних уровней ряда.

Месяц Объем продукции, млн. руб

Скользящая сумма трех членов Скользящая средняя

Январь 6,3 - - Февраль 9,3 25,8 8,6 Март 10,2 31,2 10,4 Апрель 11,7 34,5 11,5 Май 12,6 36,0 12,0 Июнь 11,7 38,3 12,8 Июль 14,0 38,3 12,8 Август 12,6 39,6 13,2 Сентябрь 13,0 39,9 13,3 Октябрь 14,3 40,8 13,6 Ноябрь 13,5 42,3 14,1

yyy m,...,,

21 yyy m 132,...,,

+

1−m

Page 92: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

92

В новом ряду скользящей средней четко видна тенденция роста объе-мов производства, в то время как в исходном ряду были провалы в августе и ноябре, когда объемы снижались.

Метод аналитического выравнивания Для того чтобы представить количественную модель, выражающую

общую тенденцию изменений уровней динамического ряда во времени, используется аналитическое выравнивание ряда динамики. В этом слу-чае фактические уровни заменяются уровнями, вычисленными на основе определенной кривой. Предполагается, что она отражает общую тенден-цию изменения во времени изучаемого показателя.

При аналитическом выравнивании ряда динамики закономерно изме-няющийся уровень изучаемого показателя оценивается как функция вре-мени, то есть уровни динамического ряда вычисляются по соответствую-щему аналитическому уравнению на момент времени .

Для характеристики связей экономических показателей используют следующие типы функций:

˗ линейную

˗ гиперболическую

˗ показательную

˗ параболическую

˗ степенную

˗ логарифмическую

˗ логистическую Основанием для выбора вида кривой может использоваться содержа-

тельный анализ сущности развития данного явления. Можно опираться также на результаты предыдущих исследований в данной области. На практике для этих целей прибегают к анализу графического изображе-ния уровней динамического ряда. При выборе формы уравнения следует исходить и из объема имеющейся информации. Чем больше параметров содержит уравнение тренда, тем больше должно быть наблюдений при од-ной и той же степени надежности оценивания.

Выбор формы кривой может осуществляться на основе принятого кри-терия, в качестве которого может служить сумма квадратов отклонений фактических значений от значений, рассчитанных по уравнению

xaayx 10ˆ +=

xaayx

1

0ˆ +=

aay xx 10ˆ =

xaxaayx

2210ˆ ++=

xay ax

10ˆ =

( )xaayxln

10ˆ +=

e xaaayx 211ˆ 0

++=

Page 93: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

93

тренда. Из совокупности кривых выбирается та, которой соответствует минимальное значение критерия.

Рассмотрим аналитическое выравнивание ряда динамики по прямой, т.е. аналитическое уравнение вида:

Параметры a0 и a1 прямой рассчитываются по методу наименьших

квадратов (МНК). Система нормальных уравнений для нахождения пара-метров в данном случае имеет вид:

Поиск параметров уравнения можно упростить, если отсчет времени

производить так, чтобы сумма показателей времени изучаемого ряда ди-намики была равна нулю. При нечетном числе уровней ряда динамики уровень, находящийся в середине ряда, принимается за условное начало отсчета времени (этому периоду или моменту времени придается нулевое значение). Даты времени, стоящие ранее этого уровня, обозначаются нату-ральными числами со знаком минус (-1,-2,-3 и т.д.), а позже - натуральны-ми числами со знаком плюс (+1, +2, +3 и т.д.)

Тогда получим:

=

== == n

ii

n

iii

n

ii

t

tya

ya n

1

2

11

10 ,

Рассмотрим аналитическое выравнивание ряда динамики по линейной зависимости cтроительствa жилья жилищно-строительными кооператива-ми России за 1990-1994 гг. (табл. 13)

Таблица 13. Аналитическое выравнивание ряда динамики по прямой

Годы Построено, млн. кв.м, Y

Условное время t ty ii

ti2 Выравненные

уровни ряда 1990 2,9 -2 -5,8 4 2,76 1991 2,4 -1 -2,4 1 2,49 1992 2,1 0 0 0 2,22 1993 1,9 1 1,9 1 1,95 1994 1,8 2 3,6 4 1,68 1995 3 1,41 Итого 11,1 0 -2,7 10 11,10

taayt⋅+= 10ˆ

===

==

=⋅+⋅

=⋅+⋅

n

iii

n

ii

n

ii

n

ii

n

ii

tytata

ytaa n

11

21

10

1110

=⋅

=⋅

==

=n

iii

n

ii

n

ii

tyta

ya n

11

21

10

Page 94: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

94

Используя таблицу определим параметры уравнения прямой Уравнение прямой ряда динамики:

Подставив в это уравнение t =3, получим прогноз на следующий год

в объеме 1.41 млн. руб жилья, построенного жилищно-строительными кооперативами.

Продление в будущее тенденции, наблюдавшейся в прошлом, носит название экстраполяции. Возможность экстраполяции обеспечивается двумя обстоятельствами: 1) общие условия, определяющие тенденцию развития в прошлом, не пре-терпевают существенных изменений в будущем; 2) тенденция развития явления характеризуется тем или иным аналитиче-ским уравнением.

При составлении прогнозов оперируют не точечной, а интервальной оценкой, определяя так называемые доверительные интервалы прогноза. Величина доверительного интервала определяется в общем виде так:

где среднее квадратическое отклонение от тренда

ta,n-m — табличное значение критерия Стьюдента при уровне значимости а; n — число уровней ряда; m — количество параметров в уравнении тренда (для уравнения прямой m = 2).

Следует помнить, что прием аналитического выравнивания содержит в себе ряд условностей, связанных прежде всего с тем, что уровни, харак-теризующие тот или иной динамический ряд, рассматриваются как функ-ция времени. В действительности же развитие явлений обусловлено не тем, сколько времени прошло с отправного момента, а тем, какие факторы влияли на развитие, в каком направлении и с какой интенсивностью. Раз-витие явлений во времени выступает как внешнее выражение этих факто-ров, как их суммарное действие, оказывающее влияние на изменение уров-ня в отдельно взятые промежутки или моменты времени.

Выявить основную тенденцию развития явления методом наименьших квадратов можно лишь тогда, когда выяснено, что изменяющиеся во времени процессы протекают на всем рассматриваемом промежутке времени одина-ково, что их количественное и качественное изменение происходит под дей-ствием одного и того же комплекса основных факторов, определяющих дви-жение данного ряда динамики. Экстраполяция на отдаленные даты подвер-жена более значительным ошибкам, чем краткосрочная экстраполяция.

27,010

7,2 ;22,25

1,11 10 −=−=== aa

tyi⋅−= 27,022,2ˆ

nys

tyt

ˆˆ α±

( )mn

n

iti

y

yys

i

−== −

1

2

ˆ

ˆ

Page 95: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

95

Измерение колеблемости в рядах динамики Для измерения колеблемости в рядах динамики используются показа-

тели вариации по формулам: minmax xxR −= — размах вариации;

n

xxl −

= — среднее линейное отклонение;

nxx −

=2

2 )(σ — дисперсия;

nxx −

=2)(

σ — среднее квадратическое отклоненние;

100⋅=x

V σ — коэффициент вариаци;

Только в качестве признака в этих рядах используют уровень ряда, обозначаемый y.

Задача исследований колебаний уровней в рядах динамики сводится к разложению общей колеблемости на составляющие и выделению именно тех, которые интересуют исследователя. Имея фактические уровни yi и уровни, выравненные по определенному тренду yt, можно по правилу сло-жения дисперсий представить сумму квадратов отклонений от средней арифметической как сумму двух сумм (суммы квадратов отклонений от тренда и суммы квадратов отклонений за счет случайных факторов):

∑(yi – y )2 = ∑( y t – y )2 + ∑( y ti – yt)2;

где y — средняя арифметическая из эмпирических значений ряда; y t — значения уровней выравненного ряда; yi — фактические значения уровней ряда.

Используя ∑(yi – y t)2, можно определить среднее квадратическое от-клонение уровней за счет случайных факторов. Чем меньше эта сумма, тем ближе фактические уровни к линии тренда, тем меньше средняя квадрати-ческая ошибка уравнения тренда, тем более удачно подобрана линия тренда.

Выявление и измерение сезонных колебаний Под сезонными колебаниями понимаются периодически повторяю-

щиеся повышение и снижение уровней в отдельные месяцы или кварталы года.

Для измерения «сезонной волны» используют методы сравнения фак-тических уровней по месяцам (кварталам) со средним уровнем или с вы-равненными по уравнению тренда. При этом рассчитывают либо абсолют-ные разности (yi – y ) , (yi – y t) или индексы сезонности:

Icез = yi / y *100 % , или Icез = yi / yt *100 %.

Page 96: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

96

Для характеристики силы (меры) колеблемости уровней динамического ряда среднее квадратическое отклонение σ или коэффициент вариации v.

Зная уравнения тренда и средние абсолютные разности и (или) средние индексы сезонности можно спрогнозировать квартальные уровни на сле-дующий год при условии, что выявленная закономерность сохранится в про-гнозируемом периоде. Первый вариант (с использованием абсолютных раз-ностей) называется экстраполяцией по аддитивной схеме, второй (с исполь-зованием индексов сезонности)- по мультипликативной схеме. Рассмотрим расчет индексов сезонности и их использования на примере (табл. 14).

Таблица 14.

Расчет индексов сезонности *

Квартал года T

I способ II способ Пр-во масла

yi

Icез=yi / y *100 % I cез t2 yit ty

Icез = yi

/yt *100%

I cез Вырав. уровень с учетом

сезонности cезty 1 2 3 4 5 6 7 8 9 10

1992 год I 1 298,8 121,7 123,45 1 298,8 240,62 124,2 124,5 299,6 II 2 228,9 93,2 108,0 4 457,8 242,02 94,6 108,2 261,9 III 3 118,4 48,2 55,2 9 355,2 243,42 48,6 55,0 133,9 IV 4 270,4 110,1 113,3 16 1081,6 244,82 110,4 112,4 275,2

1993 год I 5 307,3 125,2 123,45 25 1536,5 246,22 124,8 124,5 306,5 II 6 301,5 122,8 108,0 36 1809,0 247,62 121,8 108,2 267,9 III 7 152,7 62,2 55,2 49 1068,9 249,02 61,3 55,0 137,0 IV 8 286,2 116,5 113,3 64 2289,6 250,42 114,3 112,4 281,5 ∑ 36 1964, 2 - - 204 8897,4 1964,2 - - 1963,5

Средние 245,525 - 1994 9 124,5 313,5

10 108,2 274,0 11 55,0 140,0 12 112,4 287,8

* Таблица сконструирована по данным в [1, c. 138]

Объем производства растительного масла в РФ (тыс. т) по кварталам за 1992 и 1993 г.г. приведен в табл. 14 (графы 1 и 2).

Решение. I способ. 1. Рассчитываем средний квартальный уровень производства

за два года:

=1964,2/ 8 = 245, 525 (тыс. т) (табл. 14, графа 2).

nnyyyy

y n

n

ii +++

==

=...

211

Page 97: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

97

2.Находим индексы сезонности, как отношение уровня каждого квар-тала к среднеквартальному (табл. 14, графа 3).

3. Находим средний индекс по данным двух лет для каждого квартала (табл. 14, графа 4).

II способ. 1. Осуществим аналитическое выравнивание по линейной функции: ,(табл. 14, графы 5-7) . Параметры а0 и а1 определяем из системы нормальных уравнений

8 а0 + 36 а1 = 1964,4 36 а0 + 204 а1 = 8897, 4,

получаем а1 = 1,4; а0 = 239, 22. Отсюда .4,122,239ˆ tyt += Подставляя в это уравнение значения t (табл. 14, графа 1), находим выравненные кварталь-ные значения ряда (табл. 14, графа 7).

2.Индексы сезонности (табл. 14, графа 8) рассчитаем как отношение уровня каждого квартала к выравненному за этот же квартал.

3. Рассчитаем средние поквартальные уровни как среднюю арифмети-ческую за два года (табл. 14, графа 9) .

4. Каждое выравненное значение ytˆ (табл. 14, графа 7) умножаем на средний индекс сезонности соответствующего квартала (табл. 14, графа 9) и получаем скорректированные с учетом сезонной волны выравненные уровни cезty (табл. 14, графа 10).

5. Зная уравнение линии тренда и сезонную волну можно спрогнози-ровать производство растительного масла по кварталам на следующий год (1994), приняв величину t, равными 9-12 (табл. 14, графа 1). Для этого не-обходимо значения t подставить в уравнение тренда и рассчитать про-гнозные значения ytˆ (табл. 14, графа 7), а затем скорректировать их с уче-том сезонной волны cезty (табл. 14, графа 10). Такой способ прогнозирова-ния называется мультипликативным.

Возможен и аддитивный способ, когда после нахождения выравнен-ных значений находят разность между эмпирическими и выравненными значениями и затем при прогнозировании к значению уровня, полученно-го по линии тренда, прибавляется среднее значение этих разностей за два или три года.

Автокорреляция в рядах динамики Зависимость между последовательными (соседними) уровнями ряда

динамики называется автокорреляцией. Измерить автокорреляцию между уровнями ряда можно с помощью коэффициента автокорреляции ra, исчис-ляемого по формуле парного коэффициента корреляции. Рассчитанное зна-чение ra необходимо сравнить с критическим (табличным rтабл). Если рас-четное значение меньше табличного, то гипотеза об отсутствии автокорре-ляции в ряду (нулевая гипотеза) может быть принята. Если расчетное значе-ние больше табличного, то нулевая гипотеза отвергается и делается вывод

taayt ⋅+= 10ˆ

Page 98: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

98

о наличии автокорреляции. Существуют специальные таблицы (приводи-мые в учебниках, например в [1, приложение 9]), в которых для разного числа членов ряда n , разных уровней значимости α определена критиче-ская область проверяемой нулевой гипотезы.

Уравнение, выражающее эту зависимость между последовательными (соседними) уровнями ряда динамики называется уравнением авторегрес-сии. Наиболее простой формой такого уравнения может служить линейная в виде: yaay tt 110ˆ

−+=′ . Параметры уравнения авторегрессии определяются

по общим правилам регрессионного анализа.

Корреляция рядов динамики Коррелировать непосредственно уровни двух рядов динамики можно

лишь тогда, когда в каждом из них отсутствует автокорреляция, так как наличие последней может существенно повлиять на величину коэффици-ента, измеряющего зависимость между анализируемыми показателями. Поэтому прежде чем измерять корреляцию между x и y, каждый из рядов нужно проверить на автокорреляцию.

Рассмотрим пример об установлении связи между урожайностью зер-новых (y) и количеством минеральных удобрений, внесенных на 1 га (x). Данные по сельскохозяйственным предприятиям за 1992-1996 г.г. и все расчеты приведены в таблице 15.

Решение 1. Проверим на автокорреляцию ряд x. Для этого параллельно со зна-

чениями xt, запишем xt-1, то есть сдвинутые на единицу. А чтобы ряд не укорачивался и характеристики не изменились, последнее значение xt пе-ренесем в первую строку значений xt-1. Рассчитаем коэффициент автокор-реляции по формуле:

22

21

)()(

tt

ttta xn

xn

xxxr

−= − . Необходимые средние арифметические значения

и суммы рассчитаем в табл. 15 (графы 2, 5, 6). Находим ra (расчетное):

1136231

4805594148055036

31.5594131.55036

2

2

=−−=

−−

=ra = 0,203.

Таблица 15. Расчет показателей автокорреляции в рядах x и y*

Год Внесено мин.удобркг/ га, xt

Урожайность ц/га,

yt xt-1 xt

2 xtxt-1 yt-1 yt2 ytyt-1

1 2 3 4 5 6 7 8 91992 52 17,2 (17) 2704 884 (12,9) 295,84 221,881993 46 16,3 52 2116 2392 17,2 265,69 280,361994 24 14,4 46 576 1104 16,3 207,36 234,721995 16 11,6 24 256 384 14,4 134,56 167,041996 17 12,9 16 289 272 11,6 166,41 149,64∑ 155 72,4 72,4 5941 5036 72,4 1069,86 1053,64

Cредние 31 14,48 1188,2 213, 972 * Таблица сконструирована по данным в [1, с. 139-141]

Page 99: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

99

По таблице приложения 7 в [1] находим , что для n=5 и 5%-го уровня значимости (α =0.05) табличное значение ra= 0,253. Так как ra расч < ra табл, то делаем вывод об отсутствии автокорреляции в ряду xt.

2. Проверим на автокорреляцию ряд y. Необходимые средние арифме-тические значения и суммы рассчитаем в табл. 15 (графы 3, 7, 8, 9). Нахо-дим ra (расчетное):

22

21

)(

)(

tt

ttta

yn

yn

yyy

r

−= − =

48,14.586,106948,14.564,1053

2

2

−−

= 0,246.

Так как и здесь ra расч < ra табл, делаем вывод об отсутствии автокорре-ляции в ряду y .

3. Рассчитаем линейный коэффициент корреляции по формуле:

σσ yx

yxxyr xy

−= ,

где величины числителя и знаменателя рассчитаем по формулам: xy =

nxy =

59,12176,11164,14243,16462,17.52 ×+×+×+×+× =

57,2394 =478,

)( 222 xxx −=σ = 5941/5 -312 = 227,2;

)( 222 yyy −=σ = 1069,86/5 – 14,482 = 4,3. Отсюда

σσ yx

yxxyr xy

−= =3,42,227

48,143194,478××− = 0,96,

т.е. зависимость между вариацией количества вносимых минеральных удобрений и вариацией урожайности зерновых в 1992-1996 гг. была очень большой.

Контрольные вопросы и задания 1. Что такое ряды динамики и какова их роль в статистическом анализе? 2. С какой целью анализируются данные рядов динамики? 3. Назовите виды рядов динамики. 4. Что характеризуют показатели рядов динамики? 5. Какие показатели применяются для характеристики изменений уровней ряда

динамики? 6. Как решается вопрос о сопоставимости уровней динамического ряда? 7. Охарактеризуйте графическое представление временных рядов. Назовите наи-

более распространенные виды графиков. 8. Как провести периодизацию рядов динамики? 9. Что представляет собой средний уровень ряда? 10. Какой вид средних величин используется для расчета среднего уровня момент-

ного ряда?

Page 100: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

100

11. Как исчисляется средний уровень для различных рядов?12. Как связаны между собой цепные и базисные показатели динамики?13. Чему равен абсолютный прирост и средний темп роста? В чем принципиальные раз-

личия в расчете среднего темпа роста и так называемой средней параболической?14. Как производится сглаживание рядов динамики?15. Расскажите о сезонных колебаниях.16. Как может быть выявлена основная тенденция в изменениях уровней ряда динамики?17. Как выполнить прогноз на будущее с помощью уравнения тренда?18. Какие особенности корреляции могут быть выделены в рядах динамики?19. Определите понятие автокорреляции в рядах динамики. Как она измеряется?20. Назовите виды колебаний уровней временного ряда.21. Как рассчитать скользящую среднюю и для каких целей она может быть исполь-

зована?

Тема 3. Индексы

Общее понятие об индексах и значение индексного метода ана-лиза. Индексы индивидуальные и общие, простые и аналитические. Сводные индексы. Индексы количественных показателей. Индексы качественных показателей. Индексные системы в динамике. Средние формы сводных индексов. Разложение абсолютных приростов по факторам. Использование индексов в территориальных сравнениях. Использование индексов в экономическом анализе и в макроэконо-мических исследованиях. Методы расчета и анализа индексов цен. Методы оценки уровня и динамики инфляции.

Индекс — это относительная величина сравнения, которая характеризу-ет изменения явлений и процесов во времени, в пространстве или по срав-нению с планом (нормой, стандартом).

Посредством индексов решают задачи:1. Дать обобщающую характеристику изменения одноименного показа-

теля по разнородной совокупности.2. Провести анализ влияния отдельных факторов на изучаемое явление.3. Дать оценку динамики среднего показателя по однородной совокуп-

ности, в том числе за счет изменения структуры.Индексы классифицируются по следующим направлениям:1. По выбранной базе сравнения (динамические, территориальные и по

сравнению с планом).2. По степени агрегирования (или охвата) явления (индивидуальные

и сводные).3. По форме построения сводных индексов (общие и групповые).4. По характеру исследуемой величины.5. По виду весов, выбранных в индексе (Пааше, Ласпейреса).

Page 101: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

101

Введем условные обозначения, используемые в теории индексного метода:

i — индивидуальный индекс; I — сводный индекс; p — цена единицы товара; q — количество товара в натуральном выражении; z — себестои-мость продукции; t — трудоемкость единицы продукции; T — общие за-траты времени; 1 — подстрочный символ показателя текущего (отчетного) периода; 0 — подстрочный символ показателя предшествующего (базис-ного) периода.

Индивидуальные индексы

Рассмотрим сначала индивидуальные индексы динамики. Индивиду-альный индекс- относительный показатель изменения отдельного элемента сложного явления, например, его изменения в отчетном периоде по срав-нению с базисным. Величина, изменения которой изучается , называется индексируемой (подстрочный индекс-1). Величина, с которой сравнивает-ся индексируемая величина, называется базисной (подстрочный индекс-0). Рассмотрим наиболее распространенные в практике экономического ана-лиза индивидуальные индексы.

Индивидуальный индекс цены рассчитывается по формуле:

pp

ip0

1= ,

где ip — индекс цены; p1 — цена товара в текущем периоде; p0 — цена

товара в базисном периоде. Индивидуальный индекс физического объема рассчитывается по фор-

муле:

qq

iq0

1 =

где ip — индекс физического объема; q1 — количество товара, проданного

в текущем периоде; q0 — количество товара, проданного в базисном пе-

риоде. Индивидуальный индекс товарооборота рассчитывается по формуле:

qpqp

ipq00

11 = ,

где ipq — индекс товарооборота; qp 11 — товарооборот в текущем периоде;

qp 00 — товарооборот в базисном периоде. Данные три индивидуальных индекса взаимосвязаны между собой:

iii qppq . = ,

Page 102: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

102

то есть индекс товарооборота равен произведению индексов физического объема и цен, а изменение товарооборота складывается под воздействием динамики цены и изменения объема продажи данного товара.

Индивидуальные индексы, в сущности, представляют собой относи-тельные показатели динамики или темпы роста и по данным за несколько периодов времени могут рассчитываться в цепной или базисной формах.

Сводные индексы. Агрегатная форма сводного индекса Сводные индексы вычисляются по товарным группам и нескольким

видам продукции. Сводные индексы могут быть представлены в трех фор-мах: агрегатной, средней арифметической и средней гармонической.

Исходной и основной формой сводного индекса является агрегатная; средние индексы получаются в результате ее преобразования. В агрегатной формуле сводного индекса присутствуют два элемента:

- индексируемая величина, изменение которой показывает индекс (например, цена p);

- некоторая постоянная величина, называемая весом индекса (напри-мер q), с помощью которого несоизмеримые элементы сложного социаль-но-экономического явления приводятся к сопоставимому виду. В числите-ле и знаменателе агрегатной формы находятся суммы произведений двух величин, одна из которых — индексируемая, другая постоянная (вес).

Различают индексы количественных и индексы качественных показа-телей. К количественным относятся показатели, характеризующие физиче-ские размеры явления (объемы продукции, численность работников, объем фондов и т.д.; при этом используются простые единицы измерения (метры, кг, штуки, руб.)). Качественный показатель используется для экономиче-ской (качественной) характеристики количественной единицы совокупно-сти. Это цена за единицу товара, себестоимость единицы продукции, фон-доотдача и т. д. (единица измерения сложная — руб./ шт., руб./руб. и т. д.).

Индексы качественных показателей строятся с весами отчетного пе-риода, а индексы количественных показателей строятся с весами базисного периода. Такое построения индексов позволяет получать систему взаимо-связанных индексов и проводить по ней анализ влияния отдельных факто-ров на изменение результативных показателей.

Рассмотрим агрегатный индекс товарооборота, показывающий изме-нение показателей разнородной продукции:

qpqpqpqpqpqp

Inn

nnpq

0020201010

1121211111

...

...

++

++= ,

где n — число товаров, входящих в рассматриваемую группу. В статистике принята упрощенная форма записи экономических индек-

сов, без указания подстрочного (или надстрочного) индекса номера товара, так как суммирование всегда осуществляется по всем товарам, входящим в товарную группу. К тому же по правилам векторной алгебры произведе-

Page 103: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

103

то есть индекс товарооборота равен произведению индексов физического объема и цен, а изменение товарооборота складывается под воздействием динамики цены и изменения объема продажи данного товара.

Индивидуальные индексы, в сущности, представляют собой относи-тельные показатели динамики или темпы роста и по данным за несколько периодов времени могут рассчитываться в цепной или базисной формах.

Сводные индексы. Агрегатная форма сводного индекса Сводные индексы вычисляются по товарным группам и нескольким

видам продукции. Сводные индексы могут быть представлены в трех фор-мах: агрегатной, средней арифметической и средней гармонической.

Исходной и основной формой сводного индекса является агрегатная; средние индексы получаются в результате ее преобразования. В агрегатной формуле сводного индекса присутствуют два элемента:

- индексируемая величина, изменение которой показывает индекс (например, цена p);

- некоторая постоянная величина, называемая весом индекса (напри-мер q), с помощью которого несоизмеримые элементы сложного социаль-но-экономического явления приводятся к сопоставимому виду. В числите-ле и знаменателе агрегатной формы находятся суммы произведений двух величин, одна из которых — индексируемая, другая постоянная (вес).

Различают индексы количественных и индексы качественных показа-телей. К количественным относятся показатели, характеризующие физиче-ские размеры явления (объемы продукции, численность работников, объем фондов и т.д.; при этом используются простые единицы измерения (метры, кг, штуки, руб.)). Качественный показатель используется для экономиче-ской (качественной) характеристики количественной единицы совокупно-сти. Это цена за единицу товара, себестоимость единицы продукции, фон-доотдача и т. д. (единица измерения сложная — руб./ шт., руб./руб. и т. д.).

Индексы качественных показателей строятся с весами отчетного пе-риода, а индексы количественных показателей строятся с весами базисного периода. Такое построения индексов позволяет получать систему взаимо-связанных индексов и проводить по ней анализ влияния отдельных факто-ров на изменение результативных показателей.

Рассмотрим агрегатный индекс товарооборота, показывающий изме-нение показателей разнородной продукции:

qpqpqpqpqpqp

Inn

nnpq

0020201010

1121211111

...

...

++

++= ,

где n — число товаров, входящих в рассматриваемую группу. В статистике принята упрощенная форма записи экономических индек-

сов, без указания подстрочного (или надстрочного) индекса номера товара, так как суммирование всегда осуществляется по всем товарам, входящим в товарную группу. К тому же по правилам векторной алгебры произведе-

ние векторов всегда равно сумме произведений соответствующих элементов векторов (в данном случае объемов и цен по каждой группе товаров) qp ii 11

.

При таком подходе формула сводного индекса принимает вид:

pqpq

pqpq

Iii

iipq

00

11

00

11 =

= , i = 1,2,3…n,

где pi1 — цена товара i-ой группы в текущем периоде; qi1 — объем товара i-ой группы в текущем периоде; pi0 — цена товара i-ой группы в базисном периоде; qi0

— объем товара i-ой группы в базисном периоде; p1 — вектор цен товаров n групп в текущем периоде; p0 — вектор цен товаров n групп в базисном периоде; q1 — вектор объемов товаров n групп в текущем пе-риоде; q0 — вектор объемов товаров n групп в базисном периоде; qp 00 — объем товарооборота (скалярная величина) по n группам в базисном пе-риоде; qp 11

— объем товарооборота по n группам в текущем периоде. На величину индекса товарооборота оказывают влияние как измене-

ние цен, так и объемов продаж. Для того, чтобы оценить изменение только цен (индексируемой величины), необходимо количество проданных това-ров (веса индекса) зафиксировать на каком-либо постоянном уровне. При исследовании динамики таких показателей, как цена, себестоимость, про-изводительность труда, количественный показатель обычно фиксируют на уровне текущего периода. Таким способом получим простую формулу сводного индекса цен:

qpqp

I p

10

11 =qpqp

ii

ii

10

11

= .

Аналогично рассчитывается сводный индекс физического объема продаж, только индексируемой величиной является количество товаров (записывается на первом месте), а весами выступают цены, фиксируемые на базисном уровне. Формула сводного индекса физического объема про-даж имеет вид:

pqpq

pqpq

Iii

iiq

00

01

10

11 =

=

Между сводными индексами цен, физического объема продаж и това-рооборота существует взаимосвязь, которую можно использовать для про-верки правильности расчетов:

III qppq =

Рассмотрим вычисление индексов на примере реализации мясных продуктов (табл. 16.)

Page 104: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

104

Таблица 16. Реализация мясных продуктов на рынке*

Вид продукта,

i

Октябрь Ноябрь Товарооборот Цена за кг, руб.,p0

Продано, т, q0

Цена за кг, руб., p1

Продано, т, q1

Тыс. руб. p0q0

Тыс. руб. p1q1

Тыс. руб. p0q1

Тыс. руб. p1q0

1 2 3 4 5 6 7 8 9 Говядина 80 2,8 90 2,5 224 225 200 252 Баранина 70 1,1 75 0,9 77 67,5 63 82,5 Свинина 100 1,5 105 1,3 150 136,5 130 157,5 ∑ 451 429 393 492

* Таблица сконструирована по данным в [12, с. 148]

Рассчитаем индексы:

pqpq

Iii

iipq

00

11

= = 429/451 = 0,951 (или 95, 1%);

Индекс товарооборота равен 0,951, то есть товарооборот сократился на 4.9 %.

Сокращение товарооборота Э = 429-451 = -22 тыс. руб.

pqpq

Iii

iip

01

11

= = 429/ 393 = 1,092 ( или 109,2);

Индекс цен равен 1.092, то есть цены выросли на 9,2 %. Потери покупателей от роста цен Э= 429 – 393 = 36 тыс.руб.

pqpq

Iii

iiq

10

11

= = 429/492 = 0,871 (или 87, 1);

Индекс физического объема равен 0, 871, то есть объем продаж сокра-тился на 12,9 %. Потери продавцов от сокращения объема продаж Э= 429 – 492 = 63 тыс.руб.

Проверим правильность расчетов индексов, используя их взаимо-связь:

IpIq = Ipq = 1,092*0,871 = 0,951. При анализе результатов производственной деятельности эти же

сводные индексы называют соответственно индексом стоимости продук-ции ( I pq ), индексом оптовых цен ( I p ) и индексом физического объема продукции в натуральном выражении ( I q ).

Для определения общего изменения уровня себестоимости нескольких видов продукции, выпускаемых предприятием, рассчитывается сводный индекс себестоимости:

qzqz

qzqzI

ii

iiz

10

1

01

11 1=

= ,

Page 105: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

105

где z1 — вектор себестоимости продукции n групп в текущем периоде; z0 — вектор себестоимости продукции n групп в базисном периоде; I z — свод-ный индекс себестоимости продукции.

Числитель этого индекса отражает затраты на производство текущего периода, а знаменатель условную величину затрат при сохранении себе-стоимости на базисном уровне. Разность числителя и знаменателя показы-вает сумму экономии предприятия от снижения себестоимости (Э):

Э = z1q1 – z0q1. Cводный индекс физического объема продукции, взвешенный по се-

бестоимости продукции (Iq), имеет следующий вид:

zqzq

zqzq

Iii

iiq

10

11

10

11 =

= .

Третьим показателем в этой индексной системе затрат является свод-ный индекс затрат на производство (Izq):

qzqz

qzqzI

ii

iiz

10

1

01

11 1=

= .

Все три индекса взаимосвязаны между собой: Izq = IzIq.

Индексный метод также широко используется в анализе производи-тельности труда. Возможны два подхода к расчету таких индексов (на ос-нове учета количества продукции, выработанной в единицу времени w, и на основе учета затрат рабочего времени на единицу продукции t. Коли-чество продукции, вырабатываемое в единицу времени (в натуральном вы-ражении), и затраты времени на единицу продукции взаимосвязаны между собой:

t1

=ω .

Основанные на показателях выработки и трудоемкости индивидуаль-ные индексы имеют следующий вид:

Tq

Tq

i0

0

1

1

0

1 : ==ωω

ω ;

qT

qT

ttit

1

1

0

1

1

0 : == ,

где T — суммарные затраты времени на выпуск данной продукции в чело-веко-часах, человеко-днях или человеко-месяцев (в последнем случае со-ответствует общей численности работников).

При расчете сводного индекса производительности труда в стоимост-ном выражении (по выработке) необходимо количество продукции, произ-веденной за каждый период, взвесить по каким-либо ценам, принятым за

Page 106: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

106

сопоставимые. Такой сводный индекс производительности труда (по выра-ботке) рассчитывается по формуле:

=Tpq

Tpq

Ii

ii

i

iipq

0

0

1

1 :

Первая часть представляет собой среднюю выработку в отчетном пе-риоде, вторая — в базисном.

Произведение индекса производительности труда по выработке и ин-декса затрат рабочего времени приводит к индексу физического объема продукции, взвешенного по цене:

III qT =.ω или qpqp

TT

Tpq

Tpq

ii

ii

i

ii i

00

11

00

0

1

1 1).:( =

.

Сводный индекс производительности труда (по трудоемкости) рас-считывается по данным о трудоемкости различных видов продукции и объемах их производства:

qtqtI t

11

10= ,

где t0 — вектор трудоемкости продукции в базисном периоде; t1 — вектор трудоемкости продукции в текущем периоде; q1 — вектор объемов произ-водства продукции в текущем периоде. It — сводный индекс производительности труда (по трудоемкости).

Знаменатель этого индекса отражает реально имевшие место общие затраты времени на выпуск всей продукции в текущем периоде (T1). Чис-литель представляет собой условную величину, показывающую, какими бы были затраты времени на выпуск этой продукции, если бы трудоем-кость не изменилась.

Индекс производительности труда связан с индексом затрат рабочего времени (труда) и с индексом физического объема, взвешенным по трудо-емкости:

III qTt =. или tqtq

TT

qtqt

iii

ii i

0

1.0

01

011

10 =

Индексные системы в динамике Если индексы рассчитываются за ряд последовательных периодов, то

веса могут быть постоянными или переменными, цепными или базисными. Рассмотрим некоторые варианты построения индекса цен за m периодов. 1. Цепные индексы цен с переменными весами:

. ;... ; 1

/1

21

221/2

10

110/1 −

==

==

=

qpqp

Iqpqp

Iqpqp

Iimim

imimmpm

ii

iip

ii

iip

или

Page 107: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

107

. ;... ; 1

/1

21

221/2

10

110/1 qp

qpIqp

qpIqp

qpI

mm

mmmpmpp

− ===

2. Цепные индексы с постоянными весами:

. ;... ; 01

0/1

01

021/2

00

010/1 qp

qpIqp

qpIqp

qpI

m

mmpmpp

− ===

Веса могут фиксироваться на уровне базисного периода по методу Ласпейреса и на уровне последнего года по методу Пааше. 3. Базисные индексы с переменными весами:

. ;... ; 0

/1

20

221/2

10

110/1 qp

qpIqp

qpIqp

qpI

m

mmmpmpp === −

Индексы характеризуют изменение цен в текущем периоде по сравне-нию с неизменным базисным уровнем (в исследовании помесячной дина-мики в качестве такого уровня обычно принимается декабрь предшест-вующего года). 4. Базисные индексы с постоянными весами:

. ;... ; 00

0/1

00

021/2

00

010/1 qp

qpIqp

qpIqp

qpI m

mpmpp === −

Отличие данной индексной системы от предшествующей заключает-ся в том, что здесь не меняется не только база сравнения, но и веса. Ис-пользование базисных весов позволяет исключить влияние структурных изменений в объемах продаж на сводные индексы.

Выбор той или иной системы индексов зависит от целей исследований и имеющейся информации. Определенные преимущества имеет второй ва-риант системы (цепные индексы с постоянными весами), так как в ней ин-дексы мультипликативны- их последовательное перемножение позволяет получить базисный индекс в целом за исследуемый временной интервал.

Средние формы сводных индексов Сводные индексы могут быть получены путем осреднения индексов

индивидуальных, то есть рассчитаны как средневзвешенная величина из индивидуальных индексов. В зависимости от вида весов (базисные (по ме-тоду Ласпейреса) или текущие (по методу Пааше)) различают среднеариф-метический и среднегармонический индекс. При расчете среднеарифмети-ческого индекса производится замена:

pip iipi . 01= , или .. 01 pip p=

где iрi — индивидуальный индекс цен i-го товара; ip — вектор индивидуаль-ных индексов цен товаров.

И формула среднего индекса цен будет иметь вид:

Page 108: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

108

, 00

00

00

00)(

qpqpi

qpqpiI

p

ii

iiipp =

=

где ( qp 00)— вектор товарооборота (объема продаж в стоимостном выра-

жении) в базисном периоде. При расчете среднегармонического индекса производится замена:

ippip

ii

10

= , или ippp

10

= ,

pip iipi . 01= , или .. 01 pip p=

И формула среднего гармонического индекса цен будет иметь вид:

)( 111

11.

111

11

qpi

qp

qpi

qpI

pii

ip

iip =

= ,

где i p1 — вектор обратных величин индивидуальных индексов цен това-

ров; )( 11qp — вектор товарооборота (объема продаж в стоимостном вы-

ражении) в отчетном периоде.

Индексный анализ факторов изменения среднего уровня Рассмотрим случай, когда один товар реализуется в нескольких мес-

тах или один вид продукции производится на ряде предприятий.Для этого случая можно рассчитать среднюю цену в каждом временном периоде. По отношению этих средних можно получить три взаимосвязанных индекса: индекс переменного состава, индекс структурных сдвигов и индекс фикси-рованного состава.

Индекс переменного состава определяется по формуле:

=

qqp

qqp

Ii

ii

i

iipп

0: 00

1

11 ,

Индекс фиксированного о состава определяется по формуле:

qpqp

Iii

iipф

10

11

= .

Индекс структурных сдвиго определяется по формуле:

=

qqp

qqp

Ii

ii

i

iipстр

0: 00

1

10 .

Первая часть индекса позволяет определить среднюю цену текущего периода при условии, если бы цены остались на уровне базисного периода.

Page 109: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

109

Вторая часть отражает среднюю фактическую цену базисного периода. В целом по индексу можно судить об изменении цены за счет структурных сдвигов. Взаимосвязь индексов следующая:

III pпpстрpф =. ,

То есть индекс переменного состава равен произведению индекса фиксированного состава на индекс структурных сдвигов. Аналогично строятся и используются индексы для анализа изменения себестоимости, урожайности и других показателей.

Использование индексов в территориальных сравнениях В отличие от динамических территориальные индексы служат для

сравнения показателей в пространстае, то есть по предприятиям, округам, городам, районам и т.п. Построение территориальных индексов требует решения вопросов, связанных с выбором базы сравнения и весов, или уровня, на котором фиксируются веса.

При двусторонних сравнениях каждая территория может быть и срав-ниваемой (числитель индекса, и базой сравнения. Веса как первой, так и второй территории, также имеют равные основания для использования при расчетах. Чтобы не было неопределенности, в качестве весов принима-ются объемы проданных товаров по двум регионам (А и B), вместе взятым:

Q = qa +qb . Территориальный индекс в этом случае рассчитывается по формуле:

QpQp

Iiia

iibapb

=/ .

Можно рассчитать и обратный индекс:

QpQp

Iiib

iiabpa

=/ .

Второй способ расчета территориальных индексов заключается в уче-те соотношения весовна каждой из территорий.Для этого сначала опреде-ляется средняя цена каждого товара по территориям, вместе взятым:

qqp

pij

ijij

i

= .

После этого рассчитывается территориальный индекс по формуле:

=

qpqp

qpqp

Ii iai

iaia

ib

ibibapb :/ .

Разложение абсолютных приростов по факторам Построение взаимосвязанных индексов позволяет одновременно ре-

шать две задачи: определить изменение сложного (результативного) показа-теля в относительном и абсолютном выражении за счет влияния отдельных

Page 110: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

110

факторов. Расчет изменения результативного показателя за счет изменения отдельных факторов в абсолютном выражении называется разложением абсолютного прироста (убыли) по факторам.

Рассмотрим методы разложения по факторам на примере двухфактор-ной модели, приведенной в учебнике «Теория статистики» под редакцией Г. Л. Громыко*.

Пусть имеются данные по сельскохозяйственному предприятию о продаже картофеля на трех рынках области (табл. 17, графы А, 1-4). Тре-буется определить абсолютное и относительное изменение выручки от продажи картофеля в апреле по сравнению с выручкой в марте и разло-жить абсолютное изменение по факторам.

Решение Общая выручка равна сумме произведений цены на объем продаж

(∑p0q0 — за март — 17800 руб., ∑ p1q1 — за апрель — 29400 руб., графы 5, 6 табл. 17) и относительное изменение выручки от продажи равно:

17800

29400

00

11 =

=

qpqp

I pq = 1, 651 ( или 165,1 %).

В абсолютном выражении изменение выручки составило: ∆pq = ∑ p1q1 - ∑ p0q0 = 29400 – 17800 = 11600 руб.

Так как общая выручка зависит от объема продаж в натуре и от цен, рассчитаем соответствующие индексы.

17800

22200

00

10 =

=

qpqp

I q = 1, 247 ( или 124,7 %);

Таблица 17. Данные о продаже картофеля на трех рынках**

Рынок Цена 1 кг, руб. Продано, кг Выручка от продажи, руб. p0q1

Март p0 Апрель p1 Март q0 Апрель q1 Март p0q0 Апрель p1q1 A 1 2 3 4 5 6 7 1 8 10 800 1000 6400 10000 8000 2 9 12 600 800 5400 9000 7200 3 10 14 600 700 6000 9800 7000 ∑ - - 2000 2500 17800 29400 22200

324,117800

29400

10

11 ==

=

qpqp

I p (или 132,4%).

Это означает, что общая выручка от продажи картофеля выросла на 24,7 % за счет изменения количества реализованной продукции и на 32,4 % за счет изменения цен. Причем рост выручки вызван не только изменением общего количества проданного картофеля, но и доли реализации на от-дельных рынках, то есть изменением структуры продаж. * [13, с.407-412] ** [13, с.407]

Page 111: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

111

В целом относительное изменение стоимости равно произведению факторных индексов, то есть агрегатные индексы результативного и фак-торных показателей связаны мультипликативно:

Ipq = IpIq или qpqp

qpqp

qpqp

00

10

10

11

00

11 .

=

= 1,324. 1,247 = 1,651.

Соответственно абсолютный прирост можно разложить по факторам по следующем схеме (первый метод):

)()(001010110011 qpqpqpqpqpqp −+−=− или ∆pq= p∆pq + q∆pq,

где ∆pq = qpqp 0011− — общее изменение выручки;

p∆pq = )(1011 qpqp − — изменение выручки за счет изменения цен;

q∆pq = )(0010 qpqp − — изменение выручки за счет изменения объема

и доли( структуры) продаж. Так, в примере ∆pq =11600 руб., p∆pq =29400 – 22200 = 7200 руб.,

q∆pq = 22200-17800 = 4400 руб. В целом, 11600 = 7200 + 4400. Такой метод наиболее распространен, но при таком разложении

структурный фактор остается невыделенным. Второй метод разложения по факторам применим к однородным сово-

купностям, для которых можно рассчитать средние значения индексируемо-го качественного показателя и индексы переменного и фиксированного со-става и структурных сдвигов. По данным того же примера (табл. 17.) для каждого месяца рассчитаем среднюю цену на картофель, а именно:

в марте

=qqpp0

000

= 17800/2000 = 8,9 руб.;

в апреле

=qqpp1

111

= 294400/2500 = 11,76 руб.

Сопоставляя средние цены на картофель за два меcяца, получим ин-декс переменного состава:

=qqp

qqp

I pп0

00

1

11 : = 11,76/8,9 = 1,321 (или 132,1 %),

который показывает, что средняя цена на картофель в апреле по сравнению со средней ценой в марте возросла на 32,1 %. Цена изменилась и за счет изменения цен на отдельных рынках и за счет изменения структуры про-даж на них. Чтобы устранить влияние структурного фактора рассчитаем индекс фиксированного состава:

qpqp

I pф10

11

= = 29400/22200 = 1,324 ( или 132,4 %).

Значение этого индекса совпадает с индексом физического объема Ip по первому методу.

Page 112: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

112

Разделив индекс цен переменного состава на индекс фиксированного состава, получим индекс структурных сдвигов, характеризующий измене-ние средней цены за счет изменения доли продаж на отдельных рынках.

III pфpпpстр : = = 1,321 /1,324 = 0,998 (или 99,8 %). Этот же результат можно получить непосредственно по формуле:

=×=qzqz

qzzq

qzqzI pстр

0000

0

1

11 111

0= 8,88: 8,9 = 0,998.

То есть, на 0,2 % средняя цена снизилась за счет изменения структуры продаж.

Следовательно, абсолютный прирост выручки ∆pq =11600 руб. можно разложить по факторам: 1) за счет изменения общего объема проданного картофеля q :

∑p∆pq= (∑q1 - ∑q0). p0= (2500-2000).8,9 = 4450 руб.

2) за счет изменения средней цены на картофель p0

pср∆pq = qpp 101 )( − = (11,76 -8,9)2500 = 7150 руб.

Этот результат можно также разложить на 2 слагаемых: а) прирост выручки за счет изменения цен на отдельных рынках:

p∆pq = )(1011 qpqp − = 29400- 22200 = 7200 руб.;

б) прирост выручки за счет изменения структуры

qср∆pq = )(0

00

1

10

−qqp

qqp ∑q1= (8,88-8,9)2500 = - 50 руб.

В сумме 7200 и (-50) дают 7150. Таким образом, мы разложили общий абсолютный прирост, равный

11600 руб., на 3 части: 1) 4450 руб. — за счет изменения объема реализации картофеля; 2) 7200руб. — за счет изменения цен на картофель (на всех рынках); 3) -50 руб. — за счет структурного фактора.

Аналогично проводится анализ изменения затрат на производство продукции под воздействием двух факторов: изменения себестоимости продукции и объемов производства. Относительное влияние отражают ин-дексы:

Izq = IzIq =

=×qzqz

qzzq

qzqz

0000

0

1

11 111

0.

Абсолютное изменение затрат на производство за счет отдельных факторов рассчитывается следующим образом:

∆zq = ∑z1q1 -∑z0q0; ∆zqz =∑z1q1 -∑z0q1; ∆zqq = ∑ q1z0 -∑ q0z0. Взаимосвязь абсолютных изменений определяется уравнением:

∆zq = ∆zqz + ∆zqq.

Page 113: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

113

Методы расчета и анализа индексов цен В статистическом изучении динамики цен ведущая роль принадлежит

индексному методу. Сравнение цен одного товара осуществляется с помо-щью индивидуального (однотоварного) индекса цен:

i

i

p ppi

0

1=

где pi0 , pi

1 — цены на товар в базисном и текущем периоде. Индекс средних цен применяется при изучении изменения цен товар-

ных групп, цен одного товара по различным территориям и субрынкам:

÷

=

−n

ii

n

iii

n

ii

n

iii

pq

qp

q

qpi

10

100

11

111

где pi1, qi1 — цена и количество проданного i-го вида товара (товара на i-й территории или i-м субрынке) в отчетном году, i = l,…, n; pi0, qi0 — цена и количество проданного i-го вида товара (товара на i-й территории или i-м субрынке) в базисном году, i=l,…, n.

Товары должны быть достаточно однородными, чтобы их количество поддавалось суммированию.

Основной формой индекса цен для совокупности разнородных това-ров является агрегатный индекс. Цены различных товаров (например, кон-дитерских изделий и компьютеров) складывать бессмысленно. Несумми-руемость элементов совокупности преодолевается путем взвешивания ка-ждой цены по количеству проданных товаров. Сумма произведений цен товаров на их количество составляет товарооборот совокупности товаров. Чтобы выявить непосредственно изменение цен, необходимо зафиксиро-вать показатели количества на одном из уровней:

- базисного периода времени (формула Ласпейреса);

=

00

01qpqрЛ

рI , где q0 — количество товара в базисном периоде, p1 и p0 — цена

единицы товара соответственно в отчетном и базисном периодах - текущего периода времени (формула Пааше)

=10

11qpqрП

рI , где q1 – количество товара в отчетном периоде.

Четкость интерпретации, экономический смысл и удобство практиче-ского расчета формулы Ласпейреса сделали ее самой популярной в мире для расчета индекса потребительских цен, который показывает, во сколько раз изменились бы потребительские расходы в текущем периоде по сравнению с базисным, если бы при изменении цен уровень потребления оставался прежним. Такой расчет корректен при отсутствии значительных количест-венных и качественных изменений в структуре потребления (во времени и по территории, если индекс рассчитывается для нескольких регионов).

Page 114: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

114

Изучение динамики розничных цен (например, для получения дефля-тора, позволяющего рассчитать стоимостные показатели от четного перио-да в сопоставимых ценах) должно быть максимально приближено к сово-купности товаров, произведенных в отчетном периоде. Результат расчета по формуле Пааше показывает, во сколько раз сумма фактических затрат населения на покупку товаров больше (меньше) суммы денег, которую на-селение должно было бы заплатить за эти же товары, если бы цены остава-лись на уровне базисного периода. Статистическим анализом доказано, что в долговременном аспекте формула Пааше занижает реальное изменение цен вследствие общественной отрицательной корреляции (относительный вес товара падает, если цена его возрастает).

Доказано, что наилучший линейный индекс лежит между индексами, вычисленными по формулам Ласпейреса и Пааше. Зарубежные статистики пытались найти компромиссную формулу.

Формула Эджворта — Маршалла: IЭ-М= (pi

1((q1+q0)/2))/(pi0((q1+q0)/2))

Эта формула улавливает сдвиги в структуре покупок, но привязана к условной структуре товарооборота, не характерной ни для одного реаль-ного периода, не имеет прямого экономического смысла. Ее расчет встре-чает препятствия в сборе материалов.

Наиболее удачным компромиссом многие экономисты считают «иде-альный» индекс Фишера:

⋅=

10

11

00

01

qpqp

qpqp

I p ,

который оценивает не только набор товаров базисного периода по ценам текущего, но и набор товаров текущего периода по ценам базисного. При-меняется в случае трудностей с выбором весов или значительного измене-ния структуры весов.

Разновидностью розничных цен являются цены на продукты массово-го (общественного) питания. Они образуются на базе розничных или опто-вых цен на продукты, покупаемые предприятиями массового питания с до-бавлением наценки, возмещающей издержки на переработку продуктов и дающей прибыль. Непосредственная регистрация цен продукции массо-вого питания практически невозможна из-за большого разнообразия ее со-става и отсутствия стабильной единицы измерения. Поэтому для расчета индекса цен на продукцию массового питания исчисляют индекс цен на израсходованные продукты и товары, проданные на предприятиях массо-вого питания, и индекс ценовых факторов наценки (Inp). Последний, в свою очередь, состоит из двух индексов: индекса норм наценок (т.е. про-цента наценки к цене продукта) и индекса изменения самих цен:

Page 115: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

115

=

−k

i

k

ik

i

k

ik

io

k

i

qpn

qpn

qpn

qpn

qpn

qpn

1100

1110

1110

1111

110

1111

где n1,p1,q1— норма наценки, цена и количество товаров в отчетном году; n0, p0, q0 — норма наценки, цена и количество товаров в базисном году; k — число i-x разновидностей товаров;

Так как расход продуктов в производстве продукции массового пита-ния учитывается в стоимостных единицах, то для расчета используется формула среднего гармонического индекса:

где

00

11

pnpniii pnпр =⋅=

Формула индекса цен массового питания имеет вид:

Индексы при систематическом расчете из года в год образуют ин-

дексные ряды. Различают базисные ряды (цены каждого года сравнивают-ся с ценами года, принятого за базу) и цепные (характеризующие измене-ние цен по сравнению с предыдущим годом). Веса индексов ряда могут быть постоянными (на уровне одного года), и тогда произведение цепных индексов даст базисный индекс.

Применение системы переменных весов (по количеству товаров от-четного года) в индексном ряду цен порождает ошибку при переходе от цепных индексов к базисным и обратно, так как позитивна корреляция ме-жду текущим изменением цен и прошлым изменением количества продан-ных товаров. Эта ошибка мала, если корреляционная связь между измене-нием цен и количества проданного товара незначительна. На практике сис-тема цепных индексов (достоинство — сокращает период сравнения, огра-ничивает круг несопоставимых товаров) используется для коротких перио-дов, затем осуществляется поправка по формуле базисного периода, так как за длительный период ошибка накапливается.

Численные значения индексов, рассчитанных по различным форму-лам на основе одних и тех же данных, отличаются и порой значительно, особенно в годы резких изменений уровня цен и связанного с этим изме-нения структуры спроса. Отдать предпочтение одной формуле трудно: разные цели диктуют применение индексных форм, имеющих разный эко-номический смысл. Отказ от концепции единственного индекса цен в пользу концепции системы индексов позволит дать обобщающую

=

k

i no

k

iпр

qpni

qpnI

1111

1111

1

Page 116: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

116

характеристику и оценку основных причин изменения розничных цен. Но поскольку все же индексный метод не универсален, а отражает лишь тен-денцию движения цен, то нельзя требовать большей определенности от рассчитанных индексов. Кроме того, на чистоту результатов огромное влияние оказывает достоверность исходных материалов, особенно ошибка выборки, степень представительности товаров, включенных в расчет.

Методы оценки уровня и динамики инфляции Одной из самых важных характеристик состояния экономики любой

страны является уровень инфляции, который проявляется в росте общего уровня цен. Рост уровня цен неравнозначен понятию «инфляционный рост цен», так как может включать изменение цен, обусловленное изменением качества продукции и услуг. Не существует единого статистического пока-зателя, способного отделить один из другого, тем более что оценка изме-нения качества не возможна без привлечения экспертных методов. Поэто-му адекватная оценка инфляции возможна только с использованием раз-вернутой системы показателей.

Для наиболее общей характеристики уровня инфляции в мировой практике используются два показателя. Индекс потребительских цен (ИПЦ) позволяет оценить уровень инфляции на потребительском рынке.

Дефлятор валового внутреннего продукта (ДВВП) оценивает степень инфляции по всей совокупности благ, производимых и потребляемых в го-сударстве, учитывает не только изменение цен товаров народного потреб-ления, но и цен товаров, используемых в государственных интересах, ин-вестиционных, экспортируемых и импортируемых товаров и услуг. В большинстве стран ИПЦ публикуется ежемесячно, в кризисных услови-ях - еженедельно. Периодичность расчета ДВВП квартальная или годовая. Это связано с относительной сложностью его расчета.

В России ИПЦ исчисляется за каждый месяц и нарастающим итогом с начала года по модифицированной формуле Ласпейреса:

−−= ii

iiti

t

it

qp

qppp

ЛрI

00

011 где pi

t-1qi0 = p0q0 (p1/p0)(p2/p1)(…)(pt/pt-1).

Модификация состоит в том, что изменение цен исчисляется на осно-ве последовательных наблюдений цены, т. е. в каждый период времени ба-зовые веса умножаются на последнее значение индекса цен.

ДВВП в большинстве стран определяется по методу Пааше. Известная формула может быть представлена в виде:

где ptqt — номинальный ВВП, p0qt — реальный ВВП. Отечественная практика расчета ДВВП имеет некоторые особенности:

сначала с помощью индексов цен или физического объема (в зависимости от имеющейся базы) производится постатейная переоценка ВВП, рассчитанного

t

tt

qpqpI

0

=

Page 117: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

117

по методу конечного использования, в ценах предыдущего года. Затем по формуле Пааше рассчитывается цепной ДВВП. Базисный ДВВП определя-ется путем перемножения всех годовых ДВВП в промежутке от отчетного до — базисного года.

Основным показателем динамики инфляции служит норма инфляции: N=(It - It-1) /It где It и It-1 — индексы цен смежных периодов. Норма инфляции показывает, на сколько процентов изменился уро-

вень инфляции за данный период времени. Если N составляет 1 – 9 %, ин-фляция называется «ползучей», 10 – 49 % — «галопирующей». В случае 50 % и более в месяц — экономика «больна» гиперинфляцией.

Для измерения инфляции используется индекс покупательной спо-собности денежной единицы, показывающей, во сколько раз обесценились деньги: IП.С.= 1 / Ip

Одной из составляющих инфляции является денежная масса, не обес-печенная соответствующим количеством товаров и услуг. Величина де-нежной массы зависит от количества денег в обращении и от скорости их обращения. Теоретически относительный рост денежной массы при замед-лении оборота денег может не привести к инфляции, например, если по-вышены процентные ставки на депозиты. Но, как правило, не обеспечен-ный товарами выпуск денег побуждает покупателей к быстрой их реализа-ции, что увеличивает скорость оборота денег и усиливает разбег инфля-ции. Величина товарной массы, второй составляющей инфляции, зависит от ее физического объема и цен товаров. Поскольку товарная и денежная масса стремятся к рыночному равновесию, то рост средних цен товарной массы определяется размером изменения ее физического объема, массы денег в обращении и скорости их обращения. Таким образом, общий раз-мер инфляции прямо пропорционален росту денежной массы и увеличе-нию скорости обращения денег и обратно пропорционален росту товарной массы (в постоянных ценах).

Денежная масса рассчитывается государственной статистикой как оборот и остатки наличных и безналичных денежных средств, сумма всех доходов с учетом размера накоплений, взносов и платежей; товарная масса - как товарооборот и продажа услуг, денежные расходы населения на по-купку товаров и услуг или ВВП.

Степень соответствия товарной и денежной массы оценивается с по-мощью ряда показателей:

- соотношения денежной и товарной массы в статистике и динамике; - соотношения темпов роста денежной эмиссии и цен; - соотношения темпов роста доходов и цен. Изменение номинальных доходов (p1q1-p0q0) складывается из измене-

ния реальных (пересчитанных в сопоставимые цены) доходов (p0q1-p0q0) и роста доходов за счет изменения цен (p1q1-p0q1).

Page 118: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

118

Сопоставление этих показателей покажет размер потерь (прироста) реальных доходов, или насколько рост доходов населения возмещал его потери от обесценения денег. Аналогично осуществляется анализ реаль-ных потерь денежных накоплений населения.

В качестве информационной базы для анализа инфляции используют-ся различные источники. Цены на товары и услуги-представители собира-ются статистикой методом выборочного наблюдения; структура потреби-тельских расходов определяется статистикой семейных бюджетов в ходе регулярных обследований; система статистической отчетности получает данные о товарообороте; сведения о денежной массе статистические орга-ны получают от банков; баланс денежных доходов и расходов населения позволяет определять затраты на приобретение товаров и услуг.

Контрольные вопросы и задания 1. Какова роль индексного метода анализа в экономических исследованиях? 2. На каких принципах базируется расчет агрегатных индексов объемных и ка-

чественных показателей? 3. В чем различие агрегатных индексов Ласпейреса и Пааше и какие факторы

оказывают влияние на расхождение в величине этих индексов? 4. Какие виды средних индексов используются в статистической практике и для

решения каких проблем? 5. Запишите формулу «идеального» индекса Фишера. Какой вид средних вели-

чин используют для его расчета? 6. Что характеризует индекс влияния структурных сдвигов? Напишите формулу

для его расчета. 7. Какие методические приемы используют при расчете индексов фондового

рынка? 8. Как измерить уровень инфляции? 9. Какие формы индексов используют при территориальных сопоставлениях? 10. Какие характеристики определяют вид расчетной формулы фондового ин-

декса?

Page 119: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

119

ПРИЛОЖЕНИЕМетодика изучения дисциплины «Статистические методы обработки

данных» предусматривает чтение лекций, проведение семинарских и прак-тических занятий, самостоятельную работу. После изучения раздела 2 сту-денты выполняют курсовую работу, а по окончании обучения по дисципли-не — сдают зачет, экзамен. Так как данная дисциплина по сути есть другое название дисциплин «Теория статистики», «Статистический анализ», «Ме-тоды прикладной статистики в социологии», при ее изучении могут исполь-зоваться любые методические материалы, разработанные, в частности, на кафедре экономики, организации и управления производством Тюменского государственного нефтегазового университета для студентов всех направ-лений и специальностей [20–27]

Указания к выполнению курсовой работы*

Общие требования к содержанию и оформлению курсовой работы. Выполнение курсовой работы предполагает закрепление полученных сту-дентами знаний, развитие самостоятельных творческих навыков работы с литературой, статистическими и методическими материалами, а также приобретение практического опыта статистических исследований и работы по анализу и прогнозированию социально-экономических показателей.

Задачи курсовой работы сводятся к приобретению студентами следую-щих навыков:

- применять знания, полученные на лекциях и практических занятиях, для самостоятельного анализа временных рядов;

- выявлять тренды (тенденции роста) экономики в условиях конкретных регионов и комплексов;

- проводить экономико-статистический анализ динамических рядов по-казателей развития экономики отраслевых, межотраслевых и региональных комплексов РФ;

- экономически обосновывать прогнозы развития предприятий, отрас-лей, комплексов и регионов России, внедрения инноваций и принимать ре-шение об их целесообразности;

- теоретически грамотно и логически последовательно излагать рассма-триваемую проблему.

* За основу взята методическая работа кафедры экономики, организации и управления производством ТюмГНГУ, разработанная для студентов специальности 080601 «Стати-стика» очной формы обучения [21]

Page 120: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

120

Выполнение курсовой работы является одним из важных моментов под-готовки к дипломному проектированию. Взаимосвязь курсового и диплом-ного проектирования обеспечивается продуманным выбором направления развития конкретного предприятия (комплекса, региона, страны) на стадии курсового проектирования, освоения методики экономического обоснова-ния принятия решений.

Методологической основой курсового проектирования являются законо-дательные акты Российской Федерации по экономике в целом, по регионам и отраслям России, международные стандарты СНС (системы националь-ных счетов), международные стандарты по финансам и бухгалтерскому учету, положения общей теории статистики, теории математической и при-кладной статистики, положения теории, методологии и практики методи-ческих работ в РФ по социально-экономической и финансовой статистике. Для написания курсовой работы рекомендуется использовать отчетные данные по предприятию (региону, комплексу, стране) за ряд лет, статисти-ческие сборники Росстата, учебную и специальную литературу, периодиче-ские издания, монографии, брошюры, статьи.

Выполнение курсовой работы включает следующие этапы:1. Получение задания и консультация по сбору материалов с руководи-

телем.2. Изучение настоящих методических указаний.3. Составление плана работы и изучение литературы по теме курсовой

работы.4. Сбор исходных материалов (статистических данных по временным

рядам) на предприятиях (комплексах, регионах), в статистических ор-ганах страны.

5. Обработка и анализ собранных материалов.6. Написание курсовой работы, проведение экономико-статистических

расчетов и обоснований.7. Оформление курсовой работы.8. Сдача курсовой работы на проверку, исправление замечаний руково-

дителя (при их наличии).9. Защита курсовой работы.На любом этапе предусматривается возможность консультирования

с руководителем по курсовому проектированию при возникновении вопро-сов и сложных моментов в процессе курсового проектирования.

Исходными данными для выполнения курсовой работы является ма-териал, собранный студентом во время подготовки к написанию курсовой работы:

- общая характеристика объекта статистического исследования и основ-ные показатели его развития;

Page 121: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

121

- основные технико-экономические и социально-экономические показа-тели развития объекта за последние 10–15 лет;

- прогнозные (основные технико-экономические и социально-экономи-ческие показатели на предстоящие 3–5 лет);

- выполнение планов развития объекта за последние 2–3 года;- текущие и перспективные планы (программы) технического и социаль-

но-экономического развития объекта;- данные по конкретным (выбранным студентом) показателям времен-

ных рядов, определяющих корреляционные связи между факторными и ре-зультативными признаками рядов распределения.

Источниками информации служат:- статистические сборники и бюллетени федеральной службы по стати-

стике РФ, газеты и журналы с публикациями технико-экономических и со-циально-экономических показателей;

- материалы пояснительных записок к годовым отчетам предприятий, компаний, отчеты федеральных и территориальных органов управления и их подразделений (департаментов, фондов, управлений и т. д.);

- планы и программы развития компаний, федеральных и территори-альных органов управления и их подразделений (департаментов, фондов, управлений и т. д.);

- отраслевые и региональные периодические издания;- законодательные акты, отраслевые и региональные руководящие доку-

менты.Курсовая работа должна представлять собой самостоятельную творче-

скую работу объемом не менее 50 страниц машинописного текста и вклю-чать элементы:

- титульный лист;- план (содержание);- введение;- 2–3 главы (параграфа), в логической последовательности отражающие

содержание работы;- заключение;- список литературы (не менее 20 наименований).Курсовая работа оформляется в соответствии с ГОСТами на одной сто-

роне листа формата А4 с соответствующим образом оформленным титуль-ным листом (см приложение 1).

Page 122: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

122

Тематика курсовых работ

Тематика курсовой работы продиктована особенностью технико-эконо-мического образования и необходимостью подготовки к дипломному про-ектированию. Студентам предлагаются варианты темы курсовой работы, которые должны отличаться методами обработки динамических рядов, объектом исследования (те есть, написанием по данным различных стати-стических совокупностей), которые не должны повторяться (при согласова-нии с руководителем курсовой работы может быть сформулирована инди-видуальная тема).

Ниже предлагается образец плана по общей теме дисциплины.

Тема курсовой работы:«Статистический анализ и прогнозирование временного ряда развития объ-екта

«_______________________________________________»(наименование предприятия, региона, межотраслевого комплекса )

Курсовая работа включает следующие разделы:Введение1. Характеристика объекта (предприятия, региона, комплекса) 1.1. Организационно- производственная характеристика предприятия (региона, комплекса). 1.2. Анализ динамики экономических показателей предприятия (региона, комплекса). 1.2.1. Сопоставление уровней и смыкание рядов динамики. 1.2.2. Основные показатели изменения уровней ряда. 1.2.3. Исчисление средних показателей в рядах динамики.2. Экономико-статистический анализ временных рядов объекта. 2.1. Выявление и характеристика тренда (основной тенденции) изменения факторных и результативных показателей развития объекта. 2.2. Измерение колеблемости в рядах динамики. 2.2. 1.Выявление и измерение сезонных колебаний. 2.3. Автокорреляция в рядах динамики. Построение моделей авторегрессии 2.4. Корреляция рядов динамики и проведение регрессионного анализа показателей.3. Прогнозирование развития объекта (предприятия, региона, комплекса). 3.1. Построение линий регрессии анализируемых (факторных

Page 123: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

123

и результативных) показателей развития предприятия (региона, комплекса) и статистическая оценка ее теоретических показателей. 3.2. Расчет прогнозных показателей факторных и результативных признаков по линии тренда. 3.3. Расчет прогнозных показателей результативных признаков по линии регрессии и экономическое обоснование вариантов развития объекта (предприятия, региона, комплекса).ЗаключениеСписок использованных источниковПриложения

Во введении на 2–3 страницах доказывается актуальность темы (обосно-вывается роль объекта (предприятия, региона, топливно-энергетического комплекса), отражаются основные проблемы нефтегазодобывающего произ-водства, подчеркивается необходимость осуществления анализа и прогно-зирования временного ряда его, кратко излагается их суть); формулируются цель и задачи исследования, раскрывается структура работы, определяются ее основные этапы, информационная база, объект и методика исследования.

В первой главе дается краткая история развития объекта (предприятия, региона, комплекса), характеристика его организационно-правовой формы, производственной структуры, специализации, ассортимента продукции, специфики разрабатываемых месторождений, стадий их разработки и т. д.

Анализ технико-экономических показателей производится за последние 10–15 периодов (лет). При наличии сложности получения последних дан-ных по объекту допускается использование показателей за любые последо-вательные периоды. Изучаются тенденции изменения показателей произ-водственной программы, производственных и трудовых ресурсов, а также финансовых показателей. Для выявления тенденций развития предприятия рассчитываются показатели динамики (базисные и цепные темпы роста и темпы прироста) и делаются выводы о работе предприятия (региона, ком-плекса) и о направленности его развития за рассматриваемый промежуток времени. Динамика показателей может быть представлена графически.

Во второй главе на основе изучения литературы делается обзор основ-ных направлений экономико-статистического анализа временных рядов показателей и на основе фактических данных по исследуемому объекту (предприятию, региону, комплексу) изучается изменение его показателей за последние периоды с использованием основных методов анализа динами-ческих рядов (выявление и характеристика основной тенденции развития (тренда), измерение колеблемости в рядах динамики, выявление и измере-ние сезонных колебаний, выявление и измерение автокорреляции в рядах динамики, построение моделей авторегрессии, исследование корреляции

Page 124: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

124

рядов динамики взаимосвязанных показателей объекта). Выбор методов и экономико-статистических моделей развития (математических зависимо-стей и формул, таблиц и графических изображений и доказательств адек-ватности выравненных рядов фактическим) производится с учетом особен-ностей развития объекта и динамики его показателей. Вывод о наиболее подходящей эконометрической модели для прогнозирования развития объ-екта на перспективу обосновывается на основе проведенного анализа в этой главе.

В третьей главе на основе выше приведенного анализа выявляется влия-ние будущих изменений факторных признаков на величину результативных экономических показателей, дается прогноз их по наиболее эффективным вариантам с учетом изменения факторных признаков. Глава завершается выводами об экономической целесообразности реализации оптимального варианта развития комплекса в перспективе.

В заключении на 2–3 страницах кратко, но аргументированно, излагают-ся основные выводы, полученные в результате курсовой работы, начиная с первой главы.

Список используемых источников включает источники и литературу (в алфавитном порядке), которые были использованы при написании кур-совой работы (отчетные материалы предприятия (региона, комплекса), ста-тистические сборники и бюллетени, монографии, статьи, руководящие до-кументы, методические указания, приоритетные национальные проекты, федеральные и региональные программы и др.).

В приложениях помещаются материалы, использование в тексте кото-рых затрудняет восприятие из-за большого объема (схемы, таблицы, алго-ритмы и др.). Таблицы, данные которых являются основным материалом для раскрытия темы курсовой работы, помещаются в тексте в соответствии с логикой изложения и должны быть проанализированы в основной части работы.

Примерная тематика курсовых проектов (работ) в соответствии с самостоятельно выбранными объектами:

1. Статистический анализ и прогнозирование развития топливно-энергетиче-ского комплекса Тюменской области

2. Статистический анализ и прогнозирование развития нефтегазового комплекса Тюменской области

3. Статистический анализ и прогнозирование развития нефтяной промышленно-сти Тюменской области

4. Статистический анализ и прогнозирование нефтедобывающей промышленно-сти Тюменской области (без округов)

5. Статистический анализ и прогнозирование агропромышленного комплекса Тюменской области (без округов)

Page 125: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

125

6. Статистический анализ и прогнозирование электроэнергетической промыш-ленности Тюменской области (без округов)

7. Статистический анализ и прогнозир. лесозаготовительной промышленности Тюменской области (без округов)

8. Статистический анализ и прогнозирование мясо-молочной промышленности Тюменской области (без округов)

9. Статистический анализ и прогнозирование нефтеперерабатывающей про-мышленности Тюменской области (без округов)

10. Статистический анализ и прогнозирование медицинской промышленности Тюменской области (без округов)

11. Статистический анализ и прогнозирование промышленности Тюменской об-ласти

12. Статистический анализ и прогнозирование нефтегазового комплекса Яма-ло-Ненецкого АО

13. Статистический анализ и прогнозирование машиностроения Тюменской об-ласти 14.Статистический анализ и прогнозирование мясо-молочной промыш-ленности Тюменской области (без округов)

14. Статистический анализ и прогнозирование населения Тюменской области15. Статистический анализ и прогнозирование химической и нефтехимической

промышленности Тюменской области16. Статистический анализ и прогнозирование лесной, деревообрабатывающей

и целлюлозно-бумажной промышленности Тюменской области (округа, горо-да, района).

17. Статистический анализ и прогнозирование деревообрабатывающей промыш-ленности Тюменской области (округа, города, района).

18. Статистический анализ и прогнозирование мебельной промышленности Тю-менской области (округа, города, района)

19. Статистический анализ и прогнозирование промышленности строительных материалов Тюменской области (округа, города, района).

20. Статистический анализ и прогнозирование легкой промышленности Тюмен-ской области (округа, города, района)

21. Статистический анализ и прогнозирование рыбной промышленности Тюмен-ской области (округа, города, района).

22. Статистический анализ и прогнозирование комбикормовой промышленности Тюменской области (округа, города, района)

23. Статистический анализ и прогнозирование мукомольно-крупяной промыш-ленности Тюменской области (округа, города, района).

24. Статистический анализ и прогнозирование трубопроводного транспорта Тю-менской области

25. Статистический анализ и прогнозирование автомобильного транспорта Тю-менской области

26. Статистический анализ и прогнозирование железнодорожного транспорта Тюменской области

27. Статистический анализ и прогнозирование трубопроводного транспорта Тю-менской области (без округов)

28. Статистический анализ и прогнозирование строительства Тюменской области (округа, города, района).

29. Статистический анализ и прогнозирование образования Тюменской области (округа, города, района).

30. Статистический анализ и прогнозирование здравоохранения Тюменской обла-сти (округа, города, района).

31. Статистический анализ и прогнозирование жилищного строительства Тюмен-ской области (округа, города, района).

Page 126: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

126

СПИСОК ЛИТЕРАТУРЫ

1. Громыко Г. Л. Теория статистики. Практикум. — 3-е изд., доп. и перераб. — М.: Ин-фра-М, 2010. — 205 с.

2. Ефимова М. Р., Петрова Е. В., Румянцев В. Н. Общая теория статистики: Учебник. — 2-е изд., доп. и перераб. — М.: Инфра-М, 2010. — 416 с.

3. Килин П. М. Система измерения макроэкономического кругооборота регионального продукта. — Тюмень, ТюмГНГУ, 2009. —156 с.

4. Назаров М. Г. Статистика. Учебно-практическое пособие. — М.: КНОРУС, 2010. — 480 с.5. Октябрьский П. Я. Статистика: учеб. — М: ТК Велби, Изд. Проспект, 2010. — 328 с.6. Плошко Б. Г., Елисеева И. И. История статистики. — М.: Финансы и статистика, 19907. Cтатистика: Учебник для вузов (+ СD) / под ред. профессора И. И. Елисеевой — СПб.:

Питер, 2012. — 368 с.8. Cтатистика: учебник / И. И. Елисеева [и др.]; под ред. И. И. Елисеевой. — Москва:

Проспект, 2011. — 448 с.9. Статистика: учебн. / В. Г. Минашкин [и др.]; под ред. В.Г, Минашкина. — М.: ТК Вел-

би, Изд-во Проспект, 2006. — 272 с.10. Статистика: учебно-практическое пособие. Под ред. М. Г. Назарова. — М.: КНОРУС,

2011. — 480 с.11. Статистика. Практикум: учебное пособие / кол.авторов; под ред. В. Н. Салина,

Е. П. Шпаковской. — М.: КНОРУС, 2009. — 496 с.12. Статистика. Учебник. Под ред В. С. Мхитаряна. — М.: Экономистъ, 2011. — 671 с.13. Теория статистики. Учебник. Под ред. Г. Л. Громыко. — 2-е изд., доп. и перераб. — М.:

Инфра-М., 2010. — 476 с.14. Экономическая статистика: учебник / под ред. Ю. Н. Иванова. — М.: ИНФРА-М,

2006. —736 с.15. Российский статистический ежегодник. Официальное издание. Статистический

сборник. Росстат. М., 2000–2012.16. Регионы России. Социально-экономические показатели. Официальное издание. Рос-

стат. М., 2000–2012.17. Регионы России. Основные характеристики субъектов Российской Федерации. Офи-

циальное издание. Статистический сборник. М.: Росстат. — М., 2000–2012.18. Информационные издания Территориального органа Федеральной службы государ-

ственной статистики (Тюменьстат). Режим доступа: http://www.tumstat.gks.ru.19. Официальные статистические публикации Федеральной службы государственной

статистики (Росстат). Режим доступа: http://www.gks.ru.

Методические указания

1. Килин П. М. Методические указания по изучению курса «Анализ вре-менных рядов и прогнозирование» для студентов специальности 080601 «Статистика» очной формы обучения. — Тюмень: ТюмГНГУ, 2008.

2. Килин П. М., Краснова Т. Л., Курушина Е. В. Методические указания к вы-полнению курсовой работы по диcциплине «Анализ временных рядов и прогнозирование» для студентов специальности 080601 «Статистика» очной формы обучения. — Тюмень: ТюмГНГУ, 2008.

Page 127: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

127

3. Килин П. М. Методические указания по изучению курса «Статистика транспорта» для студентов специальности 060800 «Экономика и управ-ление на предприятиях (на трубопроводном транспорте)» очной формы обучения. — Тюмень: ТюмГНГУ, 2008.

4. Килин П. М. Методические указания к выполнению курсовой работы по диcциплине «Статистика транспорта» для студентов специальности 060800 «Экономика и управление на предприятиях (на трубопроводном транспорте)» очной формы обучения. — Тюмень: ТюмГНГУ, 2008.

5. Килин П. М. Методические указания к выполнению курсовой работы по диcциплине «Статистика промышленности» для студентов специально-сти 060800 «Экономика и управление на предприятии природопользова-ния» очной формы обучения. — Тюмень: ТюмГНГУ, 2008.

6. П. М. Килин, Н. И. Чекмарева. Методические указания по изучению дис-циплины «Статистические методы обработки данных», проведению прак-тических занятий, организации самостоятельной работы и выполнению курсовых работ для студентов, обучающихся по направлению подготовки магистров 131000.68 «Нефтегазовое дело». — Тюмень: ТюмГНГУ, 2013.

7. П. М. Килин, Н. И. Чекмарева. Методические указания по изучению дис-циплины «Методы прикладной статистики в социологии», проведению практических занятий, организации самостоятельной работы и выпол-нению курсовых работ для студентов, обучающихся по направлению подготовки бакалавров 040100.62 «Социология» профиль «Прикладные методы социологических исследований». — Тюмень: ТюмГНГУ, 2013.

8. П. М. Килин, Н. И. Чекмарева. Методические указания по изучению дис-циплины «Статистический анализ», проведению практических занятий, организации самостоятельной работы и выполнению курсовых работ для студентов, обучающихся по направлению подготовки подготовки бакалавров 131000.62 «Нефтегазовое дело». — Тюмень: ТюмГНГУ, 2013.

Page 128: СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ …elib.tyuiu.ru/wp-content/uploads/2014/02...4 ВВЕДЕНИЕ Учебно-практическое пособие по

Учебное издание

Килин Петр МартемьяновичЧекмарева Наталья Ивановна

СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ДАННЫХ

В авторской редакцииДизайн обложки А. В. Клеменко

Подписано в печать 18.12.2013. Формат 60х90 1/16.Усл. печ. л. 8,0. Тираж 110 экз. Заказ № 2289.

Библиотечно-издательский комплексфедерального государственного бюджетного образовательного

учреждения высшего профессионального образования«Тюменский государственный нефтегазовый университет».

625000, Тюмень, ул. Володарского, 38.

Типография библиотечно-издательского комплекса.625039, Тюмень, ул. Киевская, 52.