Upload
others
View
11
Download
0
Embed Size (px)
Citation preview
Федеральное агентство по образованию
Государственное образовательное учреждение
высшего профессионального образования
«Северный (Арктический) федеральный университет»
Институт права
Правовая статистика Учебное пособие
Специальность 030501
«Юриспруденция»
Архангельск
2010
Рассмотрена и рекомендована к изданию учебно-методической комиссией Института права и предпринимательства
Северного (Арктического) федерального университета марта 2009 г.
Автор:
С.Н. Папушина, доцент, канд. эк. наук
Рецензенты:
А.В. Тонцев, зам. нач. штаба УВД по Арх. области, полковник милиции С Е . Жура, канд. эк. наук, профессор, зам. каф. финансов и кредита
УДК ББК Правовая статистика: учеб.пособие для студентов очного, очно-
заочного и заочного отделений Института права и предпринимательства // С.Н. Папушина - Архангельск: САФУ, 2010. - 124 с.
Учебное пособие содержит все разделы курса, каждый из которых состоит из теории, методологии расчета показателей, примеров расчета таких показателей и контрольных вопросов по теме. Изучение курса дает студентам ясное представление о дисциплине «Правовая статистика», об организации и задачах ее; помогает овладеть основными приемами обработки статистических данных, приобрести навыки в технике вычисления статистических показателей.
© Северный (Арктический) федеральный университет, 2010
©Папушина СИ., 2010
СОДЕРЖАНИЕ
Введение 4
Теория и методология 5
Тема 1. Предмет, метод и задачи правовой статистики 5
Тема 2. Статистическое наблюдение 14
Тема 3. Сводка и группировка статистических данных 21
Тема 4. Статистические ряды. Статистические таблицы 29
Тема 5. Абсолютные и относительные статистические величины 36
Тема 6. Средние величины 44
Тема 7. Показатели вариации 53
Тема 8. Ряды динамики 60
Тема 9. Графическое изображение статистических данных 69
Тема 10. Индексы 82
Тема 11. Взаимосвязи экономических явлений 89
Тема 12. Выборочное наблюдение 104
Список литературы 119
3
Введение
Изучение курса «Правовая статистика» ставит своей целью овладение студентами, обучающимися по юридическим специальностям, методами статистического анализа, выявления закономерностей развития и взаимосвязей правовых явлений с помощью статистических показателей.
Данное учебное пособие содержит все разделы курса, каждый из которых состоит из теории, методологии расчета показателей, примеров расчета таких показателей и контрольных вопросов по теме.
Область права является для юридической науки принципиально важной категорией, предусматривающей систему правовых норм, регулирующих отношения в определенной сфере общественной жизни. В современных условиях повышения роли права возникает необходимость более широкого использования статистических методов для изучения состояния и динамики правовых процессов.
Знание системы статистических показателей, методологии их расчета и анализа — важное требование при подготовке специалистов высокой квалификации. Изучение статистики права дает возможность студентам овладеть научными методами познания правовых явлений и процессов.
В курсе правовой статистики излагается методология получения, контроля и обработки статистической информации, рассматривается природа статистических совокупностей, познавательные свойства статистических показателей, условия их применения.
Использование данного пособия в учебном процессе позволит студентам закрепить теоретические знания и практические навыки по правовой статистике.
4
Т е о р и я и м е т о д о л о г и я
Тема 1. Предмет, метод и задачи правовой статистики
Основные теоретические вопросы
Правовая статистика - общественная, социально - экономическая наука.
Предмет правовой статистики - массовые правовые и социальные явления.
Теоретическая основа статистики - закон больших чисел. Этапы исследования:
- наблюдение; - сводка и обработка; - анализ.
Статистика - многоотраслевая наука.
Задачи правовой статистики на современном этапе развития экономики.
Методические указания
Статистика возникла из практических потребностей общественной жизни. Слово "статистика" происходит от латинского слова status (статус) - состояние или положение. От этого слова образовалось итальянское слово "stato" (стато), под которым понималось государство пли управляемая область, а также знания о состоянии дел в них.
Первые попытки установить на основании статистических данных некоторые закономерности общественной жизни были сделаны в XVTT в. в Англии Джоном Граунтом и Вильямом Петти. В. Петти (1626-1697 гг.) в своих работах обосновал применение численного метода к изучению общественных явлений. Свои исследования он назвал "политической арифметикой". Это и было первоначальной формой статистики.
5
В настоящее время статистика рассматривается как самостоятельная наука, изучающая количественную сторону массовых социально-экономических явлений в неразрывной связи с их качественной стороной.
Статистика изучает количественную сторону явлений с помощью статистических показателей. Статистические показатели характеризуют уровни, размеры, объемы массовых явлений в определенных условиях. Можно, например, говорить о количестве убийств, хищений, хулиганств, всякого рода преступлениях; о темпах роста данных показателей, то есть об изменении их во времени - в течение года, квартала, месяца.
Особенность статистики состоит в том, что во всех случаях ее данные относятся к совокупности. Так, статистику, например, не интересует преступление, совершенное конкретным преступником, а интересует количество преступлений по группе людей, по причинам, по социальной принадлежности, по полу, возрасту и т.п., а также число правонарушений по регионам, стране в целом.
Изучение массовых явлений основывается на некотором общем принципе - законе больших чисел. Сущность закона больших чисел заключается в том, что общая закономерность массовых явлений проявляется под действием различных причин лишь в большой совокупности случаев, при взаимопогашении отклонений от закономерности, складывающихся под влиянием случайных причин, которые имеют место в отдельных единичных явлениях, составляющих множество. Проявление действия закона больших чисел можно видеть во многих областях явлений общественной жизни, изучаемых статистикой. Среднее число правонарушений на одного жителя, средний возраст правонарушителей и т.п. - все это статистические характеристики, которые выражают общие для данного массового явления закономерности. Таким образом, закон больших чисел способствует раскрытию закономерностей массовых явлений как объективной необходимости их развития.
Статистика как многоотраслевая наука состоит из общей теории статистики, математической статистики, экономической статистики (статистики народного хозяйства) и отраслевых статистик.
Общая теория статистики, как методологическая наука, разрабатывает систему статистических показателей для измерения и анализа, изучаемых
6
социально-экономических явлений и располагает сетью статистических методов для проведения исследования.
Общая теория статистики объединяет каждую отраслевую статистику с помощью методов исследования. К таким методам относят, в частности, метод статистических группировок, табличный и графический методы, методы исчисления средних и относительных величин, показателей вариации, показателей динамики, индексный и корреляционный методы исследования.
Любая законченная статистическая работа вообще и в органах юстиции в частности слагается из трех основных этапов:
1) статистического наблюдения; 2) сводки и группировки собранного материала; 3) анализа статистических показателей. Эти три этапа статистической работы неразрывно связаны друг с дру
гом и требуют составления предварительного плана всего статистического исследования, охватывающего его важнейшие разделы.
Статистическое наблюдение - первый этап статистического исследования - представляет собой массовую цифровую регистрацию определенных индивидуальных явлений по тем или иным интересующим нас признакам. Задачей первого этапа является сбор полной, объективно достоверной информации. Предположим, нам необходимо выяснить объем совершенных за определенный период преступлений и его изменения, установить их причины и наметить конкретные мероприятия по их предупреждению. Прежде чем ответить на поставленные вопросы, необходимо, очевидно, иметь в своем распоряжении конкретный статистический материал, охватывающий своими показателями количественную сторону такого явления, как преступность. Для получения этого материала нам и придется, прежде всего, провести статистическое наблюдение, т.е. регистрацию за определенный период времени каждого случая преступления, дошедшего до соответствующего государственного органа (милиции, прокуратуры, следствия или суда), характеризуя это преступление заранее установленными признаками (например, статьей уголовного кодекса), местом и временем совершения преступления, условиями, способствующими его совершению, мерой уголовного наказания и пр.
7
Такая работа будет проведена путем выборки из соответствующих учетно-регистрационных карточек всех нужных показателей. Конечно, такие карточки, являющиеся как бы сырым материалом, необходимо еще обработать и обобщить, соединив их в массы или совокупности, где, как известно, проявляются закономерности, где могут быть выявлены и измерены соответствующие взаимозависимости.
Задачами второго этапа статистического исследования являются группировка данных статистического наблюдения на качественно - однородные совокупности и подведение итогов (сводка) как отдельных групп, так и всей массы наблюдаемых фактов.
Разгруппируем все зарегистрированные преступления на более однородные совокупности по существенным признакам (предположим по главам и статьям Уголовного кодекса) и подсчитаем эти частные совокупности и их общий итог. Практически группировка и сводка осуществляются в виде составления отчетности, представляющей собой подсчет и разбивку на определенные категории соответствующих первичных документов, т.е. карточек, на уголовное и гражданское дело, на подсудимого и т.д. Полученные после такого подсчета абсолютные показатели уже дадут некоторое представление об общем объеме преступности или гражданских споров и об их структуре. Но этого еще недостаточно.
Третий этап всякого законченного статистического исследования дает ответ на вопрос об изменении преступности за определенный период времени. Для этого необходимо, очевидно, сопоставить данные о числе совершенных преступлений по годам, установить, количество каких видов преступлений увеличилось, каких уменьшилось, в каких городах, краях, областях и республиках преступность наиболее распространена, какова связь между преступностью и другими явлениями, предположим с алкоголизмом, и т.п. Все это требует соответствующей обработки сводных статистических показателей, например, приведение удельного веса отдельных видов преступлений к их общему итогу; определения степени изменения преступности по отношению к предыдущему периоду; вычисления коэффициентов преступности, т.е. отношения числа преступлений на 100 тыс. населения по городам, краям, областям и республикам для сопоставления преступности в территориальном аспекте; установления процента лиц, совершивших преступление в состоянии опьяне-
8
ния, и т.п. Скажем, показатели, характеризующие, что 96% хулиганств, 85% убийств и 67% изнасилований совершаются в состоянии опьянения, конкретно показывают прямую связь между преступностью и алкоголизмом, являющимся основным условием, способствующим совершению преступлений. Подобная обработка и анализ статистических данных позволяют увидеть взаимосвязи и закономерности в изучаемых общественных процессах, что является важнейшей задачей третьего этапа.
Статистические данные о развитии народного хозяйства и отдельных отраслей являются необходимым материалом для государственного управления народным хозяйством.
Условия новой экономической реформы требуют совершенствования статистической работы, особенно в части отражения эффективности укрепления общественного строя, широкого внедрения машинной техники и т.д.
Как было сказано, статистика, охватывающая своими показателями все стороны экономической, политической, культурной и правовой жизни, расчленяется на целый ряд отраслей.
Одной из таких отраслей является правовая статистика, которая отражает своими показателями, как охраняется общественный и государственный строй, государственная и частная собственность, как защищаются гарантированные Конституцией права и интересы отдельных граждан, учреждений, предприятий, общественных организаций. Основной целью правовой статистики является учет нарушений законности, рассматриваемых органами МВД, прокуратуры, суда и общественными организациями, а также мероприятий по борьбе с этими нарушениями.
Роль правовой статистики в улучшении деятельности указанных органов весьма серьезна, так как именно она наряду с другими источниками дает возможность установить, как работают судебные, следственные и исправительно-трудовые учреждения, как осуществляется ими правосудие. Зная количество совершенных преступлений, учитывая самих преступников, располагая сведениями о нарушении семейных, трудовых, жилищных и других законов, о распространенности преступлений на различных участках народного хозяйства, о размерах ущерба от этих преступлений, учитывая результаты борьбы с уголовными и другими нарушениями, органы юстиции (в широком смысле) получают возможность наиболее эффективно осуществлять возложенные на них задачи в деле укрепления законности.
9
Какие же явления изучает правовая статистика, т.е. что следует считать ее предметом? Правовая статистика учитывает работу всех государственных органов, осуществляющих уголовно-правовую и гражданско-правовую охрану общественного и государственного строя, государственной и частной собственности, личности, прав и интересов граждан, предприятий и организаций. Следовательно, правовая статистика учитывает работу прокуратуры, милиции, судов, исправительно-трудовых учреждений, арбитража, нотариата и др. Отсюда ее предметом и будет количественная сторона тех явлений, которые входят в сферу деятельности указанных органов. Это - количественная сторона преступности и мероприятий по борьбе с ней, преступников и наказаний, а также гражданско-правовых споров, ставших объектом разбирательства в суде, нотариате или арбитраже.
Следовательно, правовая статистика имеет своей целью учесть все нарушения законности, рассматриваемые соответствующими государственными органами, и мероприятия по предупреждению этих нарушений. В соответствии с этим правовая статистика, применяя свои специфические методы, должна количественно отразить те мероприятия, которые осуществляют государственные органы для защиты от всяких посягательств на общественный и государственный строй, на систему хозяйства и государственную и частную собственность, на политические, трудовые, жилищные и другие личные имущественные права и интересы граждан РФ, на права и охраняемые законом интересы государственных учреждений, предприятий, общественных организаций.
Изучая правовую статистику, мы должны исходить, во-первых, из различного характера правовых нарушений, которые она призвана учитывать, а во-вторых, из различного характера учреждений, которые практически занимаются правовой статистикой. Основываясь на этом делении, правовая статистика подразделяется на две самостоятельные отрасли:
1) уголовно-правовую статистику, имеющую своим непосредственным объектом количественную сторону преступности и мероприятий по ее предупреждению;
2) гражданско-правовую статистику, непосредственным объектом которой является количественная сторона гражданско-правовых отношений, рассматриваемых судом, арбитражем и нотариатом.
ю
Таким образом, правовая статистика отражает своими показателями все стадии уголовного и гражданского пропессов.
Каждая отрасль правовой статистики - уголовно-правовая и гражданско-правовая - подразделяется на несколько разделов в соответствии с основными стадиями уголовного и гражданского процессов.
По этому признаку уголовно-правовая статистика, отражающая своими показателями процесс борьбы с преступностью, подразделяется на следующие составные разделы:
а) статистика предварительного расследования, учитывающая деятельность государственных органов, которые расследуют преступления и устанавливают лиц, виновных в их совершении;
б) статистика уголовного судопроизводства, отражающая работу судов первой, второй (кассационной) и надзорной инстанций по разбирательству уголовных дел;
в) статистика исполнения приговоров, отражающая работу исправительно-трудовых учреждений.
Самостоятельным подвидом уголовной статистики является статистика прокурорского надзора. Все это играет серьезную роль в улучшении работы этих органов, а также в деле изучения и предупреждения преступности.
Следует сказать несколько слов об актуальном и перспективном направлении в изучении и предупреждении преступности - виктимологии, что в буквальном переводе означает "учение о жертве" (от лат. victima -
жертва). Виктимология призвана исследовать в самых различных аспектах жертву преступления или, точнее, людей, потерпевших от преступных посягательств. Подобные исследования требуют организации особого раздела уголовной статистики. Как видно из рассмотрения многих уголовных дел, из обобщения судебной практики, поведение человека бывает порой не только преступным, но и виктимным, т.е. рискованным, распущенным, провокационным, легкомысленным, а, следовательно, опасным для самого себя. Конечная цель виктимологии - выработка определенных мер, позволяющих избегать ситуаций, в которых поводом к совершению преступлений может быть личность или поведение самой жертвы. Здесь не обойтись без статистики. Основная задача статистики виктимности - дать количественную характеристику личности потерпевших и их поведения по следующим примерным направлениям:
1) совершенное преступление, личность обвиняемого и причиненный им вред;
2) демографические, социально-психологические, правовые и другие признаки, характеризующие личность потерпевшего;
3) роль потерпевшего в конфликтной ситуации (его взаимодействие с обвиняемым, его состояние и поведение в момент совершения преступления, вопрос о "вине" потерпевшего - моральной, уголовно- правовой и пр.).
Следовательно, уголовно-правовая статистика должна включать не только показатели, характеризующие преступность, меры борьбы с ней и личность преступника, но также виктимность и ее профилактику. Здесь будет количественно отражена личность потерпевшего, его поведение, а также меры, направленные на предупреждение виктимной обстановки, т.е. такой, когда поводом к совершению преступлений может быть личность или поведение самой жертвы.
Второй отраслью правовой статистики является гражданско-правовая статистика. Ее основная цель - учет гражданско-правовых отношений, находящихся на разрешении суда и арбитража.
К области гражданско-правовой статистики относится учет таких гражданских правоотношений, которые, не будучи связаны с правонарушением и не являясь предметом гражданского спора, удостоверяются в порядке административном, нотариальном или в порядке бесспорного судебного производства (например, удостоверение нотариусом завещаний, выдача свидетельства о праве наследования, удостоверение судом стажа работы и пр.).
Гражданско-правовая статистика подразделяется на два раздела: 1 )статистика гражданского судопроизводства, освещающая работу
судов по рассмотрению гражданских дел; 2)статистика исполнения судебных решений, освещающая деятель
ность судебных исполнителей по приведению в исполнение решений судов по гражданским делам.
Руководство правовой статистикой осуществляется МВД, ФСБ, Министерством юстиции, Прокуратурой РФ, в составе которых имеются специальные отделы статистики. Эти отделы разрабатывают показатели статистической отчетности с учетом основных задач и соответствующих из-
12
менений в законодательстве, издают инструкции по статистической отчетности.
Таким образом, организация статистического аппарата в судах, прокуратуре и органах МВД обеспечивает сбор, обработку и анализ статистического материала, необходимого для всесторонней характеристики их деятельности, для выявления и устранения имеющихся недостатков, а, следовательно, для более эффективного выполнения тех задач, которые стоят перед этими органами в настоящее время.
Руководящие органы пользуются наряду с материалами обследований, ревизий и изучением отдельных категорий уголовных и гражданских дел также материалами правовой статистики при обобщении судебной и прокурорской практики. Статистика дает, например, возможность определить основные направления в развитии судебной репрессии и выяснить, насколько типичны недостатки в применении мер уголовного наказания.
Однако ограничиваться только статистическими данными было бы совершенно неправильно. Как бы ни были важны показатели правовой статистики, они должны всегда подкрепляться углубленным изучением. Для окончательных выводов необходим всесторонний качественный анализ исследуемых объектов и процессов, всестороннее знание практики. Только при этом непременном условии показатели правовой статистики выявят качественное своеобразие исследуемых явлений.
Исключительно велика роль уголовной статистики в изучении и предупреждении преступности. Уголовная статистика дает исчерпывающую, научно обоснованную информацию о состоянии преступности, о ее структуре и динамике, о причинах и условиях, способствующих совершению преступлений, о личности преступника, о плюсах и минусах в деятельности милиции, прокуратуры, суда и исправительно-трудовых учреждений. Все это необходимо для повышения эффективности деятельности, направленной на борьбу с преступностью.
Одна из форм использования правовой статистики относится к сфере законодательства. Иллюстрируя своими показателями практику применения тех или иных законов, характеризуя движение отдельных видов нарушений, статистика подтверждает целесообразность или, наоборот, нецелесообразность действия в данный период конкретного закона, его эффективность. Отсюда может возникнуть необходимость установления иного
13
порядка регулирования некоторых гражданско-правовых отношений (например, семейных), новых форм борьбы с преступностью.
Последняя форма использования правовой статистики относится к области теоретического исследования. Правовая статистика имеет весьма широкое применение в научно-исследовательской работе по изучению преступности и других вопросов криминологии, уголовного и гражданского права и процесса. Представляя необходимый материал, характеризующий объем и динамику уголовно-правовых и гражданско-правовых явлений, правовая статистика подкрепляет и иллюстрирует соответствующие положения и выводы этих наук. Она обогащает указанные науки знанием конкретных фактов и явлений, она показывает, где, как и при каких условиях совершаются уголовные и гражданские правонарушения, какова их взаимосвязь с другими социальными явлениями. Правовая статистика, таким образом, - это один из важнейших источников, снабжающих юридическую науку фактическим материалом для теоретического обобщения.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. ('формулируйте определение предмета, изучаемого правовой статистикой? 2. Что является теоретической основой статистики? 3. Какие этапы содержит статистическое исследование? 4. Что такое статистические показатели? 5. Каковы составные части правовой статистики? 6. Каковы основные задачи правовой статистики в современном обществе?
Тема 2. Статистическое наблюдение
Основные теоретические вопросы
Статистическое наблюдение, его содержание, назначение и задачи. Статистическое наблюдение - источник первичной информации. Программа статистического наблюдения.
14
Две формы статистического наблюдения - отчетность и специально организованное наблюдение.
Способы статистического наблюдения - непосредственное наблюдение, опрос, документальный.
Наблюдение по степени охвата - сплошное и выборочное. Наблюдение по времени фиксирования - моментное и периодическое. Объект наблюдения, единица совокупности и единица наблюдения в
правовой статистике.
Методические указания
Статистическое наблюдение представляет собой научно организованный сбор сведений и цифровых данных о единицах изучаемых явлений и процессов с обязательной регистрацией этих сведений.
Статистическое наблюдение должно быть организовано так, чтобы на основе полученного первичного материала путем соответствующей его обработки можно было исчислить нужные обобщающие показатели для выявления той или иной закономерности и сделать правильные выводы об изучаемых явлениях и процессах.
Статистическое наблюдение проводится по строго определенному плану. Программа наблюдения определяется задачами проводимого исследования. Поэтому, прежде всего, необходимо сформулировать цель и задачи всей работы, а затем уже решать вопросы программы наблюдения:
• определить объект; • установить единицы наблюдения и единицы совокупности; • сформулировать вопросы программы наблюдения; • определить перечень статистических показателей. Задача статистического наблюдения - зарегистрировать факты изу
чаемой совокупности (например, преступления) и характеризующие их признаки (квалификация преступления, место и время его совершения, ущерб и пр.), что требует, прежде всего, четкого определения цели данного статистического исследования.
Вполне понятно, что любая область может изучаться с разных точек зрения, может быть исследована для различных целей. Например, изучая преступность, можно поставить перед собой цель исследовать личность
15
преступника, давая ей подробную характеристику, или изучать причины и условия, способствующие совершению преступлений, или установить способы совершения некоторых преступлении, скажем хищений, и понесенный от них ущерб и пр. Очевидно, что в зависимости от поставленной цели в одном случае придется подвергнуть регистрации одни признаки, в другом - другие.
Исходя из целей статистического исследования, особенностей его объекта (например, преступности), а также специфики входящих в этот объект единиц совокупности (отдельных преступлений), устанавливается программа наблюдения, т.е. те признаки, которые будут характеризовать выбранную единицу совокупности. Регистрации подлежат только варьирующие признаки, т.е. такие, которыми одна единица совокупности качественно или количественно отличается от другой. Например, при обследовании числа осужденных каждый преступник может быть охарактеризован такими количественными признаками, как возраст, сроки лишения свободы, число прошлых судимостей, а также качественными признаками, выражающимися словами, а не числами - социальным и семейным положением, видом преступления и наказания, полом, профессией и т.п. Следовательно, программа наблюдения - это перечень вопросов, на которые должны быть получены ответы от каждой единицы совокупности.
Очень важно четко редактировать вопросы программы наблюдения. Они должны быть поставлены так, чтобы они всеми понимались одинаково.
После установления цели наблюдения возникает вопрос о его формах и способах. Основными формами статистического наблюдения в нашей стране являются отчетность и специально организованные статистические обследования.
Отчетность представляет собой такую форму статистического наблюдения, при которой каждое нижестоящее звено (завод, народный суд и т.д.) по единым утвержденным формам и в твердо установленные сроки обязано представлять вышестоящему органу соответствующие документально обоснованные сведения. Отчетность, охватывающая целый ряд статистических показателей, имеет огромное значение для постоянного контроля за выполнением плана, для повседневного оперативного руководства, для различных исследований (например, эффективности деятельности суда и прокуратуры).
16
Второй формой статистического наблюдения являются всякого рода переписи и обследования (например, перепись населения, обследования правонарушений несовершеннолетних и т.п.). Полученные в результате таких переписей материалы используются для глубокого изучения наблюдаемых процессов (например, изменений в составе населения), а также для уточнения показателей отчетности.
Кроме организационных форм, надо различать два вида статистического наблюдения: непрерывное (текущее) и прерывное (единовременное). В первом случае наблюдаемые явления регистрируются непрерывно по мере их возникновения, а во втором учитывают состояние явлений лишь на определенную дату. Например, каждое преступление немедленно учитывается в установленном порядке, как только оно станет известно органам МВД, прокуратуры и суда.
Но можно привести ряд примеров, когда наблюдение отражает состояние каких-либо явлений на определенную дату, причем иногда такое наблюдение периодически повторяется. Возьмем, например, перепись населения — численность населения по состоянию на определенное число, так называемый момент, т.е. момент времени, к которому относятся наблюдаемые факты (при переписи населения таким моментом является 12 часов ночи). Само получение статистических материалов проводится обычно тремя способами: а) непосредственное наблюдение, б) опрос и в) документальный способ.
а) Непосредственное наблюдение, как говорит само название, состоит в регистрации признаков интересующих нас явлений на основе непосредственного обследования — взвешивания, измерения, подсчета и т.д. Например, на каждом промышленном предприятии выработка продукции учитывается на основе непосредственного наблюдения: изготовленные изделия непосредственно измеряются, подсчитываются и т.п.
б) Опрос имеет три разновидности: устный (экспедиционный), когда регистраторы опрашивают соответствующих лиц и с их слов производят записи; корреспондентский, при котором наблюдения осуществляются письменно; саморегистрация, заключающаяся в том, что регистраторы раздают переписные листы обследуемым лицам, которые сами отвечают на все поставленные вопросы и через определенный срок возвращают листы регистраторам.
17
в) Документальный способ состоит в том, что записи статистических материалов делаются на основе документов, карточек, формуляров, листков и пр. (например, карточка на уголовное дело, на подсудимую и т.п.). Этот способ, применяемый, в частности, при составлении отчетности, гарантирует, как правило, наиболее точные результаты.
По охвату единиц исследуемой совокупности (скажем, населения), т.е. по полноте обследования тех или иных явлений (в данном примере жителей), статистическое наблюдение может быть сплошным и несплошным. Последнее, в свою очередь, подразделяется на:
1) выборочное; 2) анкетное; 3) обследование основного массива; 4) монографическое. Сплошное наблюдение заключается в исчерпывающей, стопроцент
ной регистрации всех без исключения единиц, входящих в состав изучаемой совокупности. Примером такого наблюдения может служить перепись населения. Примером сплошного наблюдения является также регистрация преступлений, ставших известными органам дознания и прокуратуры. Эти преступления должны быть зарегистрированы полностью, на все 100% без всяких пропусков.
По ряду причин (в целях экономии времени, средств, в связи с невозможностью проведения сплошного наблюдения и пр.) часто проводится так называемое выборочное обследование, сущность которого заключается в том, что регистрации подвергается только часть (выборка) интересующей нас по какому-либо признаку совокупности (например, 10% осужденных) и полученные результаты служат характеристикой всей совокупности.
Разновидностью несплошного наблюдения является таюке анкетное обследование, при котором обследуемым раздаются анкеты, возвращаемые обычно регистраторам только частично (например, обследование кинозрителей для получения от них отзывов о качестве кинокартины).
К несплошному наблюдению относится довольно редко встречающееся так называемое обследование основного массива. Оно заключается в том, что регистрации подвергаются единицы, имеющие доминирующий удельный все во всей совокупности. Например, для определения суммы выпуска продукции по какому-либо ведомству можно подвергнуть регист-
18
рации только крупные предприятия, занимающие преобладающее значение в изготовлении изделии.
К несплошному наблюдению относится и так называемое монографическое обследование - подробное описание интересующего нас единичного явления, например: колонии для несовершеннолетних и др. Монографии имеют большое значение для детального исследования определенных объектов в целях, например, передачи передового опыта.
После определения целей и задач наблюдения, его основных форм и способов возникает вопрос об объекте наблюдения, т.е. о том, какая масса изучаемых явлений должна быть подвергнута обследованию, каковы границы той совокупности, которую необходимо наблюдать (напомним, что статистика всегда интересуется именно совокупностью явлений).
Без четкого определения объекта наблюдения всегда есть опасность пропустить отдельные факты или, наоборот, зарегистрировать факты, не относящиеся к изучаемой совокупности (скажем, административные нарушения при исследовании преступности).
Вполне понятно, что и то и другое может привести к совершенно неверному отражению наблюдаемой совокупности, а в дальнейшем, на последующих стадиях статистического исследования, к неверным выводам.
Исходя из этого, можно наметить три конкретных объекта регистрации уголовно-правовой статистики, которые она характеризует с количественной стороны:
1) преступления, т.е. сами факты общественно опасных деяний; 2) преступники, т.е. лица, совершившие такие деяния; 3) наказания, т.е. меры государственного принуждения, назначаемые
судом за совершение преступлений. Гражданско-правовая статистика ставит перед собой задачу учесть со
вокупность личных, семейных и имущественных отношений граждан, а также имущественных отношений учреждений, предприятий и организаций. Следует иметь в виду, что учетом гражданско-правовых отношений занимаются и иные отрасли статистики. Так, например, семейно-правовые отношения могут учитываться не только в гражданско-правовой статистике, но в первую очередь и в статистике населения (браки, разводы, рождаемость, смертность). Имущественные отношения могут являться пред-
19
мехом не только гражданско-правовой статистики, но и, прежде всего, статистики экономической (торговой, промышленной, сельскохозяйственной).
Конкретными объектами гражданско-правовой статистики, которые она характеризует с количественной стороны, являются:
1) спор о гражданском праве (гражданское дело); 2) стороны в гражданском процессе (истец и ответчик); 3) судебное решение. Гражданско-правовая статистика отражает основные элементы граж
данского правоотношения: право, обязанность, субъект обязанности, объект. Она учитывает правоотношения - трудовые, договорные, жилищные и др., соответствующие наиболее важным институтам гражданского права.
Кроме споров о гражданском праве в объект правовой статистики входят и те гражданские правоотношения, которые, не являясь предметом конкретного спора и не выступая в форме правонарушения, удостоверены в порядке нотариального или судебного производства (например, купля-продажа строения, удостоверение завещаний и пр.).
Следует отличать единицу наблюдения от единицы совокупности или единицы учета.
В судебной статистике единицей наблюдения может быть муниципальный суд, районная прокуратура, отделение милиции, от которых поступают сведения, а единицей совокупности - преступник, преступление, гражданское дело, истец, ответчик.
КОНТРОЛЬНЫЕ ВОПРОСЫ
/. Что собой представляет статистическое наблюдение? 2. Что собой представляет программа статистического наблюдения? 3. Какие существуют формы статистического наблюдения по источни
кам информации? 4. Какое может быть наблюдение по степени охвата совокупности? 5. Чем предопределяется выборочное наблюдение? 6. Какое может быть наблюдение по времени осуществления? 7. Что такое объект наблюдения, единица совокупности и единица наблюдения?
20
Тема 3. Сводка и группировка статистических данных
Основные теоретические вопросы
Сводка - этап статистического исследования. Содержание статистической сводки и ее задачи. Понятие статистической группировки. Задачи группировки и ее значение в статистическом исследовании. Группировочньте признаки и их выбор. Группировки по атрибутивным и количественным признакам. Группировки по форме - простые и комбинационные. Виды группировок - аналитические, топологические и структурные. Определение числа групп, величины интервалов группировок.
Методические указания
Сводка статистической информации не ограничивается получением общих итогов по изучаемой совокупности. Исходная информация на этой стадии статистической работы систематизируется, образуются отдельные статистические совокупности, т.е. осуществляется статистическая группировка.
При статистической группировке производится расчленение множества единиц изучаемой совокупности на различающиеся между собой, но внутренне однородные части, и одновременно с этим происходит их объединение в типичные группы по существенному для них признаку. Именно при таком подходе к изучению социально-экономических явлений группировки являются важнейшим методом статистического исследования, позволяющим уловить переход количественных изменений в качественные, выявить закономерности их развития.
Группировка - это процесс образования однородных групп на основе расчленения статистической совокупности на части или объединение изу-
21
чаемых единиц в частные совокупности по существенным для них признакам.
Иначе говоря, в зависимости от содержания и форм изучаемых признаков статистические группировки образуются или посредством разделения совокупности на отдельные части, характеризующиеся внутренней однородностью и различающиеся между собой рядом признаков, или благодаря объединению в группы единиц совокупности по типичным признакам.
Признаки, по которым производится распределение единиц наблюдаемой совокупности на группы, называются группировочными признаками.
Одно из требований, предъявляемых в процессе осуществления группировки, состоит в том, что образуемые группы должны быть реальными. Но это не означает, что они существуют в действительности в готовом виде. Чаще всего для их получения необходимо глубокое и всестороннее осмысление цели исследования, оценка исходной информации и учет других обстоятельств, связанных с изучаемым объектом. Только, исходя из всей этой теоретико-методологической основы, делается заключение о возможных группах, способах образования, и выделения их из всей совокупности. Этот вопрос является наиболее сложным и ответственным во всей методологии статистических группировок.
Значение статистических группировок состоит в том, что они раскрывают объективное положение вещей и выявляют самые существенные черты и свойства изучаемых явлений, а также позволяют получать информацию о размерности отдельных групп, соотношении их в обшей совокупности и о связях между изучаемыми показателями, характеризующими выделенные части, и признаками, положенными в основу группировки.
Содержание и виды группировок многообразны. Группировки можно осуществлять как по количественному, так и по
качественному (атрибутивному) признаку. В количественной группировке группировочный признак выражается вариантами чисел (табл. 3.1).
22
Таблица 3.1 Группировка коммерческих банков России
по сумме активов баланса Группы банков
по сумме активов баланса, тыс. руб.
Количество банков,
ед.
Численность занятых в среднем на один
банк, чел.
До 20000 19 184 20000 - 30000 8 313 30000 - 40000 7 374 40000 - 50000 9 468 50000 и более 7 515
Итого 50 323
Так в табл. 3.1 количественным является группировочный признак, характеризующий сумму активов баланса.
В атрибутивной группировке группировочный признак количественного выражения не имеет, так как он характеризует качество изучаемого явления (табл. 3.2).
Таблица 3.2 Группировка инвестиций в основной капитал России
по предприятиям и организациям в 1 квартале 2007 г. Группы инвестиций в основной капитал Млн. руб
Инвестиции в основной капитал Всего 66854 в том числе по объектам: Производственного назначения 41114 Непроизводственного назначения 25740
В табл. 3.2 атрибутивным является признак, характеризующий инвестиции в основной капитал по различным объектам.
Группировки бывают простые и комбинационные. Простые группировки образуются по какому-либо одному признаку (табл. 3.1), а комбинационные по двум и более признакам (табл.3.3).
23
Таблица 3.3 Группировка семей России по месту проживания и числу детей
(по материалам переписи населения)
Группы семей по месту проживания
В том числе подгруппы по числу детей
Число семей, тыс.
Городское население С 1 ребенком 9605 С 2 детьми 6936 С 3 детьми 971 С 4 детьми 153
С 5 детьми и более 76 Итого по группе 17741 Сельское население С 1 ребенком 2328
С 2 детьми 2306 С 3 детьми 757 С 4 детьми 213
С 5 детьми и более 141 Итого по группе 5745 Итого по подгруппам С 1 ребенком 11933
С 2 детьми 9242 С 3 детьми 1728 С 4 детьми 366
С 5 детьми и более 217 Всего 23486
В представленной комбинационной группировке группировочными признаками являются место проживания семей (в городах или сельской местности) и число детей в семье.
Применение комбинационных группировок обусловлено многообразием экономических явлений, необходимостью их всестороннего изучения.
С помощью статистических группировок решают следующие задачи: 1. Анализируют структуру исследуемой совокупности; 2. Выявляют наличие взаимосвязи между экономическими явлениями. Для решения первой задачи строят группировки типологические и
структурные; для решения второй задачи строят группировки аналитиче-
24
ские и корреляционные. Пример корреляционной группировки будет рассмотрен в теме "Взаимосвязи экономических явлений".
Примером типологической группировки может служить группировка промышленных предприятий по формам собственности (табл. 3.4).
Таблица 3.4 Группировка промышленных предприятий одного из регионов
России по формам собственности в 2007г. Группы предприятий по формам
собственности Число предприятий
Федеральная собственность 26326 Муниципальная собственность 89 Частная собственность 1366 Смешанная собственность 331 Итого 28112
Примером структурной группировки может служить группировка, приведенная в табл. 3.5.
Если типологическая группировка даст представление о изучаемой совокупности по выделяемым типам (формам собственности), то структурная группировка раскрывает долю составляющих частей целого в общем итоге. Так, по структурной группировке (см. табл. 3.5) можно сказать, что наибольшая доля численности всего населения России проживает в городской местности. Причем эта тенденция усиливается.
Таблица 3.5 Группировка населения России по месту жительства
за 1959-2007гг.
Группы населения по месту жительства
Численность населения Группы населе
ния по месту жительства
1959 г. 1979 г. 2007 г. Группы населения по месту жительства
всего млн. чел.
В % к
итогу
всего, млн. чел.
в % к итогу
Всего, млн. чел.
в % к итогу
Городское 61,6 52 95,4 69 108,5 73 Сельское 55,9 48 42,2 31 39,9 27 Всего 117,5 100 137,6 100 148,4 100
25
В экономико-статистическом анализе количественных совокупностей группировки строятся как с равными, так и с неравными интервалами. При построении группировки с равными интервалами величину интервала групп определяют по формуле:
"^"max "^"mm
где x m a x - максимальное значение признака в совокупности; х т ш - минимальное значение признака в совокупности;
п - число групп (устанавливается исследователем).
При выборе числа групп необходимо учитывать следующее: 1) в каждую группу должно попасть достаточно большое число еди
ниц; 2) число единиц в группах не должно резко отличаться друг от друга,
то есть должно быть примерно одного порядка: 3) число групп должно быть не более 4-6 (это зависит, как правило, от
числа наблюдений). Группировки с неравными интервалами целесообразно применять в
тех случаях, когда исходные статистические данные разнятся на весьма значительную величину, то есть когда слишком велик размах вариации в исходной совокупности.
Как было ранее сказано, для выявления взаимосвязей между экономическими явлениями применяется аналитическая группировка.
По отчетным месячным данным за 2006-2007гг. построим аналитическую группировку для установления зависимости числа зарегистрированных случаев разбоя от производства винно-водочных изделий и пива (табл. 3.6).
Для построения группировки необходимо выделить группировочный признак. Таким группировочньтм признаком является производство винно-водочных изделий и пива. Установим число групп по данному признаку п=4. Размеры интервалов в группах принимаем равными и их величину определяем по формуле h. Тогда:
h = * , „ „ - * „ „ = 1860-46! = ,399 = М 9 ? 5 л ; м р у . п п 4
Образуем группы предприятий по производству винно-водочных изделий и пива. Нижней границей первого интервала будет минимальная ве-
26
личина группировочного признака 461 млн. руб. Верхней границей первого интервала будет 461 + 349,75 = 810,75 млн. руб.
Таблица 3.6 Исходные данные для построения аналитической
группировки по данным Республики Беларусь Произведено Число заре Произведено Число заре
Ме винно- гистриро Ме винно- гистрирося водочных из ванных ся водочных из ванных цы делий и пива, случаев цы делий и пива, случаев
млн. руб. разбоя млн. руб. разбоя 2006 г. 2007 г.
I 461 74 I 947 91 II 492 118 II 918 106 III 527 156 III 993 144 IV 488 152 IV 1026 154 V 579 123 V 1256 125 VI 632 153 VI 1348 155 VII 723 118 VII 1289 124 VII 878 118 VII 1552 126 IX 689 120 IX 1593 129 X 759 142 X 1638 154 XI 840 119 XI 1538 124 XII 838 181 XII 1860 190
При группировке по непрерывно - варьирующим количественным признакам границы интервалов обозначают так, что верхняя граница предыдущего интервала служит нижней границей последующего интервала.
Таким образом, нижней границей второго интервала будет величина 810,75 млн. руб., а верхней границей данного интервала (810,75 + 349,75) = 1 160,5 млн. руб. Аналогично определяются границы последующих интервалов (табл. 3.7).
Так как поставлена задача установить зависимость зарегистрированных случаев разбоя от производства винно-водочных изделий и пива, определяем по каждой выделенной группе общую величину зарегистрированных случаев разбоя в группе и в среднем за месяц. Тогда по первой
27
группе с производством винно-водочных изделий и пива от 461 млн. руб. до 810 млн. руб. число зарегистрированных случаев разбоя составит 74 + 118 + 156 + 152 + 123 + 153 + 118 + 120 + 142 =1156 случаев, а в расчете в среднем за месяц 1 156/9 = 128 случаев разбоя. Аналогичные расчеты производим по другим группам. Результаты расчетов сведем в табл. 3.7.
На основе полученной группировки можно сделать вывод, что с увеличением производства винно-водочных изделий и пива возрастает число зарегистрированных случаев разбоя.
Таблица 3.7 Группировка объемов производства винно-водочных изделий
и пива в Республике Беларусь за 2006-2007гг.
Объемы производства винно-водочных изделий и пива,
млн.руб.
Число меЧисло зарегистрированных
случаев разбоя Объемы производства винно-
водочных изделий и пива, млн.руб.
сяцев общее
В среднем за месяц
461,00 - 810,75 9 1156 128 810,75 - 1160,50 7 913 130
1160,50 - 510,25 3 404 135 1510,25 - 1860,00 5 723 145
Итого 24 3196 133
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Каковы назначение и задачи статистической сводки? 2. Что называется статистической группировкой? 3. Какова цель статистической группировки? 4. Какие различают виды статистических группировок? 5. Чем отличается простая группировка от комбинационной? в.1 Тем различаются группировки по количественному и атрибутивному признакам? Приведите пример. 7. Чем различаются структурная и аналитическая группировки? 8. В каких случаях применяются группировки с равными и неравными интервалами? 9. Как определяется величина интервала группировки в случае построения группировки с равными интервачами?
28
Тема 4. Статистические ряды. Статистические таблицы
Основные теоретические вопросы
Понятие статистических рядов. Виды статистических рядов. Атрибутивные вариационные ряды распределения. Дискретные и непрерывные вариационные ряды распределения. Понятие о статистической таблице. Макет таблицы. Подлежащее и сказуемое статистической таблицы. Виды таблиц по характеру подлежащего: - простые; - групповые; - комбинационные. Основные правила построения таблиц.
Методические указания
В результате обработки и систематизации первичных статистических материалов получают ряды цифровых статистических показателей, которые характеризуют отдельные стороны изучаемых явлений. Эти ряды называют статистическими. На рис. 4.1 представлены виды статистических рядов.
Как видно из рис 4.1, статистические ряды делят на два вида: - ряды динамики; - ряды распределения. Ряды динамики — ряды, которые характеризуют изменение изучае
мых явлений во времени (по месяцам, кварталам, годам и т.п.) (табл. 4.1).
29
Статистические ряды
Ряды распределения
Вариационные
Дискретные Непрерывные (интервальные)
Рис. 4.1. Виды статистических рядов
Зарегистрировано грабежей в России Таблица 4.1
Годы 2002 г. 2003 г. 2004 г. 2005 г. 2006 г. 2007 г. Всего 784410 748546 740597 721356 712051 680650
Ряды распределения - ряды, которые характеризуют распределение единиц совокупности по какому-либо признаку, например распределение преступников по возрасту, социальной принадлежности и т.п.
Ряды распределения, в свою очередь, делятся на два вида: атрибутивные и вариационные.
Атрибутивный ряд распределения образуется по качественному признаку, например распределение осужденных по социальной принадлежности (табл. 4.2).
Вариационный ряд образуется по количественному признаку. Среди вариационных рядов распределения выделяют дискретные и интервальные ряды.
В дискретном ряде распределения отдельные варианты имеют определенные конкретные значения, например, распределение женщин по числу рожденных ими детей (табл. 4.3).
30
Таблица 4.2 Характеристика осужденных, совершивших преступление
в возрасте 14-17 лет в 2007 г. в России
Всего
Из них
Всего Учащиеся
Работающие Трудоспособные, неработающие и
не учащиеся
Про чие
Число осуж
денных 120574 58068 17435 44406 665
Таблица 4.3 Распределение числа женщин по числу рожденных
ими детей в России в 2007 г.
Всего женщин в возрасте 18 лет
и старше
Из них Всего женщин в возрасте 18 лет
и старше Всего женщин, родивших детей
В том числе Всего женщин в возрасте 18 лет
и старше Всего женщин, родивших детей
1 ребенка
Двух детей
Трех и более
1000 834 297 354 183
В интервальном вариационном ряде варианты колеблются в определенных пределах, например, распределение населения по размеру среднедушевого дохода (табл. 4.4). В данном случае рассматривается интервальный ряд распределения с равными интервалами.
Таблица 4.4 Распределение населения по размеру среднедушевого
денежного дохода в России в 2007 г. Группы населения со среднедушевым доходом,
руб. Население, млн. чел.
до 400 30,6 400 - 800 31,3 800- 1200 25,3
1200- 1600 18,2 1600-2000 12,6 2000 - 2400 14,6 Свыше 2400 14,9
31
В табл. 4.5 приводится интервальный вариационный ряд с неравными интервалами.
Дискретные вариационные ряды изображаются в виде так называемого полигона распределения; интервальные вариационные ряды - в виде гистограммы (см. тему 9).
Статистические ряды как результат статистической сводки и группировки всегда излагаются в виде статистических таблиц.
Статистические таблицы представляют собой форму систематизированного и наглядного изображения числовых результатов сводки и обработки данных. Таблица, незаполненная цифрами, но имеющая названия строк и граф, называется макетом таблицы.
Таблица 4.5 Состав лиц, совершивших преступления в России в 2007 г.
Выявлено лиц, совершивших Размер интервала
преступления в возрасте, лет тыс. чел.
14-15 1 112,5 15-17 2 450,8 17-24 7 890,4 24 -29 5 680,0
29 и свыше 5 1430,3
При построении статистических таблиц следует разграничивать статистическое подлежащее и статистическое сказуемое.
Статистическим подлежащим таблицы является сам объект (перечень его единиц или групп), который характеризуется числовыми показателями. Статистическое подлежащее располагают, как правило, в строках таблицы.
Статистическим сказуемым таблицы являются числовые показатели, которые характеризуют изучаемый объект. Статистическое сказуемое располагают в графах таблицы. В зависимости от строения подлежащего различают три вида статистических таблиц: простые, групповые, комбинационные.
Простые таблицы в подлежащем содержат перечень рассматриваемых объектов. Поэтому простые таблицы часто называют перечневыми (табл. 4.6).
32
Таблица 4.6 Основные показатели преступности в России, тыс.
2003 г. 2004 г. 2005 г. 2006 г. 2007 г. Рассмотрено заявлений, сообщений о преступле
ниях органами внутренних дел
3394 3728 3385 3311 6406
Зарегистрировано преступлений
2633 2756 2625 2397 4864
Выявлено лиц, совершивших преступления
1442 1596 1618 1372 3564
Осуждено лиц по приговорам, вступившим в за
конную силу 925 1036 1111 1013 2105
Погибло людей в результате различных преступ
лений 75 76 65 63 90,1
Групповые таблицы в подлежащем содержат группировку единиц изучаемого объекта по какому - либо одному признаку, например, по возрасту (табл. 4.7).
Комбинационные таблицы в подлежащем содержат группировку единиц, образованную по двум и более признакам, например (табл. 4.8).
Таблгща 4.7 Состав лиц, совершивших преступления в России, тыс. чел.
2003 г. 2004 г. 2005 г. 2006 г. 2007 г. Выявлено лиц, совершивших преступления - всего
956,3 1149,0 1262,7 1441,6 3564,0
В том числе в возрасте 14 - 15
52,3 59,3 66,9 65,2 112,5
15-17 107,1 128,9 136,9 135,8 450,8 17-24 202,2 251,8 301,0 336,2 890,4 24 -29 164,2 186,3 189,1 209,9 680,0
29 и старше 430,6 522,7 568,8 694,5 1430,3
33
Таблица 4.8 Структура инвестиций в основной капитал по источникам
финансирования России, % к итогу 2006 г.
I квартал 2007 г. I квар
тал Инвестиции в основной капитал - всего 100 100 Внебюджетные средства 82,3 85,1 Бюджетные средства 17,7 14,9 из них федеральный бюджет
8,7 7,0
Бюджеты субъектов РФ и местные бюджеты 9,0 7,9
Во всех приведенных примерах рассматривались различные формы выражения подлежащего, в зависимости от которых таблица может быть простой, групповой или комбинационной.
Разработка сказуемого таблицы может быть простой и сложной. Простая разработка сказуемого предполагает чередование показателей, сложная - их комбинирование. Примером статистической таблицы с простой разработкой сказуемого может служить табл. 4.9.
Таблгща 4.9 Постоянные дошкольные учреждения в России за 2002 - 2007 гг.
2002 г. 2003 г. 2004 г. 2005 г. 2006 г. 2007 г. Число учреждений, тыс.
87,9 87,6 82,0 78,3 72,8 64,1
В них детей, млн. чел.
9,0 8,4 7,2 6,8 6,1 5,4
Примером статистической таблицы со сложной разработкой сказуемого может служить табл. 4.10.
При построении статистических таблиц следует соблюдать следующие правила:
1. Каждая таблица должна быть нумерована и иметь название, которое в краткой форме отражает ее содержание, место и время явления;
34
2. Графы таблицы должны быть нумерованы арабскими цифрами для удобства ссылки на цифры в тексте;
3. В таблице используются только общепринятые сокращения (тыс. руб., шт., % и т.п.);
4. В таблице по соответствующим показателям должны быть приведены единицы измерения. Если единица измерения общая, то она выносится справа над таблицей в скобках;
5. Цифровые данные можно сокращать. Округленные цифры приводятся с одной степенью точности (до 0,1 или до 0,01 и т.д.);
6. К таблице можно делать примечание, которое располагают под таблицей;
7. В текстовой части работы каждая таблица должна быть прокомментирована, т.е. по ней должны быть сделаны соответствующие выводы.
Таблица 4.10 Число дошкольных учреждений и численность детей
в них в России в 2002 - 2007 гг.
Число учреждений, тыс. Численность детей, млн. чел.
Годы В том числе В том числе всего В горо В сельской всего В горо В сельской
дах местности дах местности 2002 87,9 47,3 40,6 9,0 6,9 2,1 2003 87,6 47,0 40,6 8,4 6,4 2,0 2004 82,0 44,5 37,5 7,2 5,6 1,6 2005 78,3 42,2 36,1 6,8 5,2 1,6 2006 72,8 39,3 33,5 6,1 4,7 1,4 2007 64,1 31,6 32,5 5,4 3,9 1,5
КОНТРОЛЬНЫЕ ВОПРОСЫ
/. Что такое статистические ряды? 2. Каково понятие ряда распределения и ряда динамики? 3. Какие различают виды рядов распределения? 4. В чем отличие атрибутивного ряда распределения от количественного'; 5. Дайте определение статистической таблицы?
35
6. Что такое подлежащее и сказуемое статистической таблицы? 7. Какие существуют виды статистических таблиц? #. Что представляет собой макет статистической таблицы? 9. Каковы основные правила построения статистических таблиц?
Тема 5. Абсолютные и относительные статистические величины
Основные теоретические вопросы
Понятие абсолютных статистических величин. Виды абсолютных величин, их назначение. Единицы измерения абсолютных величин. Абсолютные величины как исходная форма статистического анализа. Понятие относительных статистических величин. Виды относительных величин, способы их расчета и формы выраже
ния. Относительные величины динамики, структуры, интенсивности, ко
ординации, сравнения.
Методические указания
Под абсолютными величинами в статистке понимают показатели, которые характеризуют размеры (уровни, объемы) изучаемых экономических явлений, например количество преступлений, численность осужденных, возраст преступников и т.п.
Абсолютные величины в статистике являются исходной базой статистического анализа. Различают индивидуальные и суммарные (итоговые) абсолютные величины. Индивидуальные величины характеризуют конкретную единицу совокупности. Суммарные величины (итоговые) характеризуют всю совокупность. Так абсолютной индивидуальной величиной можно считать, например, размер пошлины но рассматриваемому делу; суммарной величиной будет сумма налоговых сборов за год.
36
Абсолютные величины измеряются в натуральных, условно-натуральных и стоимостных единицах. Натуральные величины выражаются в кг., шт., чел. и т.п. При использовании условно-натуральных единиц за условную единицу принимается какая-либо величина, а другие представители данного вида показателей соизмеряются с условной единицей через коэффициенты. Например, за условную единицу топлива принята Т тонна кузнецкого каменного угля. Другие же виды топлива (дрова разных древесных пород; торфы разных месторождений, угли различных разрезов -бурый, антрацит; различные виды нефтяных топлив - мазут, бензины; природный газ различных месторождений), обладающие различными теплотворными качествами, пересчитываются через поправочные коэффициенты (дрова твердых пород - 0,21; торфы - 0,29-0,32; угли - 0,65-0,9; нефтяные - 1,2-1,35; газ - 1,5-1,7).
Стоимостные единицы измерения абсолютных величин выражаются в рублях.
В отличие от абсолютных величин, относительные величины являются величинами производными и рассчитываются на основе абсолютных.
В статистическом анализе рассчитывают следующие виды относительных величин:
• величины динамики; • величины структуры; • величины координации; • величины интенсивности; • величины сравнения. Относительные величины динамики - показатели, характеризующие
соотношение одноименных величин во времени. Они рассчитываются по формуле:
Фактические данные отчетного периода К д и п = * 100%
Фактические данные базисного периода Частное от деления числителя и знаменателя дроби называют коэф
фициентом динамики. Коэффициент динамики, выраженный в %, называют темпом роста. Не следует путать отчетный и базисный периоды. Отчетный период - период всегда текущий, базисный период - период, предшествующий отчетному.
37
При изучении относительных величин динамики необходимо прежде всего уяснить их роль в характеристике развития явления во времени. Следует обратить внимание на характер базы сравнения (постоянная, переменная).
Приведем пример расчета относительных величин динамики (табл. 5.1).
Таблица 5.1 Число осужденных с применением меры наказания "конфискация имущества" в России 2003-2007 гг.
Годы
Относительные величины динамики
Годы
Число осужден
ных
с постоянной базой сравнения (2003 г.)
с переменной базой сравнения
Годы
Число осужден
ных в коэффициентах
в % в коэффициен
тах в %
2003 78868 1,00 100,0 - -2004 75691 0,960 96,0 0,960 96,0 2005 71353 0,905 90,5 0,943 94,3 2006 67563 0,857 85,7 0,947 94,7 2007 69853 0,885 88,5 1,033 103,3
Вычислим относительные величины динамики с постоянной базой сравнения, приняв за базу 2003 г.:
75691 К 0 4 = = 0,96* 100 % = 96%;
78868
71353 Ко5 = = 0,905*100 % = 90,5 %;
78868
67563 К 0 6 = = 0,857*100 % = 85,7 %;
78868
38
69853 Ко7 = = 0,885*100 % = 88,5 %;
78868 Вычислим относительные величины динамики с переменной базой
сравнения, приняв соотношение каждого года к предыдущему: 75691
К 0 4 = = 0,96*100 % = 96%; 78868
71353 К 0 5 = = 0,943* 100 % = 94,3 %;
75691
67563 Коб = = 0,947*100 % = 94,7 %;
71353
69853 К 0 7 = = 1,033*100 %= 103,3%;
67563 Можно сделать вывод, что за рассматриваемый период в целом на
блюдается снижение числа осужденных с конфискацией имущества. Это же подтверждают и расчетные значения коэффициентов динамики, которые все меньше 100%.
Относительные величины структуры - показатели, характеризующие долю составных частей целого в общем итоге. Если задать условие, что величины:
X i + Х 2 + Х 3 + ... + Х П =
то приняв итоговую величину за 100%, можно рассчитать по отношению к этой величине в процентном соотношении каждую составляющую. Тогда величины структуры соответственно составят:
39
X
i x2
ft
I
z *
100%
* 1 00%
* 1 00%
X 4 *inno 00%
При этом сумма рассчитанных относительных величин структуры должна составлять 100%.
Приведем пример расчета (табл. 5.2). Таблица 5.2
Характеристика фактов взяточничества в России в 2007 г. Количество
фактов В % к ито
гу Зарегистрировано фактов взяточничества Всего 5608 100,0 в том числе в городах и поселках городского типа в сельской местности
4620 988
82,4 17,6
Для характеристики структуры взяточничества в России в 2007г. (в %) определяют долю фактов взяточничества отдельно в городах и поселках городского типа, а также в сельской местности в общем числе взяточничества в России. Так, доля взяток в городах и поселках городского типа составит:
4620 * 100 = 82,4%;
5608 г̂ор
доля взяток в сельской местности составит:
40
988 0^,,= * 100=17,6%;
5608 Проверка: 82,4 + 17,6 = 100 %. Как видно из расчетных данных, наибольшая доля взяток (82,4%)
приходится на города и поселки городского типа. Относительные величины координации - показатели, характеризую
щие соотношение друг к другу составных частей целого. При вычислении относительных величин координации за базу сравнения принимается какая - л и б о одна часть изучаемой совокупности, а остальные части соотносятся с ней.
Для примера воспользуемся данными табл. 5.2. Если взять за базу сравнения число фактов взяточничества в городах и поселках городского типа, то относительная величина координации составит:
988 1<! = = 0,21.
4620 Если взять за базу сравнения число фактов взяточничества в сельской
местности, то величина координации составит: 4620
К 2 = = 4,6. 988
Это означает, что взяточничество в городах и поселках городского типа в 4,6 раза превышают взяточничество в сельской местности. Относительные величины координации могут быть выражены не только в коэффициентах, но и в процентном соотношении, а также в тех же именованных единицах, в которых выражен признак.
Относительные величины интенсивности — показатели, характеризующие соотношение одного экономического явления в расчете на единицу другого. При вычислении относительных величин интенсивности необходимо помнить, что они, в отличие от величин динамики и структуры, являются величинами именованными, т.е. выражаются в тех же единицах, что и признак.
По данным табл. 5.3 рассчитаем относительные величины интенсивности.
41
Таблица 5.3 Характеристика интенсивности фактов хулиганства
и разбоев в России в 2007 г. Показатели Значения
Зарегистрировано фактов хулиганства 129505,0 Зарегистрировано фактов разбоев 34318,0 Численность наличного населения на 1.01.08 г., млн. чел.
147,5
129505 Киптеп.хулиг. = = 878 фактов хулиганства
147,5
34318 Кинтен.р<-нб. = = 233 факта разбоя
147,5 Иначе говоря, на каждый млн. чел. наличного населения в России в
2007 г. приходилось 878 фактов хулиганства и 233 факта разбоя. Относительные величины сравнения - показатели, характеризующие
сравнительные размеры одноименных явлений за один и тот же период времени, но по разным объектам (табл. 5.4).
Таблица 5.4 Зарегистрировано грабежей
Города 2004 г. 2005 г. 2006 г. 2007 г.
Москва 4260 3466 2897 3101,5 Санкт - Петербург 10561 6562 7619 ! 7920,0
Вычислим относительные величины сравнения, приняв за базу сравнения число грабежей в г. Москве. Тогда показатели соответственно составят:
10561 К 0 4 = = 2,5 раза;
4260
42
6562 К„5 = = 1,9 раза;
3466
7619 Кое = = 2,6 раза;
2897
7920,0 Кот = = 2,5 раза;
3101,5 Иначе говоря, число грабежей в г. Санкт-Петербурге превышает число
грабежей в г. Москве в 2004 г. в 2,5 раза; в 2005г. - в 1,9 раза; в 2006г.- в 2,6 раза; в 2007г. - в 2,5 раза.
Если взять за базу сравнения число грабежей в г. Санкт-Петербурге, тогда показатели сравнения соответственно составят:
4260 К„4 = = 0,4 раза;
10561
3466 К(,5 = = 0,5 раза;
6562
2897 К„6 = = 0,4 раза;
7619
3101,5 Ко? = = 0,4 раза;
7920,0
43
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Каково назначение в статистике абсолютных и относительных статистических величин? 2. Что понимают под базой сравнения? 3. Какие существуют виды относительных величин, что они выражают и как вычисляются?
Тема 6. Средние величины
Основные теоретические вопросы
Средняя величина, ее сущность, виды и применение. Средняя арифметическая, простая и взвешенная. Вычисление средней арифметической по данным интервального ва
риационного ряда. Особенности вычисления по данным статистической отчетности. Средняя геометрическая, способы ее расчета. Структурные средние медиана и мода.
Методические указания
Большое распространение в статистике имеют средние величины. Средняя - это один из распространенных приемов обобщений. Важность средних величин для статистической практики и науки отмечалась в работах многих ученых. Так, английский экономист В. Петти (1623-1667) еще в XVII веке предлагал использовать в качестве меры стоимости затраты на среднее дневное пропитание одного взрослого работника.
Весьма широко применял средние величины английский ученый Г. Кинг (1648-1712) при анализе данных о населении Англии (средний доход на одну семью, среднедушевой доход и т.п.).
Следствием учения бельгийца А. Кетле (1796-1874) об общих и индивидуальных причинах явилось выделение средних величин в качестве основного приема статистического анализа. Известный русский статистик
44
Ю.Э. Янсон (1835-1893) писал, что средняя величина есть отражение законов социальной жизни.
Средняя величина рассматривается как социально значимая характеристика, информативность которой зависит от однородности данных. Правильное понимание сущности средней величины определяет ее особую значимость в условиях рыночной экономики, когда через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития.
Средние величины - это обобщающие показатели, в которых находят выражение действие общих условий и закономерность изучаемого явления.
Статистические средние рассчитываются на основе массовых данных правильно статистически организованного массового наблюдения (сплошного или выборочного). Однако статистическая средняя будет объективна и типична, только если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Пример нетипичной средней хорошо показан в рассказе Глеба Успенского "Живые цифры". Там средний доход определялся сложением 1 млн. миллионера Колотуш-кина и 1 гроша просвирни Кукушкиной, и получалось, что он составил 0,5 млн. руб. Например, если рассчитывать среднюю заработную плату в кооперативах и на госпредприятиях, а результат распространить на всю совокупность, то средняя фиктивна, так как рассчитана по неоднородной совокупности, и такая средняя теряет смысл.
При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения.
Средняя величина - величина абстрактная, потому что характеризует значение абстрактной единицы, а значит, отвлекается от структуры совокупности. Средняя абстрагируется от разнообразия признака у отдельных объектов. Но то, что средняя является абстракцией, не лишает ее научного содержания. Абстракция есть необходимая ступень всякого научного исследования. В средней величине, как и во всякой абстракции, осуществляется диалектическое единство отдельного и общего.
Применение средних должно исходить из диалектического понимания категорий общего и индивидуального, массового и единичного. Средняя
45
отражает то общее, что складывается в каждом отдельном, единичном объекте. Благодаря этому средняя получает большое значение для выявления закономерностей, присущих массовым явлениям и не заметных в единичных случаях.
Отклонение индивидуального от общего - проявление процесса развития. В отдельных, единичных случаях могут быть заложены элементы нового, передового. В этом случае именно конкретные факты, взятые на фоне средних величин, характеризуют процесс развития. Поэтому в средней и отражается характерный, типичный, реальный уровень изучаемых явлений. Характеристика этих уровней и их изменений во времени и в пространстве является одной из главных задач средних величин. Так, через средние проявляется, например, закономерность изменения преступности по различным возрастным группам, различной социальной принадлежности и т.п.
Средняя величина вычисляется отдельно для признаков, присущих всем явлениям в данной совокупности, и для признаков качественно однородных и различных только количественно (средний рост, средняя зарплата). Средняя величина является отражением значений изучаемого признака и, следовательно, измеряется в той же размерности, что и этот признак.
Под средней величиной в статистике понимают обобщающий показатель, характеризующий типичный уровень варьирующего признака
Вопрос о том, какой вид средней необходимо применить в каждом отдельном случае, разрешается путем конкретного анализа изучаемой совокупности, определяется содержанием изучаемого явления, а также исходя из принципа осмысленности результатов при суммировании или при взвешивании. Только тогда средняя применима правильно, когда получают величины, имеющие реальный смысл для практического применения.
В статистическом анализе используют следующие виды средних величин:
• средняя арифметическая простая; • средняя арифметическая взвешенная; • средняя геометрическая; • структурные средние медиана и мода.
46
Средняя арифметическая простая применяется в том случае, когда каждая единица совокупности имеет свое конкретное значение. Средняя арифметическая простая рассчитывается по формуле:
- Т х
п
где X - значение показателя; п - число значений.
Рассчитаем среднюю арифметическую простую по данным табл. 6.1. Таблгща 6.1
Меры наказания,
2004 г. 2005 г. 2006 г. 2007 г. Принудительное лечение
Всего 48775 42040 43161 48744 в том числе
от алкоголизма 42572 34794 32409 36114 от наркомании 6203 7246 10752 12630
В данном случае для определения средней величины лечившихся от алкоголизма и наркомании произведем следующие расчеты по формуле средней арифметической простой:
— - У X 42572 + 34794 + 32409 + 36114 X = ^ — = = 36472 чел.
п 4 — У X 6203 + 7246 +10752 +12630 м л п
X L = = -9207 чел. // 4
Таким образом, в среднем за год от алкоголизма лечится 36472 чел., а от наркомании - 9207 чел.
Средняя арифметическая взвешенная применяется в том случае, когда имеется некоторая повторяемость значений у единиц совокупности. Средняя арифметическая взвешенная рассчитывается по формуле:
— У хт
где m - частота (повторяемость значений).
47
По данным о распределении числа пострадавших в дорожно-транспортных происшествиях в России в 2007 г. рассчитаем среднюю арифметическую взвешенную (табл. 6.2).
Таблгща 6.2 Распределение числа пострадавших в дорожно - транспортных
происшествиях по возрасту в 2007 г. в России
Группы по возрасту (х), лет Число погибших в дорожно-
транспортных происшествиях ( т ) , тыс. чел.
1- 7 1,7 7 - 1 4 3,4
14-16 1,2 16-26 19,5 26-41 32,6 41 -60 24,5
свыше 60 17,1 Итого 100,0
Определим средний возраст лиц, погибших в дорожно-транспортных происшествиях по формуле:
х = 2 > '
где X - срединное значение показателя в соответствующей возрастной группе;
m - число погибших в соответствующей возрастной группе.
х = / 2 6 + 4 l V
' 1 ± 1 > 1 7 +
Г 7 + 1 4
V 2 ) '
\„„ (\4 + {6 * 3,4 + - \ 1 2 / 1 6 + 2 ^
1 V — У *19.5
+
32.6 + ( 41 + 60
* 24.5 +
100
( 60 + 79
+
} 17.1
100 3987 8
* 17,1 = ——- = 39,9 года. 100
Таким образом, средний возраст пострадавшего в дорожно-транспортном происшествии составляет 39,9 года.
48
Средняя геометрическая используется для определения среднего темпа роста явления за рассматриваемый период динамики. Средняя геометрическая рассчитывается двояко:
x = tfkyk2..Jkm *100%
или
где к ь к 2, . . к ш - коэффициенты динамики по отношению к предыдущему периоду;
m - число коэффициентов динамики; yi и у 2 - соответственно первый и последний абсолютные уровни
ряда динамики; п - число абсолютных уровней ряда динамики.
Требуется определить средний темп роста преступлений, связанных с наркотическими средствами, психотропными и одурманивающими веществами (табл. 6.3).
Табтща 6.3 Зарегистрировано преступлений, связанных с наркотическими средствами, психотропными и одурманивающими веществами
2002 г. 2003 г. 2004 г. 2005 г. 2006 г. 2007 г. Всего по г.Москве
преступлений 2178 2406 3005 4625 8720 9980
в % к предыдущему году
- 110,5 124,9 153,9 188,5 114,4
Произведем расчет: X = V U 0 5 * 1,249 * 1,539 * 1,885 * 1,144 - 1385 * 100%» - 138,5%;
Таким образом, средний темп роста преступлений, связанных с наркотическими средствами, психотропными и одурманивающими веществами, в г. Москве за 2002 - 2007 гг. составляет 138,5%.
Для изучения структуры исследуемой совокупности применяют так называемые структурные средние: медиану и моду.
49
Медианой в статистике называют такое значение признака, которое расположено в середине упорядоченного ряда.
Медиана определяется по-разному для дискретного и интервального вариационного рядов.
Медиана дискретного вариационного ряда, расположенного в ранжированном порядке, имеет серединное значение.
Пример. По следующим данным дискретного ряда распределения, расположенного в ранжированном порядке (в порядке возрастания), определим медиану:
Срок лишения свободы, лет 7 8 9 10 11 Число осужденных (частота), чел. 2 8 4 6 10 Сумма накопленных частот 2 10 14 20 30
Для нахождения медианы (Me) середина упорядоченного ряда определяется средней величиной числа осужденных:
(2 + 8 + 4 + 6+ 10)/2 = 30/2= 15 чел. Данная средняя величина накапливается только к 4-й группе по сроку
лишения свободы, по которой сумма накопленных частот составляет 2 + 8 + 4 + 6 = 20. По данной группе и определяется Me = 10 лет. Это значит, что 50% совокупности осужденных - со сроком лишения свободы до 10 лет, 50%) - более 10 лет.
Медиана в интервальном вариационном ряде определяется по формуле: N/2 - N 0
Ме = х„+ * (xi-xo), Ni
где Хо и xi - соответственно нижняя и верхняя границы медианного интервала;
N - сумма частот ряда; N 0 - сумма частот, накопившаяся до начала медианного интервала; Ni - частота медианного интервала.
Рассчитаем медиану по данным табл. 6.4.
50
'Таблица 6.4 Характеристика лиц, совершивших кражи в России
Группы преступников по возрасту, лет
Число выявленных лиц, совершивших
кражи, чел.
Накопленные частоты от начала ряда
14-17 94364 94364 17-29 214440 308804 29-60 213165 521969
Прежде находится медианный интервал, на который должно приходиться 50% накопленных частот данного ряда. По условию задачи:
94364 + 214440 + 213165 521969 N = = = 260984,5
2 2 Сумма частот первых двух интервалов равна 94364 + 214440 = 308804,
что немногим больше 260984,5. Следовательно, медианный интервал будет находиться во второй группе, т.е. в пределах границ 17-29 лет.
Подставим соответствующие значения в формулу: 521969/2-94364
Me = 17 + * (29 - 17) = 26,6 года. 214440
Таким образом, 50% преступников совершают кражи в России в возрасте до 26,6 лет, а 50% преступников - в возрасте более 26,6 лет.
Модой в статистике называют наиболее часто встречающееся в исследуемой совокупности значение признака.
В дискретном вариационном ряде моду определяют по наибольшей частоте.
Пример. По следующим данным дискретного вариационного ряда определим моду:
Срок лишения свободы, лет 5 10 15 20
Число осужденных, чел. (частота) 20 10 8 4
Просматривая частоты ряда (число осужденных), видим, что наибольшая частота - 20 чел. Этой частоте соответствует срок лишения свобо-
51
ды 5 лет. Таким образом, мода показывает, что в данной совокупности наибольшее число осужденных имеют срок лишения свободы 5 лет (Мо = 5 лет).
В интервальном вариационном ряде мода определяется по формуле: f2 - f i
Мо = х 0 + * ( x i - x 0 ) , ( f 2 - f i ) + ( f 2 - f 3 )
где xo и X| - соответственно нижняя и верхняя границы модального интервала;
f 2 - частота модального интервала; f, и fs - частота интервала соответственно предшествующего и сле
дующего за модальным. По данным той же табл. 6.4 рассчитаем моду. Прежде находится мо
дальный интервал, на который должна приходиться наибольшая частота, по условию задачи в табл. 6.4 это будет интервал 17 - 29, так как ему соответствует наибольшая частота 214440 чел. Подставим соответствующие значения в формулу:
214440-94364 Mo = 17 + * (29 - 17) = 28,9 года
(214440 - 94364) + (214440 - 213165) Иначе говоря, наибольшее число преступников в возрасте 28,9 лет.
КОНТРОЛЬНЫЕ ВОПРОСЫ
/. Какова сущность средней? 2. Какие формы средней рассчитываются в исследованиях? 3. Какова методология расчета средней по данным интервального вариационного ряда? 4. Какова методология и применимость средней арифметической? 5. Какова методология и применимость средней геометрической? 6. Каков экономический смысл и методология расчета структурных средних? 7. Какой интервал в интервальном вариационном ряде называется модальным, какой медианным?
52
Тема 7. Показатели вариации
Основные теоретические вопросы
Понятие о вариации признака. Показатели вариации и их применение. Размах вариации. Среднее линейное отклонение. Дисперсия. Среднее квадратическое отклонение. Коэффициент вариации. Виды дисперсий. Правило сложения дисперсий и его применение в
анализе.
Методические указания
Наряду со средней величиной, характеризующей типичный уровень варьирующего признака, около которого колеблются отдельные значения признака, рассматривают показатели вариации (колеблемости) признака, позволяющие количественно измерить величину и степень этой колеблемости.
К показателям вариации относят: размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение, коэффициент вариации.
Простейшим показателем вариации является размах вариации, который рассчитывается по следующей формуле:
К ~~ X n i a x X n i j n , где Х | Ш Х , Х т ш - соответственно максимальное и минимальное значение
признака в исследуемой совокупности.
Размах вариации характеризует диапазон колебаний признака в изучаемой совокупности и измеряется в тех же единицах, в которых выражен признак.
53
Рассчитывают среднее линейное отклонение, которое бывает невзве-шенное и взвешенное. Если каждое значение признака встречается в совокупности один раз, то применяется формула среднего линейного отклонения невзвешеииого:
/) = -= п
где х - значение признака; х - среднее значение по совокупности; п - количество значений.
Если имеется некоторая повторяемость значений признака, то применяется формула среднего линейного отклонения взвешенного:
° = v -
где т - частота.
Среднее линейное отклонение характеризует абсолютный размер колеблемости признака около средней и измеряется в тех же единицах, в которых выражен признак. Однако при его исчислении применяются допущения (расчет по модулю), поэтому более точным будет показатель среднего квадратического отклонения, который учитывает отрицательные и положительные отклонения показателя. Для его определения предварительно рассчитывают показатель дисперсии. Дисперсия иевзвешеииая определяется по формуле:
Дисперсия взвешенная определяется по формуле:
(7 — т
Тогда для расчета среднего квадратического отклонения невзвешен-ного используют формулу:
54
а для расчета среднего квадратического отклонения взвешенного - форму-
Как и среднее линейное отклонение, среднее квадратическое отклонение характеризует абсолютный размер колеблемости признака около средней.
В отличие от среднего линейного и среднего квадратического отклонения коэффициент вариации является относительной мерой колеблемости признака около средней и характеризует степень однородности признака в изучаемой совокупности. Он определяется по формуле:
Если коэффициент вариации v>33,3%, исследуемая совокупность считается весьма неоднородной и для проведения дальнейшего анализа должна быть разгруппирована.
Если исследуемую совокупность единиц расчленить на группы, то можно считать, что общая дисперсия всей совокупности варьирует (изменяется*) под влиянием дисперсий для каждой отдельной группы (так называемых групповых или частных дисперсий), а также под влиянием межгрупповой дисперсии. Эти дисперсии связаны между собой правилом сложения дисперсий. При использовании правила сложения дисперсий в экономическом анализе по величине частной дисперсии может решаться задача выявления наиболее эффективной в производстве системы (формы, структуры и т.п.) организации труда, его оплаты и т.п.
Частные или групповые дисперсии характеризуют колеблемость изучаемого признака в каждой отдельной группе и определяются по следующей формуле:
лу:
V = = * 100%. X
где х - значение признака; х, - средняя по совокупности в i - ой группе; n i i - численность единиц в i - ой группе; i = 1,2, ... п - номер группы.
55
Средняя из частных дисперсий определяется по формуле:
г 2 Z°V4 а.
Межгрупповая дисперсия характеризует колеблемость частных средних Xi около общей средней х и определяется следующим образом:
у- = Z 1П;
Отдельно рассчитывается общая дисперсия а" по формуле:
°~ >
При соблюдении правила сложения дисперсий должно соблюдаться равенство:
а~ = о' +у2
Проиллюстрируем расчет показателей вариации по данным о числе зарегистрированных убийств и покушений на убийство в г. Москве за 2000 -2004 гг. (табл. 7.1).
Таблица 7.1 Зарегистрировано убийств и покушений
Годы Зарегистрировано убийств и покушений на убийство (х)
(х-х)2
2003 1404 185,4 34372,2 2004 1820 230,6 53176,4 2005 1702 112,6 12678,8 2006 1544 45,4 2061,2 2007 1477 112,4 12633,8
Итого 7947 686,4 114923,4
В расчетах будем использовать невзвешенные показатели вариации, так как в наличии несгруппированные данные.
7947 х = = 1589,4 убийства
R - хта - хтт - 1820 -1404 - 416убийств;
56
d=^ [ 1404 -1589.4 + 1820 -1589.4 + 1702 -1589.4
+ 1544 -1589.4 + 1477 -1589.4 5
686.4 - 137',3убийств;
<т~ -
5 5
^ ( x - . v ) 2 _ (1404-1589,4)2 + (1820-1589,4)2 + (1702-1589,4)" п ~ 5
(1544 -1589,4) 2 + (1477 -1589,4) 2 114923,4 - 22984,7;
а - VfT^ = V - 2 9 8 4 > 7 - 15\,6yow!cme;
v = Zr = 1 5 1 , 6 ^ 100% - 9.5% x 1589,4
По произведенным расчетам можно сделать следующие выводы. В среднем за год совершается 1589,4 убийств и покушении на убийство. Диапазон колебания зарегистрированных убийств и покушений на убийство варьирует в пределах 1404-1802 убийств и составляет величину 416 убийств. Так как наиболее точным показателем вариации признака является среднее квадратическое отклонение, нежели среднее линейное отклонение, можем считать, что в среднем на 151,6 убийств ежегодно отклоняется от средней величины за рассматриваемый период. Иными словами, число зарегистрированных убийств и покушении на убийство за период 2003 -2007 гг. варьирует в пределах 9,5%.
Расчет показателей вариации можно производить по интервальному ряду распределения. Рассмотрим это на примере (табл. 7.2).
Таблица 7.2 Возрастная характеристика лиц, совершивших изнасилования и
покушения на изнасилование в России в 2007 г.
Группы по возрасту (х), лет
Число выявленных лиц,совер
шивших преступление ( т )
\х - х\ \x-x\m (х-х)2
(х - х)2 m
14-17 1298 9,6 12460,8 92,2 119675,6 17-29 4606 2,1 9672,6 4,4 20266,4
29 и старше 2203 9,9 21809,7 98,0 215894 Итого 8107 - 43943,1 - 355836
57
Так как исследованию подвергается интервальный вариационный ряд, то все показатели вариации будут взвешенными. В качестве весов будет выступать число выявленных лиц, совершивших изнасилование и покушение на изнасилование в соответствующей возрастной группе ( т ) .
( 14 + 17^ (17 + 29 *1298 +
хт *4606 +
( 29 + 41' *2203
х =
15.5 * 1298 + 23 * 4606 + 35 * 2203 203162 8107 8107
= 25,\года;
* = =41-14 = 27.7^;
, ^(х-х)2т 355836
£ т 8Ю7
а - V<7' - J4?\9 - б&года;
v = g = ^A * юо% - 25.9% х 25,1
На основе проведенных расчетов можно сделать выводы, что средний возраст лиц, совершивших изнасилование и покушение на изнасилование, составляет 25,1 года. Рассматриваемая совокупность лиц, совершивших преступление по возрастному критерию, весьма разрозненна: от 14 до 41 года, что характеризуется размахом вариации R = 27 лет. В среднем, возраст преступников колеблется и пределах 6,6 года, т.е. в пределах 25,9%.
Правило сложения дисперсий может применяться для определения наиболее эффективной системы (структуры, формы и т.п.) организации труда и его оплаты. Определим, используя данные табл. 7.3, наиболее эффективную систему оплаты труда рабочих.
58
Таблица 7.3 Исходные данные для расчета частных дисперсий
Системы оплаты труда
Затраты времени на производимые
операции (х), мин.
Число рабочих
( т ) , чел.
Всего затрачено времени Ех, мин
Затраты времени в среднем (хО, мин
Простая сдельная 28,30,29,27,31 5 145 29,0 Сдельная преми
альная 23,25,24,27,24 5 123 24,6
Сдельная прогрессивная
18,16,19,21,20 5 94 18,8
Итого 15 362 24,13
Частные дисперсии рассчитываются по формуле: , ^{х-х^т,
<У7 - Z 1П;
Тогда, при х. = 29
, (28-29)" +(30-29)" +(29-29)" + (27-29)* +(31-29) 2 10 „ <тг = : : 1 — = — = 2и/ш;
1 5 5 При х2 = 24,6
, (23 - 24,6>2 + (25 - 24,6)2 + (24 - 24, б) 2 + (27 - 24,6)2 + (24 - 24,6)2 9,2 5 5
При х~ = 18,8
2 (18-18,8)2 +(16-18,8)2 + (19-18,8)2 +(21-18,8)2 +(20-18,8) 2 _ 148 5 ~ 5
Рассчитаем среднюю из частных дисперсий по формуле:
-2 У <т2/н, 2*5 + 1,84*5 + 2,96*5 34 „ сг/ - -=^- — - 2.26л/ш/.
5 + 5 + 5 15 Определим межгрупповую дисперсию по формуле:
= \.$4лшн:
= 2.96.1/ww:
Г = v ;
, (29-24J3) 2 *5 + (24,6-24,l3) 2 *5 + (l8,8-24,l3) 2 *5 261,75 ,„ A r
5 + 5 + 5 15
59
Определим общую дисперсию по формуле:
а п
, (28 - 2 4 Д З ) 2 +(30-24,13)" +(29- 24ДЗ) 2 +(27- 24ДЗ) 2
(7 = Ь 15
(31-24,13)- + ( 2 3 - 2 4 Д З ) 2 + ( 2 5 - 2 4 Д З ) 2 + ( 2 4 - 2 4 Д З ) 2
15 (27 -24ДЗ) 2 + ( 2 4 - 2 4 Д З ) 2 + (18 -24ДЗ) 2 +(16-24,13)2 + (19 -24ДЗ) 2
15 (21-24ДЗ) 2 + ( 2 0 - 2 4 Д З ) 2 295.76 , , ^
+ — = : — = 19,72л/////. 15 15
Так как соблюдается правило сложения дисперсий, а именно: 19,72 = 17,46 + 2,26, то можно считать, по максимальной величине частной дисперсии а; =2,9б.иш, что наиболее эффективной системой оплаты труда по исследуемой совокупности является сдельная прогрессивная оплата труда.
КОНТРОЛЬНЫЕ ВОПРОСЫ
[.Каковы экономический смысл и методология расчета показателя размаха вариации? 2.Каково назначение и методология расчета среднего линейного отклонения и среднего квадратического отклонения? З.В каком случае применяются невзвешенные и взвешенные показатели варшщии? 4. Какова экономическая интерпретация коэффициента вариации? 5.В чем заключается правило сложения дисперсий и каково его экономическое назначение?
Тема 8. Ряды динамики
Основные теоретические вопросы
Понятие ряда динамики. Виды рядов динамики.
60
Моментные и интервальные ряды динамики. Показатели рядов динамики. Средний уровень ряда и способы его вычисления. Абсолютный прирост. Средний абсолютный прирост. Темпы роста и прироста. Средние темпы роста и прироста. Абсолютное значение одного процента прироста. Цепные и базисные показатели динамики. Методы выявления тенденции ряда динамики. Метод укрупнения интервалов. Метод скользящей средней. Аналитическое сглаживание рядов динамики.
Методические указания
Рядами динамики называют ряды, которые характеризуют изменение явления во времени. Ряды динамики бывают моментные и интервальные. Моментные ряды характеризуют изменение явления в динамике на определенный момент времени (чаще - на начало или конец периода). Интервальные ряды характеризуют изменение явления в динамике за определенный период времени (месяц, квартал, год).
В экономическом анализе используют аналитические показатели динамики. К ним относят абсолютный прирост, средний абсолютный прирост, темп роста, темп прироста, средние темпы роста и прироста, абсолютное значение одного процента прироста. Данные показатели широко используются в статистической практике, что вызывает необходимость тщательного изучения методологии их расчета.
Рассмотрим на примере расчет аналитических показателей ряда динамики (табл. 8.1).
61
Таблгща 8.1 Зарегистрировано грабежей по г. Москве за 2003 - 2007 гг.
Годы
Заре-гист-риро-вано гра
бежей
Показатели динамики
Годы
Заре-гист-риро-вано гра
бежей
Абсолютный прирост (А)
Темп роста (Тр) Темп прироста
(Тпр) Абсолютное зна
чение 1% прироста
(А)
Годы
Заре-гист-риро-вано гра
бежей
Абсолютный прирост (А) Цепной, %
Базисный,
% Цепной,
%
Базисный,
%
Абсолютное зна
чение 1% прироста
(А)
2003 5595 - - 100 - - -2004 4720 -875 84,4 84,4 -15,6 -15,6 56,1 2005 4260 -460 90,3 76,1 -9,7 -23,9 47,4 2006 3466 -794 81,4 62,0 -18,6 38 42,7 2007 2897 -569 83,6 51,8 -16,4 -48,2 34,7
Абсолютный прирост (Л) определяется как разность между отчетным и предыдущим уровнями ряда динамики, т.е. по формуле:
А = У 1 - у м ,
где у, - уровни ряда динамики (численные значения ряда динамики).
Абсолютный прирост характеризует абсолютное изменение явления в отчетном периоде по сравнению с предыдущим. Так, например, по сравнению с2003 г. в 2004 г. было зарегистрировано грабежей на 875 (4720-5595) меньше, а в 2005 г. по сравнению с 2004 г. - на 460 (4260-5595) меньше и т.д.
Средний абсолютный прирост (А) определяется па основе данных абсолютных приростов либо на основе абсолютных уровней ряда динамики по следующим формулам:
Д = -^— или -" } ' . п-\ п-1
где п - число уровней ряда динамики; yi и у п - соответственно первый и последний абсолютные уровни
ряда динамики. Средний абсолютный прирост (д) за рассматриваемый период дина
мики составит:
62
- - 875 - 460 - 794 - 569 - 2698 ._ л е „ Д = = = -67А.Ъгпаоежеи
5-1 4
ИЛИ - 2897-5595 -2698 е , Д —ЫА.Ъгриоежеи.
5-1 4
Можно сделать вывод, что в среднем за рассматриваемый период в г. Москве число зарегистрированных грабежей сократилось на 674,5.
Темп роста (Тр) определяется по формуле:
где у 0 - уровень ряда динамики, взятый за базу сравнения.
Темп роста характеризует относительный рост явления за рассматриваемый период.
Темпы роста рассчитываются по принципу цепных и базисных соотношений. В том случае, когда за базу сравнения принимается предыдущий период, рассчитываются цепные показатели темпа роста; когда же сравнение осуществляется с любым другим уровнем ряда динамики, взятым за базу сравнения, рассчитываются базисные темпы роста.
Так, в 2004 г. по отношению к 2003г. число грабежей в г. Москве составило Тр, = (4720:5595) * 100% = 84,4%, а в 2005г. по отношению к 2004г. - Тр 2 = (4260:4720) * 100% = 90,3% и т.д.
Если за базу сравнения взять 2003г., то число зарегистрированных грабежей в 2004г. составит Тр, = (4720:5595) * 100% = 84,4%, а в 2005г. по отношению к 2003г. Тр 2 = (4260:5595) * 100%=76,1% и т.д.
Темп прироста (Тпр) в отличие от темпа роста характеризует относительный прирост явления в отчетном периоде по сравнению с тем уровнем, с которым осуществляется сравнение, и определяется по формуле:
Тпр = Т р - 100. Если продолжить начатый с расчетов темпов роста анализ, то можно
сделать вывод, что так как в 2004 г. по отношению к 2003 г. темп роста числа грабежей составил 84,4 %, значит, число грабежей снизилось в 2004г. по сравнению с 2003 г. на 15,6% (Тр, = 84,4-100); так как в 2005г. по сравнению с 2004 г. темп роста числа грабежей составил 90,3%, то, зна-
63
чит, число грабежей снизилось в 2005 г. по сравнению с 2004 г. на 9,7% (Тр 2 = 90,3 - 100)ит.д.
Средний темп роста (х) за период динамики определяют по формуле средней геометрической двояким способом: на основе данных цепных коэффициентов динамики либо на основе данных абсолютных уровней ряда динамики по формулам:
x = tfk1k2...km *100%
или
^ = п - ^ ^ * 1 0 0 % ,
где к ь к 2 кП 1 - коэффициенты динамики по отношению к предыдущему
периоду; m - число коэффициентов динамики; п -число абсолютных уровней ряда динамики; yi и у 2 - соответственно первый и последний абсолютные уровни
ряда динамики.
Так, за рассматриваемый период средний годовой темп роста грабежей в г. Москве составил:
х = * 0,903 * 0,814 * 0,836 - ^0,518 = О ' 8 4 8 * Ю0% - 84,8%
или '2897
х = . - I = 4/0,518 = 0,848 * 100% = 84,8%. V 5595
Таким образом, можно сделать вывод, что за рассматриваемый период темп роста числа грабежей, в среднем, составил 84,8%, т.е. грабежи сократились в среднем на 15,2% (84,8 - 100).
Абсолютное значение одного процента прироста (А) характеризует абсолютный эквивалент одного процента прироста и определяется по формуле:
Тлр
64
Так, в 2004г. на каждый процент прироста приходилось А1 = (-875):(-15,6) = 56,1 грабежей; в 2007г. А2 = -(-569):(-16,4)=34,7 грабежей и т.д.
В анализе ряда динамики важное практическое значение имеет определение среднего уровня ряда динамики.
Средний уровень интервального ряда динамики определяется по формуле средней арифметической простой. Так, по данным табл. 8.1 за 2003 - 2007 гг., в среднем, зарегистрировано 4188 грабежей:
_ 5595 + 4720 + 4260 + 3466 + 2897 л ftrt „ у 41 ъъграоежеи.
Средний уровень моментного ряда динамики определяется по формуле средней хронологической:
_ V, /2+ V\ +...+ v V = — — ' - J L ^ .
п-\ Пример. Наличие в суде нерассмотренных гражданских дел на начало
соответствующего месяца составило: на 01.01. на 01.02. на 01.03 на 01.04
13 15 16 18
Таким образом, в среднем, за 1 квартал не рассмотрено 16 дел. _ 13/2 + 15 + 16 + 18/2 , Л Ч
V ~ 16,0с)ел 4 - 1
Один из важнейших вопросов, возникающих при изучении рядов динамики, - это выявление тенденции развития экономического явления в динамике. Для этой цели применяются разнообразные статистические методы, в частности метод укрупнения интервалов, метод скользящей средней, метод аналитического выравнивания.
Наиболее простым в использовании является метод укрупнения интервалов, основанный на укрупнении периодов времени, к которым относятся уровни ряда. Выявление тенденции осуществляется по новому укрупненному ряду динамики.
Другой метод - метод скользящей средней - заключается в замене первоначальных уровней ряда динамики средними арифметическими, найденными по способу скольжения, начиная с первого уровня ряда с постепенным включением последующих уровней.
Наиболее совершенным методом выявления тенденции ряда динамики является метод аналитического выравнивания, который заключается в
65
замене первоначальных уровней ряда новыми, найденными во времени t путем построения аналитического уравнения связи.
Рассмотрим на примере данных (табл. 8.2) применение каждого из методов выравнивания при выявлении тенденции ряда динамики.
Таблица 8.2 Количество разбоев в Республике Беларусь за 2007г.
Месяц Количество
разбоев Месяцы
Количество разбоев
Т 91 VII 124 II 106 VIII 126
ИТ 144 IX 129 IV 154 X 154 V 125 XI 124 VI 155 XII 190
По методу укрупнения интервалов получим новые укрупненные поквартально уровни ряда динамики;
у, =91 + 106+ 144 = 341; у 2 = 154 + 125 + 155 = 434; у ? = 124+ 126+ 129 = 379; у 4 = 154+ 124+ 190 = 468.
Тогда выровненный ряд динамики примет вид:
| 341 | 434 | 379 | 468 |
По новому выровненному ряду динамики прослеживается тенденция увеличения числа разбоев в Республике Беларусь за 2007 г.
Взяв те же данные, применим метод скользящей средней, используя семичленную скользящую среднюю.
Тогда, — 91 + 106 + 144 + 154 + 125 + 155 + 124 , „ 0 „ V, = = 128,4
7 — _ 106 + 144 + 154 + 125 + 155 + 124 + 126 _ п з / ]
— 144 + 154 + 125 + 155 + 124 + 126 + 129 У у = ^
66
— 154 + 125 + 155 + 124 + 126 + 129 + 154 | / 1 П , v4 = = 138,1 7
— 125 + 155 + 124 + 126 + 129 + 154 + 124 V, 133,9
— 155 + 124 + 126 + 129 + 154 + 124 + 190 , , Л = т = '43Л
Отсюда выровненный с помощью семичленной скользящей средней ряд динамики примет вид:
| 128,4 | 133,4 | 136,7 | 138,1 | 133,9 | 143,1 |
Таким образом, подтверждается тенденция увеличения числа разбоев в Республике Беларусь за отчетный год.
Для осуществления метода аналитического выравнивания построим вспомогательную таблицу (табл. 8.3).
Используя метод отсчета от условного нуля, введем условное обозначение времени t, придав ему определенные значения так, чтобы ^ / = о.
Судя по выявленной с помощью двух предыдущих методов тенденции увеличения разбоев в 2007 году, можно сказать, что наиболее вероятна линейная зависимость данного распределения от времени t и данному распределению соответствует уравнение прямой (рис. 8.1);
У, =а« +<V-
Кол-во рачбоев
0 I II Ш IV V VI VII VIII IX X XI XII месяцы
Рис. 8.1. Динамика разбоев в Республике Беларусь за 2007г.
67
Таблица 8.3 Исходные данные для расчета корреляционного уравнения связи
Месяцы Количество разбоев(у)
t t2
ty yT=135,2+2t
I 91 -11 121 -1001 113,2 II 106 -9 81 -954 117,2 III 144 -7 49 -1008 121,2 IV 154 -5 25 -770 125,2 V 125 -3 9 -375 129,2 VI 165 -1 1 -165 133,2 VII 124 +1 1 124 137,2 VIII 126 +3 9 378 141,2
Продолжение табл. 8.3 IX 129 +5 25 645 145,2 X 154 +7 49 1078 149,2 XI 124 +9 81 1116 153,2 XII 190 +11 121 2090 157,2
Итого 1622 0 572 1158 1622,4
Для нахождения параметров аО и al используем систему уравнений:
а, .Z'+°.S'2=Zo'.
Поскольку 2 / = 0, имеем:
а Е ' 2 = Х ' > - ;
а* -= Z>1=I622 =
п 12 2 Л П58
CL = £ г 572 -2.0
68
Следовательно, уравнение прямой примет вид у, =135,2 + 2,0/ и будет в
данном случае искомым, т.к. ^ у = ^у,.
По найденному уравнению прямой найдем новые выравненные во времени t уровни ряда динамики:
уп =135,2 + 2*(-11) = 113,2;
уп_ = 135,2+ 2*(-9) = 117,2;
уп = 135,2+ 2*( -7) = 121,2;
у1Л = 135,2 + 2*(-5) = 125,2; И Т.Д.
Расчетные значения отложим на рис. 8.1 для построения прямой линии.
Графическое изображение, построенное по отдельному уравнению прямой, подтверждает выявленную с помощью предыдущих двух методов тенденцию увеличения числа разбоев в Республике Беларусь за 2007 год.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Какие показатели рядов динамика используются в социально экономическом анализе? 2. В чем отличие цепных показателей рядов динамики от базисных? 3. В чем сущность метода укрупнения интервалов? 4. Как используется метод скользящей средней? 5. В чем сущность метода аналитического выравнивания?
Тема 9. Графическое изображение статистических данных
Основные теоретические вопросы
Понятие о статистическом графике. Роль графического изображения в статистике. Элементы статистического графика и правила его построения. Классификация графиков. Формы графического изображения статистических данных. Диаграммы:
69
• столбиковые; • ленточные; • линейные; • квадратные; • круговые; • секторные. Графическое изображение: • динамики; • структуры; • сравнения. Графическое изображение рядов распределения. Гистограмма. Полигон.
Методические указания
Графиками в статистике называют условные изображения числовых величин и их соотношений в виде различных геометрических фигур.
Графики являются средством обобщения и анализа статистических данных. С помощью графиков решаются следующие задачи:
• выявляются основные тенденции развития экономических явлений; • выявляются взаимные связи между явлениями. При рассмотрении любого графика можно выделить следующие со
ставляющие его элементы: • поле графика - пространство, в котором размещаются или распола
гаются геометрические знаки, образующие график; • геометрические знаки - знаки, с помощью которых формируются
понятия, отраженные на графике. Эти знаки, по существу, образуют его основу;
• пространственные ориентиры, определяющие размещение геометрических знаков в поле графика;
• масштабные ориентиры, дающие этим знакам количественную определенность;
• экспликация графика, состоящая из объяснения:
70
а) предмета, изображаемого графиком (его названия); б) смыслового значения каждого знака, применяемого на графике.
Каждый из перечисленных элементов представляет весьма существенную часть процесса графирования.
Статистические графики различают по содержанию и способу построения.
По содержанию изображаемых статистических показателей графики делят на следующие виды:
• графики сравнения; • графики динамики; • графики структуры; • графики вариационных рядов. По способу построения различаются графики: • столбиковые; • ленточные; • линейные; • квадратные; • круговые; • секторные диаграммы. Рассмотрим на конкретных примерах каждый вид графиков и соответ
ствующие способы графического изображения статистических данных.
/. Графики сравнения. При построении графиков сравнения могут использоваться столбико
вые, ленточные, квадратные, круговые диаграммы. Столбиковая диаграмма изображается в виде столбиков, основания
которых откладываются на оси абсцисс, высота - на оси ординат. Ширина столбиков произвольная, но одинаковая (рис. 9.1).
Пример. Зарегистрировано преступлений, совершенных несовершеннолетними и при их участии по некоторым регионам России за 2007г.: Брянская обл. - 1649; Нижегородская обл. - 4294; Рязанская обл. - 1060; Ульяновская обл. - 959.
Ленточную диаграмму целесообразно строить в том случае, когда осуществляется сравнение показателей.
71
В ленточной диаграмме в отличие от столбиковой диаграммы столбики расположены не вертикально, а горизонтально в системе прямоугольных координат (рис. 9.2).
>
г, с
4500
4000
3500
3000
2500
2000
1500
1000
500
0
4294
Брянская Нижегородская Рязанская Ульяновская область область область область
Регионы России
Рис. 9.1. Сравнительная характеристика преступлений, совершенных несовершеннолетними и при их участии по некоторым
регионам России за 2007 г.
Пример. Темпы прироста разбоев по некоторым регионам России в 2007г. по сравнению с 2006г. составили: Иркутская обл. - (-3,2%); Калининградская обл. (+21,7%); Воронежская обл. (+25,7%); Ивановская обл. (+7,9%).
72
-3,2%
7.9 %
25,7%
21,7%
-5% 0% 5% 1 0% 15% 20% 25% 30%
Рис. 9.2 Изменение количества разбоев по некоторым регионам России в 2007г. по сравнению с 2006г.:
1 - Иркутская область, 2 - Калининградская область, 3 - Воронежская область, 4 - Ивановская область.
Квадратную диаграмму целесообразно строить в том случае, когда между сравниваемыми показателями разница настолько велика, что установление подходящего масштаба становится затруднительным. Для нахождения стороны квадрата извлекают квадратный корень из соответствующей величины. Тогда площадь квадратов визуально будет характеризовать соответствующую исходную величину (рис. 9.3).
Пример. Зарегистрировано фактов хулиганства по государствам СНГ за 2007 г.: Беларусь - 6454, Азербайджан - 1359, Армения - 436. Для построения квадратной диаграммы площади квадратов соответственно составят:
1, = V6454 = 80,34; Ь VT359 = 36,86; 13 = V436 = 20,86;
73
436
Беларусь Азербайджан Государства СНГ
Армения
Рис. 9.3 Факты хулиганства по некоторым государствам СНГ за 2007г.
Круговые диаграммы строятся аналогично квадратным (рис. 9.4). Радиус круга есть корень квадратный из соответствующей величины.
Пример. Зарегистрировано изнасилований и покушений на изнасилование по некоторым регионам России в 2007г.: Рязанская обл. - 57; Самарская обл. - 145; Ростовская обл. - 236. Для построения круговых диаграмм радиусы кругов соответственно составят:
r/i = V57 = 7,55; г2 = л/145= 12,04; r 3 = V236 = 15,36.
2. Графики динамики. Построение графиков динамики осуществляется, как правило, с по
мощью линейной (рис. 9.5, рис. 9.6) или столбиковой диаграмм (рис. 9.7).
Пример. Число осужденных за нарушение правил безопасности движения железнодорожного, водного и воздушного транспорта в России (в % к предыдущему году): 2004г. - 88,2%; 2005г. - 83,6%; 2006г. - 95,1%; 2007г. -74,1%.
74
о Рязанская область
Самарская область
Ростовская область
Регионы России
Рис. 9.4. Факты изнасилований и покушений на изнасилование по некоторым регионам России в 2007г.
2004 2005 2006 2007 Годы
Рис. 9.5. Динамика числа осужденных за нарушение правил безопасности движения и эксплуатации железнодорожного,
водного и воздушного транспорта в России (в % к предыдущему году).
Пример. Число осужденных за нарушение правил дорожного движения лицом, управляющим транспортным средством в России (в % к 2003 г.): 2004г. - 95,6%; 2005г. - 101,1%; 2006г. - 100,9%; 2007г. - 91,8%.
75
Проценты
мюз 2004 2005 2006 2007
Рис. 9.6 Динамика числа осужденных за нарушение правил дорожного движения лицом, управляющим транспортным
средством в России (в % к 2003 г.)
Пример. Число осужденных за недоброкачественный ремонт транспортных средств и выпуск в эксплуатацию с техническими неисправностями в России: 2003г. - 69 чел.; 2004г. - 73 чел.; 2005г. - 69 чел.; 2006г. -102 чел.; 2007г.-31 чел.
120
100
80
60
40
20
0
102
73 69 69
31
2003 2004 2005 2006 2007 Годы
Рис. 9.7. Динамика числа осужденных за недоброкачественный ремонт транспортных средств и выпуск их в эксплуатацию
с техническими неисправностями
76
3. Графики структуры При построении графиков структуры могут использоваться секторные
и столбиковые диаграммы. Особенностью построения секторной диаграммы является то, что площадь круга в секторной диаграмме принимается за 100%, а величины секторов пропорциональны процентному соотношению составных частей целого в их общем итоге (рис. 9.8). По данным табл. 9.1 построим секторную диаграмму.
Таблица 9.1 Распределение приватизированных предприятий
по формам собственности (в % к итогу)
Формы собственности Январь - март
2006г. Январь - март
2007г. Федеральная собственность 17 16
Собственность субъектов Российской Федерации
13 23
Муниципальная собственность 70 61 Итого 100 100
январь - март 2006г. январь - март 2007г.
Федеральная собственность Собственность субъектов Российской Федерации Муниципальная собственность
Рис. 9.8. Структура приватизированных предприятий по формам собственности в России
77
Используем те же данные табл. 9.1 для построения столбиковой диаграммы (рис. 9.9).
100
75
50
25
70 61
23_
16
январь - март 2006г. январь - март 2007г. годы
Федеральная собственность Собственность субъектов Российской Федерации Муниципальная собственность
Рис. 9.9. Структура приватизированных предприятий по формам собственности в России.
4. Графики вариационных рядов Среди вариационных рядов распределения выделяют дискретные и
интервальные ряды. Дискретные вариационные ряды изображают в виде так называемого полигона распределения. Варианты откладываются на оси абсцисс, частоты - на оси ординат. Точки пересечения соединяются отрезками прямой (табл. 9.2, рис. 9.10).
Интервальные вариационные ряды изображают в виде гистограммы. При построении гистограммы интервальных вариационных рядов с равными интервалами на оси абсцисс откладывают границы интервалов, на оси ординат - число совокупности, приходящееся на данный интервал. Строят прямоугольники с равными основаниями (табл. 9.3, рис. 9.11).
При построении гистограммы интервальных вариационных рядов с неравными интервалами на оси абсцисс откладывают границы интервалов, на оси ординат - число единиц совокупности, приходящееся на единицу ширины интервала (плотность распределения). Строят прямоугольники (табл. 9.4, рис, 9.12).
78
Пример. Таблица 9.2
Распределение числа женщин по числу родившихся детей
Па 100 женщин приходится
Женщин, родивших детей
В том числе Женщин, родивших детей 1 ребенка 2 ребенка 3 ребенка
Всего женщин в возрасте 18 лет и
старше 834 297 354 183
Количество женщин, чел.
400 _ _
150
100
50 Количество детей, чел.
I 2 3
Рис. 9.10. Распределение числа женщин по числу родившихся детей
79
Пример. Таблица 9.3
Распределение населения по размеру среднедушевого дохода в 2006 г. Группы населения по размеру среднедушевого
дохода в 2006 г., руб. млн. чел.
До 400 30,6 400 - 800 31,3 800 - 1200 25,3 1200-1600 18,2 1600-2000 12,6 2000 - 2400 14,6 2400-2800 14,0
Млн. чел
35
30
25 _
20
15
10
400 800 1200 1600 2000 2400 2800 руб.
Рис. 9.11. Распределение населения по размеру среднедушевого дохода в 2006г.
80
Пример. Таблица 9.4
Распределение лиц, совершивших преступления
Возраст лиц, совершивших преступления в 2007г. в РФ:
Количество совершивших
преступления, тыс. чел.
Ширина возрастного интервала,
лет
Плотность распределения, тыс.
чел./год
(1) (2) (3) (2:3) 14-15 69 1 69,0 15-17 139 2 69,5 17-24 363 7 51,9 24 -29 231 5 46,2
29 и свыше 792 5 158,4
Тыс. чел ./год
210
180
150
120
90
60
30
0 Ч 14 15 17 24 29 34
Рис. 9.12. Распределение лиц, совершивших преступления в 2007г. в России, по возрасту
При построении графиков в системе прямоугольных координат необходимо придерживаться следующих правил:
81
1. Каждый график должен иметь название, которое располагают под ним. В названии в краткой форме следует отразить содержание, место и время явления;
2. Все графики в тексте последовательно нумеруются и именуются рисунками. Например, рис. 1, рис. 2 и т.д.
3. Оси координат должны быть названы и иметь единицы измерения; 4. На оси ординат, как на числовой оси, должны быть обозначены це
лые числа в равном масштабе (например, 20, 40, 60 и т.д. или 1500, 3000, 45000 и т.д.). Заканчиваться числовая ось должна той величиной, которая немногим больше максимальной величины в исходной совокупности;
5. Под рисунком, там, где это необходимо, следует давать пояснения условным изображениям, используемым на графике;
6. В текстовой части работы график следует помещать после упоминания о нем в тексте на той же странице или на следующей;
7. Каждый график в текстовой части работы должен быть прокомментирован (сделаны экономические выводы).
КОНТРОЛЬНЫЕ ВОПРОСЫ
/. Каково назначение графика? 2. Какие виды графиков используют в анализе9
3. Какие применяют способы графического изображения статистических данных?
Тема 10. Индексы
Основные теоретические вопросы
Понятие об индексах и их значение в анализе изучаемых явлений.
Индивидуальные и сводные индексы. Агрегатный индекс как основная форма сводного индекса. Способы расчета сводных индексов. Индексируемые величины. Базисные и цепные индексы.
82
Индексы переменного, постоянного составов и структурных сдвигов. Взаимосвязи индексов. Важнейшие сводные индексы. Индексный метод выявления влияния отдельных факторов. Два свойства индексов, используемые в анализе.
Методические указания
В статистике индексами называют относительные величины, характеризующие изменение явления во времени.
Индексы измеряются в процентах. Для некоторых простых. Единичных явлений, которые допускают непосредственное сравнение, строят индивидуальные индексы. Для явлений сложных, состоящих из непосредственно несоизмеримых элементов, строят сводные индексы. Так, для характеристики динамики конкретного вида преступления применяется индивидуальный индекс. Если же исследователя интересует динамика преступности в целом, то в этом случае строится сводный индекс.
Разработанная статистикой теория индексов позволяет решить следующие задачи:
1) определить соотношение показателей во времени; 2) определить влияние отдельных факторов на изменение результа
тивного показателя при условии, что факторы представлены в виде произведения.
В теории индексов наиболее часто используются следующие обозначения: i - индивидуальный индекс; Т - сводный индекс.
Порядок построения индивидуальных индексов весьма прост: в числителе дроби записывается показатель на уровне отчетного периода, в знаменателе - на уровне базисного периода. Например:
- ^ • <?,
/ - — ; /, - — ; и т.д., Л, </0
где i p - индивидуальный индекс пошлины (иска); i q - индивидуальный индекс количества дел (нотариальных, иско
вых и пр.);
83
pi и ро - размер пошлины (иска) соответственно в отчетном и базисном
периодах, руб; qi и q 0 - количество дел (нотариальных, исковых и пр.) соответст
венно в отчетном и базисном периодах, ед.
Существуют цепные и базисные индивидуальные индексы. В цепных индексах каждый последующий период сравнивается с предыдущим, например:
Р : ( Ю Л Р2ОО2 р 2 0 0 [
; ; ; и т . д . Р2002 Р2001 Р2000
В базисных индексах каждый последующий период сравнивается с одним начальным периодом, взятым за базу сравнения, например:
Poo Poo Poo Роо
Нетрудно заметить, что перемножение цепных индексов дает в итоге сравнение явления за весь исследуемый период:
р2()<14 Р20П4 Л Р2(Ю1 . p2 (Hi2 „ р 2 ( Ю ]
5р *Р Ф Р2000 Р20ОЗ Р2002 P2001 Р2000
Естественно, если в задаче известен базисный индекс и какие-то из цепных, то для нахождения других цепных индексов необходимо производить деление.
Если в задаче требуется найти абсолютное изменение какого - либо явления, то оно определяется как разность между числителем и знаменателем индекса:
(Pi — Ро); (qi-qo) и т.п. Если при этом ставится задача определить, как влияет это изменение
на какое - то многофакторное явление, то найденная разность между числителем и знаменателем качественного индекса (пошлин, иска и пр.) умножается на соответствующий количественный фактор (количество нотариальных, исковых и пр. дел) на уровне отчетного периода. Разность между числителем и знаменателем количественного индекса дел (нотариальных, исковых и пр.) умножается на соответствующий качественный фактор (размер пошлины, иска и пр.) на уровне базисного периода:
84
(pi - Po) 4i ~~ изменение объема (нотариальных, исковых и пр.) дел в денежном выражении от снижения (повышения) размера пошлины (иска);
(чл - %>) Ро ~ изменение объема (нотариальных, исковых) дел в денежном выражении от снижения (увеличения) количества дел (нотариальных, исковых и пр.).
В отличие от индивидуальных индексов, сводные индексы представляют собой результат сравнения сложных явлений, состоящих из непосредственно несоизмеримых элементов. Сводные индексы представляют собой соотношение сумм произведений индексируемых величин и их со-измерителей. Название сводного индекса определяется изменяющимся (индексируемым) показателем. Индексируемый показатель записывают в числителе на уровне отчетного периода, в знаменателе - на уровне базисного периода.
Исходя из этого сводные индексы запишутся следующим образом: 1) сводный индекс пошлин (иска)-
и - ^ ,
2) сводный индекс количества дел (нотариальных, исковых и пр.) -
3) сводный индекс объема дел (нотариальных, исковых) в денежном выражении -
1ЧР ,
Индекс пошлин (иска) относится к индексу постоянного состава, так как q=const. Индекс количества дел (нотариальных, исковых) относится к индексу структурных сдвигов, так как учитывается изменение по видам дел. Индекс объема дел (нотариальных, исковых) в денежном выражении относится к индексу переменного состава, т.к. меняются обе составляющие (и размер пошлины и количество дел).
В статистическом анализе используется взаимосвязь индексов переменного, постоянного составов и структурных сдвигов, которая проявляется в виде двух свойств индексов.
85
Первое свойство индексов. Индекс переменного состава равен произведению индексов постоянного состава и структурных сдвигов:
Iqp - lq 1 P , — - — — .
Z -̂fr Z -̂fr Z ^ Второе свойство индексов. Разность числителя и знаменателя индек
са переменного состава равна сумме разностей числителя и знаменателя индексов постоянного состава и структурных сдвигов:
Zfrfr ~Zg°A = Z ^ A ~ Z ^ , Z^fr "Zg-A
Рассмотрим пример совершения различных нотариальных дел и обложения их госпошлинами (табл. 10.1).
Таблица 10.1 Данные о совершении различных нотариальных дел
и обложении их госпошлинами
Виды дел Количество нотариальных дел
Пошлина, руб Виды дел
Базисный период (q0)
Отчетный период (q0
Базисный период (р„)
Отчетный период (р,)
А 540 850 10 25 Б 420 750 15 26 В 460 640 12 24
Рассчитаем индивидуальные индексы нотариальных дел и индивидуальные индексы пошлин.
Индивидуальные индексы по соответствующим видам нотариальных дел составят:
. = _ ^ _ = 8 5 0 * 1 0 0 о / о = 1 5 7 4 о / о
q 540
</, _ 7 5 0 * , п п о / _ с, 420
100%-178,6%
86
= ^ = ^ ; П 0 0 о / о = 1 3 9 1 % п" q: 460
То есть в отчетном периоде по сравнению с базисным дел вида А рассмотрено больше на 57,4% (157,4-100); дел вида Б - на 78,6% (178,6-100); дел вида В - н а 39,1% (139,1-100).
Индивидуальные индексы пошлин по соответствующим видам нотариальных дел составят:
/ = — * Ю 0 % = 250,0%
26 /' = — * Ю 0 % = 173,3%
15
/ = — * 100% = 200.0% ; 12
То есть пошлина по нотариальному делу вида А в отчетном периоде по сравнению с базисным увеличилась на 150% (250,0-100); вида Б - на 73,3% (173,3-100); вида В - на 100% (200,0-100).
Индивидуальные индексы конкретного вида нотариальных дел в стоимостном выражении соответственно составят:
Up . =^JLL = — ~ * Ю0% = 2 1 2 5 0 * 100% = 393,5% 5400
Up , = ^ i £ X = ~ * i o o % = J ^ ^ * i o o % = 309,5% 6300
uiP = = v ' v *" * 100% - * i oo% - 278,3% 5520
Таким образом, в денежном выражении объем нотариальных дел вида А в отчетном периоде по сравнению с базисным периодом увеличился на 293,5% (393,5-100); вида Б - на 209,5% (309,5-100); вида В - на 178,3% (278,3-100).
Для того чтобы ответить на вопрос, как изменился объем всех видов нотариальных дел в денежном выражении в отчетном периоде по сравне-
Ч Pi 850 * 25
Я0Р0 540*10
750*26
чпр„ 420*15
640*24 460*12
87
нию с базисным периодом, необходимо рассчитать сводные индексы количества нотариальных дел, пошлин и сводные индексы объема нотариальных дел в денежном выражении.
Сводный индекс объема нотариальных дел в денежном выражении составит:
= = 850 * 25 + 750 * 26 + 640* 24 = 56110 , , ^ =
qjl> 540 * 10 + 420 * 15 + 460 * 12 17220
Aqp = 56110-17220 = 3SS90 руб.
Сводный индекс количества нотариальных дел составит:
= Z M l = 850*10 + 750*15 + 640*12 = 27430 , , ^ % _ J^qvpc 540*10 + 420*15 + 460*12 17220
Aqp.,0 = 27430 -17220 = \02\0 руб.
Сводный индекс пошлин составит:
= 850 * 25 + 750 ̂ 26 + 640 * 24 = 56110 , , 0 Q % =
£ q{ р,. 850 * 10 + 750 * 15 + 640 * 12 27430
Aqpy;i) = 56110 - 27430 = 28680/П'б.
Используя первое свойство индексов, получим: Jpq — Jq * Jp\
325,8 - 1,593 * 2,046 * 100%
Используя второе свойство индексов, получим: Aqp = Aqp^+AqpKr)\
38890=10210 + 28680. Таким образом, можно сделать вывод: объем нотариальных дел в де
нежном выражении в отчетном периоде по сравнению с базисным периодом возрос на 225,8% (325,8-100) или на 38890 руб. (56110-17220), в том числе за счет увеличения количества нотариальных дел на 59,3% (159,3-100) объем нотариальных дел в стоимостном выражении возрос на 102210
88
руб. (27430-17220) и за счет увеличения пошлин на 104,6% (204,6-100) объем нотариальных дел в денежном выражении в отчетном периоде по сравнению с базисным периодом увеличился на 28680 руб. (56110-27430).
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Каково назначение индекса в статистике? 2. В чем назначение индивидуальных и сводных индексов в статистике? 3. Какая величина называется индексируемой? 4. Как формируются цепные и базисные индексы? 5. Что представляют собой индексы переменного состава, постоянного состава и структурных сдвигов? 6. В чем заключаются два свойства индексов, используемые в статистическом анализе?
Тема 11. Взаимосвязи экономических явлений
Основные теоретические вопросы
Изучение взаимосвязей между явлениями - важнейшая задача научного анализа.
Виды и формы взаимосвязей. Задачи статистики в изучении и измерении взаимосвязей. Важнейшие методы статистики, применяемые в анализе взаимосвязей
между явлениями: • метод аналитических группировок; • графический метод изображения и анализа взаимосвязей. Корреляционный метод анализа взаимосвязей между явлениями. Уравнение регрессии как форма аналитического выражения взаимо
связей. Выбор уравнения взаимосвязи. Отбор взаимосвязанных признаков. Интерпретация уравнения регрессии. Показатели тесноты связи.
89
Линейный коэффициент корреляции. Корреляционное отношение.
Методические указания
При изучении взаимосвязей между экономическими явлениями выделяют факторные и результативные признаки. Факторным признаком является то, который влияет и обуславливает изменение результативного признака. Результативный признак - тот, который изменяется под влиянием факторного признака.
Различают два вида взаимосвязей экономических явлений: функциональные и корреляционные.
При функциональных связях каждому значению факторного признака соответствует вполне определенное значение результативного признака. Функциональные связи можно формализовать, т.е. представить в виде формулы. Например, стоимость совершенных нотариальных актов находится в функциональной связи с количеством нотариальных дел и размера пошлины.
При функциональных связях применяется индексный метод анализа. При корреляционных связях отдельным значениям факторного при
знака может соответствовать несколько значений результативного признака. Корреляционная связь проявляется при большом числе наблюдений в виде определенной зависимости между средним значением результативного признака и факторным признаком. В корреляционной зависимости находится, например, уровень преступности от ряда факторов: уровня алкоголизма и наркомании, социальной принадлежности (рабочие, служащие, учащиеся и т.п.). В данном случае построить функцию зависимости результативного признака от факторного без применения специального математического аппарата не представляется возможным.
При корреляционных связях применяется корреляционный метод анализа.
Связи между явлениями бывают прямые и обратные. При прямых связях с увеличением (уменьшением) факторного признака результативный увеличивается (уменьшается). В прямой зависимости находится, например, количество преступлений от состояния алкогольного опьянения.
90
При обратных связях с увеличением (уменьшением) факторного признака результативный уменьшается (увеличивается). В обратной зависимости находится, например, количество преступлений от уровня социального благосостояния населения.
По аналитическому выражению связи бывают прямолинейные и криволинейные. Прямолинейные связи выражают уравнением прямой. Криволинейные связи выражают уравнением параболы или гиперболы.
Особую трудность для усвоения представляет корреляционный метод анализа. Корреляционный анализ взаимосвязи между явлениями проводят в три этапа. На первом этапе осуществляется выбор формы связи между факторным и результативным признаками, т.е. выбирается тип аналитической функции. На втором этапе осуществляется решение аналитического уравнения связи путем нахождения его параметров. На третьем этапе определяется теснота связи между изучаемыми явлениями.
Прежде чем подробно остановиться на каждом из трех этапов корреляционного анализа, обратим внимание на следующее.
В том случае, когда определяется влияние одного фактора на результативный признак, строится однофакторная регрессионная модель (парное уравнение корреляции); когда определяется влияние двух и более факторов на результативный признак, строится многофакторная регрессионная модель (уравнение множественной корреляции).
При подборе факторов для регрессионной модели следует помнить, что факторы не должны находиться в функциональной связи с результативным признаком. В противном случае должен применяться индексный метод анализа, а не корреляционный. Следует также знать, что число наблюдений для построения однофакторной регрессионной модели должно быть не менее 10 - 12.
На первом этапе корреляционного анализа для определения формы связи между факторным и результативным признаками, т.е. для установления типа аналитической функции связи, применяют различные статистические методы. Так, характер и направление связи между изучаемыми экономическими явлениями можно установить, применяя метод статистических группировок. С помощью данною метода наличие связи между явлениями устанавливается визуально.
91
Для выявления тенденции изменения результативного признака при изменении факторного могут использоваться такие статистические методы, как метод укрупнения интервалов, метод скользящей средней, метод аналитического выравнивания. Чаще всего для установления формы зависимости между факторным и результативным признаками применяют графический метод.
1) При прямолинейной форме зависимости между факторным и результативным признаками функция связи имеет вид прямой
2) при параболической форме - вид параболы
у у - <г/. + ахх + clx2
3) при гиперболической форме - вид гиперболы а х
На втором этапе корреляционного анализа осуществляют решение аналитического уравнения связи путем нахождения его параметров ао, Е],. . . , а„
Параметр а 0 означает влияние на результативный признак не включенных в регрессионную модель факторов. Как правило, экономической интерпретации параметр а 0 не подлежит. Параметры а ь а п - коэффициенты регрессии, означают величину результативного признака при изменении факторного признака на единицу измерения.
В случае прямолинейной формы зависимости параметры аналитиче
ского уравнения связи уу=а11+ах находятся путем решения следующей
системы уравнений: аип + а^х = ^у,
В случае параболической формы зависимости параметры аналитиче
ского уравнения связи vv = а(1 +alx + a2x2 находят путем решения следую
щей системы уравнений:
92
л„ x •*+«i Z * ~ + a 2 Z * 3 = Z •x--v'
Z - ^ + ^ Z - ^ + ^ Z * = Z j f > ' '
В случае гиперболической формы зависимости параметры аналитиче-С1\
ского уравнения у х = ао + — находятся путем решения следующей системы А*
уравнений: г 1
cV/ + tf,Z- = Z > ' '
^ o Z ~ + t / i Z ~ " Z ~ > -X А'~ А
Для экономической интерпретации аналитического уравнения связи можно воспользоваться также коэффициентом эластичности, который рассчитывается по формуле:
Э = а.
Коэффициент эластичности показывает, на сколько процентов в среднем изменяется результативный признак при изменении факторного на 1%.
На третьем этапе корреляционного анализа осуществляют оценку тесноты связи между факторным и результативным признаками с помощью показателей тесноты связи.
В случае линейной связи между факторным и результативным признаками производят расчеты линейного коэффициента корреляции по следующей формуле:
. _ ХУ ~ ХУ
Линейный коэффициент корреляции варьирует в пределах от - 1 до +1. Положительное его значение говорит о прямой связи, отрицательное -об обратной. Близость к нулю говорит о слабой связи, близость к ±1 говорит о существенной связи, при г=±1 связь функциональная.
93
В случае криволинейной зависимости (параболической, гиперболической) тесноту связи между факторным и результативным признаками определяют с помощью корреляционного отношения но формуле:
- V
Рассмотрим на конкретном примере применение корреляционного метода в изучении взаимосвязи экономических явлений.
Пример. По данным табл. 11.1 построить аналитическое уравнение связи и определить тесноту связи между явлениями.
Таблица 11.1 Исходные данные для построения аналитического
уравнения связи месяцы 1 4 7 10 Числен
ность безра
ботных в Рес
публике Беларусь в 2007 г.
(х), тыс. чел.
184.8 83.2 178.0 72.9 165.2 157.4 151.1 45.6 140.2 133.9
Число совер
шенных краж (у)
4259 5508 6213 5836 5872 4255 4342 4605 5219 5368
Определим форму зависимости числа совершенных краж от уровня безработицы, используя графический метод (рис. 11.1).
94
Число краж
6500 "
6000 -
5500 -
5000 -
4500 _
4000
(Y)
тыс.чел.
130 140 150 160 170
— Эмпирическая линия регрессии 180 190 (х)
Теоретическая линия регрессии
Рис. 11.1 Зависимость числа совершенных краж от уровня безработицы
Судя по распределению, зависимость прямолинейная. Как известно, прямолинейная зависимость подчиняется уравнению
прямой у у = с/,, + а х.
Следовательно, параметры данного уравнения связи находятся путем решения следующей системы уравнений:
а ^ х + а^х2 = ^ху;
Для решения системы построим вспомогательную таблицу 11.2.
95
Таблица 11.2 Расчетные данные для построения аналитического
Месяцы Численность безработных (х), тыс.чел.
Число краж (у)
х 2
У, =
3638,8+ +9,359х
1 184,8 4259 18139081 787063,2 34151,1 5368,3
2 183,2 5508 30338064 1009065,6 33562,2 5353,4
3 178,0 6213 38601369 1105914,0 31684,0 5304,7
4 172,9 5836 34058896 1009044,4 29894,4 6257,0
5 165,2 5872 34480384 970054,4 27291,0 5184,9
6 157,4 4255 18105025 669737,0 24774,8 5111,9
7 151,1 4342 18852964 656076,2 22831,2 5052,9
8 145,6 4605 21206025 670488,0 21199,4 5001,5
9 140,2 5219 27237961 731703,8 19656,0 4950,9
10 133,9 5368 28815424 718775,2 17929,2 4892
Итого 1612,3 51477 269835193 8327921,8 262973,3 51477,5
На основе данных табл. 11.2 имеем систему уравнений в следующем
виде:
10а 0+ 1612,3 а! = 51477, 1612,3a0 + 262973,3ai= 8327921,8;
96
^ 1612,3а,, + 259951,1а, = 8299636,7, |l612,3a«, + 262973,3а, = 8327921,8;
3022,2а, =28285,1; а,=9,359;
10а«,+ 1612,3:9,359 = 51477; 10а(>+ 15089,5 = 51477; 10а,, = 51477- 15089,5;
36387,5 S o = ;
10 а() = 3638,8.
Следовательно, найденное аналитическое уравнение связи имеет вид: 7̂ = 3638,8 + 9,359л:;
Подставим соответствующие значения х в уравнение и найдем новые значения у х . Так
у* = 3638,8 + 9,359* 184,8 = 5368,3;
Ух2 = 3638,8 + 9,359* 183,2 = 5353,4;
УхЪ = 3638,8 + 9,359* 178,0 = 5304,7;
Уха = 3638,8 + 9,359* 172,9 = 6257,0;
= 3638,8 + 9,359* 165,2 = 5184,9;
Ух6 = 3638,8 + 9,359* 157,4 = 5111,9;
УХ1 = 3638,8 + 9,359* 151,1 = 5052,9;
У* = 3638,8 + 9,359* 145,6 = 5001,5;
Ух9 = 3638,8 + 9,359* 140,2 = 4950,9;
Ух1 , =3638 8 + 9,359 * 133,9 = 4892;
97
Изобразим по найденным значениям у х теоретическую линию регрессии, которая, как видно с некоторыми погрешностями воспроизводит эмпирическую линию регрессии (см. рис. 11.1).
Так как = Х > 4 т о м о ж н о считать, что построенное парное уравнение корреляции является искомым и мы вправе сделать следующий вывод: с увеличением числа безработных на каждую тысячу человек число краж возрастает в среднем на 9,359.
Как было ранее сказано, экономическая интерпретация аналитического уравнения связи может осуществляться с помощью коэффициента эластичности. Расчетная величина коэффициента эластичности:
Таким образом, увеличение безработицы на 1% приводит к увеличению числа краж на 0,293%.
Как было сказано ранее, для установления тесноты связи между факторным и результативным признаками в случае линейной зависимости применяется линейный коэффициент корреляции.
Рассчитаем величину линейного коэффициента корреляции:
Э = ^ - = 9,359*
У
1612,3:10 51477:10
= 0.293.
г -ху - ху
2>>' _ 8327921,8 п ~ 10
- _ _ 1612,3
832792,2;
161,2; п 10
- _ Х > ' _ 51477 -5147,7; п 10
5147J 2 = V484704 = 696,2;
832792,2-161,2*5147,7 = 0,242.
17,7*696,2
98
Как видно, связь между числом совершенных краж и уровнем безработицы недостаточно тесная (при /• =-» ±1).
Для установления размера вариации числа краж от уровня безработицы рассчитаем коэффициент детерминации;
Kd = г2 * 100% = 0,2422 * 100% = 5,9%.
Следовательно, на 5,9% вариация совершенных краж объясняется уровнем безработицы.
Анализ взаимосвязи между явлениями можно также проводить по сгруппированным данным, представленным в виде корреляционной таблицы. Приведем пример корреляционной таблицы, характеризующей связь между стажем работника и его заработной платой (табл. 11.3).
Таблица 11.3 Корреляционная таблица
Стаж Годовая заработная плата (у), тыс.руб.
работы работы (х), лет 40-50 50-60 60-70 70-80 80-90 90-100 100-110 Итого
0-5 5 7 14 8 1 35 5-10 3 4 10 5 2 1 25 10-15 2 4 9 2 17 15-20 3 2 5 1 11 20-25 3 3 1 7 25-30 5 5
Итого п х 5 10 20 25 20 15 5 100
Корреляционная таблица показывает, что частоты (численность рабочих) концентрируются главным образом у диагонали. Это значит, что связь между стажем работника и его заработной платой прямая, то есть с увеличением стажа заработная плата возрастает. Характер линейной зависимости более четко прослеживается на графике (рис. 11.2).
99
100
90
80
70
60
50
40
30
Стаж работы, лет
10 15 20 25 30
Рис. 11.2 Поле корреляции и эмпирическая линия регрессии
Для построения эмпирической линии регрессии рассчитаны средние показатели заработной платы по каждой из шести групп работников, выделенных по стажу работы:
— 45*5 + 55*7 + 65* 14 + 75*8 + 85 *1 2205 }\ = = = 63
5 + 7 + 14 + 8 + 1 35 Аналогично рассчитаны средние показатели заработной платы по дру
гим группам работников. Результаты расчетов следующие:
V, = 75,8; >\ = 82,6; у 4 = 88,6; v , = 92,1; у6 = 95,0;
На рис. 11.2 очевидна прямолинейность зависимости заработной пла
ты работников от стажа работы на предприятии. Такую зависимость мож
но выразить уравнением прямой у х = а0
100
Для построения уравнения зависимости, то есть нахождения его параметров а ( | и аь необходимо решить систему нормальных уравнений с использованием метода наименьших квадратов:
Для этого построим вспомогательную таблицу для х (табл. 11.4). Таблица 11.4
Данные для нахождения значений х в уравнении связи
2,5 7,5 12,5 17,5 22,5 27,5 Итого
35 25 17 11 7 5 100 хп х 87,5 187,5 212,5 192,5 157,5 137,5 975 х 2 п х 218,7 1406,3 2656,3 3368,8 3543,8 3781,3 14975,2
В табл. 11.4 в качестве х берутся средние значения х в интервалах 0 + 5 ^ с 5 + 10 п с группировки: х1 = = 2,5;*, = = 7,5 и т.д. Умножая наиденные груп-
повые средние х на численность каждой группы п х получим хп х в пределах данной группы. Суммируя полученные величины по группам, получим общую ^хпу =975, которая и будет выступать в качестве ^ л - в решении
системы уравнений.
Суммируя величины х"пх по группам, получим общую ^ V / 7 v = 14975,2.
Эта суммарная величина будет выступать в качестве для решения
системы уравнений. Построим вспомогательную таблицу для у (табл. 11.5). В табл. 11.5 в качестве у берутся средние значения у в интервалах
40 + 50 Л е 50 + 60 е с „
группировки, а именно: у, = — - — = 45; у , = — - — = 55 и т.д. Умножая наи
денные групповые средние у на численность каждой группы п у, получим
уп у в пределах данной группы. Суммируя полученные величины по груп
пам, получим общую ^ > 7 ? v =7600. Эта суммарная величина и будет вы
ступать в качестве ^ у в решении системы уравнений.
101
Таблица 11.5 Данные для нахождения значений у в уравнении связи
У 45 55 65 75 85 95 105 Итого
% 5 10 20 25 20 15 5 100 упу 225 550 1300 1875 1700 1425 525 7600
">
у-п у
10125 30250 84500 140625 144500 135375 55125 600500
пху 562,5 2200 5850 14812,5 18275 29212,5 7612,5 78525
Несколько сложнее с ^ху. Но если интервалы группировки малы, то
можно считать значения х для всех единиц в рамках группы одинаковыми. Умножив средние значения х в интервалах группировки на соответствующие средние значения у и на численность данной группы, получим пху в пределах данной группы. Так, по данным табл. 11.3:
(nxy)i=2,5 * 5 *45 = 562,5; (пху)2=2,5*7*55+7,5*3*55=2200
и т.д. Сумма полученных значений по группам дает общую величину = 78525.
Подставим найденные значения и систему уравнения и решим ее:
^ 100а 0+ 975а, = 7600, * 955а 0+ 14975,2а, = 78525;
< - 9 5 5 3 0 + 9311,33! = -72580, 955а„ + 14975,2а, =78523;
5663,9а, = 5945; а,=1,05;
| l00au+975ai*l,05= 7600,
102
100а«= 7600-1023,8;
а 0 = 65,8. Следовательно, аналитическое уравнение связи заработной платы ра
бочих и стажа их работы имеет вид; г у = 65,8 + 1,05*. На основе данного
уравнения связи можно сделать вывод: с увеличением стажа работы на 1 год заработная плата увеличивается на 1,05 тыс. руб.
Рассчитаем тесноту связи между х и у с помощью линейного коэффициента корреляции:
г = ^ = ^ . 2 5 - 9 , 7 5 * 7 6 = 44Д5_ , ^ =
<то\, 7.4*15,1 111,74
— У * у 78525 х\> = = 785,25;
// 100
- 2 > 7600 I' = = = 76;
и 100
- Ух 975 * = ==- = = 9,75;
п 100
1 1 о-,. = V . v " - r =15,1;
Таким образом, заработная плата работников на 39,6% зависит от стажа их работы на предприятии.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Какие различают два вида взаимосвязей изучаемых явлений? 2. Какие выделяют связи по направлению и в чем их сущность? 3. Какие существуют методы изучения взаимосвязи изучаемых явлений? 4. В чем сущность корреляционного метода анализа? 5. Что характеризуют линейный коэффгщиент корреляции и корреляционное отношение; каково их применение?
103
6.Каковы особенности проведения корреляционного анализа по сгруппированным данным?
Тема 12. Выборочное наблюдение
Основные теоретические вопросы
Понятие выборочного наблюдения. Необходимость и условия применения выборочного наблюдения. Теоретические основы выборочного наблюдения. Генеральная и выборочная совокупности и их обобщающие характе
ристики. Способы отбора единиц из генеральной совокупности. Индивидуальный и групповой отбор. Повторный и бесповторный отбор. Виды выборки. Собственно случайная выборка. Механическая выборка. Типическая выборка. Серийная выборка. Ошибки выборочного наблюдения. Определение предельной ошибки выборки для средней и частоты (до
ли). Определение необходимой численности выборки. Практика применения выборочного исследования в статистике.
Методические указания
Выборочным наблюдением называется такое наблюдение, при котором обследованию подвергается некоторая часть совокупности, а обобщающие показатели, характеризующие эту исследуемую совокупность, распространяются на всю совокупность в целом.
Проведение выборочного наблюдения обуславливается тремя мотивами:
104
1. Выборочное наблюдение обладает рядом преимуществ перед сплошным: дает большую экономию сил и средств; значительно экономится время для проведения обследования; представляется возможным значительно расширить программу статистического наблюдения, то есть сделать ее более детальной. К выборочному исследованию статистики прибегают также тогда, когда необходимо уточнить результаты сплошного наблюдения.
2. Когда проводится контроль качества разрушающими методами. Например, испытание деталей (узлов) по прочностным параметрам, в результате которого устанавливаются предельные прочностные показатели, а деталь разрушается.
3. Когда невозможно провести сплошное наблюдение по времени и объему.
Всю массу единиц изучаемого объекта называют генеральной совокупностью. Совокупность единиц, отобранных для выборочного наблюдения, называют выборочной совокупностью.
Обозначим: N - число единиц, входящих в генеральную совокупность; п - число единиц, входящих в выборочную совокупность; хча2 - соответственно средняя величина и дисперсия в выборочной
совокупности;
x,al - соответственно средняя величина и дисперсия в генеральной
совокупности; р - доля признака в генеральной совокупности (генеральная доля); q - доля единиц, не обладающих определенным признаком (является
дополнением генеральной доли до единицы). Сумма обеих долей составляет 1, то есть р\ q = 1;
W - отношение числа единиц, обладающих определенным признаком выборочной совокупности к общей численности выборочной совокупности (выборочная доля).
Рассмотрим пример. Численность студентов, обучающихся на потоке, составляет 200 человек (табл. 12.1). Определить успеваемость студентов на потоке и долю студентов, имеющих хорошие или отличные оценки в порядке 20% выборки.
105
Таблица 12.1 Распределение студентов по балльной оценке
Оценки (баллы) Число студентов, чел. Неудовлетворительно (2) 20
Удовлетворительн (3) 90 Хорошо(4) 60
Отлично (5) 30 Итого 200
Определим по исходным данным генеральной совокупности средний балл студентов по формуле:
£* /w 2*20 + 3*90 + 4*60 + 5*30 Л" =
т 20 + 90 + 60 + 30 = 3,5, балла.
Доля студентов, имеющих хорошие и отличные оценки, составляет 60 + 30
Р = 200 -0,45
Осуществим отбор студентов для выборочной совокупности в порядке 20% выборки (табл. 12.2).
Таблица 12.2 Распределение студентов по балльной оценке
Оценки (баллы) Число студентов генеральной совокупности,
чел.
Число студентов, отобранных в выборочную совокупность,
чел.
Неудовлетворительно (2)
20 5
Удовлетворительно (3) 90 15
Хорошо (4) 60 13 Отлично (5) 30 7
106
Итого 200 40
По отборочным данным выборочной совокупности определим выборочную среднюю х и выборочную долю W. Показатели соответственно составят:
^ 2 * 5 + 3*15 + 4*13 + 5*7 , е е
х = 3,55 ; 40
13 + 7 ^0 40 40
В порядке 20% выборки получили те лее самые результаты, что и при использовании данных генеральной совокупности.
В теории выборочного наблюдения есть такое понятие, как ошибка выборки. Ошибкой выборки (репрезентативности) называют отклонение выборочных характеристик от генеральных.
Основной вопрос выборочного метода заключается в том, насколько выборочная средняя отличается от так называемой генеральной средней, т.е. как велика ошибка репрезентативности.
Теория вероятностей дает математические формулы, позволяющие установить, в какой степени возрастает достоверность наших выводов по мере увеличения числа наблюдений. Имеющиеся формулы позволяют подсчитать, какое именно количество наблюдений (объем выборки) необходимо произвести, чтобы ошибка репрезентативности, т.е. разность между выборочной и генеральной средней, не выходила за определенные, заранее установленные пределы колебаний. И наоборот, эти формулы дают возможность определить, какие колебания выборочной средней, т.е. возможная ошибка, будут иметь место при данном числе наблюдений.
Для определения средней ошибки репрезентативности, обозначаемой в статистике //, рекомендуется пользоваться следующими двумя формулами:
1) при определении среднего размера изучаемого количественного признака -
\ст~ а V п Jn
2) при определении доли качественного признака -
где // - средняя ошибка репрезентативности;
107
а2 - показатель пестроты, колеблемости количественного признака, т.е. среднеквадратическое отклонение;
п - число единиц, попавших в выборку; Р - доля данного качественного признака в выборке; (1 - Р) - доля противоположного признака.
Напомним, что в практике криминологических исследований доминирующее значение имеет изучение качественных признаков, и следовательно, наиболее часто должна применяться вторая формула, которая, как покажем далее, весьма доступна и не требует каких-либо сложных расчетов.
Приведем условный пример. Предположим, имеется совокупность в 6500 заключенных. В порядке
случайной выборки обследовали 900 заключенных и установили следующие показатели:
1) средний возраст заключенного (X) - 30 лет; 2) показатель колеблемости или пестроты возраста заключенных, т. е.
среднеквадратическое отклонение (<т)— 9 лет; 3) доля заключенных, совершивших преступление в состоянии опья
нения, (Р) -0,8 или 80%. Требуется определить среднюю ошибку репрезентативности: а) при установлении среднего возраста заключенных; б) при определении доли заключенных, совершивших преступление в
состоянии опьянения. Средняя ошибка репрезентативности (//) при установлении среднего
возраста определяется по формуле: а
т.е. здесь необходимо среднеквадратическое отклонение разделить на корень квадратный из числа единиц, попавших в выборку. Как известно, сг = 9 годам, а п = 900 человек. Следовательно,
9 9 // = , = — = О^года
V900 30
Значит, при определении среднего возраста заключенных мы могли допустить среднюю ошибку репрезентативности в 0,3 года в ту или другую сторону, т. е. этот средний возраст во всей генеральной совокупности (6500 человек) находится в пределах х = Х±ц или 30 + 0,3,т.е. от 29,7 до
108
30,3 года. Средняя ошибка репрезентативности при установлении доли заключенных, совершивших преступление в состоянии опьянения, определяется по формуле:
Как известно, Р = 0,8 и п = 900. Следовательно,
= 0,8(1-0,8) = 0 ^ 0Д6 = OA = , 3 % =
V 900 V 900 V 900 30
Отсюда 1доля заключенных, совершивших преступление в состоянии опьянения, во всей генеральной совокупности (6500 человек) будет равна P = P + jLt = 80%+ 1,3%,т.е. находится в пределах от 78,7% до 81,3%.
Итак, мы определили возможные размеры ошибки репрезентативности, и, казалось бы, проблема нахождения критерия точности выборочного обследования полностью решена. Но это далеко не так, ибо пока не установлен практически очень важный вопрос о том, какова вероятность того, что ошибка репрезентативности не будет в нашем примере более 0,3 года в первом случае и 1,3% во втором? Для ответа на этот вопрос теория статистики на основе соответствующих расчетов устанавливает, что вероятность отклонения выборочной средней или доли от генеральной в пределах вычисленной однократной ошибки (ti) равна 0,683, в пределах двукратной (t2) - 0,954, трехкратной (t3) - 0,997 и т.д. (Для установления необходимого значения вероятности, соответствующей определенному кратному значению желаемой меры точности, в статистике существуют специальные таблицы). Следовательно, в нашем примере вычисленная ошибка репрезентативности (ti) гарантируется с вероятностью, равной лишь 0,683, которую, предположим, мы считаем недостаточной. Для того, чтобы повысить размер гарантии в отношении полученных результатов, надо раздвинуть пределы возможной ошибки. Возьмем двукратную ошибку (12), т.е. 0,3 * 2 = 0,6 лет. Тогда для нашего примера средний возраст заключенных, установленный на основе выборки и равный 30 годам, будет находиться в пределах от 29,4 года до 30,6 лет (30 лет ±0,6 года), что гарантируется с вероятностью 0,954. Аналогично решается вопрос о пределах возможной ошибки при установлении доли заключенных, совершивших преступление в состоянии опьянения. При 1> эта ошибка будет равна 1,3*2 или 2,6%. Следо-
109
вательно, с вероятностью 0,954, т.е. практически почти с полной уверенностью, можно утверждать, что доля заключенных, совершивших преступление в состоянии опьянения, установленная на основе нашей выборки и равная 80%, будет находиться в пределах от 77,4% до 82,6% (80% ± 2,6%).
Таковы в самом элементарном виде основные положения теории статистики о возможных размерах ошибки репрезентативности и о технике ее вычисления. Добавим только следующее. Прежде чем приступить к проведению выборочного наблюдения, надо установить необходимую численность выборки. Это очень важный вопрос. Действительно, сколько, например, заключенных надо подвергать анкетному опросу или каков процент уголовных дел следует исследовать, чтобы получить на основе этой выборки вполне типичные, характерные для всей совокупности заключенных или уголовных дел показатели. Ясно, что излишняя численность выборки вызовет ненужный перерасход сил и средств и, наоборот, ее недостаточность приведет к очень большим ошибкам репрезентативности.
Из приведенных выше формул легко установить, какое количество единиц (в нашем примере заключенных или уголовных дел) надо наблюдать, чтобы ошибка выборки не превышала заранее установленного, приемлемого для вас размера. Эти формулы, как было выяснено выше, имеют следующий вид:
Нас интересует в данном случае вопрос - как определить численность выборки, т.е. п? Ясно, что если мы возведем в квадрат обе части равенства как первой, так и второй формулы (чтобы освободиться от корня), то численность выборки будет легко установлена. В первом случае (при определении среднего размера количественного признака) // = и во втором
Другими словами, для установления численности выборки необходимо среднеквадратическое отклонение разделить на квадрат намеченного размера ошибки. Чтобы гарантировать полученные на основе такой выборки результаты с определенной вероятностью, надо при проведении расчетов учитывать показатель t, о котором мы уже говорили.
(при определении доли качественного признака) п Р(1-Р)
п о
Особый практический интерес представляет формула для определения необходимой численности выборки при установлении доли качественного признака.
Пример. Предположим, имеется группа заключенных за убийство в 3500 человек. Ставится задача - путем выборочного обследования этой группы установить мотивы совершения убийств, т.е. долю корысти, ревности, мести и т.п. Спрашивается, какое количество заключенных (п) надо обследовать, чтобы ошибка выборки (//) не превышала 3%? Как мы только что говорили, для решения данной задачи надо использовать формулу
Р(\-Р) гт // = —^—-. Практически наиоолынее затруднение при применении этой
формулы вызывает то обстоятельство, что в момент проектирования выборочного обследования нам неизвестно значение среднеквадратического отклонения, т.е. числитель приведенной формулы. Между тем, без знания Р(1-Р) невозможно определить численность выборки. Как же выйти из создавшегося положения? Мы учитываем, что максимальное значение среднеквадратического отклонения при определении доли качественного признака равно 0,25 (25%). Это мы и возьмем в качестве Р(1-Р).
Оно вполне гарантирует нам положительные результаты выборки, численность которой, согласно условиям задачи, будет теперь определена следующим образом:
Р{\-Р) 0,25 0,25 // = —win = = 2ЬЬчеяовек /Г 0,03- 0,0009
Таким образом, из группы заключенных в 3500 человек (генеральная совокупность) надо подвергнуть обследованию 266 человек, чтобы полученные на основе этой выборки результаты по установлению доли отдельных мотивов убийств колебались в пределах 3%. Другими словами, результаты между выборочной и генеральной совокупностями будут отличаться на ±3%. Напомним, что возможность такой однократной ошибки (tj) равна 0,683. Если данная возможность представляется нам недостаточной, мы можем, увеличив численность выборки, гарантировать любую желаемую нам возможность (например, увеличив численность выборки в четыре раза, мы гарантируем точность полученных результатов с вероятностью в 0,954, т. е. почти с достоверностью).
i l l
Следует иметь в виду, что для облегчения довольно громоздких расчетов, связанных с применением указанных формул, что обычно отпугивает лиц, далеких от математики, в частности юристов, существуют специальные таблицы с уже готовыми результатами применительно к конкретным условиям проводимого выборочного наблюдения. Эти таблицы, делающие излишними какие-либо расчеты, удобны, и они должны найти самое широкое применение в практике криминологических исследовании.
Приведем для ясности некоторые выдержки из двух таких таблиц с небольшими комментариями (табл. 12.3; табл. 12.4). Первая таблица служит для ответа на вопрос, в каких пределах может колебаться показатель, полученный на основе данной численности выборки, т.е. какова достоверность этого показателя. Вот как выглядит часть такой таблицы.
Таблица 12.3 Предельные ошибки при заданном числе наблюдений
При величине показателя,%
Число наблюдений При величине показателя,% 100 200 300 400 500 600 700 800 900
10 6,0 4,3 3,5 3,0 2,7 2,5 2,3 2,1 2,0 15 7,2 5,1 4,1 3,6 3,2 2,9 2,7 2,5 2,4 20 8,0 5,7 4,6 4,0 3,6 3,3 3,0 2,8 2,7 30 9,2 6,5 5,3 4,6 4,1 3,7 3,5 3,2 3,1 35 9,6 6,8 5,5 4,8 4,3 3,9 3,6 3,4 3,2 40 9,9 7,0 5,6 4,9 4,4 4,0 3,7 3,5 3,3 45 10,0 7,1 5,7 5,0 4,5 4,1 3,8 3,5 3,3 55 10,0 7,1 5,7 5,0 4,5 4,1 3,8 3,5 3,3 65 9,6 6,8 5,5 4,8 4,3 3,9 3,6 3,4 3,2 70 9,2 6,5 5,3 4,6 4,1 3,7 3,5 3,2 3,1 75 8,7 6,2 5,0 4,3 3,9 3,5 3,3 3,1 2,9 80 8,0 5,7 4,6 | 4,0 3,6 | 3,3 3,0 2,8 2,7
Как же пользоваться этой таблицей?
Пример. Предположим, на основе обследования 100 осужденных за хулиганство мы установили, что 80% из них совершили преступление в состоянии опьянения. Насколько точен этот показатель? Ответ на дан-
112
ный вопрос дает только что приведенная таблица, где на пересечении горизонтальной последней строчки (80) с вертикальной первой графой (100) мы находим число 8,0. Это означает, что при данном числе наблюдений (100 человек) доля осужденных, совершивших хулиганство в состоянии опьянения, может колебаться в пределах от 72 до 88% (80%±8%). Отметим, что все показатели таблицы вычислены с вероятностью 0,954, т. с. с учетом удвоенной ошибки (t = 2). Как видно из таблицы, путем увеличения численности выборки можно уменьшить ошибку до любого желаемого предела (при увеличении, например, числа наблюдений со 100 осужденных до 400 ошибка выборки будет уменьшена в два раза - с 8 до 4% - см. табл. 12.3).
На вопрос о том, какое минимальное число наблюдений надо производить, чтобы ожидаемый показатель колебался в заданных пределах, отвечает табл. 12.4.
Приведем пример определения численности выборки на основе таблицы. Предположим, требуется узнать, сколько нужно обследовать осужденных за хулиганство, чтобы выяснить среди них долю лиц, совершивших преступление в состоянии опьянения. Предел ошибки при нашем обследовании должен быть не более 4%. Па основе предварительного ознакомления с различными материалами (статистическая отчетность, показатели прошлых обследований, судебная практика и пр.) мы считаем, что ожидаемая доля составит примерно 80%. Тогда из последней строки таблицы мы видим, что величине показателя в 80%) с пределом ошибки в 4% соответствует число 400. Значит, в данном случае надо обследовать минимум 400 человек осужденных.
В статистике применяется несколько видов выборки. Вид выборочного наблюдения определяется способом отбора. Из генеральной совокупности можно отбирать единицы в индивидуальном порядке. При индивидуальном отборе выборочная совокупность образуется путем последовательного отбора отдельных единиц. Индивидуальный отбор организуется в порядке случайного отбора, типического и механического. Отбор единиц, проводимый в случайном порядке, называется случайным отбором. Выборка, производимая в порядке индивидуаль-
113
ного случайного отбора из генеральной совокупности, называется случайной выборкой.
Таблица 12.4 Значение предельных ошибок
При величине показателя, % Предельные ошибки, % При величине показателя, % 1 2 3 4 5 10
10 3600 900 400 230 150 37 20 6400 1600 710 400 260 65 40 9600 2400 1070 600 390 97 45 9900 2500 1100 620 400 100
55 9900 2500 1100 620 400 100
65 9100 2300 1010 570 370 92 70 8400 2100 930 530 340 85 80 6400 1600 710 400 260 65
Отбор единиц из генеральной совокупности, разбитой на однородные типические группы, называется типическим отбором, а выборка, основанная на таком отборе, называется типической выборкой. Отбор единиц из генеральной совокупности может производиться механически через определенный интервал, а выборка в таком случае носит название механической.
Вместе с индивидуальным отбором в статистике имеет место серийный (гнездовой) отбор, когда из генеральной совокупности для выборочного исследования отбираются не отдельные единицы, а целые группы.
Существуют повторный и бесповторный отборы. Отбор, называется повторным, если единица или серия, попавшая в выборку, при одном извлечении из жребия не устраняется из дальнейшей жеребьевки, то есть каждый раз жеребьевка производится из всей массы генеральной совокупности. При таком отборе каждая единица может попасть в выборку несколько раз. Повторный отбор еще называют возвратным.
Бесповторным отбором называют такой отбор, при котором один раз отобранная и зарегистрированная единица из отбора устраняется. Повтор-
114
ный и бесповторный отборы производят при проведении случайной, типической и серийной выборок. При механической выборке проводят только бесповторный отбор.
Рассмотрим более подробно каждый вид выборки. Случайная выборка - отбор единиц производится случайным образом в
порядке жеребьевки. Оценка точности случайной выборки осуществляется по следующим формулам (табл. 12.5).
Механическая выборка - отбор единиц из генеральной совокупности проводится механически через интервал, который определяется по формуле N —. Механический отбор осуществляется из списка единиц, расположенных в п
алфавитном порядке, географическом или из ранжированного списка единиц, расположенных в порядке возрастания или убывания. Механическая выборка является более репрезентативной (представительной) по сравнению со случайной, так как дает, как правило, более близкое распределение отобранных единиц к распределению единиц в генеральной совокупности. Таблица 12.5
Формулы предельной ошибки случайной выборки
Способы отбора
Предельная ошибка выборка
Способы отбора При определении среднего значения
признака При определении доли
Повторный, если известны
( 7 2 И Р если известны
а2 и W V п K = l \ W i l - W )
Бесповторный, если известны
а2 и Р если известны
а2 и W
* . = J - o - V > V п N
" у п N) Бесповторный, если известны
а2 и Р если известны
а2 и W V п /V
Формулы ошибок механической выборки (бесповторный отбор): - при определении среднего значения признака
115
при определении доли \W(i-W)
Типическая выборка — генеральная совокупность разбивается на однородные типические группы по какому-либо признаку, а затем из каждой типической группы отбор единиц производится в порядке случайной или механической выборки. При этом, если число единиц, которое должно попасть в выборку от каждой типической группы, определяется пропорционально численности единиц в каждой группе, такая выборка называется пропорциональной.
Так, если число единиц генеральной совокупности — N , число единиц в каждой типической группе соответственно - N i , N2, ... N k , а объем выборочной совокупности - п, то число единиц, попавших в выборку от каждой типической группы, 111,112,... определяется по формуле:
tu = N - п- N N
где N - удельный вес каждой типической группы в генеральной со
вокупности;
— - пропорции отбора.
Типическая выборка дает более точные результаты по сравнению со случайной или механической выборкой вследствие того, что она обеспечивает представительство выборочной совокупности различных типов единиц, имеющихся в генеральной совокупности. Оценка точности типической выборки осуществляется по формулам в табл. 12.6.
Таблица 12.6 Формулы предельной ошибки типической выборки
Способы отбора Предельная ошибка выборки
Способы отбора При определении среднего значения признака При определении доли
Повторный А „ = ^ ( , - " ; )
116
Бесповторный Бесповторный
V ti л A , = / f ( , - ^ 0 - f . ) V /1 Д'
Серийная выборка в отличие от других видов выборки предполагает отбор единиц сериями или гнездами. Серии состоят из единиц, связанных между собой или территориально (например, населенный пункт, район, область и т.п.), или во времени (например производство продукции за данный период времени).
Серии отбирают в случайном порядке или механически. Точность серийной выборки зависит от того, насколько хорошо средние показатели серии будут репрезентировать генеральную совокупность. Оценка точности серийной выборки осуществляется по формулам в табл. 12.7.
Введем обозначения: г - число серий выборочной совокупности; R - число серий генеральной совокупности;
- межгрупповая (межсерийная) дисперсия.
Таблица 12.7 Формулы предельной ошибки серийной выборки
Способы отбора
Предельная ошибка выборки
Способы отбора При определении среднего
значения признака При определении доли
Повторный
Бесповторный
117
При планировании выборочного наблюдения необходимо определить численность выборки. Необходимая численность выборки определяется по формулам в табл. 12.8.
Таблица 12.8 Формулы определения необходимой численности выборки
Способы отбора Предельная ошибка выборки
Способы отбора При определении среднего значения признака
При определении доли
Повторный Га- „ = ГРЧ
Бесповторный t2o2N „ _ >V/<v
Бесповторный A\.N + t2(72 Д;.ЛГ + Г pq
Расчет по данным формулам нередко затрудняется из-за отсутствия значения генеральной дисперсии. В этом случае используют данные пробного выборочного наблюдения, на основе которого определяют приближенные размеры дисперсии.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Каше формы несплошного наблюдения применяются в статистике? 2. Какие существуют формы выборочного наблюдения в зависимости от способа отбора единиц выборочной совокупности? 3. Что такое предельная ошибка выборки и от чего зависит ее величина? 4. Как определяется предельная ошибка выборки при различных способах отбора?
118
Список литературы
1. Альбом наглядных пособий по общей теории статистики. - М.: Финансы и статистика, 1991.
2. Венецкий И.Г., Венецкая В.И. Основные математико - статистические понятия и формулы в экономическом анализе. - М.: Статистика, 1979.
3. Горемыкина Т.К. Общая теория статистики: Учебное пособие. -М.:МГИУ, 1998.
4. Горемыкина Т.К. Графические методы в экономических исследованиях: Учебное пособие. - М.:МГИУ, 1996.
5. Королев Ю.Г. Метод наименьших квадратов в социально - экономических исследованиях. -М.:Статистика, 1980.
6. Практикум по теории статистики: Учебное пособие /Под ред. Шмойловой Р.А. - М.: Финансы и статистика, 1998.
7. Статистический словарь /Главный редактор М.А.Королев. - М.: Финансы и статистика, 1989.
8. Теория статистики / Под ред. Р.А.Шмойловой. - М.: Финансы и статистика, 1998.
9. Экономика и статистика фирм: Учебник/ Под ред. С.Д. Ильенковой — М.: Финансы и статистика, 1998.
10. Горемыкина Т.К. Теория статистики. Учебное пособие - М.: МГИУ, 1996.
119