МАТЕМАТИЧНА ТЕОРІЯ ВИБІРКИ

Preview:

DESCRIPTION

Сучасні інформаційні технології у вищій школі. Лекція 1. МАТЕМАТИЧНА ТЕОРІЯ ВИБІРКИ. К афедр а інформаційних технологій доцент Бесклінська О.П. Зміст Вступ 1. Предмет і задачі математичної статистики. 2. Первинна обробка статистичних даних. 3. Графічне зображення варіаційних рядів. - PowerPoint PPT Presentation

Citation preview

1

МАТЕМАТИЧНА ТЕОРІЯ ВИБІРКИ

Лекція 1

Кафедра інформаційних технологій доцент Бесклінська О.П.

Сучасні інформаційні технології у вищій школі

2

Зміст

Вступ1. Предмет і задачі математичної статистики.2. Первинна обробка статистичних даних.3. Графічне зображення варіаційних рядів.

3

Вступ

Математична статистика - це розділ математики, що вивчає методи збору, систематизації і обробки результатів спостережень масових випадкових явищ з метою виявлення існуючих закономірностей.

Слово статистика походить від латинського слова "статус" (status) – стан.

4

В наш час статистика складається з таких розділів:

1.   Збір статистичних даних, тобто відомостей, що характеризують окремі одиниці будь-яких масових сукупностей.

2.   Статистичне дослідження одержаних даних, що складається у виявленні тих закономірностей, які можуть бути встановлені на основі даних масового спостереження.

3.   Розробка заходів статистичного спостереження і аналізу

статистичних даних. Цей розділ складає зміст математичної статистики.

5

Збір статистичних даних про населення провадився вже у 2238 р. до нашої ери в Китаї при імператорі Яо. Перепис населення провадився також у древньому Єгипті, Ірані, Римській імперії. Пізніше у 1245 р. - в Росії.

Яо 堯 2353— 2234 роки до н. е.

6

В початковий період розвитку математичної статистики велике значення мали праці А.Кетле (1796-1874), Ф.Гальтона (1822-1911) і особливо К.Пірсона (1857-1936). Подальший розвиток цієї науки пов`язаний з іменами П.Л. Чебишева (1821-1894), А.А.Маркова (1856-1922), О.М. Ляпунова (1857-1918), А.М.Колмогорова (1903-1983), О.Я.Хінчіна (1894-1959), С.Н.Бернштейна (1880-1968), В.І. Романовського (1879-1954), М.В.Смірнова (1900-1966), Є.Є.Слуцького (1880-1948), Б.В. Гнеденко (1912-1995), Ю.В. Лінніка (1915-1972).

Розвиток математичної статистики в інших странах пов'язаний з такими вченими, як Ст`юдент (В.С.Госсет), Р.Фішер, Е.Пірсон, В.Феллєр, Д.Дуб, Г.Крамер, Ю. Нейман, А.Вальд.

7

1. Предмет і задачі математичної статистики

Прийоми і засоби наукового аналізу даних, масових явищ, з метою визначення деяких узагальнюючих ці дані характеристик і виявлення статистичних закономірностей і складають предмет математичної статистики.

8

Основні задачі математичної статистики

1. Оцінка невідомого закону розподілу

2. Оцінка невідомих параметрів розподілу

3. Перевірка статистичних гіпотез

9

2. Первинна обробка статистичних даних

Якщо статистична сукупність поєднує всі однорідні об‘єкти, що мають дану кількісну або якісну ознаку, то таку сукупність називають генеральною сукупністю. Генеральна сукупність може мати як скінчену так і нескінчену кількість одиниць. Якщо генеральна сукупність нескінчена або досить велика, то дослідженню підлягає деяка її частина, яка називається вибірковою сукупністю або вибіркою.

10

Кількість об'єктів вибіркової сукупності (або генеральної сукупності ) називають

об'ємом вибірки (або генеральної сукупності).

Вибірка повинна достатньо повно відображати властивості всіх об'єктів

генеральної сукупності, тобто повинна бути репрезентативною.

11

Вибір елементів може бути: простим (вибірковим), наприклад, за списком; типовим, тобто за якимись ознаками; механічним, наприклад, кожен 100-й об'єкт; серійним, тобто якась окрема партія.

12

Статистичний метод дослідження загальних властивостей генеральної сукупності на основі вивчення властивостей лише її окремої частини називається вибірковим методом.

Значення xi (i=1,...,n) випадкової

величини , які створюють вибірку називають варіантами.

Якщо варіанти розташувати у порядку зростання їх значень, то вони створюють дискретний варіаційний ряд.

13

Приклад 1.1. У вірші Т.Г.Шевченко підрахувати кількість букв у словах і побудувати варіаційний ряд кількості букв у словах:

І небо невмите, і заспані хвилі;І понад берегом геть-гетьНеначе п’яний очеретБез вітру гнеться. Боже милий!Чи довго буде ще меніВ оцій незамкнутий тюрмі,Понад оцим нікчемним моремНудити світом? Не говорить,Мовчить і гнеться, мов жива,В степу пожовклая трава;Не хоче правдоньки сказати,А більше ні в кого спитати.

14

Розв'язання. Нехай xi - кількість букв у

словах . Маємо послідовність значень: 1,4,7,1,7,5,1,5,7,4,4,6,5,6,3,5,7,4,5,2,5,4,2,4,1,4,

11,5,5,4,9,5,6,6,2,8,7,1,7,3,4,1,5,9,5,2,4,10,7,1,6,2,1,4,7.

Можливими значеннями xi є дискретні

величини: 1,2,3,4,5,6,7,8,9,10,11. Ці величини і утворюють варіаційний ряд.

15

Якщо підрахувати, скільки раз зустрічається кожна варіанта, то ми отримаємо частоти.

Кожній варіанті можна поставити у відповідність не частоту, а відношення відповідної частоти до об'єму сукупності. Ці числа називають частостями, або відносними частотами.

16

Позначимо: m*i - частоти;

– частості (або відносні частоти);

k – кількість різних варіант.

n

mp i

i

n mii

k

1

17

18

В залежності від того, які значення може приймати ознака, варіаційні ряди поділяють на дискретні і неперервні (інтервальні) .Означення. Варіаційний ряд називається дискретним, якщо значення ознаки відрізняються одне від одного не менш як на деяку сталу величину, і неперервним, якщо значення ознаки можуть відрізнятись одне від одного на як завгодно малу величину.

19

Кількість інтервалів можна підрахувати за формулою Стерджеса:

k=1+3,222 lgn.

20

Алгоритм складання групованого статистичного ряду (угрупування).

1. Розмах вибірки: R = xmax - xmin;

2. Крок інтервалу (його довжину):

де k-кількість інтервалів.3.Частоту mi

*

4. Відносну частоту 5. Накопичувану відносну частоту 6. Середини інтервалів (ai-1,ai)

k

Rh

n

mp i

i

**

k

jj

p1

*

2

* 1 iii

aax

21

3. Графічне зображення варіаційних рядів

Полігон частот (полігон відносних частот) - це ламана з вершинами у точках (xi*, mi*) або (xi*, pi*).

22

Гістограма – сукупність прямокутників, в основі яких знаходятся інтервали угрупування (ai=ai-ai-1), а площі цих прямокутників

дорівнюють відносним частотам pi*.

S=pi

23

Кумулянта (полігон відносних накопичених частот) – ламана з вершинами у точках

(ak; ), або (ak; ),

k

jjm

1

k

jjp

1

*

24

Огіва – сукупність прямокутників, в основі яких знаходяться інтервали угрупування, а площі цих прямокутників дорівнюють відносним накопичуваним частотам.

25

Питання для самоперевірки

1.Предмет і задачі математичної статистики.

2. Що таке вибірка? Що таке генеральна сукупність?

3.Первинна обробка статистичних даних. Як скласти угрупування?

4.Графічне зображення варіаційних рядів (полігон частот, гістограма, кумулянта, огіва)

Recommended