41
ЗМІСТ Лекція 2. Числові характеристики робочих процесів. 2 2.1. Систематизація та формалізація експериментальних даних............................... 2 2.2. Статистичні числові характеристики...........7 2.3. Оцінка статистичних характеристик...........13 2.4. Розподіли неперервних і дискретних величин. .15 2.4.1. Розподіл і функції розподілу........15 2.4.2. Нормальний закон розподілу...........17 2.4.3. Біноміальний розподіл..................20 2.4.4. Розподіл Пуассона......................22 1

DOE Lekcia02

Tags:

Embed Size (px)

DESCRIPTION

Планування експериментуЛекція 2

Citation preview

Page 1: DOE Lekcia02

ЗМІСТ

Лекція 2. Числові характеристики робочих процесів................................2

2.1. Систематизація та формалізація експериментальних даних..............2

2.2. Статистичні числові характеристики...................................................7

2.3. Оцінка статистичних характеристик..................................................13

2.4. Розподіли неперервних і дискретних величин..................................15

2.4.1. Розподіл і функції розподілу...................................................15

2.4.2. Нормальний закон розподілу...................................................17

2.4.3. Біноміальний розподіл................................................................20

2.4.4. Розподіл Пуассона.......................................................................22

1

Page 2: DOE Lekcia02

Лекція 2. Числові характеристики робочих процесів

2.1. Систематизація та формалізація експериментальних даних

До робочих процесів належать різноманітні природні, технічні та

технологічні процеси. Сутністю експериментального вивчення цих процесів є

відповідність між теоретичними і практичними результатами.

Поняття експеримент безперервно розвивається, виникають нові його

різновиди. У загальному вигляді науковий експеримент – це процес, в якому

матеріально-практична і науково–пізнавальна діяльність людини поєднана.

Основні різновиди експерименту: реальний, мислений, модельний. У свою

чергу, модельні експерименти поділяються на фізичний, математичний,

імітаційний. Чіткої межі між ними немає. За своєю сутністю всі три методи

передбачають вивчення не реального явища, а його моделі з імітацією

відхилень від найбільш імовірних значень параметрів, які характеризують це

явище. Для кожної області робочих процесів класифікація експериментів

може продовжувати ланку.

Якого б гатунку не проводився експеримент, результат кожного

випробування (спостереження чи досліду) називають подією. Якщо відомо,

що подія напевно відбудеться, її називають вірогідною. Між вірогідною

подією та її антиподом і одночасно різновидом – подією неможливою,

лежать дві групи непередбачених подій: випадкові й невизначені.

Досить правдоподібно, що зі збільшенням числа дослідів частота

спостережуваної події незначно і несистематично змінюватиметься. Важливо

також, щоб частота настання спостережуваної події в контрольованій сотні

була близькою до частоти цієї ж події не лише в даній тисячі, а й у решті

дослідів. Лише тоді, коли подія, яка вивчається, має такі властивості, її

можна назвати випадковою. Випадкові події – основний об'єкт теорії

ймовірностей і одного з її розділів – математичної статистики. Про подію,

2

Page 3: DOE Lekcia02

яка підлягає описаним вище вимогам, говорять, що вона має статистичну

стійкість.

Невизначеність – досить широке поняття, яке відображає об’єктивну

неможливість отримати абсолютне знання про внутрішні та зовнішні умови

їх функціонування, неоднозначність параметрів. Невизначеність, пов’язана з

можливістю виникнення в ході реалізації конкретного проекту

несприятливих ситуацій і наслідків, характеризується наявністю

економічного ризику і потребує свого урахування. Невизначені події з

математичних позицій вивчаються в теорії ігор.

Систематизацію дослідних даних проводять у будь-якому виробничому

процесі. Час від часу спостерігаються відхилення від норм, заданих

технологічним регламентом. Для контролю за ходом процесу, поліпшення

його техніко-економічних показників вимірюють найважливіші змінні

процесу. Утворені дані використовують при оперативному керуванні цим

процесом, а також накопичують для наступного аналізу. При цьому

ставляться і вирішуються такі питання:

Чи не виходять змінні за допустимі межі?

Яка тенденція зміни даних у часі?

Які змінні і в якій мірі впливають на задані техніко-економічні

показники?

Які заходи мають бути вжиті для поліпшення згаданих показників?

Якщо керування процесом здійснюється вручну, ці питання часто

вирішуються інтуїтивно, на основі досвіду оперативного персоналу. Для

автоматизованого керування перш за все їх треба перевести на формальну

математичну мову і вибрати необхідні технічні засоби для реалізації.

Для задовільного розв'язання поставлених задач треба накопичити цілий

ряд даних, систематизувати їх і провести аналіз здобутих результатів.

Наприклад, досвідчений апаратник не змінюватиме відразу режим роботи

апарату при відхиленні одного з параметрів від норми, а дістане нові дані,

щоб переконатися у вірогідності відхилення або виявити тенденцію зміни 3

Page 4: DOE Lekcia02

цього параметра. Використання результатів спостережень для аналізу

виробничої ситуації та прийняття доцільного рішення якраз і становлять

досвід апаратника.

Закономірності, які лежать в основі того чи іншого процесу, оформлені у

вигляді математичних залежностей, дають змогу здійснити автоматизацію

керування. Якщо ці залежності є розв'язком оптимізаційної задачі,

з'являється можливість реалізувати відповідну математичну модель, вести

процес оптимальним способом.

Для розв'язання поставлених задач виробничнику і досліднику треба

накопичити цифровий матеріал. Зрозуміло, що він не відображає всієї

інформації про робочий процес. Замість генеральної сукупності даних мають

справу з деякою її частиною, яку називають вибіркою. Розглядувані події

випадкові і прагнуть до однакової закономірності окремого й загального. При

цьому вибірка є невпорядкованим рядом чисел. Для подальшої роботи

зібрані дані треба систематизувати, узагальнити за характерними ознаками,

перетворюючи у статистичні ряди розподілу.

Якщо треба з'ясувати закономірності поведінки змінних у часі, тобто

вирішити питання динаміки робочого процесу, то за даними вибірки будують

часовий статистичний ряд розподілу. При цьому цифровий матеріал

розміщують обов'язково в хронологічному порядку з групуванням за

певними проміжками часу. Ці проміжки вибирають так, щоб якомога чіткіше

підкреслити тенденцію зміни досліджуваних змінних. Час сам по собі рідко

впливає на функцію відклику, аналіз і планування таких експериментів

проводять за особливими правилами. Частіше у робочих процесах час

впливає через численні фактори, наприклад у зв'язку з несталістю,

лабільністю фізичних і фізико–хімічних характеристик сировини або готової

продукції. При цьому часові статистичні ряди не будують; зміни

характеристик і функції відклику називають дрейфом, який враховують.

Проводячи аналіз з метою визначення точності вимірювань впливу на

приріст, стійкість, якість, цифровий матеріал (вибірку), здобутий за певний 4

Page 5: DOE Lekcia02

проміжок часу, розміщують за числовими значеннями, визначаючи частоту

або число повторень кожного значення розглядуваної змінної незалежно від

того, в які моменти даного проміжку часу спостерігалися ці значення. Ряди

даних, оброблених таким чином, називають рядами розподілу, або

варіаційними рядами. Вони демонструють розмах і порядок відхилень тієї чи

іншої змінної, що характеризує технологічний процес від заданого значення.

Кожне значення х ряду часто називають варіантою.

Ряди розподілу складають так, щоб вибірка розміщувалася у порядку

зростання або спадання. Після цього упорядковані значення змінних

групують в інтервали. Межі інтервалів вибирають так, щоб будь-які значення

х можна було віднести з певністю до того чи іншого інтервалу. Для цього

межі виражатимуться числами з кількістю значущих цифр на одну більшу,

ніж у х.

При визначенні числа інтервалів міркують так: при малому числі

інтервалів можна втратити характерну деталь розподілу, при великому –

затушувати загальну картину невеликими випадковими відхиленнями. На

практиці встановлено доцільні співвідношення між чисельністю значень N,

які групуються, змінної х і числом інтервалів k.

Число інтервалів оцінюється обчисленням кореня квадратного із

загального числа значень змінної, причому воно не повинно бути меншим

п'яти і більшим двадцяти. Для попереднього визначення числа інтервалів

може бути використана також емпірична формула

k=1+3.2lg N

з округленням до найближчого цілого.

Ширина інтервалу d найчастіше зберігається однаковою для всіх

інтервалів і визначається як

5

Page 6: DOE Lekcia02

d=xmax−xmin

k

де xmax , xmin – максимальне і мінімальне значення членів ряду. Отже,

ширина інтервалу d має ту ж розмірність, що й змінна х.

Число повторень Nx кожного значення х у варіаційному ряду

називається частотою. За частоту, яка відповідає m-му інтервалу, беруть суму

частот Nm членів ряду, які потрапили в цей інтервал. Відношення Nm до

загальної чисельності значень змінної (обсягу вибірки) N, тобто Nm/N,

називається відносною частотою pm. Відношення N/d називається густиною

частоти, а величина pm/d – густиною відносної частоти. Частоти Nx і Nm – цілі

числа, вимірювані в штуках. Величини Nm/N вимірюються у частках одиниці,

a Nm/d i pm/d мають розмірність, обернену розмірності основної змінної х.

При аналізі рядів розподілу розглядають взаємозв'язок двох змінних:

значень членів ряду і відповідних частот або відносних частот. Цей

взаємозв'язок називають статистичним розподілом вибірки (ряду).

Статистичний розподіл задається у вигляді послідовності інтервалів і

відповідних частот та зображується графічно у вигляді полігонів і гістограм

розподілу. Площа гістограми частот дорівнює сумі всіх частот, тобто обсягу

вибірки, а площа гістограми відносних частот – сумі всіх відносних частот,

тобто одиниці. На рисунку 2.1 зображено полігон і гістограму.

Рисунок 2.1 – Полігон та гістограма розподілу

Розподіли частот, здобуті експериментально, піддаються випадковим

коливанням, хоча сполучення значень змінних в інтервали пом'якшує такий

6

Page 7: DOE Lekcia02

недолік даних. Якщо змінні можуть набувати тільки цілих значень, то ряди

розподілу таких змінних, які називають дискретними, подаються

гістограмами або полігонами.

Рисунок 2.2 – Гістограма і згладжувана крива розподілу

Якщо ж змінні можуть набувати значень з як завгодно малими

приростами, то ряди розподілу таких безперервних змінних будуються з

інтервалами такої малої ширини, що ламана лінія, обмежуюча площу

розподілу, на межі перетворюється в плавну криву. Крива розподілу

згладжує ламану лінію, замикаючу полігон, підкреслює характерні риси

розподілу та виявляє його закономірність. Утворені внаслідок згладжування

частоти (ординати кривої) називаються теоретичними або згладженими.

Крива розподілу може бути виражена аналітично, тобто за допомогою

математичної формули, що дає можливість визначити ті проміжні значення,

які були відсутні серед вихідних даних. На рисунку 2.2 зображено гістограму

і згладжувану криву.

2.2. Статистичні числові характеристики

Побудова кривих розподілу дає змогу дістати початкову уяву про

характер, структуру розглядуваного ряду значень змінних. Для детального

вивчення властивостей змінних слід визначити їх узагальнюючі числові

характеристики: середнє значення та міру розкиду (розмір відхилення від 7

Page 8: DOE Lekcia02

середнього значення). Розподіл частот може бути задано однозначно за

допомогою них двох величин. При статистичних обчисленнях користуються

різними видами середніх: середнім арифметичним, середнім геометричним,

медіаною тощо. Для результатів, які порівнюються між собою, слід

користуватися одним і тим же середнім.

Якщо у розглядуваній вибірці окремі елементи не повторюються, то

кожен з них впливає на середнє однаково і таке середнє називають простим.

Якщо ж у вибірці деякі елементи повторюються, причому частота

повторення різна, то на середнє впливають як значення, так і частота всіх

елементів. Середнє, обчислене з урахуванням частоти (ваги) кожного

елемента, називають зваженим. Середні позначають рисочкою над

відповідним символом елемента: х, у та ін.

Просте середнє арифметичне х дорівнює сумі елементів вибірки,

поділеної на їх число (обсяг вибірки) N:

x=x1+x2+…+x N

N=∑i=1

N

xi

N

Якщо елементи вибірки x1, x2, …, xk мають відповідно частоти N1, N2, …,

Nk, то

x=N1 x1+N2 x2+…+N k xk

N1+N 2+…+N k

=∑i=1

k

N i x i

N,

тобто зважене середнє арифметичне дорівнює сумі добутків елементів

вибірки на їх ваги, що відповідають частотам.

Середнє арифметичне має такі властивості:

1) середнє арифметичне суми дорівнює сумі середніх арифметичних

доданків;

2) множник або дільник, однаковий для всіх елементів вибірки, при

обчисленні середнього арифметичного можна винести за знак середнього;

3) сума додатних відхилень елементів від їх середнього арифметичного

дорівнює сумі від'ємних відхилень;

8

Page 9: DOE Lekcia02

4) середнє арифметичне добутків елементів дорівнює добутку середніх

арифметичних цих елементів.

Часто доводиться уточнювати обчислене середнє арифметичне за

новими утвореними даними. При цьому зручно користуватись рекурентною

формулою для обчислення середнього арифметичного xN для вибірки з N

елементами, якщо відомо попереднє середнє xN-1 і результат нового

вимірювання xN

xN=xN−1+1N

( xN−xN−1 )

Якщо побудовано варіаційний ряд, тобто визначено середини інтервалів

xm та їх кількість k з відповідними частотами Nm або відносними частотами

pm, то середнє арифметичне обчислюється за формулами:

x= 1N∑m=1

k

xmNm ;x=∑m=1

k

xm pm

Середнє арифметичне не можна обчислювати з розподілу, що має кілька

максимумів. При його обчисленні ні в якому разі не можна без аналізу

відкидати найвище та найнижче випадаючі вимірювання, інакше середнє

виявиться грубою помилкою. Середнє арифметичне погано зображує ряд

значень х при розкиданих даних, нерівномірному поділі осі графіка

розподілу частот, а також якщо значення вимірювань при розподілі за часом

мають тенденцію до зростання чи спадання.

Середнє арифметичне, утворене за даними однієї вибірки, називається

вибірковим середнім і зображує певне число. Якщо для обчислення середньої

використати інші вибірки з тієї ж генеральної сукупності, то вибіркова

середня змінюватиметься від вибірки до вибірки. Середнє арифметичне є

статистичною характеристикою названої сукупності. Якщо вимірюванню

підлягає стала величина, то середнє арифметичне є наближенням до

справжнього значення цієї величини. Справді, чим більше число елементів у

вибірці, тим більше обчислене середнє наближається до середнього всієї

сукупності.

9

Page 10: DOE Lekcia02

Крім середнього арифметичного, при аналізі експериментальних даних

використовують середнє геометричне xгеом. , яке є додатним значенням кореня

N-го ступеня з добутку елементів вибірки x1, x2, …, xk :

xгеом=+N√x1 x2 ,…, xN

Середнє геометричне зручніше обчислюється за формулою

lg xгеом=lg x1+lg x2+…+lg xN

N

Середнє геометричне більш точний показник, ніж середнє арифметичне,

коли доводиться характеризувати зміну ознак за часом, але при цьому

повинна мати місце геометрична прогресія. Чисельне значення xгеом завжди

дещо менше, ніж xa, а якщо вимірювання провадяться з досить високою

точністю, то ця різниця невелика, і як наближеною характеристикою

динаміки користуються середнім арифметичним, яке простіше обчислити.

Для характеристики невеликої серії вимірювань (N < 10)

використовують серединне значення або медіану x м. Для визначення медіани

результати вимірювань упорядковуються за значенням, тобто будується ряд з

N елементів так, що x1 < x2 < …< xN. Якщо N – непарне число, то x м дорівнює

серединному елементу (члену) ряду. При парному числі спостережень

медіана дорівнює середньому арифметичному двох серединних значень

елементів упорядкованого за значеннями ряду спостережень. Медіана, на

противагу арифметичному середньому, є невідчутною до крайніх (таких, що

різко відрізняються) значень елементів ряду. Це має значення, коли елементи

на початку і в кінці зростаючого ряду мають меншу точність відносно решти,

проте немає достатніх підстав для того, щоб відкинути будь-які з них. За цих

умов медіана є надійнішою, ніж середнє арифметичне.

При обчисленні середнього гармонічного використовують обернені

значення змінної

xгарм=N /∑i=1

N

( 1x i )

10

Page 11: DOE Lekcia02

Якщо треба визначити зважене середнє гармонічне, то 1/xi множать на

Ni.

Якщо змінна може бути використана для обчислення площі то більш

точною її характеристикою буде середнє квадратичне значення:

xкв=√∑i=1

N

x i2

N

Аналогічно середнє кубічне обчислюють, якщо змінна має об'ємну

ознаку.

xкуб=3√∑i=1

N

x i3

N

При обчисленні зважених середніх у цих випадках треба помножити Ni

на x i2 і відповідно на x i

3.

Як зазначалося раніше, змінні відносно середнього мають відхилення

(розкид) у той чи інший бік. Мірами розкиду значень змінних відносно

середнього є розмах R, середнє квадратичне відхилення (СКВ) S та

коефіцієнт варіації V.

Розмах R (розмах коливань, варіаційний розмах) визначається як різниця

між найбільшим xmax і найменшим xmin значеннями змінного:

R=xmax−xmin

Як міру розкиду найчастіше використовують СКВ S, яке обчислюється

за формулами

S=√∑i=1

N

(x i−x )2

N−1

Або

S=√ NN−1

(∑i=1

N

x i2

N−x2)

При великому значенні N користуються спрощеною формулою

11

Page 12: DOE Lekcia02

S=√∑i=1

N

x i2

N−x2

Величина, яка дорівнює квадрату СКВ, називається дисперсією, D=S2.

Обчислення дисперсії для змінних, поданих у вигляді ряду розподілу з

числом елементів N, може виконуватися з використанням значень частот Nm

або відносних частот pm і xm – значень середин усіх інтервалів, число яких k.

Для цього обчислюється x, після чого визначається дисперсія D за

формулами

D= 1N−1

∑m=1

k

Nm (xm¿ −x )2

або

D= NN−1

∑m=1

k

Nm (xm¿ −x )2 pm

У практичних розрахунках використовують також спосіб

обчислення дисперсії відліком від умовного середнього А0:

D=∑m=1

k

( x¿−A0

d )2

Nm

N−1d2−(x−A0 )2

Дисперсія має такі основні властивості :

Дисперсія суми змінних дорівнює сумі дисперсій кожної із змінних

D (х + у) = D (х) + D (у). Ця властивість називається адитивністю і

використовується в дисперсійному аналізі.

Дисперсія сталої величини С дорівнює нулю, тобто D (С) = 0.

Дисперсія добутку змінної х на сталу величину С дорівнює добутку

дисперсії цієї змінної на квадрат сталої величини: D (С • х) = D (х) С2.

Якщо значення змінної х зменшити на сталу величину С, то дисперсія не

зміниться D (х – С) = = D (х). Ця властивість випливає із властивостей 1 і 2.

Якщо обчислення СКВ або дисперсій проводиться для різних вибірок,

змінні яких мають різні розмірності, при порівняльній їх оцінці слід

12

Page 13: DOE Lekcia02

користуватися коефіцієнтом варіації V, який дорівнює відношенню СКВ до

середнього значення ряду і виражений у процентах:

V= Sx∙100

2.3. Оцінка статистичних характеристик

Чисельне значення змінної, що визначає випадкову подію як наслідок

досліду або спостереження, називається випадковою величиною. Статистичні

характеристики змінних також можна визначити як чисельні значення, що

відповідають випадковим подіям, і віднести до випадкових величин. Тому в

загальному випадку випадкова величина – це деяка функція випадкової події.

Так, обчислюючи S, D та V за N даними, дістанемо статистичні

характеристики конкретної вибірки. Тому зазначені величини, а також

розглянуте раніше x є вибірковими характеристиками або оцінками

справжніх значень статистичних характеристик генеральної сукупності.

Вибіркові характеристики змінюються від вибірки до вибірки, їх можна

розглядати як випадкові величини, оскільки кожна з них є кількісним

результатом досліду або розрахунку, який точно передбачити не можна. Він

описується лише імовірнісними законами.

Ймовірністю р (х) зазначеного результату х називається границя

відношення числа випадків Nm, які дали результат х, до числа всіх

рівнозначних випадків N при N, яке прямує до нескінченності. Очевидно,

p ( x )= limN →∞

pm= limN→∞

N m

N

Слід зазначити, що наявність указаної границі, а отже, і ймовірності

постулюється; тому відомі властивості ймовірностей (ймовірність вірогідної

події дорівнює 1, неможливої – 0, випадкової – лежить між 0 та 1, двох

несумісних подій – дорівнює сумі ймовірностей кожної з них) називають

аксіомами ймовірності.

13

Page 14: DOE Lekcia02

Аналогія між частотами та ймовірностями дає змогу визначити

математичне сподівання змінної М як її найбільш ймовірне значення:

M=∑ x p (x)

Найчастіше у цьому рівнянні ряд сходиться і математичне сподівання

змінної дорівнює граничному значенню середнього арифметичного. Процес

обробки вимірювань не вважатиметься закінченим після того, як знайдено

середнє значення вимірюваної величини (математичне сподівання) і

обчислено міру розкиду відносно цього середнього (S або D). Треба оцінити

точність та надійність здобутих результатів, використовуючи при цьому

ймовірнісний підхід.

Введемо загальне позначення А̂ для вибіркових статистичних

характеристик (оцінок x або D) та А – для справжніх значень цих

характеристик. Задача зводиться до відшукання такого числа δА, при якому

інтервал (А ± δА) охопить невідоме справжнє значення А з досить великою

ймовірністю γ.

Інтервал А ± δА називається надійним інтервалом, а імовірність γ –

надійною імовірністю.

Помилка δА для середнього арифметичного x обчислюється за формулою

δ х=l S

√N

де величина l пов'язана з надійною імовірністю певним законом, деякі

табличні значення якого наведено нижче:

γ 0.68 0.8 0.9 0.95 0.99

l 1.00 1.28 1.65 1.96 2.58

Помилка δA, обчислювана при l=1, називається середньою квадратичною

похибкою обчислення статистичної характеристики. Так, при обчисленні

середнього арифметичного х середня квадратична похибка обчислення х

становить δ x=S /√N i справжнє значення середнього з імовірністю γ = 0,68

14

Page 15: DOE Lekcia02

міститься в надійному інтервалі x± S/√N . При обчисленні S середня

квадратична похибка розрахунку становить δ S S /√2N .

Результати обробки експериментальних даних можна записати: x+S,

x=S /√N та x=S /√2N при надійній імовірності γ = 0,68 або x ± 2S; x±2S /√N , та

x±2S /√2N при надійній ймовірності γ = 0,95 (вважаючи наближено 2,0

замість 1,96).

Проте слід зазначити, що збільшення надійної ймовірності (надійності

результату) приблизно на 30 % розширює можливий (надійний) інтервал у

два рази, тобто похибка обчислення статистичних характеристик зростає.

Імовірність того, що результат вимірювання х і результати обробки

експериментальних даних x та S лежать поза вказаними границями,

визначається співвідношенням

α=1−γ

і називається рівнем значущості. Рівень значущості, як і надійна

імовірність, виражається в процентах. Так, 95 %-й надійній імовірності

відповідає 5 %-й рівень значущості.

2.4. Розподіли неперервних і дискретних величин

2.4.1. Розподіл і функції розподілу

Доцільно розрізняти випадкові величини, які набувають лише окремих,

ізольованих значень (дискретні випадкові величини), та випадкові величини,

можливі значення яких суцільно заповнюють деякий проміжок. У біометрії

зустрічаються обидві групи випадкових величин. Перша з них характеризує

зчисленні або меристичні біологічні ознаки, друга – вимірні або метричні

ознаки. У технологічних вимірюваннях найчастіше мають справу з

неперервними за своєю природою змінними, проте результати вимірювань,

залежно від використовуваних технічних засобів, будуть у вигляді як

неперервних, так і дискретних випадкових величин. Наприклад, результат

вимірювання такої неперервної величини, як температура, при вимірюванні 15

Page 16: DOE Lekcia02

ртутним термометром е неперервною метричною випадковою величиною, а

при вимірюванні приладом з цифровим індикатором – дискретною

меристичною випадковою величиною.

Результатам окремих вимірювань або серединам інтервалів (якщо ряд

вимірювань оброблено належним чином) відповідають відносні частоти, які

характеризують утворену вибірку. При аналізі експериментальних даних

припускають, що в основі розподілів частої лежать деякі математичні

закономірності, для виявлення яких проводять згладжування частот.

Утворені в результаті згладжування частоти називають теоретичними або

згладженими.

Слід зазначити, що у математичній статистиці розглядаються

закономірності у вигляді відповідності між значеннями х (елементами

вибірки), які спостерігаються та їх частотами або відносними частотами. У

теорії ймовірностей міра відповідності між можливими значеннями х

випадкової величини та їх ймовірностями pх, які знаходять в результаті

операції згладжування або розрахунковим шляхом, називається розподілом

випадкової величини.

Розподіл неперервної випадкової величини не можна задавати за

допомогою ймовірностей кожного можливого значення цієї величини. Число

значень таке велике, що для більшості з них ймовірність дорівнює нулю, хоча

подія може реалізуватися будь-якою з цих величин Тому для метричних

величин визначають ймовірність попадання у досить широкий інтервал.

Зручно користуватися ймовірністю того, що результат вимірювання х буде

меншим за деяке дійсне число X, яке займає весь числовий ряд від –∞ до +∞.

Ця ймовірність G є функцією х і називається функцією розподілу

G ( x )=p(x<X )

З цих означень зрозуміло, що G(x) – неспадна функція, граничні

значення якої G(–∞)=0, G(+∞)=1. Для дискретної випадкової величини це

ступінчаста, а для неперервної – також неперервна функція. Значення G(x)

обчислюється за формулами16

Page 17: DOE Lekcia02

G ( x )=∑x <X

p ( x )абоG ( x )=∑x<X

Nm/N

для дискретних випадкових величин;

G x=∫−∞

X

p ( x )dx

для неперервних випадкових величин.

2.4.2. Нормальний закон розподілу

Більшість результатів вимірювань підлягає нормальному закону

розподілу або просто нормальному розподілу. Нормальний розподіл виражає

закономірності зміни значень змінних під впливом багатьох випадково

виникаючих факторів, які діють у різних напрямах так, що жоден з них не

впливає на інший. На рисунку 2.3 зображено криву нормального розподілу

ймовірностей (або відносних частот). Вона симетрична відносно

вертикальної осі у – найбільшої ординати, що відповідає середньому

арифметичному х розглядуваної змінної х. Точки перетину кривої мають

абсциси, які дорівнюють СКВ цієї змінної, тобто х1 = х – S та х2 = x + S.

Ординати обох віток кривої спадають від найбільшої спочатку швидко, а

потім повільніше й повільніше. Крива досягає значення у = 0 при x=±∞.

Проте значеннями ординати при x=x ±3 S можна практично знехтувати.

Рисунок 2.3 – Крива нормального розподілу

Крива нормального розподілу описується рівнянням

17

Page 18: DOE Lekcia02

y=φ ( x )= 1S√2π

exp[−12 ( x−xS )

2]де у – ордината точки кривої розподілу при заданому значенні

розглядуваної змінної x. Звідси випливає, що зі зменшенням СКВ крива

нормального розподілу стає більш вузькою, витягнутою вгору, і навпаки, зі

збільшенням S – розмитою і максимальне значення у зменшується. В обох

випадках залишається в силі припущення про те, що при x=x ±3 S ймовірність

р(х) дорівнює нулю. Звичайно в цій формулі роблять заміну u=x−xS і

вважають, що S=1. Тоді φ (u ) називають рівнянням кривої нормального

розподілу нормованої випадкової величини:

φ (u )= 1√2 π

exp(−u2

2 )Значення φ (u) наведено в таблиці Додатку А. По вертикалі відкладено

десяті, по горизонталі – соті частки u. Такої точності досить при обробці

результатів дослідження робочих процесів.

Якщо обґрунтовується припущення, що випадкова величина у

генеральній сукупності розподілена нормально, вирівнюючі відносні частоти

знаходять за формулою

pi=dSφ(u)

А вирівнюючи частоти – за формулою

N i=NdSφ(u)

Ці залежності дають змогу побудувати нормальну криву за дослідними

даними; тому частоти правильніше було б назвати нормалізуючими, а не

вирівнюючими. Побудова такої кривої здійснюється з припущення, що в

генеральній сукупності, число членів якої N може бути як завгодно великим,

СКВ δ дорівнює вибірковому S, а середнє арифметичне значення генеральної

сукупності або математичне сподівання М[х] дорівнює середньому

арифметичному значенню х, утвореному з даної вибірки.

Розглянемо порядок обчислення ординат кривої нормального розподілу:18

Page 19: DOE Lekcia02

1) визначають вибіркові характеристики x та S;

2) підраховують значення відхилень xm¿ −x і нормованих відхилень

u=(xm¿ −x )/S;

3) знаходять за табл. Д1 значення φ (u), що відповідають обчисленим u, і

множать на загальне для даного розподілу відношення d/S або Nd/S (де d –

ширина інтервалу);

4) відкладають для відповідних абсцис змінних обчислені ординати pi',

або N i'.

На рисунку 2.4 побудовано нормальну криву за згладженими частотами

N i' і полігон спостережуваних частот Ni (позначено чорними кружальцями).

Щоб підтвердити, що розподіл частинок нормальний, можна використати

деякі критерії згоди.

Рисунок 2.4 – Нормальна крива за згладженими частотами

Крім нормального розподілу, у математичній статистиці розглядаються

також інші види розподілу, які можна звести до нормального, вважаючи

замість х як змінну √ x , lg x ,1/ x і т. д.

Нормальний розподіл належить до унімодальних. Це означає, що існує

єдине значення змінної, ймовірність якого найбільша, і воно називається

модою. Нормальний розподіл є симетричним, тобто для нього збігаються

значення середнього арифметичного, медіани та моди. Зазначимо також, що

19

Page 20: DOE Lekcia02

нормальний розподіл має властивість лінійності. У даному випадку це

означає, що коли незалежні змінні x1 та x2 мають нормальний розподіл, то

для довільних сталих чисел α і β змінна α x1 + β x2 також має нормальний

розподіл.

2.4.3. Біноміальний розподіл

Нормальний закон розподілу стосується неперервних випадкових

величин. Для дискретних величин він може застосовуватися лише за певних

умов, зокрема при великому числі випробувань. Разом з тим число

дискретних величин часто не може бути великим (обсяг вибірки невеликий),

а, крім того, на ймовірність тієї чи іншої події (наслідку) впливають деякі

обмеження.

У робочих процесах найчастіше користуються біноміальним розподілом

дискретних величин. Він виникає тоді, коли при будь-якому випробуванні у

серії має відбутися одна подія або у деякому розумінні їй протилежна.

Вивчення цього розподілу розпочалося з відомої гри в підкидання монет,

тому появу однієї події часто називають сприятливим наслідком або успіхом

(наприклад, гербом зверху на монеті, що впала, для гравця, який поставив на

герб), а протилежної – несприятливим наслідком або невдачею.

В основі біноміального закону розподілу лежить загальна схема, названа

ім'ям відомого швейцарського вченого математика Якоба Бернуллі. Нехай

випадкова величина х набуває тільки двох значень: 1 та 0, причому

результати кожного випробування не залежать одні від одних. Ця вимога

задовольняється при підкиданні правильної монети. У випадку виймання

навздогад білих або чорних куль з урни вона задовольняється за умови, якщо

перед черговим випробуванням опускати раніше вийняту кулю назад в урну.

Така схема випробувань лежить в основі широкого кола експериментів,

наслідки яких належать двом взаємовиключаючим класам, а розподіл змінної

х, яка може набувати тільки двох значень (х = 1 з імовірністю р або х = 0 з

імовірністю q = 1 – р), називається розподілом Бернуллі.20

Page 21: DOE Lekcia02

Якщо нас цікавить, яка імовірність сприятливого наслідку в серії з N

дослідів, то треба врахувати, що число цих наслідків k може набувати будь-

яких цілих значень від 0 до N, а число протилежних наслідків дорівнює N – k.

При цьому імовірність р (N, k) обчислюється за біноміальним законом

p (N ,k )=CNk pN−k qN

де CNk = N !

k ! (N−k )! – біноміальний коефіцієнт.

Рисунок 2.5 – Полігон для N=20 та p=5

Параметри N та p повністю визначають біноміальний розподіл. На

рисунку 2.5 зображено полігон p(N,k) для N=20 та п'яти значень р. Звідси

випливає, що біноміальний розподіл є симетричним тільки при р = q = 0,5.

При цьому рівноймовірність наслідків є найчастішою в робочих процесах.

При обчисленні теоретичного біноміального розподілу з відомими N та

р використовують ту обставину, що p(N, k) є членами в розкладанні бінома

Ньютона.

∑k=0

N

p (N ,k )=¿∑k=0

N

CNk pN−k qN=( p+q)N=CN

0 pN q0+CN1 pN−1q1+…+CN

N p0qN ¿

Біноміальні коефіцієнти CNk визначають за допомогою трикутника

Паскаля, в якому вони займають рядок з номером N. В Додатку Б зображено

трикутник Паскаля для N=12.

Для обчислення р(N,k), починаючи з р(N,0), можна користуватися також

рекурентною формулою

21

Page 22: DOE Lekcia02

p(N ,k )p (N ,k−1)

=(N−k+1 ) p

kq

Важливе місце біноміальний розподіл посідає в задачах про постачання

підприємств водою, тепловою чи електричною енергією в умовах

нерівномірних графіків споживання окремими апаратами чи цехами. При

вивченні великої кількості робочих процесів, які визначаються схемою

випробувань Бернуллі, число випробувань N велике, а імовірність

сприятливого наслідку р відносно мала, разом з тим їх добуток λ=Np і не

малий і не великий.

2.4.4. Розподіл Пуассона

При вивченні великої кількості робочих процесів, які визначаються

схемою випробувань Бернуллі, число випробувань N велике, а імовірність

сприятливого наслідку р відносно мала, разом з тим їх добуток λ=Np і не

малий і не великий. Типовий приклад – розподіл ізюминок у булочках, якщо

за рецептурою у тісто кладуть досить багато ізюму. Тоді зручніше замість

біноміального використати розподіл ймовірностей Пуассона

p ( λ , k )= λ2

k !exp (−λ)

де k може набувати будь-яких цілих значень від 0 до N. Розподіл

Пуассона з достатньою для технічних розрахунків точністю апроксимує

біноміальний розподіл, проте обчислення провадяться значно швидше.

Однак розподіл Пуассона не просто є зручним наближенням

біноміального, а зустрічається в різних задачах і не тільки при великій

асиметрії (тобто при значній відмінності р і а). Наприклад, число частинок,

випромінюваних стабільним радіоактивним джерелом, які досягають заданої

області простору за однакові проміжки часу, має розподіл Пуассона. Те саме

можна сказати й про розподіл колоній бактерій, вирощених у чашці Петрі.

Параметр λ в законі Пуассона чисельно дорівнює математичному

сподіванню М і одночасно дисперсії D змінної, що також спрощує

22

Page 23: DOE Lekcia02

обчислення, пов'язані з цим розподілом. Щоб формула Пуассона виражала не

імовірності, а очікувані частоти Nx кожного значення змінної х, її записують

у такому вигляді:

N x=Nxk

k !exp (−x)

Значення р(λ,k) для діапазонів λ, від 0,1 до 11 та k від 0 до 14

наведено в таблиці Додатку В. Якщо треба дістати очікувані частоти Nx, то їх

можна обчислити як

N x=p ( λ , k )N

На рисунку 2.6 зображена крива розподілу Пуассона.

Рисунок 2.6 – Крива розподілу Пуассона

Крім описаних розподілів, характеристики робочих процесів можуть

підлягати також іншим законам. При моделюванні епідемій заразних

захворювань вживається розподіл Пойа, оскільки на відміну від біноміальної

схеми тут після вийняття з урни кулі білого кольору її повертають до урни

разом з новими кулями того ж кольору.

Серед розподілів неперервних величин назвемо логістичний, який поряд

з нормальним використовується у медико–біологічних дослідженнях для

аналізу ефекту різних ліків, а також степеневий та його різновидність –

розподіл Парето, вживаний у задачах економічної статистики.

23

Page 24: DOE Lekcia02

СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ

1. Аністратенко В. О. Метематичне планування експериментів в

АПК : навч. посібник / В.О. Аністратенко, В.Г. Федоров. – К. : Вища шк.,

1993. – 375 с. – ISBN 5-11-002551-1.

2. Binomial theorem: – Режим доступу:

http://en.wikipedia.org/wiki/Binomial_theorem - Title from the screen.

3. Бабак В. П. Теорія ймовірностей, випадкові процеси та

математична статистика : підручник для вузів / В. П. Бабак, Б. Г. Марченко,

М. Є. Фриз. – К.: Техніка, 2004. – 288 с. – ISBN 966-575-106-9.

24

Page 25: DOE Lekcia02

Додатки

25

Page 26: DOE Lekcia02

Додаток А

Значення нормованої випадкової величини

26

Page 27: DOE Lekcia02

Додаток Б

Трикутник Паскаля.

27

Page 28: DOE Lekcia02

Додаток В

Значення p(λ, k). Розподіл Пуассона

28

Page 29: DOE Lekcia02

29