26
ЗМІСТ Лекція 3. Критерії згоди та оцінка вибірок.Перевірка емпіричних розподілів...............2 3.1. Критерії згоди...............................2 3.1.1. Потужність критерію. Класифікація критеріїв згоди....................................... 2 3.1.2. Ступень вільності .......................3 3.1.3. Критерій Стьюдента.......................3 3.1.4. Хіквадрат Пірсона........................5 3.1.5. Критерій Колмогорова.....................6 3.1.6. Критерій Фішера..........................7 3.2. Оцінка вибірок...............................8 3.2.1. Порівняння оцінок дисперсій..............8 3.2.2. Належність вибірок до однієї сукупності. .9 3.3. Перевірка емпіричних розподілів.............12 3.3.1. Перевірка на однорідність...............15 3.3.2. Перевірка на адекватність...............16 Перелік використаних джерел і літератури.........17 1

DOE Lekcia03

Embed Size (px)

DESCRIPTION

Планування експериментуЛекція 2

Citation preview

Page 1: DOE Lekcia03

ЗМІСТ

Лекція 3. Критерії згоди та оцінка вибірок.Перевірка емпіричних розподілів.................................................................................................................2

3.1. Критерії згоди.........................................................................................23.1.1. Потужність критерію. Класифікація критеріїв згоди..................23.1.2. Ступень вільності ...........................................................................33.1.3. Критерій Стьюдента........................................................................33.1.4. Хіквадрат Пірсона...........................................................................53.1.5. Критерій Колмогорова....................................................................63.1.6. Критерій Фішера.............................................................................7

3.2. Оцінка вибірок........................................................................................83.2.1. Порівняння оцінок дисперсій.........................................................83.2.2. Належність вибірок до однієї сукупності.....................................9

3.3. Перевірка емпіричних розподілів.......................................................123.3.1. Перевірка на однорідність............................................................153.3.2. Перевірка на адекватність............................................................16

Перелік використаних джерел і літератури..............................................17

1

Page 2: DOE Lekcia03

3. . Лекція Критерії згоди та оцінка вибірок Перевірка емпіричних розподілів

3.1 Критерії згоди

До перевірки тієї чи іншої статистичної гіпотези доцільно підходити з різних теоретичних позицій. Кожна позиція ґрунтується на розподілі первинних або обчислених даних, які відрізняються від нормального розподілу. Це зумовлено обмеженим числом вимірювань або додатковими умовами при обробці дослідних даних. Характеристикою кожного розподілу є набір чисел, заздалегідь протабульованих. При перевірці гіпотези з дослідних даних складається число за тим же правилом, що й наведені в таблиці числа і порівнюються з табличним числом. Гіпотеза визнається або відхиляється залежно від згоди дослідних і табличних чисел, тому останні називаються критеріями згоди. Як і в інших галузях науки, наприклад, в теорії подібності, статистичні критерії – величини зазвичай безрозмірні.

Найвідоміші критерії згоди : Хіквадрат Пірсона; Колмогорова; Стьюдента; Фішера.

3.1.1. Потужність критерію. Класифікація критеріїв згоди

Основною характеристикою критерію згоди є потужність. Потужність критерію – це імовірність відхилити нульову гіпотезу Н0, коли вірна гіпотеза Н1. Критерій називається потужним, якщо він порівняно з іншими можливими критеріями показу вищу дискримінуючу здатність, тобто, здатність до розділення гіпотез.

За потужністю критерії згоди діляться на дві великі групи: Параметричні. До параметричних належать критерії, побудовані

за допомогою основних параметрів (числових оцінок) вибіркової сукупності. Ці критерії застосовуються лише тоді, коли генеральна сукупність, з якої взято одну або кілька вибірок, розподілена нормально, і за умовою рівності основних параметрів.

Непараметричні. Непараметричні критерії мають сильнішу дискримінуючу (роздільну) здатність, більшу потужність порівняно з непараметричними. Коли досліджувана сукупність розподіляється за

2

Page 3: DOE Lekcia03

нормальним законом або не дуже відхиляється від нього, слід надавати перевагу таким критеріям.

Потужність критерію збільшується при збільшені обсягу вибірки. Якщо ж обсяг вибірки малий і збільшити його не вдається, то треба брати невисокий рівень значущості, оскільки, і малий обсяг вибірки і високий рівень значущості призводить до небажаного зменшення потужності критерію. Слід пам’ятати про те, що при зворотному переході до вищого рівня значущості обчислене значення може з області відхилення нульової гіпотези перейти у область її визнання.

При плануванні та реалізації експериментів задаються імовірністю тільки помилки першого роду. Далі, рекомендуючи той чи інший критерій згоди, вибиратимемо найпотужніший з можливих критеріїв, тобто будемо враховувати також помилки другого роду. Слід пам’ятати, що задаючись занадто високим рівнем значущості, ми знижуємо достовірність отриманих результатів експерименту, тому бажано обмежитися 5% рівнем значущості.

3.1.2 Ступень вільності

Поняття статистичного критерію тісно пов’язане з поняттям ступеня вільності. Для більшості критеріїв ступінь вільності є аргументом N-1, що стоїть у знаменнику формули для середньо квадратичного відхилення , є числом ступенів вільності.

Число ступенів вільності – число змінних, значення яких задаються довільно. Іншими словами це є число змінних мінус число лінійних зв’язків, накладених на систему, що вивчається.

Отже, під числом ступенів вільності, будемо розуміти різницю між числом дослідів та числом характеристик, які визначаються за утвореними даними незалежно одне від одного.

3.1.3 Критерій Стьюдента

Нехай X - нормально розподілена випадкова величина. При відомому середньо квадратичному відхиленні σ висувається основна гіпотеза M(x)=m0, або M(x)-m0 =0, тобто середнє значення або математичне сподівання M(x) заданої сукупності, оцінюване на основі випадкової вибірки, не відрізняється від заданого значення m0 .

Альтернативна гіпотеза HA, протилежна нуль-гіпотезі, тобто M(x)≠m0 , або M(x)-m0 ≠0. Як критерії використовується відношення різниці

порівнюваних величин -m0 до статистичної помилки S/√N розрахункової

величини :

3

Page 4: DOE Lekcia03

Z=

Де N – обсяг вибірки, - оцінка математичного сподівання генеральної

сукупності.

– теоретичне математичне сподівання.

– оцінка математичного сподівання.

Статистична помилка, або помилка репрезентативності (відтворюваності) – це відхилення даного вибіркового показника від його справжнього значення в генеральній сукупності. Для вибіркового середнього

це значення в  разів менше, ніж середньо квадратичне відхилення S. Згідно

з теорією статистичної обробки обмеженого числа дослідних даних ймовірність значення Z розподілена за законом Стьюдента

σ (z)=

де r – гамма-функція, табличні значення якої можна знайти в довідниках з математики або статистики. Залежно від параметрів вибірки значення Z

відрізняється від нуля, як міра відхилення вважається абсолютне значення

. За прийнятим рівнем значущості  α можна визначити таке критичне

значення z , що при вірній гіпотезі H0 справедлива нерівність , тобто

σ( α. Якщо число z , обчислене за вибіркою, задовольняє

нерівність , то вважатимемо що відхилення z від 0 можна розглядати

як випадкове. Тоді говорять, що нуль гіпотеза не відхиляється на основі

вибірки, або немає підстав для її відхилення. Якщо, , то при

справедливій нуль гіпотезі таке відхилення можливе, але малоймовірне. Тоді вважають більш ймовірним, що нуль гіпотеза невірна, і її відхиляють. При аналізі рішень слід мати на увазі обидва можливі типи помилок. Співвідношення ймовірностей  α і β проілюстровано на рисунку 1, де наведено графіки розподілу ймовірностей при порівнянні арифметичних середніх, здобутих з двох вибірок: лівий зображає основну гіпотезу, правий альтернативну.

4

Page 5: DOE Lekcia03

Рисунок 1 – Співвідношення ймовірностей прийняття гіпотез.

Залежно від значень обчисленого на підставі вибіркових даних z і його положення по-відношенню до z критичного можливі 2 рішення.Якщо значення Z дорівнює або перевищує Z критичне, то основна гіпотеза

відхиляється і приймається альтернативна. Якщо , то немає підстав

для відхилення основної гіпотези, тобто вона підтверджується. При одному і тому ж розташуванні графіків розподілу імовірностей зі

зменшенням ймовірності помилки α значення β зростає. Імовірність β визнати невірно основну гіпотезу залежить від обсягу вибірки чим , більше N, тим надійніше при даному рівні значущості  α буде встановлена аналізована відмінність між статистичними характеристиками і ступеня вільності між цими характеристиками, потужності критеріїв.

3.1.4 Хіквадрат Пірсона

Критерій узгодженості Пірсона - один з найвідоміших критеріїв  ,

тому його часто і називають просто "критерій хі-квадрат". Використовується для перевірки гіпотези про закон розподілу. Ґрунтується на групованих даних. Область значень передбачуваного розподілу F1 ділять на деяке число інтервалів. Після чого будують функцію відхилення ρ по різницях теоретичних імовірностей попадання в інтервали групування й емпіричних частот.

Нехай X=(X1,…, Xn) — вибірка з розподілу F. Перевіряється проста гіпотеза H1 = F=F1  проти складної альтернативи  H2=F≠F1 .

Нехай A1,…, Ak — інтервали групування в області значень випадкової величини з розподілом F1.

Позначимо для j=1,…,k через vj число елементів вибірки, що потрапили в інтервал Aj:

5

Page 6: DOE Lekcia03

vj =(Xi Aj) = і через pj>0 – теоретичну ймовірність PH1

(Xi Aj ) попадання в інтервал Aj випадкової величини з розподілом F1. З

необхідністю, p1+…pk=1.

Як правило, довжини інтервалів вибирають так, щоб  p1=…=pk=

Нехай  ρ(X) =

Перед тим, як сформулювати правило прийняття або відкидання гіпотези необхідно врахувати, що критерій Пірсона має правобічну критичну область.

Правило. Якщо отримана статистика перевищує квантиль розподілу X2 заданого рівня значимості α з (k-1) або з  (k – p - 1) ступенями вільності, де k — число спостережень або число інтервалів (для випадку інтервального варіаційного ряду), а p — число оцінюваних параметрів закону розподілу, то гіпотеза H0 відкидається. А якщо ні, то гіпотеза приймається на заданому рівні значимості α.

Теорема Пірсона.

Якщо вірна гіпотеза H1 то при фіксованому k й при n→ ρ(X) =

k-1 де, нагадаємо, k-1 є X2  -розподіл зі k-1 ступенем

вільності.

3.1.5 Критерій Колмогорова

З інших методів розв’язання задач дослідження емпіричних розподілів найпростішим є λ – розподіл. Як міра розходження між емпіричним та гіпотетичним розподілами тут приймається максимальне значення модуля різниці між експериментально утвореною відносною частотою рі і

теоретичною частотою обчисленої на основі того чи іншого неперервного

розподілу:

Z = max .

Теоремою Колмогорова доведено, що яким би не був закон розподілу

неперервної випадкової величини х, при необмеженому зростанні числа

6

Page 7: DOE Lekcia03

незалежних спостережень N ймовірність нерівності Z λ прямує до

межі

р(λ) = 1 –

Описані найважливіші розподіли застосовуються при використанні різних критеріїв згоди. З іншого боку, є ціла група критеріїв, які ґрунтуються на інших розподілах або взагалі не потребують для їх обчислення будь-яких розподілів. Тому необхідна інформація про інші розподіли подана разом з описом відповідних критеріїв. Тут зазначимо, що згідно з центральною граничною теоремою сума чисел незалежних одна від одної випадкових величин з довільним неперервним розподілом має в границі нормальний розподіл, якщо кожен з доданків вносить у суму приблизно однаковий внесок. Ця теорема дає обгрунтування багаторазово підтвердженому практикою факту, що коли певна подія визначається великою кількістю ви-падкових факторів, впливом кожного з яких можна знехтувати, такий експеримент добре апроксимується нормальним розподілом

3.1.6 Критерій Фішера

Для розв’язування задач порівняння двох і більше дисперсій користуються розподілом випадкової змінної F, що має вигляд

де х1, х2,…у1,у2 – взаємно незалежні нормально розподілені випадкові величини з М=0 і довільним D. Цей критерій F=Z залежить тільки від чисел

m та n; його ймовірність р(F)=0, якщо F 0, а якщо F 0 то

Такому ж розподілу підлягає відношення оцінок дисперсій та

однієї генеральної сукупності зі ступенями вільності f1 = N1 – 1та f2=N2-1:

Щоб не було розбіжностей, яку ж з вибірок вважати першою, а яку другою, прийнято в чисельнику записувати більшу оцінку дисперсії, так що

критерій завжди більший від одиниці. При цьому в наведеному вище

розподілі р(F) ступені вільності f1 та f2 дорівнюють відповідно m та n , так що на відміну від p(t) тут маємо справу з двома ступенями вільності. Крім

7

Page 8: DOE Lekcia03

того, - критерій має за означенням розподіл одностороннього характеру й

розташовується у першому квадранті F=0 та F= .

F – розподіл у деяких публікаціях називають розподілом Фішера; однак він дістав розподіл іншого критерію Z, пов’язаного з F формулою Z = ½ ln F. Пізніше Дж. Снедекор запропонував перейти безпосередньо до розподілу величини F. У перекладених довідниках можна зустріти також термін U2 – розподіл, хоча цей критерій не є квадратом будь-якого числа.

Зі збільшенням числа випробувань асиметричність F – розподілу зменшується і він наближається до нормального.

3.2 Оцінка вибірок

3.2.1 Порівняння оцінок дисперсій

Задача порівняння дисперсій виникає, наприклад, при виборі методу аналізу речовини з точки зору відтворюваності даних. Крім того, треба порівнювати дисперсії двох вибірок для розв’язання задачі про відсутність відмінності в їх середніх; тому спочатку використаємо F-розподіл.

Нехай треба порівняти дві різні за значенням оцінки S1 та S2 середньо квадратичного відхилення α1, і α2 із ступенями вільності f1 та f2 відповідно, утворених з двох різних вибірок. Треба визначити, чи лежить різниця між S1 та S2 , в межах можливих випадкових коливань, тобто вирішити, чи можна

обидва значення та розглядати як оцінку однієї й тіє ж дисперсії σ2 ге-неральної сукупності. Іншими словами, слід визначити, чи належать утворені вибірки до цієї генеральної сукупності. Перевіримо нуль-гіпотезу H0 : отже

припустимо , що . Якщо це припущення виконується, то

відношення підлягає F – розподілу зі ступенями вільності f1 та f2 .

Тому обчислюємо F – критерій Фішера Fр= , де S1 > S2 за умовою. Потім з таблиці «Розподіл Фішера» виберемо критичне значення Fкр для

заданої надійної ймовірності або відповідного рівня значущості при ступенях вільності f1 чисельника та f2 знаменника. Знайдені значення

та є оцінками однієї і тієї ж генеральної дисперсії σ2 , якщо Fр ≤ Fкр , а спостережувану відмінність між ними розглядають як незначну і випадкову. При Fр > Fкр гіпотезу, яку перевіряють, слід відхилити. Між

значеннями S1 та S2 існує значуща різниця, так що .Оскільки F- критерій належить до параметричних, його можна

використовувати лише тоді, коли є певність у тому, що генеральна

8

Page 9: DOE Lekcia03

сукупність, з якої взято вибірки, розподілена нормально. Крім того, його використання у сприятливих умовах Fр ≤ Fкр дає змогу говорити лише про рівність дисперсій, а рівність середніх треба встановлювати додатково.

Критерій Фішера використовують при порівнянні двох дисперсій, коли відомо, що одна з них належить генеральній сукупності. Тут число ступенів вільності для генеральної дисперсії слід брати таким, що дорівнює нескін-ченності.

За допомогою F - критерію при обробці активних планованих експериментів перевіряють адекватність математичної моделі, для чого обчислюють дисперсію адекватності. Його можна використовувати також при складанні моделі за результатами пасивних експериментів.

Якщо кількість порівнюваних дисперсій більша двох, то при формуванні F- критерію беруть найбільшу і найменшу дисперсії Якщо при цьому Fр < Fкр , то ці дисперсії не відрізняються одна від одної, а решту дисперсій можна зарахувати до однієї сукупності.

При дослідженні різноманітних робочих процесів і особливо при планованому експерименті задають обсяг різних вибірок однаковим, тобто N1 = N2=…= N. Тут слід застосовувати G - критерій Кохрена, що має вигляд:

де п — число досліджуваних дисперсій. Величина G може служити для перевірки гіпотези про однорідність (належність до однієї генеральної сукупності) дисперсій, коли G = Z, тобто G -розподіл залежить від числа досліджуваних дисперсій n, числа ступенів вільності I = N-1 і надійної ймовірності у. Критичні значення для G – критерію наведені у спеціальній таблиці. Для α G –критерій рівний 0,05. Якщо за вибірковими дисперсіями розрахункове значення Gр < Gкр , то всі вибіркові дисперсії є оцінками однієї генеральної сукупності, тобто однорідні.

Коли обсяг вибірок неоднаковий, користуються критерієм Бартлета, який грунтується на нормальному та X2- розподілах. Розрахунки за цим критерієм досить складні і кропіткі, описане вище застосування F- критерію у більшості випадків достатнє.

3.2.2 Належність вибірок до однієї сукупності

Нехай треба визначити склад речовини, що характеризується

значенням , двома методами аналізу Один метод дає оцінку середнього 1 з

відхиленням S1 інший — 2 з відхиленням S2.

9

Page 10: DOE Lekcia03

Обидва середні значення відрізняються не набагато. Слід перевірити, чи пояснюється ця різниця тільки випадковою помилкою, тобто чи належать обидва середні значення до генеральної сукупності з одним і тим же середнім

значенням . Перевірювана нуль-гіпотеза буде 1 = 2 = . Попередньо треба дослідити, чи існує різниця між середньо квадратичне відхилення S1 та S2. Порівняння двох середніх арифметичних проводять тільки при виконанні умови Fр < Fкр, причому попередньо обчислюють середньо квадратичне відхилення для різниці двох середніх значень N1 і N2 вимірювань, тобто

= ,з числом ступенів вільності f=f1 + f2 = N1 + N2 -2

Різниці 1 - 2 є випадковими величинами і при наявному малому числі вимірювань підлягають t - розподілу . Для порівняння двох середніх арифметичних використовують t - критерій (критерій Стьюдента).

Розрахункове значення tр дістанемо за формулою tр= де виразом

враховують в загальному випадку перехід середньо

квадратичного відхилення S1 і S2 до статистичних помилок S1 і S2 За таблицями t - розподілу для заданого рівня значущості α або

надійної ймовірності у і числа ступенів вільності f= N1 + N2 -2 знаходять tкр.

Якщо tр ≤ tкр, то визнають гіпотезу про те, що 1 = 2 = . У противному

разі |tр > tкр | різниця між середніми визнається значущою, тобто різниця | 1

- 2 |не випадкова з помилкою першого роду α.

Іноді треба перевірити відхилення середнього від безпомилкового числа х0, наприклад відмінність значення параметра, яке підтримував апаратник протягом зміни, від заданого технічним регламентом

оптимального значення. Тоді гіпотезою, яка перевіряється, буде = х0 і розрахункова формула критерію Стьюдента матиме вигляд

tр=де х0 — задане значення; N — число вимірювань; S— оцінка СКВ, яка визначається так:

S=

10

Page 11: DOE Lekcia03

Тут перевірка проводиться також зіставленням обчисленого значення tр з наведеним у таблицях значенням tкр.

Якщо нуль-гіпотеза не відхиляється, то при малих обсягах вибірок застосування t- критерію може бути недостатнім. Не виключено, що при повторних випробуваннях нуль-гіпотеза може спростуватися. Крім того, і при спростуванні нуль-гіпотези треба впевнитися в тому, що генеральні сукупності, з яких було взято порівнювані вибірки, розподілені за нормальним законом та їхні генеральні дисперсії не дуже відрізняються. Якщо хоч одна з цих умов не виконується, то t- критерій застосовувати не слід. Тут треба вдаватися до непараметричних критеріїв, які мають меншу потужність, але більшу універсальність.

Одним з таких критеріїв при порівнянні двох середніх є ранговий критерій Ван – дер- Вардена, або Х-критерій. Для його розрахунку спочатку треба записати загальний ряд розподілу з обох порівнюваних вибірок так, щоб значення змінних розташовувалися в порядку зростання. Рангом кожного значення змінної R тут буде порядковий номер. Потім для вибірки, меншої за обсягом, знаходять відношення R/(Rmax+1), де Rmax - максимальне значення рангу Rmax = N1 + N2.

Розрахувавши R/(Rmax+1), визначають значення функції ψ від цієї величини за допомогою відповідної таблиці. Тут цифри верхніх стовпців означають тисячні частки R/(Rmax+1). Розрахункове значення Х-критерію знаходять за формулою

’причому підсумовування здійснюється алгебраїчно з урахуванням знака функції ψ. Потім Хр порівнюється з критичним значенням Хкр . Критичні значення Хкр наведені в таблиці.(дод.9).

Критерій Уайта, або Т-критерій, як і Х-критерій, можна застосовувати до вибірок однакового і різного обсягів. Тут також ранжирують вибірки, розміщуючи значення змінних у порядку зростання в одному ряду. Якщо кілька значень змінної в одному ряду однакові, їм надається один і той же ранг, обчислений як середнє арифметичне зайнятих цими значеннями рангів. Сума рангів для вибірок, що належать до однієї генеральної сукупності, має бути пропорційною розміру вибірки, при однакових обсягах вибірок суми рангів мають бути однаковими.

Фактична різниця в сумі рангів може бути випадковою, і її оцінюють за допомогою T-критерію. Критичні значення Tкр з урахуванням обсягів вибірок N1, N 2, а також надійної ймовірності 1 — α наведено в табл. Д10. Якщо розрахункові значення Тр для вибірок N1 і N 2 будуть меншими від

11

Page 12: DOE Lekcia03

Tкр при заданому чи визнаному рівні значущості α, то нуль-гіпотеза про рівність середніх має бути відхилена. Якщо ж Tр≥ Ткр, то її слід визнати, а різницю між вибірками вважати випадковою.

Близький до рангових критерій Уілкоксона, який використовують для дослідження технічних процесів. Ранжирування тут проводять разом для обох вибірок лише для зручності обчислення числа інверсій, коли замість прийнятого, наприклад х1 > х2, має місце х2 > х1, Порівнюють кожне значення х з однієї вибірки з кожним значенням х2 з іншої.

Якщо треба порівняти не два, а кілька середніх, то можна використати t- критерій і порівняти вибірки між собою парами. Разом з тим детальніше інформацію про всі середні можна використати, застосовуючи множинний критерій Дункана. Цей критерій належить до рангових критеріїв згоди, проте ранжируваги в порядку зростання тут треба всі значення k арифметичних Хі (і =1,2, ...,k). Подальший порядок роботи з критерієм Дункана такий:

1. Визначити дисперсію кожної вибірки та статистичну

помилку (помилку відтворюваності) 2. Виписати з таблиці критеріїв Дункана (див. табл. Д16) k-1

значень критерію, починаючи з і = 2, з урахуванням обраного рівня значущості α та числа ступенів вільності ft=∑Nt – 1 ;

3. Помножити ці значення критеріїв на дістати k - 1 найменших значущих рангів (НЗР), які матимуть зміст критеріїв згоди Z;

4. Перевірити вірогідність різниці середніх для двох крайніх значень ранжованого ряду, порівнявши їх різницю з НЗР для і = k (різниця

вірогідна або значуща, якщо max - min > НЗР).

5. Те саме зробити для max та min , порівнюючи їх різницю з НЗР і =k -1, і т. д.

Закінчивши порівняння для Хmax, тобто при і = k, треба виконати ту ж роботу з X при i=k-1 , тобто для другого за величиною, яке також порівнюється з Xmin. Це треба продовжувати до тих пір, поки не будуть порівняні всі k(k-1)/2 пар середніх.

3.3 Перевірка емпіричних розподілів

У попередніх лекціях з’ясовувалися причин,з яких той чи інший розподіл випадкових величин відрізняється від нормального, але це були

12

Page 13: DOE Lekcia03

причини систематичні. Утворені в експериментах розподіли відрізняються від нормального також рядом інших причин. Деяких з них можна назвати технічними. Наприклад, змінюючи кількість інтервалів ряду, на підставі одних і тих же дослідних даних дістанемо різні гістограми, а їх згладжування більш-менш наближатиме ці дані до нормального розподілу. Сюди ж належить обсяг вибірки та інші причини суб’єктивного характеру.

Серед об’єктивних причин можна назвати взаємодію системи, яка вивчається з навколишнім середовищем. Крім порушень симетричності, дані причини можуть викликати перерозподіл ймовірностей: збільшення максимальних ймовірностей або їх зниження.

Розпізнати відхилення такого типу можна, і не будуючи гістограми, не згладжуючи її та не порівнюючи з графіком нормального розподілу. Для цього досить обчислити числові характеристики варіаційного ряду – коефіцієнти асиметрії y1 та y2 :

Якщо >0, то матимемо правосторонню асиметрію, оскільки тут в

сумі для будуть перевалювати куби відхилень з додатним

законом. Для випадку <0 маємо лівосторонню симетрію; для =0 крива розподілу симетрична.

Для крутовершних розподілів коефіцієнт ексцесу >0 , для плоско

вершинних <0. При y=0 спотворення другого роду відсутні. При практичних обчисленнях використовують обчислення середнього

арифметичного з використанням умовного середнього A0. Розраховані таким чином коефіцієнти асиметрії та ексцесу є величинами випадковими. Критерієм згоди з гіпотезою про випадкову відмінність утворених в

розрахунках та є їх відношення до власної помилки:

Помилки коефіцієнтів у більшості практичних випадків можна обчислити за наближеними формулами:

Нуль-гіпотеза або припущення, що і 0 відхиляються, коли > 3

або відповідно > 3.

13

Page 14: DOE Lekcia03

Найчастіше для розв’язання задач дослідження емпіричного розподілу використовується критерій Пірсона, побудований на X2 розподілі.

Якщо вибірку поділено на k інтервалів, причому спостережувані значення розташовано в окремих інтервалах незалежно одне від одного, то значення критерію Пірсона обчислюється як сума квадратів різниці між спостережуваними і очікуваними частотами, поділених на очікувані частоти:

де, - спостережувана частота в i-му інтервалі; - очікувана частота.Число ступенів вільності дорівнює k-1. Якщо для обчислення

очікуваних частот треба за спостережуваними даними оцінити n параметрів, то число ступенів вільності зменшується до f=k-1-n, де k – число інтервалів, а n – число оцінюваних параметрів, необхідних для характеристики вибірки.

При використанні цього критерію вибірки мають бути не занадто

малими, а очікував частоти не меншими від 4 ( 4). Якщо вони менші, то їх треба збільшувати до бажаного рівня поєднанням двох, трьох і т.д. сусідніх інтервалів. Проте це необхідно тільки тоді, коли число інтервалів мале. При f

8 і не занадто малому обсязі вибірки N 40 значення очікуваної частоти може бути зменшено до 1.

Порядок роботи з критерієм Пірсона такий. Висувається нуль-гіпотеза про те, що в основі вибірки лежить передбачуваний теоретичний розподіл, тобто між емпіричним та теоретичним розподілами не існує ніяких відмінностей. Вибірку з N значень ділять на k інтервалів; при цьому бажано

. Для кожного такого інтервалу визначають абсолютну частоту значень вимірюваної величини, які містяться в ньому, а також теоретично

очікувану абсолютну частоту . Оскільки теоретичні розподіли табульовані

для випадку = 1, до розрахунку теоретичної частоти нормують ширину

інтервалу за . Для цих нормованих значень аргументу в таблиці відповідного поділу знаходять функції , які належать до них. З урахуванням наявних N вимірювань при ширині інтервалу d і середньому квадратичному

відхиленні S обчислюють теоретично очікувану абсолютну частоту заповнення окремих інтервалів. За знайденими і обчисленими частотами

знаходять . Задаються рівнем значущості , обчислюють число ступенів

вільності f, за таблицями x2 – розподілу знаходять . Якщо , то

14

Page 15: DOE Lekcia03

перевірювана гіпотеза відхиляється, тобто між емпіричним і теоретичним

розподілами існує значуща різниця. Відмінність незначна, якщо .Критерій Пірсона застосовується для перевірки не тільки нормального,

але й інших розподілів: біноміального, Пуасона. З інших критеріїв, які вживаються для перевірки розподілів,

зупинимось на критерії Колмогорова – Смирнова, заснованому на λ – розподілі. Схема застосувань λ – критерію така. Розраховується емпірична і теоретична відносні частоти і визначається найбільша різниця між ними Dmax . Потім цю величину множать на корінь квадратний з числа спостережень N

λ= Dmax*і з відповідної таблиці знаходять p(λ), тобто ймовірність того, що коли величина Х дійсно розподілена заданим законом, за рахунок певних причин

максимальне розходження між рі та буде не менше від фактично знайденого. Якщо ймовірність p(λ) дуже мала, гіпотезу слід відхилити як неправдоподібну; при порівняно великих p(λ) її можна вважати сумісною з дослідними даними.

При порівнянні двох емпіричних рядів спостережень з різними обсягами вибірок N1 і N2 для розрахунку λ-критерію користуються формулою:

Критерій Колмогорова – Смирнова своєю простотою вигідно

відрізняється від - критерію Пірсона, тому частіше застосовується при обробці дослідних даних. Однак треба застерегти, що цей критерій можна застосовувати лише тоді , коли число експериментальних даних не менше від 40, а бажаний розподіл відомий заздалегідь з яких-небудь теоретичних міркувань , тобто коли відомі не тільки вид функції теоретичного розподілу, а й всі параметри, які до нього входять. Таке порівняно рідко зустрічається на практиці. Звичайно з теоретичних міркувань відомий лише загальний вид функції розподілу, а числові характеристики, що входять до нього,

визначаються за даними експерименту. При застосуванні ця обставина

враховується відповідним зменшенням числа ступенів вільності. Критерій такого погодження не передбачає. Якщо все таки цей критерій застосовується тоді, коли параметри теоретичного розподілу вибираються за

експериментальними даними, він дає завищені значення ймовірності .

15

Page 16: DOE Lekcia03

Тому в ряді випадків ми ризикуємо визнати правдоподібною гіпотезу, яка справді погано погоджується з дослідними даними.

3.3.1 Перевірка на однорідність

Для перевірки гіпотези про однорідність оцінок дисперсії слід користуватися критерієм Кохрена, заснованим на законі розподілу

відношенням максимальної дисперсії до суми всіх дисперсій:

Якщо обчислене значення критерію буде меншим значення G,

знайденого з таблиці розподілів для , і для вибраного рівня значущості ( звичайно α = 0,05) , то гіпотеза про однорідність дисперсій визнається. Це означає, що відмінностей між дисперсіями не повинно бути, а утворена відмінність випадкова. Тоді можна обчислити генеральну

дисперсію відтворюваності за формулою

яка має f3 = N(m-1) ступенів вільності.Якщо перевірка на відтворюваність дала негативний результат, то

залишається визнати не відтворюваність експерименту відносно керованих змінних внаслідок наявності флуктуаційних некерованих і неконтрольованих змінних. При цьому слід збільшити число паралельних дослідів.

3.3.2 Перевірка на адекватність

Для перевірки гіпотези про адекватність результатів експерименту знайденим рівнянням зв’язку треба оцінити відхилення передбаченої

рівнянням регресії вихідної величини yір від результатів експерименту в точках факторного простору. Розкид результатів експерименту відносно лінії регресії тут порівнюється з розкидом точок між собою. Перший

характеризується дисперсією адекватності , оцінку якої знаходять за формулою

де d - число коефіцієнтів лінійного рівняння. Число ступенів вільності fвідтв = N – n – 1 Другий розклад характеризується дисперсією відтворюваності

з числом ступенів вільності fвідтв = N ( m – 1).16

Page 17: DOE Lekcia03

Якщо не перевищує дисперсії відтворюваності, тобто , то утворена математична модель адекватно є результатом експерименту.

Якщо , то треба з’ясувати випадково чи не випадково відрізняються ці дисперсії, і якщо не випадково , то роблять висновок про неадекватність рівняння.

Перевірка гіпотези про адекватність проводиться з використанням F – критерію Фішера. Якщо обчислене значення критерію Fp < Fкр для відповідних ступенів вільності fад = N-d = N-n -1 та fвідтв = N(m-1) при заданому рівні значущості α, то нуль-гіпотеза визначається , тобто рівняння адекватності при sgn(Fp - Fкр) = “ - ”. У противному разі гіпотеза відхиляється і опис визнається неадекватним об’єкту.

Перевірка адекватності можлива при fад 0. Трапляється, що число варіантів (рядків) варіювання ПФЕ дорівнює числу оцінюваних коефіцієнтів регресії, отже, не залишається ступенів вільності для перевірки нуль-гіпотези про адекватність представлення експериментальних даних вибраною формою апроксимуючого полінома. Якщо деякі коефіцієнти регресії виявилися незначущими або ними можна знехтувати через їхню мализну, чи треба довести рівномірність лінійної апроксимації у заданому інтервалі варіювання, то число членів перевіюваного рівняння туту буде меншим від числа варіантів варіювання і один або кілька ступенів вільності залишаться для перевірки гіпотези адекватності. Якщо гіпотезу адекватності відхилено, то переходять до складнішої форми рівняння , або ж, якщо це можливо,

проводять експеримент з меншим кроком варіювання

Список використаних джерел і літератури

1. Критерій згоди[Електронний ресурс] / wiki – стаття Режим доступу: http://wiki.tntu.edu.ua/Критерій_згоди.

2. Аністратенко В.О. Математичне планування експериментів в АПК /Аністратенко В.О., Федоров В.Г.– К.: Вища школа, 1993. – 375 с: іл. ISBN 5-11-002551-1

17