126

Критерии за различие

Embed Size (px)

DESCRIPTION

Критерии за различие. Department of zoology and anthropology Elena Tasheva. Достоверност – основно свойство на добре организираната извадка да отразява правилно генералните параметри. Достоверна разлика – такава разлика по знак ще има и между генералните параметри - PowerPoint PPT Presentation

Citation preview

Page 1: Критерии за различие
Page 2: Критерии за различие

ДостоверностДостоверност – основно свойство на – основно свойство на добре организираната извадка да добре организираната извадка да отразява правилно генералните отразява правилно генералните

параметрипараметри

Достоверна разликаДостоверна разлика – – такава такава разлика по знак ще има и между разлика по знак ще има и между генералните параметригенералните параметри

Недостоверна разликаНедостоверна разлика – – различията различията между генералните параметри между генералните параметри остават недоказаниостават недоказани

Page 3: Критерии за различие

Въвежда сеВъвежда се нулева хипотеза –нулева хипотеза – HHoo

предположение, че разликата между предположение, че разликата между генералните параметри е нула, а различието генералните параметри е нула, а различието между извадъчните показатели е случайномежду извадъчните показатели е случайно

Ако: І извадка от нормална съвкупност с Ако: І извадка от нормална съвкупност с параметри параметри 11 и и 11

ІІ извадка от нормална съвкупност с ІІ извадка от нормална съвкупност с параметри параметри 22 и и 22

То:То: HHoo : : 11 - - 22 = 0 = 0

1 1 - - 2 2 = 0= 0

Page 4: Критерии за различие

Биологични въпросиБиологични въпроси versusversus статистически нулеви хипотези статистически нулеви хипотези

Различават ли се женските и мъжките Различават ли се женските и мъжките по размерипо размери??

Средните размери на женските и Средните размери на женските и мъжките са еднакви.мъжките са еднакви.

Дали възрастовата структура на даден Дали възрастовата структура на даден вид риби в две популации се вид риби в две популации се различаватразличават??

Възрастовата структура е Възрастовата структура е независима от популацията.независима от популацията.

Page 5: Критерии за различие

Индивидуални наблюденияИндивидуални наблюдения((данниданни) - ) - допусканиядопускания

Допускане – данните са събрани по Допускане – данните са събрани по подходящ начин подходящ начин

Всички данни са обект на еднакво голяма Всички данни са обект на еднакво голяма грешка в измерваниятагрешка в измерванията

Page 6: Критерии за различие

Какво представляваКакво представлява вероятността вероятността pp??

Вероятността нулевата хипотеза да е Вероятността нулевата хипотеза да е вярнавярна

Ако нулевата хипотеза е вярна, р е Ако нулевата хипотеза е вярна, р е вероятността да получим резултати, които вероятността да получим резултати, които да се отличават от очакванитеда се отличават от очакваните, , при при условие, че данните са събрани правилно условие, че данните са събрани правилно и всички статистически допускания са и всички статистически допускания са налиценалице

Вероятността да не бъдем прави, когато Вероятността да не бъдем прави, когато отхвърляме нулевата хипотезаотхвърляме нулевата хипотеза

Page 7: Критерии за различие

Да отхвърлим или не нулевата Да отхвърлим или не нулевата хипотезахипотеза??

Решението да приемем или отхвърлим Решението да приемем или отхвърлим нулевата хипотеза зависи отнулевата хипотеза зависи от pp..

Това изисква съгласие относно Това изисква съгласие относно големината на големината на pp, , която да се приеме за която да се приеме за гранична. гранична. Тази стойност е условна.Тази стойност е условна.

Page 8: Критерии за различие

Оценка на рОценка на р

В статистическия анализ В статистическия анализ pp се оценява се оценява въз основа на разпределението на въз основа на разпределението на някаква тест - статистика. някаква тест - статистика.

Ако знаем разпределението на Ако знаем разпределението на стойностите на тест - статистиката, стойностите на тест - статистиката, можем да изчислим вероятността да можем да изчислим вероятността да получим конкретна стойност или по-получим конкретна стойност или по-голяма голяма ((по-малкапо-малка)), ако , ако HH00 е вярна – т.е. е вярна – т.е. pp

Page 9: Критерии за различие

За проверка на нулевата хипотеза се използват За проверка на нулевата хипотеза се използват показатели, наречени показатели, наречени тестове за различие.тестове за различие.

Това са величини, функцията на разпреде-Това са величини, функцията на разпреде-лението на които са известни и дадени в таблици, лението на които са известни и дадени в таблици, които съдържат стойностите на функциите:които съдържат стойностите на функциите: - за различни степени на свобода /обем на - за различни степени на свобода /обем на извадката/ извадката/

- за различно ниво на значимост.- за различно ниво на значимост.

Page 10: Критерии за различие

Ниво на значимостНиво на значимост – допустимата – допустимата вероятност за получаване на случайни вероятност за получаване на случайни

отклонения от установените с определена отклонения от установените с определена вероятност резултати вероятност резултати ((допустимата допустимата

вероятност за некоректно заключение, че вероятност за некоректно заключение, че съществуват различиясъществуват различия))

АкоАко Р Р ≤≤ различията са достоверниразличията са достоверни

0.05 0.01 0.0010.05 0.01 0.001

Page 11: Критерии за различие

Две извадкиДве извадки (1, 2) (1, 2) се различават по се различават по средните си средните си аритметични саритметични с ..

Каква е вероят-Каква е вероят-носттаността pp да да наблюдаваме тези наблюдаваме тези различия акоразличия ако HH00 ( (че че няма различияняма различия)) е е вярнавярна??

чес

тота

X1 X2

| |X X1 2

Sample 2Sample 1

Page 12: Критерии за различие

АкоАко HH00 е вярнае вярна, , то то

очакваното очакваното разпределение наразпределение на статистикатастатистиката t t ще бъдеще бъде::

s XX

XXt21

21

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т (p

)

t

чес

тота

X1 X2

| |X X1 2

Sample 2Sample 1

Page 13: Критерии за различие

Нека предположим, че Нека предположим, че tt = 2.01 = 2.01

Каква е вероятността Каква е вероятността да получим стойност да получим стойност поне толкова голяма поне толкова голяма при условие, че при условие, че HH00 е е вярна? вярна?

Тъй катоТъй като pp е малкае малка, , то то изглежда малко изглежда малко вероятно вероятно HH00 да е да е вярнавярна..

Следователно Следователно отхвърлямеотхвърляме HH0.0.

-3 -2 -1 0 1 2 3

Pro

bab

ility t = 2.01

Fre

qu

en

cy

X1 X2

| |X X1 2

Sample 2Sample 1

Page 14: Критерии за различие

Какво в превод означава Какво в превод означава конкретна стойност на конкретна стойност на pp??

АкоАко pp < 0.05, < 0.05, отхвърляме нулевата отхвърляме нулевата хипотеза, но хипотеза, но ...... не забравяме не забравяме pp

СъобщавамеСъобщаваме pp, , без “достоверни” или без “достоверни” или “недостоверни”“недостоверни”

ПомнимПомним, , че съгласието “че съгласието “pp < 0.05 < 0.05”” е е изцяло условноизцяло условно!!

Page 15: Критерии за различие

ДопусканияДопускания

pp се изчислява при допускането, че се изчислява при допускането, че tt разпределението разпределението == на известното в на известното в статистиката разпределение на статистиката разпределение на StudentStudent ttss,,

Това допускане е вярно само когато Това допускане е вярно само когато данните са нормално разпределениданните са нормално разпределени..

Page 16: Критерии за различие

Разпределение наРазпределение на Student Student

Рапределението Рапределението зависи от зависи от d.f.d.f.

Една и съща Една и съща разлика ще даде разлика ще даде различна различна вероятноствероятност

При При d.f.d.f.=30 =30 разпределението е разпределението е почти нормалнопочти нормално

-5 -4 -3 -2 -1 0 1 2 3 4 50.0

0.1

0.2

0.3

0.4

-5 -4 -3 -2 -1 0 1 2 3 4 5

t

0.0

0.1

0.2

0.3

0.4

ве

ро

ятн

ос

т

df=2df=1000

Page 17: Критерии за различие

tt versusversus Student Student t tss

Изчисляването наИзчисляването на pp допускадопуска pp((tt) = ) = pp((ttss).).

Колкото данните се Колкото данните се отклоняват повече от отклоняват повече от нормалнотонормалното,, толкова толкова разликата между разликата между вероятностите се вероятностите се увеличаваувеличава

СледователноСледователно, , изчислената стойност изчислената стойност нана pp не е вярнане е вярна

t, по-силно отклонение от нормалнотоtпо-слабо отклонение от нормалното

ts разпределение на Student

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т (p

)

Page 18: Критерии за различие

Увеличаваме обема на извадкатаУвеличаваме обема на извадката..

Трансформираме даннитеТрансформираме данните..

Използваме друг непараметричен Използваме друг непараметричен тест, който да не изисква тест, който да не изисква нормалност на разпределениетонормалност на разпределението..

Какво да правим, ако Какво да правим, ако разпределението не е разпределението не е

нормално инормално и pp е близка дое близка до ??

Page 19: Критерии за различие

Транформация на даннитеТранформация на данните Като математически функции:Като математически функции: log( log(XX), sqrt(), sqrt(XX), ),

arcsin(arcsin(XX)) На базата на опита и грешкатаНа базата на опита и грешката.. Съществуват алгоритми, за опростяване на Съществуват алгоритми, за опростяване на

задачата.задачата. проблемпроблем 1 1: : търсенето на подходяща търсенето на подходяща

трансформация често е много труднотрансформация често е много трудно проблемпроблем 2 2: : някои данни не могат да бъдат някои данни не могат да бъдат

нормализиранинормализирани

Page 20: Критерии за различие

Едно- и дву-странна Едно- и дву-странна нулева хипотезанулева хипотеза

((One- and two-tailed)One- and two-tailed)

При При 2-tailed 2-tailed HH00

има 2 области има 2 области на отхвърляне на отхвърляне с големинас големина /2./2.

ПриПри 1-tailed 1-tailed HH00

има 1 област има 1 област на отхвърляне на отхвърляне с големинас големина ..

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т

-3 -2 -1 0 1 2 3

t

1-

1- 1-

Page 21: Критерии за различие

2-tailed 2-tailed HH00

Няма различия между Няма различия между генералните генералните съвкупностисъвкупности

HH00: : 11 = = 22

Ще отхвърлимЩе отхвърлим HH00 ако: ако:

11 - - 22 > > 0 0 илиили 11 - - 22 < < 0. 0.

HH11: : 11 22

чес

тота

X1 X2

| |X X1 2

Sample 2Sample 1

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т

- Алтернативна хипотеза- Алтернативна хипотеза

Page 22: Критерии за различие

1-tailed 1-tailed HH00

Средно индивидите от Средно индивидите от едната съвкупностедната съвкупност са по-са по-големи от другата големи от другата съвкупностсъвкупност

HH00: : 11 - - 22 0 0

Ще отхвърлимЩе отхвърлим HH00 само само

ако ако 11 - - 22 > 0 > 0

HH11: : 11 - - 22 0 0

Fre

qu

en

cy

X1 X2

| |X X1 2

Sample 2Sample 1

-3 -2 -1 0 1 2 3P

rob

abili

ty

- Алтернативна хипотеза- Алтернативна хипотеза

Page 23: Критерии за различие

ЕдностраннаЕдностранна versusversus двустранна нулева хипотезадвустранна нулева хипотеза

2-tailed 2-tailed хипотезахипотеза: : отхвърля се отхвърля се независимо от независимо от наблюдавания моделнаблюдавания модел..

1-tailed 1-tailed хипотезахипотеза: : отхвърля се само при отхвърля се само при определен моделопределен модел

чес

тота

X1 X2

| |X X1 2

Sample 2Sample 1

Page 24: Критерии за различие

ВажноВажно!! Тестът при Тестът при

едностранна едностранна HH00 е е

по-мощен, отколкото по-мощен, отколкото при двустраннапри двустранна

ЗатоваЗатова HH00 трябва да трябва да

се формулира преди се формулира преди да се извършат да се извършат изчислениятаизчисленията

2 3

ве

ро

ятн

ос

т

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т

Page 25: Критерии за различие

Видове грешкиВидове грешки

Има 2 типа грешки при приемане или Има 2 типа грешки при приемане или отхвърляне на нулевата хипотеза:отхвърляне на нулевата хипотеза:

I I тип грешкатип грешка ((): ): вероятността да вероятността да отхвърлим правилна нулева хипотезаотхвърлим правилна нулева хипотеза

II II тип грешкатип грешка ((): ): вероятността да вероятността да приемем невярна нулева хипотезаприемем невярна нулева хипотеза

Page 26: Критерии за различие

Грешки при тестовете за Грешки при тестовете за различияразличия

реалност

решение H0 е вярна H0 е грешна

приемаме H0

отхвърляме H0

правилно

правилно

Page 27: Критерии за различие

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

f

0.00

0.05

0.10

0.15

0.20

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

f

0.00

0.05

0.10

0.15

0.20

α/2 α/2

ß 1-ß

H0 ♀:♂=1:1

H1 ♀:♂=2:1

1-α

Page 28: Критерии за различие

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

f

0.00

0.05

0.10

0.15

0.20

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

f

0.00

0.05

0.10

0.15

0.20

ß 1-ß

H0 ♀:♂=1:1

H1 ♀:♂=2:1

α/21-α

Page 29: Критерии за различие

Когато α намалява

1 - α се увеличава ß нараства

- І тип грешка

- област на приемане

- ІІ тип грешка

Page 30: Критерии за различие

Сила на тестаСила на теста

Вероятността тестът да открие различия, Вероятността тестът да открие различия, когато те наистина съществуват.когато те наистина съществуват.

Силата на теста Силата на теста ≥ 0.8≥ 0.8

Page 31: Критерии за различие

Сила на тестаСила на теста Силата на теста е вероятността да Силата на теста е вероятността да

отхвърлим нулевата хипотеза, когато тя е отхвърлим нулевата хипотеза, когато тя е грешна, а алтернативната хипотеза е вярна грешна, а алтернативната хипотеза е вярна т.е.т.е. 1- 1- ..

Силата на теста се изчислява само при Силата на теста се изчислява само при конкретна алтернативна хипотеза и зависи конкретна алтернативна хипотеза и зависи от нея. от нея.

Тестове с по-голяма сила могат да открият Тестове с по-голяма сила могат да открият по-малки различия, тестове с по-малка сила по-малки различия, тестове с по-малка сила могат да докажат само по-големи различия. могат да докажат само по-големи различия.

Page 32: Критерии за различие

Сила на теста Сила на теста зависи от:зависи от: Конкретния тестКонкретния тест Нивото на значимост Нивото на значимост Обема на извадкатаОбема на извадката Алтернативната хипотезаАлтернативната хипотеза Минималната разлика,Минималната разлика, която може да регистриракоято може да регистрира Вариацията в извадкитеВариацията в извадките

Page 33: Критерии за различие

ІІ тип грешка и сила на тестаІІ тип грешка и сила на теста

40 45 50 55 60

H0: = 0 H1: = 1

1=54

1=53

1=50

1=48.5

=0.0096

=0.0018

0=45.5

=0.2676

=0.5948

Нарастването на ІІ Нарастването на ІІ тип грешкатип грешка , , води води до намаляване на до намаляване на силата на тестасилата на теста

Приближаването Приближаването на алтернативната на алтернативната хипотеза до хипотеза до нулевата води до нулевата води до увеличаване на ІІ увеличаване на ІІ тип грешка и тип грешка и намаляване на намаляване на силата на тестасилата на теста

Page 34: Критерии за различие

Зависимост на силата на Зависимост на силата на теста от обема на извадкататеста от обема на извадката

Крива на силата на Крива на силата на теста когатотеста когато H H00: : = 45.5 = 45.5

HH11: : 45.5 45.5 заза

n = 5 n = 5 ии n = 35. n = 35. За дадена стойност За дадена стойност

вероятността да вероятността да отхвърлим грешната отхвърлим грешната HH00 намалява с намалява с намаляване на обема намаляване на обема на извадкатана извадката

35 40 45 50 55

1.0

0.5

0

дължина (x 0.1 mm)

Сил

а на

тес

та (

1-)

n = 5

n = 35

Page 35: Критерии за различие

Защо трябва наблюденията да Защо трябва наблюденията да са независимиса независими??

Ако наблюденията не Ако наблюденията не са независими, тогава са независими, тогава истинските истинските d.f. d.f. ще са ще са по-малко, отколкото по-малко, отколкото изчисленитеизчислените… …

Разпределението, въз Разпределението, въз основа на което основа на което изчисляваме изчисляваме pp ще ще бъде грешнобъде грешно … …

… … pp ще бъде по-ще бъде по-малко, отколкото би малко, отколкото би трябвалотрябвало

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

тt

изчислениdf

истинскиdf

изчисленаt

Page 36: Критерии за различие

t-тест на Student

William Sealey Gosset (Student)(1876 - 1937)

Page 37: Критерии за различие

21

2121

xxs

xxt

Оценка на разликата междусредните аритметични

t-тест на Student

210 : H

d.f. = (n1-1) + (n2-1) = n1 + n2 -2

Page 38: Критерии за различие

0 210 Hсъгласно

dxx s

d

s

xxt

21

21

d - разликата между средните Sd - грешка на извадъчната разлика

Page 39: Критерии за различие

22

21

22

21

1

обема от независимо

n

21ss

nsss

nnпри

xxd

Стандартна грешка на разликатамежду средните аритметични

Page 40: Критерии за различие

21

21

21

22

21

21

2

30n

nn

nn

nn

xxxxs

nпри

iid

Стандартна грешка на разликатамежду средните аритметични

Page 41: Критерии за различие

1

22

2

21

21 30n

n

s

n

ss

nпри

d

Стандартна грешка на разликатамежду средните аритметични

Page 42: Критерии за различие

t t stАко

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между средните аритметични

е ДОСТОВЕРНА

Такава разлика по знак ще има и междусредните аритметични на генералнитесъвкупности.

Page 43: Критерии за различие

t t stАко

Нулевата хипотеза ОСТАВА.Разликата между средните аритметични

е НЕДОСТОВЕРНА

1. По извадъчната разлика не може да се направи оценка на генералната разлика2. Остава недоказано както наличието, така и отсъствието на разлика 3. Остава неизяснено коя от генералните средни е по-голяма

Page 44: Критерии за различие

Сте

пен

и н

а св

обод

аНиво на значимост

Page 45: Критерии за различие

Правилното използване на теста на Student

ИЗИСКВА

1. Нормално разпределение 2. Равенство на дисперсиите

Page 46: Критерии за различие

След пречиствателните станции се създават изкуственивлажни зони от тръстикови масиви за допълнително пречистване на биогенните елементи, разтворени във водата. Важен показател за ефективността на пречист-ването е химичното потребление на кислорода ХПК, представляващ мярка за количеството кислород, необходимо за окисление на наличната органика в отпадъчните води.

Page 47: Критерии за различие

ХПК1 [mg l-1] над тръстиковия масив

3.53 3.81 2.88 3.32 4.14 3.04 3.45 3.75

4.29 3.14 3.22 2.61 3.1 3.68 4.52

ХПК2 [mg l-1] под тръстиковия масив

2.98 3.42 3.18 2.80 2.60 3.61 3.09 3.27

2.36 3.82 2.88 3.17

Page 48: Критерии за различие

Normality Test: Passed (P = 0.8733)

Equal Variance Test: Passed (P = 0.1998)

Group N Missing ХПК1 15 0 ХПК2 12 0

Group Mean Std Dev SEM ХПК1 3.4987 0.53832 0.13899 ХПК2 3.0983 0.41248 0.11907

Difference 0.40033

t = 2.1226 with 25.000 degrees of freedom. (P = 0.0439)

95 percent confidence interval for difference of means: 0.011897 to 0.78877

Page 49: Критерии за различие

?

Page 50: Критерии за различие

Доверителен интервална разликата между

средните аритметични

dstxx значимост

на ниво2121 : -

Page 51: Критерии за различие

F-тест на Fisher

Проверка за равенство на дисперсиите

212

0

2

: H

Page 52: Критерии за различие

22

212

2

21 при sss

sF

F1 (при равни дисперсии F=1)

d.f.1 = n1-1 d.f.2 = n2-1

Page 53: Критерии за различие

При FFst Нулевата хипотеза се отхвърля Дисперсиите са различни

При F<Fst Нулевата хипотеза за равенство на дисперсиите остава.

Page 54: Критерии за различие

d.f.1

d.f.2

Page 55: Критерии за различие

50.40073.0

0331.0F

84.1stFпри α = 0.05 n1 = 30, n2 = 30

FFst Нулевата хипотеза се отхвърля Дисперсиите са различни

Сравнени са лабораторнаи изходна популация на Aphis gossypii по отношениена изменчивостта на белега дължина на сифоните.

Page 56: Критерии за различие

Чифтен критерий на Student

Параметричен критерий за различиемежду средните аритметични на извадки

с по двойки свързани варианти.

0 : 210 H

Page 57: Критерии за различие

ds

dt

11

22

2

nn

n

dd

nn

dds

ii

id

d.f. = n - 1

Чифтен критерий на Student

Page 58: Критерии за различие

t t stАко

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между средните аритметични

е ДОСТОВЕРНА

t t stАко

Нулевата хипотеза ОСТАВА.Разликата между средните аритметични

е НЕДОСТОВЕРНА

Page 59: Критерии за различие

Изследване на нервни клетки от гръбначния мозък на Rhesus maccacus. Нервите, от лявата страна са прерязвани, докато тези от дясната страна са запазвани цялостни. През време на регенерационния процес е измервано съдържанието на креатин фосфат CP на двойките неврони. Мерната единица е mg CP за 100 g тъкан.

Page 60: Критерии за различие

D 16.3 4.8 10.9 14.2 16.3 9.9 29.2 22.4

L 11.5 3.6 12.5 6.3 15.2 8.1 16.6 13.1

Съдържание на креатин фосфат[mg CP / 100g]

n = 8

Page 61: Критерии за различие

T-test for Dependent Samples

Std.Dv.Diff.Mean Std.Dv. N Diff.

D 15.5 7.609017

L 10.8625 4.488378 8 4.6375 4.885821

t df p

2.684673 7 0.031326

Page 62: Критерии за различие

T-test for Independent Samples

Note: Variables were treated as independent samples

Mean Mean

D L t-value df p

15.5 10.8625 1.484782 14 0.159767

ГрешноГрешно!!

Стандартната грешка е по-голяма стойността на t-теста е по-малка

d.f. са по-големи

Стойността на Стойността на рр ще е по-голяма ще е по-голяма

Реално съществуващи различия могат да Реално съществуващи различия могат да не бъдат доказани!не бъдат доказани!

Page 63: Критерии за различие

НЕПАРАМЕТРИЧНИКРИТЕРИИ ЗА

РАЗЛИЧИЕ

Page 64: Критерии за различие

U - тест на Mann-Whitney

Ho - Извадките принадлежат към генерални съвкупности с еднакви медиани

Непараметричен тест за сравняване на медиани

Page 65: Критерии за различие

приложениеприложение

Количествени белезиКоличествени белези, при които едно , при които едно или двете условия за използване на или двете условия за използване на t-t-тестатеста не са спазенине са спазени

Качествени белези Качествени белези (ordinal scale)(ordinal scale)

Page 66: Критерии за различие

Алгоритъм

1. Вариантите в двете извадки се подреждат по големина - от най-малката стойност до най-голямата

2. За всеки вариант от едната извадка се преброяват вариантите от другата извадка с по-малка стойност.

Page 67: Критерии за различие

При еднакви стойности, се отчита При еднакви стойности, се отчита 0.50.5

3. За стойност на U-test се приема по-малката от двете суми на тези стойности

4. Сравнява се стойността на U-testс критичната стойност при приетото ниво на значимост и обемите на двете извадки

Page 68: Критерии за различие

Критични стойности на теста наMann-Whitney при ниво на значимост

и обем на извадките

Page 69: Критерии за различие

U U stАко

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между медианите

е ДОСТОВЕРНА

Такава разлика по знак ще има и междумедианите на генералните съвкупности.

Page 70: Критерии за различие

Ако

Нулевата хипотеза ОСТАВА.Разликата между медианите

е НЕДОСТОВЕРНА

По извадъчната разлика не може да се направи оценка на генералната разлика

U U st

Page 71: Критерии за различие

ІІ извадка 2 4 5 9 12 17 19 0 0 0 1 1.5 3 3

8 12 15 21 25 44 44 60

2 4 5 9 12 17 19

І извадка

ІІ извадка

І извадка 8 12 15 21 25 44 44 60 3 4.5 5 7 7 7 7 7

5.8

5.47

Page 72: Критерии за различие

UU

108.5

st

При ниво на значимост 5%,

критичната стойност на теста е 10

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между медианите

е ДОСТОВЕРНА

Page 73: Критерии за различие

Измерена е дължината на основата на хелицеритена извадки от две популации на Trombicula lipovskyi

104 109 112 114 116 118 118 119

121 123 125 126 126 128 128 128

100 105 107 107 108 111 116 120

121 123            

Page 74: Критерии за различие

Group N Median 25% 75% 1 16 120 115 126

2 10 109 107 120

T = 91,500 n (small)= 10 n (big)= 16 (P = 0,023)

Page 75: Критерии за различие

Различие между две популации на Trombicula lipovskyi по

дължината на основата на хелицерите

Page 76: Критерии за различие

Тест на Wilcoxon за свързани по двойки наблюдения

Wilcoxon’s signed-ranks test

Ho - Извадките принадлежат към генерални съвкупности с еднакви медиани

Непараметричен тест за сравняване на медиани

Page 77: Критерии за различие

Алгоритъм

1. За всяка двойка наблюдения, се изчислява разликата - d

2. Поставят се поредни номера - РАНГОВЕ на тези разлики, според абсолютната им стойност

Page 78: Критерии за различие

Не се взимат под внимание двойките Не се взимат под внимание двойките наблюдения, чиято разлика е нула ! ! !наблюдения, чиято разлика е нула ! ! !

3. Изчисляват се сумите от ранговете на отрицателните и положителните разлики

4.4. Взима се по-малката от двете суми стойност и се сравнява с критичната стойност на теста при избраното ниво на значимост.

Page 79: Критерии за различие

Критични стойности на теста наWilcoxon при избрано ниво на значимост

и дадения обем на извадките

Page 80: Критерии за различие

TT stАко

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между медианите

е ДОСТОВЕРНА

Такава разлика по знак ще има и междумедианите на генералните съвкупности.

Page 81: Критерии за различие

Ако

Нулевата хипотеза ОСТАВА.Разликата между медианите

е НЕДОСТОВЕРНА

По извадъчната разлика не може да се направи оценка на генералната разлика

TT st

Page 82: Критерии за различие

Изследване върху телесната маса [g] на eдин вид коприварче, преди периода на

миграция през август и септември

10.311.410.912.010.011.912.212.311.712.0

+1.9+0.7+2.2-0.1+2.0+1.0-0.8-0.2+1.8+0.3

8 410 1 9 6 5 2 7 3

+++-++--++

8

47

12.212.113.111.912.012.911.412.113.512.3

Page 83: Критерии за различие

stTT

88

При ниво на значимост 5%,

критичната стойност на теста е 88

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между медианите

е ДОСТОВЕРНА

Page 84: Критерии за различие

Group N Median 25% 75% 1 10 11,80 10,90 12,00 2 10 12,15 12,00 12,90

W= 39,000 T+ = 47,000 T- = -8,000 P (est.)= 0,053 P (exact)= 0,049

Page 85: Критерии за различие

Сравнение на телесната маса [g] на eдин вид коприварче, преди периода на миграция

през август и септември

Page 86: Критерии за различие

статистическа достоверност

не е равна нане е равна на биологическа значимост

Page 87: Критерии за различие
Page 88: Критерии за различие
Page 89: Критерии за различие

Тест на Колмогоров-Смирнов

сравняване на емпирични и теоретични натрупани честоти тест за нормалност на разпределението

сравняване на емпирични натрупани честоти

Приложение

Page 90: Критерии за различие

Тест на Колмогоров-Смирнов

Ho – Няма разлика между теоретичните и емпиричните натрупани честоти т.е. Разпределението се счита за

нормално

Тест за нормалностна разпределението

Page 91: Критерии за различие

Колмогоров-СмирновКолмогоров-Смирнов Сравнява Сравнява

наблюдавани наблюдавани натрупани честоти и натрупани честоти и очаквани натрупани очаквани натрупани честоти според честоти според Ho Ho

pp се основава на се основава на максималната максималната абсолютна разлика абсолютна разлика между тяхмежду тях

Dmax

X

0.2

0.4

0.6

0.8

1.0

На

тру

па

ни

че

сто

ти

Page 92: Критерии за различие

di+ = │Fi –F’│

di- = │Fi-1 –F’│

D = най-голямата разлика

F’ - теоретична натрупана честота в дадена стъпкаFi - емпирична натрупана честота в тази стъпкаFi-1 - емпирична натрупана честота преди тази стъпка

Page 93: Критерии за различие

Ако

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между натрупаните честоти

е ДОСТОВЕРНА

Разпределението не е нормално

stDD

Page 94: Критерии за различие

Ако

Нулевата хипотеза ОСТАВА.Разликата между натрупаните честоти

носи случаен характер

Разпределението се счита за нормално

stDD

Page 95: Критерии за различие

Ако Р Ако Р ≤≤ различията са достоверни различията са достоверни

Разпределението не е нормалноРазпределението не е нормално

Ако Р Ако Р >> различията са недостоверни различията са недостоверни

Разпределението се счита нормалноРазпределението се счита нормално

Page 96: Критерии за различие

xx tt F’F’ FF d+d+ d-d-

1.411.41 -1.64-1.64 0.050.05 0.080.08 0.030.03 0.050.05

2.502.50 -1.47-1.47 0.070.07 0.160.16 0.090.09 0.010.01

4.194.19 -1.21-1.21 0.110.11 0.250.25 0.140.14 0.040.04

9.529.52 -0.39-0.39 0.350.35 0.330.33 0.020.02 0.100.10

11.3011.30 -0.12-0.12 0.450.45 0.420.42 0.030.03 0.120.12

14.4014.40 0.360.36 0.640.64 0.500.50 0.140.14 0.220.22

14.9014.90 0.440.44 0.670.67 0.580.58 0.090.09 0.170.17

15.2015.20 0.490.49 0.680.68 0.670.67 0.010.01 0.100.10

15.3915.39 0.520.52 0.700.70 0.750.75 0.050.05 0.030.03

15.8115.81 0.580.58 0.710.71 0.830.83 0.120.12 0.040.04

17.2517.25 0.800.80 0.790.79 0.920.92 0.130.13 0.040.04

22.7022.70 1.641.64 0.950.95 1.001.00 0.050.05 0.030.03

Page 97: Критерии за различие

Ðàçï ðåäåëåí èå í à í àòðóï àí èòå÷åñòî òè

ì àñà [gr]

0 5 10 15 20 25

íàò

ðóï

àíà

÷åñ

òîòà

0

1

òåî ðåòè÷í à ÷åñòî òàåì ï èðè÷í à ÷åñòî òà

Page 98: Критерии за различие

D = 0.22Dst = 0.37, α=0,01

stDD

Normality Test (Kolmogorov-Smirnov)

K-S Distance = 0.2250 P = 0.0949

Разпределението може да се считаРазпределението може да се счита

за нормалноза нормално

Page 99: Критерии за различие

праг на праг на вероятноствероятност

Об. биоста-Об. биоста-

тистическитистически

методиметоди

Различия в Различия в разпределенияразпределения

0.95 0.95 ((αα = 0.05) = 0.05) обикновенаобикновена повишенаповишена

0.90.999 ((αα = 0.01) = 0.01) повишенаповишена обикновенаобикновена

0.90.99999 ((αα = = 0.001)0.001)

високависока пониженапонижена

Отговорност на изследванетоОтговорност на изследването

Page 100: Критерии за различие

Eucera M.leporina

Изследвана е разликата в сезонната динамика на двавида Eucera clypeata и Melitta leporina - опрашители на люцерната. Направен е количествен сбор на двата вида в активния период от края на май до началото на август. Материалът е събиран през 10 дена (декада).

Page 101: Критерии за различие

Сравнение на сезонната динамиката на видоветеСравнение на сезонната динамиката на видоветеEucera clypeataEucera clypeata ии Melitta leporinaMelitta leporina

ІвидІвид ІІвидІІвид

11 V3V3 6464 00

22 VI1VI1 7474 22

33 VI2VI2 1515 1616

44 VI3VI3 2929 66

55 VII1VII1 22 3434

66 VII2VII2 44 174174

77 VII3VII3 11 144144

88 VIII1VIII1 00 77

Page 102: Критерии за различие

Case Number

87654321

Va

lue

200

100

0

E. clypeata

M. leporina

Сравнение на сезонната динамиката на видоветеСравнение на сезонната динамиката на видоветеEucera clypeataEucera clypeata ии Melitta leporinaMelitta leporina

Page 103: Критерии за различие

Критерий на Колмогоров- Смирнов

J

j

jJ

j

j

n

n

n

n

1 2

2

1 1

1 и

21

21

1 2

2

1 1

1 - maxnn

nn

n

n

n

n J

j

jJ

j

j

n1j и n2j - броя на индивидите на двата вида през jтия период от време

Натрупаните честоти на индиви- дите на двата вида през jтия период от време

Page 104: Критерии за различие

Eucera clypeataEucera clypeata ии Melitta leporinaMelitta leporina

ІвидІвид ІІвидІІвид ІвидІвид ІІвидІІвид ІвидІвид ІІвидІІвид

11 V3V3 6464 00 6464 00 .338.338 00 .338.338

22 VI1VI1 7474 22 138138 22 .729.729 .005.005 .724.724

33 VI2VI2 1515 1616 153153 1818 .809.809 .047.047 .762.762

44 VI3VI3 2929 66 182182 2424 .962.962 .063.063 .899.899

55 VII1VII1 22 3434 184184 5858 .972.972 .152.152 .820.820

66 VII2VII2 44 174174 188188 232232 .995.995 .606.606 .389.389

77 VII3VII3 11 144144 189189 376376 11 .981.981 .019.019

88 VIII1VIII1 00 77 189189 383383 11 11 00

Бройиндивиди

Натрупаначестота

Дяловенатрупана

честота разл

ика

Page 105: Критерии за различие

01.001.0 63.1 Различията са достоверни

99.9383189

383189899,0

Page 106: Критерии за различие

Критерий на Пирсон χ2

сравняване на емпирични и теоретични разпределения сравняване на две емпирични разпределения разпадане на хибриди таблици 2х2

Приложение

Page 107: Критерии за различие

Различия между разпределенияРазличия между разпределения

20 30 40 50 60 дължина

0

10

20

30

чес

тоти

Наблюдавани честоти

Очаквани честоти

Page 108: Критерии за различие

Fork length

очакванинаблюдавани

0

20

30

чес

тоти

20 30 40 50 600

10

20

30

отхвърлянена H0

приеманена H0

Page 109: Критерии за различие

22

1

i i

ii

n f f

f

( )

чес

тоти

клас/категория

наблюдаваниочаквани

Критерий на Пирсон χ2

i

i

f

f

ˆемпирична честота

теоретична честота

Page 110: Критерии за различие

Buteo buteo (обикновен мишелов)

Изследвано е пространственото разпределение на гнездата на обикновения мишелов Buteo buteo. На даденатеритория са обособени 60 квадрата с по 4 km2 площи са преброени гнездата на този вид за всички квадрати.

Page 111: Критерии за различие

брой гнезда 0 1 2 3 4 5+

честота 4 22 15 10 7 2

теор.

честота 8.1 16.2 16.2 10.8 5.4 3.2

Page 112: Критерии за различие

0 1 2 3 4 5

֌

ñòî

òà

0

5

10

15

20

25

åì ï èðè÷í è ÷åñòî òèòåî ðåòè÷í è ÷åñòî òè

Χ2 = 5.1815

Χ2st = 9,49

при α = 0,05и d. f. = 4

Заключение: Пространственото разпределение на гнездата на Buteo buteo е случайно.

Χ2 < Χ2st

H0 остава

Page 113: Критерии за различие

Степени на свобода при сравняване на Степени на свобода при сравняване на емпирични с теоретични честотиемпирични с теоретични честоти

Нормално разпределениеНормално разпределение

d.f. = k – 3, d.f. = k – 3, k – k – броя класовеброя класове Биномно разпределениеБиномно разпределение

d.f. = k – d.f. = k – 22, , k – k – броя класовеброя класове Поасоново разпределениеПоасоново разпределение

d.f. = k – d.f. = k – 22, , k – k – броя класовеброя класове

Page 114: Критерии за различие

Изследване на унаследяването на цвета Изследване на унаследяването на цвета ((червен, розов и бялчервен, розов и бял)) на цветовете на на цветовете на

AntirrhinumAntirrhinum majusmajus ((лъвска муцункалъвска муцунка))

При кръстосване на хетерозиготни индивиди При кръстосване на хетерозиготни индивиди са се получили 10 червени, 21 розови и 9 бели.са се получили 10 червени, 21 розови и 9 бели.

Тези резултати съответстват ли на Тези резултати съответстват ли на теоретичното разпадане - 1:2:1 ?теоретичното разпадане - 1:2:1 ?

Page 115: Критерии за различие

Унаследяването на цвета Унаследяването на цвета на на AntirrhinumAntirrhinum majusmajus

ЧервениЧервени РозовиРозови белибели

бройброй

цветовецветове1010 2121 99

очакваночакван

бройброй

¼ х 40 =¼ х 40 =

1010

½ х 40 =½ х 40 =

2020

¼ х 40 =¼ х 40 =

1010

Page 116: Критерии за различие

22

1

i i

ii

n f f

f

( )

d.f. = (r - 1)(c - 1)

Observed vs. Expected Frequencies Chi-Square = 0,15 df = 2 p < 0,927

observed expected (O – E) (O-E)**2 / EC: 1 10 10 0 0,00C: 2 21 20 1 0,05C: 3 9 10 -1 0,10Sum 40 40 0 0,150,15

Разпадането по този белег е 1:2:1 Разпадането по този белег е 1:2:1

Page 117: Критерии за различие

Таблици 2х2Таблици 2х2

ff1111 ff1212 RR11

ff2121 ff2222 RR22

CC11 CC22 nn

Page 118: Критерии за различие

Критерий на Пирсон χ2с поправка на Yates

(за изясняване на степента на достоверност на връзката между два белега)

2121

2

211222112 2

CCRR

nffffn

X

d.f. = (r - 1)(c - 1) 2x2 d.f. = 1

Page 119: Критерии за различие

sp1sp1 sp2sp2 общообщо

без без паразитипаразити 1818 1010 2828

с с паразитипаразити 66 1515 2121

общообщо 2424 2525 4949

Изследвани извадки от 2 вида мишки заналичие на чревни паразити.Ho: р1 = p2 H1: р1 p2

Page 120: Критерии за различие

779,421.28.25.24

549

6.1015.18492

2

X

Χ2st = 3,841

при α = 0,05и d. f. = 1

Χ2 > Χ2st

H0 се отхвърля

Заключение: Честотата на инфектираните с чревни паразити популации не е една и съща при двата вида.

Page 121: Критерии за различие
Page 122: Критерии за различие

Row

Column 1 Column 2 Totals

Frequencies, row 1 18 10 28

Percent of total 36.735% 20.408% 57.143%

Frequencies, row 2 6 15 21

Percent of total 12.245% 30.612% 42.857%

Column totals 24 25 49

Percent of total 48.980% 51.020%

Yates corrected Chi-square 4.78 p= .0288

Page 123: Критерии за различие

Морската звезда Pisaster ochraceus се среща в 3 цветовиморфи – кафява, оранжева и лилава. Изследвани са 2 локални популации в Орегон - Seal rock и Yaquina Head. От тях, по време на отлива са събрани случайни извадки с големина съответно 143 и 149. Отчитан е броя на морските звезди от всяка морфа.

Page 124: Критерии за различие

лилави кафявиоранжев

иобщо

Seal rock 38 72 33 143

очакванаочаквана 28,89 86,19 27,91

Yaquina Head

21 104 24 149

очакванаочаквана 30,11 89,81 29,09

общо 59 176 57 292

Примерно изчисление:Лилави: 38 + 21 = 59 общо.

Относителна честота: 59 / 292 = 0,20Очакван брой 0,20 х 143 = 28,89

Page 125: Критерии за различие

Χ2 = 2.870 + 2.337 + 0.927 + 2.754 + 2.243 + 0.889

Χ2 = 12.019 при df = 2, p = 0.003

Критична стойност - 5.991 при = 0.05 и df = 2.

22

1

i i

ii

n f f

f

( )

12.019 5.991 - нулевата хипотеза се отхвърля

Заключение: Съотношението между цветовите форми на Pisaster ochraceus се различават достоверно между двете популации.

d.f. = (r - 1)(c - 1)

Page 126: Критерии за различие

Fisher exact testFisher exact testако честотите < 5

McNemar testMcNemar testако данните са свързани по двойки