38
1 Вариационен анализ Вариационен анализ Кликни върху бутона Хайде да започваме... FAQ FAQ Гиги Гиги & & Гого Гого

Вариационен анализ

  • Upload
    espen

  • View
    48

  • Download
    3

Embed Size (px)

DESCRIPTION

FAQ Гиги & Гого. Вариационен анализ. Хайде да започваме. Кликни върху бутона. Какво постижение в 30 м. гл. б. имат 12 г. футболисти?. Трудно е да се отговори с една дума, защото: Отделните футболисти имат различни постижения; - PowerPoint PPT Presentation

Citation preview

Page 1: Вариационен анализ

11

Вариационен анализВариационен анализ

Кликни върху бутона

Хайде да започваме...

FAQFAQ Гиги Гиги && Гого Гого

Page 2: Вариационен анализ

22

Какво постижение в 30 м. гл. б. имат 12 г. футболисти?

Трудно е да се отговори с една дума, защото:

1. Отделните футболисти имат различни постижения;

2. Все пак има някакво общо, типично състояние, характеризиращо цялата група.

Page 3: Вариационен анализ

33

Пол

Тренираност

Мотивация

Инд. особености

Вид спорт

Възраст

30 м. гл. б.Постиженията в 30 м. гл. б. се формират под влияние на редица:

•Закономерни фактории

•Случайни фактори

Действието на закономерните фактори формира типичното състояние на признака;

Действието на случайните фактори води до разсейване на признака

Page 4: Вариационен анализ

44

За средно равнищеЗа средно равнище

За разсейванеЗа разсейване

За нормалност на разпределениетоЗа нормалност на разпределението

Вариационният анализ дава възможност Вариационният анализ дава възможност да се опише детайлно разпределението да се опише детайлно разпределението

на количествени променливи. на количествени променливи.

Той включва 3 групи показателиТой включва 3 групи показатели::

Вариационният анализ дава възможност Вариационният анализ дава възможност да се опише детайлно разпределението да се опише детайлно разпределението

на количествени променливи. на количествени променливи.

Той включва 3 групи показателиТой включва 3 групи показатели::

Какво ли значи това?

Какво ли значи това?

Page 5: Вариационен анализ

55

Показатели за средно равнищеПоказатели за средно равнище

МодаМода – стойността, която се – стойността, която се среща най-много пътисреща най-много пъти

МедианаМедиана – стойността, която се – стойността, която се намира в средата на намира в средата на вариационния редвариационния ред

Средна аритметична величинаСредна аритметична величина

n

XX

n

XX

Те описват типичното,

характерното състояние на

признака.

Те описват типичното,

характерното състояние на

признака.

ii 11 22 33 44 55

XX 7 7 8 9 11Това е

лесно...

Mo = 7

Me = 8

X = 8.4

Това е лесно...

Mo = 7

Me = 8

X = 8.4

Page 6: Вариационен анализ

66

ii 11 22 33 44 55 66

XX 7 8 8 9 9 11

ii 11 22 33 44 55 66

XX 7 7 8 9 9 11

ii 11 22 33 44 55 66

XX 7 7 8 8 9 9

Две съседни стойности се повтарят еднакъв,

максимален брой пъти, модата е полусумата на тези

стойности, т.е.

Mo=8.5

Средата на вариационния ред е между 3-тата и 4-тата

стойност, т.е.

Me = 8.5

Две съседни стойности се повтарят еднакъв,

максимален брой пъти, модата е полусумата на тези

стойности, т.е.

Mo=8.5

Средата на вариационния ред е между 3-тата и 4-тата

стойност, т.е.

Me = 8.5

Две несъседни стойности се повтарят еднакъв брой пъти -

разпределението има две моди:

Mo=7 и Мо=9

Две несъседни стойности се повтарят еднакъв брой пъти -

разпределението има две моди:

Mo=7 и Мо=9

Няма стойност, която се повтаря повече от останалите

- разпределението

няма мода

Няма стойност, която се повтаря повече от останалите

- разпределението

няма мода

Ако имаме следните данни:

Page 7: Вариационен анализ

77

Четирима приятели решихме да упражним Четирима приятели решихме да упражним наученото, като определим средно с колко наученото, като определим средно с колко пари разполагаме в момента. След щателно пари разполагаме в момента. След щателно търсене в джобовете ни се оказа, че търсене в джобовете ни се оказа, че разполагаме с:разполагаме с:

1лв., 1лв., 11 лв., 111 лв.1лв., 1лв., 11 лв., 111 лв.

Значи ... Мо=1 лв., Ме=6 лв., Х=31 лв., нали...Значи ... Мо=1 лв., Ме=6 лв., Х=31 лв., нали...

Технически погледнато – да. Логически, обаче са уместни Технически погледнато – да. Логически, обаче са уместни въпросите:въпросите:

• Може ли да се търси типичното, характерното за Може ли да се търси типичното, характерното за стойности, които се различават твърде много? Очевидно стойности, които се различават твърде много? Очевидно не. не.

• Кой от показателите е най-информативен, т.е. кой от тях Кой от показателите е най-информативен, т.е. кой от тях дава най-вярна представа за средното количество пари, с дава най-вярна представа за средното количество пари, с които разполага представител на вашата група? Най-които разполага представител на вашата група? Най-често използваният показател – средната аритметична е често използваният показател – средната аритметична е напълно лишена от смисъл, защото не дава вярна напълно лишена от смисъл, защото не дава вярна представа за парите на нито едно от лицата.представа за парите на нито едно от лицата.

Page 8: Вариационен анализ

88

Пример 1: Изследвани са резултатите в 30 м. гл. б. и месечния доход на член от семейството на подрастващи футболисти. На фигурите са представени хистограми на тяхното разпределение.

Разпределението на постиженията на 30 м. е симетрично, а от резултатите от обработката личи, че Mo=Me=X.

Разпределението на доходите е силно несиметрично. Най-голямо струпване на стойностите се наблюдава около Хmin (Mo=100 лв.), има силно отклоняващи се стойности (Xmax=700лв.). Резултатите от обработката показват, че Мо, Ме и Х силно се различават.

В такива случаи възниква въпросът кой от показателите за средно равнище да се ползва. Отговорът му е свързан с това каква е изследователската задача, в случая какъв смисъл се влага в понятието “среден доход”. Ако се разбира онзи доход, който имат най-голям брой от изследваните, очевидно модата е най-добрият “измерител” на средното равнище. Äîõîä (ëâ.)

675,

0

625,

0

575,

0

525,

0

475,

0

425,

0

375,

0

325,

0

275,

0

225,

0

175,

0

125,

0

F(X

)

30

25

20

15

10

5

0

Std. Dev = 120,77

Mean = 189,1

N = 50,00

30 m.

7,13

6,88

6,63

6,38

6,13

5,88

5,63

5,38

F(X

)

20

18

16

14

12

10

8

6

4

2

0

Std. Dev = ,36

Mean = 6,22

N = 50,00

Statistics

50 50

0 0

6,2180 189,1400

6,1850 150,0000

6,27 100,00

Valid

Missing

N

Mean

Median

Mode

30 m. Доход

Доход (лв.)

30 м. гладко бягане

Page 9: Вариационен анализ

99

Пример 2: Три групи подрастващи футболисти имат средна Три групи подрастващи футболисти имат средна аритметична на постиженията в 30 м. гл. б. 6,1 сек.. Това аритметична на постиженията в 30 м. гл. б. 6,1 сек.. Това означава ли, че бързината на трите групи е една и съща?означава ли, че бързината на трите групи е една и съща?

Мисля, че да ...

Нека видим първичните данни :

Група А

Група Б

Група В

Какво прави впечатление?

ii 11 22 33 44 55

XX 5.2 5.9 6.1 6.3 7.1

ii 11 22 33 44 55

XX 6.1 6.1 6.1 6.1 6.1

ii 11 22 33 44 55

XX 6.0 6.1 6.1 6.1 6.2

Вече е ясно, че в първите 2 групи попадат Вече е ясно, че в първите 2 групи попадат лица, които имат напълно или лица, които имат напълно или приблизително еднакви скоростни приблизително еднакви скоростни възможности, а в група В – с твърде възможности, а в група В – с твърде различна бързина-...различна бързина-...

Page 10: Вариационен анализ

1010

Правилно!

За да се характеризира разпределението на количествена променлива не е достатъчно да се опише само средното равнище на признака.

Изключително важна характеристика на признаците е тяхната вариация

Page 11: Вариационен анализ

1111

Размах (Размах (RR)) – диапазон, в – диапазон, в който варират стойностите:който варират стойностите:

Стандартно отклонение (Стандартно отклонение (SS) – ) – отклонения на стойностите отклонения на стойностите от средната аритметична от средната аритметична величинавеличина

Коефициент на вариация (Коефициент на вариация (VV):):

Показатели за разсейванеПоказатели за разсейване

Те описват различията между стойностите.

Като синоними се ползват понятията

вариация и дисперсия на стойностите.

Те описват различията между стойностите.

Като синоними се ползват понятията

вариация и дисперсия на стойностите.

Размахът е лесен...

Група А =0сек.

Група Б = 0,2 сек.

Група В = 1,9 сек.

...обаче стандартното отклонение ...

Размахът е лесен...

Група А =0сек.

Група Б = 0,2 сек.

Група В = 1,9 сек.

...обаче стандартното отклонение ...

1n

)XX(S

2i

100.X

SV

minmax XXR

Page 12: Вариационен анализ

1212

Не е страшно! Трябва да се опише средното отклонение от средната аритметична величина.

На фигурите е представено графично разпределението на постиженията на групи А и Б. С червена пунктирана линия е означена средната аритметична величина.

Група А

Очевидно е, че стойностите при гр. А не се отклоняват от Х, което означава, че S=0.

Група Б

Група В

5,9

6

6,1

6,2

6,3

1 2 3 4 5

Пореден номер на изследвания

Ре

зул

тат

5,9

6

6,1

6,2

6,3

1 2 3 4 5

Пореден номер на изследвания

Ре

зул

тат

071.0

4

02.0

15

1.00001.0S

22222

04

0

15

00000S

22222

687.0

4

89.1

15

12.002.09.0S

22222

-0,1

Група А

Група Б

Page 13: Вариационен анализ

1313

На първо място е важно да се знае, че стандартното отклонение се изразява в същата мерна единица, в която е измерен признака, в случая в секунди ... значи S=0,071 сек. и S=0,687 сек. Дори се изписва заедно със средната аритметична по следния начин Х±S.

На второ място, не може да се оцени степента на разсейването на признака само на базата на стандартното отклонение, защото е важно по отношение на каква средна стойност е въпросното отклонение. 0,1 секунда отклонение от постижения на 100 м. и на 3000 м. имат съвсем различен смисъл, нали ...

На първо място е важно да се знае, че стандартното отклонение се изразява в същата мерна единица, в която е измерен признака, в случая в секунди ... значи S=0,071 сек. и S=0,687 сек. Дори се изписва заедно със средната аритметична по следния начин Х±S.

На второ място, не може да се оцени степента на разсейването на признака само на базата на стандартното отклонение, защото е важно по отношение на каква средна стойност е въпросното отклонение. 0,1 секунда отклонение от постижения на 100 м. и на 3000 м. имат съвсем различен смисъл, нали ...

... все пак, не ми е съвсем ясно, какво е това S=0.071 и S=0,687... Много ли е ...

Page 14: Вариационен анализ

1414

Друг един “недостатък” на стандартното отклонение е, че с него не може да се сравнява разсейването на признаци, изразени в различни мерни единици.

В пример № 1 бе представено разпределението на постиженията в 30 м. и дохода на член от семейството на подрастващи футболисти. Резултатите от обработката показват:

•За 30 м. – 6,22 ±0,36 сек.•За дохода – 189,1±120,8 лв.

Излишно е да умуваме дали 0,36 сек. са повече от 120,8 лв. С помощта на коефициента на вариация подобни проблеми се решават много лесно ...

Друг един “недостатък” на стандартното отклонение е, че с него не може да се сравнява разсейването на признаци, изразени в различни мерни единици.

В пример № 1 бе представено разпределението на постиженията в 30 м. и дохода на член от семейството на подрастващи футболисти. Резултатите от обработката показват:

•За 30 м. – 6,22 ±0,36 сек.•За дохода – 189,1±120,8 лв.

Излишно е да умуваме дали 0,36 сек. са повече от 120,8 лв. С помощта на коефициента на вариация подобни проблеми се решават много лесно ...

Page 15: Вариационен анализ

1515

Коефициентът на вариация изразява разсейването в проценти и обобщава информацията от средната аритметична величина и стандартното отклонение.

Да припомним формулата:

Той дава възможност:

1. Да се сравнява разсейването на признаци, изразени в различни мерни единици;

2. Да се правят изводи относно еднородността на извадките (голямо ли е разсейването на признака). В практиката се ползват следните степени:

•До 10% - извадката е еднородна (малко разсейване)•От 10- до 30% - извадката е приблизително еднородна (средно разсейване);•Над 30 % - силно нееднородна извадка (голямо разсейване на признака)

Коефициентът на вариация изразява разсейването в проценти и обобщава информацията от средната аритметична величина и стандартното отклонение.

Да припомним формулата:

Той дава възможност:

1. Да се сравнява разсейването на признаци, изразени в различни мерни единици;

2. Да се правят изводи относно еднородността на извадките (голямо ли е разсейването на признака). В практиката се ползват следните степени:

•До 10% - извадката е еднородна (малко разсейване)•От 10- до 30% - извадката е приблизително еднородна (средно разсейване);•Над 30 % - силно нееднородна извадка (голямо разсейване на признака)

100.X

SV

Page 16: Вариационен анализ

1616

Да видим дали вече е ясно:

1. По данните от пример 1 (за 30 м. - 6,22 ±0,36 сек. дохода – 189,1±120,8 лв.) :

По кой от двата признака разсейването е по-голямо?

2. По данните от пример 2 (група А – 6,11 ±0 сек., група Б – 6,11 ±0,071 сек. и група В – 6,11 ±0,687 се.):

Еднородни ли за изследваните групи?

Да видим дали вече е ясно:

1. По данните от пример 1 (за 30 м. - 6,22 ±0,36 сек. дохода – 189,1±120,8 лв.) :

По кой от двата признака разсейването е по-голямо?

2. По данните от пример 2 (група А – 6,11 ±0 сек., група Б – 6,11 ±0,071 сек. и група В – 6,11 ±0,687 се.):

Еднородни ли за изследваните групи?

Page 17: Вариационен анализ

1717

1. Коефициентите на вариация са съответно:За 30 м. гл. Б. – 5,79%За дохода – 63,87%

Очевидно, че вариацията на дохода е много по-голяма

2. Коефициентите на вариация са съответно:Група А – 0 % - липсва разсейване на стойностите. Постиженията са постоянна величина. Е, това трудно може да се случи при реално изследване, но за упражнение,

може !Група Б – 1,16 % - групата е еднородна;Група В – 11,26 % - групата е приблизително еднородна.

Аз също имам въпрос:Направих опит да изчисля коефициента на вариация на температурата навън в последните 3 дни. Данните са:

-1оС , 0о С, 1оС . Средната аритметична е 0о, а стандартното отклонение 1о. Защо не мога да изчисля V?

Page 18: Вариационен анализ

1818

Време е да преминем към следващата група показателиВреме е да преминем към следващата група показатели

Браво! Много точни отговори и също така уместен въпрос.

Данните за времето, които си събрал са за температурата на въздуха, измерени по скалата на Целзий. От първата лекция трябва да си разбрал, че този признак е интервално скалиран, т.е. има условна 0. При такива признаци не се ползва коефициента на вариация. Затруднението, с което си се сблъскал се дължи на факта, че средната е 0оС, а деление на 0 не е възможно.

Е, едва ли може да се случи в реално изследване, но за пример,

може !

Браво! Много точни отговори и също така уместен въпрос.

Данните за времето, които си събрал са за температурата на въздуха, измерени по скалата на Целзий. От първата лекция трябва да си разбрал, че този признак е интервално скалиран, т.е. има условна 0. При такива признаци не се ползва коефициента на вариация. Затруднението, с което си се сблъскал се дължи на факта, че средната е 0оС, а деление на 0 не е възможно.

Е, едва ли може да се случи в реално изследване, но за пример,

може !

Page 19: Вариационен анализ

1919

Показатели за нормалност на Показатели за нормалност на разпределениеторазпределението

Ще използвам данните от пример 1 – постижения на 50 подрастващи футболисти в тест 30 м.гл.б. Хистограма на емпиричното разпределение е представено на фигурата.

По абсцисата са нанесени резултатите в теста;По ординатата – тяхната абсолютна честота (f). Както се вижда, минималните стойности се срещат сравнително рядко, и приблизително толкова, колкото максималните стойности. Най-голямо струпване има около центъра на разпределението. Модата, медианата и средната аритметична са приблизително равни.

Как смяташ, кога вероятността е по-голяма – един случайно взет подрастващ футболист да има постижение 5,4 сек. или 6,1 сек. ?

Ще използвам данните от пример 1 – постижения на 50 подрастващи футболисти в тест 30 м.гл.б. Хистограма на емпиричното разпределение е представено на фигурата.

По абсцисата са нанесени резултатите в теста;По ординатата – тяхната абсолютна честота (f). Както се вижда, минималните стойности се срещат сравнително рядко, и приблизително толкова, колкото максималните стойности. Най-голямо струпване има около центъра на разпределението. Модата, медианата и средната аритметична са приблизително равни.

Как смяташ, кога вероятността е по-голяма – един случайно взет подрастващ футболист да има постижение 5,4 сек. или 6,1 сек. ?

30 m.

7,13

6,88

6,63

6,38

6,13

5,88

5,63

5,38

F(X

)

20

18

16

14

12

10

8

6

4

2

0

Std. Dev = ,36

Mean = 6,22

N = 50,00

30 м. гладко бягане

F(X)

Page 20: Вариационен анализ

2020

Разсъждението е напълно правилно! Стълбчетата на хистограмата онагледяват емпиричното разпределение (конкретните данни) и затова абсцисата е означена с f(X).

Нека обаче си представим, че се онагледява която и да е променлива, изследвана в достатъчно голяма генерална съвкупност, по абсцисата се нанесат възможните стойности от Xmin до Xmax, а по ординатата – съответстващата им вероятност.

Разсъждението е напълно правилно! Стълбчетата на хистограмата онагледяват емпиричното разпределение (конкретните данни) и затова абсцисата е означена с f(X).

Нека обаче си представим, че се онагледява която и да е променлива, изследвана в достатъчно голяма генерална съвкупност, по абсцисата се нанесат възможните стойности от Xmin до Xmax, а по ординатата – съответстващата им вероятност.

Ще опитам!

Резултат 6,1 сек. е около средната стойност. Той е постигнат от 14 от 50-те изследвани лица, нека да пресметна ... 14/50*100=28%. Нека да го означа като вероятност А.

Резултат 5,4 сек. Имат само 3 изследвани лица, което означава 6% от случаите, т.е 6% вероятност да се получи такъв резултат. На фигурата съм означил като вероятност Б.

Май греша, абсцисата е означена f(X), т.е. абсолютна честота .....

Ще опитам!

Резултат 6,1 сек. е около средната стойност. Той е постигнат от 14 от 50-те изследвани лица, нека да пресметна ... 14/50*100=28%. Нека да го означа като вероятност А.

Резултат 5,4 сек. Имат само 3 изследвани лица, което означава 6% от случаите, т.е 6% вероятност да се получи такъв резултат. На фигурата съм означил като вероятност Б.

Май греша, абсцисата е означена f(X), т.е. абсолютна честота .....

30 m.

7,13

6,88

6,63

6,38

6,13

5,88

5,63

5,38

F(X

)

20

18

16

14

12

10

8

6

4

2

0

Std. Dev = ,36

Mean = 6,22

N = 50,00

30 м. гладко бягане

F(X)А

Б

Page 21: Вариационен анализ

2121

Под понятието разпределение на променливата величина се разбира съответствието между възможните стойности на променливата и съответстващата им вероятност.

Ето така изглежда кривата на нормалното разпределение. Най-характерно за него е, че:

То е симетрично по отношение на центъра на разпределениетоИма умерен връх.

Под понятието разпределение на променливата величина се разбира съответствието между възможните стойности на променливата и съответстващата им вероятност.

Ето така изглежда кривата на нормалното разпределение. Най-характерно за него е, че:

То е симетрично по отношение на центъра на разпределениетоИма умерен връх.

Page 22: Вариационен анализ

2222

На теория звучи добре, но не разбирам как бих могъл по емпирични данни да разбера дали разпределението на променливата е нормално...

На теория звучи добре, но не разбирам как бих могъл по емпирични данни да разбера дали разпределението на променливата е нормално...

За да се установи доколко емпиричното разпределение се приближава до нормалното се ползват коефициентите на асиметрия (As) и ексцес (Ex).

За да се установи доколко емпиричното разпределение се приближава до нормалното се ползват коефициентите на асиметрия (As) и ексцес (Ex).

Page 23: Вариационен анализ

2323

Как по стойността им разбера дали разпределението на променливата е нормално?

Как по стойността им разбера дали разпределението на променливата е нормално?

Коефициент на асиметрия (As) където

Коефициент на ексцес (Ех):

къдетоn

)XX(m

4i

4

33

S

mAs

344 S

mЕх

Page 24: Вариационен анализ

2424

Какви са тези статистически таблици? Какви са тези статистически таблици?

Процедурата е следната:

1. По формулите се изчислява т. нар. емпирична стойност на критерия

2. От статистически таблици се определя т. нар. критична стойност на критерия.

3. Двете стойности се сравняват:

Ако емпиричната е по малка или равна на табличната се приема, че разпределението не се различава

съществено от нормалното

Процедурата е следната:

1. По формулите се изчислява т. нар. емпирична стойност на критерия

2. От статистически таблици се определя т. нар. критична стойност на критерия.

3. Двете стойности се сравняват:

Ако емпиричната е по малка или равна на табличната се приема, че разпределението не се различава

съществено от нормалното

Page 25: Вариационен анализ

2525

Ето така изглежда таблицата с критичните стойности на

коефициента на асиметрия.

• В първата колона се намира обемът на извадката (n).

• Другите две колони са означени “Равнище на значимост ()”. Това е възможността за допускане на

погрешен извод. =0.05 означава

5% възможност за грешка, а =0.01

- 1%.

Ако си изследвал 50 лица и работиш с 5% възможност за грешка – критичната стойност на коефициента на асиметрия е 0,533.

Ето така изглежда таблицата с критичните стойности на

коефициента на асиметрия.

• В първата колона се намира обемът на извадката (n).

• Другите две колони са означени “Равнище на значимост ()”. Това е възможността за допускане на

погрешен извод. =0.05 означава

5% възможност за грешка, а =0.01

- 1%.

Ако си изследвал 50 лица и работиш с 5% възможност за грешка – критичната стойност на коефициента на асиметрия е 0,533.

Обем на

извадката (n)

Равнище на значимост (a)

Обем на извадка

та (n)

Равнище на значимост (a)

0,05 0,01 0,05 0,01

25 0,711 1,061 250 0,251 0,360

30 0,661 0,982 300 0,230 0,329

35 0,621 0,921 350 0,213 0,305

40 0,587 0,869 400 0,200 0,285

45 0,558 0,825 450 0,188 0,269

50 0,533 0,787 500 0,179 0,255

60 0,492 0,723 550 0,171 0,243

70 0,459 0,673 600 0,163 0,233

80 0,432 0,631 650 0,157 0,224

90 0,409 0,569 700 0,151 0,215

100 0,389 0,567 750 0,146 0,208

125 0,350 0,508 800 0,142 0,202

150 0,321 0,464 850 0,138 0,196

175 0,298 0,430 900 0,134 0,190

200 0,280 0,403 1000 0,127 1,180

Page 26: Вариационен анализ

2626

Това е таблицата с критичните стойности на коефициента на

ексцес.

• В първата колона се намира обемът на извадката (n).

• Другите две колони са означени “Равнище на значимост ()”.

Ако си изследвал 50 лица и работиш с 5% възможност за грешка – критичната стойност на коефициента на ексцес е 0,848.

Това е таблицата с критичните стойности на коефициента на

ексцес.

• В първата колона се намира обемът на извадката (n).

• Другите две колони са означени “Равнище на значимост ()”.

Ако си изследвал 50 лица и работиш с 5% възможност за грешка – критичната стойност на коефициента на ексцес е 0,848.

Обем на извадката (n)

Равнище на значимост (a)

0,05 0,01

11 0,907 0,936

16 0,888 0,914

21 0,877 0,900

26 0,869 0,890

31 0,863 0,883

36 0,858 0,877

41 0,854 0,872

46 0,851 0,868

51 0,848 0,865

61 0,843 0,859

71 0,840 0,855

81 0,838 0,852

91 0,835 0,848

101 0,834 0,846

201 0,823 0,832

301 0,818 0,826

401 0,816 0,822

501 0,814 0,820

Page 27: Вариационен анализ

2727

А защо е толкова важно да знаем дали признака има нормално разпределение?

А защо е толкова важно да знаем дали признака има нормално разпределение?

Защото изборът на метод за обработка на данните до голяма степен зависи от вида на разпределение на променливите.

Ако те имат нормално разпределение се ползват т.нар. параметрични методи.

Ако те имат ненормално разпределение се ползват т.нар. непараметрични методи

Защото изборът на метод за обработка на данните до голяма степен зависи от вида на разпределение на променливите.

Ако те имат нормално разпределение се ползват т.нар. параметрични методи.

Ако те имат ненормално разпределение се ползват т.нар. непараметрични методи

Page 28: Вариационен анализ

2828

На теория всичко ми е ясно.

Как да изчисля тези показатели с помощта на компютъра си?

На теория всичко ми е ясно.

Как да изчисля тези показатели с помощта на компютъра си?

Вариационен анализ Вариационен анализ с с Excel Excel и и SPSSSPSS

Page 29: Вариационен анализ

2929

Вариационен анализ със Вариационен анализ със SPSSSPSS

1. Избери анализа

2. Задай променливата/ите

3. Избери/промени статистическите показатели

4. Потвърди с ОК

Page 30: Вариационен анализ

3030

Descriptive Statistics

50 1,56 5,45 7,01 6,2164 ,0508 ,35932 ,331 ,337 -,286 ,662

50

30 m.

Valid N (listwise)

Statistic Statistic Statistic Statistic Statistic Std. Error Statistic Statistic Std. Error Statistic Std. Error

N Range Minimum Maximum Mean Std.Deviation

Skewness Kurtosis

·        N – брой на наблюденията·        Range – размах·        Minimum – минимална стойност;·        Maximum – максимална стойност;·        Mean – средна аритметична величина;·        Std. –  стандартно отклонение;;·        Skewness – коефициент на асиметрия·        Kurtosis – коефициент на ексцес

Резултатът от обработката изглежда

така

Означението на показателите е

следното

Page 31: Вариационен анализ

3131

Вариационен анализ с Вариационен анализ с ExcelExcel

1. Избери анализа1. Избери анализа

а

б

Page 32: Вариационен анализ

3232

2. Задай променливата/ите

3. Избери/промени статистическите показатели

4. Потвърди с ОК

Page 33: Вариационен анализ

3333

Mean – средна аритметична величинаStandard Error –репрезентативна грешкаMedian - медианаMode - модаStandard Deviation - стандартно отклонениеSample Variance - дисперсия Kurtosis – коефициент на ексцес Skewness – коефициент на асиметрияRange – размахMinimum – минимална стойност;Maximum – максимална стойност;Sum – сумата на стойноститеCount – брой на наблюденията      

Резултатът от обработката изглежда

така

Означението на показателите е

следното

50,00Count

310,82Sum

7,01Maximum

5,45Minimum

1,56Range

0,33Skewness

-0,29Kurtosis

0,13Sample Variance

0,36Standard Deviation

6,50Mode

6,18Median

0,05Standard Error

6,22Mean

30 m.

50,00Count

310,82Sum

7,01Maximum

5,45Minimum

1,56Range

0,33Skewness

-0,29Kurtosis

0,13Sample Variance

0,36Standard Deviation

6,50Mode

6,18Median

0,05Standard Error

6,22Mean

30 m.

Page 34: Вариационен анализ

3434

Не мога да разбера, как цялата тази информация може да се побере в една таблица за вариационен анализ?

Не мога да разбера, как цялата тази информация може да се побере в една таблица за вариационен анализ?

Представяне на резултатите от вариационен Представяне на резултатите от вариационен анализанализ

Page 35: Вариационен анализ

3535

Ето вариационен анализ на резултатите в тест 30 м.гл.б., с който започнахме разговора. Можеш ли да направиш анализ?

Ето вариационен анализ на резултатите в тест 30 м.гл.б., с който започнахме разговора. Можеш ли да направиш анализ?

Показател n Xmin Xmax R S V As Ex

30 m. 50 5,5 7,0 1,6 6,22 0,36 5,78 0,33 -0,29

Page 36: Вариационен анализ

3636

Добре!!!Информацията може да се

допълни и с графика.

Добре!!!Информацията може да се

допълни и с графика.

Изследвани са постиженията в тест 30 м.гл.б. на 50 подрастващи футболиста. Резултатите варират от 5,5 сек. До 7,0 сек. Средната стойност е 6,22 сек. Изследваната група е силно еднородна по отношение на резултатите в този тест, защото коефициентът на вариация е V=5.78%. Коефициентите на асиметрия и ексцес (съответно 0,33 и -0,29) са под критичните, което означава, че признака има нормално разпределение.

Изследвани са постиженията в тест 30 м.гл.б. на 50 подрастващи футболиста. Резултатите варират от 5,5 сек. До 7,0 сек. Средната стойност е 6,22 сек. Изследваната група е силно еднородна по отношение на резултатите в този тест, защото коефициентът на вариация е V=5.78%. Коефициентите на асиметрия и ексцес (съответно 0,33 и -0,29) са под критичните, което означава, че признака има нормално разпределение.

Показател n Xmin Xmax R S V As Ex

30 m. 50 5,5 7,0 1,6 6,22 0,36 5,78 0,33 -0,29

Page 37: Вариационен анализ

3737

50N =

30 m.

7,5

7,0

6,5

6,0

5,5

5,0

30 m.

7,13

6,88

6,63

6,38

6,13

5,88

5,63

5,38

F(X

)

20

18

16

14

12

10

8

6

4

2

0

Std. Dev = ,36

Mean = 6,22

N = 50,00

30 м. гладко бягане

Това е хистограмата, която ползвахме в началото.

По абсцисата са нанесени стойностите на променливатаПо ординатата – съответните им абсолютни честоти.

С червената линия е представена кривата на нормалното разпределение.

Това е хистограмата, която ползвахме в началото.

По абсцисата са нанесени стойностите на променливатаПо ординатата – съответните им абсолютни честоти.

С червената линия е представена кривата на нормалното разпределение.

Това е т.нар. Box plot диаграма.

При нея стойностите на променливата са представени по ординатата.

С червената “кутия е са представени 25-ия процент, средната стойност и 75-ия процент от вариационния ред.

С “дръжките” на кутията се онагледяват минималната и максималната стойност

Това е т.нар. Box plot диаграма.

При нея стойностите на променливата са представени по ординатата.

С червената “кутия е са представени 25-ия процент, средната стойност и 75-ия процент от вариационния ред.

С “дръжките” на кутията се онагледяват минималната и максималната стойност

Page 38: Вариационен анализ

3838

Време е да приключваме.

Имаш ли още някакви въпроси?

Засега – не

Ако възникнат – ще ги задам на

[email protected]