Upload
others
View
11
Download
0
Embed Size (px)
Citation preview
УНИВЕРЗИТЕТ У НОВОМ САДУ
ПОЉОПРИВРЕДНИ ФАКУЛТЕТ
Департман за економику
пољопривреде и социологију села
Игор Гуљаш
ВЕЛИЧИНА ЕФЕКТА СТАТИСТИЧКИХ
ТЕСТОВА У АГРОЕКОНОМСКИМ
ИСТРАЖИВАЊИМА
Мастер рад
Нови Сад, 2015.
_______________________________________________
УНИВЕРЗИТЕТ У НОВОМ САДУ
ПОЉОПРИВРЕДНИ ФАКУЛТЕТ
Департман за економику
пољопривреде и социологију села
Кандидат Ментор
Игор Гуљаш Др. Беба Мутавџић
ВЕЛИЧИНА ЕФЕКТА СТАТИСТИЧКИХ
ТЕСТОВА У АГРОЕКОНОМСКИМ
ИСТРАЖИВАЊИМА
Мастер рад
Нови Сад, 2015.
_______________________________________________
КОМИСИЈА ЗА ОЦЕНУ И ОДБРАНУ МАСТЕР РАДА
Проф. др. Беба Мутавџић,
доцент, ментор,
Пољопривредни факултет, Нови Сад
_________________________________________
Проф. др. Загорка Лозанов-Црвенковић,
редовни професор, председник комисије,
Природно-математички факултет, Нови Сад
_________________________________________
Проф. др. Небојша Новковић,
редовни професор, члан комисије,
Пољопривредни факултет, Нови Сад
_________________________________________
С А Д Р Ж А Ј
РЕЗИМЕ..................................................................................................................... 2
ABSTRACT ............................................................................................................... 3
1. УВОД ................................................................................................................. 4
ПРЕДМЕТ И ЦИЉ ИСТРАЖИВАЊА.................................................................... 4
ПРЕГЛЕД ЛИТЕРАТУРЕ ......................................................................................... 5
РАДНА ХИПОТЕЗА ............................................................................................... 10
МЕТОД РАДА И ИЗВОРИ ПОДАТАКА ............................................................. 11
2. РЕЗУЛТАТИ ИСТРАЖИВАЊА ................................................................... 14
КОНВЕНЦИОНАЛНИ ПРИСТУП У СТАТИСТИЧКОМ ЗАКЉУЧИВАЊУ .. 14
2.1.1. Основни појмови у статистичком истраживању ..................................................... 14
2.1.2. Статистичко истраживање ........................................................................................ 20
2.1.3. Снага теста.................................................................................................................. 21
2.1.4. Погрешне интерпретације p вредности ................................................................... 23
ВЕЛИЧИНА ЕФЕКТA ............................................................................................ 24
2.2.1. Величина ефекта и p вредност .................................................................................. 24
2.2.2. Основни појмови величине ефекта .......................................................................... 25
2.2.3. Зашто p вредност није довољна ................................................................................ 26
МЕРЕ ВЕЛИЧИНЕ ЕФЕКТА ................................................................................. 27
МЕРЕ ВЕЛИЧИНЕ ЕФЕКТА РАЗЛИКА ИЗМЕЂУ ДВЕ АРИТМЕТИЧКЕ
СРЕДИНЕ ................................................................................................................ 28
2.4.1. Поређење аритметичких средина два независна случајна узорка ......................... 28
2.4.2. Методе за процену стандардне разлике аритметичке средине .............................. 31
МЕРЕ ВЕЛИЧИНЕ ЕФЕКТА У АНАЛИЗИ ВАРИЈАНСЕ ................................. 36
2.5.1. Анализа варијансе у статистичким инстраживањима ............................................ 36
2.5.2. Величина ефекта у анализи варијансе...................................................................... 44
МЕРЕ ВЕЛИЧИНЕ ЕФЕКТА У КОРЕЛАЦИОНОЈ АНАЛИЗИ ........................ 47
2.6.1. Основни појмови у корелационој анализи .............................................................. 47
2.6.2. Величина ефекта у корелационој анализи ............................................................... 52
МЕРЕ ВЕЛИЧИНЕ ЕФЕКТА КОД χ2 ТЕСТА...................................................... 52
2.7.1. Конвеционалан приступ χ2 тесту .............................................................................. 52
2.7.2. Величина ефекта код χ2 теста ................................................................................... 59
3. ДИСКУСИЈА ................................................................................................... 61
4. ЗАКЉУЧАК .................................................................................................... 64
ПРИЛОГ .................................................................................................................. 66
ЛИТЕРАТУРА ........................................................................................................ 73
Игор Гуљаш Мастер рад РЕЗИМЕ
2
РЕЗИМЕ
Агроекономија, као наука, бави се применом економских теорија на
пољопривреду са циљем да оптимизује производњу, дистрибуцију хране и других
пољопривредних производа. Као резултат агроекономских истраживања добијају
се подаци које је потребно интерпретирати на правилан начин. Подаци добијени у
истраживањима могу се обрадити различитим статистичким поступацима, у циљу
предвиђања и тестирања претпоставки, односно хипотеза, о појавама које
испитујемо. Тестирање хипотеза је често коришћен статистичких поступак, па
самим тим треба указати на ограничења и проблеме који постоје у искључивом
ослањању на конвенционално тестирање статистичке значајности и приказивању
резултата емпиријских истраживања. Конвенционалним тестирањем и доношењем
закључака добијају се статистички значајни резултати при чему се занемарује
реалан допринос тих резултата у анализи и тумачењу проучаваних проблема. Основ
за доношење закључака, у конвенционалном приступу, представља p вредност.
Проблем у статистичком закључивању на основу p вредности, представља
могућност да добијени закључак који је статистички значајан има веома малу или
чак уопште нема практичну значајност. Овај проблем се може превазићи
утврђивањем величине ефекта статистичких тестова. Циљ овог рада је да прикаже
могућност реалнијег закључивања приликом тестирања значајности
претпостављених хипотеза. У раду је представљена теоријска основа која је
пропраћена практичним примерима у агроекономији. Дат је упоредни преглед
закључивања кроз традиционални приступ као и путем израчунавања величине
ефекта кроз приказ разлике између две аритметичке средине, анализе варијансе,
корелационе анализе и хи квадрат теста.
Кључне речи: p вредност, величина ефекта, статистичка значајност, тест,
статистички метод, интервал поверења
Игор Гуљаш Мастер рад ABSTRACT
3
ABSTRACT
Agricultural economics as a science is based in applying economic theory to
agriculture in order to optimize the production, distribution of food and other agricultural
products. As a result of agicultural economics research, researchers obtain raw data that
need to be interpreted, but in a correct way. The raw data acquired through research can
be subjected to various statistical procedures in order to predict and to test the hypotheses
about phenomena being researched. Hypotheses testing is one of the most used statistical
methods of data analysis, hence the necessity to point out its limitations and the problems
that can arise from relying exclusively on conventional methods in testing statistical
significance and data representation of the empirical research. Conventional methods of
hypothesis testing and drawing conclusions can obtain statistically significant results, but
the actual contribution of the results acquired through these methods to agricultural
science is often disregarded and overlooked. The basis for decision making in
conventional statistical research is p value. When p value is used for making statistical
decisions it is often the case that the obtained results are statistically significant but that
the conclusion based on them are practically insignificant. To overcome this problem,
one can calculate the effect size of statistical tests that have been used within the research.
The goal of this paper is to present the opportunities to draw more relevant conclusions
when performing testing of the significance of assumed hypotheses. This thesis gives a
strong theoretical foundations to calculation of the effect size and also provides real life
examples of its application in agricultural research. A comparison of traditional methods
of statistical tests versus effect size calculation is made by comparing calculated
arithmetic means, variance analyses, correlation analyses and chi-square tests.
Key words: p value, effect size, statistical significance, hypothesis test, statistical
methods, confidence interval
Игор Гуљаш Мастер рад УВОД
4
1. УВОД
ПРЕДМЕТ И ЦИЉ ИСТРАЖИВАЊА
Статистика подразумева прикупљање, приказивање, анализу и коришћење
података са циљем да се изведу закључци и донесу одлуке. Предмет статистичког
истраживања су масовне појаве које су по својој природи променљиве и настају под
утицајем неких фактора. Понашања појава зависе од природе, броја и комбинације
ових фактора. Појаве које испитују природне науке су резултат деловања малог
броја фактора или се ти фактори могу лакше контролисати. За разлику од њих,
друштвено-економске појаве зависе од много већег броја фактора који делују на
непредвидљив начин, односно доносе више неодређености, случајности.1
Статистички прорачуни могу бити различити у зависности од тога која се
проблематика жели сагледати, а начин рада зависи од података са којима
расположемо и од услова истраживања. Постоји велик број статистичких метода за
обраду података и добијање резултата истраживања. У овом раду су приказане неке
од метода које се користе, и дат је осврт на утицај величине ефекта у пољопривреди,
односно агроекономији.
Често тврдимо да је нешто статистички проверено и доказано, а затим да
ипак није доказано, или чак да је доказано супротно, па с тим постоје супротна
мишљења о вредности и исправности статистичког тестирања.
Овај рад је написан са циљем да укаже на ограничења и проблеме који
постоје у уобичајеном искључивом ослањању на конвенционално тестирање
статистичке значајности при статистичкој анализи и приказивању резултата
емпиријских истраживањa, као и да приближи величину ефекта и његову употребу
у извештајима о резултатима истраживања.
1 Статистика, Лозанов-Црвенковић
Игор Гуљаш Мастер рад УВОД
5
ПРЕГЛЕД ЛИТЕРАТУРЕ
Постоји велики број писаних записа који се баве проблематиком обраде
резултата и применом статистичких метода у различитим научним дисциплинама.
У раду је разматрана литература чије истраживање обухвата радове страних и
домаћих аутора. Поред теоријске основе и разматрања о статистичким методама,
направљен је осврт на практичну примену статистичких метода приликом обраде
узорка, као и на начин доношења закључака на основу добијених резултата.
Литература која је проучавана приликом писања овог рада је у класичној штампаној
форми књиге, у форми књиге у електронском, односно пдф формату, као и
текстова, чланкова и радова који су објављени на интернету. Такође, коришћена је
и проучавана литература која приказује традиционалну статистику,
конвенционалну статистику која се бави и тематиком величине ефекта, а неисцрпан
извор који прати теорију и практичан рад је глобана светска рачунарска мрежа,
односно интернет. Приказана литература је послужила за писање и креирање идеје
овог рада и представља само један део целокупног материјала који проучава и
приказује величину ефекта.
Литература која се бави статистиком и приказује статистику у њеном
традиционалном облику је:
Ковачић, 1994 приказани су основи мултиваријационих статистичких
метода. За илустрацију изложених метода наведени су примери из економије и
маркетинга. Стављен је акценат на разумевање и усвајање основних појмова
изложених метода као и на правилну интерпретацију добијених резултата.
Направљен је покушај да се нађе компромис између потребне ригорозности
математичког излагања и практичне употребљивости теоријских модела.
Livingston, Cassidy, 2005 акценат је на приказу основног концепта за
израчунавање снаге статистичких тестова. Описане су једначине потребне за
израчунавање величине узорка за непрекидне променљиве када се статистичка
анализа изводи помоћу Студентовог t-теста. Поред приказа извођења ових
једначина дата је и њихова графичка илустрација.
Ловрић, 2008 логика и концепт статистичког начина размишљања приказани
су са циљем да омогуће стицање сазнања неопходних за разумевање претпоставки
и ограничења у примени основних статистичких метода, као и за правилно
израчунавање и интерпретацију основних статистичких показатеља.
Игор Гуљаш Мастер рад УВОД
6
Лозанов-Црвенковић, 2012 представљени су основи статистике уз
дефинисање основних појмова и теоријског приказа материје који су пропраћени и
објашњени кроз примере. Приказана статистика представља основу ка даљем раду
и едукацији како студената, тако и других истраживача ентузијаста.
Тањга, Тањга, 2013 статистика се посматра не само и нужно као
математичка дисциплина, већ као методологија и скуп алата за решавање
нематематичких проблема. Акценат је усмерен на начин статистичког мишљења и
повезивање тог начина мишљења са струком као што је економија, рачунарство,
информатика и менаџмент.
Hair J.F, 2009 описује мултиваријациону анализу и њену примену за
истраживаче који се не баве примарно статистиком. Статистичка истраживања су
сажета у основне концепте у којима се објашњавју и приказују резултати добијени
одређеном статистичкком техником.
Хаџи Стојковић М, 2006 тероријски и практично је обрађена дескриптивна
и статистичка анализа у истраживањима масовних појава, која може бити корисна
како студентима тако и свим људима који практично примењују статистичке
методе за тумачење добијених резултата.
Хаџивуковић, 1989 изложени су принципи, методе и технике савремене
статистике. Стављен је акценат на општим принципима статистичких метода са
намером да се прикажу могућности њихове примене, да се разуме смисао добијених
резултата и да се ти резултати правилно интерпретирају.
Чобановић, 2003 примена пручаване терорије кроз примере има за циљ да
пружи могућност увежбавања и стицања практичног знања. Подела на
методолошке јединице олакшава праћење и увежбавање кроз урађене примере и
кроз примере за вежбање.
Wilcox, 2005 усмерава студенте и друге истраживаче кроз основне стратегије
које се користе за проналажење практичних решења статистичких проблема.
Описане су најновије методе за анализу података, као што су ANOVA и регресија,
а које проналазе практичну примену у математици, економији, здравству,
биологији и психологији.
Литература која поред конвенционалне статистике посматра и обрађује
област величине ефекта је:
Игор Гуљаш Мастер рад УВОД
7
Volker, 2006 приказан је преглед аргумената за уврштавање процене
величине ефекта у статистичким резултатима емпиријских истраживања.
Представљене су фомруле за израчунавање величине ефекта са нагласком на
поједностављено израчунавање мере величине ефекта.
Ellis, 2010 приказује увод у величину ефекта за истраживаче, као и алате
који су им потребни за интерпретацију резултата њихових истраживања.
Објашњени су примери и поступци извођења за процену значајности у
интерпретацији величине ефекта и анализи статистичке значајности.
Kelley, Preacher, 2012 поред интерпретације величине ефекта и његових
интервала поверљивости, акценат стављају на три особине величине ефекта:
димензију, индекс и вредност. На основу њих обједињују многе постојеће
дефиниције величине ефекта. Проучава се важност величине ефекта са проценом
интервала у ком се процењују величине ефекта за посматрану популацију.
Keselman, Algina, Lix, Wilcox, Deering, 2008 приказана је непараметријска
методологија која обезбеђује побољшану конторлу добијања грешака Типа I.
Описан је оквир за робусне процене и тестове који користе умањене скупове са
апроксимацијом степена слободе за независне и зависне променљиве да би се
постигла робусност варијансе приписаног ефекта.
LeCroy, Krysik, 2007 направљен је покушај да се продуби основно
разумевање мерења величине ефекта добијених на различите начине. Приказане су
њихове разлике и дат је предлог једног од начина за лакше интерпретирање
добијених резултата. Величина ефекта је постала део стандарда друштвених
истраживања и као таква мора бити исправано интерпретирана.
McGraw, Wong, 1992 недостаци у интерпретацији и генерализацији
величине ефекта се могу превазићи са статистиком која изражава колико често
резултат узорака из једне дистрибуције може бити већи од узорака из друге
дистрибуције. Индикатор величине ефекта се израчунава из величине узорка и
његове варијансе, и са којим се изражава величина посматраног ефекта у групама
зависно и независно променљивих.
McHugh, 2008 снага теста може утицати на то да истраживач припише много
веће значење статистичком резултату добијеном приликом анализе неког проблема
применом методе тестирања него што то реално јесте. У сврху доношења реалног
Игор Гуљаш Мастер рад УВОД
8
закључка, потребно је сагледати величину узорка на основу ког се изводи анализа
и величина ефекта при тестирању.
McCartney, Rosenthal, 2000 нагласак је дат на три основна принципа који
треба да прате тумачење података добијених у истраживању. Први принцип је да
сваки тест значајности треба да прати и процена величине ефекта. По другом
принципу треба искористити све доступне податке приликом постављања
хипотеза. Трећи принцип наглашава да треба бити опрезан приликом прихватања
нулте хипотезе, јер мала величина ефекта може бити последица грешака насталаих
у током мерења.
Nakagawa, Cuthill, 2007 тренутно доминантан приступ у статистичком
закључивању заснованом на p вредности, не указује на прави значај проблема
истраживања, што је приказано кроз примере везане за биолошка истраживања.
Osborne, 2008 приказан је на недостатак и ограниченост статистичких
метода. Кроз примере се наводи и приказује важност величине ефекта у снази
статистичког закључивања које би требало да прихвате и остали истраживачи кроз
практичну примену.
Pallant, 2007 процес анализе података и СПСС као алатке, приказан је на
једноставан и поступан начин. Читалац треба да се оспособи за самостално
истраживање и да стекне самопоуздање приликом коришћења СПСС-програма. У
оквиру описа статистичких техника поређења група (метод теститања хипотеза)
указује се на могуће грешке приликом тестирања, као и на утврђивање величине
ефекта приликом извођења ове методе.
Петц, Колесарић, Иванец, 2012 на једноставан и разумљив начин су описане
статистичке мотоде, технике и поступци који се користе у практичном и
истраживачком раду у свим подручјима друштвених, медицинских и природних
наука. Приступ тематици је обрађен тако да је она прихватљива и
нематематичарима.
Rosenthal, 1996 објашњени су разлози за и против коришћења квалитативног
описа величине зависности и величине ефекта у интерпретацији података. Ради
лакшег разумевања поред класификације да величина ефекта може бити мала,
средња и велика, уводи се још једна категорија „изразито велика“ која служи за
квалитативно описивање и интерпретацију добијених резултата.
Игор Гуљаш Мастер рад УВОД
9
Ступар, 2012 анализиран је већи број истраживања са циљем да се установи
разлика у антропометријским карактеристикама и моторичким способностима
дечака и девојчица узраста 7 година. За свако истраживање израчуната је величина
ефекта као и укупна величина ефекта. Анализирани су резултати чије су
модераторске варијабле чиниле антропометријске и моторичке карактеристике.
Sullivan, Feinn, 2012 тежи да приближи младим истраживачима и онима са
основним знањем статистике важност величине ефекта и његов значај у планирању,
анализи, извештавању и разумевању приликом истраживања. Објашњава зашто
доношење закључака искључиво на основу p вредности није довољно, а приликом
интерпретације резултата истраживања неизоставно је навођење величине ефекта.
Тењовић, Смедеревац, 2012 указују на ограничења и проблеме који се
јављају ако се статистичко закључивање приликом извођења тестова своди само на
p вредност. Сврсисходнији закључак се добија ако се као допунски показатељи у
процесу статистичког закључивања користе мере величине ефекта и интервал
поузданости.
Ћулав, 2008 кључни корак у мета-анализи је одабир статистичке методе
процене величине ефекта и њена примена у даљој анализи. Појашњене су
параметријске и непараметријске методе и њихове подврсте, методе процене,
њихово међусобно поређење, предности и недостаци.
Field, 2005 на врло једноставан начин и кроз занимљиве примере се показује
шта је то величина ефекта и какве нелогичности у закључивању могу настати ако
се величина ефекта занемари.
Hedges, 1981 величина ефекта се проучава у контексту експлицитног
статистичког модела. Поред многбројних примера наведена су и мерења грешке у
процени величине ефекта, као и извођења једначина за прецизну оцену величине
ефекта.
Hoening, Heisey, 2001 наводе се разлози због који није довољно урадити
статистичке калкулације другог степена из којих се могу добити само
карактеристике посматраног скупа, него да је потребно добити информације о
подацима из којих се може закључити да ли су добијени резултати значајни и у
којој мери.
Huber, 1981 описане су основе теоријске и примењене статистике са
нагласком на примењене статистичке концепте. Приказани су једноставни примери
Игор Гуљаш Мастер рад УВОД
10
чији резултати се трансформишу у компликоване ситуације користећи
вишепараметријску регресију и матрицу коваријансе, помоћу бројних алгоритама
за израчунавање робусних процена и конвергенције доказа.
Hyde, 2001 истраживачи у својим истраживањима треба да наведу резултате
одговарајућих тестова значајности и њима повезане величине ефекта. Разматра се
улога писане литературе у циљу побољшања квалитета статистичог извештавања.
Callahan, Reio, 2006 критикује се употреба нулте хипотезе статистичког
теста, као и извештавање добијених резултата у друштвеним наукама. Дате су
дефиниције и кратак историјски преглед величине ефекта и интервала
поверљивости као и аргументи који се односе на значајност њиховог навођења уз
добијене резултате у истраживању.
Cohen, 1988 кроз нетехнички водич статистичке анализе и планирања пружа
истраживачима примењене статистике потребне алате за ефективнију анализу
резултата истраживања. Обухвата поглавља у којима су обрађене корелационе и
мултиваријационе методе статистичке анализе, величина ефекта, психометријска
поузданост, ефикасност квалификације зависних варијабли и приказане су
проширене таблице за вишеструку регресију и корелацију.
Техничко-технолошки развој и развој интернета, омогућује лако
претраживање материјала истраживања које су извели истраживачи статистичари.
Развој информационих система пружа могућност упоредног прегледа литературе и
њено праћење и претраживање по различитим садржајима и критеријумима.
РАДНА ХИПОТЕЗА
Очекивани резултати у овом раду би треблао да потврде сазнања о утицају
величине ефекта добијених резултата приликом извођења статистичких тестова,
као и да укажу на факторе који утичу на величину ефекта.
Приликом формулисања проблема и циља истраживања полази се од
следећих хипотеза:
конвенционалним закључивањем добијају се статистички значајани
резултати при чему се занемарује реалан допринос тих резултата у
анализи и објашњавању испитиваних проблема.
Игор Гуљаш Мастер рад УВОД
11
постоје ограничења и проблеми у уобичајеном искључивом
ослањању на конвенционално тестирање статистичке значајности.
проблеми конвенционалног закључивања могу се умањити увођењем
додатних статистичких показатеља, као што су величина ефекта и
интервал поузданости.
величина ефекта доприноси реалнијем објашњењу испитиваних
појава у истраживањима у пољопривреди односно агроекономији.
Од добијених резултата се очекује да потврде да величина ефекта доприноси
реалнијем објашњењу испитиваних појава на примерима у пољопривреди, односно
агроекономији.
МЕТОД РАДА И ИЗВОРИ ПОДАТАКА
Статистички подаци који су сређени у облику статистичких серија које су
табелеарно и графички приказане, служе за статистичку анализу, са циљем
истраживања правилности и законитости посматраних појава. Статистичка анализа
има задатак да применом различитих статистичких метода и поступака рашчлани
и упореди статистичке подаке, открије и формулише законитости и правилности
посматраних појава. При томе се истичу састав, структура и све значајне
карактеристике посматране статистичке масе.
У статистичкој теoрији и пракси примењују се два начина посматрања
стастистичке масе:
потпуно посматрање, којим су обухваћене све јединице посматрања,
као што су на пример статистички пописи. Овим посматрањем се
добија поуздана оцена и карактеристика посматране статистичке
масе. У пракси, што је нарочито изражено у пољопривреди, није
могуће увек извршити потпуно посматрање статистичке масе, и не
могу бити обухваћене све јединице, поготово уколико се посматрање
доводи до уништења јединица приликом посматрања или пописа.
делимично посматрање или метод узорка се примењује када није
могуће извршити посматрање свих јединица статистичке масе. Овај
метод се уводи уз одговарајуће критеријуме и ограничења, којима
бирамо јединице узорка из посматране масе. Метод узорка је
Игор Гуљаш Мастер рад УВОД
12
ефикаснији и економичнији од метода потпуног посматрања, захтева
мање времена за прикупљање статистичких података и мања
финансијска средства, а при томе не оштећујемо све јединице
посматране статистичке масе, већ само део, уколико су јединице
такве да се морају уништавати. У примени метода узорка постоји
могућности ризика који могу проузроковати погрешну оцену
карактеристика статистичке масе.
Метод узорка мора обезбедити поуздану оцену карактеристика посматране
статистичке масе, и при томе мора да испуни два основна критеријума:
- узорак мора бити репрезентативан, што се обезбеђује начином избора
јединица из посматране статистичке масе у узорак. Избор јединица
узорка може бити намеран и случајан.
- мора постојати метод за оцену поузданости изведених закључака.
Тестирање хипотеза је уобичајена параметарска или непараметарска
техника за анализирање података из узорака и област статистичке анализе која се
најчешће користи. Анализа тестирања хипотеза даје могућност систематичног
доношења одлука о проблемима који у себи садрже неодређеност. При томе подаци
добијени из узорка могу се комбиновати са статистичком теоријом и на тај начин
се изводе закључци о целој популацији. Тестирањем хипотеза отклања се утицај
субјективног појединца, што доводи до рационалнијег и тачнијег закључивања. У
највећем броју случајева тестирање хипотеза се своди на проверу неког тврђења и
расподелу посматраних обележја.
Приликом тестирања хипотеза потребно је водити рачуна да се узорак бира
на случајан начин, па стим два изабрана узорка могу довести до супротних одлука
о одбацивању хипотеза. Потребно је сагледати величину узорка на основу кога се
изводи анализа, као и величину ефекта приликом тестирања, јер истраживачи који
се баве статистичком анализом дају много веће значење статистичком проблему
приликом тестирања анализе неког проблема него што оно реално јесте.
У истраживачком раду често се тестирају или оцењују више од две средине
истог или различитих основних скупова. Статистички поступак код оваквих
истраживања познат је под називом анализа варијансе.
Анализа варијансе се састоји у испитивању варијабилитета аритметичких
средина из више случајно одабраних узорака, при чему се укупан варијабилитет
Игор Гуљаш Мастер рад УВОД
13
(укупна варијанса) раздваја на саставне делове, односно на варијабилитет који
настаје услед утицаја примењених третмана и на случајан варијабилитет.
Једна од метода која се изводи на основу узорка је и регресиона и
корелациона анализа. Корелациона анализа је једна је од често примењиваних
статистичких метода у анализи конкретних проблема у којима се утврђују
зависности између испитиваних појава. Регресиона анализа представља скуп
статистичких метода за истраживање постојања утицаја и веза међу појавама и
утврђивање смера и јачине тих утицаја и веза.
Напред наведене методе које се најчешће изводе су параметарске, базиране
су на одређеним претпоставкама везаним за параметре и расподеле популација из
којих су узорци који се користе за њихову примену извучени. Уколико се
параметарски методи примењују на податке који не испуњавају захтеване
претпоставке, њихови закључци могу бити погрешни. Из тог разлога у овом раду
су обрађени и неки непараметарски статистички поступци који се најчешће користе
у статистичкој анализи.
Како је овај рад пре свега методолошког карактера, теоријска основа
наведених метода детаљно је описана у оквиру резултата истраживања и свака од
метода је примењена на конкретним подацима из области пољопривреде.
Резутати анализе коришћених података добијени су рачунањем у програму
Microsoft Excel 2013.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
14
2. РЕЗУЛТАТИ ИСТРАЖИВАЊА
КОНВЕНЦИОНАЛНИ ПРИСТУП У СТАТИСТИЧКОМ
ЗАКЉУЧИВАЊУ
2.1.1. Основни појмови у статистичком истраживању
Научно истраживање је систематско, планско и објективно испитивање
неког проблема, одређено методолошким правилима, чија је сврха да се пружи
поуздан и прецизан одговор на унапред постављено питање. Свако научно
истраживање спроводи се у више међусобно логички повезаних фаза. Прву фазу
истраживања представља прикупљање података - које може бити потпуно и
делимично. Потпуно посматрање подразумева обухватање свих јединица у маси,
док се код делимичног посматрања на основу извесног броја одабраних јединица,
дакле на основу узорка, доноси закључак о карактеристикама целе масе. У овом
раду примењено је делимично посматрање, односно одговарајући узорак и
најчешће коришћене методе за анализу узорака.
Ако је популација на којој желимо истраживати неке карактеристике велика
или чак бесконачна, неопходно је из такве популације формирати узорак који мора
бити добар репрезент те популације.
На основу узорка се најчешће изводе процене параметара популације или се
изводи тестирање хипотеза, односно доносе закључци о одређеним
претпоставкама. Неке од претпоставки које се најчешће проверавају, односно
хипотезе које се тестирају могу бити:
1. Дистрибуција фреквенција има одређени облик
2. Узорак припада одређеној популацији
3. Два узорка припадају истој популацији
4. Две варијабле су независне
5. Коефицијент корелације популације једнак је нули
У процесима статистичког закључивања често се унапред претпоставља
постојање одређених веза међу појавама које се испитују или одређена расподела
обележја која се изучава. Поступак провере ових претпоставки назива се тестирање
статистичких хипотеза.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
15
Научна хипотеза представља нагађање, наслућивање и претпоставке које
мотивишу истраживање. Из научне хипотезе, односно хипотезе истраживача, која
је најчешће афирмативна, изводи се статистичка хипотеза2.
Статистичка хипотеза се исказује на начин тако да може бити вреднована
статистичко-аналитичким поступцима. Статистичка хипотеза је математички израз
који представља полазну основу на којој се темељи калкулација статистичког теста.
Тестирање хипотезе је статистички поступак којим се одређује да ли и
колико поуздано расположиви подаци подупиру постављену претпоставку.
Тестирање хипотеза, односно тестирање значајности је у основи поступак
квантификације закључака о специфичној хипотези.
Нулта хипотеза, H0 je претпоставка о изостанку ефекта, односно не
постојању разлика међу узорцима које посматрамо. Циљ је да се постављена нулта
хипотеза или прихвата или одбацује.
Алтернативна хипотеза, H1 важи ако нулта хипотеза није истинита, односно
стоји као супростављена нултој хипотези. Најчешће се директно односи на
теоријску претпоставку која се истражује, а често је алтернативна хипотеза управо
постављена хипотеза истраживача.
Тестирање хипотеза прати следећи ток3:
- дефинисање нулте H0 и алтернативне хипотезе H1;
- избор модела теоријског распореда вероватноћа, на основу кога ће се
извести тестирање хипотеза;
- избор узорка на случајан начин;
- израчунавње тест статистике на основу изабраног узорка;
- одређивање нивоа поузданости (1-α)*100, односно вероватноће
поузданости (1-α) и нивоа разлике α;
- утврђивање критеријума, односно границе за прихватање или
одбацивање формулисане хипотезе;
- израчунавање вредности променљивих u0, t0, F0, у зависности од тога
који се модел теоријског распореда користи за тестирање;
- очитавање критичних вредности из одговарајућих таблица;
2 Тестирање хипотеза, Кујунџић, Иванковић
3 Статистика - дескрипивна и статистичка анализа, Хаџи Стојковић
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
16
- поређење резултата статистичког теста са вредностима из познате
дистрибуције вероватноће специфичне за дати тест;
- интерпретација резултата статистичког теста и доношење одлуке о
прихватању или одбацивању формулисане хипотезе;
Тестови по којима се спроводи поступак доказивања или одбацивања нулте
хипотезе називају се тестови значајности (сигнификантности) и могу се поделити
у две групе4:
- параметарски тестови
- непараметарски тестови
Параметарски (нумерички) тестови или класични тестови су формулисани
пре непараметарских, почетком XX века. Њихова теоријска основа се заснива на
тадашњем уверењу истраживача да у природи и друштву преовладава само један,
нормалан распоред. Параметарски тестови имају заједнички предуслов да основни
скупови коме припадају анализирани узорци имају нормалан распоред.
Параметарски тестови се примењују када:
- су вредности испитиваног обележја дате нумерички, односно
интервалом и скалом односа
- подаци о појави која се проучава не одступају значајно од нормалне
расподеле, за велике узорке (више од 30 јединица) и без обзира на
њихов распоред
Најпознатији и теоријски најразрађенији и практично применљиви су z-тест
и t-тест.
Непараметарски тестови или тестови независни од распореда, су настали
средином XX века, а представљају логичну реакцију статистичара на чињеницу да
се претпоставка о нормалности свих појава показала нетачном. Заснивају се на
много блажим условима о облику основног скупа, а могу се применити и на
квантитативна обележја. Непараметарски статистички тестови не зависе од строгих
претпоставки за основни скуп из кога се формира узорак. Примењују се када:
- су вредности обележја дате описно
- за нумеричка обележја, када је мали узорак (мањи од 30 јединица), а
подаци су несиметрично распоређени (одступање од нормалне
4 Основи статистике, М. Ловрић
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
17
расподеле се третира посебним тестовима), када се варијабле не
третирају као бројеви са којима су могуће математичке операције
него као рангирани низ.
Непараметарски тестови имају мању поузданост и мању снагу од
параметарских тестова. Непараметарски тестови тестирају разлику између
фреквенција или њихових позиција у скупу.
Зависно од врсте постављене хипотезе постоје две врсте теста5:
1. двосмерни тест
Двосмерним тестом тестирамо непознате вредности аритметичке средине
основног скупа μ на основу нормалног распореда вероватноћа, где је H0 : μ = μ0.
Код двосмерног теста ризика грешке α равномерно се дели на оба краја нормалне
криве (слика 1).
Слика 1: Област прихватања и област одбацивања полазне хипотезе код
двосмерног теста
2. једносмерни тест
У случају да нулта хипотеза гласи H0 : μ ≤ μ0 и H1 : μ > μ0 , ризик грешке α
налази се на десној страни нормалне криве расподеле (слика 2).
Слика 2: Област прихватања и област одбацивања полазне хипотезе код горњег
једносмерног теста
5 Статистика - дескрипивна и статистичка анализа, Хаџи Стојковић
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
18
У случају да нулта хипотеза гласи H0 : μ ≥ μ0 и H1 : μ < μ0 , ризик грешке α
једносмерног теста налази се на левој страни нормалне криве расподеле (слика 3).
Слика 3: Област прихватања и област одбацивања полазне хипотезе код доњег
једносмерног теста
У случају да систематске и инструменталне грешке сведемо на најмању
могућу меру укупна грешка резултата је одређена случајном грешком.
Ако се за сваки узорак израчуна аритметичка средина и стандардна
девијација и ако се дистрибуирају аритметичке средине свих узорака, добиће се
самплинг дистрибуција.
Самплинг дистрибуција је нормална дистрибуција код које су аритметичке
средине узорака дистрибуиране око аритметичке средине популације.
Помоћу Гаусове расподеле проналазимо вероватноћу да се резултати
мерења нађу у симетричном интервалу око средње вредности. Добија се
интеграцијом функције која описује Гаусову расподелу на интервалу од -а до а.
Свака Гаусова крива је одређена аритметичком средином и стандардном
девијацијом.
Корен из просечне удаљености и тачака од средње вредности назива се
стандардна девијација Ϭ, односно SD, и рачуна се помоћу формуле:
Ϭ =√∑(𝑥𝑖 − �̅�)2
𝑛−1
xi - појединачно мерење
�̅� - средња вредност n броја мерења
Да ли ће размак за дате оквире бити апсолутно већи или мањи зависи од
величине стандардне грешке оцене. Стандардна девијација утиче на ширину
Гаусове криве, односно већа стандардна девијација значи да су током мерења
случајне грешке биле велике, или да су одступања од средње вредности велика.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
19
Стандардан нормалан распоред чини употребу Гаусове криве
једноставнијом, и дефинисан је �̅� = 0, и Ϭ = 1. Ако податке који карактеришу
стандардан распоред заменимао у формули за z вредност добијамо стандардизоване
вредности случајне променљиве6:
𝑧 = x−x̅
SD=
x−0
1= x
На основу стандардизованих вредности формиране су таблице вероватноће
одговорајућих површина. Како је симетричност једна од особина овог распореда,
добијамо једнаке површине између 0 и z , као и између -z и 0.
Код малих узорака користимо студентов t - распоред, где симбол z - вредност
замењује t - вредност. Студентов t - распоред можемо рачунати помоћу израза:
𝑡 = xuz−xos
SG=
xuz−xos SDuz
√n−1
Стандардна грешка представља случајно променљиву, јер зависи од
величине узорка, па стим и t вредност зависи од величине узорка. Код z вредности
стандардна грешка је константа, па z вредност не зависи од величине узорка.
Аритметичке средине једнаких узорака, мањих од 30 јединица распоређују се око
аритметичке средине основног скупа по t распореду, тако да t вредност зависи од
величине узорка. Крива t распореда је симетрична и има облик звона као код
нормалног распореда и дефинисана је у интервалу од минус до плус бесконачно.
Приликом оцене интервала за мале узорке не примењује се табела
нормалног распореда, већ Студентова, односно, табела t-распореда (табела 1 у
прилогу), где су изведене граничне t вредности за одговарајућу вероватноћу и број
степена слободе. У случају када имамо број јединица узорака већи од 30, t вредност
се изједанчује са z вредношћу, а Студентов t распоред добија облик стандардног
нормалног распореда.
Приликом примене методологије тестирања одлуку о томе које вредности
спадају у подручје одбацивања, а које у подручје прихватања постављене хипотезе,
доноси се на основу нивоа значајности α. Ниво значајности α је вероватноћа да смо
одбацили нулту хипотезу када је она заправо истинита. Ниво значајности α
6 http://wwwserver.medfak.ni.ac.rs/predavanja/3.%20farmacija/statistika/7.%20predavanje.pdf
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
20
представља граничну вероватноћу уз коју би још увек требало прихватити
евентуално истиниту нулту хипотезу.
Закључивање приликом тестирања може се извести и на основу p вредности.
Вредност p представља вероватноћу да се, ако нулта хипотеза тачна, на узорку исте
величине, какав је коришћен у истраживању, добије таква или екстремнија
вредност тест статистика за тестирање нулте хипотезе. Уколико узмемо да је ниво
значајности α = 0.05 тада имамо следеће7:
- ако је p < 0.05 одбацује се нулта хипотеза и резултати су статистички
значајни (сигнификантни) на 5% нивоу значајности;
- ако је p ≥ 0.05 прихвата се нулта хипотеза. При томе резултати нису
статистички значајни (сигнификантни) на 5% нивоу значајности, односно нема
довољно доказа за одбацивање нулте хипотезе.
Избор величине нивоа значајности статистичког теста (0.05; 0.01; 0.001) је
произвољан. Величина нивоа значајности говори о томе у којем постотку
истраживач допушта да се начини грешка одбацивања истините нулте хипотезе. У
ситуацијама када су последице одбацивања нулте хипотезе озбиљне, треба
захтевати снажније доказе за одбацивање нулте хипотезе (ниво значајности од 0.01
или 0.001).
2.1.2. Статистичко истраживање
Током истраживања се сакупљају подаци, изводи нека врста статистичке
анализе над подацима (t-тест, ANOVA и др.) која даје вредности познате као тест
статистикa. Тестирање статистичке значајности (ТСЗ) представља главно средство
статистичког закључивања које истраживачи користе у емпиријским
истраживањима. ТСЗ подразумева проверу статистичке нулте хипотезе рачунањем
вредности тест статистика и одређивањем одговарајуће p вредности. Уколико је p
вредност, мања од одабраног нивоа значајности, нулта хипотеза се одбацује.
Насупрот томе, уколико је вредност тест статистике мала, а њој придружена p
вредност већа од одабраног нивоа значајности, нулту хипотезу није могуће
одбацити. Све више се изражавају несугласице са конвенционалним приступом
статистичког закључивања, заснованом на интерпретацији статистичке значајности
7 Тестирање хипотеза, Кујунџић, Иванковић
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
21
и p вредности. У тумачењу ТСЗ наилазимо на две проблематике у организационом
смислу8:
- унутрашњу логику, ограничења и домет ТСЗ
- начин на који се изводи и тумачи, односно употребљава ТСЗ
Истраживачи често прибегавају једноставним објашњењима када добију
статистички значајне резултате, а при томе занемаре реалан допринос тих резултата
у процесу развоја научних дисциплина које креирају референтни оквир за
истраживања. Поред тога, ТСЗ представља корисно аналитичко средство и може
имати важну функцију у емпиријским истраживањима уколико се добро разумеју
њихова ограничења, ако се правилно користи и уколико се допуни информацијама
које истраживачима стоје на располагању у подацима.
2.1.3. Снага теста
Закључивање у статистици се изводи на основу информација из узорка, па
је могуће направити грешку и донети погрешну одлуку9.
Грешка Типа I настаје када одбацимо истиниту нулту хипотезу. Ниво
значајности статистичког теста α, представља вероватноћу да се начини грешка
Типа I. Величину нивоа значајности треба одредити пре прикупљања података.
Грешка Типа II настаје када се прихвати неистинита нулта хипотеза и при
томе се закључи да нема ефекта када он стварно постоји. Вероватноћа да се начини
грешка Типа II назива се β (бета).
Нулта хипотеза о вредности непознатог параметра основног скупа, може у
стварности бити или истинита или неистинита, док подаци случајног узорка могу
бити или сагласни са H0 или јој противречити. Код тестирања као и код оцењивања
постоји могућност доношења погрешног закључка. На основу табеле 1, видимо да
исправно поступамо у два случаја:
- када је H0 истинита, а информација из узорка сагласна са њом, тада
хипотезу нећемо одбацити;
- ако одбацимо H0 која је неистинита.
8 Мала реформа у статистичкој анализи података у психологији: Мало p није довољно,
потребна је и величина ефекта, Тењовић, Смедеревац
9 Тестирање хипотеза, Кујунџић, Иванковић
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
22
Како узорак никада није савршено репрезентативан, могућа су и следећа два
исхода:
- да информација из узорка противречи истинитој нултој хипотези;
- да се сагласи са неистинитом нултом хипотезом.
Из табеле 1 се види да реално постоји могућност да направимо две различите
грешке: Типа I и Типа II.
Табела 1: Грешке приликом доношења закључака о популацији на основу узорка10
Ниво значајности је вероватноћа остварења грешке Типа I, односно
вероватноћа ризика да одбацимо истиниту нулту хипотезу.
Снага теста представља вероватноћу одбацивања неистините нулте
хипотезе, односно вероватноћу да нећемо направити грешку Типа II. Рачуна се као
1-β. Снага теста заправо је могућност детектовања, као статистички значајног,
одређеног реалног ефекта11.
На снагу статистичког теста утичу:
• величина узорка - снага расте сразмерно величини узорка;
• варијабилност опажања - снага пада како расте варијабилност опажања;
• ефекат од интереса (ефекат разлике) - снага је већа што је ефекат већи;
• ниво значајности α - снага је већа што је ниво значајности већи.
Може се приметити да је фактор на који се најлакше утиче уствари величина
узорка. Стога се тзв. анализа снаге користи за израчунавање потребне величине
узорка за истраживање са високом вероватноћом откривања стварног ефекта задате
величине.
Да би се повећала снага предложеног статистичког теста важно је унапред
познавати кораке у планирању истраживања. Адекватна снага статистичког теста
указује да он има добру шансу откривања релевантног ефекта, ако он постоји.
Снага доброг статистичког теста требала би бити барем 70-80%. Етички је
10 Статистика, Лозанов-Црвенковић
11 Тестирање хипотеза, Кујунџић, Иванковић
Одлука Стварна ситуација
H0 је тачна H1 је тачна
H0 се не одбацује Исправан закључак Грешка II врсте
H0 се одбацује Грешка I врсте Исправан закључак
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
23
неприхватљиво, а такође је и губитак времена и средстава, изводити истраживања
која имају мању шансу откривања реалног ефекта.
2.1.4. Погрешне интерпретације p вредности
Један од кључних извора проблема који се јављају у коришћењу ТСЗ је
недовољно разумевање суштине и правог значења p вредности која истраживачима
представља ослонац у закључивању на основу добијених резултата. Многи
истраживачи се у свом раду приликом доношења закључака ослањају на p вредност
и приписују јој значења која ова вредност нема. Најчешће и најштетније погрешне
интерпретације p вредности су12:
1. Тумачење да p вредност представља вероватноћу да су добијени резултати
последица грешке узорковања, је погрешно, јер грешка узорковања стоји у основи
рачунања вероватноће p и већ је укључена у логику статистичког теста која
омогућава рачунање p вредности. Статистички значајан резултат не значи да такав
резултат није последица грешке узорковања.
2. p вредност представља вероватноћу погрешне одлуке у случају
одбацивања тачне нулте хипотезе. Ово тумачење погрешно поистовећује p
вредност са вредношћу нивоа значајности α. Вредност α је априорна вероватноћа
грешке при одбацивању тачне нулте хипотезе која се одређује пре него што су
подаци прикупљени и на основу које се поставља критеријум за одбацивање нулте
хипотезе, док је p постериорна вероватноћа да статистика за тестирање нулте
хипотезе на случајном узорку одређене величине узме вредност једнаку оној која
је добијена у конкретном истраживању.
3. Интерпретација да p вредност представља вероватноћу да је нулта
хипотеза тачна ако се добијени резултати узму у обзир, је погрешна и последица је
потребе истраживача да на основу прикупљених података процени вероватноћу да
је нулта хипотеза тачна. Међутим, p вредност представља условну вероватноћу
добијања резултата ако је нулта хипотеза тачна.
4. 1-p директно даје меру вероватноће да ће се добијени резултати поновити
ако би се истраживање поновило у истим условима. Истраживачи често верују да
12 Мала реформа у статистичкој анализи података у психологији: Мало p није довољно,
потребна је и величина ефекта, Тењовић, Смедеревац
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
24
мала p вредност која води одбацивању нулте хипотезе даје директну меру
вероватноће репликације резултата у поновљеним истраживањима и да је ова мера
једнака 1-p. Иако између p вредности и статистичке снаге репликације резултата
постоји веза, вероватноћу репликације резултата није могуће израчунати на овај
начин.
5. 1-p представља вероватноћу да је, алтернативна хипотеза тачна, када се у
обзир узму добијени подаци. Вредност 1-p представља вероватноћу да се добије
мање екстремна вредност статистика за тестирање нулте хипотезе, ако је нулта
хипотеза тачна и не може показивати постериорну вероватноћу тачности
алтернативне хипотезе.
На основу наведених погрешних тумачења p вредности, приликом извођења
тестова, неопходно је водити рачуна о његовим ограничењима и дометима који
проистичу из правог значења p вредности: p вредност представља вероватноћу да
се, ако је нулта хипотеза тачна, на узорку исте величине, какав је коришћен у
истраживању, добије таква или екстремнија вредност статистика за тестирање
нулте хипотезе. Основни проблем који се уочава у процесу статистичког
закључивања на основу p вредности, је могућност да неки резултат, иако
статистички значајан, има незнатну практичну релевантност.
Важно је имати у виду да p вредност не даје непосредне информације о
практичном значају добијених резултата.
ВЕЛИЧИНА ЕФЕКТA
2.2.1. Величина ефекта и p вредност
Задње две, три деценије све више се показује потреба да се оде корак даље
од једноставног тестирања нулте хипотезе и одређивања статистичке значајности,
а све са циљем да се из резултата статистичке обраде добију квалитетније
информације. Проблеми који се генеришу искључиво на ослањање на p вредност
као основ за статистичко закључивање могу бити барем делимично умањени
увођењем додатних статистичких показатеља помоћу којих је могуће одредити
параметре, на основу расположивих података, као што су величина ефекта и
интервал поузданости.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
25
P вредност је функција резултата посматраног узорка, односно његова
статистика која се користи за тестирање статистичких хипотеза. Пре него што се
започне са тестирањем, потребно је одредити граничну вредност која означава ниво
значајности теста вероватноће посматраних података. Вредност p не означава
вероватноћу да је нулта хипотеза тачна.
Све више се намеће потреба за статистичким показатељем који ће пружити
бољи увид у то колики је учинак независно променљиве, а не само да ли он постоји
или не. Један од таквих додатних статистичких показатеља који истраживачима
омогућује да имају бољи увид у резултате истраживања је величина ефекта. У том
случају закључак истраживања као коначан резултат истраживања има смисла ако
разлика или степен повезаности достигне одређену величину.
2.2.2. Основни појмови величине ефекта
Величина ефекта се у најширем смислу може дефинисати као било који
статистички показатељ који квантификује степен у којем се резултат добијен на
узорку разликује од очекивања претпостављених нултом хипотезом. Такође,
величину ефекта можемо дефинисати као степен у којем испитивана појава постоји
у популацији, односно степен у којем је нулта хипотеза нетачна13.
Величина ефекта је начин изражавања разлике између два посматрана скупа
који су систематски различито третирани у истраживању. У том случају величина
ефекта назначава колико је утицаја имао експериментални третман. Величина
ефекта се користи да би се одредила разлика између две групе када је једна од њих
подвргнута експерименталном третману, а друга није (контролна група). У овом
случају ефекат величине је мера успешности утицаја третмана над
експерименталном групом. Величина ефекта може бити изражена и као величина
повезаности између варијабли, изражена коефицијентом корелације. Тако добијена
вредност може сама за себе да се третира као параметар који поприма вредност
нула када је нулта хипотеза тачна или неку другу вредност када нулта хипотеза није
тачна, и као таква може служити као индекс степена одступања од нулте хипотезе.
13 Мала реформа у статистичкој анализи података у психологији: Мало p није довољно,
потребна је и величина ефекта, Тењовић, Смедеревац
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
26
Величина ефекта је основни резултат квантитативних истраживања. Сама p
вредност даје информацију да ли ефекат постоји, али на основу p вредности се не
може одредити величина ефекта. Приликом извештавања и тумачења добијених
резултата наводи се и њихова величина ефекта и статистичка значајност, односно
p вредност.
2.2.3. Зашто p вредност није довољна
Статистичка значајност је вероватноћа да је посматрана разлика између два
скупа случајна, ако је хипотеза H0 тачна. Ако је p вредност већа од изабране α
вредности, нпр. 0.05, претпоставља се да је посматрана разлика добијена због
варијабилности узорковања. У случају да се нулта хипотеза прихвата, алтернативна
хипотеза се одбија и супротно, уколико се нулта хипотеза одбије, алтернативна
хипотеза се прихвата. Величина разлике се не разматра, већ се само констатује да
добијена разлика није статистички значајна или јесте статистички значајна.
Уколико би истраживање поновили под свим једнаким условима, добили би
једнако значајан резултат, али је мала вероватноћа да величина разлике буде иста
као у претходном мерењу. Та мала вероватноћа добијања једнаке разлике у
поновљеном мерењу је последица утицаја случајних фактора приликом одабира
случајног узорка, али и других чинилаца који су присутни при сваком мерењу. Са
значајно великим узорком, статистички тест ће скоро увек показати значајну
разлику, осим када ефекат не постоји, односно када је величина ефекта једнака
нули. Интерпретација која се заснива само на значајности p вредности није
довољно да се резултати у потпуности разумеју14.
Уколико узмемо да је величина узорка довољно велика вероватно ће се
пронаћи значајна p вредност, чак и ако је разлика између два скупа занемарљива.
Ниво значајности сам за себе не може да предвиди величину ефекта. Величина
ефекта је независна од величине узорка, док статистичка значајност зависи и од
величине узорка и од величине ефекта. Стим p вредност може да делује збуњујуће
због њене зависности од величине узорка, где некад статистички значајан резултат
значи да је коришћен сувише велик узорак.
14 Using Effect Size - or Why the P Value Is Not Enough, Sullivan, Feinn
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
27
Тестирањем нулте хипотезе истраживач може само да потврди постојање
разлике и то у одређеној мери вероватноће. Самим тим се намеће да је потребан
статистички показатељ који ће показати колики је ефекат независне варијабле, а не
само да ли је постојао или не.
МЕРЕ ВЕЛИЧИНЕ ЕФЕКТА
Процена величине ефекта може да се користи за појединачни екперимент,
али и за већи број експеримената. У случају већег броја експеримената њихова
величина ефекта се прво израчунава за сваки експеримент појединачно. Уколико
постоји претпоставка да је величина ефекта једнака у сваком истраживању, тада
може да се процени заједничка величина ефекта користећи информације из сваког
истраживања. Важно је препознати када је процена и интерпретација заједничке
величине ефекта једнака за сва истраживања, јер процена средње вредности ефекта
може лако превидети битне разлике између истраживања.
Процена величине ефекта из појединачног истраживања са два скупа се
заснива на стандардној разлици аритметичких средина, које зависе од величине
узорка.
Величина ефекта омогућава да се резултати примарних истраживања
представе на стандардизован начин.
Величину ефекта користимо за генерисање експерименталних резултата.
Величину ефекта популације можемо да интерпретирамо као средњу вредност
изражену у скаларним јединицама. Ако су резултати у експерименталној и
контролној групи нормално дистрибуирани, средњу вредност користимо за
квантитативно одређивање степена преклапања између дистрибуције
експерименталног и контролног скупа.
Статистичка теорија, односно неки аутори разликују две најчешће основне
групе мера величине ефекта:
1) мере величине ефекта засноване на разлици аритметичких средина - d
група мера величине ефекта
2) мере величине ефекта засноване на степену повезаности две променљиве
- r група мера величине ефекта
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
28
И једна и друга група мера величине ефекта су независне од јединица мере
посматраних променљивих, односно представљају стандардизоване, индексне
вредности.
МЕРЕ ВЕЛИЧИНЕ ЕФЕКТА РАЗЛИКА ИЗМЕЂУ ДВЕ
АРИТМЕТИЧКЕ СРЕДИНЕ
2.4.1. Поређење аритметичких средина два независна случајна узорка
Аритметичка средина или просек је основна израчуната средња вредност.
Уколико прикупљени статистички подаци представљају цео основни скуп или
популацију, тада кажемо да је то артиметичка средина основног скупа μ , а уколико
су прикупљени подаци само део основног скупа, узорка, тада кажемо да је у питању
аритметичка средина узорка �̅�. Аритметичка средина негруписаних података под
условом да прикупљени подаци представљају цео основни скуп, популацију, може
се израчунати по формули:
𝜇 = 𝑥1+ 𝑥2+...+ 𝑥𝑖+ ...+ 𝑥𝑁
𝑁=
∑ 𝑥𝑖𝑁𝑖=1
𝑁=
1
𝑁 ∑ 𝑥𝑖
𝑁𝑖=1 , i = 1,2,...,N
xi , i = 1,2,...,N ,
N - број јединица посматрања и i = 1,2,...,N .
Ако прикупљени подаци представљају део основног скупа, односно узорак,
аритметичка средина се израчува по формули:
�̅� = 𝑥1+ 𝑥2+...+ 𝑥𝑖+ ...+ 𝑥𝑛
𝑛=
∑ 𝑥𝑖𝑛𝑖=1
𝑛=
1
𝑛 ∑ 𝑥𝑖
𝑛𝑖=1 , i = 1,2,...,n
xi , i = 1,2,...,n ,
Приликом тестирања разлике између две аритметичке средине потребно је
да оба узорка буду формирана на случајан начин и да су међусобно независни.
Полазна и алтернативна претпоставка, код овог теста формулисане су на
следећи начин:
H0 : µ = µ0
H1 : µ ≠ µ0
Формулисана полазна претпоставка проверава се на основу података из
узорка. Како варијансе основних скупова нису познате, израчунава се 𝑆(𝑥1− 𝑥2), која
представља оцењену стандардне грешке разлике аритметичких средина.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
29
Уколико се изводи стандардан t тест, утврђује се вредност тест статистике
по формули:
21
21
St
Уколико су величине два узорка једнаке 𝑛1 = 𝑛2, за израчунавање
стандардне грешке користи се израз:
𝑆(�̅�1− �̅�2) = √2 𝑆1+22
𝑛
Израз 𝑆1+22 представља здружену варијансу два узорка која се израчунава
помоћу формуле:
𝑆1+22 =
∑ 𝑋12 −
(∑ 𝑋1)2
𝑛1+ ∑ 𝑋2
2 − (∑ 𝑋2)2
𝑛2
𝑛1+ 𝑛2 −2 ,
Добијена вредност количника t упоређује се са вредностима из таблица
Студентове дистрибуције и она зависи од прага значајности α и степена слободе
грешке (n1+n2-2). Уколико вредност количника t превазилази табличну вредност,
закључује се да је разлика између аритметичких средина статистички значајна, а
нулта хипотеза се одбацује. Описани поступак провере значајности разлике две
средине представља конвенционални приступ тестирању, односно статистичком
закључивању.
Пример 1а:
Потребно је тестирати хипотезу о једнакости средина два узорка од којих
први узорак представља принос винове лозе која није третирана фолијарним
ђубривом, а други узорак представља принос винове лозе третиране раствором
фолијарног ђубрива. Резултати15 су приказани у табели 2.
15 Примери за вежбање из статистике, др. К. Чобановић
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
30
Табела 2: Приноси винове лозе
Принос винове лозе (t/ha)
n Узорак 1 Узорак 2
1 8.0 9.7
2 8.2 10.6
3 8.5 10.8
4 9.3 11.0
5 9.8 11.2
6 10.7 11.5
Ʃ 54.5 64.8
Потребно је утврдити да ли постоји разлика између две популације, на
основу два узорка винове лозе, односно да ли третирање фолијарним ђубривом
доводи до промене приноса код винове лозе. Претпостављена нулта хипотеза је да
нема разлике између приноса два узорка винове лозе.
H0 : �̅�1 = �̅�2
H1 : �̅�1 ≠ �̅�2
�̅�1 = ∑ 𝑋1
𝑛=
54.5
5 = 9.08
�̅�2 = ∑ 𝑋2
𝑛=
64,8
5 = 10.8
На основу табеле 3, формирана је радна табела (табела 3), са додатним
вредностима потребним за израчунавање тест статистике:
Табела 3: Вредности за израчунавање тест статистике
Принос винове лозе (t/ha)
Узорак 1 Узорак 2
n X1 X12 X2 X2
2
1 8.0 64.00 9.7 94.09
2 8.2 67.24 10.6 112.36
3 8.5 72.25 10.8 116.64
4 9.3 86.49 11.0 121.00
5 9.8 96.04 11.2 125.44
6 10.7 114.49 11.5 132.25
Ʃ 54.5 500.51 64.8 701.78
𝑆�̅�1 − �̅�2 = √2 𝑆1+2
2
𝑛 = √
1.482
6 = 0.497
𝑆1+22 =
∑ 𝑋12 −
(∑ 𝑋1)2
𝑛1 + ∑ 𝑋2
2− (∑ 𝑋2)2
𝑛2
𝑛1+ 𝑛2−2=
500.51− 54.502
6 + 701.78−
64.82
6
6 + 6 − 2=
7.41
10= 0.741
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
31
𝑡 =�̅�1− �̅�2
𝑆�̅�1− �̅�2
= 10.8 −9.08
0.497= 3.46 **
Како је таблична вредност за t0,05(10) = 2.28 , a t0,01(10) = 3.169 , закључује се да
постоји значајна разлика између аритметичких средина узорака и за α=5% и за
α=1%, што је довољно да одбацимо нулту хипотезу и са 95% и са 99% сигурности.
Третирање винове лозе фолијарним ђубривом статистички врло значајно утиче на
пораст приноса.
2.4.2. Методе за процену стандардне разлике аритметичке средине
У циљу добијања комплетнијег резултата изведеног теста, поред
конвенционалног поступка закључивања, потребно је сагледати колика је величина
ефекта између две артиметичке средине. Величину ефекта можемо сагледати
израчунавањем неког од показатеља наведене две групе мера величине ефекта:
Из групе мера величине ефекта заснованих на разлици аритметичких
средина најчешће се израчунава Cohen-ово d - Коенова мера величине ефекта
разлике аритметичких средина два независна случајна узорка из два основна скупа
која се дефинише на следећи начин:
𝑑 =𝜇1−𝜇2
𝜎
μ1 и μ2 аритметичке средине, а σ стандардна девијација основних скупова.
Оцена Cohen-овe мере израчуната на основу узорака је дефинисана на
следећи начин:
�̂� =�̅�1−�̅�2
𝑠𝑝
�̅�1 и �̅�2 су оцене параметара μi (i=1,2) на основу простих случајних независних
узорака, а Sp је оцена за непознату стандардну девијацију основних скупова,
израчуната на основу израза:
𝑆𝑝 = √(𝑛1−1)𝑆1
2 + (𝑛2−1)𝑆22
𝑛1+ 𝑛2−2
где су стандардне девијације израчунате по формули:
𝑆1 = √∑(𝑥1−�̅�)2
𝑛1−1 , односно 𝑆2 = √
∑(𝑥2−�̅�)2
𝑛2−1
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
32
У зависности од вредности d Cohen је интерпретирао овај показатељ на
следећи начин:
- мали ефекат: од 0.20 до 0.50
- средњи ефекат: od 0.50 до 0.80
- велики ефекат: d > 0.80
Како је оцена �̂� пристрасна оцена параметра d, Hedges16 је увео оцену
параметра d чиме је његова пристрасност редукована. Hedges-ово g, као мера
величине ефекта утврђује се на основу следећег израза:
𝑔 =𝑋1̅̅̅̅ − 𝑋2̅̅̅̅
𝑆𝑝 (1 −
3
4𝑛−9 )
Да би се добила стабилност резултата за утврђене мере величине ефекта
потребно је утврдити границе поузданости или сигурности и на тај начин додатно
сагледати стварно постојање ефекта.
Границе поузданости, односно интервал поверења утврђује се на основу
следећег израза:
𝑑 ̂ ± 𝑍𝛼 ∙𝑆𝑝
√𝑛1+𝑛2 , односно 𝑔 ± 𝑍𝛼 ∙
𝑆𝑝
√𝑛1+𝑛2
Ако је потребно утврдити величину ефекта на основу повезаности
променљивих израчунава се коефицијент корелације, као најчешће коришћени
показатељ из r групе мера величине ефекта. Тумачење d и r показатеља се
разликује, али како су оба показатеља стандардизовани може се трансформисати
један у други. Ако се утврди d мера величине ефекта, r се може исказати на следећи
начин:
𝑟 =𝑑
√𝑑2+4
d представља меру величине ефекта утврђену на основу разлике аритметичких
средина.
У зависности од вредности r величина ефекта може бити:
- мали ефекат: од 0.10 до 0.30
- средњи ефекат: 0.30 до 0.50
- велики ефекат: > 0.50
16 Distribution theory for Glass’s estimator of effect size and related estimators, Hedges, L. V.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
33
Величину ефекта r може се утврдити и на следећи начин:
𝑟2 =𝑡2
𝑡2 +𝑑𝑓 ≫ 𝑟 = √𝑟2
t је израчуната вредност тест статистике, а df су степени слободе који се
утврђују на основу величине узорака.
Такође, може се утврдити мера величине ефекта d ако је позната вредност
мере величине ефекта r, на основу следећег израза:
𝑑 =2𝑟
√1−𝑟2
Пример 1б:
У примеру 1а, је изведено тестирање стандардном методом t теста и
добијена је значајна разлика, што је довело до одбацивања нулте хипотезе. За
проверу, да би се утврдило да ли је са оправданим разлогом нулта хипотеза
одбијена, израчунавају се величине ефекта.
𝑆1 = √∑(𝑋1̅̅̅̅
− 𝑋𝑖)2
𝑛−1=
√(8−9.08)2 + (8.2−9.08)2 + (8.5−9.08)2 + (9.3−9.08)2 + (9.8−9.08)2 + (10.7−9.08)2
6−1= 1.046
𝑆2 = √∑( 𝑋2̅̅̅̅
− 𝑋𝑖)2
𝑛−1=
√(9.7−10.8) + (10.6−10.8) + (10.8−10.8) + (11.0−10.8) + (11.2−10.8) + (11.5−10.8)
6−1= 0.623
𝑆𝑝 = √(6−1)1,0462 +(6−1)0,6232
6+6−2= 0.8609
�̂� =9.08 − 10,8
0,8609=
|1.72|
0.8609= 1,998
Добијена вредност величине ефекта исказана Cohen-овим d је веома висока,
па добијена разлика између нетретираног узорка и узорка третираног фолијарним
ђубривом није случајна, већ је та разлика веома значајна.
Hedges-ово g, као мера величине ефекта у овом примеру има вредност:
𝑔 = 1,998 (1 −3
4∙12−9) = 1,844
Добијена вредност Hedges-овог g, такође указује да добијена разлика између
нетретираног узорка и узорка третираног фолијарним ђубривом није случајна.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
34
Вредност величине ефекта r за дати пример износи:
𝑟 =𝑑
√𝑑2+4=
1,998
√1,9982+4= 0.705 , 𝑟 =
𝑔
√𝑔2+4=
1,844
√1,8442+4= 0.695
Величина ефекта показатеља r је веома висока што показује, као и Cohen-
ово d и Hedges-ово g, да одбијање нулте хипотезе није случајно и да постоји
значајно одступање између два посматрана узорка.
Утврђена величина ефекта може се приказати и табеларно (табела 4).
Табела 4. Величина ефекта разлике две средине
Величина ефекта: 95% Интервал поверења:
Доња граница Горња граница
Cohen-ово d 1,998
Hedges-ово g 1,844 1,357 2,331
�̂� конвертовано у r 0,705 0,212 1,192
g конвертовано у r 0,695 0,208 1,182
У претходном примеру израчунате мере величине ефекта потврдиле су
закључак који је добијен на основу конвенционалног поступка тестирања разлике
две средине.
Пример 2.
У наредном примеру посматране су две инбред линије уљаног кукуруза, код
којих је анализиран проценат уља у зрну. Резултати који су анализирани добијени
су на основу огледа постављеног 2009. и 2010. године на Римским Шанчевима. На
основу резултата огледа (табела 2 у прилогу), направљено је поређење садржаја
уља код две популације уљаног кукуруза стандардним извођењем t-теста. За обраду
података коришћен је програм Microsoft Excel 2013, а добијени резултати су
приказани у табели 5.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
35
Табела 5. Поређење садржаја уља стандардним извођењем t-теста
Variable 1 Variable 2
Mean 16.3456875 15.809
Variance 1.128046065 1.136270692
Observations 160 160
Pooled Variance 1.132158379
Hypothesized Mean Difference 0
df 318
t Stat 4.511416061
P(T<=t) one-tail 4.53661E-06
t Critical one-tail 1.649659429
P(T<=t) two-tail 9.07322E-06
t Critical two-tail 1.967451881
Standard deviations 1.06209513 1.065959986
Резултати из табеле 5, показују да се полазна претпоставка о једнаком
проценту уља код две посматране инбред линије не прихвата, односно да се ове две
линије по проценту уља врло значајно разликују. Да би се утврдила величина
разлике израчунате су уобичајене мере ефекта (табела 6).
Табела 6. Величина ефекта разлике две средине
Величина ефекта 95% Интервал поверења:
Доња граница Горња граница
Cohen-ово �̂� 0,504
Hedges-ово g 0,503 0,387 0,62
�̂� конвертовано у r 0,244 0,127 0,360
g конвертовано у r 0,245 0,129 0,361
Израчунате вредности Cohen-овог d и Hedges-овог g, показују да је разлика
у проценту уља две инбред линије уљаног кукуруза на доњој граници средње
величине ефекта, односно не може се окарактерисати као врло значајна. Такође
мера ефекта исказана као степен слагања r, с обзиром на утврђену вредност упућује
на закључак да је величина ефекта мала.
На основу датих примера уочава се да су конвенционалним закључивањем
добијени статистички значајани резултати, али да је реалан допринос тих резултата
у анализи и објашњавању испитиваних проблема сагледан тек на основу утврђене
величине ефекта, што је дало реалније сагледавање испитиваних појава.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
36
МЕРЕ ВЕЛИЧИНЕ ЕФЕКТА У АНАЛИЗИ ВАРИЈАНСЕ
2.5.1. Анализа варијансе у статистичким инстраживањима
Анализа варијансе је један од начешће коришћених статистичких метода.
Представља математичко-статистички поступак помоћу кога се изводи тестирање
значајности разлике између аритметичких средина из три и више узорака, а у
оквиру тога и тестирање једног или више контролисаних фактора који утичу на
варијабилитет неког тестираног нумеричког обележја17.
Анализа варијансе је нашла примену у скоро свим областима истраживања
како у пољопривреди, тако и у биологији, медицини, социологији, техници.
Анализа варијансе врши испитивање утицаја:
- једног фактора варијабилитета;
- два фактора варијабилитета;
- два фактора варијабилитета са више посматрања, опсервација.
2.5.1.1. Анализа варијансе једног фактора варијабилитета
Анализом варијансе једног фактора варијабилитета изводи се испитивање
утицаја једног фактора варијабилитета на вредност нумеричког обележја
посматране појаве. На пример, утицај различитих сорти кукуруза на принос или
утицај различитих смена рада на продуктивност, где се сви утицаји сврставају у
анализу варијансе једног фактора варијабилитета18.
У овој анализи варијансе се полази од нулте хипотезе H0 да су аритметичке
средине свих подскупова μi , i = 1,2,…,m , из којих су формирани узорци једнаке,
односно да изабрани подскупови припадају истом основном скупу са
аритметичком средином μ.
17 18 Статистика - дескрипивна и статистичка анализа, Хаџи Стојковић
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
37
Хипотезе могу да се формулишу као:
H0 : μ1 = μ2 = ... = μi = … = μm = μ
H1 : Аритметичке средине бар два подскупа се разликују
m - означава број посматраних подскупова Ai , i = 1,2,…,m , односно показује
број фомрираних узорака из ових подскупова.
Анализа варијансе једног фактора варијабилитета изводи се у неколико
корака19:
1. израчунавају се одступања сваке јединице узорка xij : i = 1,2,…,m ,
j = 1,2,…,ni , од општег просека �̿� или од произвољног почетка �̅�0 . Произвољан
почетак �̅�0 може бити било који број из скупа прикупљених јединица у узорцима,
а може бити и нула, што се у пракси и најчешће ради.
2. израчунава се општи просек свих посматрања, свих јединица у узорцима
на основу формуле:
�̿� = ∑ ∑ 𝑥𝑖𝑗
𝑛𝑖𝑗=1
𝑚𝑖=1
∑ 𝑛𝑖𝑚𝑗=1
,
а аритметичка средина узорка, по редовима, израчунава се на основу релације:
�̅�𝑖 = ∑ 𝑥𝑖𝑗
𝑛𝑖𝑗=1
𝑛𝑖 , i = 1,2,…,m
3. израчунава се сума квадрата одступања ST, SA и SR. Сума квадрата
одступања свих посматраних јединица xij : i = 1,2,…,m ; j = 1,2,…,ni , од општег
просека �̅� или од произвољног почетка �̅�0 , која се назива и тотална дисперзија,
израчунава се на основу формуле:
𝑆𝑇 = ∑ 𝑚𝑖=1 ∑ (𝑥𝑖𝑗 − �̿�𝑖)
2 = ∑ 𝑚𝑖=1 ∑ (𝑥𝑖𝑗)2𝑛𝑖
𝑗=1 − 𝑆2
𝑛
𝑛𝑖𝑗=1
n укупан број јединица у свим узорцима n = n1 + n2 + ... + ni + ... + nm .
Сума квадрата одступања аритметичких средина узорака �̅�𝑖 , i = 1,2,…,m , од
општег просека �̅� , односно сума квадрата одступања између група Ai , i = 1,2,…,m,
назива се дисперзија по фактору A, и израчунава се по формули:
𝑆𝐴 = ∑ 𝑛𝑖(�̅�𝑖 − �̿� )2𝑚
𝑖=1 = ∑𝑆𝑖
2
𝑛𝑖
𝑚𝑖=1 −
𝑆2
𝑛
19 Статистика - дескрипивна и статистичка анализа, Хаџи Стојковић
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
38
Сума квадрата одступања јединица xij , i = 1,2,…,m , j = 1,2,…,ni , у узорцима
од аритметичких средина �̅�𝑖, i = 1,2,…,m, односно сумa квадрата одступања између
група Ai, i = 1,2,…,m, која се назива резидуална дисперзија, израчунава се по
формули:
𝑆𝑅 = ∑ 𝑚𝑖=1 ∑ (𝑥𝑖𝑗 − 𝑥𝑖)2𝑛𝑖
𝑗=1 = 𝑆𝑇 − 𝑆𝐴
4. израчунава се оцена факторијалне варијансе VA, резидуалне варијансе VR,
и укупне варијансе VT , по формулама:
𝑉𝐴 = 𝑆𝐴
𝑟1=
𝑆𝐴
𝑚−1
𝑉𝑅 = 𝑆𝑅
𝑟2=
𝑆𝑅
𝑛−𝑚
𝑉𝑇 = 𝑆𝑇
𝑟=
𝑆𝑇
𝑛−1
5. израчунава се однос варијације F0, на основу формуле:
𝐹0 = 𝑉𝐴
𝑉𝑅> 1 или 𝐹0 =
𝑉𝑅
𝑉𝐴> 1
Како је у Snedekor-овој табели F распореда (табела 3а и 3б у прилогу)
најмања таблична вредност један (1), у однос варијанси F0, у бројилац се увек
ставља већа варијанса VA или VR. Ако се у бројилац за израчунавање F0, стави VA,
онда таблична вредност 𝐹(α,r1,𝑟2) , где је r1 = m - 1, а r2 = n - m , а ако се у бројилац
уврсти VR , онда је таблична вредност 𝐹(α,r2,𝑟1)
6. доноси се одлука о прихватању или одбацивању нулте хипотезе H0 , као
што је приказано на слици 420.
7. ако се нулта хипотеза H0 одбаци, изводи се тестирање разлике између
појединих аритметичких средина узорака. У статистистичкој пракси најчешће се у
овом случају изводи неки од следећа три теста:
а. тестирање разлике између појединих аритметичких средина узорака
применом „t“
б. тестирање најмање значајне разлике (НЗР)
ц. Такијев тест
20 Статистика - дескрипивна и статистичка анализа, Хаџи Стојковић
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
39
Слика 4: Област прихватања и област одбацивања полазне хипотезе код F теста
Тестирање значајне разлике (НЗР) се најчешће користи, и израчунава се као:
НЗР = 𝑡(𝛼,𝑟2) 𝑆( 𝑥 𝑖 − 𝑥 𝑖+1) , i = 1,2,…,m ,
𝑡(𝛼,𝑟2) је таблична вредност која се очитава из табеле 1 (у прилогу), за ризик грешке
α и број степена слободе r2 = n - m, a 𝑆( 𝑥 𝑖 − 𝑥 𝑖+1) , i = 1,2,…,m . Стандардна грешка
разлике између две аритметичке средине, израчунава се:
𝑆( 𝑥 𝑖 − 𝑥 𝑖+1) = √2𝑉𝑅
𝑛𝑖 , i = 1,2,…,m ,
ако сви узорци имају исти број јединица n1 = n2 = ... = ni = ... = nm . У случају када
узорци имају различит број јединица, користи се формула:
𝑆( 𝑥 𝑖 − 𝑥 𝑖+1) = √𝑉𝑅( 1
𝑛𝑖 +
1
𝑛𝑖+1) , i = 1,2,…,m
Разлика између аритметичких средина два узорка |�̅�𝑖 - �̅�𝑖+1| је значајна ако је
испуњен услов:
|�̅�𝑖 − �̅�𝑖+1| ≥ НЗР , i = 1,2,…,m
а није значајна ако је:
|�̅�𝑖 − �̅�𝑖+1| < НЗР , i = 1,2,…,m
Уколико се тестирање разлике изводи уз ризик грешке α=5%, онда је
разлика |�̅�𝑖 − �̅�𝑖+1| значајна и обележава се са (*), а ако се тестирање изводи уз
ризик грешке α=1%, онда је разлика |�̅�𝑖 − �̅�𝑖+1| високо статистички значајна и
обележава се са (**), уз услов да је:
|�̅�𝑖 − �̅�𝑖+1| ≥ НЗР , i = 1,2,…,m
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
40
2.5.1.2. Анализа варијансе два фактора варијабилитета
У анализа варијансе два фактора варијабилитета врши се испитивање
утицаја два фактора варијабилитета Ai , i = 1,2,…,m , и Bj , j = 1,2,…,s , као на пример,
анализа приноса разних сорти пшенице прихрањиване разним врстама минералног
ђубрива, анализа продаје различитих типова производа у различитим земљама итд.
Овим тестом се истовремено посматра утицај две групе фактора
вaријабилитета Ai, i = 1,2,…,m , и Bj , j = 1,2,…,s , где је сваки елемент xij , i = 1,2,…,m;
j = 1,2,…,s , под истовременим утицајем оба фактора A и B. Свака од могућих
комбинација (Ai , Bj), i = 1,2,…,m ; j = 1,2,…,s , je заступљена само једном. Укупан
број посматрања је n = ms , где је m број фактора A , а s број фактора B.
Код овог теста анализе варијансе хипотезе је дефинишу као:
H0 : μ (A1) = μ (A2) = ... = μ (Ai) = ... = μ (Am) = μ
H1 : Бар две аритметичке средине се разликују
H0 : μ (B1) = μ (B2) = ... = μ (Bi) = ... = μ (Bm) = μ
H1 : Бар две аритметичке средине се разликују
Поступак тестирања је исти као и код анализе варијансе једног фактора
варијабилитета. Уводе се симболи Si, који представља збир посматрања елемената
по редовима, Sj, који представља збир елемената по колонама и S који представља
збир свих посматраних елемената.
Тотална дисперзија ST, факторијална дисперзија SA, факторијална дисперзија
SB и резидуална дисперзија SR, израчунавају се по следећим изразима:
𝑆𝑇 = ∑ ∑ (𝑥𝑖𝑗 − �̿�)2
𝑠𝑗=1
𝑚𝑖=1 = ∑ ∑ (𝑥𝑖𝑗)
2−
𝑆2
𝑛 𝑠
𝑗=1𝑚𝑖=1
𝑆𝐴 = ∑ 𝑠(�̅�𝑖 − �̿� )2 𝑚𝑖=1 =
∑ 𝑆𝑖2𝑚
𝑖=1
𝑠−
𝑆2
𝑛
𝑆𝐵 = ∑ 𝑚(�̅�𝑗 − �̿� )2
𝑠𝑗=1 =
∑ 𝑆𝑗2𝑠
𝑗=1
𝑚−
𝑆2
𝑛
𝑆𝑅 = 𝑆𝑇 − 𝑆𝐴 − 𝑆𝐵
Оцене варијабилитета се израчунавају на основу израза:
𝑉𝐴 = 𝑆𝐴
𝑟1=
𝑆𝐴
𝑚−1
𝑉𝐵 = 𝑆𝐵
𝑟2=
𝑆𝐵
𝑠−1
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
41
𝑉𝑅 = 𝑆𝑅
𝑟3=
𝑆𝑅
(𝑚−1)(𝑛−1)
𝑉𝑇 = 𝑆𝑇
𝑟=
𝑆𝑇
𝑛−1
Односи варијанси се израчунавају на основу релације:
𝐹0(𝐴) = 𝑉𝐴
𝑉𝑅 или 𝐹0(𝐴) =
𝑉𝑅
𝑉𝐴
𝐹0(𝐵) = 𝑉𝐵
𝑉𝑅 или 𝐹0(𝐵) =
𝑉𝑅
𝑉𝐵
Уколико одбацимо нулту хипотезу H0 по фактору A или по фактору B или
по оба фактора, тада изводимо тестирање значајности разлике између појединих
аритметичких средина узорака, где најчешће користимо тест најмање значајне
разлике (НЗР).
Стандардна грешка разлике између аритметичких средина за фактор A, за
редове, израчунава се на основу израза:
𝑆(�̅�𝑖− �̅�𝑖+1) = √2 𝑉𝑅
𝑠 ,
а за фактор B, за колоне, на основу израза:
𝑆(�̅�𝑖− �̅�𝑖+1) = √2 𝑉𝑅
𝑚
Таблична вредност 𝑡(𝛼,𝑟3) очитава се из табеле 1, у прилогу, за ризике грешке
α и број степени слободе r3 = (m-1)(s-1).
Најмања значајна разлика (НЗР) и за фактор A и за фактор B, израчунава се
на основу израза:
НЗР = 𝑡(𝛼,𝑟2) 𝑆𝑥 𝑖− 𝑥 𝑖+1 , i = 1,2,…,m
У анализи варијансе два фактора варијабилитета оцењује се и релативан
значај утицаја фактора A и за фактора B, на посматрану појаву, на основу израза:
𝑅𝐴 =𝑆𝐴−(𝑚−1)𝑉𝑅
𝑆𝑇 − 𝑉𝑅 , и
𝑅𝐵 =𝑆𝐵−(𝑠−1)𝑉𝑅
𝑆𝑇 − 𝑉𝑅
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
42
2.5.1.3. Анализа варијансе два фактора варијабилитета са више
посматрања, опсервација
Метод анализе варијансе фактора варијабилитета са више опсервација
испитује утицај два фактора варијабилитета A и B, при чему је свака од могућих
комбинација фактора (Ai , Bi), i = 1,2,…,m ; j = 1,2,…,s , заступљена h пута. При томе
се укупан број посматрања може посматрати као n = msh. Уколико је код сваке
комбинације (Ai , Bi), i = 1,2,…,m ; j = 1,2,…,s , број посматрања h > 1, онда се може
утврдити да ли постоји међусобно дејство, односно интеракција фактора A и B. Под
интеракцијом фактора A и B подразумева се повезани утицај ових фактора, односно
да се утицај једног фактора мења у зависности од нивоа другог фактора21.
Код ове врсте тест анализе могу се формулисати хипотезе као:
H0 : μ (A1) = μ (A2) = ... = μ (Ai) = ... = μ (Am) = μ
H1 : Бар две аритметичке средине се разликују
H0 : μ (B1) = μ (B2) = ... = μ (Bi) = ... = μ (Bm) = μ
H1 : Бар две аритметичке средине се разликују
H0 : μ (AB)ij = μ
H1 : μ (AB)ij ≠ μ
Поступак тестирања је потпуно исти као код анализе варијансе два фактора
варијабилитета.
Пример 3а:
На узорку од пет сорти бораније мерен је садржај беланчевина (%) у свежној
махуни, на основу чега треба утврдити да ли постоје значајне разлике између
испитиваних сорти и између којих сорти су разлике у садржају беланчевина
значајне. Резултати22 су дати у табели 7:
21 Статистика - дескрипивна и статистичка анализа, Хаџи Стојковић
22 Примери за вежбање из статистике, др.К. Чобановић
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
43
Табела 7: Садржај беланчевина (%) у свежој махуни
Сорта А Сорта Б Сорта Ц Сорта Д Сорта Е
2.10 1.84 1.64 1.46 1.51
1.90 1.80 1.78 1.59 1.49
1.89 1.79 1.70 1.50 1.43
1.95 1.88 1.71 1.55 1.48
Ʃ = 7.84 Ʃ = 7.31 Ʃ = 6.83 Ʃ = 6.10 Ʃ = 5.91
Полазна претпоставка у овој анализи је да нема разлике у садржају
беланчевина у свежој махуни код пет посматраних сорти.
Резултати једнофакторске анализе варијансе добијени рачунањем у
програму Microsoft Excel 2013 приказани су у табели 8.
Табела 8: Резултати ANOVA-е
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Сорта А 4 7.84 1.96 0.0094
Сорта Б 4 7.31 1.8275 0.001692
Сорта Ц 4 6.83 1.7075 0.003292
Сорта Д 4 6.1 1.525 0.003233
Сорта Е 4 5.91 1.4775 0.001158
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0.65617 4 0.164043 43.68642 4.29E-08 3.055568
Within Groups 0.056325 15 0.003755
Total 0.712495 19
На основу резултата датих у табели може се закључити да се нулта хипотеза
одбацује и са 95% и са 99% сигурности, јер је израчуната F вредност далеко већа
од табличних F вредности, односно закључује се да постоји значајна разлика у
садржају беланчевина између испитиваних сорти бораније.
У следећем кораку треба да се утврди значајност разлике између
посматраних сорти. Из табеле Студентове t расподеле се ишчитава таблична
вредност за 𝑡(0.05,15) која износи 2.131. Стандардну грешку аритметичких средина
израчнунавамо као:
𝑆( 𝑥 𝑖 − 𝑥 𝑖+1) = √2∗0.0038
4= 0.043
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
44
Ове две вредности су потребне за израчунавање најмање значајне разлике:
НЗР = 2.131 * 0.043 = 0.092
Након израчунате најмање значајне разлике, изовди се тестирање да ли је
разлика између аритметичких средина два узорка значајна или не.
|x̅1 - x̅2| = |1.96 - 1.83| = 0.13 *
|x̅1 - x̅3| = |1.96 - 1.71| = 0.25 *
|x̅1 - x̅4| = |1.96 - 1.53| = 0.43 *
|x̅1 - x̅5| = |1.96 - 1.48| = 0.48 *
|x̅2 - x̅3| = |1.83 - 1.71| = 0.12 *
|x̅2 - x̅4| = |1.83 - 1.53| = 0.30 *
|x̅2 - x̅5| = |1.83 - 1.48| = 0.35 *
|x̅3 - x̅4| = |1.71 - 1.53| = 0.18 *
|x̅3 - x̅5| = |1.71 - 1.48| = 0.23 *
|x̅4 - x̅5| = |1.53 - 1.48| = 0.05
На основу анализе резултата, може се дати закључак да значајна разлика у
садржају беланчевина (%) у свежној махуни постоји између свих сорти бораније,
осим у случају између сорти Д и Е.
2.5.2. Величина ефекта у анализи варијансе
Мерење величине ефекта у ANOVA погодније су мере степена зависности
између ефекта и зависно променљиве, односно мере ефекта из r групе. Ова група
показатеља величине ефекта показује колико се укупног варијабилитета
посматране појаве може објаснити утицајем испитиваног фактора, односно
фактора којим смо третирали експерименталне јединице. Квадрирану вредност
мерења интерпретирамо као пропорцију варијансе зависне променљиве која може
да се припише сваком ефекту. Мере величине ефекта у ANOVA су:
- Eta Squared, η2
- Partiаl eta squared, 𝜂𝑝2
- Omega squared, ω2
- Intraclass correlation, ρI
Прве две вредности су процене степена повезаности узорка, а друге две су
мере процене степена повезаности у популацији.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
45
Eta Squared, η2 је пропорција укупне варијансе која може да се припише
утицају посматраног фактора. Рачуна се као однос ефекта варијансе (сума квадрата
третмана) и тоталне варијансе.
η2 = SSeffect / SStotal
Један од проблема са η2 је тај да вредности ефекта зависе од броја других
ефеката и њихове јачине. Када би додали неку нову независну променљиву,
величина ефекта ће бити мања иако је ефекат варијансе за ту интеракцију исти, док
за велику варијансу SS је η2 мања. Стога се преферира алтернативно израчунавање,
𝜂𝑝2 .
На основу израчунатог η2 величину ефекта тумачимо:
- мање од 0.02 мала величина ефекта
- од 0.02 до 0.13 средња величина ефекта
- од 0.13 до 0.26 велика величина ефекта
Partiаl eta squared, 𝜂𝑝2 је пропорција ефекта и грешке варијансе која може да
се припише неком ефекту. Формула за израчунавање је:
𝜂𝑝2 = SSeffect / (SSeffect + SSerror)
Суме 𝜂𝑝2 вредности не могу да се сабирају. Оне нису сума количине
варијансе зависно променљивих које постоје за независно променљиве. Могуће је
сумирати 𝜂𝑝2 ако су веће од 1.00 . η2 описујe количинy варијансе приписану неком
узорку. Процена количине варијансе која се приписује некој популацији је ω2.
На основу израчунатог 𝜂𝑝2 величину ефекта тумачимо:
- мање од 0.01 мала величина ефекта
- од 0.01 до 0.06 средња величина ефекта
- од 0.06 до 0.14 велика величина ефекта
Omega squared, ω2 је процена зависности варијансе која се приписује
независно променљивој у популацији за фиксни модел ефекта. Omega squared се
израчунава по формули:
ω2 = (SSeffect - (dfeffect)(MSerror)) / MSerror + SStotal
ω2 је процена за целу популацију, и она је због тога увек мања од процене узорака
η2 и 𝜂𝑝2.
Intraclass correlation, ρI је процена степена повезаности између независно и
зависно променљивих у популацији са случајним моделом ефекта. Пошто је модел
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
46
ефекта случајан, насумичан, овај модел се не користи често у истраживањима.
Израчунава се по формули:
ρI = (MSeffect - MSerror) / (MSeffect + (dfeffect)(MSerror))
Intraclass correlation је процена количине варијансе зависно променљивих
која се приписује независно променљивима.
Пример 3б:
На основу резултата из примера 3а, потребно је израчунати наведене
показатеље величине ефекта и дати објашњење добијених резултата.
η2 = SSeffect / SStotal = 0.656 / 0.712 = 0.92
На основу показатеља η2 добија се изразито велика величина ефекта, што
значи да добијена разлика, односно одбијање нулте хипотезе није случајно.
𝜂𝑝2 = SSeffect / (SSeffect + SSerror) = 0.656 / (0.656 + 0.056) = 0.92
У анализи варијансе једног фактора варијабилитета се добија иста вредност
за eta squared и partiаl eta squared. Разлика се види у друга два случаја анализе
варијансе, јер се уводи други фактор Б, који улази у израчунавање као део тоталне
дисперзије, па ће и вредности ова два показатеља величине ефекта бити различите.
У овом случају тумачење је исто као и за eta squared.
Показатељ ω2 израчунавамо као:
ω2 = (SSeffect - (dfeffect)(MSerror)) / MSerror + SStotal =
(0.656 - (4 * 0.0038)) / 0.0038 +0.712 = 0.895
Као и за предходна два показатеља, и за omega squared добија се висока
вредност величине ефекта, што говори да је и у овом случају величина ефекта
значајна.
Показатељ величине ефекта ρI добија се математичким рачунањем помоћу
формуле:
ρI = (MSeffect - MSerror) / (MSeffect + (dfeffect)(MSerror)) =
(0.164-0.0038) / (0.164+( 4*0.0038))= 0.894
Добијена вредност intraclass correlation је веома висока, и може се сврстати
у исту групу по тумачењу као и претходни показатељи величине ефекта.
На основу израчунатих вредности величине ефекта може се закључити да су
разлике које су добијене између сорти значајне и да их не би требали занемарити.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
47
МЕРЕ ВЕЛИЧИНЕ ЕФЕКТА У КОРЕЛАЦИОНОЈ
АНАЛИЗИ
2.6.1. Основни појмови у корелационој анализи
Корелациона анализа је често употребљаван статистички метод којим се
утврђује повезаност између променљивих вредности и она спада у најсложеније
анализе. Циљ корелационе анализе је да се испита да ли између променљивих
вредности посматраних појава постоји квантитативно слагање, и ако постоји у ком
степену постоји. Вредност корелације утврђује се мерењем коефицијента
корелације који представља нумеричку вредност којом се означава степен
повезаности између две променљиве појаве. Вредност коефицијента корелације је
између +1 и -1. Када је вредност коефицијента корелације око ± 1 онда се каже да
је то савршен степен зависности између две променљиве појаве, односно када је
коефицијент ближе +1 тада кажемо да је савршено позитивна корелација, док када
је ближе -1 тада кажемо да је савршено негативна корелација. Када вредност
коефицијента корелације тежи нули, зависност између две променљиве постаје
слабија. Коефицијент корелације је релативни показатељ корелације, независан од
јединица мере променљивих X и Y.
Корелациона анализа се допуњује утврђивањем и интерпретацијом
коефицијента детерминације. Коефицијент детерминације (r2) представља
коефицијент корелације на квадрат и најчешће се исказује у процентима. Овај
коефицијент се креће у интервалу (0, 1) или (0, 100%). Интерпретација овог
коефицијента указује да је коефицијент детерминације показатељ удела утицаја
одабране независно променљиве X на варијабилност зависно променљиве Y,
узимајући да је укупна варијабилност зависно променљива Y један (100%).
У статистици се мере три типа корелације: Pearson-ова корелација,
Spearman-ова корелација и Kendall-ов ранг корелације.
Pearson-ова r корелација се користи у статистици за мерење степена
зависности између две линеарно међузависне променљиве. Претпоставља се да у
Pearson-овој r корелацији између променљивих посматраног модела постоји
линеарна повезаност и непрекидна нормална расподелa. За израчунавање степена
повезаности између две зависно променљиве користимо формулу:
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
48
𝑟𝑥𝑦 =𝑛 ∑ 𝑥𝑦− ∑(𝑥) ∑(𝑦)
√[𝑛 ∑ 𝑥2−( ∑ 𝑥)2] √[𝑛 ∑ 𝑦2− ( ∑ 𝑦)2 ]
n - број упарених података.
Овако дефинисан коефицијент корелације базира се на упоређивању
стварног утицаја посматраних променљивих једне на другу, у односу на
максимални могући утицај. Након утврђивања вредности коефицијента корелације
проверава се његова значајност извођењем одговарајућег теста. Тестирање
значајности коефицијента линеарне корелације r може се извести тако што се
израчуната вредност упоређује са одговарајућом табличном (из таблица по
Snedekor-у). Полазна хипотеза гласи:
H0 : ρ = 0
H1 : ρ ≠ 0
Уколико је rизр ≥ rα(n-2) нулта хипотеза се одбацује. Уколико је rизр < rα(n-2)
нулта хипотеза се прихвата.
Полазна хипотеза за тестирање значајности коефицијента линеарне
корелације може се проверити и израчунавањем одговарајућег количника на
следећи начин:
- у случају великог узорка (n > 30) , 𝑍 =𝑟
𝑆𝑟
r - оцена коефицијента корелације основног скупа на основу узорка,
Sr - стандардна грешка коефицијента корелације на основу узорка
Стандардна грешка коефицијента корелације на основу великог узорка
израчунава се на следећи начин:
𝑆𝑟 =1
√𝑛
Израчунати количник Z упоређује се са одговарајућим табличним
вредностима из таблица Нормалне дистрибуције. Ако је Zизр < Zα полазна хипотеза
се прихвата, а уколико је Zизр > Zα хипотеза се одбацује.
- у случају малог узорка (n < 30), 𝑡 =𝑟
𝑆𝑟
Стандардна грешка коефицијента корелације на основу малог узорка
израчунава се на следећи начин:
𝑆𝑟 =√1−𝑟2
√𝑛−2
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
49
За доношење закључка о полазној хипотези израчунати количник се
упоређује са табличним вредностима Студентове дистрибуције (tα(n-2)). Ако је
tизр < tα(n-2) полазна хипотеза се прихвата, а уколико је tизр > tα(n-2) хипотеза се
одбацује.
Коефицијент корелације је вероватно најпознатијa мера величине ефекта,
иако многи који га користе нису свесни да овај коефицијент показује величину
ефекта.
Значајност израчунатог коефицијента корелације и његовог квадрата,
коефицијента детерминације, може да се утврди и извођењем анализе варијансе
регресије. Анализа варијансе регресије омогућава да се сагледа релативни утицај
независно променљиве X у укупном варијабилитету зависно променљиве Y.
F-тестом у анализи варијансе регресије проверава се следећа хипотеза:
H0 : ρ = 0
H1 : ρ ≠ 0
За проверу полазне претпоставке утврђује се одговарајућа тест статистика:
𝐹 =𝑆𝑅
2
𝑆𝑒2 ,
𝑆𝑅2 =
𝑄𝑅
𝑝 , варијанса регресије, а 𝑆𝑒
2 =𝑄𝑉𝑅
𝑛−𝑝−1 , варијанса оцењеног модела.
Ако је F израчунато веће од F-таблично нулта хипотеза се одбацује, а
закључујемо да независно променљива X има значајан или врло значајан утицај на
зависно променљиву Y.
Spearman-ова корелација је непраметарски показатељ који се користи за
мерење степена повезаности између две варијабле у случајевима када није могуће
применити Pearson-ов коефицијент корелације. Spearman-oв коефицијент
корелације рачунамо ако су испуњени следећи услови:
- барем једнa од варијабли X или Y, мерена је ординалном скалом
- ни X ни Y немају нормалну дистрибуцију
- узорак је мали
- треба нам мера повезаности између две варијабле када та повезаност није
линеарна
Spearman-ов тест корелације је непараметарски еквивалент Pearson-овом
коефицијенту линеарне корелације, стим да се рачунске операције не изводе из
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
50
математичких вредности зависне и независне променљиве појаве, већ из њихових
релативних односа тј. рангова. Приликом израчунавања овог коефицијента
потребно је рангирати вредности променљивих и на такав начин свести их на
заједничку меру. Најједноставнији начин рангирања је тај да се најмањој вредности
сваке променљиве додели ранг 1, следећој по величини ранг 2 и тако све до
последње којој се додељује максималaн ранг. Израчунавање коефицијента се
изводи на основу разлика вредности додељених рангова.
За израчунавање Spearman-овог коефицијента користимо формулу:
𝜌 = 1 − 6 ∑di
2
n(n2−1)
ni=1
di - разлика између вредности рангова две посматране варијабле
n - број различитих серија
Kendall-ов ранг корелације је непараметарски показатељ за мерење јачине
зависности између две варијабле, односно одражава минимални број суседних
размена потребних за настанак једног реда података из другог.
Приликом рачунања овог коефицијента X и Y варијабле се испишу једна
испод друге, тако да варијабла X буде поређана по рангу. За рачунање ранг
корелације израчунава се израз S који се добија тако да се у Y варијабли сваки ранг
упореди са следећим, па уколико је онај други већи онда се означи са +1, а уколико
је мањи, означи се са -1. Њиховим сабирањем се добија вредност коју означавамо
са S. За израчунавање Kendall-ове ранг корелације користи се формула23:
𝜏 = 𝑆
1
2 𝑛(𝑛−1)
Уколико имамо везане, заједничке, рангове израчунавање се изводи на исти
начин као код Spearman-овог коефицијента корелације. Сви елементи истог ранга
добијају један, просечан ранг. Поређењем по Y варијабли вредност нула додељује
се уколико постоје два једнака ранга. Такође, исто се односи ако постоје везани
рангови и за X варијаблу.
За израчунање Kendall-ове везане ранг корелације користи се формула24:
𝜏 = 𝑆
√(1
2𝑛(𝑛−1)−𝑇𝑥) − (
1
2𝑛(𝑛−1)−𝑇𝑦)
23 24 Петцова статистика основне статистичке методе за нематематичаре, Б. Петц
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
51
Tx = ½ tx (tx -1), a Ty = ½ ty (ty -1)
tx и ty представљају број резултата везаних у један ранг у свакој варијабли.
Овај коефицијент корелације се лако може користити као алтернатива за
Spearman-ов ρ коефицијент, за податке приказане у облику редова. Предност
Кендал-овог коефицијента је дистрибуција која има боља статистичка својства и
постоји њихово директно тумачење у складу са могућностима посматрања
сагласности и несагласности тих парова. Кендал-ов коефицијент је еквивалент
Spearman-овом коефицијенту у смислу основних претпоставки, али они нису
идентични у величини, јер су њихова основна логика и формуле за израчунавање
сасвим другачије.
Пример 4:
На основу података о приходима из буџета по глави становника и удела
запослених у пољопривреди, шумарству и рибарству у укупном броју запослених,
у 45 општина у Војводини (табела 4, у прилогу), испитиван је утицај броја
запослених на приход25. Резутати регресионе анализе добијени рачунањем у
програму Microsoft Excel 2013 приказани су у табели 9.
Табела 9: Резултати регресионе и корелационе анализе
Regression Statistics
Multiple R 0.31305037
R Square 0.098000534
Adjusted R Square 0.077023802
Standard Error 5168.673077
Observations 45
ANOVA
df SS MS F Significance F
Regression 1 124809816.5 1.25E+08 4.67187 0.03627
Residual 43 1148752799 26715181
Total 44 1273562616
Coefficients Standard
Error t Stat P-value Lower 95%
Upper
95%
Intercept 25055.703 1307.63276 19.16112 1.11E-22 22418.610 27692.8
X Variable 1 -210.830 97.54085 -2.16145 0.036272 - 407.540 - 14.1199
Резултати изведене регресионе и корелационе анализе показују да је оцењен
регресиони модел за испитивање утицаја удела запослених у пољопривреди,
шумарству и рибарству у укупном броју запослених на приходе из буџета по глави
25 Соколовски В, Николић-Ђорић Е, Жолт Л. (2014), Регионалне разлике у Републици Србији,
Региони и регионализација: социолошки аспекти 3, 9-21, Филозофски факултет, Одсек за
социологију, Нови Сад.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
52
становника у општинама у Војводини статистички значајан, што се закључује на
основу F-теста у табели анализе варијансе. Међутим, релативно исказан утицај
посматраног фактора на ниво прихода је низак и исказан коефицијентом
детерминације износи само 9,8 %. То нам у оквиру ове анализе указује да на ниво
прихода већи утицај имају неки други фактори које ми нисмо узели у обзир.
2.6.2. Величина ефекта у корелационој анализи
Коефицијент корелације са својом величином представља величину ефекта.
Интерпретација коефицијента корелације као мере величине ефекта изводи се на
следећи начин:
- ако је r мање од 0.10 величина ефекта је мала
- ако је r од 0.10 до 0.30 величина ефекта је средња
- ако је r вредност већа од 0.50 величина ефекта је велика
МЕРЕ ВЕЛИЧИНЕ ЕФЕКТА КОД χ2 ТЕСТА
2.7.1. Конвеционалан приступ χ2 тесту
Ово је један од најпознатијих непараметријских тестова, а познат је и под
називом Pearson-ов χ2 тест, јер га је увео K. Pearson 1900. године. Најчешће се
користи када су обележја категоријална, па се могу користити само фреквенције
које имају различите вредности обележја. Њиме се израчунава да ли постоји
статистички значајна повезаност у фреквенцијама два атрибутивна обележја. Овим
тестом се упоређују реализоване фреквенције, које могу бити добијене
посматрањем или експериментом, са очекиваним вредностима фреквенцијама, које
могу бити теоријског карактера или су очекиване на основу хипотезе коју желимо
да проверимо. χ2 тест се употребљава за тестирање значајности разлике између
добијених (Oi) и очекиваних (Ei) фреквенција26:
χ2 = Ʃ (𝑂𝑖 − 𝐸𝑖)2
𝐸𝑖
26 Статистика, Лозанов-Црвенковић
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
53
За извођење овог теста морају бити испуњена два услова27:
• збир добијених и очекиваних фреквенција треба да буде једнак;
• збир разлике добијених и очекиваних фреквенција увек је једнак нули.
На особинама χ2 распореда базира се закључивање приликом коришћења χ2
теста. Основне карактеристике χ2 распореда су:
а) распоред је дефинисан у области од 0 до +∞;
б) крива распореда није симетрична, а са повећањем броја модалитета
посматраног обележја, повећањем броја степена слободе, χ2 распоред се
приближава нормалном распореду;
ц) за сваки број степена слободе постоји и одређен χ2 распоред и критичне
области прихватања или одбацивања нулте хипотезе.
Тумачење добијене вредности χ2 теста изводи се помоћу таблица критичних
вредности χ2 дистрибуције, табела 5 у прилогу.
Најважнији услови за примену χ2 теста су:
а) χ2 тест се израчунава искључиво из апсолутних фреквенција или из
података ако они могу да се сведу на апсолутне фреквенције;
б) ниједна од апсолутних фреквенција не сме да има вредност мању од 5
јединица;
ц) када су узорци мањи од 200 јединица, n1 + n2 < 200, примењује се
Yates-ова корекција:
1) свака добијена фреквенција, ако је већа од очекиване, умањује се за 0,5
2) свака добијена фреквенција, ако је мања од очекиване увећава се за 0,5
У даљем раду приказани су модалитети χ2 квадрат теста:
1) χ2 тест распореда фреквенција (тест слагања);
2) χ2 тест независности обележја;
3) χ2 тест хомогености скупа.
2.7.1.1. χ2 тест распореда фреквенција (тест слагања)
Овај тест испитује разлику између распореда добијених (опажаних) и
очекиваних (теоретских) фреквенција. Добијене фреквенције су фреквенције
27 http://wwwserver.medfak.ni.ac.rs/predavanja/3.%20farmacija/statistika/10.%20predavanje.pdf
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
54
модалитета обележја која испитујемо, а очекиване фреквенције се могу добити на
следеће начине:
1. на оснуву нулте хипотезе;
2. на основу теоретске расподеле вероватноћа;
3. на основу стручне теорије или претходних истраживања.
Једна од карактеристика непараметријских поступака је да се у њима води
рачуна о читавој дистрибуцији, па је један од основних начина примене χ2 теста
испитивање подударности две дистрибуције, односно тест слагања. На овај начин
испитујемо да ли су емпиријски подаци сагласни са хипотетичком расподелом.
Основна хипотеза је да обележје X има неку одређену расподелу H0 (Fx = F),
где је F функција те расподеле, а алтернативна је најопштија, да X нема ту
расподелу H1 (Fx ≠ F). За овај тест се користе велики узорци, n ≥ 50. Код овог теста
се упоређују реализоване фреквенције вредности обележја X у узорку са
очекиваним фреквенцијама какве би требало да буду ако је хипотеза H0 (Fx = F)
тачна.
За реализацију овог теста потребно је да се скуп вредности обележја подели
на r, r ≥ 2, дисјунктних скупова, S1, S2,…, Sr . Нека је Oi , i = 1,2,…,r , број елемената
узорака (X1, X2,…, Xn) који припадају скупу Si , i = 1,2,…,r . Ове вредности се
називају и посматране фреквенције, где је:
p0i = 𝑃𝐻0{X ϵ S}, i = 1,2,…,r
вредност догађаја {X ϵ S}, i = 1,2,…,r , под претпоставком да је H0 тачна, називају
се и теоријске вероватноће. Тада су посматране фреквенције једнаке:
Ei = np0i , i = 1,2,…,r
Као тест статисика узима се:
𝑇 = ∑(𝑂𝑖− 𝐸𝑖)2
𝐸𝑖
𝑟𝑖=1
која представља одступања реализованих од очекиваних фреквенција. Ако је
хипотеза H0 тачна, не очекујемо већа одступања статистике Т од нуле, а ако H0 није
тачна, њене вредности ће бити значајно веће од нуле. Због тога је тест облика:
α = P{T ≥ c}
Да би се одредила критична вредност c, потребно је одредити нулту
расподелу статистике Т. Може се показати да је, за велико n, у питању χ2 распореда
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
55
са r-1 степеном слободе, па је број c квантил реда 1- α за χ2 расподелу са r-1 степени
слободе.
2.7.1.2. χ2 тест независности обележја
χ2 тест независности се може дефинисати као тест повезаности,
независности, између два обележја једног скупа. То значи да два независна узорка
која се тестирају узимамо из једног скупа на коме се тестира повезаност између два
обележја.
Цео скуп, узорак, може да се подели на два дела: на групу јединица које
имају неко обележје и групу јединица које немају неко обележје. Из скупа се
извлачи узорак обима n и његови критеријуми се класификују по два критеријума
(A и B). Та два обележја се могу класификовати у два модалитета и приказати
табелом контигенције 2x2. Који модалитети ће бити приказани у редовима, а који
у колонама, зависи од метода и начина испитивања. Први критеријум
класификације има r, а други s категорија. Ако је Oij број елемената узорака који
припадају i-тој категорији по првом, и j-тој категорији по другом критеријуму
класификације. Резултати се приказују у облику табеле контигенције (табела 10):
Табела 10: Општи облик табеле контигенције
Критеријум A (обележје X )
Категорија 1 Категорија 2 ... Категорија s Укупно
Крит
ерију
м B
(об
ележ
је Y
) Категорија 1 O11 O12 ... O1s R1
Категорија 2 O21 O22 ... O2s R2
.... .... .... ... .... ....
Категорија r Or1 Or2 ... Ors Rr
Укупно S1 S2 Ss n
Узорак треба да буде случајан, а сваки елемент узорка припада само једној
категорији како по првом тако и по другом критеријуму класификације.
Нулта хипотеза је да су обележја независна, а алтернативна хипотеза је да
ови догађаји нису независни за бар један пар i и j.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
56
Тест статистика је:
𝜒2 = ∑ 𝑟𝑖=1 ∑
(𝑂𝑖𝑗− 𝐸𝑖𝑗)2
𝐸𝑖𝑗
𝑠𝑗=1
где је:
Eij = 𝑅𝑖𝑆𝑗
𝑛
Фреквенције Oij су посматране, а Еij очекиване. Ако је нулта хипотеза тачна,
не очекују се велике разлике између посматраних и очекиваних фреквенција,
односно не очекују се велике вредности тест статистике Т. Као нулта расподела
статистике Т узима се χ2 расподела са (r-1) (s-1) степена слободе.
2.7.1.3. χ2 тест хомогености скупа
χ2 тест хомогености утврђује да ли испитивани узорци припадају истом или
су узети из различитих скупова, односно да би се утврдило да ли су унапред
одређене групе, популације, хомогене у односу на неки критеријум класификације.
Поступак израчунавања је исти, али он није идентичан са тестом независности.
Тестом независности се истражује разлика између два обележја узорака узетих из
једног скупа, док се тестом хомогености испитује разлика између више независних
узорака извучених из различитих скупова.
Посматра се r популација и из сваке се извлачи случајан узорак обима ni,
i=1,2,…,r. Сваки елемент сваког узорка може бити класификован у c категорија.
Нека је Oij број елемената i-тог узорка који припада j-тој категорији, j = 1,2,...,c ,
тако да је:
ni = Oi1 + Oi2 +…+ Oic , i = 1,2,…,r .
За извођење овог теста подаци се приказују у табели реда r x c (табела 11).
Табела 11: Општи облик табеле r x c
Категорија 1 Категорија 2 .... Категорија c Укупно
Узорак 1 O11 O12 .... O1c n1
Узорак 2 O21 O22 .... O2c n2
.... .... .... .... .... ....
Узорак r Or1 Or2 .... Orc nr
Укупно C1 C2 .... Cc n
У табели је Oij број регистрованих вредности у ћелији (i, j).
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
57
Потребно је водити рачуна да сваки узорак из дате популације буде случајан,
да су узорци међусобно независни и да сваки елеменат сваког узорка припада само
једној категорији.
Нулта хипотеза је:
H0 (све вероватноће у истој колони су једнаке), односно
H0 (p1j = p2j = … = prj , за све j),
популације су хомогене, не разликују се у односу на дату класификацију у c
категорија.
Алтернативна хипотеза је:
H1 (бар две вероватноће у истој колони нису исте),
односно популације нису хомогене.
Тест статистика је:
𝑇 = ∑ 𝑟𝑖=1 ∑
(𝑂𝑖𝑗− 𝐸𝑖𝑗)2
𝐸𝑖𝑗
𝑙𝑗=1
где је:
Eij = 𝑛𝑖𝐶𝑗
𝑛
Фреквенције Oij су посматране, а Еij очекиване. Ако је нулта хипотеза тачна,
не очекујемо велике разлике између посматраних и очекиваних фреквенција,
односно не очекујемо велике вредности тест статистике Т. Као нулта расподела
статистике Т узима се χ2 расподела са (r-1) (c-1) степена слободе.
Пример 5а:
Посматран је број свиња по категоријама за 2012, 2013, и 2014. годину,
укупно за целу Србију. Подаци су узети са сајта Републичког завода за статистику
(табела 12). Потребно је утврдити да ли постоји статистичка зависност између броја
произведених свиња по категоријама у различитим календарским годинама. У овом
примеру користи се χ2 тест независних обележја.
Постављамо нулту хипотезу:
H0: Број произведених свиња по категорији је независан у односу на календарске
године посматрања
H1: Постоји зависност између броја свиња по категоријама у различитим
календарским годинама
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
58
Табела 12: Број произведених свиња по категоријама и по годинама
2012 2013 2014 Укупно
Прасад масе до 20 кг 999 1033 953 2985
Свиње масе до 20-49 кг 744 656 715 2115
Товне свиње масе 50-79 кг 405 388 450 1243
Товне свиње масе 80-109 кг 293 314 312 919
Товне свиње масе 110 или више кг 163 272 280 715
Приплодне свиње - назимад 106 107 157 370
Приплодне свиње - назимад: супрасне назимице
40 32 33 105
Приплодне свиње - крмаче 408 355 346 1109
Приплодне свиње - крмаче: супрасне крмаче
170 175 171 516
Приплодне свиње - нерастови 20 20 23 63
Укупно 3348 3352 3440 10140
*у хиљадама
На основу података из табеле 12, прерачунавањем се добијају очекиване
вредности броја свиња по категоријама и по календарским годинама, што је
приказано у табела 13.
Табела 13: Очекивани број свиња по категоријама и по годинама
2012 2013 2014 Укупно
Прасад масе до 20 кг 985.58 986.76 1012.66 2985.00
Свиње масе до 20-49 кг 698.33 699.16 717.51 2115.00
Товне свиње масе 50-79 кг 410.41 410.90 421.69 1243.00
Товне свиње масе 80-109 кг 303.43 303.80 311.77 919.00
Товне свиње масе 110 или више кг 236.08 236.36 242.56 715.00
Приплодне свиње - назимад 122.17 122.31 125.52 370.00
Приплодне свиње - назимад: супрасне назимице
34.67 34.71 35.62 105.00
Приплодне свиње - крмаче 366.17 366.60 376.23 1109.00
Приплодне свиње - крмаче: супрасне крмаче
170.37 170.58 175.05 516.00
Приплодне свиње - нерастови 20.80 20.83 21.37 63.00
Укупно 3348.00 3352.00 3440.00 10140
*у хиљадама
Рачунањем χ2 по формули:
χ2 = ∑ 𝑟𝑖=1 ∑
(𝑂𝑖𝑗− 𝐸𝑖𝑗)2
𝐸𝑖𝑗
𝑠𝑗=1
добијају се подаци представљени у табели 14.
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
59
Табела 14: χ2 по броју категорија свиња и по годинама
2012 2013 2014 Укупно
Прасад масе до 20 кг 0.18 2.17 3.52 5.86
Свиње масе до 20-49 кг 2.99 2.66 0.01 5.66
Товне свиње масе 50-79 кг 0.07 1.28 1.90 3.25
Товне свиње масе 80-109 кг 0.36 0.34 0.00 0.70
Товне свиње масе 110 или више кг 22.62 5.37 5.78 33.77
Приплодне свиње - назимад 2.14 1.92 7.89 11.95
Приплодне свиње - назимад: супрасне назимице
0.82 0.21 0.19 1.22
Приплодне свиње - крмаче 4.78 0.37 2.43 7.58
Приплодне свиње - крмаче: супрасне крмаче
0.00 0.11 0.09 0.21
Приплодне свиње - нерастови 0.03 0.03 0.12 0.19
Укупно 33.99 14.47 21.94 70.39
*у хиљадама
Из табеле 14 видимо да је вредност χ2 = 70.3945 док је таблична вредност за
𝜒0,05;182 = 28.8693 , док је вредност 𝜒0,01;18
2 = 34.80531 .
Како је добијена вредност χ2 далеко већа од табличне вредности, нулта
хипотеза се одбија за праг значајности 5% и 1%, што говори да су две категорије
посматраних података зависне, односно да су статистички значајне.
2.7.2. Величина ефекта код χ2 теста
Величина ефекта за χ2 тест независности може да се утврди уколико се χ2
конвертује у ɸ коефицијент корелације или Cramer-ов V коефицијент. ɸ
коефицијент корелације се користи када су подаци представљени табелом
контигенције 2x2, а у свим осталим случајевима се користи Cramer-ов V
коефицијент. Опсег вредности оба коефицијента је од 0 до 1, што представља
вредности које одговарају потпуној независности, односно потпуној зависности
између променљивих.
Формула за ɸ коефицијент је:
ɸ = √𝜒2
𝑛
n величина узорка.
Формула за Cramer-ов V коефицијент је:
𝑉 = √χ2
n (L−1) ,
Игор Гуљаш Мастер рад РЕЗУЛТАТИ ИСТРАЖИВАЊА
60
L представља мању вредност од броја редова или колона из табеле
контигенције. Уколико имамо табелу контигенције 3x2, онда је L=2.
Вредност процене величине учинка код χ2 теста је:
- за вредности мање од 0.10 величина ефекта je мала;
- за вредности од 0.10 до 0.30 представља средњу величину ефекта;
- за вредности преко 0.50 величина ефекта је велика.
Пример 5б:
На основу добијених података у примеру 5а, потребно је израчунати
вредност Cramer-овог V коефицијента по формули:
𝑉 = √𝜒2
𝑛 ∗(𝐿−1)= √
70.3945
10140 ∗(3−1)= √
70.3945
20280= 0.0589
Како је добијени коефицијент мањи од 0.10, израчуната величина ефекта
може да се интерпретира као мала. У овом примеру зависност две категорије
посматраних података постоји али она није много изражена, односно ефекат
повезаности је мали. Зависност између категорија свиња у календаркој години и за
године које су посматране, може се окарактерисати као слаба.
Игор Гуљаш Мастер рад ДИСКУСИЈА
61
3. ДИСКУСИЈА
Тема која је обрађена у овом раду је савремена, занимљива и отвара
могућност практичне примене у математичко-статистичкој обради резултата
истраживања. Задњих година свако статистичко истраживање подразумева да се у
прорачун уврсти и показатељ величине ефекта.
У раду су поред теоријског дела, приказани и обрађени традиционални
показатељи као и показатељ величине ефекта. Како се ради о узроцима, а не о целој
популацији, грешка увек постоји, стим да доношење погрешне одлуке треба свести
на минимум. Постављене нулте хипотезе се прихватају или не, а величина ефекта
је показатељ да ли је донета одлука исправна или је треба преиспитати.
Уколико се ради о два узорка, тада је препоручљиво радити t или z тест, и
на тај начин објаснити резултат постављене нулте и алтернативне хипотезе.
Конвенционалним доношењем закључака врло често се добијају статистички
значајни резултати, а реалан допринос тих резултата у анализи и тумачењу
проучаваних проблема не узима се у обзир. Основ за доношење закључака, у
конвенционалном приступу извођења тестова, представља p вредност. Проблем
при доношењу закључака на основу p вредности, представља могућност да
добијени закључак који је статистички значајан има веома малу или чак уопште
нема практичну значајност. Да би се применом методологије тестирања дошло до
статистички и реално значајних закључака конвенционално закључивање у
наведеним примерима, допуњено је утврђеним мерама величине ефекта.
Као меру величине ефекта у примеру тестирања разлике аритметичких
средина два узорка у раду су приказани Cohen-ово d и Hedges-ово g, где је показано
да је одбацивање нулте хипотезе оправдано, јер вредности оба добијена показатеља
величине ефекта показују да је разлика значајна и тиме потврђују закључак донет
на конвенционалан начин. Сагледавајући овај резултат може се закључити да
постоји значајна разлика између приноса два узорка винове лозе (нетретиран и
третиран раствором фолијарног ђубрива).
У примеру где су посматране две инбред линије уљаног кукуруза,
извођењем t-теста дошло се до закључка да су разлике у просечном садржају уља
код ове две инбред линије уљаног кукуруза статистички врло значајне. Израчунате
вредности Cohen-ово d и Hedges-ово g, показују да је разлика у процента уља на
Игор Гуљаш Мастер рад ДИСКУСИЈА
62
доњој граници средње величине ефекта, односно не може се окарактерисати као
врло значајна. Такође мера ефекта исказана као степен слагања r, упућује на
закључак да је величина ефекта разлика у проценту уља код ове две инбред линије
уљаног кукуруза мала. У овом примеру утврђене мере ефекта допринеле су
реалнијем сагледавању анализираног проблема.
Код тестирања значајности разлике две средине као мере величине ефекта
могу се израчунавати и мере величине ефекта засноване на разлици аритметичких
средина, као и мере величине ефекта засноване на степену повезаности две
променљиве - r група мера величине ефекта, где и једна и друга група мера
доприносе доношењу реалнијег закључка.
Уколико се у анализи неког проблема користи метод анализе варијансе
(ANOVA), као показатељи, односно мере величине ефекта погодније су мере
засноване на степену повезаности две променљиве, односно r група мера величине
ефекта, које показују колико се укупног варијабилитета посматране појаве може
објаснити утицајем испитиваног фактора, односно фактора којим смо третирали
експерименталне јединице. У примеру где је код пет сорти бораније мерен садржај
беланчевина (%) у свежој махуни, на основу чега је требало утврдити да ли постоје
значајне разлике између испитиваних сорти и између којих сорти су разлике у
садржају беланчевина значајне, закључак на основу израчунате F вредности је да
постоји врло значајна разлика у садржају беланчевина између испитиваних сорти
бораније. Као мере величине ефекта у овом примеру ANOVA израчунати су:
- Eta Squared, η2
- Partiаl eta squared, 𝜂𝑝2
- Omega squared, ω2
- Intraclass correlation, ρI
Добијене вредности показатеља величине ефекта су јако велике, што значи
да су разлике утврђене F-тестом потврђене, односно одбијање нулте хипотезе није
случајно и да се разлика између сорти бораније у садржају беланчевина (%) у
свежој махуни не сме занемарити.
У корелационој анализи уобичајено се израчунава коефицијент корелације
који је мера величине ефекта, иако многи који га у својим анализама израчунавају
нису свесни да овај коефицијент показује величину ефекта.
Игор Гуљаш Мастер рад ДИСКУСИЈА
63
У примеру где је испитиван утицај броја запослених на приход из буџета по
глави становника, оцењени регресиони модел је статистички значајан, што би
могло навести на закључак да број запослених има значајан утицај на висину
прихода. Међитим, вредности израчунатих коефицијената корелације и
детерминације показују да на ниво прихода већи утицај имају неки други фактори,
односно да реалан ефекат броја запослених на ниво прихода није толико
доминантан.
Хи квадрат тест је приказан на примеру броја свиња по категоријама за
посматране три године. Конвенционалним приступом добијена је статистичка
значајност резултата, што показује да постоји зависност између броја свиња по
категоријама у посматраним календарским годинама. Међутим, израчуната
величина ефекта је мала, што говори да добијена зависност између варијабли
посматрања није висока, односно зависност између категорија свиња у календаркој
години и за године које се посматра, може се окарактерисати као слаба.
Резултати у овом раду потврђују значај утврђивања величине ефекта
добијених резултата приликом извођења статистичких тестова. Уочено је да
постоје ограничења и проблеми у уобичајеном искључивом ослањању на
конвенционално тестирање статистичке значајности. Такође, јасно је да се
конвенционалним закључивањем добијају статистички значајани резултати при
чему је занемарен реалан допринос тих резултата у анализи и објашњавању
испитиваних проблема. Примери су показали да се проблеми конвенционалног
закључивања могу умањити израчунавањем додатних статистичких показатеља,
мера величине ефекта, што доприноси значајности добијених резултата у анализи.
Тиме су и радне хипотезе од којих се пошло у овом раду доказане.
Игор Гуљаш Мастер рад ЗАКЉУЧАК
64
4. ЗАКЉУЧАК
Величина ефекта је прилично једноставана емпиријска процена разлике
између два или више узорака који се желе испитати и има велике предности у
односу на конвенционалне статистичке тестове.
Искључиво доношење закључка на основу p вредности може довести до тога
да статистички значајан закључак има веома малу или уопште нема практичну
значајност. Утврђивањем величине ефекта статистичких тестова добија се боља
могућност поређења резултата у истраживањима, а тиме и бољи увид у резултате
истраживања и прецизнија процена важности добијених резултата. Погрешна
одлука менаџмента на основу погрешне статистике повлачи за собом неефиксне
економске, људске факторе, и време као неизоставни фактор свакодневнице.
Неадекватни параметри и погрешни механизми за доношење одлука имају
негативан утицај на крајње резултате, а тиме и на тржиште и конкуренцију.
Величина ефекта са интервалима поверења може да се рачуна и за
емпиријске области. Овакав прилаз истраживању статистичким методама даје
могућности за даљи развој и све већу примену у истраживањима како у
пољопривреди тако и на свим другим сегментима привреде.
Приказана теорија која је пропраћена кроз практичне примере, указује на
потребу да се у разматрање уврсти и величина ефекта. Сам рад треба да приближи
статистику свима без обзира да ли имају професионалну потребу за статистичким
прорачунима или не. Велика примена статистике и закључивања на основу
величине ефекта, поред пољопривреде, је у медицинским, биомедицинским
истраживањима и истраживањима у психологији. Теорију у овом раду прате
примери из пољопривреде, а на сличан начин се могу уврстити нумерички
параметри и уз одређене методе урадити прорачуни у осталим гранама привреде.
У раду је акценат стављен на узорак, јер тестирање целе популације у већини
случајева није могуће, а врло често није ни финансијски ни временски исплативо.
Тематика која је проучавана и приказана у овом раду даје разноврсне
могућности статистичких израчунавања кроз различите примере и тумачење
добијених резултата. Приказ у раду је само мали део онога што можемо употребити
у свакодневници. Утврђивање величине ефекта би требало да буде саставни део
резултата сваког теста, јер погрешно закључивање и доношење одлука на бази
Игор Гуљаш Мастер рад ЗАКЉУЧАК
65
таквих закључака није од практичног значаја, а понекад може имати и негативне
последице.
Игор Гуљаш Мастер рад ПРИЛОГ
66
ПРИЛОГ
Табела 1: Студентов распоред или t - дистрибуцијa
Игор Гуљаш Мастер рад ПРИЛОГ
67
Табела 2: Проценат уља у зрну код две инбред линије уљаног кукуруза
р.број линија 1 линија 2 р.број линија 1 линија 2 р.број линија 1 линија 2
1 17.17 17.97 42 15.79 16.40 83 17.89 15.74
2 16.97 16.00 43 16.87 16.46 84 18.65 16.68
3 16.54 16.91 44 15.87 16.25 85 17.40 14.77
4 15.86 16.47 45 15.90 16.67 86 14.78 16.79
5 15.06 15.33 46 16.68 16.22 87 15.72 15.51
6 16.80 14.86 47 15.25 14.09 88 18.18 16.27
7 15.92 16.89 48 15.80 16.37 89 17.70 15.84
8 15.30 16.96 49 15.09 15.73 90 18.01 16.31
9 17.25 17.00 50 15.42 15.55 91 17.13 15.96
10 11.30 17.16 51 16.30 17.24 92 16.13 14.46
11 15.07 16.50 52 15.27 14.83 93 16.69 15.65
12 13.90 16.86 53 16.21 14.68 94 17.24 13.01
13 17.08 14.94 54 16.50 16.33 95 18.58 15.34
14 16.56 18.00 55 16.59 18.24 96 15.61 15.37
15 14.72 17.38 56 16.31 16.04 97 16.93 17.53
16 15.99 17.17 57 16.01 17.19 98 17.57 16.66
17 16.74 16.79 58 16.30 14.66 99 16.84 15.68
18 16.51 17.10 59 15.55 16.60 100 16.84 15.35
19 16.77 15.35 60 15.13 17.13 101 16.27 15.22
20 16.81 16.11 61 18.30 15.03 102 17.05 14.55
21 15.64 15.78 62 16.46 16.94 103 16.82 16.14
22 16.16 17.21 63 15.77 14.17 104 17.30 13.24
23 15.67 15.29 64 16.19 16.77 105 17.70 13.67
24 15.59 14.56 65 16.34 14.76 106 16.25 16.59
25 18.04 15.85 66 18.37 16.21 107 15.00 15.42
26 15.46 16.88 67 15.71 15.97 108 17.22 15.17
27 14.36 16.71 68 14.87 14.48 109 16.01 15.57
28 17.21 16.66 69 15.09 16.21 110 15.23 18.23
29 17.27 17.09 70 18.32 17.02 111 14.65 15.80
30 16.50 16.68 71 15.84 16.33 112 16.48 16.60
31 15.93 15.51 72 16.16 15.80 113 15.96 14.27
32 16.24 15.61 73 16.51 15.43 114 16.15 15.07
33 16.27 14.90 74 15.20 16.41 115 15.98 16.63
34 16.35 16.57 75 15.63 14.14 116 16.48 15.29
35 16.26 16.65 76 15.29 18.25 117 16.68 15.56
36 14.28 15.08 77 16.74 14.60 118 16.45 14.57
37 17.25 15.59 78 15.52 14.42 119 16.07 16.75
38 17.34 16.02 79 14.84 14.22 120 16.04 15.40
39 15.13 15.26 80 16.07 16.47 121 16.31 15.30
40 17.54 15.37 81 17.28 16.02 122 18.18 15.33
41 15.89 16.07 82 17.23 15.16 123 15.92 15.37
Игор Гуљаш Мастер рад ПРИЛОГ
68
р.број линија 1 линија 2
124 17.23 15.50
125 17.80 13.35
126 15.96 14.26
127 15.57 15.79
128 15.80 15.51
129 16.51 14.38
130 16.78 15.97
131 15.99 15.58
132 17.23 15.27
133 15.88 14.56
134 16.85 15.66
135 17.21 14.13
136 17.42 15.45
137 13.98 15.04
138 15.01 14.53
139 16.14 16.56
140 15.80 15.20
141 14.82 14.75
142 17.50 14.45
143 17.48 15.61
144 16.16 14.90
145 18.03 15.25
146 16.13 16.45
147 15.95 14.82
148 16.33 16.76
149 17.49 16.36
150 15.77 14.09
151 16.91 17.91
152 17.77 16.00
153 17.10 14.70
154 18.19 16.82
155 18.09 13.26
156 16.32 17.05
157 16.91 17.36
158 16.88 16.46
159 14.05 15.51
160 16.91 16.95
Игор Гуљаш Мастер рад ПРИЛОГ
69
Табела 3а: Snedekor-ов F-распоред
Вредности F за ниво значајности α = 5 %
Игор Гуљаш Мастер рад ПРИЛОГ
70
Табела 3б: Snedekor-ов F-распоред
Вредности F за ниво значајности α = 1 %
Игор Гуљаш Мастер рад ПРИЛОГ
71
Табела 4: Проценат запослених у пољопривреди, шумарству и рибарству у
укупном броју запослених и приходи по глави становника
р.број удео
запослених приходи р.број
удео
запослених приходи
1 13.67 19,376 24 9.45 22,655
2 2.39 19,189 25 5.52 19,225
3 5.04 18,385 26 33.74 23,404
4 4.87 18,860 27 28.30 21,336
5 8.23 19,681 28 21.83 19,332
6 4.74 23,496 29 2.64 25,162
7 4.36 27,033 30 9.51 23,806
8 7.44 24,234 31 12.27 21,215
9 5.06 32,924 32 16.54 16,966
10 5.16 28,905 33 9.00 21,786
11 6.59 21,529 34 14.27 19,347
12 3.95 22,830 35 7.23 18,633
13 4.13 24,093 36 20.96 24,800
14 16.37 18,658 37 1.71 25,001
15 15.61 17,707 38 18.43 17,721
16 4.33 30,901 39 5.65 25,449
17 15.68 18,414 40 9.76 15,090
18 9.95 19,013 41 1.48 43,692
19 20.60 17,222 42 16.96 22,872
20 3.38 29,473 43 0.29 28,117
21 25.55 27,543 44 7.05 18,657
22 21.32 29,989 45 21.66 15,307
23 4.75 25,716
Игор Гуљаш Мастер рад ПРИЛОГ
72
Табела 5: χ2 дистрибуција
Вредности χ2 за одговарајуће нивое сигнификантности α и степен слободе r
𝜒2 = 𝜒𝛼2
Игор Гуљаш Мастер рад ЛИТЕРАТУРА
73
ЛИТЕРАТУРА
1. Valker, A.M. (2006): Reporting effect size estimates in school psychology
research, Psychology in the Schools, 43(6): 653-672
2. Ellis, D.P. (2010): Тhe Essential Guide to Effect Sizes, Cambridge University
Press, New York
3. Kelley, K., Preacher, K. J. (2012): Psychological Methods, Vol. 17, No.2,
137-152
4. Keselman, H.J., Algina, J., Lix, L.M., Wilcox, R.R., Deering, K.N. (2008): A
generally robust approach for testing hypotheses and setting confidence intervals for
effect sizes, Psychological Methods, 13(2): 110–129.
5. Ковачић, Ј.З. (1994): Мултиваријациона анализа, Универзитет у Београду,
Економски факултет, Београд
6. LeCroy, C.W., Krysik, J. (2007): Understanding and interpreting effect size
measures, Journal of Social Work Research, 34(4): 243–248
7. Livingston, E.H., Cassidy, L. (2005): Statistical power and estimation of the
number of required subjects for a study based on the t-test: A surgeon’s primer, Journal
of Surgical Research, 128(2): 207–217
8. Ловрић, М. (2008): Основи статистике, Економски факултет, Универзитет
у Крагујевцу
9. Лозанов-Црвенковић, З. (2012): Статистика, Природно-математички
факултет, Универзитет у Новом Саду
10. McGraw, K.O., Wong, S.P. (1992): A common language effect size statistic,
Psychological Bulletin, 111(2): 361–365
11. McHugh, L.M. (2008): Power analysis in research, School of Nursing,
University of Indianapolis, Indianapolis, Indiana, USA
12. McCartney, K., Rosenthal, R. (2000): Effect size, practical importance and
social policy for children, Child Development, 71(1): 173–180
13. Nakagawa, S., Cuthill, C. (2007): Effect size, confidence interval and
statistical significance: a practical guide for biologists, University of Sheffield, Sheffield
14. Osborne, J.W. (2008): Sweating the small stuff in educational psychology:
How effect size and power reporting failed to change from 1969 to 1999, and what that
means for the future of changing practices, Educational Psychology, 28(2): 151–160
Игор Гуљаш Мастер рад ЛИТЕРАТУРА
74
15. Pallant, J. (2007): SPSS Survival Manual: A Step by Step Guide to Data
Analysis using SPSS for Windows, Maidenhead, Open University Press
16. Петц, Б., Колесарић, В., Иванец, Д. (2012): Петцова статистика, Основе
статистичке методе за нематематичаре, Свеучилиште у Загребу
17. Rosenthal, J.A. (1996): Qualitative descriptors of strength of association and
effect size, Journal of Social Service Research, 21(4): 37–59
18. Ступар, Д. (2012): Разлике у антропометријским карактеристикама и
моторичким способностима између дечака и девојчица узраста 7 година, Факултет
за спорт и туризам, ТИМС Акта 6, 57-64, Нови Сад
19. Sullivan M. G., Feinn R. (2012): Using Effect Size - or Why the P Value Is
Not Enough, Journal of Graduate Medical Education, 4(3): 279-282
20. Тањга, Р., Тањга, М. (2013): Пословна статистика, Висока школа за
економију и информатику, Бања Лука
21. Тењовић, Л., Смедеревац, С. (2011): Мала реформа у статистичкој
анализи података у психологији: Мало p није довољно, потребна је и величина
ефекта, Примењена психологија 2011/4, 317-333
22. Ћулав, И. (2008): Статистичке методе за процјењивање величине учинка,
Природословно-математички факултет, Свеучилиште у Сплиту
23. Field, A. (2005): Discovering Statistics Using SPSS, Sage Publications Ltd
24. Hair, J.F. (2009): Multivariate Data Analysis: A Global Perspective, Upper
Saddle River: Prentice Hall
25. Хаџи Стојковић, М. (2006): Статистика - дескриптивна и статистичка
анализа, Економски факултет, Суботица
26. Хаџивуковић, С. (1989): Статистика, Привредни преглед, Београд
27. Hedges, L. V. (1981): Distribution Theory for Glass's Estimator of Effect Size
and Related Estimators, Journal of Educational Statistics, 6(2): 107-128
28. Hoening, L.V., Heisey, D.M. (2001): The abuse of power: The pervasive
fallacy of power calculations for data analysis, The American Statistician, 55(1): 19–24
29. Huber, P. J. (1981): Robust statistics, John Wiley and Sons, New York
30. Hyde, J.S. (2001): Reporting effect sizes: The role of editors, textbook authors,
and publication manuals, Educational and Psychological Measurement, 61(2): 225–228.
Игор Гуљаш Мастер рад ЛИТЕРАТУРА
75
31. Callahan, J.L., Reio, T.G. (2006): Making subjective judgments in quantitative
studies: The importance of using effect sizes and confidence intervals, Human Resource
Development Quarterly, 17(2): 159–173
32. Cohen, J. (1988): Statistical Power Analysis for the Behavioral Sciences, 2nd
Edition. Hillsdale, NJ: Lawrence Erlbaum Associates.
33. Чобановић, К. (2003): Примери за вежбање из статистике,
Пољопривредни факултет, Нови Сад
34. Wilcox, R. R. (2005): Introduction to robust estimation and hypothesis testing,
Elsevier, New York
интернет http://www.statisticssolutions.com/correlation-pearson-kendall-
spearman
интернет http://www.ef.uns.ac.rs/download/statistika/2010-10-20_testiranje_
statistickih_hipoteza.pdf
интернет са http://sites.stat.psu.edu/~mga/401/tables/chi-square-table.pdf
интернет http://wwwserver.medfak.ni.ac.rs/predavanja/3.%20farmacija/
statistika/7.%20predavanje.pdf
интернет http://wwwserver.medfak.ni.ac.rs/predavanja/3.%20farmacija/
statistika/10.%20predavanje.pdf
интернет https://egret.psychol.cam.ac.uk/statistics/local_copies_of_sources_
cardinal_and_aitken_anova/glm_effectsize.htm
интернет http://documents.routledge-interactive.s3.amazonaws.com/
9780415819947/critical_value_spearman.pdf
интернет https://www.chem.bg.ac.rs/~grzetic/predavanja/hemija%20zivotne%
20sredine%20ii/analiticke%20greske%20i%20analiza%20gresaka.pdf
Тестирање хипотеза, Кујунџић М., Иванковић Д., интернет
http://www.mef.unizg.hr/meddb/slike/pisac15/file1525p15.pdf