49
1 ANALIZA VARIANCE 3.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija

ANALIZA VARIANCE 3...ANALIZA VARIANCE 3.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 FAKTORSKI POSKUS (Factorial Experiments) - dva proučevana dejavnika (dvofaktorski), trije

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

  • 1

    ANALIZA

    VARIANCE

    3.del

    Doc.dr. Tadeja Kraner Šumenjak

    Delovna verzija

  • 2

    FAKTORSKI POSKUS (Factorial Experiments)

    - dva proučevana dejavnika (dvofaktorski), trije

    proučevani dejavniki (trifaktorski), več proučevanih

    dejavnikov (večfaktorski poskus),

    - bločna zasnova,

    - model III ANOVA, SKOblok nima pomena,

    - ZELO UPORABNA POSKUSNA ZASNOVA

  • 3

    DVOFAKTORSKI POSKUS

    Agricultural Field Experiments str. 86

    S poljskim poskusom v treh ponovitvah želimo

    proučiti vpliv medvrstnega razmika ter gnojenja s fosforjem na pridelek nizkega fižola (kg/parcelo).

    V poskus so vključeni trije medvrstni razmaki:

    R1=45 cm R2=90 cm R3=135 cm

    ter gnojenje s fosforjem v dveh odmerkih:

    P1=0 kg/ha P2=25 kg/ha

  • 4

    Dejavnik 1:

    medvrstni

    razmak

    Dejavnik 2:

    odmerek

    fosforja

    Nivo

    dejavnika

    45 cm (1)

    60 cm (2)

    135 cm (3)

    0 kg/ha (1)

    25 kg/ha

    (2)

    Obravnavanj

    a

    11

    12

    21

    22

    31

    32

    Obravnavanje (Treatment) = česar

    vpliv na eksperimentalni material

    proučujemo (is a procedure whose

    effect on the experimental material is

    to be measured),

    Dejavnik (Factor) = (a particular class

    of related treatments),

    Nivo dejavnika (Factor Level)

    Interakcija = skupno odvisno

    delovanje dveh ali več proučevanih

    dejavnikov na izid

  • INTERAKCIJA

    Je posebne vrste vpliv dveh ali več

    dejavnikov na izid.

    Dvofaktorska interakcija je prisotna, če je

    vpliv enega dejavnika na izid drugačen, pri

    različnih ravneh drugega.

  • 6

    R2P1

    60

    R1P2

    45

    R1P1

    55

    R1P1

    65

    R3P1

    55

    R3P1

    51

    R3P2

    66

    R3P2

    57

    R1P2

    43

    R3P1

    59

    R1P1

    58

    R2P1

    54

    R1P2

    56

    R2P2

    50

    R2P2

    45

    R2P2

    62

    R2P1

    59

    R3P2

    50

  • 7

    2x3 FAKTORSKI POSKUS Design and Analysis of Experiments str. 122

    BOB DAE122

    Proučiti želimo vpliv gnojenja s fosforjem na pridelek navadnega boba (Vicia faba). Domnevamo, da tip rastline različno reagira na gnojenje, zato v poskus vključimo:

    T1= kratek, grmast tip,

    T2= visok, pokončen tip.

    Preizkušani gnojilni odmerki fosforja so:

    P1= 0 kg/ha,

    P2= 25 kg/ha,

    P3= 50 kg/ha.

  • 8

    S STATISTIČNO ANALIZO ODGOVORI:

    Ali tip rastline vpliva na pridelek? Pri kateri stopnji tveganja oz. s kakšno zanesljivostjo lahko to trdimo?

    Ali gnojenje s fosforjem vpliva na pridelek? Pri kateri stopnji tveganja oz. s kakšno zanesljivostjo lahko to trdimo?

    Ali je interakcija tip x P statistično značilna?

  • 9

    Obravnavanje

    Pridelek

    Tip rastline (T)

    Gnojenje s fosforjem (P)

    T x P

    Dejavnik

    Srednja vrednost

    Tip rastline Grmast

    Pokončen

    Gnojenje s P 0 kg/ha

    25 kg/ha

    50 kg/ha

  • 10

    PRIMER:

    Analizirajmo naslednji primer (Vasilj, str. 202). Izvedli so študijo, da bi ugotovili vpliv dveh različnih razmakov med vrstami (R1, R2) in dveh sort grozdja (G,M) na pridelek grozdja. Poskus je bil postavljen po shemi slučajnega bloka s 6 ponavljanji. Torej imamo popolni dvofaktorski poskus v 6 blokih.

  • 11

  • 12

    Analizirajte bločni poskus najprej tako, da ne upoštevate

    strukture v obravnavanjih. Preverite ničelno domnevo,

    da je povprečni pridelek po obravnavanjih enak.

    Testirajte še homogenost varianc.

  • 13

  • 14

    Test of Homogeneity of Variances

    pridelek

    1,376 3 20 ,279

    Levene

    Statistic df1 df2 Sig.

    Predpostavka o enakosti varianc po obravnavanjih je izpolnjena

    (Levenov test), zato si oglejmo rezultate ANOVE.

  • 15

  • 16

    Tests of Between-Subjects Effects

    Dependent Variable: pridelek

    12220,228a 8 1527,529 3,148 ,027

    280599,513 1 280599,513 578,272 ,000

    4779,622 1 4779,622 9,850 ,007

    288,496 1 288,496 ,595 ,453

    6410,295 5 1282,059 2,642 ,066

    741,815 1 741,815 1,529 ,235

    7278,567 15 485,238

    300098,308 24

    19498,795 23

    Source

    Corrected Model

    Intercept

    sorta

    razmak

    blok

    sorta * razmak

    Error

    Total

    Corrected Total

    Type III Sum

    of Squares df Mean Square F Sig.

    R Squared = ,627 (Adjusted R Squared = ,428)a.

    Na osnovi tega lahko sklepamo:

    Da povprečni pridelek grozdja ni odvisen od razdalje med vrstama

    (p=0,453), je pa odvisen od sorte (p=0,007). Torej lahko pri 1%

    tveganju trdimo, da ima 2. sorta značilno večji pridelek kot 1. sorta.

    Pri interakciji lahko zavržemo trditev, da faktorji ne delujejo

    neodvisno drug od drugega.

  • 17

    Vidimo, da je vseeno, če damo blok kot

    slučajni faktor ali ne.

  • 18

  • 19

    Tabela: prikaz povprečij po obravnavanjih za oba faktorja.

    Interakcije med

    razmakom in sorto

    ni.

  • Prednosti in slabosti faktorskega poskusa

    Odkrije interakcijo, če le ta obstaja.

    Če interakcija ne obstaja, pa zelo dobro

    oceni glavne vplive dejavnikov. Imamo

    namreč skrite ponovitve.

    Veliko faktorjev in ravni pomeni veliko

    obravnavanj.

    Včasih vsa obravnavanja niso izvedljiva.

  • 22

    PRIMER:

    Izvedli so gnojilni poskus na krompirju, kjer so proučevali

    vpliv gnojenja z dušikom in kalijem ter njun medsebojni

    vpliv. Gnojenje z dušikom (N) so izvedli na dveh ravneh:

    0 kg/h in 75 kg/h. Gnojenje s kalijem (K) so izvedli na

    dveh ravneh: 0 kg/h in 190 kg/h. Merili so pridelek

    krompirja na parcelo (kg/60 m2).

  • 23

    1. Dejavnik A: gnojenje z N

    Dejavnik B: gnojenje z K

    Dvofaktorski poskus: 2x2

    Obravnavanja: (0,0), (75,0), (0,190), (75,190)

    Poskusna zasnova: 3 bloki, v vsakem bloku 4 parcele, ki merijo 60 m2

    Izid: pridelek krompirja v kg/60 m2

    Namen poskusa je ugotoviti:

    Kako vpliva gnojenje z N na povprečni pridelek krompirja?

    Kako vpliva gnojenje s K na povprečni pridelek krompirja?

    Kako prisotnost K vpliva na povprečni pridelek pri različnih ravneh N?

  • 24

    blok (0,0) (75,0) (0,190) (75,190)

    1 90 58 112 156

    2 60 61 122 142

    3 76 63 113 142

    Tabela: izid poskusa – pridelek krompirja v kg/60 m2.

  • 25

  • 26

    Tabela: Homogenost varianc po obravnavanjih.

    (Compare/Analysis of Variance/One Way ANOVA

    Dependent Variable:pridelek

    Factor:obravnavanje

    Ikona: Options/Homogeneity of variance test

    Test of Homogeneity of Variances

    pridelek

    1,888 3 8 ,210

    Levene

    Statistic df1 df2 Sig.

    Kar pomeni, da ničelno domnevo

    obdržimo in privzamemo, da je ta

    predpostavka izpolnjena.

  • 27

    Tests of Between-Subjects Effects

    Dependent Variable: pridelek

    13861,417a 5 2772,283 31,533 ,000

    119002,083 1 119002,083 1353,578 ,000

    127,167 2 63,583 ,723 ,523

    200,083 1 200,083 2,276 ,182

    11970,083 1 11970,083 136,153 ,000

    1564,083 1 1564,083 17,791 ,006

    527,500 6 87,917

    133391,000 12

    14388,917 11

    Source

    Corrected Model

    Intercept

    blok

    dušik

    kalij

    dušik * kalij

    Error

    Total

    Corrected Total

    Type III Sum

    of Squares df Mean Square F Sig.

    R Squared = ,963 (Adjusted R Squared = ,933)a.

    Tabela: ANOVA.

    Ukaz:Analyze/General Linear Model/Univariate

    Dependent Variable:pridelek

    Factor:blok,dušik,kalij

    Model:blok, dušik, kalij,dušik*kalij

  • 28

    Povprečni pridelek je odvisen od dodanega kalija.

    Povprečni pridelek ni odvisen od dodanega dušika.

    Interakcija NxK je statistično značilna. Pri interpretaciji interakcije

    si pomagamo s tabelo povprečij po obravnavanjih in z grafičnimi

    prikazi.

    Podrobneje si oglejmo interpretacijo interakcije.

  • 29

    Tabela: ANOVA.

    Ukaz:Analyze/General Linear Model/Univariate

    Dependent Variable:pridelek

    Factor:blok,obravnavanje

    Model:blok, dušik, obravnavaje

    Tests of Between-Subjects Effects

    Dependent Variable: pridelek

    13861,417a 5 2772,283 31,533 ,000

    119002,083 1 119002,083 1353,578 ,000

    127,167 2 63,583 ,723 ,523

    13734,250 3 4578,083 52,073 ,000

    527,500 6 87,917

    133391,000 12

    14388,917 11

    Source

    Corrected Model

    Intercept

    blok

    obrav

    Error

    Total

    Corrected Total

    Type III Sum

    of Squares df Mean Square F Sig.

    R Squared = ,963 (Adjusted R Squared = ,933)a.

    Tabela: ANOVA za obravnavanja

  • 30

    pridelek

    Tukey HSDa

    3 60,6667

    3 75,3333

    3 115,6667

    3 146,6667

    ,269 1,000 1,000

    obrav

    (75,0)

    (0,0)

    (0,190)

    (75,190)

    Sig.

    N 1 2 3

    Subset for alpha = .05

    Means for groups in homogeneous subsets are displayed.

    Uses Harmonic Mean Sample Size = 3,000.a.

    Multiple Comparisons

    Dependent Variable: pridelek

    Tukey HSD

    -40,33333* 7,38617 ,003 -63,9865 -16,6802

    14,66667 7,38617 ,269 -8,9865 38,3198

    -71,33333* 7,38617 ,000 -94,9865 -47,6802

    40,33333* 7,38617 ,003 16,6802 63,9865

    55,00000* 7,38617 ,000 31,3469 78,6531

    -31,00000* 7,38617 ,013 -54,6531 -7,3469

    -14,66667 7,38617 ,269 -38,3198 8,9865

    -55,00000* 7,38617 ,000 -78,6531 -31,3469

    -86,00000* 7,38617 ,000 -109,6531 -62,3469

    71,33333* 7,38617 ,000 47,6802 94,9865

    31,00000* 7,38617 ,013 7,3469 54,6531

    86,00000* 7,38617 ,000 62,3469 109,6531

    (J) obrav

    (0,190)

    (75,0)

    (75,190)

    (0,0)

    (75,0)

    (75,190)

    (0,0)

    (0,190)

    (75,190)

    (0,0)

    (0,190)

    (75,0)

    (I) obrav

    (0,0)

    (0,190)

    (75,0)

    (75,190)

    Mean

    Difference

    (I-J) Std. Error Sig. Lower Bound Upper Bound

    95% Confidence Interval

    The mean difference is significant at the .05 level.*.

  • 31

    N

    K 0 75 yn=75

    -yn=0

    0 75,3 60,7 -14,6

    190 115,7 146,7 31

    yk=190

    -yk=0

    40,4 86 45,6

    Če K ni, dodajanje N zmanjša povprečni pridelek za 14,6 kg/parcelo (ni statistično značilno).

    Če K je, dodajanje N poveča povprečni pridelek za 31,0 kg/parcelo (je statistično značilno).

    Če N ni, dodajanje K poveča povprečni pridelek za 40,4 kg/parcelo (je statistično značilno).

    Če N je, dodajanje K poveča povprečni pridelek za 86,0 kg/parcelo (je statistično značilno).

    Prikaz povprečnih pridelkov krompirja po obravnavanjih

  • 32

    SKLEPI:

    Med obravnavanji obstajajo statistično značilne razlike (p=0,0001).

    Gnojiti se splača s K, ki mu dodamo N. Dodan N povečuje vpliv K, saj

    se je povprečni pridelek povečal iz 115,7 kg/parcelo na 146, 7

    kg/parcelo, torej kar za približno 27 %. Razlika je statistično značilna.

    Odsvetujemo gnojenje samo z N, saj je le-ta zmanjšal povprečni

    pridelek za približno 20 % v primerjavi s kontrolo, vendar ta razlika ni

    statistično značilna.

  • 33

  • 34

    Grafični prikaz interakcije

  • 35

  • 36

    SPLIT-PLOT POSKUS (POSKUSNA ZASNOVA Z DELJENKAMI)

    2

    Shema split-plot poskusa

    Blok1

    Blok2

    Blok3

    Blok4

    AB C

    A B C

    AB C

    A BC

    0 50100 150 50 0100 150 150 0100 50

    150 0100 50 0 10050 150 100 050 150

    100 15050 0 0 50100 150 50 0100 150

    0 15050 100 150 0100 50 50 0150 100

    Parcela

    Podparcela

    Pri split–plot poskusu imamo dva proučevana dejavnika: dejavnik A

    na a ravneh, na glavnih parcelah.

    Ta dejavnik potrebuje zaradi tehnoloških ovir večje parcele.

    Dejavnik B na b ravneh, na podparcelah (vsaka parcela se razdeli na

    podparcele). Ponovitve so izvedene v blokih.

  • 37

    Vsak blok (ponovitev) razdelimo na glavne parcele, te glavne

    parcele pa razdelimo na podparcele.

    Od razporeditve glavnih parcel znotraj bloka, je odvisen model in

    ANOVA. Mi se bomo omejili in pogledali statistično analizo za

    primer, kjer smo glavne parcele razporedili naključno.

    Matematični model za poskusno zasnovo split-plot je

    Yijk=μ+αi+βj+(αβ)ij+λk+(αλ)ik+εijk,

    kjer je μ povprečna vrednost proučevane lastnosti, αi , λk in (αλ)ik so

    fiksni vplivi obravnavanj, βj slučajni vpliv bloka ter (αβ)ij in εijk

    slučajni napaki (na glavnih parcelah in podparcelah).

  • 38

    PRIMER (Hadživuković, str. 349)

    Cilj poskusa je ugotoviti, kako sorta pšenice

    in gostota setve vplivata na pridelek pšenice,

    in ali obstaja interakcija med obema

    dejavnikoma. V poskus so bile vključene štiri

    sorte in tri različne gostote setve. Poskus je

    bil zasnovan v split-plot zasnovi. Sorta je bila

    na glavnih parcelah, gostote setve pa na

    podparcelah.

  • 39

    Sorte Gostote

    setve

    Bloki

    San

    pastore

    (1)

    500

    700

    900

    2,47

    2,77

    2,76

    2,82

    2,66

    2,53

    2,47

    2,57

    2,55

    2,71

    2,82

    2,85

    2,28

    2,55

    2,48

    Mara

    (2)

    500

    700

    900

    2,60

    2,75

    2,77

    2,87

    2,38

    2,56

    2,33

    2,42

    2,61

    2,80

    2,89

    2,51

    2,51

    2,48

    2,65

    Produttore

    (3)

    500

    700

    900

    3,07

    2,95

    3,06

    2,75

    2,83

    2,30

    3,05

    3,02

    2,91

    2,84

    3,08

    3,05

    2,81

    2,94

    2,83

    S-15

    (4)

    500

    700

    900

    2,22

    2,49

    2,32

    2,45

    2,46

    2,20

    2,26

    2,24

    2,53

    2,48

    2,49

    2,25

    2,17

    2,33

    2,17

  • 40

    Podatke ustrezno zapišemo v programu SPSS.

  • 41

    Izberemo Analyze/General linear model/Univariate; vstavimo

    odvisno spremenljivko pridelek (Dependent Variable), fiksna

    dejavnika gostota setve in sorta (Fixed Factor(s)) in slučajni

    dejavnik blok (Random Factor). Pri opciji Model izberemo Custom

    in določimo, da SPSS izračuna vpliv dejavnikov gostota setve, sorta

    in blok ter kombinacijo sorta*gostota setve. Nato izberemo ikono

    Paste in odpre se okno s sintakso - ukazni jezik. Vrstico ’’design’’

    dopolnimo z blok(sorta). Nazadnje izberemo ikono Run/Current

    in izpišejo se rezultati analize, ki so podani v tabeli.

  • 42

  • 43

    Tabela: ANOVA za split-plot

    Tests of Be tween-Subjects Effects

    Dependent Variable: pridelek

    ,048 2 ,024 1,054 ,360

    ,724 32 ,023a

    2,370 3 ,790 24,054 ,000

    ,394 12 ,033b

    ,379 4 ,095 2,885 ,069

    ,394 12 ,033b

    ,075 6 ,012 ,549 ,767

    ,724 32 ,023a

    ,394 12 ,033 1,451 ,194

    ,724 32 ,023a

    Source

    Hypothesis

    Error

    gostotasetve

    Hypothesis

    Error

    sorta

    Hypothesis

    Error

    blok

    Hypothesis

    Error

    gostotasetve

    * sorta

    Hypothesis

    Error

    blok(sorta)

    Type III Sum

    of Squares df Mean Square F Sig.

    MS(Error)a.

    MS(blok(sorta))b.

  • ANOVA je sestavljena iz dveh delov

    Za glavne parcele, to je isto kot pri blokih,

    s tem ovrednotimo vpliv dejavnika A.

    Za podparcele tu ovrednotimo vpliv

    dejavnika B in njune interakcije.

  • 45

    •Na osnovi dobljenih rezultatov lahko sklepamo, da statistično

    značilno variabilnost pridelka povzroča sorta.

    •Nadalje lahko razberemo, da čas prekrivanja in njuna interakcija

    (sorta*gostota setve) nista statistično značilna.

  • 46

    Z dejavnikom, za katerega se izkaže da statistično značilno vpliva na

    pridelek, gremo v nadaljnjo analizo:

    Tabela: Homogeni nizi pridelek

    Tukey HSD

    so1 N

    Subset for alpha = .05

    1 2 3

    4,00 15 2,3373

    2,00 15 2,6087

    1,00 15 2,6193

    3,00 15 2,8993

    Sig. 1,000 ,997 1,000

    Means for groups in homogeneous subsets are displayed.

    V tabeli so prikazani homogeni nizi dobljeni s Tukeyevim testom

    mnogoterih primerjav pri 5 % tveganju. Na osnovi povprečnih

    vrednosti za posamezne sorte ter na osnovi HSD testa, lahko

    ugotovimo, da med povprečnima pridelkoma pri sortah San pastore in

    Mara ni statistično značilnih razlik pri 5 % tveganju, medtem ko se

    povprečni pridelki pri ostalih sortah, statistično značilno razlikujejo.

  • LATINSKI KVADRAT PRIMER Hadživuković str. 263.

    (pridelki in različna gnojenja)

    Stolpci/vrstice 1 2 3 4

    1 17(A) 15,00(B) 19,50(D) 26,00(C)

    2 14,30(D) 21,20(A) 22,40(C) 17,50(B)

    3 25,00(C) 13,20(D) 16,70(B) 23,30(A)

    4 13,80(B) 26,00(C) 24,00(A) 17,40(D)

    48

  • 49