Upload
dyre
View
71
Download
0
Embed Size (px)
DESCRIPTION
Mnohonásobná regrese a mnohorozměrná analýza dat. v programu CANOCO. Mnohonásobná regrese. mám více prediktorů ovlivňuje výšku rostliny hnojení a zálivka? ovlivňuje hmotnost těla zeměpisná šířka a nadmořská výška? prediktory by ideálně neměly být korelované lineární model:. - PowerPoint PPT Presentation
Citation preview
Mnohonásobná regrese a mnohorozměrná analýza dat
v programu CANOCO
Mnohonásobná regrese
• mám více prediktorů– ovlivňuje výšku rostliny hnojení a zálivka?– ovlivňuje hmotnost těla zeměpisná šířka a
nadmořská výška?
• prediktory by ideálně neměly být korelované• lineární model:
2211 XXY
i
iiXY
Mnohonásobná regrese
• lineární - grafem je rovina (pro 2 prediktory)3D povrchový gra f (Tabu lka1 10v*17c)
P rom 3 = 1649.5152+0.7729*x+0.9422*y
5000 4000 3000 2000 1000
Mnohonásobná regrese
• kvadratická3D povrchový gra f (Tabu lka1 10v*17c)
P rom 3 = 1697.5292+0.871*x-3 .2787*y-1.3512E -5*x*x-0.0005*x*y+0.0093*y*y
6000 5000 4000 3000 2000 1000
Mnohonásobná regrese
• metoda nejmenších čtverců3D povrchový gra f (Tabu lka1 10v*32c)
P rom 3 = M N Č váž. vzdá leností
8000 6000 4000 2000
Mnohonásobná regrese
• koeficienty α a βi-n odhadujeme stejně jako u jednoduché regrese
• testujeme:– ANOVA celého modelu (ani jeden prediktor
nevysvětluje závisle proměnnou)– t-testy jednotlivých regresních koeficientů (k
jednotlivým proměnným)
Mnohorozměrná analýza dat
• Canoco for Windows– program pro hodnocení společenstev– mám seznam lokalit (vzorky) a druhů, které
jsem tam našel– dostanu ordinační diagram - „podobné“ druhy,
lokality nebo oboje jsou u sebe– pokud mám ve vzorcích změřené nějaké
vysvětlující proměnné (např. abiotické faktory), můžu si najít jestli průkazně ovlivňují druhy a jak
Canoco – velmi stručný návod
• v podstatě hledá imaginární „co nejlépe“ vysvětlující proměnné (osy)
• viz Mnohorozměrná analýza ekologických dat. Jan Lepš & Petr Šmilauer, BF JU v ČB, 2000
• obecně pomocí Canoca mohu hodnotit jakoukoli (mnohorozměrnou) odpověď– typicky tedy druhy (počty, 0-1, třídy početnosti,…) ve
vzorcích – ale i např. hmotnost, strupovitost, chuť a rezistence
brambor– známka z M, Čj, Fy, Bi, Tv, D a Ch u studentů– délka pestíku, plocha listů, průměr stonku, počet listů,
celková výška u rostlin
Canoco – velmi stručný návod• zdrojová data – v Excelu či jiném
tabulkovém procesoru• „druhová“ data:
– řádky jsou jednotlivé vzorky– ve sloupcích druhy (nebo to co sleduji)
hodnocené téměř libovolným způsobem (0-1, počet, ordinální kategorie, délka, hmotnost,…….)
• druhová data převedu do formátu Canoca programem WCanoImp (oblast dat v Excelu zkopíruji do schránky, spustím WCanoImp a dám „Save“)
• uložím jako *.dta nebo *.spe (pokud chci aby to Canoco zobrazilo, jinak můžu třeba *.xyz)
• Spustím Canoco for Windows a zvolím nový projekt
Canoco – velmi stručný návod
• vyberu soubor s druhovými daty a zadám soubor, kam se uloží řešení projektu (*.sol)
• Type of Analysis – zde můžu zvolit některou nepřímou (neomezenou) analýzu (PCA – Principle Component Analysis, CA – Correspondent Analysis, DCA – detrended CA)
• nejprve zvolím DCA, podle výsledku se rozhodnu mezi PCA (lineární) či CA (unimodální)
Canoco – velmi stručný návod
Lineární metody – předpokládám lineární odpověď, anebo mám krátký úsek gradientu
Unimodální – nepředpokládám lineární odpověď, anebo mám dlouhý úsek gradientu
podle Lepš a Šmilauer 2000
Canoco – velmi stručný návod• Provedu DCA (většinou nechám defaultní
nastavení, pokud mám počty jedinců je dobrá použít odmocninovou transformaci)
• Po analýze dostanu souhrnnou tabulku:
• pokud je délka gradientu větší než 4, měl bych použít unimodální. Pokud menší než 3, bývá lepší lineární. Pokud 3-4 je to na mně.
• podle délky gradientu tedy zvolím CA nebo PCA
• provedu analýzu, přepnu do CanoDraw
Canoco – velmi stručný návod
Kumulovaná procentuální část variability vysvětlená jednotlivými osami
Canoco – velmi stručný návod
• pokud mám u vzorků změřené nějaké vysvětlující proměnné:– mám je v Excelu ve stejném pořadí jako druhová data– oblast vyberu a spustím WCanoImp– uložím jako *.dta nebo *.env– v Canocu užiji omezené (přímé) analýzy – RDA
(Redundancy Analysis), CCA (Canonical– Correspondence Analysis)– zase mezi lineárními a unimodálními rozhodnu
pomocí DCA
Canoco – velmi stručný návod
• proměnné – poměrová, intervalová či ordinální škála
• kategoriální proměnné – zadávám jako tzv. dummy variables
• nebo fuzzy variables
smrk buk jedl_buk louka
1 0 0 0
0 1 0 0
0 0 0 1
1 0 0 0
svetlo stin
0 1
0.5 0.5
1 0
Canoco – velmi stručný návod
• Canoco umí spočítat, jestli daná vysvětlující proměnná (environmentální charakteristika) ovlivňuje vysvětlované proměnné (druhy) statisticky průkazně – tzv. Monte-Carlo permutační testy
• manuální „forward selection“ – do analýzy zařadím jen ty proměnné, které mají průkazný efekt (většinou, záleží na tom co chci získat)
Canoco – velmi stručný návod
• další postup podobný jako u neomezených analýz• ve výsledcích dostanu omezené a neomezené
osy• kategoriální (nominální) proměnné musím v
CanoDraw takto značit• pokud mám kovariáty (covariables, vysvětlující
proměnné, jejichž vliv chci odfiltrovat) – volím na začátku projektu
• další – viz cvičení a Lepš a Šmilauer 2000