Upload
fawzi
View
33
Download
0
Embed Size (px)
DESCRIPTION
Regresja segmentami i wygładzające funkcje sklejane. Na ogół nie znamy nie tylko parametrów p ale i sposobu podziału zakresu zmiennej objaśniającej na przedziały o granicach a 1 , a 2 , …, a q. Zależność między czasem od siewu a logarytmem liczby liścieni - PowerPoint PPT Presentation
Citation preview
Regresja segmentami i wygładzające funkcje sklejane
qqqq
nn
xxf
xxf
xxf
xf
xfy
xfy
xfy
,,
,,
,,
,,
,,
,,
,,
21222
1111
22
11
p
p
p
αp
αp
αp
αp
Na ogół nie znamy nie tylko parametrów p ale i sposobu podziału zakresu zmiennej objaśniającej na przedziały o granicach 1, 2, …, q.
Zależność między czasem od siewu a logarytmem liczby liścieni Lerman, Appl. Math. Stat., 29, 77-84 (1980)
Zależność między odwrotnością metabolizowanej energii a pobieraniem pokarmu u zwierząt kopytnych (Lerman, Appl.
Math. Stat., 29, 77-84 (1980)
Dane symulowane Lerman, Appl. Math. Stat., 29, 77-84 (1980)
Prowadzenie linii regresji
q
iiKi
K
Kjiijj i
i
i
xxfy1
12
1
,, αp
Dla wszystkich możliwych podziałów zakresu x na przedziały liczymy . Wybieramy taki podział, przy którym jest najmniejsze.
Przypadek regresji liniowej dwufazowej
pnp
xxx
nixxbxa
ixxbxay
TT
TT
iii
iiii
iiiii
22
1
222
11
1
111
2222
1111
21
222212122
121211111
ˆ
ˆ
1,
,,2,1
,,2,1
yXXXβ
yXXXβ
εβXy
εβXy
Odchylenia standardowe parametrów równań prostych obliczamy (a co za tym idzie określamy przedziały ufności tych parametrów) jak dla regresji liniowej. Natomiast żeby określić przeprowadzamy test F porównując sumę kwadratów odchyleń otrzymanych z regresji pojedynczej z sumami otrzymanymi z poszczególnych segmentów.
2222221
22221122
1111111
22121111
1
22211
max
2121
21
0
max
21
2
:
βXyβXy
βXyβXy
XβyXβy
εXβy
T
iiii
T
iiii
Tn
iiii
pnp
xxyS
xxyS
xxyS
FF
p
pn
SS
S
pnSS
pSSSF
H
F określa poziom istotności hipotezy H0 dla n-2p i p stopni swobody.
n
rij
rijij
ijij
jjij
jjiji
xn
i
nzzE
nipr
ix
iz
zxy
1
222
111
11
1
0
εδβXy
εβXy Ocena istotności regresji segmentowej jest teraz równoważna określeniu poziomu istotności hipotezy H0: =0 pod warunkiem, że znamy . W teście Farleya przyjmujemy, że =n/2.
Jeżeli nie chcemy nic zakładać o to uśredniamy z-y po wszystkich możliwych wartościach (test Farleya-Hinnicha).
W obu wypadkach używamy testu F porównując model z =0 i które wyszło z minimalizacji sumy kwadratów odchyleń.
Lerman, Appl. Math. Stat., 29, 77-84 (1980)
Lerman, Appl. Math. Stat., 29, 77-84 (1980)
Lerman, Appl. Math. Stat., 29, 77-84 (1980)
„Uciąglanie” problemu
zz
zz
ee
eezz
xxxy
xxx
xxy
xx
xxy
tanhtrn
trn
sgn
210
210
210
2021
1011
Warunki dla funkcji trn:
00sgn0trn)(
sgn/trn)(
0trn)(
lim
lim
iii
zzii
zzziz
Sformułowanie min-max problemu regresji dwufazowej
xxy 21201110 ,max
Tishler & Zang, Appl. Stat. 30, 116-124 (1981)
Dopasowywanie funkcjami sklejanymi (fitting splines)
Wecker & Ansley,J. Am. Stat. Assoc., 78, 81-89 (1983)
nixSxS
nixSxS
nixSxS
niyxS
iiii
iiii
iiii
iii
,...,1,0),()(
,...,1,0),()(
,...,1,0),()(
,...,1,0,)(
''1
''
'1
'
1
Ogólna postać funkcji sklejanych stopnia trzeciego
1,...,1,0],,[
)()()()()(
1
32
nixxx
xxdxxcxxbaxSxS
ii
iiiiiiii