Upload
afrim-alili
View
40
Download
0
Embed Size (px)
DESCRIPTION
analiye ekonometrike
Citation preview
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 1/15
Metodat e bazuar në fushën e frekuencave
(Seritë Kohore).Gentian Zavalani
1.
Hyrje
E përbashkët e metodave analizuese të dhënave është se të gjitha fillojn me një problem
shkencor/inxhinierik dhe përfundojn me një konkluzion shkencor/inxhinierik. Ndryshimiqendron në rendin dhe rëndësin e hapave të ndërmjetëm. Për metodat analizuese klasike rendi
është Problemi => Të dhënat => Modeli => Analizat => Konkluzionet . Kështu që në analizën
klasike të dhënave i imponohet një model dhe të gjitha analizat testues bazohen në parametrat e
këtij modeli. Ndryshe nga metodat klasike, rendi analizes në këtë detyrë do të jetë Problemi =>
Të dhënat =>Analizat => Modeli=> Konkluzionet .Qellimi i kësaj detyre është të tregoj se si
metodat analizuse në fushën e frekuencave mund të aplikohen duke filluar nga të dhënat e një
problem inxhinierik të caktuar deri në ato të dhëna "kritike" të cilat plotësojn disa supozime
tipkie që shoqerojn procesin e matjeve.
Disa nga këto supozime lidhen me:
a)
Të dhëna të jenë të rastit
b) Të dhëna vijn nga një shpërndarje e caktuar
c) me një shpërndarje që ka një "zonë1" te përcaktuar dhe
d)
shperndarja ka një variancë të caktuar
Nëse supozimet e mësipërme plotësohen, atëherë procesi është statistikisht i kontrollushëm, me
karakteristikë themelore "parashikueshmërinë".
Një model i përshtatshëm për një proces të kontrollushëm është:
i iY C E
1 zonë ka kuptimin tendence qendrore; përcaktimin e një vlere qendrore për shpërndarjen
probabiltare
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 2/15
Ku C është një konstante (komponentja deterministe), ndërsai
E lidhet me konponenten e rastit.
Konstantja C në pergjithësi është një vlerë mesatare e procesit, ajo ka një vlerë të fiksuar dhe
është e panjohur. Kështu objektivi primar i analizës së një inxhinieri është gjetja e vlerës së
konponentes detrministe C . Për vlerat e konstantes C dalloj katër raste:
1. A është Y treguesi më i mirë i vlerës së C ?
2. Nëse Y treguesi më i mirë për C , sa është gabimiY
S ? Ku formula për llogaritjen eY
S
ështëY
sS N
.
3. Nëse Y nuk është treguesi më i mirë i vlerës së C .Kush është treguesi më i mirë? (p.sh
mediana etje...)
4. Nëse është gjetur një vlerë e C së të cilën po e shënojm me C . Sa është gabimiC
S në
një rast të tillë?
Një detyrë tjetër që shtrohet në shumë analiza statistikore është gjetja e një parametri lokal2 për
shpërndarjen, pra gjetja e një vlere qendrore e cila përshkruan më së miri të dhënat.
1.
Kontrolli i "zonës" dhe variancës sigurojn informacion nëse C është në të vertetë
konstante.
2. Kontrolli mbi shpërndarjen tregojn nëse Y është treguesi më i mirë për C . Teknikat për
kontr ollin e shpërndarjes përfshijnë histogramën, grafikun e propabilitetit normal etj…
3. Kontrolli mbi rastësin e të dhënave, nga ku konstatojm nëseY
sS N
është i
vlefshëm.
Nëse një nga supozimet e mësipërme nuk plotësohet, atëherë për të gjetur një model të
përshtashëm për të dhënat duhet të përdorim teknika të tjera ose një gërshetim të teknikave
klasike.
Një model i tillë mund të jetë:
i iY D E
2 Është një klasë e shpërndarjeve probabilitare që është parametrizuar nga një parametër
vlerësues i cili mund të jetë skalar ose vektor që përcakton "zonën" ose zhvendosjen në
shpërndarje. Formalisht do të thotë që funksioni i densitetit probabilitar në këtë klasë ka formën
0 0( ) x f f x x ,- 0 x njihet me emrin parametër lokal. Ku si parametër mund të shërbej
mesatarja,mediana dhe moda
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 3/15
Kur të dhënat nuk janë të rastit, ne mund të përdorim modele të serive kohore për të dhënat në
shqyrtim. Modeli i një serie kohore është
( )i y f t gabimi . Ky model mund të jepet në fushën e kohës ose të frekuencës në varësi te
problemit.
Për të kontrolluar nëse supozimet e mësipërme përmbushen. Do të përdorim dy lloj metodash
a) Metodat grafike.
b) Metodat e vlersimeve sasiore.
Nga metodat grafike veçojm:
A-
run sequence plot i cili është i përshtatshëm për të kontrolluar nëse të dhënat kanë
ndonjë zhvendosje të rëndësishme në "zonë" ose variancë me kalimin e kohës.
B- lag plot shërben për të kontrolluar nëse kemi jo rastësi në të dhëna.C-
Histogram është e përshtatshëme për të kontrolluar supozimin mbi shpërndarjen.
D- normal probability plot shërben për të kontrolluar nëse të dhënat ndjekin një shpërndarje
normale.
Metodat e vlersimeve sasiore përfshijnë:
A- Treguesot kryesorë statistikorë.
o Mesatarja
o
Devijimi standart
o
Koefiçienti i korelacionit për të testuar nëse të dhënat janë të rastit
o Përafrim linear të të dhënave në funksion të kohës për të dalluar
shmangiet.
o
Testien Bartlett për të kontrolluar nëse varianca është konstante.
o Grafiku i koefiçientit të korelacionit për të testuar nëse të dhënat janë
të rastit.
o
Testi Anderson-Darling për të kontrolluar normalitetin.
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 4/15
2. Aplikimi i anlizes në deformimet e një trau.
Ekzistojnë një numër përafrimesh në modelimin e serive kohore .
Më poshtë do të parashtrojmë dhe analizojmë një prej tyre. Një nga përafrimet më të përdorshëmnë aplikimet inxhinierike dhe shkencore është analizimi i serisë në fushën e frekuencave. Një
shembull i një përafrimi të tillë është në modelimin e të dhënave të cilat pershkruajn deformimet
e një trau. Një nga mjetet kryesore për analizën në fushën e frekuencave të një serie kohore është
grafiku spektral. Të dhënat që do të përdoren në këtë analizë jepen në skedarin stat.txt.
Qellimi i kësaj analize do të jetë i trefishtë.
1.
Përcaktimi nëse modeli invariant
i iY C E
është i përshtatshëm dhe i vlefshëm.
2.
Përcaktimi nëse supozoimet kryesore që shoqerojnë procesin e matjeve janë te vlefshëm.
3. Përcaktimi nëse intervali i besimit
2 /Y s N
është i përshtatshëm dhe i vlefshëm ku me s është shënuar devijimi standart i të
dhënave . Për N matjen 1 2 3, , , N Y Y Y Y devijimi standart është:
2
1
1
1
N
Y i
i
s Y Y N
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 5/15
Metodat grafike
Interperetimet:
1.Grafiku i parë (majtas sipër) tregon se të dhënat nuk kanë ndonjë zhvendosje të
rëndësishme në "zonë" ose variancë me kalimin e kohës.
2. Grafiku "lag plot "tregon se të dhënat nuk janë të rastit. Akoma më tej ky grafiktregon praninë e e disa outlierve.
3.Ndërsa supozim për rastësin është shkelur seriozisht,histograma (majtas poshtë)
dhe ndertim i shpërndarjes propabilitare normale (poshtë djathtas) eshte injoruar
sepse siç e dimë nga përcaktimi i shpërndarjes normale ajo ka kuptim vetëm kur
të dhënat janë të rastit.
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 6/15
Nga grafikët e mësipërm arrijm në përfundimin se supozimi themelor për rastësin
nuk është i vlefshëm. Prandaj modeli
i iY C E
nuk është i përshtatshëm në një situatë të tillë.
Për këtë arsye ne duhet të zhvillojmë një model më të mirë. Kur të dhënat nuk
janë të rastit, atëherë për modelimin e këtyre proceseve na vijn në ndimë seritë
kohore. Në mënyrë të veçantë, forma rrethore në grafikun "lag plot " tregon se njëmodel sinusoidale mund të jetë e përshtatshëm.
Grafikët e mësipërm për më shumë detaje mund të gjenerohen në mënyrë individuale . Në këtërast, vetëm grafiku i parë majtas dhe "lag plot " janë ndërtuar pasi grafiku i shpërndarjes normalenuk ka kuptimë.
Figura 1 Paraqitja grafike e të dhënave
.
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 7/15
Figura 2 Grafiku "lag plot" me vlerat outlier
Kemi ndërtuar disa vija dhe kuti në "lag plot" për të izoluar më mirë vlerat outlier. Pikat e
mëposhtëme të të dhënave duhet të jenë outliers bazuar në grafikun "lag plot"
INDEX Y(i-1) Y(i)158 -506 300.00
157 300 201.00
3 -15.00 -35.00
5 115.00 141.00
Kur grafiku "lag plot" tregon një jo rastësi të theksuar, është e dobishme ndërtimi i grafikut tëautokorelacionit.
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 8/15
Figure 3 Grafiku i autokorrelacionit dhe korrelacionit
Ky grafik tregon një model të dallushëm ciklik. Si në rastin " lag plot", ky grafik sugjeron njëmodel sinusoidale.
Një mjet tjetër shumë i rëndësishëm për analizimin e të dhënave jo rastësore është grafikuspektral.
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 9/15
Figura 4 Grafiku spektral me frekuenc dominante 0.3
Ky grafik tregon një kulm të vetëm dominant në një frekuencë 0.3. Pikërisht frekuenca e tij 0,3do të përdoret në përshatjen e modelit sinusoidale në paragrafin e mëposhtëm.
Metodat e vlersimeve sasiore
Këto rezultate grafike i plotësojmë me disa rezultatet sasiore.
Si fillim llogaritim treguesit kryesor satatistikor
Numri i vezhgimeve 200
Mesatarja -177.4350
Mediana -162.000
Minimumi -579.0000
Maksimumi 300.0000
Diapazoni 879.0000
Devijimi Standart 277.3322
Një mënyrë tjetër për të përcaktuar nëse kemi ndryshime në "zonë" në lidhje me kohën është
nëpërmjet përafrimit linear të të dhënave duke përdorur variablin 1, 2, X N ku N
ështënumri i vëzhgimeve. Modeli i përafrimit linear është 0 1i i iY A AT E . Nëse nuk ka ndonjë
tendencë të theksuar shmangie në "zonë", parametri i pjerrësisë duhet të jetë zero (pra1
A ).
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 10/15
Coefficient Estimate Stan. Error
t-Value
A0 -178.175 39.47
-4.514
A1 0.7366E-02 0.34
0.022
Residual Standard Deviation = 278.0313
Residual Degrees of Freedom = 198
Parametri i pjerrësis për A1 ka vlerën 0.022, çka mund të konsiderohet zero, pasi statistikisht nuk
është domethënës.
Për të kontrolluar nëse kemi ndryshim të variancës do të përdorim testin Levene. Në veçanti këtë
test do ta përdorim duke u bazuar më shumë te mediana se sa te mesatarja. Zgjedhja e numrit të
intervaleve është arbitrare, megjithatë vlera 4 dhe 8 janë të arsyeshme.
H 0: σ 12 = σ 2
2 = σ 3
2 = σ 4
2
H a: At least one σ i2 is not equal to the
others.
Test statistic: W = 0.09378
Degrees of freedom: k - 1 = 3Sample size: N = 200
Significance level: α = 0.05
Critical value: F α , k-1, N-k = 2.651
Critical region: Reject H 0 if W> 2.651
Në këtë rast testi Levene tregon se në katër intervale nuk kemi ndonjë ndryshimë të theksuar të
variancës. Meqënse vlera e testit statistikor është 0.9378, më e vogël se vlera krtikie 2.651.
Për të kontrolluar nëse të dhënat janë të rastit përdorim "run tests"
H 0: the sequence was produced in a randommanner
H a: the sequence was not produced in a
random manner
Test statistic: Z = 2.6938
Significance level: α = 0.05
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 11/15
Critical value: Z 1-α /2 = 1.96
Critical region: Reject H 0 if | Z| > 1.96
Vlera absolute e testit statistikor është më e madhe se vlera 1.96 , prandaj arrijme në përfundiminse të dhënat nuk janë të rastit. Meqënse rezultatet sasiore tregojn se supozimet për të dhëna të
rastit dhe zhvendosjen e variancës janë shkelur, atëherë kontrolli i shpërndarjes nuk do të kishtendonjë rëndësi nëse do të realizohej. Rezultatet sasiore ashtu si dhe ato grafike "lag plot",grafiku i korlacionit, dhe ai spektral, tregojnë qartësisht shkeljen e supozimit për të dhëna të
rastit. Për më tepër paraqitjet grafike "lag plot" dhe autokorrelacioni në pjesën e mëparshme
sugjerojn fuqimisht që një model sinusoidal mund të jetë i përshtatshëm në një situatë të tillë .
Modeli themelor sinusoidal është:
sin(2 )i i i
Y C T E
KuC
është një konstante e cila është një vlerë e mesatares së procesit, është amplituda përfunksionin sinusoidal, është frekuenca,i
T është variabëli kohë , ndersa eshte faza. Modeli i
përshatshëm sinusoidal mund të përcaktohet me anë të metodës së katrorëve më të vegjel rasti jolineare.
Për të marrë një model sa më të përshtatshëm duhet që modeli sinusoidal të ketë një përafrimfillestar të kostantes C , amplitudës dhe frekuencës sa më të mirë. Një perafrim i mire i C
mund të merret duke llogaritur mesataren e të dhënave . Nëse trendi i të dhënave , p.sh nësesupozimi për një "zonë" konstante shkelet, ateherë konstanten C mund ta zëvendësojm me
termin 0 1 i B B T , i cili është një model i përftuar duke aplikuar metodën e katrorëve më të
vegjël rasti linear . Në këtë mënyrë modeli ynë merr trajtën
0 1 sin 2i i i iY B B T T E
ose metodën e katrorëve më të vegjël rasti kuadratik
2
0 1 2 sin 2
i i i i iY B B T B T T E
Meqënse të dhënat tona nuk kanë ndonjë ndryshim të theksuar të "zonës" ne mund ta përshtatimmodelin duke e marrë C të barabartë me mesataren, për të dhënat në studim vlera e mesataresështë -177.44.
Përafrimi fillestare për frekuencën mund të merret nga grafiku spektral, ku pamë që frekuencadominuese kishte vlerën 0.3Për përmisimin e përafrimit fillstare të frekuencës do të përdorim demodulimn kompleks në fazë .Demodulimi kompleks në fazë, thotë: nëse pjerrësia e vijës është nga e majta në të djathtëatëherë frekuenca duhet rritur, në rast të kundërt duhet zvogëluar, nëse pjerrësia është zeroatëherë frekuenca nuk është e nevojshme të modifikohet . Në mund të gjenerojmë grafikët edemodulimit në fazë për frekuencën 0.3 dhe duke përdorur gabimin mund të marrim një matjesa më të mirë të frekuncës. Për ti thjeshtuar gjërat ndërtojmë 16 grafik të deomodulimit ne fazë
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 12/15
në një faqe të veteme me një frekuencë 0.28 me një rritje të frekuencës prej 0.0025 duke undaluar ne vleren 0.3175
Figura 5 Demodulimi kompleks në fazë
Interpretimi : Grafikët fillojnë me vija me pjerrësi nga e majta në të djathët duke ndryshuargradualisht me pjerrësi nga e djathta në të majtë . Pjerësia relativisht e sheshtë ndodh përfrekuenc 0,3025 (rreshtin i tretë, kolona e dytë). Demodulimn kompleks në fazë e kufizonë
ndërtimin e grafikëve në zonën nga2
në2
. Kjo është arsyeja pse grafiket shfaqen me
disa "thyrje"
Demodulimn kompleks në amplitudë është përdorur për të gjetur një vlerë fillestare të përshtatëshme për amplitudën. Përveç kësaj, ky grafik tregonë nëse amplituda është konstanteose varion mbi gamën e të dhënave në studim. Nëse grafiku është i sheshtë, pra me pjerrësi zero,atëherë është e arsyeshme që në modelin jo-lineare të supozohet një vlerë e amplitudës . Nëse pjerrësi ndryshon në grafik, atëherë lind nevoja për rregullimin e modelit. Modeli i rregulluar dotë ketë pamjen
0 1 sin 2i i i iY C B B T T E
Duke e zvëndësuar me një funksion të kohës. Në modelin e mësipërm është specifikuar një përshtatje lineare, por kjo përshtatje nëse është e nevojshme mund të zvëndësohet me njëfunksion më të përpunuar
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 13/15
Figure 6 Demodulimit kompleks ne amplitudë
Grafiku demodulimit kompleks ne amplitudë për këto të dhëna tregojnë:
1. Amplituda është fiksuar afërsisht në vlerën 3902. Ka një ndryshim të amplitudës në x=160, çka tregon se duhet parë për ndonjë outlier.Duke përdorur përafrimet fillestare,0.3025 për frekuencën, 390 për amplitudën dhe -177.44 për CPërcaktojmë parametrat e mëposhtëm
Coefficient Estimate Stan. Error t-ValueC -178.786 11.02 -16.22
AMP -361.766 26.19 -13.81
FREQ 0.302596 0.1510E-03 2005.00 PHASE 1.46536 0.4909E-01 29.85
Residual Standard Deviation = 155.8484
Residual Degrees of Freedom = 196
Nga rezultatet e marra , modeli i propozuar është:
178.786 361.766 2 (0.302596)T 1.46536i iY
-Vlefshmëria e modelit të përftuar
Hapi i parë në vlerësimin e modeli është gjenerimi i katër grafikëve të mbetjes.
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 14/15
Interperetimet.1.Grafiku i parë (majtas sipër) tregon se të dhënat nuk kanë ndonjë zhvendosje të
theksuar në "zonë" ose variancë me kalimin e kohës. Megjithatë gjejmë disa
zhvendosje në shkallë. Përvec kësaj në grafik shfaqen dhe disa outlier.
2. Grafiku "lag plot " tregon se të dhënat janë të rastit.Akoma më tej ky grafik
tregon praninë e e disa outlierve.
3.Histogram (majtas posht) dhe ndertim i shperndarjes propabilitare normale
(poshte djathtas) nuk shfaqin shkelje përsa i përket supozimit se të dhënat janë
rastësore .Megjithatë, përkulja në pjesën e majtë të grafikut të shperndarjes
propabilitare normale jep disa arsye për t'u shqetësuar.
Megjithatë katër grafikët e mësipërm tregojn se modeli i gjetur është i përshtatshëm.
Megjithatë, ne do të përpiqemi për të përmirësuar atë duke elminuar vlerat
outlier.
Vlerësim e parametrave të mëposhtëm janë përftuar pas eleminimit të vlerave
outlier.
Coefficient Estimate Stan. Error t-ValueC -178.788 10.57 -16.91
AMP -361.759 25.45 -14.22 FREQ 0.302597 0.1457E-03 2077.00 PHASE 1.46533 0.4715E-01 31.08
Residual Standard Deviation = 148.3398 Residual Degrees of Freedom = 193
7/18/2019 Metoda e Bazuar Ne Fushen e Frekuencave
http://slidepdf.com/reader/full/metoda-e-bazuar-ne-fushen-e-frekuencave 15/15
Në modelin origjinal, kemi një gabim të devijimi standartë 155.84,
178.786 361.766 2 (0.302596)T 1.46536i iY
Modeli përftuar pas eleminimit të vlerave outlier ka një gabim të devijimit standart 148.3398
178.788 361.759[2 (0.302597)T 1.46533]i i
Y
Ka një ndryshim minimal në vlerësimet e parametrave dhe një reduktim me 5% të gabimit tëdevijimit standart . Në këtë rast, kemi një përfitim modest në drejtim të reduktimit të
ndryshueshmërisë së modelit.
Këta grafik tregojn se supozimet themelore plotësohen dhe për këtë arsye modeli i ri është një
përshkrues i mirë i të dhënave në studim.