38
Skaitinės charakteristikos

Skaitinės charakteristikos

Embed Size (px)

DESCRIPTION

Skaitinės charakteristikos. Aprašančios statistikos. Absoliučios statistikos arba padėties statistikos [ statistics of location ] aritm.vidurkis, max ir min, mediana, moda aprašo padėtį skaičių ašyje bet neaprašo formos. - PowerPoint PPT Presentation

Citation preview

Page 1: Skaitinės charakteristikos

Skaitinės charakteristikos

Page 2: Skaitinės charakteristikos
Page 3: Skaitinės charakteristikos
Page 4: Skaitinės charakteristikos

Aprašančios statistikos

A. Absoliučios statistikos arba padėties statistikos [statistics of location]

• aritm.vidurkis, max ir min, mediana, moda• aprašo padėtį skaičių ašyje • bet neaprašo formos. A. Santykinės statistikos arba sklaidos statistikos

[statistics of dispersion] • dispersija, vid.kv.nuokrypis, asimetrija, ekscesas,

pasiskirstymo plotis [range]• aprašo formą

Page 5: Skaitinės charakteristikos

Laužtė su visomis padėties statistikomis

empiriniai dažniai

0

20

40

60

80

100

120

140

1,00 1,50 2,00 2,50 3,00 3,50

dulkinės ilgis, mm

da

žnis

, vn

t.

empiriniai dažniai

Page 6: Skaitinės charakteristikos
Page 7: Skaitinės charakteristikos

Laužtė su vidurkiu ir minimumu bei maksimumu

-20

0

20

40

60

80

100

120

140

1,00 1,50 2,00 2,50 3,00 3,50

dulkinės ilgis, mm

da

žnis

, vn

t.

empiriniai dažniai Vidurkis Range

Page 8: Skaitinės charakteristikos

Laužtė su visomis padėties statistikomis

-20

0

20

40

60

80

100

120

140

1,00 1,50 2,00 2,50 3,00 3,50

dulkinės ilgis, mm

da

žnis

, vn

t.

empiriniai dažniai Vidurkis Mediana 25% kvartilis 75% kvartilis IQR Range

Page 9: Skaitinės charakteristikos

Box and Whisker

Median = 2,9 25%-75% = (2,65, 3,1) Min-Max = (1,4, 3,3)

DULK1_IL1,2

1,4

1,6

1,8

2,0

2,2

2,4

2,6

2,8

3,0

3,2

3,4

Page 10: Skaitinės charakteristikos

Dvimatis taškinis grafikas (scatterplot) su prišlietinėmis histogramomis

Page 11: Skaitinės charakteristikos

Dvimatis taškinis grafikas (scatterplot) su prišlietiniais box-and-whiskers grafikais

Page 12: Skaitinės charakteristikos

Aritm.vidurkio, medianos ir modos lyginimas

Labiausiai vartojamas vidurkis, kadangi:a) jo standartinė paklaida yra mažiausia iš visų vietos

statistikų,b) jo skaičiavimai lengviausi,c) jis pats linkęs barstytis normaliai, nors skirstinys gali būti

nenormalus.• Vidurkio trūkumai - ji labai veikia nukrypusios vertės, o

medianą ir modą jos veikia mažai.• Vidurkis yra jautresnis skirstinio formos pokyčiams, todėl

labiau tinka, kai norima atsižvelgti į skirstinio formą.• Vienviršūnių, simetriškų skirstinių vidurkis, mediana ir

moda sutampa. Pvz., normalusis skirstinys.• Vienviršūnių asimetriškų skirstinių (lognormaliojo tipo)

vidurkis būna arčiausiai ilgosios uodegos, moda - toliausiai nuo jos, mediana - tarp vidurkio ir modos.

Page 13: Skaitinės charakteristikos

Nuokrypiai: paprastasis nuokrypis

• Rodo nuokrypį nuo vidurkio nuokrypis (deviate):• Paprastų nuokrypių suma visada lygi 0, kadangi

vidurkis - svorio centras. • Nenaudojamas kaip bendra sklaidos

charakteristika.

Page 14: Skaitinės charakteristikos

Nuokrypiai: Vidutinis absoliutus nuokrypis

• Angl. average deviation • Jis nebūna lygus nuliui. • Kažkada labai populiarus, dabar nebenaudojamas,

jį nukonkuravo vidutinis kvadratinis nuokrypis.

Page 15: Skaitinės charakteristikos

Nuokrypiai: Vidutinis kvadratinis nuokrypis

• Angl. standard deviation (SD)• Liet. dar vadinamas standartiniu nuokrypiu• Susijęs su dispersija.

Page 16: Skaitinės charakteristikos

Box and whiskers plot

Mean = 2,797 ±SD = (2,4185, 3,1755) ±1,96*SD = (2,0551, 3,5389)

VAR91,8

2,0

2,2

2,4

2,6

2,8

3,0

3,2

3,4

3,6

Page 17: Skaitinės charakteristikos

Dvimatis taškinis grafikas (scatterplot) su prišlietiniais medianų ir kvartilių grafikais

Scatterplot with Box Plots (Mieziai 1 10v*468c)

1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4

DULK1_IL

1,0

1,2

1,4

1,6

1,8

2,0

2,2

2,4

2,6

2,8

3,0

3,2

3,4

3,6

DU

LK

2_

IL

Page 18: Skaitinės charakteristikos

Dvimatis taškinis grafikas (scatterplot) su prišlietiniais vidurkių ir vid.kv.nuokrypių grafikais

Scatterplot with Box Plots (Mieziai 1 10v*468c)

1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4

DULK1_IL

1,0

1,2

1,4

1,6

1,8

2,0

2,2

2,4

2,6

2,8

3,0

3,2

3,4

3,6

DU

LK

2_

IL

Page 19: Skaitinės charakteristikos

Ką apie duomenis sako Sx?

• [+1·σx  ; - 1·σx ] apima 68.27% duomenu.

• [+2·σx  ; -2·σx ] apima 95.45% duomenu

• [+3·σx  ; -3·σx ] apima 99.73% duomenu.

• 50% duomenu yra intervale 0.674·σx.

• 90% duomenu yra intervale 1.960·σx.

• 95% duomenu yra intervale 2.576·σx.

Page 20: Skaitinės charakteristikos

[+1·σx  ; - 1·σx ]

apima 68.27% duomenų

Page 21: Skaitinės charakteristikos

[+2·σx  ; -2·σx ]

apima 95.45% duomenų

Page 22: Skaitinės charakteristikos

[+3·σx  ; -3·σx ]

apima 99.73% duomenų

Page 23: Skaitinės charakteristikos

Sx naudingumas

• Xvid=64 cm

• Sx=17 cm

• Vadinasi, intervale [64-17 cm; 64+17 cm] yra ~68% duomenų

Page 24: Skaitinės charakteristikos

Dispersija

• Angl. variance• Paprastai naudojama kaip tarpinis dydis

skaičiavimuose.• Nepatogi, nes:• miglota biologinė/fizinė prasmė (dimensija

kvadratu)• dažnai yra labai didelis ar labai mažas skaičius

(nes skaičiuojama per nuokrypio kvadratus)

Page 25: Skaitinės charakteristikos

Nepaslinktosios statistikos

• Angl. unbiased statistics

• Nepaslinktosios statistikos požymis: Paėmus daug to pat dydžio imčių iš tos pačios generalinės aibės, šių imčių statistikų vidurkis lygus atitinkamam generalinės aibės parametrui.

• Pvz.: xix

Page 26: Skaitinės charakteristikos

Paslinktosios statistikos• Angl. biased statistics

• Paslinktosios statistikos požymis: Paėmus daug to pat dydžio imčių iš tos pačios generalinės aibės, šių imčių statistikų vidurkis nelygus atitinkamam generalinės aibės parametrui.

• Pvz.

xxiS

Page 27: Skaitinės charakteristikos

Paslinktosios statistikos

• Paslinktosios statistikos „paslinktai“ atspindi atitinkamą generalinės aibės parametrą.

• Norint gauti įvertį, artimesnį atitinkamam generalinės aibės parametrui, reikia specialių pataisų.

Page 28: Skaitinės charakteristikos

Pataisos

• Dispersijai – Beselio pataisa:

• Todėl

122*

n

nSS xx

1

)( 2*2

n

xxS ix

Page 29: Skaitinės charakteristikos

PataisosVidutinis kvadratinis

nuokrypis:

• Beselio pataisa

)5.0(21

21

5.0

n

nn

Cn

• Gurlando-Tripathio pataisa (Gurland, Tripathi, 1971)

Ši pataisa mažai reikšminga mažoms imtims (C5=1,0638;

C30=1.0086)

1

)( 2*

n

xxS ix

Page 30: Skaitinės charakteristikos

Variacijos koeficientas (1)

• Angl. coefficient of variation x

SV xx

vartojant šią pataisą Vx turi būti skaičiuojamas iš Sx be pataisos Cn.

• Vx pataisa svarbi, kai imtys mažos.

x*x V

n4

11V

Page 31: Skaitinės charakteristikos

Variacijos koeficientas (2)

• Neturi dimensijos

• Leidžia palyginti dviejų imčių išsibarstymą apie vidurkį – net skirtingų požymių imčių (nepriklausomai nuo matavimo vienetų)

Page 32: Skaitinės charakteristikos

Variacijos koeficientas (3)

Variacijos koeficiento biologinė prasmė: mažos reikšmės leidžia spėti, kad

a) tai evoliucijos griežtai ribojamas požymis,

b) tai homeostazės griežtai ribojamas požymis.

Page 33: Skaitinės charakteristikos

Variacijos koeficientas (4)

0

5

10

15

20

25

-30,00 -20,00 -10,00 0,00 10,00 20,00

dulkinės ilgis, mm

da

žnis

, vn

t.

empiriniai dažniai Vidurkis

Vx=1933,9%

Page 34: Skaitinės charakteristikos

Asimetrijos koeficientas (1)

• Angl. skew

• Rodo asimetriją

3x

n

1i

3i

1 sn

xxg

Page 35: Skaitinės charakteristikos

0

5

10

15

20

25

-30,00 -20,00 -10,00 0,00 10,00 20,00

dulkinės ilgis, mm

da

žnis

, vn

t.

empiriniai dažniai Vidurkis

Asimetrijos koeficientas (2)

g1=-0,45

Page 36: Skaitinės charakteristikos

Asimetrijos koeficientas (3)empiriniai dažniai

0

20

40

60

80

100

120

140

0,00 0,50 1,00 1,50 2,00 2,50

dulkinės ilgis, mm

da

žnis

, vn

t.

empiriniai dažniai

g1=2,38

Page 37: Skaitinės charakteristikos

Ekscesas • Angl. kurtosis

3

sn

xxg

4x

n

1i

4i

2

• Formulėje

atimamas 3 tam, kad normaliojo skirstinio ekscesas būtų lygus 0.

• Rodo skirtinio bukumą/smailumą ar dviviršūniškumą

Page 38: Skaitinės charakteristikos

• Asimetrija ir ekscesas yra paslinktos statistikos, tad jų pataisos – daugikliai:

• asimetrijai –

• ekscesui -

Asimetrijos koef. ir ekscesas – paslinktos statistikos

)2)(1(

2

nn

n

)3)(2)(1(

)1(2

nnn

nn