Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
7.GAIA. ESTATISTIKA DESKRIBATZAILEA
1. Orokortasunak.
2. Datuen antolaketa. Aldagai estatistiko baten banaketak.
2.1. Definizioak.
2.2. Maiztasun-taulak.
2.2.1. Tartetan elkartuta ez dagoen aldagai estatistiko baten
maiztasun-taula.
2.2.2. Tartetan elkartuta dagoen aldagai estatistiko baten
maiztasun-taula.
3. Adierazpide grafikoak.
3.1. Tartetan elkartuta ez dauden datuak.
3.2. Tartetan elkartuta dauden datuak.
4. Zentro-joeraren neurriak.
5. Posizioko neurriak edo posizioko indizeak.
6. Sakabanatze-neurriak.
7. Asimetri eta zapaltasun-zorroztasun neurriak.
7.1. Banaketa simetrikoak.
7.2. Banaketa asimetrikoak.
7.3. Asimetri koefizienteak.
1
7.GAIA. ESTATISTIKA DESKRIBATZAILEA
Estatistikari buruz hitz egitean, kontzeptu-mailan, bi arlo handi bereizi behar ditugu:
ESTATISTIKA DESKRIBATZAILEA
ESTATISTIKA INFERENTZIALA
Estatistika deskribatzaileak, elementu-multzo bati dagozkion datuak bildu, laburtu eta des-
kribatzea du helburu.
Estatistika inferentzialak, lagin batean lortutako emaitzak ikertuko den populaziora orokortzea
du helburu. Orokorpen hau egiteko probabilitatearen teoria erabiltzea beharrezkoa izango da.
Bien arteko ezberdintasuna garbia da, hauteskundeetako inkesten adibidea hartzen badugu.
Hauteskundeen aurretik eginiko galdeketa guztiak estatistika inferentzialaren barruan sartuko
lirateke, hauteskundeen hurrengo egunean aztertutako emaitzak, estatistika deskribatzailea-
ren barruan sartuko genituzkeen bitartean.
Estatistika deskribatzaileaz ari garenean, azterketa-gai diren elementu guztien datuak edukitzeko
egoeran gaude.Estatistika inferentzialaz ari garenean, berriz, ez da hau gertatzen. Ondorioz,
beti POPULAZIOA eta LAGINA bereizi beharko ditugu.
1. OROKORTASUNAK
Populazio estatistikoa edo kolektiboa.
Azterketa estatistikoaren helburuak diren elementuen multzoari populazioa deituko diogu.
Populazioa ondo definitzeko edozein elementu partikular populaziokoa den ala ez jakin ahal
izatea beharrezkoa zaigu. Populazioak finituak ala infinituak izan daitezke populazioa osatzen
duten elementuen arabera.
Unitate estatistikoa edo indibiduoa.
Populazioa osatzen duen elementu bakoitzari unitate estatistiko edo indibiduo deitzen diogu.
Indibiduo izena, estatistika deskribatzailearen jatorri demografikoari zor diogu.
2
Lagina.
Populazioaren azpimultzo bat da. Populazioko elementu guztien behaketa zaila edo garestia
denean, lagin bat hartzen da. Lagina osatzen duten elementuen kopuruari laginaren tamaina
deritzo.
Errolda edo Zentsua.
Populazio estatistikoaren elementu guztiak behatzen direnean errolda bat egiten dugula esa-
ten da. Adibidez, botazio edo hauteskunde bat egiten denean, gero errolda edo zentsu bat
egiten dugu emaitza aztertzeko.
Ezaugarriak.
Aztertzen den populazioaren elementuen propietateak dira. Ezaugarri batzuk neurtu dai-
tezke, adibidez, pertsonen adina, pisua eta altuera. Baina beste ezaugarri batzuk ezin dira
neurtu, adibidez, sexua, profesioa edo begien kolorea. Lehenengoei ezaugarri kuantitatiboak
esaten zaie eta bigarrenei ezaugarri kualitatiboak.
Modalitateak.
Ezaugarri batek aurkez ditzakeen erak edo egoerak dira. Adibidez, “egoera zibila” ezaugarri
kualitatiboak ondorengo modalitateak aurkezten ditu: ezkondua, ezkongabea, alarguna, ...
“Pisua” ezaugarri kuantitatiboak, aldiz, ondorengo modalitateak har ditzake: 50 kilo, 65 kilo
eta abar.
Aldagai estatistikoak.
Ezaugarri kuantitatibo baten modalitate desberdinek hartzen duten zenbakizko balioei alda-
gai estatistikoa esaten zaie. Aldagai estatistikoak modu honetan sailka daitezke:
a)Aldagai estatistiko diskretuak. Modalitateek hartzen dituzten balioak zenbaki diskretuak
dira. Beti balio batek bere hurrengoa edukiko du. Hau da, ondoz ondoko bi balioren ar-
tean ezin du tarteko baliorik egon. Adibidez, kurtso baten ikasgai-kopurua edo ikastegi baten
ikasle-kopurua.
3
b) Aldagai estatistiko jarraituak. Tarte batean infinitu balio har ditzakeenean. Hau da, bi
edozein balioren artean, nahiz eta oso hurbilak izan, tarteko infinitu balio daude. Adibidez,
denboraren neurketa, pertsonen pisua, eta abar.
2. DATUEN ANTOLAKETA. ALDAGAI ESTATISTIKO BATEN BANA-
KETAK
2.1. DEFINIZIOAK
Populazio edo lagin baten behaketan lortutako datuen zenbakizko multzoak antolatu eta
egituratuko ditugu.
X aldagai estatistiko batek x1, x2, ..., xk balio desberdin har ditzake baina hauetariko ba-
koitza behin baino gehiagotan ager daiteke. x1, x2, ..., xk balioak txikienetik handienera
ordenaturik kontsideratuko dira. Hots: x1 < x2 < ... < xi < ... < xk.
Ibiltartea.
Aldagaiak hartzen dituen balio handienaren eta txikienaren arteko diferentzia da. Adibidez,
gaixo baten tenperatura 35o eta 42o graduen artean aldatzen dela suposatzen badugu, ibil-
tartea 42− 35 = 7 izango litzateke.
Maiztasun absolutua (ni).
X aldagai estatistikoaren xi balioaren maiztasun absolutua, sinbolikoki ni ikurraren bidez
adieraziko dugu, xi balioa hartzen duten indibiduoen kopurua da.
Populazioaren edo laginaren tamaina N bada, ondokoa bete behar da:
k∑i=1
ni = n1 + n2 + ... + nk = N.
Maiztasun erlatiboa (fi).
X aldagai estatistikoaren xi balioaren maiztasun erlatiboa, sinbolikoki fi ikurraren bidez
adieraziko dugu, maiztasun absolutuaren eta egindako behaketa-kopuruaren arteko zatidura
4
da. fi =ni
N.
Maiztasun hauek ondoko propietateak betetzen dituzte:
•k∑
i=1
fi = f1 + f2 + ... + fk =n1
N+
n2
N+ ... +
nk
N=
1
N
k∑i=1
ni =N
N= 1.
• Aldagaiaren xi balio bati dagokion portzentaia, maiztasun erlatiboa 100 zenbakiaz bi-
derkatuz lortzen da: (%)xi= fi × 100.
Maiztasun absolutu metatua (Ni).
xi balioaren maiztasun absolutu metatua, sinbolikoki Ni, xi baino txikiagoak edo berdinak
diren balioen maiztasun absolutuen batura da. Hots, Ni = n1 + n2 + ... + ni.
xi balioak txikienetik handienera ordenaturik daudenez, azkenengo balioaren maiztasun ab-
solutu metatua N izango da. Hots, Nk = n1 + n2 + ... + nk = N . Ondoko hau ere betetzen
da: Ni = Ni−1 + ni , beraz, ni = Ni −Ni−1.
Maiztasun erlatibo metatua (Fi).
xi balioaren maiztasun absolutu metatua, sinbolikoki Fi, maiztasun absolutu metatuaren eta
egindako behaketa-kopuruaren arteko zatidura da:
Fi =Ni
N=
n1 + n2 + ... + ni
N=
n1
N+
n2
N+ ... +
ni
N= f1 + f2 + ... + fi.
Nabaria da Fk =Nk
N=
N
N= 1 betetzen dela.
2.2. MAIZTASUN-TAULAK
Populazio edo lagin baten behaketa egiterakoan ondorengo kasuak ager daitezke:
1) Behaketa gutxi egin dira, beraz, aldagai estatistikoak balio gutxi hartzen ditu.
2) Behaketa asko egin dira, hala ere, aldagai estatistikoak balio desberdin gutxi hartzen ditu.
Kasu honetan balioen errepikapen asko daude.
3) Behaketa asko egin dira eta aldagai estatistikoak balio desberdin asko hartzen ditu, beraz,
aldakortasun-eremua oso zabala da.
5
Lehenengo bi kasuak tartetan elkartuta ez dagoen aldagai estatistiko baten azterketan
sartuko ditugu, baina hirugarren kasuan aldagai estatistikoaren balioak ahal den informazio
gutxien galtzeko helburuaz, aukeratutako tartetan elkartuko ditugu.
2.2.1. Tartetan elkartuta ez dagoen aldagai estatistiko baten maiztasun-taula.
Suposa dezagun N behaketa ditugula. Izan bedi x1, x2, ..., xk k balio desberdin hartzen
dituen X aldagai estatistikoa eta x1 < x2 < ... < xi < ... < xk.
Aldagai estatistikoa tartetan elkartuta ez dagoenean, bere maiztasun-taula aldagaiaren balio
desberdinak eta ni, fi, Ni, Fi maiztasunak adieraziz lortzen da.
xi ni fi Ni Fi
x1 n1 f1 N1 F1
x2 n2 f2 N2 F2
......
......
...
xk nk fk Nk Fk
ADIBIDEA. Ikasle-talde batean lortutako puntuazio finalak, 0 eta 5 puntuen artean, on-
dokoak izan dira: 0, 0, 5, 3, 0, 1, 3, 3, 4, 5, 5, 0, 3, 0, 4, 4, 2, 1, 2, 5. Datu hauek maiztasun-taula
batean adierazi.
xi ni fi Ni Fi
0 5 5/20 5 5/20
1 2 2/20 7 7/20
2 2 2/20 9 9/20
3 4 4/20 13 13/20
4 3 3/20 16 16/20
5 4 4/20 20 20/20 = 1
2.2.2. Tartetan elkartuta dagoen aldagai estatistiko baten maiztasun-taula.
Aldagaiak hartzen dituen balioen kopurua handia denean balioak tartetan elkartuko ditugu
eta tarte bakoitzean sartzen diren balioen kontaketa egingo dugu. Azterketaren unitateak
bezala tarteak kontsideratzen baditugu eta ez aldagaiaren balioak, argi dago gure lanaren
6
sinplifikazio bat lortzen dugula baina zoritxarrez informazioa ere galtzen dugu. Horregatik,
bi alde hauek orekatzen dituen tarte-kopuru bat aukeratu behar dugu. Tarte bakoitzean goi-
muturraren eta behe-muturraren arteko diferentziari tartearen zabalera esaten zaio. Honen
arabera bi kasu bereiztuko ditugu:
a) zabalera berdineko tarteak.
b) zabalera desberdineko tarteak.
Normalean tarteak zabalera berdinekoak hartzen dira, hala ere batzuetan problemaren bal-
dintza orokorrak direla eta, komenigarria izan daiteke zabalera desberdineko tarteak kontsi-
deratzea, horrela datuen adierazpena argiagoa izatea lortzen badugu. (Adibidez, tarte txikiak
maiztasunak handiak direnean eta tarte handiagoak maiztasunak txikiagoak direnean).
Tarteen aukera.
Tarte bakoitzarako zabalera bat aukeratuko dugu eta aldagaiaren ibiltarte ososa estaltzeko
behar diren tarte gainjarriak kontsideratuko dira. Tarteak erdiirekiak, hau da [a, b) mota-
koak, izango dira eta [a, b) tarteari dagozkion datuak a baino handiagoak edo berdinak eta b
baino txikiagoak izango dira. Horregatik, azken tartearen goi-muturrak aldagaiaren baliorik
handiena baino handiagoa izan behar du.
Adibidea. 26 haurren adinak hartu ditugu eta lortutako datuak ondokoak dira:
3, 7, 10, 10, 6, 5, 4, 12, 11, 10, 15, 10, 6, 2, 10, 9, 10, 8, 15, 13, 14, 12, 7, 10, 6, 8
tarteak barruan dauden balioak ni maiztasunak
[2− 6) 3, 5, 4, 2 4
[6− 10) 7, 6, 6, 9, 8, 7, 6, 8 8
[10− 14) 10, 10, 12, 11, 10, 10, 10, 10, 13, 12, 10 11
[14− 16) 15, 15, 14 3
Tarte-ordezkariak.
Tarte baten tarte-ordezkaria tartearen erdiko puntua bezala definitzen dugu, eta tarte horrek
duen informazioa adierazten digun balioa da.
Horrela, tarte bakoitza balio batera (tarte-ordezkaria) mugatzen dugu. Tarte bakoitzean
sartzen diren balioen kopurua bakarrik hartzen dugu kontuan eta ez balioen kokapena. Beste
7
modu batean esanda, balioen banaketa tartearen barruan homogeneoa dela suposatzen dugu
eta honek informazio-galera bat ekartzen digu.
0r2
r4
r5 8.2
r8.3
r8.4r8.5
r8.9
r9.5
r9.7
rr9 10
Irudian ikusten dugu 2, 4, 5, 8.2, 8.3, 8.4, 8.5, 8.9, 9, 9.5, 9.7 balioak elkartzen baditugu, gu-
retzat 0 eta 10 bitartean dauden 11 balio izango direla eta horrela horietariko 8 10-etik oso
hurbil daudelako informazioa galdu egiten dugula.
Tarteen kopurua, zabalera berdinekoak hartu ala ez, ... azterketa bakoitzean erabaki beha-
rreko gauzak dira.
Maiztasun-taula.
Tarteak Tarte-ordezkariak
xi ni fi Ni Fi
[a0 − a1) x1 n1 f1 N1 F1
[a1 − a2) x2 n2 f2 N2 F2
......
......
......
[al−1 − al) xl nl fl Nl Fl
ADIBIDEA. Ondoko maiztasun-taulak enpresa bateko 65 langileren asteko soldatak, eurotan
neurtuta, adierazten digu.
Tarteak Tarte-ordezkariak
xi ni fi Ni Fi
[250− 260) 255 8 0.123 8 0.123
[260− 270) 265 10 0.154 18 0.277
[270− 280) 275 16 0.246 34 0.523
[280− 290) 285 14 0.215 48 0.738
[290− 300) 295 10 0.154 58 0.892
[300− 310) 305 5 0.077 63 0.969
[310− 320) 315 2 0.031 65 1.000
8
3. ADIERAZPIDE GRAFIKOAK
Lortutako informazio guztia grafikoki adierazteak asko lagunduko digu datuak ikusarazten
eta ulertzen.
3.1 TARTETAN ELKARTUTA EZ DAUDEN DATUAK
Barra-diagrama.
Abzisa-ardatzean aldagaiaren balio desberdinak ezarriko ditugu eta balio bakoitzean lerro
elkartzut bat marrazten da, non lerro honen altuera balioaren maiztasuna (absolutua edo
erlatiboa den). Horrela lerro bertikalen multzo bat lortzen dugu non lerroen luzeren batura
N edo 1 den, adierazitako maiztasunak absolutuak ala erlatiboak diren arabera.
-
6Maiz. absolutua
xi
ni
-
6Maiz. erlatiboa
xi
fi
Maiztasun-poligonoa edo maiztasun-diagrama.
Maiztasun-poligonoa barra-diagraman barren goi-muturrak lotuz lortzen da.
-
6
����HHHH
JJJJ
Maiz. absolutuak
x-
6
����HHHH
JJJJ
Maiz. erlatiboak
x
9
Maiztasun metatuen poligonoa edo maiztasun metatuen diagrama.
Abzisa-ardatzean aldagaiaren balio desberdinak ezarriko ditugu eta balio bakoitzean lerro el-
kartzut batmarrazten da, non lerro honen altuera balioaren maiztasun metatua (absolutua
edo erlatiboa den). Hau da, xi abzisak Ni (Fi) ordenatua izango du. Modu honetan barra-
diagrama gorakor bat agertuko da. Barra-mutur bakoitzetik marra horizontal bat egiten da
eskuinean dagoen barra ebaki arte.
-
6Maiz. abs. metatuak
aldagaia
Ni
-
6Maiz. erl. metatuak
aldagaia
Fi
3.2. TARTETAN ELKARTUTA DAUDEN DATUAK
Histograma.
Aldagaiak tartetan elkartuta daudenean maiztasunak azaleren bidez adieraziko ditugu. Tarte
bakoitza oinarritzat harturik, laukizuzen bat eraikitzen da non laukizuzenaren azalera tar-
tearen maiztasuna (absolutua edo erlatiboa) den. Beraz, laukizuzenaren altuera maiztasun
(absolutua edo erlatiboa) zabaleraz zatituz kalkulatuko dugu.
-
6
ni
h = nc
tarteakci
-
6
fi
h = fc
tarteakci
10
Maiztasun-poligonoa edo maiztasun-diagrama.
Maiztasun-poligonoa histograman laukizuzenen goiko oinarriko erdiko puntuak marra batez
lotuz eraikitzen da. Lehenengo puntua lehenengo tartearen behe-muturrarekin lotzen da. Az-
kenengo puntua azkenengo goi-muturrarekin lotzen da, goi-muturra eta behe-muturra abzisa-
ardatzean kontsideratuz.
-
6h = n
c
tarteak��������HH
@@@@@ -
6h = f
c
tarteak��������HH
@@@@@
Maiztasun metatuen poligonoa edo maiztasun metatuen diagrama.
Abzisa-ardatzean gainjarriak diren tarte desberdinak adieraziko ditugu. Tarte bakoitzaren
goi-muturrean lerro elkartzut bat marrazten da, non lerro honen altuera tarte horren maiz-
tasun metatua (absolutua edo erlatiboa) den. Modu honetan barra-diagrama gorakor bat
lortzen da eta bere muturrak lotuz maiztasun metatuen poligonoa edo maiztasun metatuen
diagrama lortuko dugu.
Poligonoa maiztasun absolutu metatuen poligonoa baldin bada bere altuera maximoa az-
ken errektangeluan lortuko da eta N izango da. Aldiz, poligonoa maiztasun erlatiboen poli-
gonoa baldin bada, bere altuera maximoa azken errektangeluan ere lortuko da eta 1 izango da.
-
6
��������
�
��
Ni
Maiz. abs. metatua
Tarteakai−1 ai
-
6
��������
�
��
Fi
Maiz. erl. metatua
Tarteakai−1 ai
11
4. ZENTRU-JOERAREN NEURRIAK
Neurri hauei sarritan ezartzen zaien funtzioetako bat, aztertzen ari garen aldagaia ordez-
katzea da, hau da, aztertzen ari garen aldagaiaren ordezkari izan nahi luketen balioak dira.
Baina laburketa guztiei informazio-galtze bat dagokie eta hau kontuan izan beharko dugu
neurri bakoitza aztertzerakoan. Horregatik, zentru-joeraren neurriak edo estatistikoak beste
estatistiko batzuekin (sakabanatzearenak, ...) osatzen dira, aztertzen ari garen populazio edo
laginaren ideia errealagoa nahi baldin badugu.
Suposa dezagun X aldagai estatistikoak x1, x2, ..., xk balioak hartzen dituela eta n1, n2, ..., nk
aurreko balioei dagozkien maiztasun absolutuak direla, hurrenez hurren.
Batezbesteko aritmetikoa (x̄).
x̄ =x1n1 + x2n2 + ... + xknk
N=
k∑i=1
xini
N=
k∑i=1
xifi.
Aldagaiak hartzen dituen balio guztiak desberdinak badira, aldagaiaren balio bakoitza behin
bakarrik agertuko da, x1, x2, ..., xk.
x̄ =x1 + x2 + ... + xk
k=
k∑i=1
xi
k.
Batezbesteko geometrikoa (x̄G).
x̄G = N
√xn1
1 xn22 ...xnk
k
Kalkulu hau korapilatsu samar denez, logaritmoak hartuz kalkulatzen da:
x̄G = (xn11 xn2
2 ...xnkk )1/N ⇒ ln x̄G = ln(xn1
1 xn22 ...xnk
k )1/N
ln x̄G =1
N[ln(x1)
n1 + ln(x2)n2 + ... + ln(xk)
nk ] =1
N
k∑i=1
ni ln xi
eta esponentzialak hartuz ondokoa lortzen da
x̄G = e
k∑i=1
ni ln xi
N .
12
Aldagaiaren balioren bat zero baldin bada batezbesteko geometrikoa zero izango da eta ez da
adierazgarria izango.
Batezbesteko koadratikoa.
x̄Q =
√x2
1n1 + x22n2 + ... + x2
knk
N=
k∑
i=1
x2i ni
N
1/2
.
Batezbesteko harmonikoa.
x̄A =N
n1
x1
+n2
x2
+ ... +nk
xk
=N
k∑i=1
ni
xi
.
Aldagaiaren balioren bat zero baldin bada, batezbesteko harmonikoak ez du zentzurik.
Emandako batezbestekoen arteko erlazioa ondokoa da:
x̄A ≤ x̄G ≤ x̄ ≤ x̄Q.
Mediana (Me).
Aldagaiaren balio-multzoa txikienetik handienera ordenatzen badugu, mediana baino txikia-
goak eta mediana baino handiagoak diren balioen kopuruak berdinak dira.
Balio bakoitzaren maiztasuna 1 baldin bada, medianaren kalkulua oso erraza da. Adibidez,
X = 1, 3, 8, 15, 17, 25, 29 baldin bada, orduan medianaren balioa 15 da.
Balioen kopurua bikoitia baldin bada, adibidez X = 1, 3, 8, 15, 17, 25 bada, orduan media-
na bezala bi balio zentralen batezbesteko aritmetikoa kontsideratuko dugu. Hau da,
Me =8 + 15
2= 11.5.
Orain medianaren kalkulua aztertuko dugu kasu orokorrean eta horretarako aldagaia tar-
tetan elkartuta dagoenean eta tartetan elkartuta ez dagoenean bereiztuko dugu.
13
Tartetan elkartuta ez dagoen aldagai estatistiko baten medianaren kalkulua.
• N behaketa-kopurua zati 2 egiten dugu.
• Lortutako N/2 balioa maiztasun absolutu metatuen taulako Ni balio bat den ala ez
aztertuko dugu.
• N/2 maiztasun absolutu metatuen taulako Ni balio bat bada, orduan N/2 ordenatua
(xi, xi+1) tarteko infinitu puntuei dagokie. Medianak puntu bat izan behar duenez,
aipaturiko tartearen erdiko puntua izango da.
Me =xi + xi+1
2
-
6Maiz.abs.metatuak
X
N/2
xi xi+1
Me
• Taularen balio bat ez bada, taularen bi balioren artean egongo da, hau da N/2 ∈ (Ni, Ni+1)
eta mediana N/2 balioari dagokion abzisa izango da.
-
6Maiz.abs.metatuak
x
Ni+1
Ni
N/2
xi xi+1
Me
Tartetan elkartuta dagoen aldagai estatistiko baten medianaren kalkulua.
• N behaketa-kopurua zati 2 egiten dugu.
• Lortutako N/2 balioa maiztasun absolutu metatuen taulako Ni balio bat den ala ez
aztertuko dugu.
14
• N/2 maiztasun absolutuen taularen Ni balio bat bada, N/2 = Ni, orduan [ai−1, ai) tarte
baten maiztasun absolutu metatua izango da eta mediana tartearen goi-muturra izango
da, Me = ai.
-
6
���������
��
N/2
Maiz.abs.metatuak
Xai−1 ai
• N/2 maiztasun absolutuen taularen Ni balio bat ez bada, [ai−1, ai) eta [ai, ai+1) bi tarteei
dagozkien Ni eta Ni+1 maiztasun absolutu metatuen artean egongo da, beraz mediana
[ai, ai+1) tartean egongo da.
-
6
���������
��
N/2Ni
Ni+1
Maiz.abs.met.
Xai ai+1
-
6
����#####
←→x
N/2
Ni
Ni+1
Maiz.abs.met.
Xai ai+1Me
Medianaren balio zehatza lortzeko interpolazio bat egingo dugu ondoko moduan :
Ni+1 −Ni
ai+1 − ai
=N/2−Ni
x=⇒ x =
N/2−Ni
Ni+1 −Ni
(ai+1 − ai)
eta Me = ai + x izango da.
Moda.
Moda maiztasun handiena duen aldagaiaren balioa da. Banaketak ez du moda bakar bat
izan behar, honela bi moda badaude banaketa bimodala deitzen da, hiru moda badaude
hirumodala, ... orokorki moda anitza deitzen da. Aldagaia tartetan elkartuta dagoenean tarte
modalak erabiliko ditugu. Aldagai baten tarte modala, histograman oinarri unitatearekiko
azalera handiena duen errektangelua dagokion tartea izango da.
15
-
6Maiztasunak
Md aldagaia-
6azalera = maiztasuna
tarte modala
Tarte modalean kokatuko da moda. Tarte modala [a, b) izanez, balio modala estimatzeko
ondoko prozesua jarraituko dugu:
• Tarte modalaren eta aurreko eta ondoko tarteen altueren arteko diferentziak neurtzen
dira. Horrela δ1 eta δ2 balioak lortuko ditugu.
• Hurrengo irudian ikusten da x balioa ezagutuz gero, modaren balioa ezagutuko dugula.
x = (b− a)δ1
δ1 + δ2
=⇒ Moda = a + (b− a)δ1
δ1 + δ2
.
-
6hi = ni
ci
tarteaka b
p p p p p p p p pp p p p p pp p p p pδ1
δ2
Md
←→x
5. POSIZIOKO NEURRIAK EDO POSIZIOKO INDIZEAK
Kuartilak.
Kuartilak aldagaiaren balioak lau zati berdinetan zatitzen dituzten hiru balio dira.
P1/4 P2/4 P3/4
Lehenengo kuartila (P1/4).
Aldagaiaren balioen laurdenak P1/4 baino txikiagoak edo berdinak dira eta hiru laurdenak
bera baino handiagoak. P1/4 kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak
16
egingo ditugu baina hasieran N/2 kontsideratu beharrean N/4 kontsideratuko dugu.
Bigarren kuartila (P2/4).
Aldagaiaren balioen bi laurdenak, hau da behaketen erdia P2/4 baino txikiagoak edo berdinak
dira eta hiru laurdenak bera baino handiagoak. P2/4 = Mediana betetzen da.
Hirugarren kuartila (P3/4).
Aldagaiaren balioen hiru laurdenak P3/4 baino txikiagoak edo berdinak dira eta laurden bat
bera baino handiagoak. P3/4 kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak
egingo ditugu baina hasieran N/2 kontsideratu beharrean3N
4kontsideratuko dugu.
Dezilak.
Aldagaiaren K-garren dezila, Dk, honela definitzen da: Dk balio bat da non aldagaiaren ba-
lioen hamarreko K bera baino txikiagoak edo berdinak diren, K = 1, 2, 3, ..., 9 izanik. Dk
kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak egingo ditugu baina hasieran
N/2 kontsideratu beharrean KN
10kontsideratuko dugu.
Zentilak edo pertzentilak.
Aldagaiaren K-garren zentila edo pertzentila, Pk, honela definitzen da: Pk balio bat da non
aldagaiaren balioen ehuneko K bera baino txikiagoak edo berdinak diren, K = 1, 2, 3, ..., 99
izanik. Pk kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak egingo ditugu baina
hasieran N/2 kontsideratu beharrean KN
100kontsideratuko dugu.
6. SAKABANATZE-NEURRIAK
Datu-multzoaren ideia orokorra ematen ziguten zentru-joeraren neurriek. Ideia hau osatzeko,
zentru-joeraren inguruan datu-multzoa guztiz bilduta edo oso sakabanatuta dagoen adieraz-
ten diguten estatistiko batzuk ere behar ditugu.
Adibidea. Talde baten soldataren batezbestekoa 2000 eurokoa dela esaten bada, honek gutxi
17
balio dezake askok gutxi eta gutxik asko irabazten badute, beste gauza bat litzateke denek
berdin irabaziko balute. Nola jakin denek berdintsu edo askok gutxi eta gutxik asko ira-
bazten duten? Sakabanatze-neurriak erabiliz. Hau da, gure datuak uniformeak zenbateraino
diren edo beraien artean oso hurbil dauden edo oso berezituak dauden ikusi nahi badugu,
sakabanatze-neurriak erabiliko ditugu.
Suposa dezagun X aldagai estatistikoak x1, x2, ..., xk balioak hartzen dituela eta n1, n2, ..., nk
aurreko balioei dagozkien maiztasun absolutuak direla, hurrenez hurren.
Bariantza.
X aldagai estatistikoaren bariantza honela definitzen da.
σ2 =
k∑i=1
(xi − x̄)2ni
N.
σ2 karraturen batura denez, beti positibooa edo nulua izango da. σ2 = 0 baldin bada, orduan
batugai guztiak nuluak dira eta xi guztiak x̄ balioa hartzen dute; beraz, sakabanatze txikiena
izango dugu (nulua), behaketa guztiak puntu batean konzentratuta baitaude.
Desbideratze tipikoa edo estandarra.
Desbideratze tipikoa edo estandarra bariantzaren karratu positiboa bezala definitzen dugu.
σ = +√
σ2 =
√√√√√√k∑
i=1
(xi − x̄)2ni
N.
Batez besteko desbideratzea.
p batez besteko batekiko batez besteko desbideratzea honela definitzen dugu,
DMp =
k∑i=1
| xi − p | ni
N.
Honela, Batezbesteko aritmetikoarekiko batez besteko desbideratzea ondokoa izango da
DMx̄ =
k∑i=1
| xi − x̄ | ni
N.
18
Eta, Medianarekiko batez besteko desbideratzea
DMMe=
k∑i=1
| xi −Me | ni
N.
Neurri hauek indibiduoen homogeneotasuna adierazten digute, hau da, desbideratzeak txikiak
badira, batez besteko desbideratzea txikia izango da eta, alderantziz, handiak badira batez
besteko desbideratzea handia izango da. Sakabanatze-neurri hauek aldagaia neurtuta dagoen
unitateetan agertzen dira, hortaz, bi aldagairen konparaketa egin nahi badugu ez dira balia-
garriak aldagaiak unitate desberdinetan adierazita badaude. Beraz, zenbaki abstraktuetan
adierazitako sakabanatze-neurriak behar ditugu.
Pearson-en aldakuntza-koefizientea.
C.V. =σ
| x̄ |.
x̄ = 0 denean, koefiziente honek ez du zentzurik. Batzuetan, koefiziente hau 100 zenbakiaz
biderkatuta agertzen da eta horrela lana portzentaiekin egingo dugu.
Batez besteko aldakuntza-koefizientea (C.V.M).
p batez besteko batekiko batez besteko aldakuntza-koefizientea honela definitzen da
C.V.M.p =DMp
| p |.
p = x̄ edo p = Me baldin bada, honela geratzen da
C.V.M.x̄ =DMx̄
| x̄ |eta C.V.M.Me =
DMMe
|Me |.
Ibiltartea.
X aldagai batek hartzen dituen balio maximo eta minimoaren arteko diferentziari ibiltartea
deritzogu. Hots, R = max(x)−min(x).
Kuartil arteko ibiltartea. RI = P3/4 − P1/4.
19
Kuartil arteko ibiltarte-erdia.
RSI =P3/4 − P1/4
2=
RI
2.
Momentuak.
p parametroarekiko r ordenako momentua honela definitzen dugu
Mr(p) =
k∑i=1
(xi − p)rni
N.
Bi motatako momentu aztertuko ditugu
• Jatorriarekiko momentuak.
p = 0 denean, jatorriarekiko momentuak lortzen dira
ar =
k∑i=1
(xi − 0)rni
N=
k∑i=1
xri ni
N.
• Batezbestekoarekiko momentuak.
p = x̄ denean, batezbestekoarekiko momentuak edo momentu zentralak lortzen dira
mr =
k∑i=1
(xi − x̄)rni
N.
Momentu partikular batzuk aipatuko ditugu
a0 =
k∑i=1
x0i ni
N= 1, m0 =
k∑i=1
(xi − x̄)0ni
N= 1,
a1 =
k∑i=1
xini
N= x̄, m1 =
k∑i=1
(xi − x̄)ni
N=
0
1= 0,
a2 =
k∑i=1
x2i ni
N, m2 =
k∑i=1
(xi − x̄)2ni
N= σ2.
Beti aurki ditzakegu momentu zentratuak eta jatorriarekiko momentuak erlazionatzen
dituzten erlazioak. Nahikoa da Newton-en binomioa erabiltzea.
20
7. ASIMETRI ETA ZAPALTASUN-ZORROZTASUN NEURRIAK.
Aztertzen ari garen aldagaiaren datu-multzoa zentrurako joeraren eta sakabanatze balioen
bidez nahiko argi geratu bada ere, itxuraren balio tipikoak aztertzean gehiago osa daiteke;
hauen artean asimetri koefizientea eta kurtosi koefizientea ikusiko ditugu.
7.1. BANAKETA SIMETRIKOAK
Maiztasun-banaketa bat simetrikoa dela esango dugu balio zentral batekiko distantzikide diren
aldagaiaren balioek maiztasun berdinak dituztenean.
Banaketa bat moda batekoa eta simetrikoa baldin bada, batezbesteko aritmetikoa, moda eta
mediana balio berean daude x̄ = Moda = Me.
-
6
Barra-diagrama
-
6
Histograma
7.2. BANAKETA ASIMETRIKOAK
Maiztasun-banaketa bat simetrikoa ez denean asimetrikoa dela esango dugu.
Eskuinerantz asimetrikoa edo asimetri positiboa.
Maiztasunak eskuinetik polikiago jaisten dira. Kasu honetan honako hau betetzen da:
x̄ ≥Me ≥Moda.
.
-
6
Barra-diagrama
-
6
Histograma21
Ezkerrerantz asimetrikoa edo asimetri negatiboa.
Maiztasunak ezkerretik polikiago jaisten dira. Kasu honetan honako hau betetzen da:
x̄ ≤Me ≤Moda.
.
-
6
Barra-diagrama
-
6
Histograma
7.3. ASIMETRI KOEFIZIENTEAK
Ondorengo asimetri koefizienteak erabiltzen baditugu, banaketaren simetria edo asimetria
ezagutu dezakegu adierazpen grafikoa egin gabe.
• Pearson-en asimetri koefizientea.
Ap =x̄−Md
σ
Ap > 0 Eskuinerantz asimetrikoa
Ap = 0 Simetrikoa
Ap < 0 Ezkerrerantz asimetrikoa
Koefiziente honek banaketa baten asimetriaren maila emango digu. Nabaria denez moda
bakarra duten banaketetan erabiliko dugu.
• Fisher-en asimetri koefizientea.
Koefiziente hau honela definitzen da
AF =m3
σ3
AF > 0 Eskuinerantz asimetrikoa
AF = 0 Simetrikoa
AF < 0 Ezkerrerantz asimetrikoa
22
• Kurtosi koefizientea edo zapaltasun-zorroztasun koefizientea.
X, Y eta Z banaketen grafikak aztertzen baditugu, hirurek mugatzen duten azalera bat
da baina itxuraren aldetik oso desberdinak dira.
-
6Leptokurtikoa
Mesokurtikoa
Platikurtikoa
g2 kurtosi koefizientea aztertzen ari garen banaketaren zapaltasunaren adierazle bezala
erabiliko dugu, eta banaketaren zapaltasuna emango digu banaketa normalaren zapal-
tasunarekin konparatuz.
g2 =m4
σ4.
Eta horrela,
g2 > 3 Banaketa normala baino zorrotzagoa: leptokurtikoa,
g2 = 3 Banaketa normalaren zapaltasuna: mesokurtikoa,
g2 < 3 Banaketa normala baino zapalagoa: platikurtikoa.
23