Upload
jason-vlad
View
246
Download
0
Embed Size (px)
Citation preview
8/10/2019 Cursurile 7 si 8 statistica.pdf
1/16
1
STATISTIC
CURSURILE 7 si 8Msuri statistice descriptive pentru date
univariate
- Media si dispersia unei variabile alternative
- Regula de compunere a variabilitii unei serii mpriten mai multe subserii
8/10/2019 Cursurile 7 si 8 statistica.pdf
2/16
2
Media i dispersia unei variabile de tip alternativ
Dac variabila este alternativ celor dou variante de
rspuns li se vor acorda, convenional, valorile numerice1 i 0.
Datele pot fi sistematizate astfel:
Varianta de rspuns xi Frecveneni
Frecvene relative*in
Afirmativ 1 m fn
m=
Negativ 0 n-m fn
mn=
1
Total n 1
8/10/2019 Cursurile 7 si 8 statistica.pdf
3/16
3
Media i dispersia unei variabile de tip alternativ
Media esteproporia rspunsurilor afirmative (care posed
caracteristica studiat), n totalul unitilor statistice:
Dispersia este:
Dispersia maxim pentru o variabil alternativ este 0,25,(ponderea rspunsurilor afirmative este egal cu cea arspunsurilor negative )
( )f
n
m
n
mnm
n
nx
x iii
==+
==
=
01
2
1
( ) ( ) ( )( ) ( ) ( )( )ffffffff
n
mnfmfss f +=+=
+== 1111
01 2222
22
( )ffs f = 12
5,01 == ff
8/10/2019 Cursurile 7 si 8 statistica.pdf
4/16
4
Exemplu 200 de turiti dintr-o staiune balnear au fost ntrebai
dac sunt mulumii de serviciile de cazare. Dintreacetia 160 au rspuns afirmativ (m) i 40 negativ.
Media variabilei alternative este:
f=m/n=160/200=0,8,
adic 80% dintre persoanele anchetate (intrebate) suntmulumite de serviciile de cazare.
Dispersia este:
( ) 16,02,08,012 === ffs f
8/10/2019 Cursurile 7 si 8 statistica.pdf
5/16
5
ExempluPentru adecvarea promoiilor la cadourile de srbtori, un magazinrealizeaz un studiu referitor la veniturile clienilor, nivelul sumelor pe
alocate pentru cadouri si categoria socio-profesional.Datele referitoare la cheltuielile pentru cadouri, in sute lei, nregistratepentru 14 clieni, sunt:
6,5 2,5 3 3,2 2,2 2,3 3 5 4 5,5 6,5 8 2 7
Media de selectie 4,3357 sute leiDispersia de selectie 4,1686Abaterea standard 2,0417sute lei
Coeficientul de variatie 47,09%
8/10/2019 Cursurile 7 si 8 statistica.pdf
6/16
6
Regula de compunere a variabilitii
Deoarece seria are un grad redus de omogenitate, clienii au fostmprii n 2 grupe, n funcie de categoria socio-profesional astfel:
Cheltuieli pentru cadouri (sute lei)
Pensionari (Grupa 1) Salariati (Grupa 2 )2 3
2,5 5
3 4
3,2 5,52,2 6,5
2,3 8
6,5
7
Pensionari (Grupa 1) Salariati (Grupa 2)Media de selectie 2,5333 sute lei 5,6875 sute lei
Dispersia de selectie 0,2227 2,7098
Abaterea standard 0,4719 sute lei 1,6462 sute lei
Coeficient de variatie 18,63% 28,94%
8/10/2019 Cursurile 7 si 8 statistica.pdf
7/16
7
Regula de compunere a variabilitii
Consideram ca o unitate statistica este caracterizata de doua variabileXsi Y.
VariabilaX, in general nenumerica, are rcategorii sau variante de raspuns:Categoria 1, Categoria 2,, Categoria r, care vor determina impartireacolectivitatii generale in rgrupe astfel:
Grupa 1 (unitatile colectivitatii generale care au ca raspuns Categoria 1 pentru var. X
Grupa 2 (unitatile colectivitatii generale care au ca raspuns Categoria 2 pentru var. X)
Grupa r (unitatile colectivitatii generale care au ca raspuns Categoria r pentru var. X)
Grupele sunt disjuncte iar reuniunea lor este colectivitatea statistica.
VariabilaXse mai numeste si variabila independenta sau factor de grupare. Cealalta variabila de interes, Y, este variabila numerica, numita si variabila
dependenta.
Suntem interesati sa evaluam influenta factorului de grupareXasupra variatieitotale a variabilei numerice Y.
8/10/2019 Cursurile 7 si 8 statistica.pdf
8/16
Regula de compunere a variabilitatii Dac populatia statistica este alctuit din mai multe grupe
componente, variaia total a variabilei numerice Yse poate
calcula dupa o schem cunoscut sub numele de regula decompunere a variabilitii totale.
Din fiecare Grupa i, i=1,,r, se extrage cate un subesantion devolum n
iunitati statistice, pentru care se inregistreaza valorile
observate asupra variabilei numerice Y.
Volumul esantionului extras din populatia statistica esten=n1+n2+...+nr
Abaterea fiecrei valori observate de la media total a seriei de
date numerice este explicat prin influena factorului degrupare i a altor factori ce acioneaz la nivelul fiecrei grupe.
Putem cuantifica, astfel, ct din variaia caracteristicii numericestudiate este explicat de factorul de grupare ales.
8
8/10/2019 Cursurile 7 si 8 statistica.pdf
9/16
9
Regula de compunere a variabilitii
Dac esantionul de volum neste alcatuit din rsubesantionare extrase din cele rgrupe, volumul
fiecarui subesantion fiindrin
i
,1, =(
r
r
i
i nnnnn +++==
=...
21
1 ) se pot determina mediile de selectie degrupa ( iy ) i dispersiile de selectie de grupa (
2
is ) astfel:
Grupele Volumul
subesantionului
( in ) extras din Grupa i
Valorile
observate in
subesantion
Media de selectie a
Grupei i
( iy )
Dispersia de selectie a
Grupei i
(2
is )
Grupa 1 1n 1,12,11,1 ;;; nyyy K
=
=
1
1
,1
1
11
n
j
jy
ny ( )
=
=
1
1
21,1
1
21
1
1 n
j
j yy
ns
Grupa 22
n 2,22,21,2 ;;; nyyy K =
=
2
1
,2
2
2
1 n
j
jyn
y ( )=
=
2
1
2
2,2
2
2
21
1 n
j
j yyn
s
M M M MGrupa i
in
iniii
yyy,2,1,
;;; K
==
in
jji
ii xny 1
,
1
( )
=
=
in
jiji
ii
yyn
s
1
2
,
2
1
1
M M M MGrupa r
rn
rnrrr
yyy,2,1,
;;; K =
=
rn
j
jr
r
r y
ny
1
,
1
( )
=
=
rn
j
rjr
r
r yyn
s
1
2
,
2
1
1
8/10/2019 Cursurile 7 si 8 statistica.pdf
10/16
10
Regula de compunere a variabilitii
Abaterea individual de la media total poate fi descompus astfel:
( )yyyyyy iijiji +=
,,
unde:
r
rr
r
n
j
jr
n
j
j
n
j
j
nnn
nynyny
nnn
yyy
y
r
+++
+++=
+++
+++
=
===
...
...
...
...
21
2211
21
1
,
1
,2
1
,1
21
este media totala seriei la nivelul intregului esantion de volum n=n1+n2+...+nr.
Prin ridicarea la ptrat i nsumarea fiecrui termen i folosind proprietile mediei se
obine:
( ) ( ) ( )44 344 2144 344 2144 344 21
grupedintrevariatia
1
2
grupelorinterioruldinvariatia
1 1
2
,
totalavariatia
1 1
2
, == == =
+=
r
i
ii
r
i
n
j
iji
r
i
n
j
ji nyyyyyy
ii
8/10/2019 Cursurile 7 si 8 statistica.pdf
11/16
Regula de compunere a variabilitatii
11
Se noteaz:
SSW
= Sum of Squares Within groupssau
variatia din interiorul grupelor,adica suma patratelor abaterilor individuale de la mediile de grup
( )
( ) ( ) ( )
( ) ( ) ( ) 2222
2
11
1
2,
1
22,2
1
21,1
1 1
2
,
1...11
...
21
rr
n
j
rjr
n
j
j
n
j
j
r
i
n
j
iji
snsnsn
yyyyyy
yySSW
r
i
+++=
+++=
=
===
= =
SSB= Sum of Squares Between groups sau variatia dintre grupe,
adica suma patratelor abaterilor mediilor de grupa de la media totala
( )
( ) ( ) ( ) rr
r
i
ii
nyynyynyy
nyySSB
+++=
==
2
2
2
21
2
1
1
2
...
8/10/2019 Cursurile 7 si 8 statistica.pdf
12/16
12
Regula de compunere a variabilitii
SST= Sum of Total Squares sau variatia totala,adica suma patratelor abaterilor individuale ale tuturor valorilor observate in esantion
fata de media totala
( )
SSBSSWSST
yySSTr
i
n
j
ji
i
+=
== =1 1
2
,
8/10/2019 Cursurile 7 si 8 statistica.pdf
13/16
13
Regula de compunere a variabilitii
Relaia SST= SSW+ SSB
-
se numete REGULA DE COMPUNERE A VARIABILITII TOTALEsau identitatea fundamentala a analizei dispersionale
-
permite determinarea dispersiei de selectie a esantionului de volum ndupaformula
1
2
=
n
SSTs
y
-
permite determinarea msurii n care factorul de grupare influeneazvariaia caracteristicii studiate prin calculul coeficientului dedeterminaie:
SST
SSB
R =2
sau, n expresie procentual, gradul de determinaie:
1002
% =
SST
SSBR
8/10/2019 Cursurile 7 si 8 statistica.pdf
14/16
14
Regula de compunere a variabilitii
Dac variatia dintre grupe SSB are o pondere mai mare n
variatia total SSTatunci nseamn c factorul de grupareexplic mai mult variaia caracteristicii studiate.
Dac variatia din interiorul grupelor SSW are o ponderemai mare n variatia total SSTatunci nseamn c variaia
caracteristicii studiate este influenat de ali factori
Se poate calcula coeficientul/gradul de nedeterminaie:
22
1 RSST
SSW
K ==2
%
2
% 100100 RSST
SSW
K ==
8/10/2019 Cursurile 7 si 8 statistica.pdf
15/16
15
Exemplu - continuare
Pentru a analiza n ce proporie categoria socio-profesional influeneaz variaia
cheltuielilor pentru cadouri se determin:
Grupa Volumulsubesantionuluiniextras din Grupa i
Media de selectie aGrupei i
( iy )
Dispersia deselectie a Grupei i
( 2is )
Grupa 1
(Pensionari)
n1=6 =1
y 2,5333 sute lei =2
1s 0,2227
Grupa 2 (Salariati) n2=9 =2
y 5,6875 sute lei =2
2s 2,7098
Variatia din interiorul grupeloreste:
( ) ( ) ( )
( ) ( ) ( ) ( )
0821,20
7098,2182227,01611 2
22
2
11
8
1
2
2,2
6
1
2
1,1
2
1 1
2
,
=
+=+=
=+== === =
SSW
snsn
yyyyyySSW
j
j
j
j
i
n
j
iji
i
8/10/2019 Cursurile 7 si 8 statistica.pdf
16/16
Exemplu - continuare
16
Media totalala nivelul intregului esantion de volum n=n1+n2=14 clienti este
14
7,60
86
86875,565333,2
21
2211
=+
+
=+
+
=nn
nyny
y
3357,4= y sute lei.
Variatia dintre grupeeste
( )
( ) ( )
1101,34
8)3357,46875,5(6)3357,45333,2( 222
221
21
2
1
2
=
+=
=+=
===
SSB
nyynyy
nyySSBi
ii
Variatia totalaeste SST=SSW+SSB=20,0821+34,1101, deci SST=54,1922
Coeficientul de determinatie este6294,0
1922,54
1101,342===
SST
SSBR
sau %94,622
% =R , categoria socio-profesionala influenteaza variatia cheltuielilor cu cadourile in
proportie de 62,94%, restul de 37,06% din variatia totala a cheltuielor cu cadourile fiind influentata
de alti factori.