Upload
calin-binchevici
View
229
Download
0
Embed Size (px)
Citation preview
8/17/2019 Estimarea populatiei statistice
1/32
BAZELE STATISTICII
- anul universitar 2015-2016 -
8/17/2019 Estimarea populatiei statistice
2/32
Programa analitică
1. Noţiuni introductive2. Analiza unei serii statistice unidimensionale, folosind
metode grafice şi numerice (variabile cantitative:,
indicatori ai formei; variabile calitative).3. Analiza unei serii statistice bidimensionale.
8/17/2019 Estimarea populatiei statistice
3/32
Programa analitică4. Probabilităţi şi distribuţii teoretice
5. Estimarea parametrilor unei populaţii6. Testarea statistică7. Indicatori ai seriilor de timp
8/17/2019 Estimarea populatiei statistice
4/32
5. Estimarea parametrilor unei populaţii
5.1. Concepte fundamentale
a) Popula ţ ie - E şantion
O populaţie statistică este definită prin precizarea naturii sale,a caracteristicilor intrinseci, s aţiului şi tim ului.
Un eşantion reprezintă o sub-populaţie sau un sub-ansamblu
extras din populaţia de referinţă după o procedură anume.
8/17/2019 Estimarea populatiei statistice
5/32
5. Estimarea parametrilor unei populaţii
b) Sondajul aleator simplu repetat
Sondajele aleatoare permit calcularea a priori a probabilităţiifiecărei unităţi din populaţie de a aparţine eşantionului.
Un sondaj aleator simplu repetat presupune ca fiecare unitate
n popu a e s a aceeaş pro a a e e a nc us neşantion. Aceasta este .
N
n p =
8/17/2019 Estimarea populatiei statistice
6/32
5. Estimarea parametrilor unei populaţii
c). Numărul de e şantioane care se pot extrage
- în cazul eşantionării aleatoare repetate:
K=N n
8/17/2019 Estimarea populatiei statistice
7/32
5. Estimarea parametrilor unei populaţii
5.2. Parametru – Estimator – Estimaţie
Parametrul reprezintă o valoare fixă şi necunoscută, numităşi valoare reală sau adevărată, a unei populaţii studiate după o
.
Estimatorul este o statistică, adică o variabilă aleatoare careeste determinată de totalitatea eşantioanelor posibile devolum n care se pot extrage din populaţia de referinţă.
Estimatorul este definit ca o funcţie a variabilelor de selecţie.
8/17/2019 Estimarea populatiei statistice
8/32
5. Estimarea parametrilor unei populaţii
Estimaţia este o valoare realizată dintre valorile posibile ale
estimatorului. O estimaţie se obţine la nivelul unui eşantion extras, pe baza
datelor culese, şi este o funcţie a valorilor de sondaj.
8/17/2019 Estimarea populatiei statistice
9/32
5. Estimarea parametrilor unei populaţii
Propriet ăţ ile estimatorilor
De regulă, există o diferenţă între estimaţie şi parametru,care reprezintă o eroare de estimare.
Această eroare oate fi măsurată cu a utorul ro rietă ilor
estimatorilor:
1. Nedeplasarea
θ θ =)ˆ( M
8/17/2019 Estimarea populatiei statistice
10/32
5. Estimarea parametrilor unei populaţii
2. Convergenţa:
N ncând V →→ ,0)ˆ(θ
-
eşantionului: dacă acesta este suficient de mare, atunci oricevaloare posibilă a estimatorului (orice estimaţie) convergecătre parametru.
Această proprietate este o expresie a legii numerelor mari.
8/17/2019 Estimarea populatiei statistice
11/32
5. Estimarea parametrilor unei populaţii
- convergen ţ a în reparti ţ ie (teorema limit ă centrală)
impune o condiţie de volum pentru estimatorul transformatprin operaţia de standardizare:
)ˆ ( M ˆ ~ˆ θ θ −
Dacă volumul eşantionului creşte peste o anumită limită,atunci variabila aleatoare obţinută prin standardizarea
estimatorului urmează o lege de repartiţie normală standard:
3. Eficienţa: .min)ˆ
(V =θ
)ˆ (V θ
)1 ,0( N ~ Z ~ˆ → θ
8/17/2019 Estimarea populatiei statistice
12/32
5. Estimarea parametrilor unei populaţii
5.3. Statistici uzuale în inferenţa statistică
a) Media de selecţie µ ˆ
aritmetică a variabilelor aleatoare de selecţie X i. O valoare posibilă a estimatorului este media de sondaj.
Variabila media de selecţie se caracterizează prin legea
normală - teorema limită centrală bazată pe legea numerelormari.
),(~ˆ2
n N
σ µ µ
8/17/2019 Estimarea populatiei statistice
13/32
5. Estimarea parametrilor unei populaţii
Caracteristici ale estimatorului :
- nedeplasat;
- convergent;
ˆ
- .
b) Dispersia de selecţie
- Este un estimator deplasat.
- Ca o corecţie la acest estimator, se construieşte dispersia deselecţie modificată sau corectată. O valoare posibilă a acestuiestimator este dispersia de sondaj modificată:
2σ̂
8/17/2019 Estimarea populatiei statistice
14/32
5. Estimarea parametrilor unei populaţii
c) Proporţia de selecţie
2
i
2
) x x(1n
1
' s −
−=
∑
ˆ
- are aceleaşi proprietăţi cu media de selecţie.
)n
)1( ,( N ~ˆ π π π π −
8/17/2019 Estimarea populatiei statistice
15/32
5. Estimarea parametrilor unei populaţii
5.4 Estimarea punctuală a parametrilor unei populaţii
a) Definire
- ,
o valoare a unui estimator convenabil ales, care respectă
proprietăţile de nedeplasare şi convergenţă.b) Estimarea punctuală a mediei unei populaţii
c) Estimarea punctuală a varianţei unei populaţii
d) Estimarea punctuală a proporţiei unei populaţii
8/17/2019 Estimarea populatiei statistice
16/32
5. Estimarea parametrilor unei populaţii
5.5 Estimarea prin interval de încredere (IC) a parametrilor
unei populaţii
a Definire
- a estima prin IC un parametru presupune a identifica douăvariabile aleatoare, Li şi Ls , care, pentru o anumităprobabilitate , numită nivel de încredere, respectă
condiţia:
- , cu
)1( −
)1() L L(P si θ −=≤≤ )1 ,0(∈α
8/17/2019 Estimarea populatiei statistice
17/32
5. Estimarea parametrilor unei populaţii
- estimarea prin IC se bazează pe estimatori nedeplasaţi şi
convergenţi, cărora li se aplică Teorema limită centrală.
b Estimarea rin IC a mediei unei o ula ii
- când se cunoaşte parametrul :σ
)1,0(~),(~ˆ2
N Z n
N ⇒σ
µ µ
n Z
/
ˆˆ
ˆ σ σ µ
−=
−=
8/17/2019 Estimarea populatiei statistice
18/32
5. Estimarea parametrilor unei populaţii
)1() zn
ˆ z(P 2 / 2 / α
σ α α −=+≤
−≤−
)1()n
zˆ n
zˆ (P2 / 2 /
α σ
µ µ σ
µ α α
−=+≤≤−
8/17/2019 Estimarea populatiei statistice
19/32
5. Estimarea parametrilor unei populaţii
la nivelul unui eşantion extras:
+−
n z x ,
n z x 2 / 2 /
σ σ α α
- când nu se cunoaşte parametrul :
Variabila Z devine o variabilă Student:
σ
)1n(t ~
n
' ˆ
ˆ t −
−=
σ
8/17/2019 Estimarea populatiei statistice
20/32
5. Estimarea parametrilor unei populaţii
- valoarea se citeşte din tabelul Student pentru:
)1()t t t (P 2 / 2 / α α −=≤≤−
2 / t t P =≥
2 / t α
+−
n
' st x ,
n
' st x 2 / 2 / α α
8/17/2019 Estimarea populatiei statistice
21/32
Exemplu
Pentru un eşantion format din 20 de persoane, extras aleator
simplu repetat, s-au obţinut următoarele rezultate privindvârsta (ani):
Să se estimeze prin interval de încredere vârsta medie a întregii populaţii din care a fost extras eşantionul,
considerând un risc de 0,05.
.ans;an x ==
8/17/2019 Estimarea populatiei statistice
22/32
Exemplu
În estimarea prin IC a mediei populaţiei se foloseşte statistica
t Student . Din Tabela Student se citeşte valoarea:t 0,025;20-1=2,093.
Interpretare: Se poate garanta cu o probabilitate de 0,95 c
ă
vârsta medie a întregii populaţii din care a fost extraseşantionul este acoperită de intervalul: 19,064 ~ 19 ani şi20,936 ~ 21 ani.
[ ]936 ,20;064 ,1920
2093 ,220
n
' st x 19;025.0 =
⋅±=
⋅±
8/17/2019 Estimarea populatiei statistice
23/32
5. Estimarea parametrilor unei populaţii
Observaţie:
Precizia estimării creşte (mărimea intervalului de încredereeste mai mică), atunci când:
- volumul eşantionului (n) creşte.
8/17/2019 Estimarea populatiei statistice
24/32
6. Estimarea parametrilor unei populaţii
df t 0.1 t 0.05 t 0.025
1 3 078 6 314 12 706
2 1,886 2,920 4,303
3 1,638 2,353 3,82
8/17/2019 Estimarea populatiei statistice
25/32
5. Estimarea parametrilor unei populaţii
- varianţa eşantionului este mică (valorile aberante afectează
mărimea intervalului de încredere).
8/17/2019 Estimarea populatiei statistice
26/32
5. Estimarea parametrilor unei populaţii
c) Estimarea prin IC a proporţiei unei populaţii
- când se cunoaşte varianţa variabilei alternative:
- când nu se cunoaşte varianţa variabilei alternative:
+−
n zˆ
,n zˆ
2 / 2 /
π
α
π
α π π
−+
−−
n
) p1( pt p ,
n
) p1( pt p 2 / 2 / α α
8/17/2019 Estimarea populatiei statistice
27/32
Exemplu
În urma realizării unui sondaj electoral la nivelul unui
eşantion format din 1500 persoane, se observă că 840persoane au votat pentru candidatul A. Să se estimeze prininterval de încredere proporţia persoanelor care voteazăpentru can i atul A la nivelul întregii populaţii, consi erânun risc de 0,05.
8/17/2019 Estimarea populatiei statistice
28/32
Rezolvare
-
proporţ
ia persoanelor care au votat pentru candidatul A, lanivelul eşantionului, este: p=840/1500=0,56.
- I.C. se calculează astfel:
[ ]59 ,0;53 ,01500
)56 ,01(56 ,096 ,156 ,0
n
) p1( pt p 2 / =
−⋅⋅±=
−⋅⋅± α
8/17/2019 Estimarea populatiei statistice
29/32
5. Estimarea parametrilor unei populaţii
5.6. Estimarea prin IC în SPSS
Descriptives
7.7442 .32041Mean
rata_som_201Statistic Std. Error
.
8.3908
7.8339
8.0000
4.414
2.10105
2.3011.80
9.50
2.60
-.605 .361
.418 .709
Upper Bound
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
MinimumMaximum
Range
Interquartile Range
Skewness
Kurtosis
8/17/2019 Estimarea populatiei statistice
30/32
5. Estimarea parametrilor unei populaţii
5.7. Calcularea volumului eşantionului ( n)
Pentru determinarea volumului eşantionului se foloseşte, deregulă, ca variabilă de bază o variabilă alternativă pentru aestima parametrul , care, în cazul unui sondaj de opinie
, . În practică, se fixează probabilitatea sau nivelul de încredere,
(1-α), cu care dorim să garantăm rezultatul (de regulă, 0,95)şi eroarea maxim admisibilă (de exemplu, ).%3±π ∆
8/17/2019 Estimarea populatiei statistice
31/32
5. Estimarea parametrilor unei populaţii
Ştiind că:
, unde:
n
z 2 / π
α π
σ ∆ =
,
standard a variabilei alternative pentru care se estimează
Se află n:
Parametrul , care exprimă gradul de omogenitate alpopulaţiei, de regulă nu se cunoaşte, însă în calculul
volumului eşantionului se poate utiliza valoarea lui maximă,care este egală cu 0,25.
2
22
2 / zn
π
π α
∆
σ ⋅=
2
π σ
π π
π
8/17/2019 Estimarea populatiei statistice
32/32
6. Estimarea parametrilor unei populaţii
Exemplu
Pentru o probabilitate de 0,95 şi o eroare maxim admisibilăde , să se calculeze volumul eşantionului.
Ce se întâm lă dacă se utilizează o eroare de ?
%3±
%2±