Upload
haphuc
View
220
Download
0
Embed Size (px)
Citation preview
2. STATISTICĂ MATEMATICĂ
2.1. Teoria selecţiei
Definiţie 2.1.1. Numim colectivitate sau populaţie o mulţime C de
elemente care este cercetată din punct de vedere a uneia sau mai multor
caracteristici (proprietăţi), elementele colectivităţii fiind numite indivizi, iar
numărul indivizilor unei colectivităţi se va numi volumul colectivităţii.
Observaţie 2.1.2.
1) Problema esenţială a statisticii matematice este de a stabilii legea
de probabilitate pe care o urmează caracteristica X.
2) Caracteristicile sunt de tip discret şi de tip continuu.
Definiţie 2.1.3. Numim selecţie (sondaj) o subcolectivitate a
colectivităţii cercetate C, iar numărul elementelor selecţiei poartă numele de
volumul selecţiei (sondajului).
Definiţie 2.1.4. O selecţie se numeşte repetată sau bernoulliană dacă
după examinarea individului acesta se reintroduce în colectivitate, în caz
contrar selecţia este nerepetată.
Observaţie 2.1.5. Dacă volumul colectivităţii C este mult mai mare
decât volumul selecţiei atunci selecţia nerepetată poate fi considerată ca fiind
selecţie repetată. În continuare considerăm numai selecţii repetate.
Definiţie 2.1.6. Numim date de selecţie relative la caracteristica X
valorile obţinute pentru indivizii care intră în selecţie privind caracteristica X.
Dacă selecţia este de volum n vom nota datele de selecţie prin x1, x2,…,xn.
Definiţie 2.1.7. Datele de selecţie x1, x2,…,xn sunt valorile unor
variabile aleatoare, respectiv X1, X2,…,Xn care se vor numi variabile de
selecţie.
Elemente de teoria probabilităţilor şi statistică matematică 2
Observaţie 2.1.8.
1) Dacă selecţia este repetată atunci X1, X2,…,Xn sunt independente
şi identic repartizate cu X (urmează aceeaşi lege de probabilitate ca X).
2) Dacă datele de selecţie x1, x2,…,xn au valorile distincte x'1,
x'2,…,x'N atunci , unde f⎟⎟⎠
⎞⎜⎜⎝
⎛
N21
N21
f...ff'x...'x'x
:X i = frecvenţa apariţiei valorii
x'i, se va numi distribuţia empirică de selecţie a lui X.
3) Dacă X este de tip continuu se obişnuieşte să se facă o grupare a
datelor de selecţie în clase astfel: , ⎟⎟⎠
⎞⎜⎜⎝
⎛
N21
N21
f...ff'x...'x'x
:X2
aa'x i1ii
+= − , fi
este frecvenţa datelor de selecţie din intervalul ,)a,a[ i1i− ,nf...ff N21 =+++
n = volumul selecţiei.
Această grupare se face chiar şi pentru cazul când X este de tip
discret.
Definiţie 2.1.9. Dacă avem funcţia numim funcţie de
selecţie sau statistică, variabila aleatoare
RR:h n →
)X,...,X,X(hZ n21n = iar valoarea
numerică )x,...,x,x(hz n21n = o numim valoarea funcţiei de selecţie.
Definiţie 2.1.10. Numim medie de selecţie funcţia de selecţie
definită prin ,Xn1X
n
1kk∑
=
= iar valoarea numerică ,xn1x
n
1kk∑
=
= o numim
valoarea mediei de selecţie.
Observaţie 2.1.11.
1) Dacă X urmează legea normală ),m(N σ atunci media de selecţie
X urmează legea normală )n
,m(N σ .
Demonstraţie:
Statistică matematică 3
Avem ca variabile de selecţie X1, X2, ..., Xn urmează şi ele legea
normală ),( σmN . Funcţia caracteristică a variabilei Xk este de forma
)()()( 2
22
attdaret XaX
timt
X kϕϕϕ
σ
==−
2
22
21 )( n
tantim
Xn
etatuncik
−
=ϕ
şi obţinem ntimtn
tntimn
k
n
kX
nX
nX eettt
kn
kk
22
11
11
222
22
1
)()()(σ
σ
ϕϕϕ−
−
==∑ ==== ∏∏=
adică X urmează legea normală ),(n
mN σ .
2) Dacă X urmează legea normală ),m(N σ atunci statistica
n
mXZσ−
= urmează legea normală N(0,1).
Demonstraţie:
Statistica mnXnZσσ
−=
Conform observaţiei 1, dacă se consideră caracteristica X care
urmează legea normală ),( σmN , atunci media de selecţie X urmează legea
normală )(n
mN σ .
0)()()( =−=−= mmnmnXMnZMσσσ
1)()()()( 22
22
22
22 ===−=−
=n
nXDnmXDnnmXDZD σσσσσ
adică Z urmează legea N(0,1).
3) Dacă X1, X2 independente urmează legea normală
atunci statistica 2,1i),,m(N ii =σ
Elemente de teoria probabilităţilor şi statistică matematică 4
2
22
1
21
2121
nn
)mm()XX(Zσ
+σ
−−−= urmează legea normală N(0,1).
Demonstraţie:
Funcţiile caracteristice ale mediilor de selecţie /X şi //X sunt
respectiv /
2/2/
/2)( n
timt
X etσ
ϕ−
= şi //
2//2//
//2)( n
timt
X etσ
ϕ−
= /X şi //X fiind
independente rezultă )()()( ////// ttt XXXX −− = ϕϕϕ unde
//
2//2//
////2)()( n
titm
XX ettσ
ϕϕ−−
− =−= , iar )()( ///
///
//////)(
)( tet XXmmit
mmXX −−−
−−− = ϕϕ
Avem succesiv =
+
== −−−
+
−−− )()()(
//
2//
/
2/)()()()( //////
//
2//
/
2/
//////
nn
ttt mmXX
nn
mmXXZσσ
ϕϕϕσσ
=
+
= −
+
−−
)(
//
2//
/
2/)(
)(
/////
2//
/
2/
///
nn
te XXnn
mmit
σσϕ
σσ
=
+
−
+
= −
+
−−
)()(
//
2//
/
2/
//
2//
/
2/
)(
/////
2//
/
2/
///
nn
t
nn
te XXnn
mmit
σσϕ
σσϕ
σσ
2)(2)(2
)(2
//
2//
/
2///
2//2
//
2//
/
2/
//
//
2//
/
2//
2/2
//
2//
/
2/
/
//
2//
/
2/
///
tnn
n
t
nn
itm
nnn
t
nn
itm
nn
mmit
eeee−+
−
+
−
+−
++
−−
==σσ
σ
σσσσσ
σσσσ
adică Z urmează legea N(0,1).
Definiţie 2.1.12. Numim moment de selecţie de ordin k funcţia de
selecţie ∑=
=n
k
kik X
n 1
1σ , iar valoarea numerică ∑=
=n
k
kik x
n 1
1σ o numim
valoarea momentului de selecţie de ordin k.
Statistică matematică 5
Definiţie 2.1.13. Numim moment centrat de selecţie de ordin k
funcţia de selecţie ( )kn
iik XX
n∑=−=
1
1µ iar ∑=
−=µn
1i
kik )xx(
n1 o numim
valoarea momentului centrat de selecţie de ordin k.
Observaţie 2.1.14.
1) Dacă X urmează legea normală ),m(N σ atunci:
statistica
1n
mXT2
−µ
−= urmează legea Student cu n-1 grade de libertate.
statistica 222 n
Hσµ
= urmează legea cu n-1 grade de libertate 2χ
2) Funcţia de selecţie ∑=
−−
=σn
1k
2k
2)XX(
1n1 se numeşte dispersia
de selecţie; atunci statisticile din observaţia anterioară devin:
n
mXTσ−
= şi
2
22 )1n(H
σσ−
= .
3) Momentul centrat de selecţie kµ de ordin k, pentru n mare,
urmează legea normală
⎟⎠⎞
⎜⎝⎛ − )(1, 2
2 kkk nN σσσ
Definiţie 2.1.15. Numim funcţie de repartiţie de selecţie funcţia de
selecţie definită prin Rx,n
)x(K)x(F n
n ∈∀= , unde este numărul
valorilor variabilelor de selecţie mai mici decât x.
)x(K n
Elemente de teoria probabilităţilor şi statistică matematică 6
Teorema lui Glivenko 2.1.16. Dacă se consideră caracteristica X ce
are funcţia de repartiţie teoretică F şi fie funcţia de repartiţie de selecţie nF ,
atunci P( 1)0)x(F)x(Fsuplim nRxn
==−∈∞→
.
Teorema lui Kolmogorov 2.1.16. Fie caracteristica X de tip
continuu, care are funcţia de repartiţie teoretică F şi fie funcţia de repartiţie
de selecţie nF , iar )x(F)x(Fsupd nRx
n −=∈
, atunci
∑∞
−∞=
−
∞→>−==<⋅
k
xk2knn
.0x,e)1()x(K)xdn(Plim22
Observaţie 2.1.17. Funcţia K(x) se numeşte funcţia lui Kolmogorov
şi are valorile tabelate.
Exemplul 2.1.18. Se consideră un eşantion de 20 de clienţi, care
intră într-un magazin alimentar, pentru a cerceta frecvenţa X cu care clienţii
fac apel la serviciile magazinului de-a lungul unei săptămâni şi respectiv
pentru cercetarea cheltuielilor lunare Y în mii lei ale clienţilor, pentru
procurarea de bunuri alimentare. S-au obţinut următoarele date de selecţie
pentru X şi respectiv Y.
X: 1,2,1,4,3,2,5,6,1,2,3,2,3,4,6,2,4,3,1,2;
Y: 9,90,101,88,85,77,102,100,86,97,76,121,113,110,96,9,2,108,112,103,109.
Se cere:
a) distribuţiile empirice de selecţie pentru fiecare din caracteristicile
X şi Y;
b) mediile de selecţie, momentele centrate de selecţie de ordinul al
doilea şi dispersiile de selecţie pentru caracteristicile X şi Y;
c) funcţiile de repartiţie de selecţie pentru X şi Y.
Rezolvare:
Statistică matematică 7
a) Se observă că datele de selecţie pentru caracteristica X au N = 6
valori distincte, deci distribuţia empirică de selecţie pentru X este:
X: . Pentru caracteristica Y toate datele de
selecţie sunt distincte. Vom face o grupare a datelor de selecţie
corespunzătoare caracteristicii Y. Anume, prima clasă cuprinde valorile
datelor de selecţie în intervalul [70,80), a doua clasă cuprinde valorile din
intervalul [80,90) etc. După efectuarea acestei grupări, distribuţia empirică de
selecţie a lui Y devine:
⎟⎟⎠
⎞⎜⎜⎝
⎛213464654321
Y: . ⎟⎟⎠
⎞⎜⎜⎝
⎛136442
125115105958575
b) Mediile de selecţie pentru cele două caracteristici sunt:
∑ ∑= =
=⋅+⋅+⋅+⋅+⋅+⋅=⋅==20
1k
6
1kkkk .85,2]625143342614[
201f'x
201x
201x
∑=
=⋅+⋅+⋅+⋅+⋅+⋅=⋅=6
1kkk .5,98]125111531056954854752[
201'yf
201y
Valorile momentelor centrate de selecţie de ordinul doi pentru cele
două caracteristici sunt respectiv:
∑ ∑= =
−⋅+−⋅=−=−=µ20
1k
6
1k
222kk
2k2 )85,22(6)85,21(4[
201)x'x(f
201)xx(
201)X(
.3275,2])85,26(2)85,25(1)85,24(3)85,23(4 2222 =−⋅+−⋅+−⋅+−⋅+
∑ ∑= =
−⋅+−⋅=−⋅=−=20
1
6
1
22222 )5,9885(4)5,9875(2[
201)'(
201)(
201)(
k kkkk yyfyyYµ
5,182])5,98125(1)5,98115(3)5,98105(6)5,9895(4 2222 =−⋅+−⋅+−⋅+−⋅+ Valorile dispersiilor de selecţie se calculează imediat, dacă se
cunosc momentele centrate de selecţie de ordinul doi.
45,2)(1920)(
191)( 2
220
1
2 =⋅=−= ∑=
XxxXk
k µσ .
Elemente de teoria probabilităţilor şi statistică matematică 8
105,192)Y(1920)yy(
191)Y( 2
20
1k
2k
2 =µ⋅=−=σ ∑=
.
Astfel, se poate obţine 57,1)X()X( 2 =σ=σ şi respectiv
86,13)Y()Y( 2 =σ=σ .
c) Funcţiile de repartiţie de selecţie pentru cele două caracteristici
sunt respectiv:
⎪⎪⎪⎪
⎩
⎪⎪⎪⎪
⎨
⎧
>≤<≤<≤<≤<≤<
≤
=
⎪⎪⎪⎪
⎩
⎪⎪⎪⎪
⎨
⎧
>≤<≤<≤<≤<≤<
≤
=
.125xdaca,1125y115daca,20/19115y105daca,20/16105y95daca,20/1095y85daca,20/685y75daca,20/2
75ydaca,0
)y(F
.6xdaca,16x5daca,20/185x4daca,20/174x3daca,20/143x2daca,20/102x1daca,20/4
1xdaca,0
)x(F 2020
2.2. Teoria estimaţiei
Se consideră caracteristica X care urmează legea de probabilitate
dată prin funcţia de probabilitate f(x;λ ), λ parametru necunoscut, unde f este
funcţia densitate de probabilitate dacă X este de tip continuu, respectiv
funcţia de frecvenţă dacă este de tip discret.
Teoria estimaţiei are ca scop evaluarea parametrilor de care depinde
legea de probabilitate a lui X, folosind datele de selecţie şi
bazându-ne pe rezultatele teoretice relative la variabilele de selecţie
.
n21 x,...,x,x
n21 X,...,X,X
Statistică matematică 9
Definiţie 2.2.1. Se numeşte funcţie de estimaţie (punctuală) sau
estimator al parametrului funcţia de selecţie (statistica)
cu ajutorul căreia se trag concluzii relative la .
λ
)X,...,X,X( n21∗∗ λ=λ λ
Definiţie 2.2.2. Spunem că funcţia de estimaţie este estimator
consistent dacă 0,1)(Plimn
>ε∀=ε<λ−λ∗∞→
, adică
, iar valoarea numerică
se numeşte estimaţie consistentă pentru
λ⎯→⎯λ∗ Pn21 )X,...,X,X( )x,...,x,x( n21
∗λ
λ .
Definiţie 2.2.3. Spunem că funcţia de estimaţie este estimator
absolut corect pentru λ dacă şi când n , iar
valoarea numerică se numeşte estimaţie absolut corectă
pentru .
λ=λ∗ )(M 0)(D2 →λ∗ ∞→
)x,...,x,x( n21∗λ
λ
Definiţie 2.2.4. Spunem că funcţia de estimaţie este estimator corect
pentru dacă şi , iar valoarea numerică
se numeşte estimaţie corectă pentru
λ λ=λ∗∞→
)(Mlimn
0)(Dlim 2
n=λ∗
∞→
)x,...,x,x( n21∗λ λ .
Definiţie 2.2.5. Se numeşte distorsiunea (deplasarea) estimatorului
diferenţa M( , iar dacă distorsiunea este nulă, estimatorul se
numeşte nedeplasat.
∗λ λ−λ∗ ) ∗λ
Propoziţie 2.2.6. Dacă este un estimator
absolut corect pentru
)X,...,X,X( n21∗∗ λ=λ
λ , atunci estimatorul este consistent.
Demonstraţie:
Din ipoteză avem că şi folosind inegalitatea lui Cebîşev
pentru λ
λλ =)( *M
* obţinem ( ) 2
*2* )(1
ελελλ DP −≥<− , pentru orice ε > 0.
Elemente de teoria probabilităţilor şi statistică matematică 10
Deoarece din inegalitatea lui Cebîşev se obţine 0)(lim *2 =∞→
λDn
( ) 1lim * =<−∞→
ελλPn
, pentru orice ε > 0, deci λ* este un estimator consistent
pentru parametrul λ.
Observaţie 2.2.7.
1) Se arată că momentul de selecţie kσ de ordin k este estimator
absolut corect pentru momentul teoretic );( kk XM=σ
Demonstraţie:
Într-adevăr
kk
n
ik
n
i
kn
i
ki
n
i
kik n
nn
XMn
XMn
Xn
MM σσσσ =====⎟⎠
⎞⎜⎝
⎛= ∑∑∑∑
==== 1111
1)(1)(11)( ,
respectiv
==⎟⎠
⎞⎜⎝
⎛= ∑∑
==
n
i
ki
n
i
kik XD
nX
nDD
1
22
1
22 )(11)(σ
0)()()(1 2
2
2
1
22 →=== ∑
= nXD
nXnDXD
n
kkn
i
k ,
când n → ∞ se obţine că kσ este estimator absolut corect pentru kσ .
2) Momentul centrat de selecţie de ordin doi 2µ este estimator
corect pentru momentul centrat teoretic de ordin doi , adică
pentru dispersia teoretică;
)X(D22 =µ
Demonstraţie:
Avem succesiv
)()(11)(1)( 222
2
12 XDXD
nn
nnXX
nMM
n
kk →
−=
−=⎟
⎠
⎞⎜⎝
⎛−= ∑
=
µµ când
n → ∞, respectiv
Statistică matematică 11
0)3)(1()1()( 22343
2
22 →
−−−
−= µµµ
nnn
nnD când n → ∞ şi rezultă că 2µ
este un estimator corect pentru 2µ .
3) Dispersia de selecţie 2σ este estimator absolut corect pentru
dispersia teoretică . )X(D2
Demonstraţie:
Folosind relaţia 22
1µσ
−=
nn se obţine
)()(11
)(11
)( 2222
2 XDXDn
nn
nMn
nn
nMM =−
−=
−=⎟
⎠⎞
⎜⎝⎛
−= µµσ , respectiv
0)(11
)( 22
2
2222 →⎟
⎠⎞
⎜⎝⎛
−=⎟
⎠⎞
⎜⎝⎛
−= µµσ D
nn
nnDD , când n → ∞ şi deci 2σ
este un estimator absolut corect pentru dispersia teoretică.
Definiţie 2.2.8. Numim cantitate de informaţie relativ la parametrul
expresia: λ
I(⎥⎥⎦
⎤
⎢⎢⎣
⎡⎟⎠⎞
⎜⎝⎛
λ∂λ∂
⋅=λ2),x(flnMn) .
Observaţie 2.2.9. Se arată că estimatorul absolut corect al lui λ
verifică inegalitatea Rao-Cramer
∗λ
)(I1)(D2
λ≥λ∗ .
Definiţie 2.2.10. Estimatorul absolut corect pentru parametrul λ
se numeşte eficient dacă
∗λ
)(I1)(D2
λ=λ∗ , iar raportul
)(D)](I[)(e 2
1
∗
−∗
λλ
=λ se
numeşte eficienţa estimatorului . ∗λ
Elemente de teoria probabilităţilor şi statistică matematică 12
Aplicaţie 2.2.11. Să se arate că media de selecţie ∑=
=n
jjX
nX
1
1
constituie un estimator absolut corect şi eficient al parametrului λ din
repartiţia Poisson.
Rezolvare:
Ţinând seama că variabila aleatoare X are repartiţia Poisson cu
avem: λ== )()( 2 XDXM
λλ =⋅===⎟⎟⎠
⎞⎜⎜⎝
⎛= ∑∑∑
=== nnXM
nXM
nX
nMXM
n
j
n
jj
n
jj
111)(1)(11)(
0)(1)(11)( 21
22
1
22
1
22 →=⋅===⎟⎟⎠
⎞⎜⎜⎝
⎛= ∑∑∑
=== nnnXD
nXD
nX
nDXD
n
j
n
jj
n
jj
λλ
când n → ∞ şi deci media de selecţie este un estimator absolut corect al lui λ.
Pentru determinarea cantităţii de informaţie avem:
!);(
xexf
xλλ λ−= , !lnln);(ln xxxf −+−= λλλ
λλλ xxf
+−=∂
∂ 1);(ln iar
)(121
)(1)(2121);(ln
22
222
22
λλλ
λλ
λλλλλλ
++⋅−=
=+−=⎟⎟⎠
⎞⎜⎜⎝
⎛+−=
⎥⎥⎦
⎤
⎢⎢⎣
⎡⎟⎠⎞
⎜⎝⎛
∂∂ XMXMxxMxfM
Rezultă cantitatea de informaţie λλ
λλ nxfnMI =⎥⎥⎦
⎤
⎢⎢⎣
⎡⎟⎠⎞
⎜⎝⎛
∂∂
=2);(ln)(
Întrucât egalitatea )(
1)(2
λIXD = este verificată rezultă că X este
un estimator eficient al lui λ.
Statistică matematică 13
Exemplul 2.2.12. La un control de calitate se verifică diametrul
pieselor prelucrate de un strung. Pentru a se realiza acest control s-a efectuat
o selecţie de 18 piese şi s-a obţinut că diametrul X al pieselor are următoarele
dimensiuni (în cm):
Diametru 3,98 3,99 4,00 4,01 4,02
Nr. Piese 4 3 5 3 3
Să se determine:
a) o estimaţie absolut corectă pentru diametrul mediu al pieselor
realizate;
b) o estimaţie corectă şi una absolut corectă pentru dispersia
diametrelor faţă de diametrul mediu.
Rezolvare:
a) Distribuţia empirică de selecţie a caracteristicii X este:
X: . ⎟⎟⎠
⎞⎜⎜⎝
⎛3353402,401,400,499,398,3
Diametrul mediu este media teoretică M(X)=m. Dar se cunoaşte că
un estimator absolut corect pentru media teoretică m este media de selecţie
∑=
=n
1kkX
n1X
Prin urmare, valoarea mediei de selecţie ∑=
=n
1kkx
n1x este o estimaţie
absolut corectă pentru media teoretică m.
Se obţine:
02,4301,4300,4599,3398,34(181x ⋅+⋅+⋅+⋅+⋅= = 3,9989.
b) Deoarece un estimator corect al dispersiei teoretice este
momentul centrat de selecţie de ordinul doi
)X(D2
2µ , rezultă că o estimaţie corectă
Elemente de teoria probabilităţilor şi statistică matematică 14
pentru dispersia teoretică este valoarea momentului centrat de selecţie de
ordinul doi, adică:
+−⋅+−⋅+−⋅=−=µ ∑=
222n
1k
2k2 )9989,34(5)9989,399,3(3)9989,398,3(4[
181)xx(
n1
422 10877,1)9989,302,4(3)9989,301,4(3 −⋅=−⋅+−⋅+ .
O estimaţie absolut corectă pentru dispersia teoretică este:
42
2 10987,11718 −⋅=⋅= µσ .
Exemplul 2.2.13. Fie caracteristica X ce urmează legea normală
N(m, ), unde mσ R∈ este cunoscut, iar 0>σ este necunoscut. Se consideră o
selecţie repetată de volum n. Să se arate că funcţia de selecţie
V= ∑=
−n
kmX
n 121 π este o funcţie de estimaţie absolut corectă pentru
parametrul )X(D2=σ .
Rezolvare:
Arătăm că M(V)=σ şi . Avem 0)V(Dlim 2
n=
∞→
=−=−=−= ∑∑==
)(2
1)(2
1)m(2
1)(11
mXnMn
mXMn
XMn
VMn
kk
n
k
πππ
)mX(M2
−π
= . Deoarece X urmează legea normală N(m,σ ), avem că
∫ ∫∞
∞−
∞
∞−
−−
=⋅−=−=− dxemxdxxmxmXMmx
2
2
2)(
21)()( σ
πσρ
σππ
σσσπσ
22
22
1 2 ==⋅∫∞
∞−
−tdtet
t
dacă s-a făcut schimbarea de variabilă
tmx=
−σ
.
Statistică matematică 15
Prin urmare, avem M(V) = σ=σπ
⋅π 22
, deci prima condiţie este
satisfăcută.
Pentru verificarea celei de-a doua condiţii, scriem succesiv:
⇒−=−=−= ∑∑==
n
k
n
kk mXD
nmXD
nmXD
nVD
1
222
1
222 )(2
)(2
)()2
1()( πππ
0)(lim 2 =⇒∞→
VDn
Metoda verosimilităţii maxime 2.2.14.
Considerăm caracteristica X supusă cercetării ca având funcţia de
probabilitate f(x; ),...,, s21 λλλ . Variabilele de selecţie sunt
independente şi identic repartizate, rezultă că vectorul aleator ( )
va avea funcţia de probabilitate
n21 X,...,X,X
n21 X,...,X,X
şi care se
numeşte funcţie de verosimilitate.
∏=
=n
isisn XfXXXV
1212121 ),...,,;(),...,,;,...,,( λλλλλλ
Spunem că estimatorii sunt de verosimilitate
maximă pentru
)X,...,X,X( n21ii∗∗ λ=λ
s,1i,i =λ dacă realizează maximul funcţiei de verosimilitate.
Determinarea estimatorilor de verosimilitate maximă se va face
rezolvând sistemul s,1i,0V
i
==λ∂∂ , care de regulă se înlocuieşte cu
s,1i,0Vln
i
==λ∂
∂ numit sistem de verosimilitate maximă.
Observaţie 2.2.15.
1) Se arată că un estimator eficient este un estimator de
verosimilitate maximă.
Elemente de teoria probabilităţilor şi statistică matematică 16
2) Un estimator de verosimilitate maximă este estimator consistent,
iar pentru valori mari ale lui n este o variabilă aleatoare ce urmează legea
normală N( , unde ))](I[, 1−λλ λ este parametrul estimat.
Exemplul 2.2.16. Să se determine estimatorii de verosimilitate
maximă pentru valoarea medie şi abaterea standard dacă se consideră
caracteristica X, care urmează legea normală N(m,σ ).
Rezolvare:
M(X) = m şi σ=σ )X( , f(x; m, 2
2
2)mx(
e2
1) σ
−−
πσ=σ . Pentru a scrie
sistemul de verosimilitate maximă avem:
ln f(x; m,σ ) = - ln 2
2
2)mx(ln2
σ−
−σ−π , de unde
2
mxm
),m;x(flnσ−
=∂
σ∂ , iar 3
2)mx(1),m;x(flnσ−
+σ
−=σ∂
σ∂ .
Se obţine:
∑ ∑ ∑= = =
−=−
=∂
∂=
∂∂ n
k
n
k
n
kk
kk mXmXm
mXfmV
1 1 122 )(1),;(lnln
σσσ .
∑∑ ∑== =
−+−=−
+−=∂
∂=
∂∂ n
kk
n
k
n
k
kk mXmXmXfV1
22
1 133
2
])([1])(1[),;(lnln σσσσσ
σσ
sau:
⎪⎪⎩
⎪⎪⎨
⎧
=−+σ−
=−
∑
∑
=
=
0])mX([
0)mX(n
1k
2k
2
n
1kk
⎪⎪⎩
⎪⎪⎨
⎧
µ=−=σ
==⇒
∑
∑
=
∗
=
∗
2
n
1k
2k
n
1kk
)XX(n1
XXn1m
.
Exemplul 2.2.17. Se consideră caracteristica X ce urmează legea
binomială, adică are distribuţia teoretică:
Xm,0k)k,m(P
k
=⎟⎟⎠
⎞⎜⎜⎝
⎛, unde P(m,k) = cu parametrul ,p1q,qpC kmkk
m −=−
Statistică matematică 17
p necunoscut. Folosind o selecţie de volum n, se cere: )1,0(∈
a) estimatorul de verosimilitate maximă pentru p; ∗p
b) să se arate că estimatorul este un estimator absolut corect
pentru parametrul p;
∗p
c) să se arate că estimatorul este un estimator eficient pentru
parametrul p.
∗p
Rezolvare:
a) Funcţia de probabilitate pentru caracteristica X este
f(x; p) = m,0x,)p1(pC xmxxm =− − . Pentru a scrie ecuaţia de verosimilitate
maximă ∑=
=∂
∂n
1k
k 0p
)p;X(fln , avem că
ln f(x; p) = ln , de unde )p1ln()xm(plnxCxm −−++
p1xm
px
p)p;x(fln
−−
−=∂
∂ . Aşadar ecuaţia verosimilităţii maxime este:
∑=
=−−
−n
1k
kk 0)p1Xm
pX( , adică 0
p1Xn
p1mn
pXn
=−
+−
− , unde ∑=
=n
1kkX
n1X .
Ecuaţia verosimilităţii maxime se mai scrie 0XpmpX)p1( =+−− ,
de unde se obţine estimatorul de verosimilitate maximă
Xm1)X,...,X,X(pp n21 == ∗∗ pentru parametrul p.
Pentru aceasta avem, în primul rând, că:
pmpm1)X(M
m1)X(M
m1)p(M =⋅===∗ , iar apoi pentru dispersie se poate
scrie succesiv: ==== ∑ ∑= =
∗n
k
n
kk XD
nmXD
nmXD
mpD
1 1
222
222
22
2 )(1)(1)(1)(
∞→→==== nmnpq
nmmpq
nmXDXnD
nm,0)()(1
22
22
22.
Elemente de teoria probabilităţilor şi statistică matematică 18
Prin urmare, s-a obţinut M( ) = p şi , deci
estimatorul este estimator absolut corect pentru parametrul p.
∗p 0)X(Dlim 2
n=
∞→
∗p
c) Cantitatea de informaţie relativă la parametrul p se poate calcula
după cum urmează:
=−
=−−
=∂
∂= )X(D
)p1(pn])mpX[(M
)p1(p1n])
p)p;X(fln[(nM)p(I 2
222
222
)p1(pmn)p1(mp
)p1(pn
22 −=−
−= .
Pe de altă parte, am văzut că ,)p(I
1)p(D2 =∗ deci estimatorul
este estimator eficient pentru parametrul p.
∗p
Metoda momentelor 2.2.18.
Fie caracteristica X care are funcţia de probabilitate
f(x; s21 ,...,, λλλ ). Această metodă de estimare a parametrilor constă
în determinarea parametrilor , i = iλ s,1 din condiţiile că momentele iniţiale
teoretice ale lui X au ca estimatori absolut corecţi momentele de selecţie de
ordin corespondent. Astfel se obţine sistemul de ecuaţii kk σσ = , k = s,1 din
care se obţin estimaţii pentru parametrii s21 ,...,, λλλ .
Exemplul 2.2.19. Se consideră caracteristica X, care urmează legea
gamma de parametrii a>b>0 necunoscuţi. Vom estima aceşti parametri,
folosind metoda momentelor, pe baza datelor de selecţie. n21 x,...,x,x
Funcţia densitate de probabilitate a caracteristicii X este:
⎪⎩
⎪⎨
⎧
≤
>Γ=
−−
0xdaca,0
0xdaca,exb)a(
1)b,a;x(f
bx
1aa , unde Γ este funcţia lui Euler de
Statistică matematică 19
speţa a doua, adică ∫∞ −−=Γ0
x1a dxex)a( .
În cazul de faţă este vorba de doi parametri, deci sistemul de ecuaţii
este format din două ecuaţii, anume 11 σσ = şi 22 σσ = .
Vom calcula momentul teoretic iniţial kσ de ordin k:
∫ ∫∞
∞−
∞ −−+ ⋅−+−+==Γ
== akakabdxexba
dxbaxfx kbx
kaa
kk )...2)(1(...
)(1),;(
0
1σ
Rezultă sistemul:
⎩⎨⎧
+==
)1(22
1
aabab
σσ care are soluţia
1
212
212
21 ,
σσσ
σσσ −
=−
= ∗∗ ba , care
reprezintă estimatorii pentru parametrii a şi b.
Metoda intervalelor de încredere 2.2.20.
Fie caracteristica X care are funcţia de probabilitate f(x; , unde θ
este parametrul necunoscut. Metoda constă în determinarea a două funcţii de
selecţie
)θ
n,1i),X,...,X,X( n21ii =θ=θ astfel încât P( 21 θ<θ<θ ) = 1- ,
unde nu depinde de
α
α θ şi poartă numele de probabilitate de risc, iar 1- se
numeşte probabilitate de încredere. Intervalul aleator (
α
), 21 θθ poartă numele
de interval de încredere pentru parametrul θ .
De regulă, pentru a construi un interval de încredere pentru
parametrul se caută determinarea unei statistici θ );X,...,X,X(ZZ n21nn θ=
a cărei lege de probabilitate să fie cunoscută şi să nu depindă de . Se
determină apoi un interval numeric ( astfel încât P(
θ
)z,z 21 2n1 zZz << ) = 1-
. Din α 2n1 zZz << se exprimă inegalitatea 21 θ<θ<θ şi de aici intervalul
aleator ( este determinat. Intervalul este cu atât mai bun cu cât are
lungimea mai mică şi cu cât 1-α este mai mare.
), 21 θθ
Elemente de teoria probabilităţilor şi statistică matematică 20
Aplicaţii 2.2.21.
1. Interval de încredere pentru valoarea medie teoretică dacă
dispersia teoretică este cunoscută.
Se consideră caracteristica X care urmează legea normală N(m, )
cu m necunoscut şi
σ
R∈ 0>σ cunoscut. Vom determina un interval de
încredere pentru m cu o probabilitate de încredere 1-α dată şi cunoscând
datele de selecţie , respectiv variabilele de selecţie
corespunzătoare.
n21 x,...,x,x n21 X,...,X,X
Considerăm statistica
n
mXZn σ−
= , unde ∑=
=n
1kkX
n1X , care
urmează legea normală N(0,1) ce nu depinde de parametrul necunoscut m.
Deci putem determina intervalul ( astfel încât P()z,z 21 )zZz 2n1 << = 1-
adică
α
α−=Φ−Φ 1)z()z( 12 , ∫−
π=Φ
x
02t
dte21)x(
2
este funcţia lui Laplace şi
care are valorile tabelate. Intervalul are lungime minimă când este simetric
faţă de origine adică 2
112 zzz α−=−= . Rezultă că
21)z(
21
α−=Φ α
− şi folosind
tabelele de valori pentru funcţia Laplace găsim 2
1z α− .
Am obţinut P( α−=<σ−
<− α−
α− 1)z
n
mXz2
12
1 adică
P( )zn
Xmzn
X2
12
1 α−
α−
σ+<<
σ− = 1-α . Deci intervalul de
încredere pentru media teoretică m este ( , unde )m,m 212
11 zn
Xm α−
σ−= şi
Statistică matematică 21
212 z
nXm α
−
σ+= , iar ∑
=
=n
1kkX
n1X .
Observaţie 2.2.22. Când X nu urmează legea normală, dar volumul
selecţiei este mare (n>30) şi se cunoaşte 0)X( >σ=σ atunci statistica
= nZ
n
mXσ− , unde m=M(X) necunoscută, este aproximativ repartizată
normal N(0,1). Deci se poate considera pentru m acelaşi interval de încredere
obţinut mai sus.
2. Interval de încredere pentru valoarea medie teoretică dacă
dispersia teoretică este necunoscută.
Fie caracteristica X ce urmează legea normală N(m, )σ cu m=M(X)
parametru necunoscut şi 0)X(D2 >=σ necunoscută. Considerăm
statistica
n
mXTσ−
= , unde ∑=
=n
1kkX
n1X şi ∑
=
−−
=σn
1k
2k
2 )XX(1n
1 care
urmează legea Student cu n-1 grade de libertate. Determinăm intervalul
( ) cu P(21 t,t )tTt 21 << = 1- , adică α α−=− −− 1)t(F)t(F 11n21n , unde
∫ ∞−
+−
+Γπ
+Γ
=x
21n2
n ds)ns1(
)2n(n
)2
1n()x(F este funcţia de repartiţie a legii Student
cu n grade de libertate şi care are valorile tabelate, iar )x(F1)x(F nn −=− .
Deci 12
1,1n2 ttt −== α−−
se determină astfel încât 2
1)t(F2
1,1n1nα
−=α−−
− , apoi
putem scrie α−=<σ−
<− α−−
α−−
1)t
n
mXt(P2
1,1n2
1,1n sau
Elemente de teoria probabilităţilor şi statistică matematică 22
α−=σ
+<<σ
− α−−
α−−
1)tn
Xmtn
X(P2
1,1n2
1,1n. Adică, intervalul de
încredere pentru m este unde )m,m( 212
1,1n1 tn
Xm α−−
σ−= şi
21,1n2 t
nXm α
−−
σ+= .
3. Intervalul de încredere pentru diferenţa mediilor a două populaţii
Fie două populaţii 1ζ şi 2ζ la care se analizează aceeaşi
caracteristică şi care pentru este ce urmează legea normală N( ,
iar pentru
1ζ 1X ),m 11 σ
2ζ este ce urmează legea normală N2X ),m( 22 σ . Vom determina
un interval de încredere pentru diferenţa mediilor 21 mm − cu probabilitatea
de încredere 1-α folosind datele de selecţie relativ la
caracteristica , respectiv relativ la caracteristica .
1n11211 x,...,x,x
1X2n22221 x,...,x,x 2X
a) Presupunem abaterile standard ( ), 21 σσ cunoscute. Statistica
2
22
1
21
2121
nn
)mm()XX(Z
σ+
σ
−−−= , unde ,X
n1X,X
n1X
21 n
1kk2
22
n
1kk1
11 ∑∑
==
== urmează
legea normală N(0,1). Se determină intervalul ( astfel încât
P( = 1-
)z,z 21
)zZz 21 << α la fel ca în aplicaţia 1.
Deci: α−=<σ
+σ
−−−<− α
−α
−1)z
nn
)mm()XX(z(P
21
2
22
1
21
2121
21
sau
))()((2
22
1
21
212121
2
22
1
21
2121 nn
zXXmmnn
zXXP σσσσαα ++−<−<+−−
−−
adică intervalul de încredere pentru 21 mm − este (A,B) unde
Statistică matematică 23
A = (2
22
1
21
2121 nn
z)XX σ+
σ−− α
− şi B =
2
22
1
21
2121 nn
z)XX( σ+
σ+− α
−.
b) Presupunem abaterile standard σ=σ=σ 21 necunoscute.
Considerăm statistica
21
21
222
211
2121
n1
n1
2nn
)1n()1n(
)mm()XX(T
+
−+⋅
σ−+σ−
−−−= , unde
1X şi 2X sunt mediile de selecţie definite anterior, iar 21σ şi 2
2σ dispersiile
de selecţie ∑=
−−
=σ1n
1k
21k1
1
21 )XX(
1n1 şi ∑
=
−−
=σ2n
1k
22k2
2
22 )XX(
1n1 , care
urmează legea Student cu n = 2nn 21 −+ grade de libertate. La fel ca în
aplicaţia 2. se determină intervalul astfel încât )t,t( 21 α−=<< 1)tTt(P 21
adică α−=<+
−+
σ−+σ−
−−−<− α
−α
−1)t
n1
n1
2nn
)1n()1n(
)mm()XX(t(P
21,n
21
21
222
211
2121
21,n
.
Rezultă intervalul de încredere (A,B) pentru 21 mm − unde
A = St)XX(2
1,n21 ⋅−− α−
şi St)XX(B2
1,n21 ⋅+−= α−
cu
2nn
n1
n1
])1n()1n[(S21
21222
211
2
−+
+⋅σ−+σ−= .
4. Intervalul de încredere pentru dispersia teoretică
Fie caracteristica X ce urmează legea normală N(m,σ ). Considerăm
statistica 2
22 )1n(H
σσ−
= unde ∑=
−−
=σn
1k
2k
2 )XX(1n
1 , iar ∑=
=n
1kkX
n1X ,
ce urmează legea cu n-1 grade de libertate. Pentru probabilitatea de
încredere 1- se poate determina intervalul ( , astfel încât
2χ
α )h,h 22
21
Elemente de teoria probabilităţilor şi statistică matematică 24
α−=<< 1)hHh(P 22
221 .
2
2,1n
21 hh α
−= se determină din relaţia
2)h(F 2
11nα
=− şi
2
21,1n
22 hh α
−−= se determină din relaţia
21)h(F 2
21nα
−=− , unde
este funcţia de repartiţie a legii cu n grade de libertate )x(Fn2χ
∫−−
Γ=
x
02t1
2n
2nn dtet
)2n(2
1)x(F care are valorile tabelate.
Deci )h)1n(h(P 222
22
1 <σ
σ−< sau
α−=σ−
<σ<σ− 1)
h)1n(
h)1n((P 2
1
22
22
2
, adică s-a obţinut intervalul de
încredere ( pentru , unde ), 22
21 σσ 2σ 2
21,1n
22
1 h)1n(
α−−
σ−=σ şi 2
2,1n
22
2 h)1n(
α−
σ−=σ , iar
intervalul de încredere pentru abaterea standard σ este ),( 21 σσ .
Exemplul 2.2.23. Relativ la populaţia ζ se cercetează caracteristica
X privind media teoretică M(X) = m. Ştiind că dispersia teoretică a
caracteristicii X este , să se stabilească un interval de încredere
pentru media teoretică m cu probabilitatea de încredere 1-
35,0)X(D2 =
α = 0,95, utilizând
distribuţia empirică de selecţie:
X: . ⎟⎟⎠
⎞⎜⎜⎝
⎛25764731
4,233,232,231,230,239,228,227,22
Rezolvare:
Folosind aplicaţia 1., intervalul de încredere pentru media teoretică
Statistică matematică 25
m este , unde )m,m( 212
11 zn
xm α−
σ−= şi
212 z
nxm α
−
σ+= ;
21
z α−
se
determină astfel încât 475,02
1,2
1)z(2
1=
α−α−=Φ α
−, folosind tabelele cu
valorile funcţiei Laplace, 96,1z2
1=⇒ α
−.
077,23)4,2323,2352,2371,2362349,2278,2237,221(351
x =⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅=
Rezultă 881,2296,13535,0077,23m1 =⋅−= ,
273,2396,13535,0077,23m2 =⋅+= , adică )273,23;881,22(m∈ .
Exemplul 2.2.24. Pentru recepţionarea unei mărfi ambalată în cutii,
se efectuează un control, prin sondaj, privind greutatea X a unei cutii. Pentru
22 cutii cântărite s-a obţinut distribuţia empirică de selecţie, relativ la
caracteristica X:
⎟⎟⎠
⎞⎜⎜⎝
⎛24535213,32,31,30,39,28,27,2
:X .
Folosind probabilitatea de încredere 0,98, să se determine un interval
de încredere pentru valoarea medie a greutăţii cutiilor, presupunând că X
urmează legea normală ),m(N σ .
Rezolvare:
Deoarece abaterea standard )X(D2=σ este necunoscută, conform
aplicaţiei 2. intervalul de încredere pentru m este (m1,m2) unde
21,1n1 t
nxm α
−−
σ−= şi
21,1n2 t
nxm α
−−
σ+= . Pentru n-1=21 şi 98,01 =α−
Elemente de teoria probabilităţilor şi statistică matematică 26
din tabelul cu valorile funcţiei de repartiţie a legii Student se determină
158,2t2
1,1n=α
−−.
Folosind distribuţia empirică de selecţie se obţine:
( ) 032,33,322,341,350,339,258,227,21221x =⋅+⋅+⋅+⋅+⋅+⋅+⋅= iar
167,0)xx(f211 7
1k
2kk =−=σ ∑
=
Obţinem: 942,2518,222167,0032,3m1 =⋅−= ;
122,3518,222167,0032,3m2 =⋅+= adică )122,3;942,2(m∈ .
Exemplul 2.2.25. Masa de carne ambalată în produse de 1000 grame
de maşinile M1 şi M2 este o caracteristică X1, ce urmează legea normală
şi respectiv o caracteristică X),m(N 11 σ 2 ce urmează legea normală
. Cântărind 100 de pachete din cele produse de maşina M),m(N 22 σ 1 s-a
obţinut valoarea medie de selecţie 1007x1 = grame,iar din cântărirea a 150
pachete de la maşina M2 s-a obţinut 1002x 2 = grame.
Folosind probabilitatea de încredere 0,98, să se determine intervalul
de încredere pentru diferenţa m1-m2 , dacă se ştie că abaterile standard sunt
şi 31 =σ 42 =σ .
Rezolvare:
Conform aplicaţiei 3. a) intervalul de încredere pentru m1-m2 este
(A,B) unde
( )2
22
1
21
2121 nn
zxxA σ+
σ−−= α
− şi ( )
2
22
1
21
2121 nn
zxxB σ+
σ+−= α
− iar
Statistică matematică 27
2
1z α
− se determină a.î. 49,0
21z
21
=α−
=⎟⎟⎠
⎞⎜⎜⎝
⎛Φ α
−.
Folosind tabelul cu valorile funcţiei lui Laplace obţinem
33,2z2
1=α
−.
Deci :
975,315016
100933,25B
975,315016
100933,25A
=++=
=+−=)025,6;975,3(mm 21 ∈−⇒
Exemplul 2.2.26. Fie caracteristica X1 ce urmează legea normală
N(m, ) şi care reprezintă vânzările în milioane lei pe săptămână la
magazinele alimentare în oraşul A şi X
σ
2 vânzările în milioane lei la
magazinele alimentare din oraşul B şi care urmează legea normală N(m2, ).
S-au efectuat două sondaje, respectiv pentru X
σ
1 şi X2 şi s-au obţinut
următoarele date de selecţie:
X1: 226,5;224,1;218,6;220,1;228,8;229,6;222,5.
X2: 221,5;230,2;223,4;224,3;230,8;223,8.
Cu probabilitatea de încredere 0,95 să se construiască un interval de
încredere pentru diferenţa m1-m2, dacă 0>σ este necunoscut.
Rezolvare:
Conform aplicaţiei 3. b) intervalul de încredere pentru m1-m2 este
(A,B) unde StxxA2
1,n21 ⋅−−= α
− şi StxxB
21,n
21 ⋅−−= α−
dacă
( ) ( )[ ]222
211
21
21 1n1n2nn
n1
n1
S σ−+σ−−+
+=
21,n
t α−
iar se determină a.î.
21tF
21,n
nα
−=⎟⎟⎠
⎞⎜⎜⎝
⎛α
−.
Elemente de teoria probabilităţilor şi statistică matematică 28
Pentru 96,01 =α− şi n=1 obţinem 201,2t2
1,n=α
−.
Calculăm:
( )
( )
( )
( )
)619,3;326,6(mm619,3259,2201,2353,1B
325,6259,2201,2353,1A:zultăRe
259,2)951,145765,176(11
61
71
S
951,14xx51
765,17xx61
667,2258,2238,2303,2244,2232,2305,22161x
314,2245,2226,2298,2281.2206,2181,2245,22671x
21
6
1k
22k2
22
7
1k1k1
21
2
1
−∈−⇒=⋅+−=−=⋅−−=
=⋅+⋅+
=
=−=σ
=−=σ
=+++++=
=++++++=
∑
∑
=
=
Exemplul 2.2.27. Fie caracteristica X ce reprezintă timpul de
producere a unei reacţii chimice, măsurat în secunde. Dacă X urmează legea
normală ),m(N σ şi având o selecţie repetată de volum n=11, cu datele de
selecţie: 4,21;4,03;3,99;4,05;3,89;3,98;4,01;3,92;4,23;3,85;4,20. Să se
determine intervalul de încredere pentru dispersia şi pentru
abaterea standard
)X(D22 =σ
)X(D2=σ , cu probabilitatea de încredere 0,95.
Rezolvare:
Conform aplicaţiei 4. intervalul de încredere pentru este 2σ
( )22
21 ,σσ unde 2
21,1n
221 h
)1n(
α−−
σ−=σ şi 2
2,1n
222 h
)1n(
α−
σ−=σ iar 2
21,1n
h α−−şi 2
2,1n
h α−
se
Statistică matematică 29
determină folosind tabelele de valori pentru funcţia de repartiţie a legii cu
n-1 grade de libertate.
2χ
Avem: şi 5,20h 2975,0;10 = 25,3h 2
025,0;10 =
∑=
=−=σ
=+++=
11
1k
2k
2017,0)xx(
101
033,4)20,4...03,421,4(111x
Rezultă: 008,05,20017,0102
1 =⋅
=σ şi 052,025,,3017,0102
2 =⋅
=σ
)052,0;008,0(2 ∈σ⇒ şi )228,0;089,0(∈σ .
2.3. Verificarea ipotezelor statistice
Definiţie 2.3.1. Numim ipoteză statistică o presupunere relativă la o
caracteristică X a unei populaţii C, fie privind legea de probabilitate a lui X,
fie privind parametrii de care depinde această lege.
Metoda prin care o ipoteză statistică ce trebuie verificată se acceptă
sau se respinge, poartă numele de test (criteriu) statistic.
Observaţie 2.3.2.
1) Dacă testul statistic se referă la parametrii de care depinde legea
de probabilitate a lui X spunem că avem un test parametric.
2) Dacă testul statistic se referă la natura legii de probabilitate atunci
spunem că avem un test de concordanţă . Considerând caracteristica X cu
legea de probabilitate θθ),;x(f parametru necunoscut, ipoteza principală ce
se face asupra lui θ o numim ipoteză nulă şi o notăm A:H0 ∈θ , iar orice
altă ipoteză ce se face relativ la parametrul θ o numim ipoteză admisibilă şi
o notăm ,...2,1i,Ai . :Hi =∈θ
Elemente de teoria probabilităţilor şi statistică matematică 30
Observaţie 2.3.3.
1) în continuare, relativ la parametrul θ , vom considera doar două
ipoteze: ipoteza nulă A:H0 ∈θ , şi o ipoteză alternativă 11 A:H ∈θ .
2) Verificarea ipotezei nule în ipoteza alternativă pentru o
probabilitate de risc α se face determinând o regiune U nR⊂ numită regiune
critică a.î. P(X1,X2,…,Xn)∈ U α=)H0 . Din modul cum construim această
regiune critică U obţinem diferite teste de verificare a ipotezei statistice H0.
3) Probabilitatea de risc α se mai numeşte şi nivel de semnificaţie a
testului.
Definiţie 2.3.4. Numim eroare de genul I respingerea unei ipoteze
adevărate, iar probabilitatea de producere a acestei erori este
∈)X,...,X,X((P n21 U α=)H0 şi poartă numele de riscul furnizorului.
Definiţie 2.3.5. Numim eroare de genul II admiterea unei ipoteze
false, iar probabilitatea de producere a acestei erori este
∉)X,...,X,X((P n21 U β=)H1 şi poartă numele de riscul beneficiarului.
Definiţie 2.3.6. Se numeşte puterea testului probabilitatea de
respingere a unei ipoteze false, adică U ∈=θπ )X,...,X,X((P)( n21
~)H1 unde
~:H1 θ=θ sau . β−=θπ 1)(
~
Observaţie 2.3.7. Nu există o metodă generală de construire a
regiunii critice U, care ne duce la testul de verificare a ipotezei nule H0, dar
se cunosc clase de probleme pentru care s-au construit astfel de regiuni critice
şi corespunzător lor avem teste de verificare a ipotezelor statistice.
Testul Z 2.3.8.
Fie caracteristica X ce urmează legea normală ),m(N σ cu Rm∈
necunoscut şi 0>σ cunoscut. Vrem să verificăm ipoteza nulă H0:m=m0 în
Statistică matematică 31
ipoteza α alternativă 01 mm:H ≠ cu probabilitatea de risc ş le de
xn.
Considerăm statistica
i date
selecţie x1, x2, …
,Xn1mX n
∑=−
= X,
n
Z1k
k=σ
ce urmează legea
normală N(0,1). Deci pentru α dat putem determina intervalul
⎟⎠
⎜⎝ −−
21
21 αα ⎟
⎞⎜⎛− , zz a.î. α−=⎟
⎠⎜⎝
α−
α−
21
21
⎟⎞
⎜⎛
<<− 1zZzP .
Se de te regiunea critică Ufineş nR∈ prin:
U ∑=
α−
α−⎪
⎨ ⎜⎜⎝−
σ∈=
1
nn21 zR)u,...,u,u( =
⎪⎭
⎪⎬
⎫
⎩
⎪⎧
⎟⎟⎠
⎞⎛∉
− n
1kk
21
2
0 un1u,z,
n
mu.
tfel am obţinut: As
ααα
αασ
=∉=
==∈),...,2,1(( nXXXP
⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛−
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
⎟⎟⎠
⎞⎜⎜⎝
⎛−∉
−
−−
−−
02
12
1
02
12
1
,
,)0
HZP
PH
zz
Hzz
n
mX
Folosind regiunea critică U vom respinge ipoteza nulă H0 dacă
(x1, x2,…,xn)∈ U adică ⎟⎠
⎜⎝σ α
−α
−2
12
1
n
⎟⎞
⎜⎛−∉
−= 0 z,z
mxz şi o admitem dacă
∉)x,...,x,x( n21 U adică ⎟⎟⎠
⎞⎜⎜⎝
⎛−∈
σ−
= α−
α−
21
21
0 z,z
n
mxz .
Observ .
1) Deoarece regiunea critică U corespunde complementarei
aţie 2.3.9
Elemente de teoria probabilităţilor şi statistică matematică 32
intervalului de încredere ⎟⎟⎠
⎞⎜⎛⎜− α
−α
−2
12
1z,z pentru statistica Z în continuare nu
vom pune în evidenţă de fiecare dată regiunea critică U ci numai intervalul de
şi pentru o caracteristică X ce nu urmează
legea no
⎝
încredere pentru statistica utilizată.
2) Testul Z se poate folosi
rmală atunci când volumul selecţiei este mare (n>30).
3) Deoarece ipoteza alternativă este 01 mm:H ≠ testul Z se numeşte
testul Z bilateral. Dacă se consideră H1:m<m testul Z unilateral
dreapta. De exemplu pentru testul Z unilateral dreapta intervalul de încredere
pentru statistica Z devine )z,( 1 α−−∞ unde z
0 vom avea
1-α este determinat a.î..
α−=Φ α− 21)z( 1 .
Etapele aplicării testului:
1) Se consideră: mm,, = n210 x,...,x,x,σα
2) Se determină 2
1z α
−a.î.
21z
21
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛Φ α
−
3) Se calculează )x,...,x,x(n1x,
n
mxz n21
0 =σ−
=
4) Dacă 2
1 α−
< zz atunci ipoteza m=m0 este admisă, în caz contrar
este respinsă.
plul 2.3.10. Caracteristica X reprezintă cheltuielile lunare în
mii lei p
Exem
entru abonamentele la ziare şi reviste ale unei familii. Să se verifice,
cu nivelul de semnificaţie α=0,01 dacă media acestor cheltuieli lunare pentru
o familie este de 16 mii lei, ştiind că abaterea standard este 3=σ mii lei şi
Statistică matematică 33
având o selecţie repetată de volum n=40, care ne dă distribuţia empirică de
selecţie . ⎟⎟⎠
⎞⎜⎜⎝
⎛81012642017151311
:X
Rezolvare:
Deoarece n=40>30 şi este cunoscută, folosim testul Z pentru
verificarea ipotezei nule H
3=σ
0:m=16 cu alternativa .16m:H1 ≠
Pentru α=0,01 folosind testul se determină 995,02
1zz =α
− a.î.
( ) 495,02
1z 995,0 =α−
=Φ . Se obţine z0,995=2,58, care ne dă intervalul numeric
pentru statistica 8)(-2,58;2,5
n
mXZσ−
= . Calculăm
( ) 8,15)20817101512136114401x =⋅+⋅+⋅+⋅+⋅=
422,0
403
168,15
n
mxz −=−
=σ−
= .
Deoarece z = - 0,422 ( )58,2;58,2−∈ ipoteza se acceptă.
Testul T(Student) 2.3.11.
Fie caracteristica X ce urmează legea normală N(m,σ ) cu şi 0>σ
Rm∈ necunoscuţi. Relativ la media teoretică m=M(X) facem ipoteza nulă
H0:m=m0 cu ipoteza alternativă 01 mm:H ≠ ; probabilitatea de risc fiind α iar
variabilele de selecţie x1,x2,…,xn.
Pentru verificarea ipotezei nule considerăm statistica
( ) ,XX1n
1,Xn1X,
n
mXTn
1k
2
k2
n
1kk ∑∑
==
−−
=σ=σ−
= ce urmează legea Student
Elemente de teoria probabilităţilor şi statistică matematică 34
cu n-1 grade de libertate. Deci se determină intervalul numeric
⎟⎟⎠
⎞⎜⎜⎝
⎛− α
−−α
−−2
1,1n2
1,1nt,t a.î. α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛<<− α
−−α
−−1tTtP
21,1n
21,1n
, iar complementara
acestui interval ne defineşte regiunea critică U.
Etapele aplicării testului T:
1) Se consideră n210 x,...,x,x;mm; =α
2) Se determină 2
1,1nt α
−− a.î.
21tF
21,1n1n
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
−−−
3) Se calculează ( )∑∑==
−−
=σ=σ−
=n
1k
2
k
2n
1kk
0 xx1n
1,xn1x,
n
mxt
4) Dacă 2
1,1ntt α
−−< ipoteza m=m0 este admisă, altfel este respinsă.
Observaţie 2.3.12. Deoarece ipoteza alternativă H1:este
testul T prezentat se numeşte testul T bilateral, există şi teste unilaterale.
0mm ≠
Exemplul 2.3.13. Caracteristica X reprezintă gradul de ocupare
zilnică a unei unităţi hoteliere (în procente). Să se verifice, cu nivelul de
semnificaţie α=0,05, ipoteza că media de ocupare zilnică a hotelului este dată
prin m=80%, dacă dintr-o selecţie efectuată în 15 zile ale anului s-au obţinut
următoarele date de selecţie (în procente):
60,85,90,75,84,78,92,56,77,82,65,79,83,65,76.
Rezolvare:
Putem considera că X urmează legea normală ),m(N σ cu m şi
necunoscuţi. Ipoteza nulă ce se face este H
σ
0:m=80, cu alternativa
. 80m:H1 ≠
Deoarece σ este necunoscută, folosind testul T, cu α=0,05 şi tabelele
Statistică matematică 35
de valori se determină 2
1,1nt α
−− a.î. 975,0
21tF
21,1n1n =
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
−−− . Se obţine
t14;0,975 =2,145. Prin urmare intervalul numeric pentru statistica
n
mXTσ−
=
este (-2,145;2,145).
Calculăm 4,76)76...8560(151x =+++=
686,116)xx(141 n
1k
2k
2=−=σ ∑
=
291,1
1580,10
804,76
n
mxt 0 −=
−=
σ−
=
Întrucât -1,291 )145,2;145,2(−∈ , ipoteza ca media de ocupare zilnică
a unităţii hoteliere este de 80% se acceptă.
Teste pentru compararea a două medii 2.3.14.
Fie două populaţii C2 şi C2 cercetate din punct de vedere al aceleiaşi
caracteristici anume X1 pentru C1 care urmează legea normală şi
C
),m(N 11 σ
2 care urmează , C),m(N 22 σ 1 şi C2 fiind independente.
Vrem să verificăm ipoteza nulă H0:m1=m2 în ipoteza alternativă
cu probabilitatea de risc α şi selecţiile de volum n211 mm:H ≠ 1 şi n2 din
cele două populaţii.
a) Testul Z (dacă 21 ,σσ sunt cunoscute)
Considerăm statistica
2
22
1
21
2121
nn
)mm()XX(Zσ
+σ
−−−= care urmează legea
normală N(0,1).
Pentru α dat se determină intervalul numeric ⎟⎟⎠
⎞⎜⎜⎝
⎛− α
−α
−2
12
1z,z ,astfel încât
Elemente de teoria probabilităţilor şi statistică matematică 36
α−=⎟⎟⎠
⎞⎜⎜⎝
⎛<<− α
−α
−1zZzP
21
21
.
Etapele aplicării testului:
1) Se consideră 212n222211n1121121 mm;x,...,x,x;x,...,x,x;, =σσ
2) Se determină 2
1z α
− a.î.
21z
21
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛Φ α
−
3) Se calculează ∑∑==
==σ
+σ
−=
21 n
1kk2
2
2
n
1kk1
1
1
2
22
1
21
21 xn1x;x
n1x,
nn
xxz
4) Dacă 2
1zz α
−< ipoteza 21 mm = este admisă, altfel este respinsă.
b) Testul T (dacă σ=σ=σ 21 necunoscute)
Considerăm statistica
21
21
222
211
2121
n1
n1
2nn
)1n()1n(
)mm()XX(T+
−+
σ−+σ−
−−−=
care urmează legea Student cu 2nnn 21 −+= grade de libertate.
Pentru statistica T se determină intervalul numeric ⎟⎟⎠
⎞⎜⎜⎝
⎛− α
−α
−2
1,n2
1,nt,t
a.î. α−=⎟⎟⎠
⎞⎜⎜⎝
⎛<<− α
−α
−1tTtP
21,n
21,n
Etapele aplicării testului:
1) Se consideră . 2n222211n11211 x,...,x,x;x,...,x,x;α
2) Se determină 2
1,nt α
− a.î. 2nnn,
21tF 21
21,nn −+=
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
−
Statistică matematică 37
3) Se calculează
21
21
222
211
21
n1
n1
2nn
)1n()1n(
xxt+
−+
σ−+σ−
−=
( ) ( )∑∑∑∑====
−−
=σ−−
=σ==2121 n
1k
22k2
2
22
n
1k
21k1
1
21
n
1kk2
2
2
n
1kk1
1
1 xx1n
1;xx1n
1;xn1x;x
n1x
4) Dacă 2
1,ntt α
−< atunci ipoteza 21 mm = este admisă, altfel este
respinsă.
c) Testul T (dacă 21 σ≠σ necunoscute)
Considerăm statistica
2
22
1
21
2121
nn
)mm()XX(T
σ+
σ
−−−= care urmează
legea Student cu n grade de libertate, n este dat de
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛+
=−
−+
−=
2
22
1
21
1
21
2
2
1
2
;1)1(
11
nn
ncn
cn
cn σσ
σ
.
Pentru statistica T se determină intervalul numeric ⎟⎟⎠
⎞⎜⎜⎝
⎛− α
−α
−2
1,n2
1,nt;t
a.î. α−=⎟⎟⎠
⎞⎜⎜⎝
⎛<<− α
−α
−1tTtP
21,n
21,n
.
Etapele aplicării testului:
1) Se consideră ;x,...,x,x;x,...,x,x; 2n222211n11211α
2) Se determină 2
1,nt α
−− a.î.
21tF
21,nn
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
− unde
Elemente de teoria probabilităţilor şi statistică matematică 38
;1)1(
11
2
2
1
2
−−
+−
=n
cn
cn
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛ σ+
σ
σ
=
2
22
1
21
1
21
nn
nc ;
( ) ( )∑∑==
−−
=σ−−
=σ21 n
1k
22k2
2
22
n
1k
21k1
1
21 xx
1n1;xx
1n1
∑∑==
==21 n
1kk2
2
2
n
1kk1
1
1 xn1x;x
n1x
3) Se calculează
2
22
1
21
21
nn
xxtσ
+σ
−=
4) Dacă 2
1,ntt α
−< atunci ipoteza 21 mm = este admisă, altfel este
respinsă
Exemplul 2.3.15. La o unitate de îmbuteliere a laptelui există două
maşini care efectuează această operaţie în sticle de 1l. Pentru a cerceta
reglajul de îmbuteliere la cele două maşini s-au efectuat două selecţii relative
la sticlele îmbuteliate în cele două maşini şi s-au obţinut datele de selecţie: /kX 990 995 1000 1005 1010 //
kX 985 990 995 1000 1005 1010
/kf 7 9 11 8 5 //
kf 5 5 6 7 6 4
Folosind nivelul de semnificaţie 05,0=α , să se verifice dacă
mediile de umplere a sticlelor de către cele două maşini sunt aceleaşi, în
cazul în care abaterile standard sunt 61 =σ ml şi 5,72 =σ ml.
Rezolvare:
Caracteristicile X1 şi X2 ce reprezintă cantitatea de lapte (în ml)
conţinută de o sticlă îmbuteliată de prima maşină, se consideră ca urmând
Statistică matematică 39
legile de probabilitate normale N(m1, 6) şi N(m2; 7,5).
Verificarea ipotezei nule N0:m1=m2 cu alternativa , se
va face cu testul Z.
211 mm:H ≠
Folosind nivelul de semnificaţie 01,0=α se determină din tabele
valoarea 995,02
1zz =α
− a.î. 495,0
21z
21
=α−
=⎟⎟⎠
⎞⎜⎜⎝
⎛Φ α
−. Se obţine ,
care ne dă intervalul (-2,58; 2,58) pentru statistica
58,2z 995,0 =
2
22
1
21
2121nn
)]mm()XX[(Zσ
+σ
−−−= .
Calculăm: 375,999)10105...99599907(401x1 =⋅++⋅+⋅=
424,997)10104...99059855(331x 2 =⋅++⋅+⋅=
209,133
25,564036)424,997375,999(
nn)xx(z
2
22
1
21
21 =+−=σ
+σ
−=
Deoarece )58,2;58,2(209,1z −∈= , rezultă că mediile de umplere a
sticlelor nu diferă semnificativ pentru cele două maşini.
Exemplul 2.3.16.
Se cercetează două loturi de ulei pentru automobile, din punct de
vedere al vâscozităţii, obţinându-se datele de selecţie: /kX 10,27 10,28 10,29 10,30 10,32 //
kX 10,26 10,27 10,29 10,30 10,31
/kf 3 2 1 1 1 //
kf 3 2 1 1 1
Analizele făcându-se cu acelaşi aparat, se consideră că abaterile
standard sunt aceleaşi. Considerând nivelul de semnificaţie 05,0=α ; să se
verifice dacă mediile de vâscozitate pentru cele două laturi nu diferă
semnificativ.
Elemente de teoria probabilităţilor şi statistică matematică 40
Rezolvare:
Caracteristicile X1 şi X2, ce reprezintă vâscozităţile pentru cele două
loturi de ulei, se consideră că urmează fiecare legea normală, respectiv
şi ),m(N 1 σ ),m(N 2 σ , cu abaterea standard 0>σ necunoscută.
Verificarea ipotezei nule 210 mm:H = cu alternativa ,
se va face cu testul T, deoarece abaterea standard
211 mm:H ≠
σ este necunoscută.
Folosind nivelul de semnificaţie 05,0=α , se determină folosind tabelele,
valoarea 2
1,nt α
−, a.î.
21tF
21,nn
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
− , unde n=n1+n2-2. Adică se obţine
intervalul pentru statistica ,145,2t 975,0;14 = 145)(-2,145;2,
21
21
222
211
2121
n1
n1
2nn
)1n()1n(
)mm()XX(T+
−+
σ−+σ−
−−−= care urmează legea Student cu n
grade de libertate.
Calculăm:
285,10)32,101...28,10227,103(81x1 =⋅++⋅+⋅=
289,10)31,103...27,20126,102(81x 2 =⋅++⋅+⋅=
( ) 4n
1k
21k1
1
21 10143,3xx
1n1 1
−
=
⋅=−−
=σ ∑
( ) 4n
1k
22k2
2
22 10983,4xx
1n1 2
−
=
⋅=−−
=σ ∑
397,0
81
8114
10)881,34001,22(289,10285,10
n1
n1
2nn
)1n()1n(
)xx(t4
21
21
222
211
21 −=+⋅+
−=
+
−+
σ−+σ−
−=
−
Statistică matematică 41
Deoarece )145,2;145,2(397,0t −∈−= , rezultă că vâscozităţile medii ale celor
două loturi de ulei nu diferă semnificativ.
Testul 2χ privind dispersia 2.3.17.
Fie caracteristica X ce urmează legea normală N(m,σ ) cu parametri
Rm∈ şi necunoscuţi. Vrem să verificăm ipoteza nulă în
raport cu ipoteza alternativă cunoscând probabilitatea de risc
şi o selecţie de volum n.
0>σ 20
20 :H σ=σ
,:H 20
21 σ≠σ
α
Considerăm caracteristica ( ) 2
2n
1k
2k2
2 )1n(XX1Hσ
σ−=−
σ= ∑
=
care
urmează legea cu n-1 grade de libertate, şi se determină pentru aceasta
intervalul numeric
2χ
α−=⎟⎟⎠
⎞⎜⎜⎝
⎛<< α
−−α
−1hHhP 2
21,1n
22
2,1n
Etapele aplicării testului:
1) Se consideră . n2120
2i x,...,x,x;; σ=σα
2) Se determină 2
hF a.î. h,h 2
2,1n1-n
2
21,1n
2
2,1n
α=⎟⎟
⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛α
−α
−−α
− şi
21hF 2
21,1n1n
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
−−− .
3) Se calculează ∑∑==
=−σ
=n
1kk
n
1k
2k2
0
2 xn1x,)xx(1h
4) Dacă ⎟⎟⎠
⎞⎜⎜⎝
⎛∈ α
−−α
−
2
21,1n
2
2,1n
2 h;hh atunci ipoteza este admisă,
altfel este respinsă.
20
2 σ=σ
Elemente de teoria probabilităţilor şi statistică matematică 42
Exemplul 2.3.18. Se efectuează o selecţie repetată de volum n=12
relativă la caracteristica X ce urmează legea normală ),m(N σ , obţinându-se
distribuţia empirică de selecţie
. ⎟⎟⎠
⎞⎜⎜⎝
⎛ −−−12111111215,12,118,06,02,002,04,05,0
:X
Să se verifice, cu nivelul de semnificaţie 05,0=α , ipoteza nulă
, cu alternativa 5,0)x(D:H 220 ==σ .5,0:H 2
1 ≠σ
Rezolvare:
Se utilizează testul . La nivelul de semnificaţie ; se
determină intervalul
2χ 05,0=α
⎟⎟⎠
⎞⎜⎜⎝
⎛α
−−α
−
2
21;1n
2
2;1n
h;h , pentru statistica 2
2)1n(H
σσ−
= , care
urmează legea cu n-1 grade de libertate; folosind tabelele de valori din 2χ
( ) ⇒= 025,0hF 2025,0;1111 82,3h 2
025,0;11 = şi ( ) 9,21h975,0hF 2975,0;11
2975,0;1111 =⇒=
Deci, intervalul pentru statistica este (3,82;21,9). 2H
Calculăm [ ] 4167,05,11...)4,0(2)5,0(1121x =⋅++−⋅+−⋅=
( ) 518,0xx1n
1 n
1k
2
k
2=−
−=σ ∑
=
; 396,115,0518,011)1n(h 2
0
22 =
⋅=
σσ−
=
Deoarece , ipoteza nulă făcută relativ la
dispersia teoretică este acceptată.
)9,21;82,3(396,11h 2 ∈=
Testul F (Snédécor - Fischer) 2.3.19.
Fie două populaţii C1 şi C2 referitor la care ne interesează
caracteristicile: X1 ce urmează ),m(N 11 σ şi X2 ce urmează . Cu
probabilitatea de risc α vrem să verificăm ipoteza nulă în
),m(N 22 σ
22
210 :H σ=σ
Statistică matematică 43
raport cu ipoteza alternativă , considerând câte o selecţie din
fiecare populaţie, respectiv de volum n
22
211 :H σ≠σ
1 şi n2.
Statistica 22
22
21
21F
σσ
σσ
= urmează legea Snédécor - Fischer cu
şi 1nm 1 −= 1nn 2 −= grade de libertate, iar intervalul numeric pentru
această statistică ⎟⎟⎠
⎞⎜⎜⎝
⎛α
−α
21;n,m
2;n,m
f,f se determină a.î.
α−=⎟⎟⎠
⎞⎜⎜⎝
⎛<< α
−α 1fFfP
21;n,m
2;n,m
. Extremităţile intervalului se determină din
relaţiile 2
fF2
;n,mn,mα
=⎟⎟⎠
⎞⎜⎜⎝
⎛α şi
21fF
21;n,mn,m
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
−, dacă este funcţia
de repartiţie a legii "F
)x(F n,m
s" şi are valorile tabelate.
Are loc relaţia β
β−
=1,,
,,1
mnnm f
f şi de aceea tabelele pentru
sunt întocmite numai pentru valori mari ale lui
)x(F n,m
β şi pentru F>1. Dacă F<1
intervalul numeric pentru F este dat prin⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛
−−
2;,
21;,2
1;,nmf
2;,
1;1;αα
αα
mnmnnm ff
f .
Etapele aplicării testului F:
1) Se consideră:
2n222211n1121121 x,...,x,x;x,...,x,x;1nn;1nm; −=−=α
2) Se determină: ⎟⎟⎠
⎞⎜⎜⎝
⎛α
−α
21;n,m
2;n,m
f;f astfel încât
2fF
2;n,mn,m
α=⎟⎟
⎠
⎞⎜⎜⎝
⎛α şi .
21fF
21;n,mn,m
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
−
Elemente de teoria probabilităţilor şi statistică matematică 44
3) Se calculează:
( ) ( )∑∑==
−−
=σ−−
=σσ
σ=
n
1k
22k2
2
22
n
1k
21k1
1
212
2
21 xx
1n1;xx
1n1;f
1
∑=
=1n
1kk1
1
1 xn1x , ∑
=
=2n
1kk2
2
2 xn1x .
4) Dacă ⎟⎟⎠
⎞⎜⎜⎝
⎛∈ α
−α
21;n,m
2;n,m
f;ff atunci ipoteza este admisă,
altfel este respinsă.
22
21 σ=σ
Exemplul 2.3.20. Două strunguri produc acelaşi tip de piese.
Caracteristica cercetată este diametrul acestor piese. Se consideră două
selecţii de volum 7n1 = şi , relativ la diametrele pieselor produse de
cele două strunguri. Datele de selecţie sunt prezentate prin distribuţiile
empirice de selecţie:
9n 2 =
⎟⎟⎠
⎞⎜⎜⎝
⎛2418,36,34,3
X1 şi . Considerând nivelul
de semnificaţie
⎟⎟⎠
⎞⎜⎜⎝
⎛22418,37,36,35,3
X2
05,0=α ; să se verifice ipoteza nulă cu
alternativa
210 :H σ=σ
,:H 211 σ≠σ dacă se presupune că X1 şi X2 urmează legea
normală ),m(N 11 σ şi respectiv ),m(N 22 σ .
Rezolvare:
Se utilizează testul F. Se determină intervalul ⎟⎟⎠
⎞⎜⎜⎝
⎛α
−α
21;n,m
2;n,m
f;f
pentru statistica F folosind tabelele de valori, a.î. 2
fF2
;n,mn,mα
=⎟⎟⎠
⎞⎜⎜⎝
⎛α şi
21fF
21;n,mn,m
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
−.
Statistică matematică 45
65,4f 975,0;8,6 = deoarece 975,0)65,4(F 8,6 =
18,060,51
f1f
975,0;6,8025,0;8,6 === . Rezultă intervalul (0,18;4,65)
Calculăm:
656,3)8,327,326,345,31(91x;629,3)8,326,344,31(
71x 21 =⋅+⋅+⋅+⋅==⋅+⋅+⋅=
( ) 01905,0xx1n
1 1n
1k
21k1
1
21 =−
−=σ ∑
=
; ( ) 01028,0xx1n
1 2n
1k
22k2
2
22 =−
−=σ ∑
=
.85,101028,001905,0f 2
2
21 ==
σ
σ=
Deoarece ),65,4;18,0(85,1f ∈= rezultă că ipoteza făcută privind
egalitatea dispersiilor, este admisă.
Teste de concordanţă
Testul 2χ 2.3.21.
Fie caracteristica X care are funcţia de repartiţie teoretică F. Ipoteza
statistică pe care o facem asupra caracteristicii X este că are funcţia de
repartiţie ),,...,;x(FF s10 λλ= unde s1 ,...,λλ sunt parametrii necunoscuţi.
Folosind datele de selecţie se estimează prin metoda
verosimilităţii maxime aceşti parametrii, obţinându-se Deci
ipoteza statistică devine În continuare se face o grupare a
datelor de selecţie obţinându-se distribuţia empirică de selecţie:
clasa reprezintă intervalul [a
n21 x,...,x,x
.,...,, *s
*2
*1 λλλ
).,...,;x(FF *s
*10 λλ=
⎟⎟⎠
⎞⎜⎜⎝
⎛
N21
N21
f...ff'x...'x'x
X i'x i-1,ai). Pentru clasa x'i
avem )a(F)a(Fp 1iii −−= necunoscută, dar putem calcula
Prin urmare, ipoteza făcută asupra ).,...,;a(F),...,;a(Fp *s
*11i0
*s
*1i0
*i λλ−λλ= −
Elemente de teoria probabilităţilor şi statistică matematică 46
funcţiei de repartiţie devine ipoteza nulă NippH ii ,1;: *0 == în ipoteza
alternativă falsă. Valoarea numerică 01 H:H ∑=
−=
N
1i*i
*ii2
p n)p nf(h este
valoarea unei variabile aleatoare ce urmează legea cu k = N-s-1 grade
de libertate. Deci pentru probabilitatea de risc
2H 2χ
α se determină intervalul
numeric ( )21,kh,0 α− corespunzător lui a.î. 2H ( ) α−=< α− 1hHP 2
1,k2 adică
( ) α−=α− 1hF 21,kk .
Etapele aplicării testului:
1) Se consideră: ),...,;x(FF;x,...,x,x; s10n21 λλ=α
2) Se determină intervalul ( )21,kh,0 α− a.î. ( ) α−=α− 1hF 2
1,kk
– estimările de verosimilitate maximă .,...,, *s
*2
*1 λλλ
– distribuţia empirică de selecţie N,1ii
i
fx
X=
⎟⎟⎠
⎞⎜⎜⎝
⎛
– se calculează ),...,,;a(F),...,,;a(Fp *s
*2
*11i0
*s
*2
*1i0
*1 λλλ−λλλ= −
– k = N-s-1
3) Se calculează ∑=
−=
N
1i*i
2*ii2
pn )p nf(h
4) Dacă atunci ipoteza F = F21,k
2 hh α−< 0 este admisă, altfel este
respinsă.
Observaţie 2.3.22. Testul nu este aplicabil dacă sunt mai
mici decât 5, caz în care se recomandă o nouă grupare a datelor de selecţie.
2χ *ipn
Testul lui Kolmogorov 2.3.23.
Se consideră caracteristica X care are funcţia de repartiţie teoretică
F. Dacă )x(Fn este funcţia de repartiţie de selecţie avem că
Statistică matematică 47
)x(K)xd n(Plim nn=<
∞→ unde )x(F)x(Fsupd n
Rxn −=
∈ iar
este funcţia lui Kolmogorov. Se face ipoteza H∑+∞
−∞=
−−=k
xk2k 22
e)1()x(K 0
că X urmează legea de probabilitate dată de funcţia de repartiţie F. Dacă H0
este adevărată şi pentru probabilitatea de risc α se poate determina valoarea
a.î. α−1x α−=α− 1)x(K 1 . Deci avem că α−=< α− 1)xdn(P 1n sau
α−=⎟⎠
⎞⎜⎝
⎛< α− 1
nx
dP 1n , adică dacă dn satisface inegalitatea
nx
d 1n
α−<
admitem ipoteza H0 altfel o respingem.
Etapele aplicării testului lui Kolmogorov:
1) Se consideră N21N,1ii
i f...ffn,F,f
'x:X; +++=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
=
2) Se calculează a.î. α−1x α−=α− 1)x(K 1
3) Se calculează 2
aa'x;)a(F)a(Fmaxd i1iiiin
N,1in
+=−= −
=
4) Dacă α−< 1n xdn ipoteza este admisă, altfel este respinsă.
Exemplul 2.3.24. Se consideră caracteristica X ce reprezintă
rezistenţa, în ΩK , a unor tronsoane de ceramică acoperite cu carbon. Să se
verifice normalitatea lui X, folosind o selecţie de volum n=124, pentru, care
s-au obţinut datele de selecţie.
Clasa (- ;1,65) [1,65;1,70) [1,70;1,75) [1,75;1,80) [1,80;1,85) [1,85;1,90) [1,90;1,95) [1,95;2,00) [2,0;+ ∞ ) ∞
Frecare 11 14 17 17 18 16 13 10 8
Elemente de teoria probabilităţilor şi statistică matematică 48
a) utilizând testul de concordanţă , cu nivelul de semnificaţie
2χ
;05,0=α
b) utilizând testul de concordanţă al lui Kolmogorov, cu nivelul de
semnificaţie ;05,0=α
Rezolvare:
Se cunoaşte că estimările de verosimilitate maximă pentru m şi
sunt respectiv
σ
,xm* = 2* µ=σ .
Distribuţia empirică de selecţie pentru caracteristica X este
⎟⎟⎠
⎞⎜⎜⎝
⎛81013161817171411125,2975,1925,1875,1825,1775,1725,1675,1625,1
:X
Calculăm
82,1)125,28...675,114625,111(124
1xm* =⋅++⋅+⋅==
( ) 129,082,1x124
1 124
1k
2*k2
* =−=µ=σ ∑=
a) se consideră valoarea numerică
∑=
−=
N
1i*i
2*ii2
p n)p nf(h , unde N =9,
6129k;2s;maamap *
*1i
*
*i*
i =−−==⎟⎟⎠
⎞⎜⎜⎝
⎛σ−
Φ−⎟⎟⎠
⎞⎜⎜⎝
⎛σ−
Φ= −
Se determină intervalul ( ),h,0 21,k α− pentru statistica , folosind
tabelele de valori şi se obţine adică intervalul (0;12,59).
2H
59,12h 295,0;6 =
Calculele pentru se fac în tabelul: 2h
Statistică matematică 49
ia if *
*
σmai − ⎟⎟
⎠
⎞⎜⎜⎝
⎛σ−
Φ *
*i ma *
ip *ip n *
i
2*ii
p n)p nf( −
1,65
1,70
1,75
1,80
1,85
1,90
1,95
2,00
∞+
11
14
17
17
18
16
13
10
8
-1,32
-0,93
-0,54
-0,16
0,23
0,62
1,01
1,40
∞+
-0,4066
-0,3238
-0,2054
-0,0636
-0,0910
0,2324
0,3437
0,4192
0,5000
0,0934
0,0828
0,1184
0,1418
0,1546
0,1414
0,1113
0,0755
0,0808
11,5816
10,2672
14,6816
17,5832
19,1704
17,5336
13,8012
9,3620
10,0192
0,02921
1,35712
0,36610
0,01934
0,07146
0,13414
0,04651
0,04348
0,40694
n=124 4743,2h 2 =
Valorile funcţiei lui Laplace Φ se iau din tabele şi se are în vedere
că )x()x( Φ−=−Φ şi
=−∞Φ−−Φ=⎟⎟⎠
⎞⎜⎜⎝
⎛σ−
Φ−⎟⎟⎠
⎞⎜⎜⎝
⎛σ−
Φ= )()32,1(mamap *
*0
*
*1*
1
0934,05,04066,0 =+−=
Deoarece rezultă că se acceptă ipoteza
normalităţii lui X.
),59,12;0(4743,2h 2 ∈=
b) Pentru 05,0=α , folosind tabelele de valori, se determină
a.î. 95,01 xx =α− α−=α− 1)x(K 1 , adică 36,1x 95,0 = .
Ipoteza că X urmează legea normală , cu şi
calculaţi anterior, este acceptată dacă
),m(N ** σ *m
*σ ,xdn 1n α−< unde
)a(F)a(Fmaxd iinN,1i
n −==
.
Elemente de teoria probabilităţilor şi statistică matematică 50
Aici )x(Fn este funcţia de repartiţie de selecţie, iar F(x) este funcţia
de repartiţie pentru legea normală Calculele pentru determinarea
lui d
).,m(N ** σ
n sunt date în tabelul următor:
ia if ∑=
i
1jjf
)a(F in *
*i maσ− F(ai) )a(F)a(F iin −
1,65
1,70
1,75
1,80
1,85
1,90
1,95
2,00
∞+
11
14
17
17
18
15
13
10
8
11
25
42
59
77
93
106
116
124
0,0887
0,2016
0,3387
0,4758
0,6210
0,7500
0,8548
0,9355
1,0000
-1,32
-0,93
-0,54
-0,16
0,23
0,62
1,01
1,40
∞+
0,0934
0,1762
0,2946
0,4364
0,5910
0,7324
0,8437
0,9192
1,0000
0,0047
0,0254
0,0441
0,0394
0,0300
0,0176
0,0111
0,0163
0
dn= 0,0441
Deoarece ,36,1491,00441,0124dn n <=⋅= acceptăm ipoteza că
X urmează legea normală ).,m(N ** σ
2.4. Corelaţie şi regresie
Definiţie 2.4.1. Fie (X1,Y1), ..., (Xn, Yn) o selecţie repetată de volum
n asupra vectorului aleator (X, Y). Se numeşte coeficient de corelaţie de
selecţie
∑∑∑∑
∑==
==
= ==−−
−−=
n
ii
n
iin
i
n
i
n
i yn
yxn
xundeyyxx
yyxxr
11
1
21
1
21
111 11
)()(
))((
Statistică matematică 51
Observaţia 2.4.2. Se arată că aceasta este o funcţie de estimaţie a lui
r, adică r tinde în probabilitate către r, n ∞→ .
Observaţia 2.4.3.
1) Coeficientul de corelaţie de selecţie r este cuprins între -1 şi 1.
2) Dacă r = ± 1, atunci punctele (X1,Y1), ..., (Xn, Yn) se găsesc pe
dreapta de ecuaţie
22)( yx
x
y siundexxyy σσσσ
−−
+=−
sunt respectiv funcţiile de estimaţie absolut corectă ale dispersiilor σX2 şi
σY2, adică
1
)(,
1
)(1
2
21
2
2
−
−=
−
−=
∑∑==
n
yy
n
xxn
ii
y
n
ii
x σσ
Observaţia 2.4.4. Considerând funcţia de regresie liniară a
variabilei Y în raport cu variabila X dată de ecuaţia baxy += , unde
se obţine valoarea )/( xYMy = baxy ii +=' şi reziduul iii yy −= 'δ fiind
. )/( ixYM
Mulţimea valorilor δi determină variabila aleatoare reziduală δ, care,
prin prisma definiţiei funcţiei regresive are media nulă 0)( =δM . Calculând
dispersia variabilei δ, pe care o numim dispersia reziduală, notând-o σR2,
avem unde dispersia
reziduală este tot una cu dispersia variabilei condiţionate
)/()]/(/[])0[()( 2222 xYDxYMYMMD ==−= δδ
xY / .
Cum avem rezultă de asemenea
pentru regresia variabilei Y în raport cu variabila X.
Inversând, se scrie şi formula obţinută poate fi folosită
)1( 222/ rYxY −=σσ
)1( 222 rYR −=σσ
222 /1 YRr σσ−=
Elemente de teoria probabilităţilor şi statistică matematică 52
pentru determinarea coeficientului de corelaţie r, atunci când regresia
variabilei Y în raport cu X şi variabilele au repartiţii normale. Această
valoare a lui r este numită coeficientului de corelaţie în regresia liniară.
Exemplul 2.4.5. Fie caracteristicile:
X – reprezentând în procente suprafaţa comercială de expunere a mărfurilor
spre vânzare faţă de suprafaţa construită şi
Y – reprezentând volumul valoric al vânzărilor, raportat la metru pătrat
suprafaţă de prezentare a mărfurilor pe lună, în mii lei.
Acestea fiind cunoscute prin următoarele date de selecţie:
X 10 12 15 17 26
Y 40 45 42 53 60
Se cere:
a) Să se determine coeficientul de corelaţie al variabilelor X şi Y;
b) Să se determine dreapta de regresie a lui Y faţă de X;
c) Cu ajutorul dreptei de regresia de mai sus, să se facă prognoza
volumului valoric al vânzărilor Y când X ia valoarea 30.
Rezolvare:
Organizăm calculele în tabelul următor:
ix iy xxi − yyi − 2)( xxi −2)( yyi −
22 )()( yyxx ii −−
10
12
15
17
26
-----
80
40
45
42
53
60
-----
240
-6
-4
-1
1
10
-8
-3
-6
5
12
36
16
1
1
100
-----
154
64
9
36
25
144
-----
278
48
12
6
5
120
Statistică matematică 53
a) 165
8051 5
1
=== ∑=i
ixx ; 485
24051 5
1=== ∑
=iiyy ; 95,0
278154191
=−
=r
b) Pentru dreapta de regresie a lui Y în raport cu X calculăm:
∑=
==−−
=n
iix xx
n 1
228,30
4154)(
11σ de unde 5,58,30 ==xσ
∑=
==−−
=n
iiy yy
n 1
226,55
4278)(
11σ de unde 3,76,55 ==yσ
Obţinem )16(5,53,795,048 −⋅=− xy sau 2,273,1 += xy
c) Prognoza volumului valoric al vânzărilor se obţine calculând
valoarea lui y pentru x = 30.
Avem: 2,662,27303,16 =+⋅=y .
2.5. Probleme rezolvate
1. Fie caracteristica X, care are distribuţia empirică de selecţie:
X : . ⎟⎟⎠
⎞⎜⎜⎝
⎛12424250,4025,4000,4075,3950,3925,39
Se cere:
a) media de selecţie, momentul centrat de selecţie de ordinul doi şi
dispersia de selecţie;
b) funcţia de repartiţie de selecţie.
Rezolvare:
a) Media de selecţie este:
( ) 80,395,40225,40440275,3945,39225,39151151 6
1
'
=+⋅+⋅+⋅+⋅+⋅=
=⋅= ∑=k
kk fxx
Elemente de teoria probabilităţilor şi statistică matematică 54
Momentul centrat de selecţie de ordinul doi este:
( )
( ) ( ) ( )[ ] 135,0...8,3975,3928,395,3948,3925,392151
151)(
222
6
1
2'2
=+−⋅+−⋅+−⋅=
=−⋅= ∑=k
kk xxfXµ
Valoarea dispersiei de selecţie se calculează folosind momentul
centrat de selecţie de ordinul doi şi anume:
144,0)(1415)( 2
2== XX µσ
b) Funcţia de repartiţie de selecţie este:
⎪⎪⎪⎪
⎩
⎪⎪⎪⎪
⎨
⎧
>≤<
≤<≤<
≤<≤<
≤
=
50,40,150,4025,40,15/14
25,4040,15/124075,39,15/8
75,3950,39,15/650,3925,39,15/2
25,39,0
)(15
xdacaxdaca
xdacaxdaca
xdacaxdaca
xdaca
XF .
2. În urma unei selecţii de volum n = 100, privind caracteristica X s-
au obţinut următoarele date de selecţie:
xI 10,50 10,55 10,60 10,65 10,70 10,75 10,80
fI 10 12 16 21 18 14 9
Se cere:
Statistică matematică 55
a) o estimaţie absolut corectă pentru media teoretică m = M(X);
b) o estimaţie corectă şi una absolut corectă pentru dispersia
teoretică σ2 = D2(X).
Rezolvare:
a) Media de selecţie este un estimator absolut corect pentru media
teoretică şi prin urmare valoarea mediei de selecţie este o estimaţie absolut
corectă . Folosind datele de selecţie avem următoarea distribuţie empirică de
selecţie:
⎟⎠
⎞⎜⎝
⎛914182116121080,1075,1070,1065,1060,1055,1050,10
:X
iar media de selecţie este:
( ) 65,10...166,101255,10105,10100
1=+⋅+⋅+⋅=x
b) O estimaţie corectă pentru dispersia teoretică este reprezentată de
valoarea momentului centrat de selecţie de ordinul doi, adică:
( ) ( )[ ] 0077,0...65,1055,101265,1050,1010100
1)( 222 =+−⋅+−⋅=Xµ
O estimaţie absolut corectă pentru dispersia teoretică este reprezentată
de valoarea dispersiei de selecţie, adică:
0078,0)(99
100)( 22
== XX µσ .
3. Fie caracteristica X, care are distribuţia teoretică X :
unde p∈(0,1) este necunoscut. Se consideră o selecţie de volum n, relativă la
⎟⎟⎠
⎞⎜⎜⎝
⎛− pp 101
Elemente de teoria probabilităţilor şi statistică matematică 56
caracteristica X. să se arate că funcţia de selecţie V = )1(1
1−
−XnX
n, unde
∑=
=n
kkX
nX
1
1 , este o funcţie de estimaţie nedeplasată pentru p2.
Rezolvare:
Pentru caracteristica X avem M(X) = p şi D2(X) = p – p2.
Funcţia de estimaţie V este un estimator nedeplasat al parametrului
p2 dacă M(V) = p2.
Calculăm
( )
( ) ( )XMn
XMn
n
Xn
Xn
nMXnXn
MVM
11
1
11
11
11)(
2
2
−−
−=
=⎟⎠⎞
⎜⎝⎛
−−
−=⎟
⎠⎞
⎜⎝⎛ −
−=
Folosind faptul că variabilele de selecţie sunt liniar independente şi
identic repartizate cu X avem:
( ) ( ) ( ) ( )∑∑∑===
====⎟⎠
⎞⎜⎝
⎛=
n
k
n
kk
n
kk pXMXM
nXM
nX
nMXM
111
111 ;
( ) ( ) ( )[ ]222 XMXMXD −=
( ) ( ) ( )∑ ∑∑= ==
−===⎟
⎠
⎞⎜⎝
⎛=
n
k
n
kk
n
kk n
ppXDn
XDn
Xn
DXD1
2
1
22
22
1
22 111
( )n
nppppn
ppXM22
222 +−
=+−
= .
Obţinem:
( ) 222
11
1pp
nnnppp
nnVM =⋅
−−
+−⋅
−=
adică, V este un estimator nedeplasat al parametrului p2.
Statistică matematică 57
4. Fie caracteristica X ce urmează legea lui Poisson, cu parametrul λ
> 0 necunoscut. Se consideră o selecţie repetată de volum n. Se cere:
a) estimatorul λ∗ de verosimilitate maximă pentru parametrul λ;
b) să se arate că λ∗ este estimator absolut corect pentru λ;
c) să se arate că λ∗ este estimator eficient pentru λ.
Rezolvare:
a) Ţinând seama că variabila aleatoare X are repartiţia Poisson cu
şi λ== )()( 2 XDXM!
);(x
exfxλλ λ−= , avem:
!lnln);(ln xxxf −+−= λλλ iar
λλλ xxf
+−=∂
∂ 1);(ln .
∑ ∑= =
⎟⎠⎞
⎜⎝⎛ +−=
∂∂
=∂
∂ n
k
n
k
kk XXfV1 1
1);(lnlnλλ
λλ
.
Ecuaţia de verosimilitate maximă devine
011
=⎟⎠⎞
⎜⎝⎛ +−∑
=
n
k
kXλ
, iar estimatorul de verosimilitate maximă pentru
parametrul λ este X=*λ .
b) Calculăm:
λλ =⋅===⎟⎟⎠
⎞⎜⎜⎝
⎛= ∑∑∑
=== nnXM
nXM
nX
nMXM
n
j
n
jj
n
jj
111)(1)(11)(
0)(1)(11)( 21
22
1
22
1
22 →=⋅===⎟⎟⎠
⎞⎜⎜⎝
⎛= ∑∑∑
=== nnnXD
nXD
nX
nDXD
n
j
n
jj
n
jj
λλ
când n → ∞ şi deci media de selecţie este un estimator absolut corect al lui λ.
c) Avem:
Elemente de teoria probabilităţilor şi statistică matematică 58
)(121
)(1)(2121);(ln
22
222
22
λλλ
λλ
λλλλλλ
++⋅−=
=+−=⎟⎟⎠
⎞⎜⎜⎝
⎛+−=
⎥⎥⎦
⎤
⎢⎢⎣
⎡⎟⎠⎞
⎜⎝⎛
∂∂ XMXMXXMXfM
Rezultă cantitatea de informaţie λλ
λλ nXfnMI =⎥⎥⎦
⎤
⎢⎢⎣
⎡⎟⎠⎞
⎜⎝⎛
∂∂
=2);(ln)(
Întrucât egalitatea )(
1)(2
λIXD = este verificată, rezultă că X este
un estimator eficient al lui λ.
5. Relativ la populaţia C, se cercetează caracteristica X ce urmează
legea normală N(m,σ), cu media teoretică m = M(X) necunoscută şi dispersia
σ2=0,06. Să se determine intervalul de încredere pentru m, cu probabilitatea
de încredere 1-α = 0,9 dacă se cunosc datele de selecţie:
10.5; 10.8; 11.2; 10.9; 10.4; 10.6; 10.9; 11.0; 10.3; 10.8; 10.6; 11.3;
10.5; 10.7; 10.8; 10.9; 10.8; 10.7; 10.9; 11.0.
Rezolvare:
Pentru caracteristica X avem următoarea distribuţie empirică de
selecţie:
⎟⎠
⎞⎜⎝
⎛1124422211
3,112,11119,108,107,106,105,104,103,10:X
Folosind aplicaţia 1., intervalul de încredere pentru media teoretică
m este , unde )m,m( 212
11 zn
xm α−
σ−= şi
212 z
nxm α
−
σ+= ;
21
z α−
se determină astfel încât 450,02
1,2
1)(2
1=
−−=Φ
−
αααz , folosind
tabelele cu valorile funcţiei Laplace, 65,12
1=⇒
−αz .
Statistică matematică 59
78,10)3,11
2,111129,1048,1047,1026,1025,1024,103,10(201
=+
+⋅+⋅+⋅+⋅+⋅+⋅++=x
Rezultă 75,1065,12006,078,101 =⋅−=m ,
80,1065,12006,078,102 =⋅+=m , adică )80,10;75,10(∈m .
6. Se efectuează 12 măsurători independente asupra caracteristicii X,
rezultatele obţinute dând distribuţia empirică de selecţie
X : . ⎟⎟⎠
⎞⎜⎜⎝
⎛ −−−12111111215.12.118.06.02.002.04.05.0
Folosind probabilitatea de încredere 0.95, să se determine intervalul
de încredere pentru valoarea medie teoretică m = M(X).
Rezolvare:
Deoarece abaterea standard )X(D2=σ este necunoscută, conform
aplicaţiei 2. intervalul de încredere pentru m este (m1,m2) unde
21,1n1 t
nxm α
−−
σ−= şi
21,1n2 t
nxm α
−−
σ+= . Pentru n-1=11 şi 975,0
21 =−
α
din tabelul cu valorile funcţiei de repartiţie a legii Student se determină
201,22
1,1=
−−αn
t .
Folosind distribuţia empirică de selecţie se obţine:
( ) 4,05,12,1218,06,02,0)2,0()4,0(25,0121
=+⋅+++++−+−⋅+−=x iar
719,0)(111 10
1
2 =−= ∑=k
kk xxfσ
Elemente de teoria probabilităţilor şi statistică matematică 60
Obţinem: 05,0201,212719,04,01 −=⋅−=m ;
85,0201,212719,04,02 =⋅+=m adică )85,0;05,0(−∈m .
7. Caracteristicile X1 şi X2 relative la două populaţii independente,
urmează fiecare legea normală, respectiv N(m1,σ1) şi N(m2, σ2), unde σ1=
0.005 şi σ2=0.0045. Relativ la aceste caracteristici s-au obţinut următoarele
date de selecţie:
X1 : 0.240; 0.240; 0.235; 0.250; 0.235;
X2 : 0.220; 0.225; 0.220; 0.225; 0.235.
Folosind probabilitatea de încredere 0.98 să se determine intervalul
de încredere pentru diferenţa m1- m2.
Rezolvare:
Conform aplicaţiei 3. a) intervalul de încredere pentru m1-m2 este
(A,B) unde
( )2
22
1
21
2121 nn
zxxA σ+
σ−−= α
− şi ( )
2
22
1
21
2121 nn
zxxB σ+
σ+−= α
−
iar 2
1z α
− se determină a.î. 49,0
21z
21
=α−
=⎟⎟⎠
⎞⎜⎜⎝
⎛Φ α
−.
Folosind tabelul cu valorile funcţiei lui Laplace obţinem
33,2z2
1=α
−.
Valorile mediilor de selecţie pentru cele două caracteristici sunt:
( ) 240,0250,02240,02235,051
1 =+⋅+⋅=x
( ) 225,0235,02225,02220,051
2 =+⋅+⋅=x
Statistică matematică 61
Deci :
022,000000405,0000005,033,2015,0
008,000000405,0000005,033,2015,0
=++=
=+−=
B
A )022,0;008,0(21 ∈−⇒ mm
8. Cu datele problemei precedente, dar cu σ1 = σ2 = σ necunoscut, să
se determine intervalul de încredere pentru diferenţa m1- m2.
Rezolvare:
Conform aplicaţiei 3. b) intervalul de încredere pentru m1-m2 este
(A,B) unde StxxA2
1,n21 ⋅−−= α
− şi StxxB
21,n
21 ⋅−−= α−
dacă
( ) ( )[ ]222
211
21
21 1n1n2nn
n1
n1
S σ−+σ−−+
+=
21,n
t α−
iar se determină a.î.
21tF
21,n
nα
−=⎟⎟⎠
⎞⎜⎜⎝
⎛α
−.
Pentru 99,02
1 =−α şi n=8 obţinem 896,2
21,
=−αn
t .
Avem 240,01 =x , 225,02 =x şi calculăm:
( )
( )
)026,0;004,0(026,00038,0896,2015,0004,00038,0896,2015,0
:Re
0038,0)0000375,040000375,04(8
51
51
0000375,041
0000375,041
21
5
1
222
22
5
1
211
21
∈−⇒=⋅+==⋅−=
=⋅+⋅+
=
=−=
=−=
∑
∑
=
=
mmBA
zultă
S
xx
xx
kk
kk
σ
σ
Elemente de teoria probabilităţilor şi statistică matematică 62
9. Caracteristica X urmează legea normală N(m, σ). Se consideră o
selecţie repetată de volum n = 15 relativă la X cu datele de selecţie:
23,1; 22,8; 22,9; 23,0; 22,7; 22,9; 23,2; 22,9; 23,3; 23,2; 23,0; 22,9;
23,1; 23,2; 22,9.
Să se determine intervalul de încredere pentru dispersia σ2 = D2(X)
şi pentru abaterea standard σ, folosind probabilitatea de încredere 0,9.
Rezolvare:
Conform aplicaţiei 4. intervalul de încredere pentru este 2σ
( )22
21 ,σσ unde 2
21,1n
221 h
)1n(
α−−
σ−=σ şi 2
2,1n
222 h
)1n(
α−
σ−=σ iar 2
21,1n
h α−−şi 2
2,1n
h α−
se
determină folosind tabelele de valori pentru funcţia de repartiţie a legii cu
n-1 grade de libertate.
2χ
Avem: şi 14,292995,0;14 =h 07,42
005,0;14 =h
⎟⎟⎠
⎞⎜⎜⎝
⎛1322511
3,232,231,23239,228,227,22:X
00029,0)(141
23)3,232,2331,2322329,2258,227,22(151
15
1
22∑=
=−=
=+⋅+⋅+⋅+⋅++=
kk xx
x
σ
Rezultă: 00013,014,29
00029,01421 =
⋅=σ şi 00099,0
07,400029,0142
2 =⋅
=σ
)00099,0;00013,0(2 ∈⇒σ şi )031,0;011,0(∈σ .
10. Caracteristica X reprezintă media obţinută de un student care a
promovat anul întâi de studii. Să se verifice, cu nivelul de semnificaţie α =
0,05, ipoteza că media teoretică m = M(X) = 7,25, dacă se consideră σ = 1,5
Statistică matematică 63
şi s-a făcut un sondaj de volum n = 42, pentru care s-au obţinut datele de
selecţie
Media 5 - 5,99 6 – 6,99 7 – 7,99 8 – 8,99 9 – 10
Frecvenţa 5 8 18 6 5
Rezolvare:
Deoarece n=42>30 şi 5,1=σ este cunoscut, folosim testul Z pentru
verificarea ipotezei nule H0:m=7,25 cu alternativa .25,7:1 ≠mH
Distribuţia empirică de selecţie este:
⎟⎟⎠
⎞⎜⎜⎝
⎛5618855,95,85,75,65,5
:X
Pentru α=0,05 folosind testul Z se determină 975,02
1zz =
−α a.î.
( ) 475,02
1975,0 =
−=Φ
αz . Se obţine z0,975=1,96, care ne dă intervalul numeric
pentru statistica 6)(-1,96;1,9
n
mXZσ−
= . Calculăm
( ) 45,75,955,865,7185,685,55421
=⋅+⋅+⋅+⋅+⋅=x
86,0
425,1
25,745,7=
−=
−=
n
mxz σ .
Deoarece z = 0,86 ( 96,1;96,1− )∈ ipoteza se acceptă.
11. Caracteristica X reprezintă rezistenţa la rupere a cablurilor
produse de o anumită fabrică. Considerând că X urmează legea de
probabilitate normală N(m, σ), să se verifice, folosind nivelul de semnificaţie
α = 0,05, ipoteza că media teoretică a rezistenţei la rupere a cablurilor este de
Elemente de teoria probabilităţilor şi statistică matematică 64
400 kg, dacă se dispune de o selecţie de volum n = 10, cu următoarele date de
selecţie: 401; 403; 398; 398; 400,5; 399; 396; 401,5; 400,5; 398,5.
Rezolvare:
Ipoteza nulă ce se face este H0:m=400, cu alternativa . 400:1 ≠mH
Deoarece σ este necunoscută, folosind testul T, cu α=0,05 şi tabelele
de valori se determină 2
1,1nt α
−− a.î. 975,0
21tF
21,1n1n =
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
−−− . Se obţine
t9;0,975 =2,262. Prin urmare intervalul numeric pentru statistica
n
mXTσ−
=
este (-2,262; 2,262).
Calculăm 2,400...)3995,3983982396(101
=+++⋅+=x
86,5)(91 10
1
22=−= ∑
=kk xxσ 107,0
1086,5
4002,4000 =−
=−
=
n
mxtσ
Întrucât 0,107 )262,2;262,2(−∈ , ipoteza că media de rezistenţă la
rupere a cablurilor este de 400 se acceptă.
12. Două maşini produc piese de acelaşi tip. Fie X1 dimensiunea
pieselor produse de prima maşină, respectiv X2 să fie dimensiunea pieselor
produse de a doua maşină, fiecare urmând legea normală, respectiv
N(m1,0,02) şi N(m2,0,15). Să se verifice, folosind nivelul de semnificaţie α =
0,05, ipoteza că mediile dimensiunilor pieselor (în mm) produse de cele două
maşini sunt egale, cu alternativa că ele diferă, dacă se dispune de selecţiile,
care au ca distribuţii empirice de selecţie, respectiv
X1 : şi X⎟⎟⎠
⎞⎜⎜⎝
⎛1419161105.500.595.490.4
2 : . ⎟⎟⎠
⎞⎜⎜⎝
⎛7148610.500.595.490.4
Statistică matematică 65
Rezolvare:
Verificarea ipotezei nule H0:m1=m2 cu alternativa , se
va face cu testul Z.
211 mm:H ≠
Folosind nivelul de semnificaţie 05,0=α se determină din tabele
valoarea 975,02
1zz =
−α a.î. 475,0
21
21
=−
=⎟⎟⎠
⎞⎜⎜⎝
⎛Φ
−
ααz . Se obţine ,
care ne dă intervalul (-1,96; 1,96) pentru statistica
96,1975,0 =z
2
22
1
21
2121nn
)]mm()XX[(Zσ
+σ
−−−= .
Calculăm:
98,4)05,51451995,41690,411(601
1 =⋅+⋅+⋅+⋅=x
99,4)10,5751495,4890,46(351
2 =⋅+⋅+⋅+⋅=x
0025,0350225,0
600004,0)99,498,4()(
2
22
1
21
21 −=+−=+−=nn
xxz σσ
Deoarece )96,1;96,1(0025,0 −∈−=z , rezultă că mediile dimensiunilor
pieselor nu diferă semnificativ pentru cele două maşini.
13. Două maşini produc acelaşi tip de articol. Se efectuează două
selecţii de volume n1=12 şi n2=15 şi se măsoară dimensiunea produselor,
datele de selecţie sunt trecute în tabelul următor
x1k 3,5 3,6 3,7 3,8 x2k 3,4 3,6 3,8
f1k 3 4 2 3 f2k 2 4 9
Considerând nivelul de semnificaţie α = 0,01, să se verifice ipoteza
că mediile dimensiunilor articolelor produse de cele două maşini nu diferă
Elemente de teoria probabilităţilor şi statistică matematică 66
semnificativ, ştiind că dispersiile teoretice pentru cele două caracteristici
coincid.
Rezolvare:
Caracteristicile X1 şi X2, ce reprezintă dimensiunile articolelor
produse de cele două maşini, se consideră că urmează fiecare legea normală,
respectiv ),m(N 1 σ şi ),m(N 2 σ , cu abaterea standard 0>σ necunoscută.
Verificarea ipotezei nule 210 mm:H = cu alternativa ,
se va face cu testul T, deoarece abaterea standard
211 mm:H ≠
σ este necunoscută.
Folosind nivelul de semnificaţie 01,0=α , se determină folosind tabelele,
valoarea 2
1,nt α
−, a.î.
21tF
21,nn
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
− , unde n=n1+n2-2.
Adică se obţine intervalul pentru
statistica
,787,2995,0;25 =t 787)(-2,787;2,
21
21
222
211
2121
n1
n1
2nn
)1n()1n(
)mm()XX(T+
−+
σ−+σ−
−−−= care urmează legea
Student cu n grade de libertate.
Calculăm:
64,3)8,337,326,345,33(121
1 =⋅+⋅+⋅+⋅=x
69,3)8,396,344,32(151
2 =⋅+⋅+⋅=x
( ) 0135,01
1 1
1
211
1
21 =−
−= ∑
=
n
kk xx
nσ
( ) 0221,01
1 2
1
222
2
22 =−
−= ∑
=
n
kk xx
nσ
Statistică matematică 67
954,0
151
121
250221,0140135,011
69,364,3
112
)1()1(
)(
21
21222
211
21
−=+⋅+⋅
−=
=+
−+
−+−
−=
nn
nn
nn
xxtσσ
Deoarece )787,2;787,2(954,0 −∈−=t , rezultă că mediile articolelor produse
de cele două maşini nu diferă semnificativ.
14. Se cercetează caracteristica X ce reprezintă diametrul pieselor
produse de o maşină (în mm). Ştiind că X urmează legea normală N(m,σ) şi
având o selecţie de volum n = 11, care ne dă distribuţia empirică de
selecţie X : , ⎟⎟⎠
⎞⎜⎜⎝
⎛153265,1060,1055,1050,10
să se verifice ipoteza nulă H0 : σ2 = 0,003, cu alternativa H1 : σ2 ≠ 0,003, cu
nivelul de semnificaţie α = 0,01.
Rezolvare:
Se utilizează testul . La nivelul de semnificaţie 2χ 01,0=α ; se
determină intervalul ⎟⎟⎠
⎞⎜⎜⎝
⎛α
−−α
−
2
21;1n
2
2;1n
h;h , pentru statistica 2
2)1n(H
σσ−
= , care
urmează legea cu n-1 grade de libertate; folosind tabelele de valori din 2χ
( ) ⇒= 005,02005,0;1010 hF 16,22
005,0;10 =h şi ( ) 21,23995,0 2995,0;10
2995,0;1010 =⇒= hhF
Deci, intervalul pentru statistica este (2,16; 23,21). 2H
Calculăm
[ ] 57,1065,1016,10555,1035,102111
=⋅+⋅+⋅+⋅=x
Elemente de teoria probabilităţilor şi statistică matematică 68
( ) 0021,01
11
22=−
−= ∑
=
n
kk xx
nσ ; 3,7
003,00021,010)1(
20
22 =
⋅=
−=
σσnh .
Deoarece , ipoteza nulă făcută relativ la
dispersia teoretică este acceptată.
)21,23;16,2(3,72 ∈=h
15. Se cercetează aceeaşi caracteristică pentru două populaţii
independente, care este respectiv X1 pentru prima populaţie şi X2 pentru a
doua, fiecare urmând legea normală N(m1, σ1) şi N(m2, σ2). Se
consideră selecţiile de volume n1=10 şi n2=12, care ne dau distribuţiile
empirice de selecţie:
X1 : şi X⎟⎟⎠
⎞⎜⎜⎝
⎛1142229,185,18,17,1
2 : . ⎟⎟⎠
⎞⎜⎜⎝
⎛1224211,229,185,18,175,1
Considerând nivelul de semnificaţie α = 0,02, să se compare
dispersiile celor două populaţii.
Rezolvare:
Se utilizează testul F. Se determină intervalul ⎟⎟⎠
⎞⎜⎜⎝
⎛α
−α
21;n,m
2;n,m
f;f
pentru statistica F folosind tabelele de valori, a.î. 2
fF2
;n,mn,mα
=⎟⎟⎠
⎞⎜⎜⎝
⎛α şi
21fF
21;n,mn,m
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
−, m = n1-1 , n = n2 –1.
63,499,0;11,9 =f deoarece 99,0)63,4(11,9 =F
19,018,511
99,0;9,1101,0;11,9 ===
ff . Rezultă intervalul (0,19; 4,63)
Calculăm:
Statistică matematică 69
88,1)1,21229,1285,148,1275,11(121
;83,1)219,119,148,127,12(101
2
1
=⋅+⋅+⋅+⋅+⋅+⋅=
=⋅+⋅+⋅+⋅+⋅=
x
x
( ) 0078,01
1 1
1
211
1
21 =−
−= ∑
=
n
kk xx
nσ ;
( ) 0101,01
1 2
1
222
2
22 =−
−= ∑
=
n
kk xx
nσ
.77,00101,00078,0
22
21 ===
σ
σf
Deoarece ),63,4;19,0(77,0 ∈=f rezultă că ipoteza făcută privind
egalitatea dispersiilor, este admisă.
16. Pentru a cerceta dacă durata de ardere a două loturi de becuri
este aceeaşi s-a luat câte un eşantion de 15 de becuri din fiecare lot, care au
fost încercate în privinţa caracteristici studiate şi s-au obţinut următoarele
rezultate:
1070; 1110; 1050; 1090; 1140; 1130; 1240; 1010; 1030; 1110; 1100; 1160;
1100; 1060; 1020;
ore de ardere pentru eşantionul din primul lot şi respectiv
1100; 1170; 990; 1180; 1140; 1130; 1110; 1090; 1100; 1130; 1220; 1030;
1010; 1130; 1110;
ore de ardere pentru eşantionul din al doilea lot.
a) folosind nivelul de semnificaţie α = 0,02, să se verifice dacă
dispersiile pentru cele două loturi nu diferă semnificativ;
b) folosind nivelul de semnificaţie α = 0,05 şi rezultatul de la
punctul precedent, să se verifice dacă duratele medii de ardere pentru cele
două loturi sunt aceleaşi.
Elemente de teoria probabilităţilor şi statistică matematică 70
Rezolvare:
a) Se utilizează testul F. Se determină intervalul ⎟⎟⎠
⎞⎜⎜⎝
⎛α
−α
21;n,m
2;n,m
f;f
pentru statistica F folosind tabelele de valori, a.î. 2
fF2
;n,mn,mα
=⎟⎟⎠
⎞⎜⎜⎝
⎛α şi
21fF
21;n,mn,m
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
−, m = n1-1 , n = n2 –1.
70,399,0;14,14 =f deoarece 99,0)70,3(14,14 =F
27,070,311
99,0;14,1401,0;14,14 ===
ff . Rezultă intervalul (0,27; 3,70)
Calculăm:
1110...)118099011701100(151
;1095...)1090105011101070(151
2
1
=++++=
=++++=
x
x
( ) 64,35691
1 1
1
211
1
21 =−
−= ∑
=
n
kk xx
nσ ;
( ) 28,38641
1 2
1
222
2
22 =−
−= ∑
=
n
kk xx
nσ
.92,028,386464,3569
22
21 ===
σ
σf
Deoarece ),70,3;27,0(92,0 ∈=f rezultă că ipoteza făcută privind
egalitatea dispersiilor, este admisă.
b) Caracteristicile X1 şi X2, ce reprezintă duratele medii de ardere
pentru cele două loturi, se consideră că urmează fiecare legea normală,
respectiv ),m(N 1 σ şi ),m(N 2 σ , cu abaterea standard 0>σ necunoscută.
Statistică matematică 71
Verificarea ipotezei nule 210 mm:H = cu alternativa ,
se va face cu testul T, deoarece abaterea standard
211 mm:H ≠
σ este necunoscută.
Folosind nivelul de semnificaţie 05,0=α , se determină folosind tabelele,
valoarea 2
1,nt α
−, a.î.
21tF
21,nn
α−=⎟⎟
⎠
⎞⎜⎜⎝
⎛α
− , unde n=n1+n2-2.
Adică se obţine intervalul pentru
statistica
,048,2975,0;28 =t 048)(-2,048;2,
21
21
222
211
2121
n1
n1
2nn
)1n()1n(
)mm()XX(T+
−+
σ−+σ−
−−−= care urmează legea
Student cu n grade de libertate.
Calculăm:
673,0
151
151
2828,38641464,356914
11101095
112
)1()1(
)(
21
21222
211
21
−=+⋅+⋅
−=
=+
−+
−+−
−=
nn
nn
nn
xxtσσ
Deoarece )048,2;048,2(673,0 −∈−=t , rezultă că duratele medii de
ardere pentru cele două loturi nu diferă semnificativ.
17. Se consideră caracteristica X ce reprezintă greutatea în grame a
unor cutii încărcate automat de un dispozitiv. Pentru verificarea normalităţii
lui X, se consideră o selecţie de volum n = 100, datele de selecţie fiind
următoarele:
Greutatea 47 – 48 48 – 49 49 – 50 50 – 51 51 – 52 52 – 53
Frecvenţa 12 18 22 21 19 8
Se cere:
Elemente de teoria probabilităţilor şi statistică matematică 72
a) aplicarea testului χ2, cu nivelul de semnificaţie α = 0,05, pentru
verificarea normalităţii lui X;
b) aplicarea testului lui Kolmogorov, cu nivelul de semnificaţie α =
0,05, pentru verificarea normalităţii lui X.
Rezolvare:
Se cunoaşte că estimările de verosimilitate maximă pentru m şi
sunt respectiv
σ
,xm* = 2* µ=σ .
Distribuţia empirică de selecţie pentru caracteristica X este
⎟⎟⎠
⎞⎜⎜⎝
⎛81921221812
5,525,515,505,495,485,47:X
Calculăm
9,49)5,528...5,48185,4712(100
1* =⋅++⋅+⋅== xm
( ) 47,1100
1 6
1
2
2* =−== ∑
=k
ţkk xxfµσ
a) se consideră valoarea numerică
∑=
−=
N
1i*i
2*ii2
p n)p nf(
h , unde N =6,
3126;2;*
*1
*
** =−−==⎟⎟
⎠
⎞⎜⎜⎝
⎛ −Φ−⎟⎟
⎠
⎞⎜⎜⎝
⎛ −Φ= − ksmaamap ii
i σσ
Se determină intervalul ( ),h,0 21,k α− pentru statistica , folosind
tabelele de valori şi se obţine adică intervalul (0;7,81).
2H
81,7295,0;3 =h
Calculele pentru se fac în tabelul: 2h
Statistică matematică 73
ia if *
*
σmai − ⎟⎟
⎠
⎞⎜⎜⎝
⎛σ−
Φ *
*i ma *
ip *ip n *
i
2*ii
p n)p nf( −
48
49
50
51
52
53
12
18
22
21
19
8
-1,29
-0,61
0,07
0,75
1,42
2,11
-0,4015
-0,2291
0,0279
0,2734
0,4222
0,4826
0,0985
0,1724
0,2570
0,2455
0,1488
0,0604
9,85
17,24
25,70
24,55
14,88
6,04
0,4692
0,0335
0,5326
0,5133
1,1407
0,6360
n=100 3253,32 =h
Valorile funcţiei lui Laplace Φ se iau din tabele şi se are în vedere
că )x()x( Φ−=−Φ şi
=−∞Φ−−Φ=⎟⎟⎠
⎞⎜⎜⎝
⎛ −Φ−⎟⎟
⎠
⎞⎜⎜⎝
⎛ −Φ= )()29,1(*
*0
*
*1*
1 σσmamap
0985,05,04015,0 =+−=
Deoarece rezultă că se acceptă ipoteza
normalităţii lui X.
),81,7;0(3253,32 ∈=h
b) Pentru 05,0=α , folosind tabelele de valori, se determină
a.î. 95,01 xx =α− α−=α− 1)x(K 1 , adică 36,1x 95,0 = .
Ipoteza că X urmează legea normală , cu şi
calculaţi anterior, este acceptată dacă
),m(N ** σ *m
*σ ,xdn 1n α−< unde
)a(F)a(Fmaxd iinN,1i
n −==
.
Aici )x(Fn este funcţia de repartiţie de selecţie, iar F(x) este funcţia
de repartiţie pentru legea normală Calculele pentru determinarea
lui d sunt date în tabelul următor:
).,m(N ** σ
n
Elemente de teoria probabilităţilor şi statistică matematică 74
ia if ∑=
i
1jjf
)a(F in *
*i maσ− F(ai) )a(F)a(F iin −
48
49
50
51
52
53
12
18
22
21
19
8
12
30
52
73
91
100
0,12
0,30
0,52
0,73
0,91
1,00
-1,29
-0,61
0,07
0,75
1,42
2,11
0,0985
0,2709
0,5279
0,7734
0,9222
0,9826
0,0215
0,0291
0,0079
0,0434
0,0122
0,0174
dn= 0,0434
Deoarece ,36,1434,00434,0100 <=⋅=ndn acceptăm ipoteza că
X urmează legea normală ).,m(N ** σ
4.6. Probleme propuse
1. Pentru a cerceta prezenţa studenţilor la un anumit curs s-a ales un
eşantion de n studenţi şi s-a înregistrat numărul absenţelor acestora la patru
cursuri consecutive.
Nr. studenţi xi 50 20 15 8 7
Nr. absenţe ni 0 1 2 3 4
a) Să se scrie distribuţia empirică de selecţie şi funcţia de repartiţie de selecţie.
b) Să se calculeze media de selecţie, momentul centrat de selecţie de
ordinul doi şi dispersia de selecţie.
c) Să se calculeze ( )4100F .
2. Fie caracteristica X ce urmează legea uniformă pe [ ]θ,0 , cu
parametrul 0>θ necunoscut. Se consideră o selecţie repetată de volum n.
Statistică matematică 75
a) Determinaţi estimatorul de verosimilitate maximă al
parametrului
*θ
θ .
b) Arătaţi că este un estimator nedeplasat. *θ
c) Este un estimator efficient? *θ
3. Urmărind sosirile la serviciu la o anumită instituţie unde programul
începe la ora 7, s-au cercetat la întâmplare 100 de fişe de pontaj automat şi s-
au constatat următoarele sosiri:
Ora sosirii (xi) 6,45 6,50 6,55 7 7,05 7,10 7,15
Nr.pers. (ni) 9 13 18 30 16 10 4
a) Scrieţi rezultatele sondajului ca pe o caracteristică aleatoare
reprezentând momentul sosirii la serviciu;
b) Scrieţi funcţia de repartiţie de selecţie ( )xF100 şi trasaţi-i graficul;
c) Calculaţi media de selecţie x şi dispersia de selecţie 2
σ ;
d) Luând la întâmplare o fişă de pontaj, cu ce probabilitate salariatul
va sosi înainte de ora 7.
4. Fie X o caracteristică ce urmează legea beta de parametrii p,q > 0
necunoscuţi. Să se estimeze parametrii p şi q folosind metoda momentelor, pe
baza datelor de selecţie . nxxx ,...,, 21
5. Într-o fabrică de ţesături s-a constatat că rezistenţa la rupere a unui
anumit fir textil este repartizată normal cu media m necunoscută şi dispersia
. O selecţie de volum 25 dă o medie de selecţie 6252 =σ 180=x .
Determinaţi un interval de încredere pentru media m cu
probabilitatea de încredere:
a) 90,0=α ;
b) 95,0=α ;
Elemente de teoria probabilităţilor şi statistică matematică 76
c) 98,0=α .
6. Dintr-o populaţie repartizată normal cu dispersia necunoscută se
face o selecţie de volum 25 obţinându-se 5,20=x şi 25,62=σ . Să se scrie
un interval de încredere pentru parametrul m cu o probabilitate de încredere:
a) 95,0=α ;
b) 98,0=α .
7. Dintr-o populaţie normal repartizată se face o selecţie de volum
16 găsindu-se xi : 2,8; 2,8; 2,8; 3; 3; 3; 3,4; 3,2; 3; 3; 2,9; 2,9; 2,8; 3,4; 3; 3.
Scrieţi intervalele de încredere corespunzătoare pentru media m şi respectiv
pentru dispersia cu o probabilitate de încredere 2σ 98,0=α .
8. Un producător de automobile trebuie să aleagă între două tipuri de
pneuri A şi B. Pentru a decide, face un studiu privind rezistenţa acestora la
uzură. Numărul de kilometri parcurşi cu pneuri de tip A, respectiv b, până la
uzură este o variabilă aleatoare X, respectiv Y, normală de parametri
( AAm )σ, , respectiv ( )BBm σ, .
Construiţi un interval de încredere pentru mA – mB, ştiind că:
kmA 2000=σ , kmB 5000=σ , kmx 20000= , kmy 25000= , nA = 9, nB = 21,
95,01 =−α .
9. Pentru a testa viteza cu care este absorbit pe piaţă un produs nou,
firma producătoare pune în vânzare, prin 9 magazine, loturi identice.
Cantităţile se epuizează după un număr de zile variabil după cum urmează:
Magazin i 1 2 3 4 5 6 7 8 9
Nr.de zile xi 51 54 49 50 50 48 49 50 49
Statistică matematică 77
a) Să se estimeze printr-un interval de încredere 95% viteza cu care
este absorbit produsul pe piaţă (număr mediu de zile).
b) Să se determine un interval de încredere 90% pentru dispersia
numărului de zile X în care se epuizează produsul.
10. Nivelul de calciu în sângele unui adult este în medie 9,5
mgr/decilitru şi 4,0=σ . O clinică măsoară nivelul calciului la 160 de
pacienţi tineri şi găseşte 3,9=x . Verificaţi ipoteza 5,9:0 =mH faţă de
. 5,9:1 ≠mH
11. S-a stabilit experimental că nivelul colesterolului în organismul
unui adult este o variabilă aleatoare normală. O selecţie aleatoare de n = 41
adulţi a dat un nivel mediu observat al colesterolului 213=x cu 4,482=σ .
Să se testeze ipoteza H0 : m = 200 cu alternativa H1 : 200≠m la un nivel de
semnificaţie 05,0=α .
12. Măsurători independente ale rezistenţei unor piese alese din două
loturi L1 şi L2 au condus la rezultatele:
Lot L1 0,140 0,138 0,143 0,142 0,138 0,136 0,141
Lot L2 0,137 0,136 0,139 0,143 0,140 0,138 0,139
a) Să se verifice ipoteza H0 : m1 = m2 faţă de H1 : 21 mm ≠ la nivelul
de semnificaţie 01,0=α ;
b) Să se verifice faţă de la acelaşi nivel de
semnificaţie.
22
210 : σσ =H 2
2211 : σσ ≠H
Se presupune că rezistenţa este repartizată normal.
13. Se iau eşantioane din apa rezultată din răcirea la o centrală
nucleară. Se consideră că dacă temperatura apei evacuate nu depăşeşte 600C
nu constituie o primejdie pentru mediul înconjurător.
Elemente de teoria probabilităţilor şi statistică matematică 78
Se aleg 70 eşantioane de apă şi se măsoară temperatura fiecărui
asemenea eşantion. Se obţin rezultatele:
Temperatura în 0C 52 54 58 61 64 65
Frecvenţa 14 21 18 10 5 2
Să se verifice ipoteza faţă de la
nivelul de semnificaţie
CmH 00 60: = CmH 0
1 60: ≠
01,0=α .
14. Precizia în prelucrare a unui strung automat se verifică cu
ajutorul dispersiei dimensiunii controlate a pieselor produse. Dispersia nu
trebuie să depăşească 0,1. O selecţie extrasă la întâmplare de volum n = 25 a
dat rezultatele:
xi 3 3,5 3,8 4,4 4,5
ni 2 6 9 7 1
Presupunem că xi sunt observaţii asupra unei variabile aleatoare
normale. Să se verifice dacă strungul asigură precizia cerută, la nivelul de
semnificaţie 025,0=α .
15. În tabelul următor se dau vânzările (în mii de bucăţi) dintr-un
sortiment de marfă în 6 oraşe din România Oraşul Bucureşti Braşov Iaşi Timişoara Cluj Constanţa
Vânzările 140 120 130 160 140 130
Să se verifice că vânzările din acest sortiment reprezintă o
caracteristică repartizată uniform, folosind testul χ2, cu nivelul de
semnificaţie α = 0,05.
16. Se ţin sub observaţie n = 100 motoare electrice. Se consideră
caracteristica X, ce reprezintă numărul miilor de ore de funcţionare.
Durata 0–30 30–60 60–90 90–20 120–150 150–180 180–300
Frecvenţa 11 17 21 20 18 7 6
Statistică matematică 79
Să se cerceteze exponenţialitatea caracteristicii X, folosind testul lui
Kolmogorov, cu nivelul de semnificaţie α = 0,05.