Upload
benchea-bogdan
View
36
Download
0
Embed Size (px)
DESCRIPTION
COURS OF STATISTICS
Citation preview
1
ROMÂNIA
MINISTERUL EDUCAłIEI NAłIOANALE
UNIVERSITATEA Vasile Alecsandri din BACĂU FACULTATEA DE ŞTIINłE
Str. Calea Mărăşeşti, nr. 157, Bacău, 600115 Tel. +40 234542411, tel./ fax +40 234571012
www.ub.ro; e-mail: [email protected]
FACULTATEA DE ŞTIINłE
INFORMATICĂ
INVĂłĂMÂNT CU FRECVENłĂ REDUSĂ
PROBABILITΑΑΑΑłI ŞI STATISTICA
AUTOR: Lect. Univ. Dr. LUNGU OTILIA
Curs pentru studenŃii anului II
2
OBIECTIVELE DISCIPLINEI
1. Explicarea si interpretarea corectă a conceptelor matematice, folosind limbajul specific teoriei probabilitaŃilor şi statisticii matematice. 2. Aplicarea corectă a metodelor şi principiilor de bază în rezolvarea problemelor de probabilităŃi şi statistica matematică. 3. Recunoaşterea principalelor clase/tipuri de probleme matematice şi selectarea metodelor şi a tehnicilor adecvate pentru rezolvarea lor 4. Identificarea noŃiunilor de bază utilizate in descrierea unor fenomene si procese. Interpretarea rezultatelor prelucrării datelor . Evaluarea critică a rezultatelor implementării modelului, compararea cu diferite abordări alternative
COMPETENłE ASIGURATE PRIN PARCURGEREA DISCIPLINEI (grila 2 rncis, fisa
disciplinei)
C3. Utilizarea instrumentelor informatice in context interdisciplinar C4. Utilizarea bazelor teoretice ale informaticii si a modelelor formale
FOND DE TIMP ALOCAT, FORME DE ACTIVITATE, FORME DE VERIFICARE,
CREDITE (fişa disciplinei)
Forma de activitate Număr ore semestru
Număr credite
Lucrări practice/seminar 28 Studiu individual 41 Verificare finală Examen 5
3
STABILIREA NOTEI FINALE (fişa disciplinei)
Forma de verificare (Examen, Colocviu, Verificare pe parcurs)
Examen
Modalitatea de susŃinere (Scris şi Oral, Oral, Test grilă, etc.)
Scris Puncte sau procentaj
Răspunsurile la examen/colocviu/lucrari practice 5(50%) Activitati aplicative atestate /laborator/lucrări practice/proiect etc
...(.. %)
Teste pe parcursul semestrului ...(.. %) Teme de control 5(50%) N
OTARE
TOTAL PUNCTE SAU PROCENTE 10 (100%)
TIMP MEDIU NECESAR PENTRU ASIMILAREA FIECĂRUI MODUL
Timp mediu necesar Nr.
Crt. Denumire modul/tema (obligatoriu,
un modul/tema are 2-3 ore) SI LP Total 1 Obiectul de studiu al Teoriei
Probabilitatilor si Statisticii Matematice
5 3 8
2 Scheme clasice de probabilitate 5 3 8
3 Variabile aleatoare 5 3 8
4 Repartitii clasice 5 4 9
5 Elemente de statistica descriptiva 5 4 9
6 Teoria selectiei 6 4 10
7 Teoria estimatiei 5 4 9
8 Verificarea ipotezelor statistice 5 3 8
Timp total necesar 41 28 69
4
CUPRINS MODULUL I
ELEMENTE DE TEORIA PROBABILITĂłILOR
Unitatea de studiu I. Câmp de evenimente…………………………………………….
7
I.1. ExperienŃe aleatoare. Evenimente………………………………………….
7
I.2. RelaŃii între evenimente……………………………………………………
8
I.3. OperaŃii cu evenimente…………………………………………………….
8
I.4. Câmp de evenimente……………………………………………………….
9
Unitatea de studiu II. Câmp de probabilitate…………………………………………..
11
II.1. DefiniŃia clasică a probabilităŃii……………………………………………
11
II.2. DefiniŃia axiomatică a probabilităŃii……………………………………….
11
II.3. Sistem complet de evenimente……………………………………………
12
II.4. Evenimente independente…………………………………………………
12
II.5. ProbabilităŃi condiŃionate…………………………………………………
13
II.6. Scheme clasice de probabilitate………………………………………….
15
Unitatea de studiu III. Variabile aleatoare…………………………………………….
21
III.1. DefiniŃia variabilelor aleatoare………………………………………….
21
III.2. FuncŃia de repartiŃie………………………………………………………
22
III.3. Densitatea de repartiŃie…………………………………………………..
24
III.4. OperaŃii cu variabile aleatoare……………………………………………
25
III.5. Caracteristici numerice ale variabilelor aleatoare discrete……………….
27
III.6. Caracteristici numerice ale variabilelor aleatoare continue………………
33
Unitatea de studiu IV. RepartiŃii clasice……………………………………………….
39
IV.1. RepartiŃii 39
5
discrete………………………………………………………… IV.2. RepartiŃii continue………………………………………………………..
44
Unitatea de studiu V. Legi ale numerelor mari………………………………………..
52
V.1. Tipuri de convergenŃe pentru şiruri de variabile aleatoare……………….
52
V.2. InegalităŃi pentru variabile aleatoare……………………………………..
54
V.3. Legi ale numerelor mari…………………………………………………..
54
Autoevaluare prin aplicaŃii 58 Teste de autoevaluare 69
MODULUL II ELEMENTE DE STATISTICĂ MATEMATICĂ
Unitatea de studiu VI. Elemente de statistică descriptivă…………………………….
72
VI.1. Obiectul statisticii……………………………………………………….
72
VI.2. Limbajul statisticii……………………………………………………….
73
VI.3. Serii statistice…………………………………………………………….
74
VI.4. Indicatori sintetici ai seriilor statistice……………………………………
75
Unitatea de studiu VII. Elemente de teoria selecŃiei…………………………………..
88
VII.1. NoŃiunea de selecŃie. Momente de selecŃie………………………………
88
VII.2. Estimarea mediei teoretice. Media e selecŃie…………………………….
89
VII.3. Estimarea dispersiei teoretice. Dispersia de selecŃie…………………….
91
VII.4. Metode de efectuare a unui sondaj………………………………………
93
Unitatea de studiu VIII. Elemente de teoria estimaŃiei………………………………..
96
VIII.1. NoŃiuni generale………………………………………………………..
96
VIII.2. Metoda verosimilităŃii maxime………………………………………
99
VIII.3. Metoda momentelor……………………………………………………
101
VIII.4. Metoda intervalelor de 103
6
încredere………………………………………. Unitatea de studiu IX. Verificarea ipotezelor statistice……………………………….
107
IX.1. NoŃiuni generale………………………………………………………….
107
IX.2. TestulZ………………………………………………………………….
109
IX.3. TestulT………………………………………………………………….
111
IX.4. Teste pentru compararea a douămedii…………………………………..
113
IX.5. Testul 2χ ………………………………………………………………..
116
IX.6.TestulF…………………………………………………………………..
117
IX.7.Testul de concordanŃă 2χ ……………………………………………….
119
IX.8. Testul de concordanŃă Kolmogorov………………………………………
121
Unitatea de studiu X. Regresie şi corelaŃie…………………………………………….
122
X.1. NoŃiuni generale…………………………………………………………..
122
X.2. Metode elementare de caracterizare a legăturii dintre variabile………….
122
X.3. Modelul liniar de regresie…………………………………………………
124
X.4. Modele neliniare de regresie………………………………………………
126
X.5. Măsurarea intensităŃii legăturii dintre variabile…………………………...
127
Autoevaluare prin aplicaŃii 129 Teste de autoevaluare 139 BIBLIOGRAFIE 147
7
MODULUL I
ELEMENTE DE TEORIA PROBABILITĂłILOR
UNITATEA DE STUDIU I
CÂMP DE EVENIMENTE
I.1 ExperienŃă aleatoare. Eveniment
În activităŃile economice, sociale, ştiinŃifice ş.a. sunt întâlnite fenomene a căror producere şi desfăşurare poate fi prevăzută cu precizie. Există însă şi fenomene a căror producere şi ale căror rezultate sunt greu de anticipat deoarece sunt condiŃionate de foarte mulŃi factori necontrolabili. Astfel de fenomene se numesc fenomene aleatoare.( exp.: starea vremii, extragerea a 6 numere la loto, apariŃia unei anumite feŃe la aruncarea unui zar)
ŞtiinŃa care modelează şi studiază fenomenele aleatoare este teoria probabilităŃilor.
DefiniŃia I.1.1. O experienŃă aleatoare este o activitate ale cărei
rezultate nu pot fi anticipate cu certitudine. Fiecare repetare a unei experienŃe aleatoare se numeşte probă.
O experienŃă aleatoare se caracterizează prin 3 elemente:
i) toate rezultatele posibile sunt cunoscute dinainte; ii) rezultatul unei singure probe nu poate fi cunoscut decât după realizarea probei; iii) experienŃa poate fi repetată în condiŃii identice.
8
DefiniŃia I.1.2. MulŃimea rezultatelor posibile ale unei experienŃe aleatoare se numeşte mulŃimea cazurilor posibile. DefiniŃia I.1.3. Se numeşte eveniment aleator (sau, pe scurt, eveniment) orice situaŃie care se poate realiza prin una sau mai multe probe. Notăm evenimentele aleatoare prin A, B, C,…. . Evenimentele care se realizează printr-o singură probă se numesc evenimente elementare, iar celelalte, evenimente compuse. DefiniŃia I.1.4. Evenimentul care nu se realizează în nici o probă a experienŃei se numeşte eveniment imposibil şi se notează cu φ .
DefiniŃia I.1.5. Evenimentul care se realizează cu certitudine în orice probă se numeşte eveniment sigur. DefiniŃia I.1.6. Numim eveniment contrar evenimentului A, acel
eveniment notat prin A care se realizează atunci şi numai atunci când nu se realizează A.
SubmulŃimile de probe ataşate evenimentelor A şi A sunt complementare faŃă de mulŃimea tuturor probelor experienŃei. Teoria probabilităŃilor este cea care modelează fenomenele aleatoare. Una dintre cele mai utilizate modelări este cea a lui Kolmogorov care are la bază teoria mulŃimilor.
I.2. RelaŃii între evenimente EchivalenŃa evenimentelor.
DefiniŃia I.2.1 Numim evenimente echivalente acele evenimente care se realizează simultan .
MulŃimile de probe ce corespund evenimentelor echivalente sunt mulŃimi egale.
Notăm: A=B.
ImplicaŃia evenimentelor. DefiniŃia I.2.2. Spunem că evenimentul A implică evenimentul B dacă realizarea evenimentului A atrage realizarea evenimentului B.
9
Orice probă care realizează evenimentul A realizează şi evenimentul B, prin urmare mulŃimea de probe ataşată evenimentului A este inclusă în mulŃimea de probe ataşată evenimentului B Notăm: BA ⊂ .
I.3. OperaŃii cu evenimente
DefiniŃia I.3.1. Numim reuniunea evenimentelor A şi B evenimentul notat BA∪ care constă în realizarea a cel puŃin unuia din evenimentele A sau B.
ObservaŃie. Următoarele relaŃii au loc:
Ω=Ω∪=Ο/∪∪=∪∪⊂=∪ AA, AA,BB AB,A AA,AA ,
( ) ( ) CBA ∪∪=∪∪ CBA .
DefiniŃia I.3.2. Numim intersecŃia evenimentelor A şi B evenimentul notat BA∩ care constă în realizarea simultană a celor două evenimente.
ObservaŃie. Următoarele relaŃii au loc:
A=Ω∩Ο/=Ο/∩∩=∩⊂∩=∩ A, AA,BB AA,B AA,AA ,
( ) ( ) CBA ∩∩=∩∩ CBA .
DefiniŃia I.3.3. Numim diferenŃa evenimentelor A şi B evenimentul notat BA − care se realizează atunci când se realizează A şi nu se realizează B.
DefiniŃia I.3.4. Evenimentele A şi B sunt incompatibile dacă φ=∩ BA adică nu se pot realiza simultan în nici o probă. În caz contrar
evenimentele sunt compatibile.
I.4.Câmp de evenimente
DefiniŃia I.4.1. Se numeşte algebră Boole o mulŃime nevidă ℑ
înzestrată cu operaŃiile ∪ (reuniune), ∩ (intersecŃie), (complementară) care verifică următoarele proprietăŃi:
1. Comutativitatea: ABBA
ABBA
∩=∩
∪=∪, ℑ∈∀ B,A .
10
2. Asociativitatea: ( ) ( )( ) ( )CBACBA
CBACBA
∩∩=∩∩
∪∪=∪∪, ℑ∈∀ C,B,A .
3. Distributivitatea: ( ) ( ) ( )( ) ( ) ( )CABACBA
CABACBA
∩∪∩=∪∩
∪∩∪=∩∪, ℑ∈∀ C,B,A .
4. AbsorbŃia: ( )( ) AABA
AABA
=∪∩
=∩∪, ℑ∈∀ B,A .
5. Complementareitatea: ( )( ) BBAA
BBAA
=∪∩
=∩∪, ℑ∈∀ B,A .
DefiniŃia I.4.2. O algebră Boole închisă la reuniunea unui şir de
elemente ( )NnnA ∈ din algebră ( adică ∀ ( ) ℑ⊂∈NnnA rezultă ℑ⊂
∈UNn
nA )
se numeşte σ - algebră Boole. DefiniŃia I.4.3. Fie o mulŃime nevidă E oarecare şi ( )EP mulŃimea
părŃilor sale. Fie ( )EPK ⊂ . K se numeşte corp de părŃi (corp de evenimente) dacă este închisă la reuniune şi complementară, adică : i) KBAKB,A ∈∪⇒∈∀ ;
ii) KAKA ∈⇒∈∀ . DefiniŃia I.4.4. O familie ( )EPK ⊂ se numeşte σ - corp de părŃi (corp borelian) dacă este închisă la complementară şi la reuniunea oricărui şir de elemente din K, adică:
i) KAKA ∈⇒∈∀ ; ii) ( ) KAKA
Nn
nNnn ⊂⇒⊂∀∈
∈ U .
DefiniŃia I.4.5. Se numeşte câmp de evenimente o mulŃime E înzestrată cu un corp de evenimente K şi notat ( )K,E . Când K este corp
borelian de evenimente, ( )K,E se numeşte câmp borelian de evenimente.
11
UNITATEA DE STUDIU II
CÂMP DE PROBABILITATE
II.1. DefiniŃia clasică a probabilităŃii Considerăm o experienŃă cu n probe egal posibile şi fie A un eveniment oarecare ataşat experienŃei care se poate realiza în m probe, nm ≤ . DefiniŃia II.1.1 Numim probabilitatea evenimentului A, numărul
( )n
mAP = ,
adică raportul dintre numărul cazurilor favorabile realizării lui A şi numărul cazurilor egal posibile. Algoritm pentru a calcula probabilitatea unui eveniment oarecare A:
1. Se determină numărul de cazuri favorabile m, adică numărul de elemente din mulŃimea de probe ce se ataşează evenimentului A.
2. Se determină numărul de cazuri posibile n, adică numărul de elemente din mulŃimea totală de probe ce se ataşează evenimentului sigur.
3. Se calculează probabilitatea ( )AP ca fiind raportul acestor două
numere: n
m.
II.2. DefiniŃia axiomatică a probabilităŃii
Această definiŃie a fost dată în anul 1929 de matematicianul rus N. A. Kolmogorov . DefiniŃia II.2.1. Fie E o mulŃime de evenimente ce reprezintă rezultate posibile ale unei experienŃe aleatoare şi ( )K,E un câmp de evenimente. Se numeşte probabilitate o aplicaŃie RK:P → care satisface următoarele axiome: 1. ( ) 10 ≤≤ AP , KA∈∀ .
2. ( ) 1=EP .
12
3. ( )∑∈∈
=
Ii
i
Ii
i APAP U , pentru orice familie cel mult numărabilă IiAi ∈
de evenimente din K, având proprietatea că sunt disjuncte în ansamblul lor, adică ji,AA ji ≠∀=∩ φ .
Tripletul ( )P,K,E se numeşte câmp de probabilitate. ProprietăŃi: 1. ( ) 0=φP .
2. ( ) ( )APAP −= 1 , KA∈∀ .
3. Dacă BA ⊂ , atunci ( ) ( )BPAP ≤ , KB,A ∈∀ .(monotonia)
4. Dacă BA ⊂ , atunci ( ) ( ) ( )APBPABP −=− , KB,A ∈∀ .
5. ( ) ( ) ( )BAPAPBAP ∩−=− , KB,A ∈∀ .
6. ( ) ( ) ( ) ( )BAPBPAPBAP ∩−+=∪ , KB,A ∈∀ .(aditivitate tare)
7. ( )∑∈∈
≤
Ii
i
Ii
i APAP U , pentru orice familie finită IiAi ∈ de
evenimente.(finit-subaditivitate) 8. Formula lui Poincaré
( ) ( ) ( ) ( )
( ) ( )nn
sji
sji
n
j ji
jijn
A...AAP....
AAAPAAPAPA...AAP
∩∩∩−+
−∩∩+∩−=∪∪∪
−
<<= <∑∑∑∑ ∑∑
211
121
1
II.3. Sistem complet de evenimente
DefiniŃia II.3.1. Un sistem complet de evenimente este o mulŃime de
evenimente n,k,Ak 1= care satisfac următoarele condiŃii:
1. n,k,Ak 1=∀≠ φ .
2. n,k,j,kjAA jk 1=≠∀=∩ φ .
3. EAn
k
k ==U1
.
Dacă evenimentele n,k,Ak 1= formează un sistem complet de evenimente,
atunci
13
( ) 11
==
=
EPAPn
k
kU
II.4. Evenimente independente Două evenimente A şi B sunt independente dacă ele nu se influenŃează , adică realizarea evenimentului A nu depinde de realizarea lui B şi reciproc. DefiniŃia II.4.1. Două evenimente 1A , KA ∈2 sunt independente dacă
( ) ( ) ( )2121 APAPAAP ⋅=∩ .
DefiniŃia II.4 2. Trei evenimente KA,A,A ∈321 sunt independente dacă
( ) ( ) ( )2121 APAPAAP ⋅=∩ , ( ) ( ) ( )3131 APAPAAP ⋅=∩ ,
( ) ( ) ( )3232 APAPAAP ⋅=∩
şi ( ) ( ) ( ) ( )321321 APAPAPAAAP ⋅⋅=∩∩ .
DefiniŃia II.4.3. Spunem că evenimentele KA,...,A,A,A k ∈321 sunt
independente în totalitate dacă sunt independente “două câte două” ( adică ( ) ( ) ( ) ji,APAPAAP jiji ≠∀⋅=∩ ),
“trei câte trei”( adică ( ) ( ) ( ) ( ) sji,APAPAPAAAP sjisji ≠≠∀⋅⋅=∩∩ )
,…şi “toate k”( adică ( ) ( ) ( ) ( )kk AP...APAPA...AAP ⋅⋅⋅=∩∩∩ 2121 ).
ObservaŃie. Dacă evenimentele sunt independente două câte două nu
rezultă că sunt independente în totalitate. Dacă evenimentele sunt independente în totalitate, atunci sunt
independente si “s câte s”.
Proprietate. Dacă evenimentele n,k,Ak 1= sunt independente în
totalitate, stunci
( ) ( )( )∏∏=====
−−=−=
−=
−=
n
k
k
n
k
k
n
k
k
n
k
k
n
k
k APAPAPAPAP
11111
11111 IUU
. PropoziŃia II.4.4. Au loc următoarele afirmaŃii:
14
1) Dacă KA∈ astfel încât ( ) 0=AP , sau ( ) 1=AP , atunci, KB∈∀ avem că A şi B sunt independente.
2) Dacă KB,A ⊂ sunt evenimente in dependente, atunci şi perechile
( ) ( ) ( )B,A,B,A,B,A sunt independente.
II.5. ProbabilităŃi condiŃionate Atunci când evenimentele nu sunt independente spunem că sunt dependente. DefiniŃia II.5.1. Fie ( )P,K,E un câmp de probabilitate şi KB∈ un
eveniment pentru care ( ) 0>BP . Numim probabilitatea evenimentului A
condiŃionată de evenimentul B raportul ( ) ( )( )BP
BAPAPB
∩= .
Dacă KA∈ este un eveniment pentru care ( ) 0>AP putem defini probabilitatea evenimentului B condiŃionată de evenimentul A prin
( ) ( )( )AP
BAPBPA
∩= .
Din aceste două rapoarte obŃinem formula care leagă probabilităŃile evenimentelor reciproc condiŃionate:
( ) ( ) ( ) ( )APBPBPAP BA ⋅=⋅ .
ObservaŃie. Dacă A şi B sunt două evenimente independente, atunci ( ) ( )APAPB = şi ( ) ( )BPBPA = .
Formula de înmulŃire a probabilităŃilor( Probabilitatea intersecŃiei de evenimente)
Probabilitatea intersecŃiei a două evenimente este egală cu produsul dintre probabilitatea primului eveniment şi probabilitatea condiŃionată a celui de-al doilea de către primul:
( ) ( ) ( )APAPBAP B⋅=∩ , KB,A ∈∀ .
Generalizând, dacă KA,...,A,A n ∈21 , atunci
( ) ( ) ( ) ( ) ( )nA...AAAAAn AP...APAPAPA...AAPn 121211 32121 −∩∩∩∩ ⋅⋅⋅⋅=∩∩∩
.
Dacă evenimentele n,kA ,k 1= sunt independente, atunci relaŃia de mai sus
se reduce la ( ) ( ) ( ) ( ) ( )nn AP...APAPAPA...AAP ⋅⋅⋅⋅=∩∩∩ 32121
15
Formula de adunare a probabilităŃilor Fie KA,...,A,A n ∈21 şi KB∈ cu ( ) 0>BP . Are loc relaŃia
( ) ( ) ( ) ( )nBn
n
nji
jiB
n
i
iB
n
i
iB A...AAP...AAPAPAP ∩∩−++∩−=
−
≤<≤==∑∑ 21
1
111
1U .
Dacă evenimentele KA,...,A,A n ∈21 şi KB∈ sunt independente, atunci
(*)
( ) ( ) ( ) ( )nnn
nji
ji
n
i
i
n
i
i A...AAP...AAPAPAP ∩∩−++∩−=
−
≤<≤==∑∑ 21
1
111
1U .
Dacă în plus evenimentele n,kA ,k 1= sunt şi incompatibile, atunci relaŃia
(*) devine
( )∑==
=
n
i
i
n
i
i APAP11
U .
Formula probabilităŃii totale Fie KA,...,A,A n ∈21 un sistem complet de evenimente şi KX ∈ un
eveniment oarecare. Are loc formula:
( ) ( ) ( )∑=
⋅=n
k
Ak XPAPXPk
1
.
DemonstraŃie. Deoarece IkAk ∈, , formeazǎ un sistem complet de
evenimente, avem cǎ KAIk
k =∈U . Prin urmare, se poate scrie
( ).UUIk
k
Ik
k AXAXKXX∈∈
∩=
∩=∩=
De asemenea, deoarece ,Ο/=∩ ji AA rezultǎ cǎ şi
( ) ( )Ο/=∩∩∩ ji AXAX , pentru ji ≠ , deci
( ) ( ) ( ) ( ).∑∑∈∈
=∩=Ik
Ak
Ik
k XPAPAXPXPk
Formula lui Bayes Fie KA,...,A,A n ∈21 un sistem complet de evenimente şi KX ∈ un
eveniment oarecare. Are loc formula:
16
( )( ) ( )
( ) ( )∑=
⋅
⋅=
n
k
Ak
Aj
jX
XPAP
XPAPAP
k
j
1
.
Această formulă se aplică în următoarea situaŃie. În urma unei experienŃe poate apărea un eveniment X ca efect a n evenimente KA,...,A,A n ∈21 care
formează un sistem complet de evenimente . Presupunând că se cunosc probabilităŃile evenimentelor KA,...,A,A n ∈21 (numite şi probabilităŃi a
priori) precum şi probabilitatea de apariŃie a evenimentului X, se pot calcula
probabilităŃile condiŃionate ( ) n,k,XPkA
1= .Formula lui Bayes ne permite să
aflăm pentru fiecare n,k 1= probabilitatea ca evenimentul X să fi apărut din
cauza evenimentului kA , adică probabilitatea ( )kX AP , n,k 1= ( numită şi
probabilitate a posteriori)
II.6. Scheme clasice de probabilitate
În calculul probabilităŃilor întâlnim anumite clase de probleme , în sensul că fiecare problemă dintr-o astfel de clasă admite o abordare identică, prin particularizări ale parametrilor care intervin. Din acest motiv, pentru o anumită clasă de probleme se construieşte modelul matematic probabilistic, model ce poartă numele de schemă de probabilitate.
a) Schema bilei nerevenite
Se consideră o urnă ce conŃine bile de două culori diferite: a bile albe şi b bile negre. Se extrag n ( )ban +≤ bile fără revenire. Acest tip de extragere se poate realiza prin două modalităŃi: se extrag simultan toate cele n bile, sau, se extrage pe rând câte o bilă, făra a o reintroduce în urnă. Se cere probabilitatea ca din cele n bile extrase, k să fie albe şi n-k negre, unde ak ≤ şi bkn ≤− . Utilizând definiŃia clasică a probabilităŃii se obŃine că probabilitatea cerută este dată de formula
( )n
ba
knb
ka
C
CCk,nP
+
−
= .
Generalizare. Presupunem că avem o urnă cu bile de s culori diferite: 1a
bile de culoarea 1, 2a bile de culoarea 2,…, sa bile de culoarea s. Se extrag
n ( )sa...aan +++≤ 21 bile fără revenire. Se cere probabilitatea ca din cele n
17
bile extrase, 1k să fie de culoarea 1, 2k de culoarea 2,…, sk de culoarea s,
unde 11 ak ≤ , 22 ak ≤ ,…, ss ak ≤ şi nk...kk s =+++ 21 .
Utilizând definiŃia clasică a probabilităŃii se obŃine că probabilitatea cerută este dată de formula
( )n
a...aa
k
a
k
a
k
as
s
s
s
C
C...CCk,...,k,k.nP
+++
=
21
2
2
1
121 .
b) Schema bilei revenite(binomială)
Aceastǎ schemǎ de probabilitate se aplicǎ în cazul în care se fac
repetǎri independente ale unui experimant şi la fiecare repetare se are în
vedere apariŃia unui eveniment bine precizat. Evenimentul considerat se
presupune cǎ apare cu aceeaşi probabilitate la fiecare repetare a
experimentului. Se cere calcularea probabilitǎŃii ca din n repetǎri ale
experimentului evenimnetul precizat sǎ aparǎ de k ori.
Modelul probabilistic se realizeazǎ printr-o urnǎ ce conŃine bile de
douǎ culori diferite: a bile albe şi b bile negre. Se extrag n bile din urnǎ,
una câte una astfel încât fiecare bilǎ extrasǎ se reintroduce în urnǎ după ce
se constatǎ culoarea bilei extrase. Se cere determinarea probabilitǎŃii ca
din cele n bile extrase, k sǎ fie de culoarea albǎ şi n-k de culoare neagră.
Dacǎ se noteazǎ prin iA evenimantul ca la extragerea de rang i sǎ fie
extrasǎ o bilǎ de culoare albǎ, atunci iA este evenimentul ca la extragerea
de rang i sǎ fie obŃinutǎ o bilǎ de culoare neagrǎ. De asemenea, deoarece
la fiecare repetare, bila extrasǎ se depune din nou în urnǎ, probabilitatea
de a extrage o bilǎ albǎ, la fiecare repetare, este aceeaşi: ( ).iAPp = . La
fel, obŃinerea unei bile negre la fiecare repetare se realizeazǎ cu aceeaşi
probabilitate ( ) .1 pqAP i −==
Fie notat prin knB , evenimentul ca din n bile extrase sǎ fie obŃinute k
bile albe. Acest evenimant se poate scrie sub forma
18
( ).1
11
1, U
L
LLnii
iiiikn
k
nkkAAAAB
≤<<≤
∩∩∩∩∩=+
Evenimentele reuniunii sunt incompatibile douǎ câte douǎ, iar
evenimentele din fiecare intersecŃie sunt independente. Astfel se scrie
succesiv
( ) ( )
( ) ( ) ( ) ( )
.1
1
11
1
11
1
1
1,
∑
∑
∑
≤<≤
−
≤<<≤
≤<<≤
=
==
=∩∩∩∩∩=
+
+
nii
knk
nii
iiii
nii
iiiikn
k
k
nkk
k
nkk
qp
APAPAPAP
AAAAPBP
L
L
L
LL
LL
Având în vedere cǎ toŃi termenii sumei sunt egali, iar suma are k
nC
termeni, avem cǎ probabilitatea ( )knP , de a obŃine k bile albe în n
extrageri de bile din urnǎ este datǎ prin formula
( ) ., knkk
n qpCknP −=
ObservaŃie. Dacǎ se considerǎ formula binomului lui Newton, avem cǎ
( ) ( ) .,01∑∑==
− ==+n
k
kn
k
kknkk
n
nxknPxqpCqpx
Aşadar, probabilitatea ( )knP , este coeficientul kx din dezvoltatea
binomului ( ) ,nqpx + de aici şi denumirea de schemǎ binomialǎ.
ObservaŃie. Dacǎ se ia în formula de la observaŃia precedentǎ 1=x şi
dacǎ se are în vedere cǎ 1=+ qp , se obŃine cǎ
( ) ( ) .1,0
=+=∑=
n
k
nqpknP
Generalizare. Schema bilei întoarse cu mai multe stǎri (multinomială
sau polinomialǎ)
19
Aceasǎ schemǎ de probabilitate este o generalizare a schemei
binomiale. Se aplicǎ atunci când la fiecare repetare a experimentului, se
urmǎreşte apariŃia a r evenimente, care formeazǎ un sistem complet de
evenimente. ProbabilitǎŃile de apariŃie pentru evenimentele considerate nu
depind de rangul repetǎrii, deci sunt constante. Se doreşte calculul
probabilitǎŃii ca în n repetǎri independente ale experimentului, cele r
evenimente precizate sǎ aparǎ de un numǎr de ori dat.
Modelul probabilistic este realizat printr-o urnǎ ce conŃine bile de r
culori. Din urnǎ se extrag, pe rând, bile cu întoarcerea bilei extrase în urnǎ,
dupǎ ce s-a constatat culoarea bilei extrase. Se cere sǎ se calculeze
probabilitatea ( )rkkknP ,,,; 21 L , ca din n bile extrase 1k sǎ fie de culoarea
întâi, 2k bile de culoarea a doua ş.a.m.d. rk sǎ fie de culoarea a −r a.
Folosind aceeaşi metodǎ ca la schema binomialǎ, se obŃine cǎ
( ) ,!!!
!,,,; 21
2121
21rk
r
kk
r
r pppkkk
nkkknP L
LL =
unde ,,1, ripi = sunt respectiv probabilitǎŃile de-a obŃine la o extragere bilǎ
de culoarea .,1, rii =
ObservaŃie. Dacă se dezvoltă următorul polinom
( ) ,2211n
rrxpxpxp L++
atunci probabilitatea ( )rkkknP ,,,; 21 L este coefcientul monomului
rk
r
kk xxx L2121 din această dezvoltare. De aici şi denumirea de schema
multinomială sau polinomială folosită pentru această schemă de probabilitate.
ObservaŃie. Au loc relaŃiile
121 =++ rppp L şi .21 nkkk r =+++ L
20
c) Schema lui Poisson
Se aplică în cazul în care se fac repetări independente ale unui
experiment şi la fiecare repetare se urmăreşte un anumit eveniment, care
apare, în general, cu probabilităŃi diferite la repetiŃii de ranguri diferite.
Se cere să se calculeze probabilitatea ca din n repetări ale
experimentului, evenimentul considerat să apară de k ori.
Realizarea modelului se obŃie cu ajutorul unui sistem de n urne. În
fiecare urnă se află bile de două culori diferite. În urna cu nr. 1 se află 1a bile
albe şi 1b bile negre. În urna cu nr. 2 se află 2a bile albe şi 2b bile negre. ....
În urna cu nr. n se află na bile albe şi nb bile negre. Se ia câte o bilă din
fiecare urnă şi se cere determinarea probabilităŃii ( )knP , de a obŃine k bile de
culoarea albă din cele n extrase.
Dacă se notează cu ip probabilitatea de a extrage o bilă albă
din urna cu numărul i şi prin iq probabilitatea de a extrage o bilă de culoare
neagră din urna cu numărul i, adică ii pq −= 1 , pentru fiecare ,,1 ni = atunci,
printr-un raŃionament analog cu cel de la schema binomială, se obŃine că
( ) ∑≤<<≤
+=
nii
iiii
k
nkkqqppknP
L
LL
1
111
.,
ObservaŃie. Probabilitatea ( )knP , se obŃine ca fiind coeficientul lui
kx al polinomului
( )( ) ( )nn qxpqxpqxp +++ L2211 .
ObservaŃie. Dacă ppi = , pentru fiecare ni ,1= , deci şi
pqqi −== 1 , atunci se obŃine schema lui Bernoulli cu bila întoarsă.
21
UNITATEA DE STUDIU III
VARIABILE ALEATOARE
III.1. DefiniŃia variabilelor aleatoare
Până acum, în studiul câmpului de evenimente asociat unui experiment, am fost interesaŃi de apariŃia sau neapariŃia evenimentului, deci latura calitativă a experimentului. Un studiu riguros al fenomenelor aleatoare necesită însă şi o descriere cantitativă a acestora, astfel încât să poată să fie studiate din punct de vedere matematic. Avem deci nevoie de o corespondenŃă între mulŃimea evenimentelor dintr-un corp K şi mulŃimea numerelor reale R. O astfel de corespondenŃă este realizată de variabilele aleatoare.
DefiniŃia III.1.1. Fie ( )pKE ,, un câmp borelian de probabilitate. O
aplicaŃie REX →: se numeşte variabilă aleatoare dacă Ra∈∀ avem că ( ) KaeXEe ∈>∈ .
Variabilele aleatoare sunt de două tipuri: discrete şi continue. DefiniŃia III.1.2. O variabilă aleatoare REX →: este discretă dacă
mulŃimea valorilor pe care le ia este o muŃime finită sau numărabilă. DefiniŃia III.1.3. O variabilă aleatoare discretă se numeşte simplă
dacă ia un număr finit de valori. Prin urmare, o variabilă aleatoare discretă este simplă dacă: i) RxxxEX n ⊂→ ,...,,: 21 ;
ii) ( ) niKxeXEe ii ,1, =∈=∈ .
ObservaŃie. Deoarece evenimentele nixX i ,1, == formează un
sistem complet de evenimente, avem că 11
=∑=
n
i
ip .
In general, variabilele aleatoare simple sunt reprezentate printr-un tablou de repartiŃie (distribuŃie). Acesta este de fapt un tabel alcătuit din două linii: pe prima linie sunt trecute valorile distincte ale variabilei aleatoare, iar pe a doua linie , probabilităŃile cu care apar aceste valori.
n
n
ppp
xxxX
L
L
21
21 ,
unde
22
=
=∀>
∑=
1
,1,0
1
n
i
i
i
p
nip
şi ( )ii xXPp == .
DefiniŃia III.1.4. O variabilă aleatoare este continuă dacă mulŃimea valorilor sale este un interval sau o reuniune de intervale.
III.2. FuncŃia de repartiŃie a unei variabile aleatoare
DefiniŃia III.2.1. Fie ( )pKE ,, un câmp borelian de probabilitate şi REX →: o variabilă aleatoare. FuncŃia RRF →: definită pin
( ) ( ) ( ) ( )xeXEePxXPxF <∈=<=
se numeşte funcŃie de repartiŃie a variabilei aleatoare X. Teorema III.2.1. FuncŃia de repartiŃie F corespunzătoare unei variabile aleatoare X are următoarele proprietăŃi:
(1) pentru orice R∈x , avem că ( ) ,10 ≤≤ xF
(2) pentru orice a, b∈R, a<b, avem că
( ) ( ) ( )( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ( ),
,
,
,
bXPaFbFbXaP
bXPaXPaFbFbXaP
aXPaFbFbXaP
aFbFbXaP
=+−=≤≤
=+=−−=≤<
=−−=<<
−=<≤
(3) pentru orice ( ) ( )212121 ,, xFxFcaavemxxxx ≤<∈R,
(funcŃia F este crescătoare),
(4) ( ) ( ) ( ) ( ) ,1lim,0lim =∞+==∞−=+∞→+∞→
FxFFxFxx
(5) pentru orice R∈x , avem că ( ) ( ) ( )xFxFyFxy
=−=→
0lim
(funcŃia F este continuă la stânga).
DemonstraŃie. (1) Deoarece valorile funcŃiei de repartiŃie sunt nişte
probabilităŃi, avem această afirmaŃie, deci ( ) .10 ≤≤ xF
(2) Se scrie succesiv
23
( ) ( ) ( ) ( )[ ].\, aXbXPaXbXPbXaP <<=<<=<≤
Deoarece ( ) ( ),bXaX <⊂< avem în continuare că
( ) ( ) ( ) ( ) ( ),aFbFaXPbXPbXaP −=<−<=<≤
Pentru a doua relaŃie se are în vedre că
( ) ( ) ( ),\ aXbXabXa =<≤=<<
deci
( ) ( ) ( ) ( ) ( ) ( ).aXPaFbFaXPbXaPbXaP =−−==−<≤=<<
In mod analog, se arată şi celelalte două relaŃii de la acest punct.
(3) Folosind prima formulă de la punctul precedent, avem relaŃiile
( ) ( ) ( ),0 121 xFxFxXxP −=<≤≤ de unde ( ) ( ).21 xFxF ≤
(4) Formal avem că ( ) ( ) ( ) ,0limlim =Ο/=<=−∞→−∞→
PxXPxFxx
respectiv
( ) ( ) ( ) .1limlim =Ω=<=+∞→+∞→
PxXPxFxx
(5) Un raŃioanament analog cu cel de la punctul precedent ne conduce
la faptul că funcŃia F este continuă la stânga.
PropoziŃia III.2.1. Dacă X este o variabilă aleatoare discretă cu
distribuŃia nii
i
p
xX
,1=
, atunci funcŃia de repartiŃie este dată prin
( ) ( ) ∑∑<<
===xx
i
xx
i
ii
pxXPxF , Rx∈∀ .
Altfel spus, pentru un Rx∈ dat, se adună toate probabilităŃile ip ce
corespund valorilor lui X care verifică condiŃia xxi < :
24
( )
>
≤<
≤<+
≤<
≤
=
+=∑
n
kk
k
i
k
xx
xxxp
xxxpp
xxxp
xx
xF
,1
,
,
,
,0
11
3221
211
1
M
M
ObservaŃie. FuncŃia de repartiŃie F a unei variabile aleatoare discrete
nii
i
p
xX
,1=
este o funcŃie scară, în care punctele nixi ,1, = sunt puncte de
discontinuitate de speŃa I, iar mărimile salturilor în aceste puncte sunt date de
probabilităŃile corespunzătoare nipi ,1, = .
Până acum am facut referire cu precădere la variabile aleatoare
discrete. Pentru a putea face o descriere a varibilelor aleatoare continue avem
nevoie de o nouă noŃiune, pe care o vom introduce în continuare.
III.3. Densitatea de probabilitate ( repartiŃie).
DefiniŃia III.3.1. Fie X o variabilă aleatoare şi F funcŃia sa de
repartiŃie. Dacă există o funcŃie RRf →: , integrabilă pe R astfel încât
( ) ( )∫∞−
=x
dttfxF , Rx∈∀ , atunci funcŃia f se numeşte densitate de repartiŃie
sau densitate de probabilitate a variabilei aleatoare X.
25
DefiniŃia III.3.2. Fie X o variabilă aleatoare şi F funcŃia sa de
repartiŃie. Spunem că X este o variabilă aleatoare continuă dacă funcŃia de
repartiŃie F se spoate scrie sub forma ( ) ( )∫∞−
=x
dttfxF , Rx∈∀ .
Teorema III.3.1. Densitatea de repartiŃie f a unei variabile aleatoare
continue X are următoarele proprietăŃi:
(1) pentru orice R,∈x avem că ( ) ,0≥xf
(2) ( ) ( ),' xfxF = aproape peste tot pe R
(3) pentru a < b, avem că ( ) ( ) ,∫=<≤b
a
dxxfbXaP
(4) ( ) .1=∫+∞
∞−
dxxf
ObservaŃie. Dacă X este o variabilă aleatoare continuă, atunci tabloul
său de distribuŃie este
( )Rx
xf
xX
∈
,
unde
( )
( )
=
∈∀≥
∫∞+
∞−
.1
,0
dxxf
Rxxf
III.4. OperaŃii cu variabile aleatoare.
Teorema III.4.1. Fie ( )pKE ,, un câmp borelian de probabilitate,
REX →: o variabilă aleatoare şi 0−∈ Ra o constantă. Atunci şi
aplicaŃiile:
26
1) aX + ,
2) aX ,
3) X ,
4) nX , *Nn∈ ,
5) 0,1
≠XX
definite pe E cu valori reale, sunt de asemenea variabile aleatoare.
ObservaŃie. Dacă
n
n
ppp
xxxX
L
L
21
21 ,cu
=
=∀>
∑=
1
,1,0
1
n
i
i
i
p
nip
este o
variabilă aleatoare discretă simplă, atunci:
1)
++++
n
n
ppp
axaxaxaX
L
L
21
21 ,
2)
n
n
ppp
axaxaxaX
L
L
21
21 ,
3)
n
n
ppp
xxxX
L
L
21
21 ,
4)
n
n
n
nn
n
ppp
xxxX
L
L
21
21 ,
5)
n
n
ppp
xxxX
L
L
21
21
1111
.
Teorema III.4.2. Fie ( )pKE ,, un câmp borelian de probabilitate şi
REX →: , REY →: două variabile aleatoare. Atunci şi
1) YX + ,
2) YX − ,
3) YX ⋅
4) 0, ≠YY
X
sunt de asemenea variabile aleatoare.
27
PropoziŃia III.4.1. Dacă nii
i
p
xX
,1=
şi
mjj
j
q
yY
,1=
sunt două
variabile aleatoare discrete simple, atunci:
i) mjniij
ji
p
yxYX
,1,,1 ==
++ ,
ii) mjniij
ji
p
yxXY
,1,,1 ==
,
unde ( ) ( )( )jiij yYxXPp =∩== .
ObservaŃie. Dacă variabilele aleatoare nii
i
p
xX
,1=
şi
mjj
j
q
yY
,1=
sunt
independente, atunci jiij qpp ⋅= .
Dacă există ji ≠ astfel încât ji xx = , atunci, în tabloul de repartiŃie
al variabilei corespunzătoare se va trece o singură dată valoarea ix cu
probabilitatea ji pp + .
III.5. Caracteristici numerice ale variabilelor aleatoare discrete.
Fie REX →: o variabilă aleatoare discretă , nii
i
p
xX
,1=
, unde
=
=∀>
∑=
1
,1,0
1
n
i
i
i
p
nip
.
• Valoarea medie
DefiniŃia III.5.1. Numim valoare medie a variabilei aleatoare
discrete X acea valoare notată prin m, sau X , sau ( )XM şi definită prin
∑=
=n
i
ii pxm1
.
28
ProprietăŃi. Valoarea medie are următoarele proprietăŃi:
1) ( ) ( ) ,bXaMbaXM +=+ Rba ∈∀ ,
2) ( ) ( ) ( ),YMXMYXM +=+
3) Dacă variabilele aleatoare X şi Y sunt independente, atunci
( ) ( ) ( ).YMXMXYM =
DemonstraŃie. Vom considera variabilele aleatoare X şi Y de tip discret
cu distribuŃiile
,,Jjj
j
Iii
i
q
yY
p
xX
∈∈
pentru care există ( )XM şi ( ).YM
1) Scriem succesiv
( ) ( ) ( )
( ) ,bXaMpbpxa
bppaxpbaxbaXM
Ii
i
Ii
ii
Ii
iii
Ii
ii
+=+=
=+=+=+
∑∑
∑∑
∈∈
∈∈
de unde ( ) ( ) .bXaMbaXM +=+
2) Dacă variabilele aleatoare X şi Y au distribuŃiile, precizate mai sus,
atunci variabila aleatoare YX + are distribuŃia
( ).,,),(
jiij
JIjiij
jiyYxXPpunde
p
yxYX ===
++
×∈
Prin urmare, avem că
( ) ( )
∑ ∑ ∑∑
∑ ∑∑∑∑∑
∈ ∈ ∈∈
∈ ∈ ∈∈∈ ∈
+=
=+=+=+
Ii Ii Jj
ijj
Jj
iji
Ii Ii Jj
ijj
Jj
iji
Ii Jj
ijji
pypx
pypxpyxYXM
).()(
Se obŃine că
( ) ( ) ( ).YMXMqypxYXMJj
jj
Ii
ii +=+=+ ∑∑∈∈
29
3) Având în vedere că variabilele aleatoare X şi Y sunt independente, se
obŃine distribuŃia variabilei aleatoare produs
( )
., JIjiji
ji
qp
yxXY
×∈
Aşadar, putem scrie sucesiv
( ) ( ) ( ),YMXMqypxqpyxXYMJj
jj
Ii
ii
Ii Jj
jiji =
== ∑∑∑∑
∈∈∈ ∈
adică ( ) ( ) ( ).YMXMXYM =
ObservaŃie. Dacă în propoziŃia precedentă, la punctul (1) se ia 0=a ,
atunci se obŃine că valoarea medie a unei constante este constanta însăşi, iar
punctele (2) şi (3) se pot extinde pentru un număr finit de variabile aleatoare.
• Momentul de ordin r
DefiniŃia III.5.2. Numim momentul de ordin r al variabilei aleatoare
X, valoarea medie a variabilei rX .
Vom nota momentul de ordin r cu ( )XM r :
( ) ( ) ∑=
==n
i
i
r
i
r
r pxXMXM1
.
• Valoarea medie de ordin r
DefiniŃia III.5.3. Valoarea medie de ordin r a unei variabile
aleatoare X este radicalul de ordin r al momentului de ordin r:
( ) r
n
i
i
r
ir
rr pxXM ∑=
==1
η
• Abaterea
30
DefiniŃia III.5.4. Numim abaterea variabilei aleatoare X , având
valoarea medie m, variabila aleatoare mX −=ξ .
ObservaŃie. Dacă nii
i
p
xX
,1=
, atunci
nii
i
p
mx
,1=
−ξ şi ( ) 0=ξM .
• Momentul centrat de ordin r
DefiniŃia III.5.5. Momentul centrat de ordin r al variabilei
aleatoare X este momentul de ordin r al abaterii.
( ) ( ) ( )( ) ( )∑=
−=−===n
i
i
r
i
rr
rr pmxmXMMM1
ξξµ .
Teorema III.5.1. Intre momentele de ordin r şi momentele centrate
de ordinul r ale unei variabile aleatoare X există următoarea relaŃie:
( ) ( )[ ] ( )∑−
−−=r
k
kr
kk
r
k
r XMXMC0
1µ .
ObservaŃie. In statistica matematică se utilizează momente centrate
până la ordinul 4:
01 =µ ;
( ) ( )[ ]222 XMXM −=µ ;
( ) ( ) ( ) ( )[ ]323 233 XMXMXMXM +−=µ ;
( ) ( ) ( ) ( )[ ] ( ) ( )[ ]422
244 364 XMXMXMXMXMXM −+−=µ
• Dispersia.
DefiniŃia III.5.6. Momentul centrat de ordin 2 se numeşte dispersie.
( ) ( ) ( )[ ] ( ) ( ) ( )[ ]221
222 XMXMpmxmXMXXD
n
i
ii −=−=−== ∑=
µ
.
ProprietăŃi. Dispersia verifică următoarele proprietăŃi:
31
1) ( ) 0=cD , Rc∈∀ .
2) ( ) ( )XDccXD 2= .
3) Dacă variabilele aleatoare X şi Y sunt independente, atunci
( ) ( ) ( ).YDXDYXD +=+
DemonstraŃie.
1) ( ) ( ) ( )[ ] 02222 =−=−= cccMcMcD
2) Dacă nii
i
p
xX
,1=
, atunci X are abaterea
nii
i
p
mx
,1=
−ξ şi cX are
abatrea nii
i
p
cmcxc
,1=
−ξ . Prin urmare avem:
( ) ( ) ( )( ) ( ) ( ) ( ) cpmxcpmxcpcmcxcMcXcXDn
i
ii
n
i
ii
n
i
ii
1
22
1
22
1
222 =−=−=−=== ∑∑∑
===
ξµ
3) Deoarece vriabilele aleatoare X şi Y sunt independente, rezultă
succesiv
( ) ( )[ ][ ]( )( ) ( )( ) ( )( ) ( )( )[ ]
( ) ( ) ( ) ( ) ( )[ ] ( )( ) ( ) ( ) ( )[ ] ( ) ( ) ( ).2
2
2 22
2
YDXDYDYMXMXYMXD
YDYMXMXYMYXMXYMXD
YMYYMYXMXXMXM
YXMYXMYXD
+=+−−=
=++−−−=
=−+−−−−=
=+−+=+
• Abaterea medie pătratică.
DefiniŃia III.5.7. Media de ordin 2 a abaterii se numeşte abatere
medie pătratică.
( )XD=σ .
• Modul (Valoarea modală; valoarea dominantă)
32
DefiniŃia III.5.8. Valoarea modală a unei variabile aleatoare discrete
X este acea valoare kx a variabilei, pentru care probabilitatea
corespunzătoare kp este maximă.
• FuncŃia caracteristică
Fiind dată o variabilă aleatoare discretă nkk
k
p
xX
,1=
, putem considera
variabila aleatoare nkk
itx
itX
p
ee
k
,1=
, cu 12 −=i şi
kk
itxtxitxe k sincos += .
DefiniŃia III.5.9. FuncŃia caracteristică a variabilei aleatoare X este
media variabilei aleatoare itXe , adică
( ) ( ) ∑∑ ∑== =
+===n
k
kk
n
k
n
k
kkk
itxitX txpitxppeeMt k
11 1
sincosϕ .
ProprietăŃi. FuncŃia caracteristică a unei variabile aleatoare discrete
are următoarele proprietăŃi:
1) ( ) 10 =ϕ şi ( ) 1≤tϕ , Rt∈∀ .
2) ( )tϕ este uniform continuă pe R.
3) ( ) ( )tt ϕϕ =− .
4) ( ) ( )atet X
itb
baX ϕϕ =+ , Rba ∈∀ , .
5) Dacă X şi Y sunt două variabile aleatoare independente, atunci
( ) ( ) ( )ttt YXYX ϕϕϕ +=+
adică, funcŃia caracteristică a unei sume de două variabile aleatoare
independente este egală cu produsul funcŃiilor caracteristice ale celor două
variabile.
• FuncŃia generatoare
33
Fiind dată o variabilă aleatoare discretă nkk
k
p
xX
,1=
, putem considera
variabila aleatoare nkk
tx
tX
p
ee
k
,1=
.
DefiniŃia III.5.10. FuncŃia generatoare ataşată unei variabile
aleatoare discrete X este media variabilei tXe , adică
( ) ( ) ∑=
==n
k
k
txtX peeMtg k
1
.
Au loc următoarele relaŃii:
( ) ∑=
=n
k
tx
kkkexptg
1
' şi ( ) ( )XMxpgn
k
kk ==∑=1
0' .
( ) ∑=
=n
k
tx
kkkexptg
1
2'' şi ( ) ( )XMxpgn
k
kk 21
20'' ==∑=
.
M
( ) ∑=
=n
k
txr
kk
r kexptg1
şi ( ) ( )XMxpg r
n
k
r
kk
r ==∑=1
0 .
In concluzie, funcŃia generatoare se foloseşte pentru a calcula
momente de diferite ordine ale unei variabile aleatoare discrete. Acestea se
obŃin derivând funcŃia generatoare în 0=t .
III.6. Caracteristici numerice ale variabilelor aleatoare continue
Fie X o variabilă aleatoare continuă, cu funcŃia de repartiŃie F şi
funcŃia densitate
de probabilitate f: ( )
Rxxf
xX
∈
,unde
( )
( )
=
∈∀≥
∫∞+
∞−
.1
,0
dxxf
Rxxf
34
• Valoarea medie
DefiniŃia III.6.1. Numim valoare medie a variabilei aleatoare
discrete X acea valoare notată prin m, sau X , sau ( )XM şi definită prin
( )∫+∞
∞−
= dxxxfm .
ProprietăŃi. Valoarea medie are următoarele proprietăŃi:
1) ( ) ( ) ,bXaMbaXM +=+ Rba ∈∀ ,
2) ( ) ( ) ( ),YMXMYXM +=+
3) Dacă variabilele aleatoare X şi Y sunt independente, atunci
( ) ( ) ( ).YMXMXYM =
4) Dacă ( )NnnX ∈ este un şir de variabile aleatoare continue
independente două câte două, atunci
( ) ( ) ( )∑ ∑∑= ≤<≤=
+=
n
i nji
jii
n
i
i XMXMXMXM1 1
22
1
2 .
5) Dacă X este o variabilă aleatoare continuă cu funcŃia de repartiŃie F şi
media m, atunci:
i) ( )( ) 01lim =−+∞→
xFxx
.
ii) ( ) 0lim =−∞→
xxFx
.
ObservaŃie. Dacă în propoziŃia precedentă, la punctul 1) se ia 0=a ,
atunci se obŃine că valoarea medie a unei constante este constanta însăşi, iar
punctele 2) şi 3) se pot extinde pentru un număr finit de variabile aleatoare.
• Momentul de ordin r
DefiniŃia III.6.2. Numim momentul de ordin r al variabilei aleatoare
X, valoarea medie a variabilei rX .
Vom nota momentul de ordin r cu ( )XM r :
35
( ) ( ) ( )∫+∞
∞−
== dxxfxXMXM rr
r .
• Valoarea medie de ordin r
DefiniŃia III.6.3. Valoarea medie de ordin r a unei variabile
aleatoare X este radicalul de ordin r al momentului de ordin r:
( ) ( )rrr
rr dxxfxXM ∫+∞
∞−
==η
• Abaterea
DefiniŃia III.6.4. Numim abaterea variabilei aleatoare X , având
valoarea medie m, variabila aleatoare mX −=ξ .
ObservaŃie. Dacă ( )
Rxxf
xX
∈
, atunci
( )Rx
xf
mx
∈
−ξ şi ( ) 0=ξM .
• Momentul centrat de ordin r
DefiniŃia III.6.5. Momentul centrat de ordin r al variabilei
aleatoare X este momentul de ordin r al abaterii.
( ) ( ) ( )( ) ( ) ( )∫+∞
∞−
−=−=== xfmxmXMMMrrr
rr ξξµ .
• Dispersia.
DefiniŃia III.6.6. Momentul centrat de ordin 2 se numeşte dispersie.
( ) ( ) ( )[ ] ( ) ( ) ( ) ( )[ ]2222
2 XMXMdxxfmxmXMXXD −=−=−== ∫+∞
∞−
µ
.
ProprietăŃi. Dispersia verifică următoarele proprietăŃi:
1) ( ) 0=cD , Rc∈∀ .
36
2) ( ) ( )XDccXD 2= .
3) Dacă variabilele aleatoare X şi Y sunt independente, atunci
( ) ( ) ( ).YDXDYXD +=+
• Abaterea medie pătratică.
DefiniŃia III.6.7. Media de ordin 2 a abaterii se numeşte abatere
medie pătratică.
( )XD=σ .
• Modul (Valoarea modală; valoarea dominantă)
DefiniŃia III.6.8. Valoarea modală a unei variabile aleatoare continue
X este acea valoare a variabilei, pentru care funcŃia densitate de probabilitate
este maximă.
Dacă ( )
Rxxf
xX
∈
este o variabilă aleatoare continuă, atunci valoarea
sa modală este soluŃia sistemului ( )( )
<
=
0"
0'
xf
xf.
• Mediana
DefiniŃia III.6.9. Mediana unei variabile aleatoare continue este un
număr real Me pentru care avem
( ) ( )MeXPMeXP ≥=< .
Dacă variabila X are funcŃia de repartiŃie F, atunci
( ) ( )xFMeXP =< şi ( ) ( )xFMeXP −=≥ 1 .
37
Prin urmare obŃinem că ( )2
1=xF . Aşadar, mediana este soluŃia ecuaŃiei
( )2
1=xF .
ObservaŃie. Mediana unei variabile aleatoare este un număr real şi nu
este neapărat o valoare a variabilei.
Se poate ca o variabilă aleatoare să nu admită medie, dar orice
variabilă aleatoare admite cel puŃin o mediană.
• FuncŃia caracteristică
Fiind dată o variabilă aleatoare continuă ( )
Rxxf
xX
∈
, putem
considera variabila aleatoare nkk
itx
itX
p
ee
k
,1=
, cu 12 −=i şi
kk
itxtxitxe k sincos += .
DefiniŃia III.6.10. FuncŃia caracteristică a variabilei aleatoare X
este media variabilei aleatoare itXe , adică
( ) ( ) ∑∑ ∑== =
+===n
k
kk
n
k
n
k
kkk
itxitX txpitxppeeMt k
11 1
sincosϕ .
ProprietăŃi. FuncŃia caracteristică a unei variabile aleatoare discrete
are următoarele proprietăŃi:
1) ( ) 10 =ϕ şi ( ) 1≤tϕ , Rt∈∀ .
2) ( )tϕ este uniform continuă pe R.
3) ( ) ( )tt ϕϕ =− .
4) ( ) ( )atet X
itb
baX ϕϕ =+ , Rba ∈∀ , .
5) Dacă X şi Y sunt două variabile aleatoare independente, atunci
( ) ( ) ( )ttt YXYX ϕϕϕ +=+
38
adică, funcŃia caracteristică a unei sume de două variabile aleatoare
independente este egală cu produsul funcŃiilor caracteristice ale celor două
variabile.
• FuncŃia generatoare
Fiind dată o variabilă aleatoare discretă nkk
k
p
xX
,1=
, putem considera
variabila aleatoare nkk
tx
tX
p
ee
k
,1=
.
DefiniŃia III.6.11. FuncŃia generatoare ataşată unei variabile
aleatoare discrete X este media variabilei tXe , adică
( ) ( ) ∑=
==n
k
k
txtX peeMtg k
1
.
Au loc următoarele relaŃii:
( ) ∑=
=n
k
tx
kkkexptg
1
' şi ( ) ( )XMxpgn
k
kk ==∑=1
0' .
( ) ∑=
=n
k
tx
kkkexptg
1
2'' şi ( ) ( )XMxpgn
k
kk 21
20'' ==∑=
.
M
( ) ∑=
=n
k
txr
kk
r kexptg1
şi ( ) ( )XMxpg r
n
k
r
kk
r ==∑=1
0 .
In concluzie, funcŃia generatoare se foloseşte pentru a calcula
momente de diferite ordine ale unei variabile aleatoare discrete. Acestea se
obŃin derivând funcŃia generatoare în 0=t .
39
UNITATEA DE STUDIU IV
REPARTIłII CLASICE
IV.1. RepartiŃii discrete
1. RepartiŃia discretă uniformă
DefiniŃia IV.1.1. Spunem că variabila aleatoare X are repartiŃie discretă uniformă de parametru n dacă pentru orice 1,2,..., ,k n∈
( ) 1.kp P X k
n= = =
Tabloul de repartiŃie este: 1 2 ...
.1 1 1...
n
n n n
PropoziŃia IV.1.1. Dacă X este o variabilă aleatoare cu repartiŃie
discretă uniformă atunci media este ( ) 1,
2
nM X
+= iar dispersia de
( )2 1
.12
nD X
−=
DemonstraŃie.
( ) ( )
( )1 1
1 1 1 11 2 ...
11 2 ... 12 ;
2
n n
k
k k
M X k p x k nn n n n
n n
n n
n n
= =
= ⋅ = ⋅ = ⋅ + ⋅ + + ⋅ =
++ + + +
= = =
∑ ∑
( ) ( ) ( )2
2 2 2 2 2
1
1 1 1 11 2 ...
2
=
+ = ⋅ − = ⋅ + ⋅ + + ⋅ − =
∑n
k
k
nD X k p x M X n
n n n
( )( )2 22 2 2 2
1 2 11 2 ... 1 1 16 .
2 2 12
n n n
n n n n
n n
+ ++ + + + + − = − = − =
40
2. RepartiŃia binomială
DefiniŃia IV.1.2. Spunem că variabila aleatoare X are repartiŃie binomială de parametri n şi p (n întreg pozitiv, 0 1p< < ) dacă pentru
orice 0,1, 2,..., ,k n∈
( ) ,k k n k
k np P X k C p q −= = =
unde 1 .q p= −
Tabloul de repartiŃie este:
−− nknkk
n
n
n
n pqpCpqCq
nkX
LL
LL11
10.
PropoziŃia IV.1.2 . Dacă X este o variabilă aleatoare cu repartiŃie
binomială atunci media, respectiv dispersia sunt date de: ( ) ,M X n p= ⋅
respectiv ( ) .D X n p q= ⋅ ⋅
DemonstraŃie. Folosim identitatea:
( )0
.n
n k k k n k
n
k
px q C p x q −
=
+ =∑
Prin derivarea acestei identităŃi în raport cu x obŃinem:
( ) 1 1
0
.n
n k k k n k
n
k
np px q kC p x q− − −
=
+ =∑ (*)
Dar ( )0
,n
k k n k
n
i
M X kC p q −
=
=∑ ceea ce înseamnă că în relaŃia de mai sus,
considerând 1x = obŃinem ( ) ( ) 1.
nM X np p q
−= + Deoarece 1,p q+ = avem
( ) .M X np=
Pentru calcularea dispersiei utilizăm formula ( ) ( ) ( )2 2 ;D X M X M X= −
Pentru a determina momentul de ordin 2 ( )2 2
0
.n
k k n k
n
k
M X k C p q −
=
=∑ înmulŃim
relaŃia (*) cu x şi o derivăm încă o dată, obŃinând:
( ) ( ) ( )1 22 2 1
0
1 .n
n n k k k n k
n
k
np px q np n x px q k C p x q− − − −
=
+ + − + =∑
În această relaŃie îl luăm pe 1x = şi Ńinând cont de faptul că membrul drept
reprezintă chiar ( )2M X şi că 1,p q+ = rezultă:
( ) ( ) ( ) ( )2 21 1 .M X np n n p np np p np np q= + − = + − = +
Dispersia va fi în acest caz: ( ) ( ) ( )2 .D X np np q np npq= + − =
41
3. RepartiŃia Poisson
DefiniŃia IV.1.3. Variabila aleatoare X are repartiŃia Poisson cu parametrul 0,λ > dacă ea poate lua orice valoare întreagă pozitivă şi
( )!
kk
kp P X k ek
λ −= = = , 0,1, 2,...k =
Tabloul de repartiŃie este:
−−−
LL
LL
λλλ λλ e
nee
nX
n
!
10
PropoziŃia IV.1.3. Dacă X este o variabilă aleatoare cu repartiŃie
Poisson atunci: ( )M X λ= şi ( ) .D X λ=
DemonstraŃie. Avem că
( )( ) ( )
1
1 1 1
.! 1 ! 1 !
k k k
k k k
M X k e e e e ek k k
λ λ λ λ λλ λ λλ λ λ
−∞ ∞ ∞− − − −
= = =
= ⋅ ⋅ = ⋅ = = =− −∑ ∑ ∑
Pentru calcularea dispersiei utilizăm formula ( ) ( ) ( )2 2 .D X M X M X= −
Folosim următorul artificiu de calcul:
( )( )
( ) ( ) ( )
22 2 2
2 1
2
1 1
2 2
12 ! !
! !
,
k k
k k
k k
k k
e e e e k kk k
e k e kk k
M X M X M X
λ λ λ λ
λ λ
λ λλ λ λ
λ λ
λ
−∞ ∞− − −
= =
∞ ∞− −
= =
= = = − =−
= − =
== − = −
∑ ∑
∑ ∑
de unde rezultă că ( )2 2 .M X λ λ= +
În final obŃinem ( ) ( ) ( )2 2 2 2 .D X M X M X λ λ λ λ= − = + − =
ObservaŃie. Legea lui Poisson se mai numeşte şi legea evenimentelor rare şi se poate obŃine ca un caz limită al legii binomiale pentru p foarte mic şi n foarte mare.
4. RepartiŃia hipergeometrică
DefiniŃia IV.1.4. Variabila aleatoare X are repartiŃia hipergeometrică de parametri ,a b şi n ( , ,a b n numere întregi pozitive,
n a b≤ + ) dacă pentru orice ,k ( ) ( )max 0, min ,n b k n a− ≤ ≤ avem:
PropoziŃia IV.1.4. Dacă X este o variabilă aleatoare cu repartiŃie hipergeometrică atunci media, respectiv dispersia sunt:
42
( ) ,na
M Xa b
=+
respectiv ( ) ( )( ) ( )2 .
1
nab a b nD X
a b a b
+ −=
+ + −
DemonstraŃie. Avem că valoare medie este
( )0
.k n kna b
nk a b
C CM X k
C
−
= +
=∑
Pentru determinarea mediei utilizăm următoarele calcule:
1) ( )
( )( ) ( )
( )( ) ( )
11
1 ! 1 !!;
! ! 1 ! ! 1 ! !k k
a a
a a aakC k k a aC
k a k k k a k k a k
−−
− −= = = =
− − − − −
( ) .k n k
a bk n
a b
C Cp P X k
C
−
+
= = =
2) 1 11 1
0 1 1
,n n n
k n k k n k k n k n
a b a b a b a b
k k k
C C kC C a C C aC− − − − −− + −
= = =
= = =∑ ∑ ∑
unde Ńinem cont de faptul că 0
.n
k n k n
a b a b
k
C C C−+
=
=∑
Astfel, media este:
( ) ( )( ) ( )
( )( )
11
1 ! ! !.
1 ! ! !
n
a b
n
a b
a b n a b naC naM X a
C n a b n a b a b
−+ −
+
+ − + −= = ⋅ =
− + − + +
Pentru calcularea dispersiei utilizăm formula ( ) ( ) ( )2 2 ,D X M X M X= −
Mai întâi calculăm momentul de ordin 2:
( )
( )
( ) ( )
2 2 2
0 0
0 0
0
1
1 11
1 1
k n kn nk n ka ba bn n
k ka b a b
n nk n k k n k
a b a bn nk ka b a b
nk n k
a bnka b
C CM X k k C C
C C
k k C C kC CC C
k k C C M XC
−−
= =+ +
− −
= =+ +
−
=+
= = =
= − + =
= − +
∑ ∑
∑ ∑
∑
unde evident ( )2 1 .k k k k= − +
( ) ( )( )
( ) ( )( ) ( )
( )
0 2
22
2 2
!1 1
! !
2 !1 1 .
2 ! !
n nk
a
k k
n nk
a
k k
ak k C k k
k a k
aa a a a C
k a k
= =
−−
= =
− = − =−
−= − = −
− −
∑ ∑
∑ ∑
Revenind în formula pentru momentul de ordinul 2 avem:
( ) ( ) ( )2 22
2
1k n k
a bnka b
a aM X C C M X
C
− −−
=+
−= + =∑
( ) ( )( )( ) ( ) ( )
( )( )( )
1 ! ! 2 !.
! 2 ! ! 1
a a n a b n a b na na b nna
a b n a b n a b a b a b
− + − + − + −= + =
+ − + − + + + −
43
Dispersia este:
( ) ( ) ( ) ( )( )( ) ( )
( )( ) ( )
2 22 2
2 2 .1 1
na na b n nab a b nn aD X M X M X
a b a b a b a b a b
+ − + −= − = − =
+ + − + + + −
5. RepartiŃia geometrică DefiniŃia IV.1.5. Variabila aleatoare X are repartiŃie geometrică de parametru p cu proprietatea ( 0 1p< < ) dacă ea poate lua orice valoare întreagă pozitivă şi
( ) 1,k
kp P X k pq −= = =
unde 1 .q p= −
PropoziŃia IV.1.5. Dacă X este o variabilă aleatoare cu repartiŃie geometrică atunci:
( ) 1,M X
p= ( ) 2
.q
D Xp
=
DemonstraŃie.Vom calcula media şi momentul de ordin doi utilizând funcŃia generatoare
1
1 1
( ) ( ) ,1 1
t ttk k t k
t tk k
p p e q e pF t e pq e q
q q e q e q
∞ ∞−
= =
⋅ ⋅= = = ⋅ =
− ⋅ − ⋅∑ ∑
unde am avut în vedere că 0 1.q< < Calculăm derivata de ordinul întâi a funcŃiei ( )F t în raport cu t :
2'( )
(1 )
t
t
peF t
e q=
− şi considerând 0t = rezultă că media variabilei aleatoare
X va fi: 1
( ) '(0) ;M X Fp
= =
Calculăm derivata de ordinul doi a funcŃiei ( )F t în raport cu t :
23 3 2 2
( 1) ( 1) 1 1"( ) "(0) ( ) "(0) ;
(1 ) (1 )
t t
t
pe qe p q q qF t F M X F
e q q p p
+ + + += ⇒ = = ⇒ = =
− −
Utilizăm formula dispersiei:
2 22
( ) ( ) ( ) .q
D X M X M Xp
= − =
44
IV.2. RepartiŃii continue
1. RepartiŃia continuă uniformă
DefiniŃia IV.2.1. Variabila aleatoare X are repartiŃie continuă uniformă de parametri ,a b dacă densitatea de probabilitate este:
( ) [ ]1, ,
0 , ( , ) ( , )
x a bf x b a
x a b
∈= − ∈ −∞ ∪ ∞
.
Se pot verifica următoarele condiŃii: 0f ≥ şi ( ) 1.f x dx
+∞
−∞
=∫
PropoziŃia IV.2.1. Dacă variabilă aleatoare X are repartiŃia uniformă de parametri ,a b atunci:
( ) ,2
a bM X
+= ( ) ( )2
.12
b aD X
−=
DemonstraŃie. Avem că
( ) ( ) ( ) ( ) ( )a b
a b
M x x x dx x x dx x x dx x x dxρ ρ ρ ρ+∞ +∞
−∞ −∞
= = + +∫ ∫ ∫ ∫
şi Ńinând cont de faptul că funcŃia are valoarea 0 în afara intervalului [ ],a b
obŃinem:
( )2 2 21 1 1
.2 2 2
b
a
bx b a a bM x x dx
ab a b a b a
− += = ⋅ = ⋅ =
− − −∫
Dispersia este dată de formula: ( ) ( ) ( )2 2 .D X M X M X= −
Calculăm mai întâi momentul de ordin 2:
( ) ( )3 2 2
2 2 2 1 1.
3 3
b
a
bx b ab aM X x x dx x dx
ab a b aρ
+∞
−∞
+ += = = =
− −∫ ∫
şi dispersia va fi obŃinem:
( ) ( )22 2 2 22.
3 4 12
a bb ab a b ab aD X
++ + − += − =
2. RepartiŃia exponenŃială
DefiniŃia IV.2.2. O variabilă aleatoare X are repartiŃie
exponenŃială de parametru 0λ > dacă densitatea de probabilitate este:
( ) , 0.
0 , 0
xe xf x
x
λλ − ≥=
<
45
PropoziŃia IV.2.2. Dacă variabila aleatoare X are repartiŃia
exponenŃială de parametru 0,λ > atunci:
( ) 1M X
λ= şi ( ) 2
1.D X
λ=
DemonstraŃie.Atât pentru calcularea mediei cât şi a dispersiei vom utiliza metoda integrării prin părŃi.
( ) ( ) ( )'0 0
0
1 1 0 .
0 0
x x
x x x
M X x x dx x e dx x e dx
xe e dx e
λ λ
λ λ λ
ρ λ
λ λ
+∞ +∞ +∞− −
−∞
+∞− − −
= = = − =
+∞ +∞= − + = − =
∫ ∫ ∫
∫
( ) ( )2 2 2 2
0 0
20
+∞ +∞ +∞− − −
−∞
+∞= = = − + =∫ ∫ ∫x x xM X x x dx x e dx x e xe dxλ λ λρ λ
20
2 2 1 2 0 .xx e dxλλ
λ λ λ λ
+∞−= + = ⋅ =∫
Prin înlocuire în formula dispersiei obŃinem: ( ) 2 2 2
2 1 1.D X
λ λ λ= − =
3. RepartiŃia gamma
DefiniŃia IV.2.3. O variabilă aleatoare X are repartiŃie gamma de parametri a şi b ( 0, 0a b> > ) şi notăm ( ),X a bγ∈ dacă funcŃia densitate
de probabilitate este:
46
( ) ( )11
, 0.
0 , 0
x
a bax e x
f x a b
x
−−>
= Γ <
PropoziŃia IV.2.3. Dacă variabilă aleatoare X are repartiŃia gamma, atunci:
( )M X ab= şi ( ) 2.D X ab=
DemonstraŃie. În cele ce urmează vom aminti noŃiunea de integrală
gamma: ( ) 1
0
a xa x e dx
+∞− −Γ = ∫
şi relaŃia de recurenŃă pentru aceasta:
( ) ( )1 .a a aΓ + = Γ
Pentru calculul mediei avem că
( ) ( )( ) ( )
1
0 0
1 1 1 1.
x x
a ab ba a
M X x x dx x x e dx x e dxa b a b
ρ+∞ +∞ +∞
− −−
−∞
= = = ⋅Γ Γ∫ ∫ ∫
Pentru rezolvarea acestei integrale vom face următoarea substituŃie: x
t x bt dx bdtb= ⇒ = ⇒ =
şi observând că limitele de integrare se păstrează, obŃinem:
( )( ) ( ) ( )
( )( )
( )0 0
1 11 .a a t a t
a
b b bM X t b e bdt t e dt a a a ab
a b a a a
+∞ +∞− −= ⋅ = = Γ + = Γ =
Γ Γ Γ Γ∫ ∫Calculăm momentul de ordinul 2:
( ) ( )( )
2 2 1
0
1 1 x
a ba
M X x x dx x e dxa b
ρ+∞ +∞
−+
−∞
= = ⋅Γ∫ ∫
şi utilizând substituŃia anterioară avem:
47
( ) ( ) ( ) ( )( )
2 22 1 1 1
0 0
1 12a a t a t
a
b bM X b t e bdt t e dt a
a b a a
+∞ +∞+ + − + −= ⋅ = = Γ + =
Γ Γ Γ∫ ∫
( ) ( )( )
( )2
211 .
a a b aa a b
a
+ Γ= = +
Γ
Prin înlocuirea în formula dispersiei obŃinem:
( ) ( ) ( )22 21 .D X a a b ab ab= + − =
4. RepartiŃia beta
DefiniŃia IV.2.4. Variabila aleatoare X are repartiŃie beta de parametri a şi b ( 0, 0)a b> > şi notăm ( ),X a bγ∈ dacă are densitatea de
probabilitate:
( ) ( )( ) ( )
( )
1111 , 0,1
, .
0 , 0,1
bax x xa bf x
x
β−− − ∈
= ∉
PropoziŃia IV.2.4. Dacă variabilă aleatoare X are repartiŃia beta,
atunci:
( ) aM X
a b=
+ şi ( )
( ) ( )2 .1
abD X
a b a b=
+ + +
DemonstraŃie. Mai întâi amintim noŃiunea de integrală beta:
( ) ( )1
11
0
, 1baa b x x dxβ−−= −∫
şi relaŃia de legătură între integrala beta şi integrala gamma:
( ) ( ) ( )( )
, .a b
a ba b
βΓ Γ
=Γ +
Calculăm media:
( ) ( ) ( ) ( ) ( )0 1
0 1
.M X x x dx x x dx x x dx x x dxρ ρ ρ ρ+∞ +∞
−∞ −∞
= = + +∫ ∫ ∫ ∫
Prima şi ultima integrală sunt egale cu 0 conform definiŃiei şi prin urmare avem:
( )( )
( ) ( )( )
( ) ( )( )
( )( ) ( )
11
0
1, 111
, , 1
baa b a a a b
M X x x dxa b a b a b a b
ββ β
− + Γ + Γ Γ += − = = ⋅ =
Γ + + Γ Γ∫
48
( )( ) ( )
( )( )
.a a a b a
a b a b a a b
Γ Γ += ⋅ =
+ Γ + Γ +
( ) ( ) ( )( )
( )1 1
12 2 2 1
0 0
11
,
baM X x x dx x x dx x x x dxa b
ρ ρβ
+∞−−
−∞
= = = − =∫ ∫ ∫
( )( ) ( )
( )( ) ( )( )
( )( ) ( )
111
0
2, 211
, , 2
baa b a b a b
x x dxa b a b a b a b
ββ β
−+ + Γ + Γ Γ += − = = ⋅ =
Γ + + Γ Γ∫
( ) ( )( ) ( ) ( )
( )( )
( )( )( )
1 1.
1 1
a a a a b a a
a b a b a b a a b a b
+ Γ Γ + += ⋅ =
+ + + Γ + Γ + + +
Dispersia va fi dată de : ( )( ) ( )2 .
1
abD X
a b a b=
+ + +
5. RepartiŃia normală
DefiniŃia IV.2.5. Variabila aleatoare X are repartiŃie normală de parametri m şi σ şi notăm ( ), ,X N m σ∈ dacă funcŃia densitate de
probabilitate este:
( )( )2
221, .
2
x m
f x e xσ
σ π
−−
= ∀ ∈
ObservaŃie. FuncŃia ( )f x este simetrică faŃă de m şi are puncte de inflexiune:
.x m σ= ± Pentru 0m = şi 1σ = se obŃine repartiŃia normală “normată”, ( )0,1 ,N a
cărei densitate este: ( )2
21, .
2
x
f x e xπ
−= ∀ ∈
DefiniŃia IV.2.6. FuncŃia de repartiŃie a variabilei normale normate
este
( )21
21
2
xt
x e dtπ
−
−∞
Φ = ∫
şi se numeşte funcŃia lui Laplace. Din simetria lui ( )xΦ rezultă:
( ) ( ) ( ) ( ) ( )1 1x P X x P X x P X x xΦ − = < − = > = − < = −Φ
de unde:
49
( ) ( ) 1.x xΦ +Φ − =
FuncŃia lui Laplace este tabelată pentru diferite valori ale lui .x Cu aceste tabele putem găsi probabilităŃile asociate evenimentelor privind orice variabilă normală.
ObservaŃie. Dacă ( ), ,X N m σ∈ atunci:
a) ( ) ;b m
P X bσ− < = Φ
b) ( ) .b m a m
P a X bσ σ− − < < = Φ −Φ
PropoziŃia IV.2.5. Dacă X este o variabilă aleatoare cu repartiŃie
normală, atunci: ( )M X m= şi ( ) 2.D X σ=
DemonstraŃie.
( ) ( )22
2
( )221 1
.2 2
x mx m
M X x x dx x e dx xe dxσσρσ π σ π
− −+∞ +∞ +∞ −−
−∞ −∞ −∞
= = =∫ ∫ ∫
Rezolvăm această integrală făcând următoarea substituŃie:
2 22
x mt x m t dx dtσ σ
σ−
= ⇒ = + ⇒ =
şi observând că nu se modifică nici unul dintre capetele integralei.
( ) ( ) 2 2 21 22 2 .
2t t tm
M X m t e dt te dt e dtσ
σ σσ π π π
+∞ +∞ +∞− − −
−∞ −∞ −∞
= + = +∫ ∫ ∫
Deoarece funcŃia de sub prima integrală este o funcŃie impară
( ) ( )( ),f t f t− = − rezultă că integrala se anulează şi Ńinând cont de integrala
Gauss:2
0
,2
xe dxπ+∞
− =∫ obŃinem:
50
( )2 2
0
2 2.
2t tm m m
M X e dt e dt mπ
π π π
+∞ +∞− −
−∞
= = = ⋅ =∫ ∫
( ) ( )( ) ( ) ( )2
2 2 21.
2
x m
D X x M X x dx x m e dxσρσ π
− +∞ +∞ −
−∞ −∞
= − = −∫ ∫
Utilizând aceeaşi substituŃie integrala devine:
( ) ( ) 2 2 22 22
2 2
0
1 2 42 2 .
2t t tD X t e dt t e dt t e dt
σ σσ σ
σ π π π
+∞ +∞ +∞− − −
−∞ −∞
= = =∫ ∫ ∫
Scriem 2
2
'
2
tt e
te−
−
= − şi folosim metoda integrării prin părŃi:
( )2
22 2 2
2
0
4 2 20 .
02 2
tte
D X t e dtσ σ σ π
σπ π π
+∞−−+∞
= + = + ⋅ =− ∫
6. RepartiŃia hi-pătrat 2( )χ
DefiniŃia IV.2.7. Variabila aleatoare X are repartiŃia 2χ cu n grade de libertate dacă are densitatea de probabilitate:
( )
12 2
2
1, 0
.22
0 , 0
n x
nx e x
nf x
x
− −>
= Γ
<
.
PropoziŃia IV.2.6. Pentru o variabilă aleatoare X ce satisface repartiŃia 2χ avem:
( )M X n= şi ( ) 2 .D X n=
DemonstraŃie.
51
( ) ( ) ( )1
2 2
0 0 2
1.
22
n x
nM X x x dx x x dx x x e dx
nρ ρ
+∞ +∞ +∞− −
−∞
= = = Γ
∫ ∫ ∫
Facem următoarea substituŃie: 2 22
xt x t dx dt= ⇒ = ⇒ = şi astfel media
devine:
( ) ( ) 2 22
0 0 02
1 2 22 2
22 22
n nnt t t
nM X t e dt t e dt t e dt
n nn
+∞ +∞ +∞− − −= = = =
Γ ΓΓ
∫ ∫ ∫
2 21 .
2 2 22 2
n n nn
n n
= Γ + = Γ = Γ Γ
( ) ( ) ( )12 2 2 2 2 2
0 0 2
1.
22
n x
nM X x x dx x x dx x x e dx
nρ ρ
+∞ +∞ +∞− −
−∞
= = = Γ
∫ ∫ ∫
Folosim aceeaşi substituŃie şi avem:
( ) ( )112 22
0 02
1 4 42 2 2
22
2 22
nnt t
n
nM X t e dt t e dt
n nn
+∞ +∞++ − − = = = Γ + = Γ ΓΓ
∫ ∫
( )42 2 .
2 2 22
n n nn n
n
= + Γ = + Γ
În final, putem calcula dispersia:
( ) ( ) ( ) ( )22 22 2 .D X M X M X n n n n= − = + − =
7. RepartiŃia Student
DefiniŃia IV.2.8 Variabila aleatoare X are o repartiŃie Student cu n grade de libertate dacă funcŃia densitate de probabilitate este
( )1
2 2
1
21 , .
2
nn
xf x x
n nnπ
+−
+ Γ = + ∈ Γ
PropoziŃia IV.2.7. Dacă variabilă aleatoare X are repartiŃia Student,
atunci:
52
( ) 0M X = şi ( ) .2
nD X
n=
−
DemonstraŃie.
( ) ( )1
2 2
1
21 0
2
nn
xM X x x dx x dx
n nn
ρπ
+−+∞ +∞
−∞ −∞
+ Γ = = + = Γ
∫ ∫ ,deoarece funcŃia de
sub integrală este impară iar intervalul de integrare este simetric.
UNITATEA DE STUDIU V
LEGI ALE NUMERELOR MARI
V.1.Tipuri de convergenŃe pentru şiruri de variabile aleatoare
Fie ( )pKE ,, un câmp borelian de probabilitate şi ( ) 1≥nnX un şir de
variabile aleatoare definite pe acest câmp. Spre deosebire de convergenŃa şirurilor de funcŃii din analiza matematică clasică, există mai multe tipuri de convergenŃă a unui astfel de şir de variabile aleatoare. ConvergenŃa în probabilitate DefiniŃia V.1.1. Un şir de variabile aleatoare ( ) 1≥nnX converge în probabilitate la variabila aleatoare X dacă
( ) ( ) 1lim =<−∈∞→
εeXeXEeP nn
, 0>∀ε .
Notăm convergenŃa în probabilitate prin XX P
n → .
ProprietăŃi. 1. Limita unui şir de variabile aleatoare convergent în probabilitate este
unică aproape sigur.
53
2. Dacă ( ) 1≥nnX şi ( ) 1≥nnY sunt două şiruri de variabile aleatoare astfel
încât XX P
n → şi YY P
n → atunci bYaXbYaX P
nn +→+ ,
pentru oricare numere reale a şi b. 3. Dacă ( ) 1≥nnX este un şir de variabile aleatoare astfel încât
XX P
n → , atunci XXP
n → .
ConvergenŃa în repartiŃie Fie ( ) 1≥nnX este un şir de variabile aleatoare căruia îi corespunde un
şir de funcŃii de repartiŃie ( ) 1≥nnF şi X o variabilă aleatoare cu funcŃia de
repartiŃie F . DefiniŃia V.1.2. Spunem că ( ) 1≥nnX converge în repartiŃie la X
dacă şirul de funcŃii ( ) 1≥nnF converge către funcŃia F în fiecare punct de
continuitate a acesteia.
Notăm convergenŃa în repartiŃie XX rep
n → . .
Teorema V.1.1.
1. Dacă XX P
n → , atunci XX rep
n → . .
2. Dacă c este o constantă reală şi dacă cX rep
n → . , atunci cX P
n → .
ConvergenŃa aproape sigură (ConvergenŃă tare) DefiniŃia V.1.3. Un şir de variabile aleatoare ( ) 1≥nnX converge
aproape sigur la variabila aleatoare X dacă mulŃimea punctelor e în care şirul ( ) 1≥nnX converge punctual formează un eveniment de probabilitate 1.
( ) ( ) 1lim =
=∈
∞→eXeXEeP n
n.
Notăm convergenŃa aproape sigură
XX sa
n → .. .
Teorema V.1.2. Dacă XX sa
n → .. , atunci XX P
n → .
Teorema V.1.3. XX P
n → dacă şi numai dacă din orice subşir al
şirului ( ) 1≥nnX se poate extrage alt subşir ( )1≥nnk
X astfel încât XXsa
nk→ .. .
54
ConvergenŃa în medie DefiniŃia V.1.4. Fie ( ) 1≥nnX un şir de variabile aleatoare şi X o
variabilă aleatoare. Dacă există momentele de ordin r ale variabilelor nX şi
X , notate ( )rnXM şi ( )rXM şi dacă ( ) 0lim =−∞→
r
nn
XXM , atunci spunem
că şirul ( ) 1≥nnX converge în medie r la X .
DefiniŃia V.1.5. ConvergenŃa în medie de ordin 2 implică convergenŃa în probabilitate.
V.2. InegalităŃi pentru variabile aleatoare
Teorema V.2.1.(Inegalitatea Cebîşev). Fie X o variabilă aleatoare pentru care există valoarea medie ( )XM şi dispersia ( )XD finite. Pentru
0>∀ε are loc inegalitatea
( )( ) ( )2
1ε
εXD
XMXP −≥<− ,
sau, echivalent
( )( ) ( )2ε
εXD
XMXP <≥− .
ObservaŃie. Inegalitatea afirmă că probabilitatea ca modulul abaterii unei variabile aleatoare să ia valori mai mari decît un număr 0>ε este mai
mică decât raportul ( )2εXD
. Prin urmare, dacă dispersia unei variabile
aleatoare este mică, atunci abateri mari de la medie sunt puŃin probabile. Teorema V.2.2.(Inegalitatea Markov) Dacă X este o variabilă aleatoare continuă ce ia valori pozitive, atunci
( )( ) ( ) ( )[ ]( )XM
XMXMXP
2
221 αα −>> ,
unde ( )1,0∈α .
V.3. Legi ale numerelor mari
Legile numerelor mari reprezintă un grup de teoreme referitoare la variabile aleatoare care urmează o repartiŃie binomială.
55
Teorema V.3.1.(Teorema lui Bernoulli). Fie un eveniment A de probabilitate teoretică p. Notăm cu α numărul de apariŃii a evenimentului A
în n probe. Numim frecvenŃă relativă raportul n
f nα
= . In aceste condiŃii
avem că nf converge în probabilitate la p, adică
( ) 1lim =<−∞→
εpfP nn
, 0>∀ε .
DemonstraŃie. Din inegalitatea Cebîşev avem că
( )2
2
1εσ
ε −≥<− aXP .
In repartiŃia binomială avem însă că npqD ==2σ . ObŃinem astfel
( ) ( )22222
2
111εεε
σεαε
αε
n
pq
n
npq
nnnpPp
nPpfP n −=−=−≥<−=
<−=<−
. Rezultă inegalitatea
( ) 112
≤<−<− εε
pfPn
pqn ,
din care, aplicând teorema cleştelui obŃinem concluzia. ObservaŃie. Din teorema Bernoulli obŃinem că în cazul unei populaŃii de volum mare, dacă se efectuează o selecŃie de volum n şi se obŃin α rezultate favorabile, atunci, cu o probabilitate apropiată de 1 putem afirma că probabilitatea evenimentului cercetat este dată de frecvenŃa relativă. Prin urmare, în studiul populaŃiilor pentru care nu putem determina probabilitatea p aceasta se poate exprima pe cale experimentală prin frecvenŃa relativă
nf n
α= a evenimentului cinsiderat.
Teorema V.3.2. (Teorema lui Poisson) Fie un şir de evenimente independente ,...,...,, 21 nAAA cu probabilităŃile teoretice ,...,..,, 21 nppp şi
presupunem că există n
pppp n
n
...lim 21 ++
=∞→
. Notăm cu nf frecvenŃa de
apariŃie a evenimentului nAAA ∪∪∪ ...21 în n probe. In aceste condiŃii
avem că pf P
n → .
DemonstraŃie. Presupunem că evenimentelor ,...,...,, 21 nAAA le
corespund variabilele aleatoare ,..2,1
01
=
=
kkk
kqp
X , iar evenimentului
56
nAAA ∪∪∪ ...21 îi corespunde variabila aleatoare n
XXY n
n
++=
...1 .
Avem că ( ) kk pXM = şi ( ) kkk qpXD = .
ObŃinem că media variabilei nY este
( ) ( ) ( ) ∑∑==
==++=n
k
k
n
k
knn pn
XMn
XXMn
YM11
1
11...
1
şi dispersia
( )
=
= ∑∑
=
=n
k
k
n
k
k
n XDnn
X
DYD1
21 1
.
Rezultă
( )22
112
2 ...11
εεσ
εn
qpqppfP nn
n
++−=−≥<− .
Cum 1=+ kk qp şi 0,0 >> kk qp , obŃinem că 4
1≤kkqp , nk ,1=∀ .
Drept urmare,
2222211
4
1
4
...
εεε nn
n
n
qpqp nn =≤++
.
ObŃinem astfel că
( ) 14
11
2≤<−<− ε
εpfP
nn
şi de aici, aplicând teorema cleştelui obŃinem concluzia. Teorema V.3.3.(Teorema Cebîşev). Fie ( ) 1≥nnX un şir de variabile
aleatoare independente două câte două, având dispersiile mărginite de aceeaşi constantă c:
( ) cXD n ≤ , ,...2,1=n .
Atunci, 0>∀ε avem că
( ) 011
lim11
=
>− ∑∑==
∞→ε
n
i
i
n
i
in
XMn
Xn
P ,
Adică, şirul de variabile aleatoare ( )( )∑=
−n
i
ii XMXn 1
1 converge în
probabilitate la 0. DemonstraŃie. Avem că
( )∑∑==
=
n
i
i
n
i
i XMn
Xn
M11
11
şi, Ńinând seama că variabilele date sunt independente avem şi
57
( )∑∑==
=
n
i
i
n
i
i XDn
Xn
D1
21
11.
Din ipoteză rezultă
n
cX
nD
n
i
i ≤
∑=1
1.
Inegalitatea Cebîşev pentru variabila ∑=
n
i
iXn 1
1 conduce la
( )
<
>− ∑∑==
211
11
εε
n
cXM
nX
nP
n
i
i
n
i
i ,
de unde, trecând la limită, obŃinem concluzia. Caz particular. Dacă ( ) ( ) ( ) mXMXMXM n ==== ...21 , atunci
obŃinem că
0...
lim 21 =
>−
+++∞→
εmn
XXXP n
n.
Astfel se explică de ce putem face observaŃii asupra mediei unei populaŃii pe baza unei selecŃii de voum mic comparativ cu volumul întregii populaŃii. ObservaŃie. Teorema Cebîşev ne spune că, deşi variabilele aleatoare independente pot lua valori departe de mediile lor, media aritmetică a unui număr suficient de mare de astfel de variabile aleatoare ia, cu o probabilitate
foarte mare, valori în vecinătatea constantei ( )∑=
n
i
iXMn 1
1. Această observaŃie
ne arată că între comportarea fiecărei variabile aleatoare şi a mediei lor aritmetice există o mare deosebire, în sensul că nu putem preciza ce valoare va lua fiecare variabilă aleatoare, dar putem preciza cu o probabilitate apropiată de 1 ce valoare va lua media aritmetică a acestor variabile. Teorema Cebîşev scoate în evidenŃă esenŃa numerelor mari: dacă anumite caracteristici ataşate unei populaŃii de volum mare conŃin erori, aceste erori devin neglijabile atunci când numărul lor este foarte mare.
58
Autoevaluare prin aplicaŃii
1. Din şirul primelor 100 de numere naturale se alege la întâmplare un număr.
Fie A evenimentul ca numărul ales să fie par. Ce înseamnă evenimentul A ? 2. Din şirul primelor 100 de numere naturale se alege la întâmplare un
număr. Fie A evenimentul ca numârul ales să înceapă cu cifra 3 şi B evenimentul ca numărul ales să aibă ultima cifră 5. Ce înseamnă evenimentul
BA − ? 3. Doi studenŃi joacă o partida de şah. Fie A evenimentul ca primul
student să câştige partida şi B evenimentul ca al doilea student să câştige .Partida s-a terminat remiză. Să se scrie evenimentul realizat prin intermediul evenimentelor A şi B.
4. Fie un lot de 10 piese ce se supune unui control de calitate. Notăm cu
iA evenimentul ca piesa i să fie defectă, cu 101,i = . Să se scrie următoarele
evenimente: a) niciuna din piese nu este defectă; b) cel puŃin una din piese este defectă; c) numai una din piese este defectă; d) toate piesele sunt defecte; 5. Cineva telefonează pe rând la 4 numere diferite. Fiecare număr este
format o singură dată. Se notează cu iA evenimentul ca la apelul i să nu se
primească răspuns, cu 41,i = . Să se scrie următoarele evenimente: a) s-a primit răspuns la toate apelurile; b) s-a primit răspuns la un singur apel; c) nu s-a primit răspuns la nici un apel;
d) nu s-a primit răspuns la un singur apel; e) nu s-a primit răspuns cel mult la primul apel.
6.Un aparat este format din trei componenete. Se noteazǎ cu A , B şi C respectiv evenimentele ca prima, a doua şi a treia componentǎ sǎ fie defectǎ. Sǎ se exprime cu ajutorul evenimentelor A , B şi C evenimentul ca:
a) cel puŃin o componentǎ este defectǎ, b) exact o componentǎ este defectǎ, c) nici o componentă nu este defectǎ,
59
d) toate componentele sunt defecte.
7. Într-o urnă sunt 3 bile albe şi 5 bile negre. Se cere probabilitatea de a se extrage o bilă albă.
8.. Se aruncă 2 zaruri. Se cer probabilităŃile: a. de a se obŃine dublă; b. de a se obŃine un total de 7 puncte; c. de a se obŃine un total de cel puŃin 3 puncte. 9. Zece obiecte metalice de greutăŃi diferite sunt aşezate pe un raft. Care
este probabilitatea ca acestea să fie aşezate în ordine crescătoare a greutăŃii?
10.Pe un raft sunt aşezate la întâmplare 10 cǎrŃi, dintre care trei reprezintǎ cele trei volume ale aceluiaşi roman. Sǎ se calculeze probabilitatea ca:
a) cele trei volume ale romanului sǎ fie aşezate unul lângă altul în ordinea naturalǎ (vol.1,2,3),
b) cele trei volume ale romanului sǎ fie aşezate unul lângǎ altul în orice ordine,
c) cele trei volume ale romanului sǎ fie aşezate unul lângǎ altul în ordinea naturalǎ, la începutul raftului.
11. Zece studenŃi sunt aşezaŃi într-o ordine aleatoare pe o bancă. Se cere probabilitatea ca doi dintre ei să stea mereu unul lângă celălalt.
12. Pentru un examen oral sunt pregătite 25 de bilete. Pe fiecare bilet sunt
câte 2 subiecte: 10 bilete conŃin câte 1 subiect de algebră şi 1 subiect de geometrie, 7 bilete conŃin 1 subiect de algebră şi unul de trigonometrie şi 8 bilete conŃin câte 1 subiect de geometrie şi unul de trigonometrie. Care este probabilitatea ca trăgand 2 bilete să nimeresc 2 subiecte de algebră?
13. Fiecare coeficient al ecuaŃiei trigonometrice batgx = este determinat
prin aruncarea unui zar şi luarea numărului de puncte ieşit. Care este
probabilitatea ca ecuaŃia dată să admită soluŃiile ,...1,0,4
=+= kka ππ
?
14. Trei tunuri trag simultan asupra unei Ńinte. ProbabilităŃile de
nimerire a Ńintei pentru cele trei tunuri sunt respectiv 601 ,p = , 802 ,p = ,
703 ,p = . Să se determine probabilitatea ca Ńinta să fie nimerită cel puŃin o
dată.
60
15. O persoană scrie n scrisori la n corespondenŃi. Amestecă scrisorile şi le introduce la întâmplare în n plicuri pe care erau deja scrise adresele. Care este probabilitatea ca cel puŃin un destinatar să primească scrisoarea adresată lui?
16. În magazia unei uzine se găsesc piese de acelaşi fel provenite de la 3 secŃii ale uzinei. Se ştie că prima secŃie produce 25% din totalul pieselor, a doua secŃie, 35% şi a treia secŃie 40% din totalul pieselor. Rebuturile sunt de 2%, 3%, respectiv 1% pentru cele 3 secŃii. a) Să se calculeze probabilitatea ca luând o piesă din magazie aceasta să fie rebut. b) Ştiind că o piesă aleasă la întâmplare este rebut, să se calculeze probabilitatea ca ea să provină de la a treia secŃie. 17. Pentru însămânŃări s-au pregătit seminŃe de grâu de 4 calităŃi diferite. ProbabilităŃile ca un bob luat la întâmplare să fie de una din cele 4 calităŃi sunt respectiv 0,7 , 0,25 , 0,4 , 0,1 . ProbabilităŃile ca dintr-un bob din cele 4 calităŃi să crească un spic bogat sunt respectiv 0,9 , 0,8 , 0,6 , 0,5 . Care este probabilitatea ca un spic recoltat să fie bogat? 18. Într-o anumită casă, probabilitatea că “există caşcaval” la micul dejun este 0,8, iar probabilitatea că “ există lapte” este 0,7. Probabilitatea că “există şi lapte şi caşcaval” la micul dejun este 0,5. CalculaŃi probabilitatea să fie caşcaval cu condiŃia să fie şi lapte, iar apoi probabilitatea să fie lapte cu condiŃia să fie şi caşcaval la micul dejun. 19. Din n bilete de examen, a sunt considerate favorabile. StudenŃii vin pe rând şi extrag câte un bilet. Dintre primii doi studenŃi care are şansa mai mare de a extrage un bilet favorabil? 20. Probabilitatea ca o echipă de fotbal să piardă primul meci din campionat este 0,9. Dacă pierde acest meci, probabilitatea de a-l pierde şi pe al doilea este 0,3. Dacă însă câştigă primul meci, probabilitatea de al pierde pe al doilea este 0,8. Ştiind că echipa a pierdut al doilea meci, găsiŃi probabilitatea să-l fi pierdut şi pe primul. 21. Ionel spală vasele de 3 ori pe săptămână, iar sora sa, Maria, de 4 ori. Zilele în care aceştia spală vasele se aleg la întâmplare în fiecare săptămână. Probabilitatea ca Ionel să spargă vase în timpul spălării este 0,2, iar probabilitatea ca Maria să spargă vase este 0,1. Într-o zi, tatăl, auzind zgomot de vase sparte spune: “ aceasta este ziua în care Ionel spală vase” Care este probabilitatea ca tatăl să aibă dreptate?
61
22 48% din populaŃia unei localităŃi sunt bărbaŃi. Doar 60% din ei ating vârsta de 70 de ani. Aceeaşi vârstă este atinsă de femei în procent de 75%. Care este probabilitatea ca o persoană din acea localitate să atingă vârsta de 70 de ani? 23. La o uzină, într-o zi de lucru, trei maşini A, B, C produc piese: 3900 de piese sunt produse de maşina A, 4200 de B şi 3600 de C. Probabilitatea ca o piesă să fie defectă este de 0,01 pentru maşina A, 0,02 pentru B şi 0,04 pentru C. La un control de calitate o piesa este aleasă la întâmplare din producŃia acelei zile şi se constată că ea este defectă. Care este probabilitatea ca ea să fi fost produsă de maşina B? 24. Un aparat este construit din două unităŃi. Pentru ca aparatul să funcŃioneze trebuie ca ambele unităŃi să fie în stare bună. Într-un anumit interval de timp, însă, ele se pot defecta, în mod independent, cu probabilităŃile 0,1 şi respectiv 0,2. Ştiind că aparatul s-a defectat, se cere probabilitatea să se fi defectat numai prima unitate. 25. Tragerea de pe un avion contra altui avion inamic poate să se producă de la distanŃele de 800m, 600m, sau 400m. Probabilitatea ca tragerea să se producă de la 800m este 0,5, de la 600m este 0,3 şi de la 400m este 0,2. Probabilitatea doborârii avionului inamic de la distanŃa de 800m este 0,4, de la 600m, 0,6 şi de la 400m, 0,8. Se efectuează o tragere al cărei efect este doborârea avionului inamic. Să se determine probabilitatea ca ragerea sa se fi efectuat de la 600m. 26.Se presupune că un sistem de detecŃie poate greşi asupra prezenŃei unei Ńinte ( de exemplu un avion inamic) cu probabilitatea 0,05, iar în prezenŃa reală a Ńintei, o detectează cu probabilitatea 0,9. Presupunând că probabilitatea de apariŃie a unei Ńinte în zona sistemului de detecŃie este 0,25, să se determine probabilitatea unei alarme false, imediat ce sistemul primeşte un semnal relativ la prezenŃa Ńintei.
27. Într-o grupă de studenŃi sunt 20 de băieŃi şi 10 fete. Care este probabilitatea
ca alegând la întâmplare 10 studenŃi pentru a forma o echipă, aceasta să fie alcătuită din 6 băieŃi şi 4 fete?
28. Într-o ladă sunt 1000 de şuruburi, din care 40 nu au filet. Care este probabilitatea ca din 200 de şuruburi luate la întâmplare, 10 să fie fără filet? 29. Un vânzător are la vânzare 100 de cutii identice din care 30 sunt cu pantofi, iar restul cu bocanci. Până la ora 12 au fost vândute 10 cutii. Să se afle probabilitatea ca 3 cutii să fi fost cu bocanci.
62
30. Dintr-un lot de 40 de maşini de spălat primite la un magazin, 3 nu încălzesc apa. Un cumpărător achiziŃionează 2 maşini de spălat. Care este probabilitatea ca acestea să funcŃioneze perfect? 31. O urnă conŃine 7 bile albe, 6 bile negre şi 10 bile verzi. Se extrag 9 bile. Care este probabilitatea de a se obŃine câte 3 bile din fiecare culoare?
32. Pe un raft, într-un magazin, se aflǎ 50 de piese de acelaşi tip, care provin de la douǎ fabrici, respectiv 20 de la una dintre ele şi 30 de la cealaltǎ. Intr-o zi s-au vândut şase astfel de piese. Sǎ se calculeze probabilitatea sǎ se fi vândut acelaşi numǎr (câte trei) de piese de la cele douǎ fabrici.
33. Se aruncă 7 monede. Care este probabilitatea să apară de 5 ori marca?
34. Se aruncă un zar de 4 ori. Să se determine probabilitatea de a se
obŃine faŃa cu 5 puncte de 3 ori.
35. Se ştie că 3 studenŃi din 200 fac alergie la Coca-Cola. Care este
probabilitatea ca într-o grupă de 50 de studenŃi să fie 4 alergici?
36. Se aruncă 2 zaruri de 100 de ori. Care este probabilitatea ca de 20 de
ori să se obŃină suma punctelor 4?
37. O bancă creditează pe o perioadă determinată de timp 8 societăŃi
comerciale. Probabilitatea de solvabilitate a acestora este de 0,9. Să se
determine probabilitatea ca 5 societăŃi să fie solvabile.
38. Un lot de 20 de porumbei călători sunt trimişi spre o
destinaŃie.Probabilitatea ca un porumbel să se întorcă este 6,0=p şi este
aceeaşi pentru toŃi porumbeii. Se cere probabilitatea ca să se întoarcă 14
porumbei.
63
39. Probabilitatea ca un portar al unei echipe de fotbal să prindă mingea
la o lovitură de la 11 metri este 3,0=p . Se cere probabilitatea ca din 5
lovituri să nu ia nici un gol.
40. Un tren soseşte la ora fixată cu probabilitatea 0,9. Să se determine
probabilitatea ca într-o săptămână trenul să întârzie de două ori, ştiind că face
o singură cursa pe zi.
41. Intr-un joc faŃă de un adversar la fel de puternic, ce este mai probabil
să se câştige: 3 partide din 4, sau 5 din 8?
42. Dacǎ o familie are 6 copii, se cere sǎ se calculeze probabilitatea ca: a) patru din cei şase copii sǎ fie bǎieŃi; b)cel puŃin doi din cei şase copii sǎ fie bǎieŃi.
43. .La un magazin se gǎsesc articole de îmbrǎcăminte dintre care 90% satisfac standardele, 7% prezintǎ defecŃiuni retuşabile, iar 3% prezintǎ defecŃiuni neretuşabile. Sǎ se calculeze probabilitatea ca din şase articole luate la întâmplare, trei sǎ satisfacǎ standardele, douǎ sǎ fie retuşabile şi unul sǎ fie neretuşabil.
44. Se dau 3 loturi a câte 100 de piese. În fiecare lot există şi piese
defecte: 3 în primul lot, 4 în al doilea şi 5 în al treilea. Dacă luăm câte o piesă
din fiecare lot, care este probabilitatea să obŃinem 2 piese bune şi una
defectă?
44. Trei vânători trag simultan asupra unei Ńinte. Se ştie că
probabilităŃile ca vânătorii să nimerească Ńinta sunt de 0,7, 0,8, respectiv 0,6.
care este probabilitatea ca Ńinta să fie nimerită exact o singură dată?
45. O societate comercială se aprovizionează de la 4 furnizori. Acesta
estimează că probabilităŃile cu care furnizorii pot onora comenzile la
64
termenul stabilit sunt 5
41 =p ,
2
12 =p ,
7
33 =p ,
3
14 =p . Să se detrmine
probabilitatea ca toŃi furnizorii să-şi onoreze comenzile la termen.
46. Intr-o secŃie sunt 3 strunguri care execută piese mari şi piese mici.
Primul, execută 10% piese mici, al doilea execută 15% piese mici, iar al
treilea 75% piese mari. Se ia câte o piesă la întâmplare de la fiecare strung.
Care este probabilitatea ca 2 piese să fie mici şi una mare?
47. Pe 4 tăvi dintr-o cofetărie sunt câte 30 de prăjituri, printre care se
află 2, 3, 1, respectiv 2 prăjituri mai necoapte. Vânzătoarea ia la întâmplare
câte o prăjitură de pe fiecare tavă. Care este probabilitatea ca toate să fie
coapte bine?
48. Cinci maşini, care produc acelaşi tip de piese, dau rebuturi în
procente 2%, 1%, 5%, 4%, 6% respectiv. Se ia câte o piesǎ produsǎ de la fiecare. Sǎ se calculeze probabilitatea ca din cele cinci piese luate, exact douǎ sǎ fie rebut, precum şi probabilitatea ca cel puŃin una sǎ fie rebut.
49. Se dau variabilele aleatoare independente
2,01,03,0
4321
pX şi
−
aY
8
1
4
1
8
13201
.
a) Să se determine parametrii reali p şi a.
b) Să se calculeze YXYXYX ⋅++ ,,4,5 .
c) Să se calculeze media, momentele de ordin 2 şi 3 , precum şi dispersia
celor două variabile aleatoare.
50. Se dau variabilele aleatoare independente
++
−
3
1
3
1
6
1101
baX şi
−
−2122
3
1201
abaY .
65
a) Să se determine parametrii reali b şi a.
b) Să se calculeze YXYXYX ⋅++ ,32, .
c) Să se calculeze media, momentele de ordin 2 şi 3 , precum şi dispersia
celor două variabile aleatoare.
51. CalculaŃi valoare medie următoarelor variabile aleatoare:
a)
100
1
100
1
100
1
100
1100321
L
LX
b)
⋅⋅⋅⋅
100
1
100
1
100
1
100
1101100
1
43
1
32
1
21
1
L
L
Y
c)
99299 2
1
2
1
2
1
2
1100321
L
LZ .
52. O variabilă aleatoare X are repartiŃia
−
321
201
pppX . Dacă
( )3
1=XM şi ( )
3
4=XD , calculaŃi 321 ,, ppp .
53. Se aruncă 2 zaruri. Se acordă 12 puncte dacă suma punctelor de pe
cele două feŃe este 2 sau 12, 4 puncte dacă suma este 7 şi un punct pentru
celelalte cazuri. Să se scrie tabelul de distribuŃie al variabilei aleatoare N
ce ia dret valori numărul de puncte acordate celui care aruncă zarul.
CalculaŃi apoi valoarea medie şi dispersia acestei variabile.
54. Se experimentează 3 prototipuri de aparate. ProbabilităŃile ca
acestea să corespundă sunt respectiv 9,01 =p , 8,02 =p şi 7,03 =p . Să
se scrie tabelul de distribuŃie al variabilei aleatoare ce ia ca valori
66
numărul de prototipuri care corespund. CalculaŃi apoi valoarea medie şi
abaterea medie pătratică a acestei variabile.
55. La un antrenament, un jucător de baschet nimereşte în coş la o
singură aruncare a mingii cu probabilitatea 7,0 . Să se scrie tabelul de
distribuŃie al variabilei aleatoare ce ia ca şi valori numărul de nimeriri la
coş, atunci când jucătorul aruncă mingea de 4 ori. CalculaŃi apoi valoarea
medie şi abaterea medie pătratică a acestei variabile.
56. La o şedinŃă se convoacă prin telefon 4 persoane. Probabilitatea ca
la un singur apel să se găsească telefonul ocupat este 0,1, 0,3, 0,2 şi
respectiv 0,25. Să se scrie tabelul de distribuŃie al variabilei aleatoare care
ia drept valori numărul persoanelor care au răspuns la telefon, atunci când
se dă un singur telefon la fiecare din cele 4 persoane.
57. Fie A şi B două evenimente astfel încât ( )4
1=AP , ( )
2
1=BPA şi
( )4
1=APB . Definim o variabilă aleatoare X, astfel: 1=X , sau 0=X ,
după cum se realizează sau nu evenimentul A. Definim de asemenea o
variabilă aleatoare Y, astfel: 1=Y , sau 0=Y , după cum se realixează
sau nu evenimentul B. CalculaŃi ( )XM şi ( )YM .
58. Fie funcŃia RRf →: , ( ) [ ]( ) ( )
+∞∪−∞−∈
−∈=
,11,,0
1,1,2
x
xkxxf , unde
Rk ∈ .
a) Să se determine parametrul real k astfel încât funcŃia f să fie o funcŃie
densitate de probabilitate.
b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de
repartiŃie de f.
67
c) Să se determine funcŃia de repartiŃie corespunzătoare.
59. Fie funcŃia RRf →: , ( ) [ ]
( ) ( )
+∞∪−∞−∈
−∈+=
,11,,0
1,1,1 2
x
xx
a
xf , unde Ra∈ .
a) Să se determine parametrul real a astfel încât funcŃia f să fie o funcŃie
densitate de probabilitate.
b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de
repartiŃie de f.
c) Să se determine funcŃia de repartiŃie corespunzătoare.
60. Fie funcŃia RRf →: , ( )[ ]
( ) ( )
+∞∪−∞−∈
−∈−=
,,,0
,,22
aax
aaxxa
a
xf , unde
Ra∈ .
a) Să se determine parametrul real a astfel încât funcŃia f să fie o funcŃie
densitate de probabilitate.
b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de
repartiŃie de f.
c) Să se determine funcŃia de repartiŃie corespunzătoare.
61. Fie funcŃia RRf →: , ( )[ ]
( ) ( )
+∞∪∞−∈
∈−−=
,20,,0
2,0,11
x
xxxf
Să se precizeze dacă f este o funcŃie densitate de probabilitate şi în caz
afirmativ, calculaŃi valoarea medie şi dispersia variabilei aleatoare
( )Rx
xf
xX
∈
.
68
62. O variabilă aleatoare continuă X are funcŃia densitate de
probabilitate RRf →: , ( ) [ ]
( ) ( )
+∞∪∞−∈
∈=
,0,,0
,0,ln
ax
axx
ac
xf , unde a este fixat şi
Rc∈ .
a) Să se calculeze valoarea parametrului real c.
b) Să se scrie funcŃia de repartiŃie a variabilei aleatoare X.
c) Să se calculeze media şi dispersia variabilei aleatoare X.
63. Se consideră funcŃia RRf →: ,
( ) [ ]
( ) ( )
+∞+∪−∞−∈
+−∈=
,11,,0
1,1,1
aax
aaxxxf , unde Ra∈ .
a) Să se determine parametrul real a astfel încât funcŃia f să fie o funcŃie
densitate de probabilitate.
b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de
repartiŃie de f.
c) Să se determine funcŃia de repartiŃie corespunzătoare.
64. Fie X o variabilă aleatoare continuă cu funcŃia densitate de
probabilitate
RRf →: , ( )
≤
>=
−
0,0
0,!x
xem
x
xfx
m
, unde *Nm∈ . CalculaŃi media şi
dispersia acestei variabile aleatoare.
69
TESTE DE AUTOEVALUARE
TEST 1
1. Se consideră funcŃia
RRf →: , ( )
[ ]
](
( ) ( )
+∞∪∞−∈
∈
∈
=
,20,,0
2,1,2
1
1,0,32
x
xax
xxa
xf , unde Ra∈ .
a) Să se determine parametrul real a astfel încât funcŃia f să fie o funcŃie
densitate de probabilitate.
b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de
repartiŃie de f.
c) Să se determine funcŃia de repartiŃie corespunzătoare.
2. Intr-un lot de 100 de piese prelucrate la un strung, 10 sunt defecte. Pentru
un control de calitate, se extrag la întâmplare 3 piese. Să se scrie tabelul de
distribuŃie al variabilei aleatoare care ia ca valori numărul de piese defecte
extrase. CalculaŃi apoi valoarea medie şi dispersia acestei variabile.
3.Se presupune că un sistem de detecŃie poate greşi asupra prezenŃei unei
Ńinte ( de exemplu un avion inamic) cu probabilitatea 0,05, iar în prezenŃa
reală a Ńintei, o detectează cu probabilitatea 0,9. Presupunând că
probabilitatea de apariŃie a unei Ńinte în zona sistemului de detecŃie este 0,25,
să se determine probabilitatea unei alarme false, imediat ce sistemul primeşte
un semnal relativ la prezenŃa Ńintei.
TEST 2
70
1. Se aruncă 2 zaruri. Se acordă 12 puncte dacă suma punctelor de pe cele
două feŃe este 2 sau 12, 4 puncte dacă suma este 7 şi un punct pentru
celelalte cazuri. Să se scrie tabelul de distribuŃie al variabilei aleatoare N
ce ia dret valori numărul de puncte acordate celui care aruncă zarul.
CalculaŃi apoi valoarea medie şi dispersia acestei variabile.
2. Un tren soseşte la ora fixată cu probabilitatea 0,9. Să se determine
probabilitatea ca într-o săptămână trenul să întârzie de două ori, ştiind că face
o singură cursa pe zi.
3. Fiecare coeficient al ecuaŃiei trigonometrice batgx = este determinat prin aruncarea unui zar şi luarea numărului de puncte ieşit. Care este
probabilitatea ca ecuaŃia dată să admită soluŃiile ,...1,0,4
=+= kka ππ
?
TEST 3
1. Un vânzător are la vânzare 100 de cutii identice din care 30 sunt cu pantofi, iar restul cu bocanci. Până la ora 12 au fost vândute 10 cutii. Să se afle probabilitatea ca 3 cutii să fi fost cu bocanci. 2. Intr-o secŃie sunt 3 strunguri care execută piese mari şi piese mici. Primul,
execută 10% piese mici, al doilea execută 15% piese mici, iar al treilea 75%
piese mari. Se ia câte o piesă la întâmplare de la fiecare strung. Care este
probabilitatea ca 2 piese să fie mici şi una mare?
P.12. Fie funcŃia RRf →: , ( )[ ]
( ) ( )
+∞∪−∞−∈
−∈−=
,,,0
,,22
aax
aaxxa
a
xf , unde
Ra∈ .
a) Să se determine parametrul real a astfel încât funcŃia f să fie o funcŃie
densitate de probabilitate.
71
b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de
repartiŃie de f.
c) Să se determine funcŃia de repartiŃie corespunzătoare.
72
MODULUL II
ELEMENTE DE STATISTICĂ MATEMATICĂ
UNITATEA DE STUDIU VI
ELEMENTE DE STATISTICĂ DESCRIPTIVĂ
VI.1. Obiectul statisticii Numeroase fenomene din viaŃa economică şi socială, din fizică,
biologie, psihologie etc. necesită în studiul lor un instrument matematic special: statistica matematica.
De exemplu, pentru a cunoaşte starea de spirit a populaŃiei unei tări înaintea alegerilor, nu pot fi chestionaŃi toŃi cetăŃenii, ci se efectuează un sondaj de opinie, adică se stabileşte un eşantion reprezentativ al populaŃiei, numeric limitat, se calculează procentul cetăŃenilor care au o anumită opinie, după care se extrapolează rezultatul la întreaga populaŃie.
Aşadar statistica utilizează raŃionamente inductive : prin inducŃie se ajunge de la parte la intreg. Din punct de vedere al preciziei, raŃionamentul inductiv este mai puŃin precis decât cel deductiv. Prin urmare, afirmaŃiile se fac cu un anumit grad de neîncredere, deci cu erori.
Statistica are ca obiect sistematizarea, analiza, prelucrarea şi interpretarea datelor referitoare la anumite fenomene în vederea studierii pe cale inductivă a fenomenelor aleatoare de masă precum şi în vederea realizării de previziuni privind producerea unor anumite fenomene. Vom studia pe rând elemente de statistica descriptiva şi statistică analitică (matematică)
Statistica descriptivă se ocupă de culegerea , gruparea şi analiza datelor rezultate din observaŃia diferitelor fenomene.
Statistica matematică elaborează o metodologie fundamentată pe teoria probabilităŃilor care să asigure o verosimilitate cât mai mare în raŃionamentele cu caracter inductiv.
73
VI.2. Limbajul statisticii Există câteva elemente şi concepte comune tuturor cercetărilor statistice, concepte care alcătuiesc limbajul de bază al statisticii.
• PopulaŃia (colectivitatea) statistică reprezintă totalitatea elementelor de aceeaşi
natură, care au trăsături esenŃiale comune şi care sunt supuse unui studiu statistic. Termenul de populaŃie nu se referă doar la un grup de persoane. Prin populatie se înŃelege o mulŃime de obiecte, păreri, evenimente, opinii etc. O populaŃie statistică include întreaga colecŃie de obiecte sau observaŃii pe care le analizăm statistic pentru a trage concluzii. In genearal, populaŃia este bine definită în timp, spaŃiu şi ca formă organizatorică şi în plus este considerată a fi finită.
• Eşantionul reprezintă un subset de elemente selectate dintr-o colectivitate
statistică. Cu cât este mai numeroasă o colectivitate, cu atât devine mai dificilă cercetarea tuturor elementelor ei, fiind consumatoare de timp şi costisitoare. In acest caz soluŃia este extragerea unei subcolectivităŃi (eşantion) din colectivitatea generală. In felul acesta se vor estima parametrii populaŃiei totale pe baza rezultatelor obŃinute în eşantion, iar ceea ce a fost determinat ca fiind tipic, esenŃial şi caracteristic în eşantion, se presupune că ar fi fost găsit şi dacă s-ar fi cercetat colectivitatea generală. Exactitatea acestei presupuneri depinde de modul în care a fost extras eşantionul, iar de acurateŃea acestui proces depinde succesul mersului statistic. Reprezentativitatea eşantionului este aşadar aspectul crucial al oricărui proces de cercetare pe bază de sondaj statistic.
• InferenŃa statistică reprezintă o decizie, o estimaŃie, o predicŃie sau o generalizare privitoare la o colectivitate generală, bazată pe informaŃiile statistice obŃinute pe un eşantion.
• Unitatea statistică reprezintă elementul constitutiv al unei colectivităŃi şi care este purtătorul fiecărei trăsaturi supuse observării şix cercetării statistice. Definirea clară a unităŃii statistice trebuie să evite orice ambiguitate, să facă posibilă identificarea ei exactă şi să fie posibilă înregistrarea datelor statistice. UnităŃile statistice pot fi simple sau complexe. UnităŃile complexe sunt rezultate ale organizării sociale sau economice (ex. familia).
• Caracteristica statistică reprezintă trasatura comuna tuturor unitătilor unei colectivităŃi şi care variază ca nivel, sau valoare de la o unitate
74
la alta a colectivităŃii. Este numită şi variabilă statistică sau variabilă aleatoare. Caracteristicile statistice se pot clasifica după mai multe criterii, astfel: După modul de exprimare:calitative( nominative) ;cantitative (numerice). După numărul variantelor de răspuns:alternative ( binare);nealternative. După natura variaŃiei caracteristicilor numerice:continue;discrete. După conŃinut:de timp;de spaŃiu;atributive.
VI.3. Serii statistice
Analiza statistică a unui fenomen, în raport cu o singură caracteristică ne conduce la o serie de perechi de valori care poartă denumirea de serie statistică. DefiniŃia VI.3.1. Fie o populaŃie statistică având o caracteristică X
care ia valorile pxxx ,..., 21 şi in cu pi ,1= numărul de unităŃi statistice
pentru care caracteristica X ia valoarea ix . MulŃimea perechilor ( )piii nx ,1, = se
numeşte serie statistică, iar numerele in se numesc frecvenŃe absolute. O serie statistică este de obicei prezentată sub forma unui tabel de tipul următor: Valoarea caracteristicii ( ix ) 1x 2x .......................
px
FrecvenŃa absolută ( in ) 1n 2n ....................... pn
Există şi serii statistice în care valorile caracteristicii urmărite sunt exprimate prin intervale. In acest caz, spunem că avem o serie statistică în care distribuŃia frecvenŃelor este pe intervale.: Valoarea caracteristicii ( [ )1, +ii xx )
[ )21 , xx [ )32 , xx ....................... [ )1, +pp xx
FrecvenŃa absolută ( in ) 1n 2n ....................... pn
75
DefiniŃia VI.3.2. Fie ( )piii nx ,1, = o serie statistică cu efectivul total al
populaŃiei ∑=
=p
i
inN1
. Numărul N
nf ii = se numeşte frecvenŃa relativă a
valorii ix .
DefiniŃia VI.3.3. Fie ( )
piii nx ,1, = o serie statistică. Numărul
∑=
=i
k
ki nN1
, reprezentând suma tuturor frecvenŃelor absolute până la in
inclusiv, se numeşte frecvenŃă absolută cumulată crescător. DefiniŃia VI.3.4. Fie ( )
piii nx ,1, = o serie statistică. Numărul
∑=
=p
ik
ki nN* , reprezentând suma tuturor frecvenŃelor absolute care apar
începând cu in inclusiv, se numeşte frecvenŃă absolută cumulată
descrescător.
VI.4. Indicatori sintetici ai seriilor statistice
Analiza frecvenŃelor unei serii statistice are neajunsul de a manipula întreaga cantitate de date, respectiv toate valorile distribuŃiei statistice. Pentru a elimina acest neajuns sun utilizaŃi aşa- numiŃii indicatori sintetici. Ei sunt descriptori umerici ce condensează într-o valoare unică o anumită caracteristică a întregii serii statitice. Principalele avantaje ale acestor indicatori sunt concentrarea semnificaŃiei şi uşurinŃa utilizării. In acelaşi timp însă, dată fiind natura lor sintetică, prezintă şi dezavantaje, în sensul că fiecare indicator pierde o anumită cantitate de informaŃie care Ńine de alte caracteristici pe care nu le surprinde. Există 3 clase mari de indicatori sintetici:
a) Indicatori ai tendinŃei centrale: sunt valori tipice pentru întreaga distribuŃie.
b) Indicatori ai împrăştierii: sunt valori ce descriu caracteristica de împrăştiere a distribuŃiei.
76
c) Indicatori ai formei distribuŃiei: se referă la forma curbei de reprezentare grafică a distribuŃiei.
a) Indicatori ai tendinŃei centrale
a1) Mărimi medii i) Media aritmetică Media aritmetică a valorilor individuale nxxx ,....,, 21 ale
caracteristicii numerice X reprezintă acea valoare care s-ar fi înregistrat dacă toŃi factorii de influenŃă ar fi acŃionat constant (cu aceeaşi intensitate) la nivelul fiecărei unităŃi înregistrate. Aceasta înseamnă că dacă media aritmetică ar substitui fiecare o valoare individuală ix ,
i = n,1 ,valoarea totalizată obiectiv formată a caracteristicii urmărite nu s-ar modifica. DefiniŃia VI.4.1. Fiind dată seria statistică ( )
piii nx ,1, = , numărul
∑
∑
=
==p
i
i
p
i
ii
n
nx
x
1
1 se numeşte valoarea medie a seriei statistice.
ObservaŃii. i)DefiniŃia dată valorii medii este adevarată numai dacă valorile individuale înregistrate sunt numerice.
ii) Valoarea medie este unică. iii) Suma diferenŃelor dintre toate valorile individuale înregistrate şi
media lor aritmetică este nulă: ( )∑=
=−p
i
i xx1
0 .
iv) Media aritmetică este legată de toate valorile numerice înregistrate. Prin urmare ea este sensibilă la prezenŃa valorilor aberante ( valori foarte mari, sau foarte mici, în comparaŃie cu majoritatea datelor înregistrate). ExistenŃa unor astfel de valori are drept efect o valoare medie nereprezentativă pentru caracteristica studiată.
v) Dacă avem o serie statisticăîn care distribuŃia se face pe intervale, pentru a calcula o valoare medie căt mai apropiată de cea reală se vor lua în calcul centrele intervalelor e forma [ )1, +ii xx .
77
Teorema VI.4.1. Dacă x este valoarea medie a unei serii statistice
( )piii nx ,1, = , atunci bxa + este valoarea medie a seriei ( )
piii nbax ,1, =+ .
ObservaŃie. Această teoremă ne permite un calcul mai rapid al valorii medii atunci când dispunem de un număr mare de valori ale caracteristicii studiate, valori exprimate prin numere mari. Practic, în loc să calculăm media
y a unei serii ( )piii ny ,1, = , calculăm media x a seriei ( )
piii nx ,1, = cu
a
byx ii
−= , iar apoi avem că bxay += .
ii)Media armonică Media armonică se defineşte ca valoarea inversă a mediei aritmetice a inverselor valorilor individuale înregistrate. Aplicarea mediei armonice pentru exprimarea numerică a tendinŃei centrale are sens numai dacă este obiectivă însumarea inverselor valorilor individuale. DefiniŃia VI.4.2. Fiind dată seria statistică ( )
piii nx ,1, = , numărul
∑
∑
=
==p
i i
i
p
i
i
h
x
n
n
x
1
1 se numeşte medie armonică a seriei statistice.
ObservaŃii. i)Media armonică este mai mică decât media aritmeticăa pentru aceleaşi valori pozitive. ii) In cazul în care între două variabile există o relaŃie de inversă
proporŃionalitate, (x
y1
= ) aceasta se pastrează şi între mediile calculate
pentru fiecare variabilă. iii) Media armonică se foloseşte pentru calculul valorii medii a unei serii statistice în care valorile caracteristicii urmărite sunt, la rândul lor, valori medii. iii)Media pătratică (sau momentul iniŃial de ordinul doi)
Media pătratică ( px ) exprimă tendinŃa centrală a valorilor numerice înregistrate pentru variabila observată dacă are sens obiectiv însumarea pătratelor valorice individuale. Ea reprezintă acea valoare a caracteristicii care, dacă ar înlocui fiecare valoare individuală din serie, suma pătratelor termenilor seriei nu s-ar modifica.
78
DefiniŃia VI.4.3. Fiind dată seria statistică ( )piii nx ,1, = , numărul
∑
∑
=
==p
i
i
p
i
ii
p
n
nx
x
1
1
2
se numeşte medie pătratică a seriei statistice.
ObservaŃii. i)Cu toate că media pătratică se poate calcula atât pentru valori individuale pozitive, nule sau negative, ea nu are sens din punct de vedere economic decât dacă se calculează pentru valori pozitive. ii)Valoarea mediei pătratice este mai mare decât cea a mediei aritmetice atunci când ele se calculează cu aceleaşi date. iii) Media pătratică se utilizează frecvent la calculul abaterii medii pătratice, adică a abaterii valorilor caracteristicii faŃă de valoarea lor medie. . iv) Media geometrică Spre deosebire de tipurile de medii prezentate anterior, care au la bază o relaŃie de aditivitate între termenii unei serii statistice, media geometrică se calculează pe baza unei relaŃii obiective multiplicative între termenii aceleiaşi
serii. Prin urmare, media geometrică ( gx ) reprezintă acea valoare a
caracteristicii observate care, dacă ar înlocui fiecare valoare individuală din serie, produsul acestora nu s-ar modifica.
DefiniŃia VI.4.4. Fiind dată seria statistică ( )piii nx ,1, = , numărul
gx =pp
i
ix
1
1
∏=
se numeşte medie geometrică a seriei statistice. ObservaŃii. i) Media geometrică uneori se mai numeşte şi medie logaritmică deoarece se poate determina prin logaritmii valorilor individuale, după cum urmează:
( )n
x
x
n
i
i
g
∑== 1
lnln , de unde
= ∑
=
n
i
ig xn
x1
ln1
exp
ii) Dacă cel puŃin o valoare individuală este nulă sau negativă, calculul mediei geometrice este lipsit de sens. iii) Media geometrică se utilizează frecvent pentru calculul indicelui mediu al dinamicii, pentru caracterizarea tendinŃei centrale din seria indicilor de dinamica cu baza mobilă.
79
. a2)Indicatori de poziŃie Caracterizarea tendinŃei centrale în seriile statistice presupune luarea în considerare nu numai a valorilor individuale ale caracteristicii urmărite, dar şi a formei în care se repartizează unităŃile colectivităŃii după caracteristica respectivă. De multe ori, informaŃii mult mai utile fundamentării deciziilor, decât cele oferite de indicatorii medii, le furnizează indicatorii de poziŃie. Aceasta înseamnă că pentru caracterizarea tendinŃei centrale în seriile statistice rolul de valoare tipică poate fi jucat nu numai de medie ci şi de indicatorii de poziŃie: modul , mediana si cuantilele.
i)Valoarea modală (valoarea dominantă sau modul) DefiniŃia VI.4.5. Fiind dată seria statistică ( )
piii nx ,1, = , modul
reprezintă acea valoare kx a caracteristicii , pentru care frecvenŃa kn este
maximă. ObservaŃie. Pot exista mai multe valori modale.
Calcul. Pentru o serie avănd distribuŃia frecvenŃelor pe intervale, valoarea modală se calculează astfel:
• Se idetifică intervalul modal, ca fiind acel interval pentru care frecvenŃa este maximă.
• Se calculează modul după formula:
21
1000 ∆+∆
∆+= jMjM hxM ,
unde: 0jMx - limita inferioară a intervalului modal “j”;
0jMh - marimea intervalului modal;
1∆ - diferenŃa dintre frecvenŃa intervalului modal şi frecvenŃa intervalului predecesor; 2∆ - diferenŃa dintre frecvenŃa intervalului modal şi cea a intervalului succesor. ii) Mediana DefiniŃia VI.4.6. Fiind dată seria statistică ( )
piii nx ,1, = , mediana
reprezintă acea valoare a caracteristicii localizată în mijlocul unei serii statistice în care valorile au fost ordonate.
80
Cu alte cuvinte, mediana împarte populaŃia statistică ordonată în două părŃi: jumătate cu valori superioare medianei şi jumătate cu valori inferioare medianei. Calcul. Pentru o serie statistică ( )
piii nx ,1, = , mediana se calculează astfel:
• Se cumulează crescător frecvenŃele; • Mediana este acea valoare a caracteristicii care corespunde primei
frecvenŃe
cumulate crescător mai mare decât 2
11∑=
+p
i
in
.
Pentru o serie în care distribuŃia frecvenŃelor se face pe intervale, mediana se calculează astfel:
• Se cumulează crescător frecvenŃele; Se determină intervalul median ca fiind primul interval a cărui frecvenŃă
cumulată este mai mare decât 2
11∑=
+p
i
in
.
• Se determină mediana după formula:
Me
Me
p
i
i
n
F
n
hxMe1
1
02
1
−= −
+
+=
∑
,
unde:
0x - limita inferioară a intervalului median;
0h - marimea intervalului median;
Men - frecvenŃa intervalului median;
1−MeF - frecvenŃa cumulată crescător a intervalului predecesor celui median.
iii) Cuantilele Cuantilele sunt indicatori care descriu anumite poziŃii localizate în mod particular în cadrul seriilor statistice.. Conceptul de “cuantilă” indică o divizare a distribuŃiei observaŃiilor într-un număr oarecare de părŃi.
DefiniŃia VI.4.7. Cuantilele de ordin “r” sunt valori ale caracteristicii urmărite care împart distribuŃia ordonată a observaŃiilor în “r” părŃi egale. Fiecare parte are acelaşi efectiv, adică l/r din numărul total al unităŃilor statistice. Frecvent se utilizează următoarele cuantile:
81
*mediana sau cuantila de ordinul 2 (r=2); *cuartilele sau cuantilele de ordinul 4 (r=4); *decilele sau cuantilele de ordinul 10 (r=10); *centilele sau cuantilele de ordinul 100 (r=100)
Cuantilele de ordin superior (r > 4) se calculeaza in cazul distributiilor cu numar mare de grupe sau clase de valori individuale.
b)Indicatori ai împrăştierii ( de variaŃie) Un exemplu simplu sugerează insuficienŃa indicatorilor tendinŃei centrale în caracterizarea uni serii statistice: să presupunem că doi elevi au obŃinut la un anumit obiect următoarele note:
7786:
96103:
Y
X
Se observă că media aritmetică a celor doi elevi este aceeaşi: 7. Această notă insă, caracterizează mult mai bine notele elevului Y, decât pe cele ale lui X, care sunt foarte dispersate. In cele ce urmează vom descrie indicatorii de variaŃie care stabilesc în ce măsură o medie va caracteriza valorile unei serii statistice, dacă acestea sunt mai apropiate sau mai îndepărtate de medie. Se disting două tipuri de indicatori de variaŃie: b1) indicatori simpli ai variaŃiei (calculaŃi la nivelul unei unităŃi statistice); b2) indicatori sintetici ai variaŃiei (calculaŃi la nivelul întregii populaŃii statistice). b1)Indicatorii simpli ai variaŃiei
Această clasă de indicatori compară sub formă de diferenŃă mărimea a doi termeni ai seriei sau mărimea unui termen al seriei cu nivelul mediu al acesteia. Se exprimă în unitatea de măsură a caracteristicii pentru care s-au calculat. i)Amplitudinea absolută a variaŃiei:
82
DefiniŃia VI.4.8. Intro serie statistică ( )piii nx ,1, = amplitudinea
absolută a variaŃiei este diferenŃa dintre cea mai mare şi cea mai vică valoare a caracteristicii studiate
minmax xxA −=
ObservaŃii:
i)Dacă cele două valori extreme sunt valori aberante, amplitudinea nu mai prezintă o semnificaŃie deosebită (este sensibilă la valorile extreme). ii)Nu poate fi folosită în comparaŃii, decât pentru serii care se referă la aceeaşi caracteristică (care se exprimă în aceeaşi unitate de măsură). iii)Este destul de instabilă, pe măsura adăugării de noi date. iv)Dacă într-o distribuŃie de frecvenŃe pe intervale de valori nu se cunosc limitele inferioară şi superioară, atunci amplitudinea nu poate fi calculată, decât făcând anumite presupuneri pe baza mărimii intervalelor de grupare. v) Amplitudinea se utilizează frecvent în prelucrarea statistică la alegerea numărului de intervale de grupare a datelor şi la stabilirea mărimii intervalelor. ii) Abaterile individuale DefiniŃia VI.4.9. Intro serie statistică ( )
piii nx ,1, = abaterile
individuale exprimă cu câte unităŃi de măsură se abate o numită valoare a caracteristicii studiate de la valoarea medie. Abaterea individuală absolută :
xxd ii −= , pi ,1= .
Abaterea maximă pozitivă (în expresie absolută):
xxd −=+maxmax .
Abaterea maximă negativă (în expresie absolută):
xxd −=−minmax .
b2) Indicatorii sintetici Indicatorii sintetici ai împrăştierii, spre deosebire de indicatorii simpli, sintetizează într-o singură expresie numerică variaŃia valorilor caracteristicilor unei serii statistice corespunzătoare unei populaŃii statistice. La baza determinării indicatorilor sintetici stau abaterile individuale, dar pentru a se evita compensarea acestora, ele vor fi utilizate în valoare absolută, sau se va opera cu pătratele acestora. i)Abaterea medie liniară
83
DefiniŃia VI.4.10. Abaterea medie liniară reprezintă media
aritmetică simplă sau ponderată a abaterilor tuturor valorilor individuale luate în valoarea absolută, ale termenilor seriei faŃă de media lor.
Arată cu câte unităŃi de măsură concrete s-a modificat în medie un termen al seriei faŃă de nivelul mediu al acesteia. Pentru serie statistică ( )
piii nx ,1, = avem că abaterea medie liniară este
dată de
∑
∑
=
=
−=
p
i
i
p
i
ii
n
xxn
d
1
1 .
In cazul în care avem o serie cu distribuŃia frecvenŃelor pe intervale, pentru calculul abaterii medii liniare se vor lua în considerare centrele intervalelor de forma [ )1, +ii xx .
ii) Dispersia (sau varianŃa)
DefiniŃia VI.4.11. Dispersia este media aritmetică simplă sau ponderată a pătratelor abaterilor individuale absolute, ale termenilor seriei faŃă de media lor.
Pentru serie statistică ( )piii nx ,1, = avem că dispersia este dată de
( )
∑
∑
=
=
−=
p
i
i
p
i
ii
n
xxn
D
1
1
2
.
ObservaŃii: i)Dispersia nu are unitate de măsură; ii)Cu cât este mai apropiată de 0 cu atât variaŃia este mai mică; cu cât este mai depărtată de 0, cu atât variaŃia este mia mare. iii) Cu cât valorile caracteristicii urmărite sunt mai omogene ( mai apropiate între ele), cu atât mărimea dispersiei este mai mică .
ProprietăŃi . 1. Pentru un şir de valori constante, dispersia este întotdeauna nulă.Altfel spus, dacă toate valorile individuale sunt egale între ele (ceea ce ar însemna omogenitate perfectă) dispersia este nulă. 2. Dacă într-o serie statistică fiecare termen se măreşte sau se micşorează cu o aceeaşi constantă „a”, atunci dispersia seriei nu se modifică.
84
3. Dacă într-o serie statistică, fiecare termen se măreşte sau se micşorează de un acelaşi număr de ori (h), atunci dispersia seriei se va modifica şi ea în acelaşi sens de „h2” ori, faŃă de dispersia seriei iniŃiale. ObservaŃie. Aceste proprietăŃi sugerează posibilitatea de a calcula dispersia printr-o expresie care simplifică operaŃiile de calcul fără să afecteze rezultatul. RelaŃia de calcul simplificat a dispersiei:
( )22
1
1
2
cxh
n
nh
cx
Dn
i
i
p
i
ii
−−
−
=
∑
∑
=
= ,
unde, de regulă, c şi h sunt valori convenabil stabilite. De exemplu, în cazul distribuŃiei pe intervale egale de grupare se consideră c= centrul intervalului cu cea mai mare frecvenŃă şi h=mărimea intervalului de grupare.
. iii) Abaterea medie pătratică (sau abatere standard, sau deviaŃie standard)
DefiniŃia VI.4.12. Abaterea medie pătratică este media pătratică simplă sau ponderată a abaterilor individuale absolute faŃă de medie:
Pentru serie statistică ( )piii nx ,1, = avem că abaterea medie pătratică
este dată de
( )
∑
∑
=
=
−==
p
i
i
p
i
ii
n
xxn
D
1
1
2
σ .
ObservaŃie. In analizele statistice se preferă abaterea medie pătratică în locul dispersiei deoarece este un parametru al legii de repartiŃie normale şi majoritatea metodelor de prelucrare statistică au la bază ipoteza normalităŃii repartiŃiilor. iv)Coeficientul de variaŃie (Coeficient de omogenitate)
85
DefiniŃia VI.4.13. Coeficientul de variaŃie este indicatorul sintetic al variaŃiei care măsoară în mod relativ şi sintetic gradul de împrăştiere a
valorilor faŃă de tendinŃa centrală a seriei: 100⋅=x
vσ
.
ObservaŃie. Coeficientul de omogenitate nu depinde de unitatea de
măsură a caracteristicii urmărite, de aceea poate fi folosit pentru a compara omogenitatea sau, dimpotrivă, eterogenitatea a două sau mai multe serii, care se referă la variabile diferite.
ProprietăŃi: -dacă valoarea coeficientului de variaŃie este mai mică sau cel mult egală cu 30 - 35%, atunci seria este omogenă şi media este reprezentativă pentru valorile din care s-a calculat. -dacă, dimpotrivă, valoarea coeficientului de variaŃie este de peste 65-70%, seria este eterogenă, media calculată îşi pierde semnificaŃia şi nu mai este reprezentativă.
c) Indicatori ai formei distribuŃiei Această categorie e indicatori ne permite să analizăm seriile statistice în funcŃie de curba de reprezentare a frecvenŃelor. Concret se va analiza simetria/asimetria şi aplatizarea/boltirea curbei frecvenŃelor. c1) Simetria/ Asimetria distribuŃiilor statistice Asimetria este dată de diferenŃa dintre valoarea medie şi cea modală:
• Dacă Mox = , spunem că avem o distribuŃie simetrică. In acest caz, observaŃiile înregistrate sunt egal dispersate de o parte şi de alta a valorii lor medii..
• Dacă Mox > , spunem că avem asimetrie pozitivă („ coadă la dreapta”).
• Dacă Mox < , spunem că avem asimetrie negativă („coadă la stânga”).
Pentru a aprecia calitativ asimetria se utilizează frecvent anumiŃi coeficienŃi adimensionali. i) Coeficientul de asimetrie Pearson:
σMox
Cas
−=
86
Pentru repartiŃii moderat asimetrice, există relaŃia: ( )MexMox −≈− 3 şi drept urmare
σMex
Cas
−≈ 3
Interpretare: Coeficientul de asimetrie Pearson ia valori în intervalul [ ]1,1 +− .
Dacă MoMexCas ==⇒= 0 , seria este perfect simetrică.
Dacă MoMexCas >>⇒> 0 , seria este pozitiv asimetrică, în ea predominând valorile mici;
Dacă MoMexCas <<⇒<0 , seria este negativ asimetrică, în ea predominând valorile mari;
Dacă Cas ia valori apropiate de ±1, distribuŃia are asimetrie pronunŃată (pozitivă sau negativă); Dacă Cas ia valori apropiate de 0, distribuŃia are asimetrie uşoară (pozitivă sau negativă). ii) Coeficientul de asimetrie Fisher:
33
σµ
=FC ,
unde
( )
∑
∑
=
=
−=
p
i
i
p
i
ii
n
xxn
1
1
3
3µ este momentul centrat de ordin 3.
Interpretare: Dacă 0=FC , seria este perfect simetrică..
Dacă 0>FC , seria este pozitiv asimetrică.
Dacă 0<FC , seria este negativ asimetrică. c2) Aplatizarea / Boltirea distribuŃiilor statistice Graficele seriilor statistice pot fi comparate cu clopotul lui Gauss corespunzător repartiŃiei normale. In comparaŃie cu acesta, graficele pot fi mai mult sau mai puŃin boltite/ aplatizate. Există indicatori care dau o măsură a gradului de aplatizare/ boltire. i) Coeficientul de aplatizare :
87
44
σµ
=AC ,
unde
( )
∑
∑
=
=
−=
p
i
i
p
i
ii
n
xxn
1
1
4
4µ este momentul centrat de ordin 4.
Interpretare: Dacă 3=AC seria are o distribuŃie echivalentă cu cea normală.
Dacă 3>AC seria are o reprezentare grafică cu vârf mai ascuŃit şi cozi mai lungi decât în cazul repartiŃiei normale. Dacă 3<AC seria are o reprezentare grafică cu vârf mai turtit şi cozi mai scurte decât în cazul repartiŃiei normale. ii) Coeficientul de exces:
3−= ACEx
Interpretare: Dacă 0=Ex seria are o distribuŃie echivalentă cu cea normală. Dacă 0>Ex seria are o reprezentare grafică cu vârf mai ascuŃit şi cozi mai lungi decât în cazul repartiŃiei normale. Dacă 0<Ex seria are o reprezentare grafică cu vârf mai turtit şi cozi mai scurte decât în cazul repartiŃiei normale.
88
UNITATEA DE STUDIU VII
ELEMENTE DE TEORIA SELECłIEI
VII.1. NoŃiunea de selecŃie. Momente de selecŃie
Presupunem că avem o colectivitate Γ , discretă sau continuă, de volum N pentru care este nepractică sau imposibilă cunoaşterea individuală a tuturor elementelor ce o constituie. FaŃă de această colectivitate se cercetează o proprietate sau un fenomen care generează o variabilă aleatoare X. Pentru aceasta se va considera o subcolectivitate γ ( numită şi eşantion, selecŃie sau sondaj ) cu volumul n . Avem deci Γ⊂γ şi Nn < . Vom cerceta proprietatea sau fenomenul care defineşte variabila X în Γ prin intermediul valorilor ce le ia X în γ . Considerăm nXXX ,...,, 21 variabile aleatoare ce reprezintă valorile
variabilei X observate la elementele din γ . Dacă sondajul este efectuat la
întâmplare, variabilele njX j ,1, = au aceeaşi şansă de a se realiza. De aceea,
ele determină următoarea variabilă aleatoare discretă cu distribuŃie uniformă:
nnn
XXX
Xn
1...
11...21
* ,
pe care o numim variabilă de selecŃie. X se numeşte variabilă teoretică. DefiniŃia VII.1.1. Numim medie de selecŃie expresia
( ) ∑=
==n
i
iXn
XMm1
** 1.
DefiniŃia VII.1.2. Numim moment de selecŃie de ordin k expresia
( )( ) ( )∑=
==n
i
k
i
k
k Xn
XMM1
** 1.
DefiniŃia VII.1.3. Numim moment centrat de selecŃie de ordin k expresia
( )∑=
−=n
i
k
ik mXn 1
** 1µ .
DefiniŃia VII.1.4. Numim dispersie de selecŃie expresia
( )∑=
−==n
i
i mXn
D1
2**2
* 1µ .
89
Spunem că o selecŃie este corect efectuată atunci când caracteristicile variabilei teoretice X sunt egale cu cele ale variabilei de selecŃie *X . Ideal ar fi cazul în care ( ) ( )*XMXM = , ( ) ( )*XMXM kk = , ( ) ( )*XDXD = .
Intrucât variabila teoretică X este necunoscută, nici caracteristicile sale numerice nu sunt cunoscute. De aceea, în practică se procedează oarecum invers:
- se alege subcolectivitatea γ şi se obŃine variabila de selecŃie *X ;
- se deterimnă caracteristicile variabilei de selecŃie *X ; - se cercetează în ce condiŃii valorile obŃinute pentru *X aproximează
suficient de bine caracteristicile corespuzătoare ale variabilei teoretice X;
Această aproximare are loc în sens probabilistic şi se numeşte estimare. Estimările pot fi corecte sau absolut corecte. DefiniŃia VII.1.5. Spunem că variabila de selecŃie *X estimează corect variabila teoretică X dacă: i ) ( ) ( )XMXM Nn → →* ;
ii) ( ) 0* → →NnXD .
DefiniŃia VII.1.6. Spunem că variabila de selecŃie *X estimează absolut corect variabila teoretică X dacă: i ) ( ) ( )XMXM =* ;
ii) ( ) 0* → →NnXD .
DefiniŃia VII.1.7. DiferenŃa ( ) ( )XMXM −* se numeşte distorsiunea estimaŃiei. ObservaŃii. Dacă estimaŃia este absolut corectă, atunci distorsiunea este 0. Dacă distorsiunea are ca limită o constantă a, adică
( ) ( ) aXMXM Nn →− →* , atunci a se numeşte eroare sistematică. Este evident că dacă eroarea sistematică a este cunoscută, atunci estimarea lui X este dată de aX −* .
VII.2.Estimarea mediei teoretice. Media de selecŃie.
Teorema VII.2.1. Media de selecŃie estimează absolut corect media teoretică. DemonstraŃie. Vom arăta că sunt verificate cele două condiŃii din definiŃia estimaŃiei absolut corecte. Pentru aceasta vom calcula ( )*mM şi
( )*mD . Avem că
90
( ) ( ) mnmn
mn
XMn
XMnn
X
MmMn
i
n
i
i
n
i
i
n
i
i
===
=
=
= ∑∑∑∑
===
= 1111
111
1*
şi
( ) ( ) ( )[ ]2**2
* mMmMmD −= Calculăm mai înâi
( ) ( )( ) ( )
( )
+=
+=
==
∑ ∑
∑ ∑∑
= =≠
= =≠
=
n
i
j
n
njiji
ii
n
i
j
n
njiji
ii
n
i
i
XXMXMn
XXXMnn
X
MmMmM
1 1,,
2
2
1 1,,
2
2
2
12**2
21
21
Variabilele aleatoare iX sunt independente, deoarece eşantioanele se iau la
întâmplare, iar compoziŃia unuia nu depinde de cea a altuia. Prin urmare avem că
( ) ( )jn
njiji
ij
n
njiji
i XMXMXXM ∑∑=≠=≠
=
1,,1,,
.
ObŃinem
( ) ( ) ( ) ( )
( ) ( ) ( )( ) ( ) ( )( )22
2
21
2
1,,2
1
2
2*
2
1
2
121
21
XMn
n
n
XMXM
nn
nn
XM
n
XMXMn
XMn
mM
n
i
i
j
n
njiji
i
n
i
i
−+=
−⋅+
=
+
=
∑
∑∑
=
=≠=.
Inlocuind în expresia dispersiei găsim
( ) ( ) ( )XDn
mmn
n
n
XMmD
11 222
* =−−
+= .
Rezultă că ( ) 0lim * =
∞→mD
n
Şi astfel teorema este demonstrată. Teorema VII.2.2. DistribuŃia mediei de selecŃie *m pentru n suficient
de mare este aproximată de distribuŃia normală cu parametri m şi n
σ.
91
Practic, cele două teoreme permit aplicarea rezultatelor de la distribuŃia normală în cazul estimării mediei prin media de selecŃie.In cazul distribuŃiilor aproape simetrice, această aproximare este satisfăcătoare şi pentru 10>n , iar la cele nesimetrice pentru 30>n .
VII.3.Estimarea dispersiei teoretice. Dispersia de selecŃie.
Teorema VII.3.1. Dispersia de selecŃie estimează corect dispersia teoretică. DemonstraŃie. Vom arăta că sunt verificate cele două condiŃii din definiŃia estimaŃiei corecte. In acest scop, vom calcula ( )*DM şi ( )*DD .
Pentru a calcula ( )*DM considerăm egalitatea
( ) ( )mmmXmX ii −+−=− ** ,
care, prin ridicare la pătrat devine
( ) ( ) ( ) ( )( )mmmXmmmXmX iii −−+−+−=− **2*2*2 2 .
Sumând, găsim
( ) ( ) ( ) ( )( )∑∑∑∑====
−−+−+−=−n
i
i
n
i
n
i
i
n
i
i mmmXmmmXmX1
**
1
2*
1
2*
1
2 2
sau, echivalent
( ) ( ) ( )2*
1
2*
1
2mmnmXmX
n
i
i
n
i
i −+−=− ∑∑==
.
De aici rezultă
( ) ( )( )2*1
2*
1
2
mmn
mX
n
mXn
i
i
n
i
i
−+−
=− ∑∑
== ,
adică
( )( )2*1
2
* mmn
mX
D
n
i
i
−−−
=∑= .
ObŃinem
( )( )
( )( )2*1
2
* mmMn
mX
MDM
n
i
i
−−
−
=∑= ,
adică ( ) ( )** mDDDM −= .
92
Am găsit astfel că media dispersiei de selecŃie este mai mică dcât dispersia teoretică cu dispersia mediei de selecŃie. In plus avem
( )n
DmD =* ,
de unde rezultă
( ) Dn
n
n
DDDM
1* −=−= .
Prin urmare,
( ) 01* →−=− ∞→nDn
DDM .
Am obŃinut că estimarea dispersiei teoretice D prin dispersia de selecŃie *D
se face întotdeauna cu o distorsiune de valoare n
D− . Prin urmare nu avem o
estimare absolut corectă pentru dispersie. Pentru a găsi totuşi o estimare absolut corectă cu ajutorul datelor de
selecŃie, considerăm dispersia corectată ~
D : *
~
1D
n
nD
−= ,
sau, echivalent,
( ) ( )11
1
2*
1
2*~
−
−=
−
−=
∑∑ =
= n
mX
n
mX
n
nD
n
i
in
i
i .
Rezultă că
( )*~
1DM
n
nDM
−=
şi cum
( ) Dn
nDM
1* −= ,
obŃinem
DDM =
~
.
Calculând dispersia lui ~
D găsim că
( )24
~
1
3D
nn
n
n
MDD
−−
−=
şi de aici
0~
=
DD .
93
In concluzie, dispersia corectată ~
D estimează absolut corect dispersia teoretică D. Practic, dispersia teoretică D se estimează absolut corect printr-o sumă de tipul dispersiei de selecŃie în care însă se înlocuieşte numitorul n cu
1−n .Evident, pentru n suficient de mare, cele două estimări ale dispersiei
teoretice *D şi ~
D vor diferi neesenŃial, ambele mărimi tinzând în probbilitate la D. Valoarea dispersiei de selecŃie *D conŃine o imprecizie (bias) care conduce la subestimarea împrăştierii la nivelul întregii populaŃii. Astfel, chiar dacă luăm în considerare un număr mare de eşantioane extrase succesiv dintr-o populaŃie, indicatorii împrăştierii vor fi mai mici decât împrăştierea reală la nvelul întregii populaŃii. CorecŃia se face prin utilizarea la numitor a expresiei
1−n . In acest mod, cu cât eşantionul este mai mic, cu atât indicatorul respectiv al împrăştierii va fi influenŃat mai mult de expresia de la numitor.
VII.4. Metode de efectuare a unui sondaj
Am văzut că cercetarea unei variabile X se face prin intermediul unui eşantion γ constituit din unităŃi de sondaj a căror alegere se efecuează după anumite metode pe care le vom prezenta în continuare.
a) SelecŃia repetată ( Sondaj cu întoarcere) (non-exhaustiv)
In acest tip de selecŃie fiecare unitate de sondaj extrasă pentru a fi cercetată este lăsată în colectivitatea Γ după cercetare. Efectuarea sondajului cu întoarcere pentru n unităŃi de sondaj are ca schemă probabilistică schema bilei revenite a lui Bernoulli. Dacă numărul unităŃilor de sondaj este N, atunci
se pot realiza un număr de !n
N n
selecŃii repetate astfel ca oricare două
eşantioane să difere cel puŃin prin natura unei unităŃi de sondaj. Sondajele cu întoarcere sunt echiprobabile, iar variabilele de selecŃie obŃinute sunt independente.
94
Calculul erorilor pentru selecŃia repetată DefiniŃia VII.4.1. Se numeşte eroare de selecŃie abaterea care există
între valorile calculate prin prelucrarea datelor din eşantion şi ceea ce s-ar fi obŃinut dacă s-ar fi organizat o observare a întregii populaŃii şi s-ar fi prelucrat toate datele obŃinute.
DefiniŃia VII.4.2. Eroarea standard a mediei este
nEm
σ= ,
unde σ este abaterea medie pătratică a eşantionului, iar n este volumul eşantionului.
ObservaŃie. Deoarece am extras un eşantion de volum n dintr-o
populaŃie de volum N, nu putem fi siguri 100% în privinŃa valorii adevărate a mediei întregii populaŃii. Cu toate acestea, dacă eşantionul este de volum destul de mare ( 30>n ) putem construi un interval de încredere cu o probabilitate ( )%1100 α− de garantare a rezultatelor.
Pentru ca probabilitatea cu care garantăm rezultatele să fie
( )%1100 α− , eroarea maximă (limită )este
nzmm
X
σα 2/
** =−=∆ .
Intervalul de încredere pentru medie desemnează zona probabilă în interiorul căreia se va plasa media populaŃiei totale:
**
mmm ∆<−
***
mmmm ∆<−<∆−
****
mmmmm ∆+<<∆−
nzmm
nzm
σσαα 2/
*2/
* +<<− ,
unde 2/αz este argumentul funcŃiei Gauss-Laplace şi are valorile tabelate.
Intervalul
+−
nzm
nzm
σσαα 2/
*2/
* , va conŃine adevărata
valoare a mediei teoretice m, în ( )%1100 α− din cazuri. Volumul eşantionului La organizarea unei cercetări prin sondaj, una din problemele foarte
importante este asigurarea reprezentativităŃii eşantionului.Teoria şi practica
95
au demonstrat că în acest scop trebuie respectate cu stricteŃe următoarele condiŃii:
- includerea în eşantion a unităŃilor statistice în mod obiectiv, fără a acorda prioritate unora în defavoarea altora;
- includerea fiecărei unităŃi statistice în eşantion trebuie să se facă independent de alte unităŃi;
- eşantionul trebuie să fie suficient de mare astfel încât să permită redarea trăsăturilor esenŃiale ale populaŃiei studiate, dar, în acelaşi timp, trebuie să fie cât mai mic astfel încât să satisfacă şi criterii de economicitate.
Pentru a determina volumul eşantionului trebuie să ne concentrăm atenŃia asupra a 3 factori esenŃiali:
- nivelul de încredere dorit; - eroarea limită permisă ; - omogenitatea datelor.
Pentru a estima parametrul colectivităŃii generale cu o eroare maximă *m∆ cu
un nivel de încredere α−1 ( adică pentru a avea o probabilitate de garantare a rezultatelor de ( )%1100 α− ) volumul n al eşantionului se determină din
relaŃia n
zX
σα 2/* =∆ şi se obŃine
2
22/
2
∆= ασ z
n .
Valoarea n astfel obŃinută va trebui rotunjită la un număr întreg, prin adaus, pentru a fi siguri că mărimea eşantionului este suficientă în scopul obŃinerii preciziei dorite.
b) SelecŃia nerepetată ( Sondaj fără întoarcere) (exhaustiv)
In acest tip de selecŃie fiecare unitate de sondaj extrasă pentru a fi cercetată este îndepărtată din colectivitatea Γ după cercetare.Efectuarea sondajului fără întoarcere are drept schemă probabilistică schema bilei nerevenite. Dacă notăm cu N numărul de unităŃi statistice din colectivitatea cercetată, atunci numărul eşantioanelor distincte de volum n ce se pot constitui este n
NC . Acestea sunt echiprobabile, iar variabilele de selecŃie
corespunzătoare sunt independente.
DefiniŃia VII.4.3. Eroarea standard a mediei este
1−−
=N
nN
nEm
σ,
96
unde σ este abaterea medie pătratică a eşantionului, iar n este volumul eşantionului.
Dacă volumul N al populaŃiei este foarte mare, iar volumul n al
eşantionului este redus, atunci 11→
−−
N
nN. Astfel, se obŃine o eroare ce
coincide cu cea din selecŃia repetată. Dacă nN = , atunci 0=mE , deci eroarea dispare. Acest lucru este de
altfel evident întrucât cercetarea parŃială s-a transformat într-o cercetare a întregii populaŃii, ceea ce nu mai generează erori care sunt specifice numai lucrului cu eşantioane.
In general, eroarea în cazul selecŃiei nerepetate este mai mică decât în cazul selecŃiei repetate, deoarece, în acel caz, reîntoarcerea repetată a aceloraşi unităŃi în eşantion înrăutăŃeşte reprezentativitatea.
Pentru ca probabilitatea cu care garantăm rezultatele să fie
( )%1100 α− , eroarea maximă (limită )este
N
n
nz
X−=∆ 12/*
σα ,
iar volumul eşantionului este
N
z
zn
m
222/2
222/
*
σσ
α
α
+∆
= .
UNITATEA DE STUDIU VIII
ELEMENTE DE TEORIA ESTIMAłIEI
VIII.1. NoŃiuni generale
In unele aplicaŃii ale statisticii matematice repartiŃia fenomenului
studiat este dată de o funcŃie cunoscută în care intră anumiŃi parametri cu
valori necunoscute. Pentru aplicaŃii practice nu ne putem mulŃumi cu atât, ci
trebuie să cunoaştem repartiŃia exactă, cu alte cuvinte trebuie să determinăm
valorile numerice ale parametrilor. Determinarea acestora se face folosind
97
rezultatele a n experienŃe care ne conduc la valorile nxxx ,...,, 21 pentru o
caracteristică X studiată .
OpraŃia prin care determinăm valorile parametrilor se numeşte
estimarea parametrilor. Există mai multe metode prin care se poate realiza
această estimare. Inainte însă de a le descrie vom introduce unele noŃiuni
legate de teoria estimaŃiei.
Se consideră caracteristica X care urmează legea de probabilitate dată prin funcŃia densitate de probabilitate ( )λ,xf , unde λ este un parametru
necunoscutce urmează a fi estimat folosind datele de selecŃie n21 x,...,x,x şi bazându-ne pe rezultatele teoretice relative la variabilele de selecŃie
n21 X,...,X,X . DefiniŃia VIII.1.1. Se numeşte funcŃie de estimaŃie (punctuală) sau
estimator al parametrului necunoscut λ funcŃia de selecŃie (statistica) )X,...,X,X( n21
∗∗ λ=λ cu ajutorul căreia se trag concluzii relative la λ .
DefiniŃiaVIII.1.2. Spunem că funcŃia de estimaŃie este estimator
consistent dacă 0,1)(Plimn
>ε∀=ε<λ−λ∗∞→
,
adică λ→λ∗ P
n21 )X,...,X,X( ,
iar valoarea numerică )x,...,x,x( n21∗λ se numeşte estimaŃie consistentă
pentru λ .
DefiniŃia VIII.1.3. Spunem că funcŃia de estimaŃie este estimator absolut corect pentru λ dacă λ=λ∗ )(M şi 0)(D 2 →λ∗ când n ∞→ , iar
valoarea numerică )x,...,x,x( n21∗λ se numeşte estimaŃie absolut corectă
pentru λ .
DefiniŃiaVIII.1.4. Spunem că funcŃia de estimaŃie este estimator corect pentru λ dacă λ=λ∗
∞→)(Mlim
n şi 0)(Dlim 2
n=λ∗
∞→, iar valoarea
numerică )x,...,x,x( n21∗λ se numeşte estimaŃie corectă pentru λ .
DefiniŃia VIII.1.5. Se numeşte distorsiunea (deplasarea)
estimatorului ∗λ diferenŃa M( λ−λ∗ ) , iar dacă distorsiunea este nulă,
estimatorul ∗λ se numeşte nedeplasat.
98
PropoziŃia VIII.1.1. Dacă )X,...,X,X( n21∗∗ λ=λ este un estimator
absolut corect pentru λ , atunci estimatorul este consistent. DemonstraŃie. Din ipoteză avem că λλ =)( *M şi folosind
inegalitatea lui Cebîşev pentru λ* obŃinem ( )2
*2* )(
1ελ
ελλD
P −≥<− ,
pentru orice ε > 0. Deoarece 0)(lim *2 =
∞→λD
n din inegalitatea lui Cebîşev se obŃine
( ) 1lim * =<−∞→
ελλPn
, pentru orice ε > 0, deci λ* este un estimator consistent
pentru parametrul λ.
PropoziŃia VIII.1.2. Momentul de selecŃie kσ de ordin k este estimator absolut corect pentru momentul teoretic );( k
k XM=σ
DemonstraŃie. Avem că
kk
n
i
k
n
i
kn
i
k
i
n
i
k
ikn
n
nXM
nXM
nX
nMM σ
σσσ =====
= ∑∑∑∑
==== 1111
1)(
1)(
11)( ,
respectiv
==
= ∑∑
==
n
i
k
i
n
i
k
ik XDn
Xn
DD1
22
1
22 )(11
)(σ
0)()(
)(1 2
2
2
1
22
→=== ∑= n
XD
n
XnDXD
n
kkn
i
k ,
când n → ∞ se obŃine că kσ este estimator absolut corect pentru kσ .
PropoziŃia VIII.1.3. Momentul centrat de selecŃie de ordin doi 2µ
este estimator corect pentru momentul centrat teoretic de ordin doi )X(D 2
2 =µ , adică pentru dispersia teoretică; DemonstraŃie.Avem succesiv
)()(11
)(1
)( 222
2
12 XDXD
n
n
n
nXX
nMM
n
k
k →−
=−
=
−= ∑
=
µµ
Când n → ∞, respectiv
0)3)(1()1(
)( 22343
2
22 →
−−−
−= µµµ
n
nn
n
nD
când n → ∞ şi rezultă că 2µ este un estimator corect pentru 2µ .
PropoziŃia VIII.1.4.Dispersia de selecŃie 2σ este estimator absolut corect pentru dispersia teoretică )X(D 2 .
99
DemonstraŃie.Folosind relaŃia 22
1µσ
−=
n
n se obŃine
)()(1
1)(
11)( 22
222 XDXD
n
n
n
nM
n
n
n
nMM =
−−
=−
=
−
= µµσ ,
respectiv
0)(11
)( 22
2
2222 →
−
=
−
= µµσ Dn
n
n
nDD ,
când n → ∞ şi deci 2σ este un estimator absolut corect pentru dispersia teoretică.
DefiniŃia VIII.1.6. Numim cantitate de informaŃie relativ la parametrul λ expresia:
I(
λ∂
λ∂⋅=λ
2),x(fln
Mn) .
ObservaŃie. Se arată că estimatorul absolut corect ∗λ al lui λ verifică inegalitatea Rao-Cramer
)(I
1)(D 2
λ≥λ∗ .
DefiniŃia VIII.1.7. Estimatorul ∗λ absolut corect pentru parametrul λ
se numeşte eficient dacă )(I
1)(D 2
λ=λ∗ , iar raportul
)(D
)](I[)(e
2
1
∗
−∗
λ
λ=λ se
numeşte eficienŃa estimatorului ∗λ .
VIII.2. Metoda verosimilităŃii maxime
Considerăm o populaŃie în care se urmăreşte o caracteristică numerică ce este o variabilă aleatoare X având funcŃia densitate de probabilitatea ( )λ,xf , unde λ este un parametru necunoscut.Pentru estimarea lui se
realizează o selecŃie în urma căreia se obŃin valorile nxxx ,...,, 21 .
DefiniŃia VIII.2.1. FuncŃia ( ) ( ) ( ) ( )λλλλ ,...,,,,...,, 2121 nn xfxfxfxxxV ⋅⋅⋅= se numeşte funcŃie de
verosimilitate. DefiniŃia VIII.2.2. Spunem că o valoare *λ este un estimator pentru parametrul λ dacă realizează maximul funcŃiei de verosimilitate. Cu alte cuvinte, cea mai verosimilă valoare a parametrului λ este aceea pentru care funcŃia V are valoare maximă.
100
In concluzie, pentru a determina estimatorul parametrului necunoscut λ se rezolvă ecuaŃia
0=∂∂λV
.
ObservaŃie. FuncŃia V are valoare maximă dacă şi numai dacă funcŃia Vln are valoare maximă.
Drept urmare, estimatorul căutat este soluŃie şi pentru ecuaŃia ( )
0ln
=∂
∂λV
.
Algoritm de determinare a estimatorului. 1. Se construieşte funcŃia de verosimilitate
( ) ( ) ( ) ( )λλλλ ,...,,,,...,, 2121 nn xfxfxfxxxV ⋅⋅⋅= .
2. Se calculează ( )λ,,...,,ln 21 nxxxV .
3. Se calculează ( )
λλ
∂
∂ ,,...,, 21 nxxxV.
4. Se rezolvă ecuaŃia ( )
0,,...,, 21 =
∂
∂
λλnxxxV
.
Generalizare.Dacă funcŃia densitate de probabilitate f depinde de n parametri necunoscuŃi nλλλ ,...,, 21 , adică ( )nxff λλλ ,...,,, 21= , atunci
funcŃia de verosimilitate este ( ) ( ) ( ) ( )nnnnnn xfxfxfxxxV λλλλλλλλλλλλ ,...,,,...,...,,,,...,,,,...,,,,...,, 212122112121 ⋅⋅⋅=
Pentru a găsi estimatorii parametrilor necunoscuŃi se rezolvă sistemul:
=∂∂
=∂∂
=∂∂
,0
0
0
2
1
n
V
V
V
λ
λ
λ
M
sau, sistemul echivalent ( )
( )
( )
=∂
∂
=∂
∂
=∂
∂
.0ln
0ln
0ln
2
1
n
V
V
V
λ
λ
λ
M
101
Exemplu.Să se determine estimatorii de verosimilitate maximă pentru
valoarile mediei şi abaterei standard dacă se consideră caracteristica X, care urmează legea normală N(m,σ ).
SoluŃie. Avem că
M(X) = m şi σ=σ )X( , f(x; m,2
2
2
)mx(
e2
1) σ
−−
πσ=σ .
Pentru a scrie sistemul de verosimilitate maximă avem:
ln f(x; m,σ ) = - ln 2
2
2
)mx(ln2
σ−
−σ−π ,
de unde
2
mx
m
),m;x(fln
σ−
=∂
σ∂, iar
3
2)mx(1),m;x(fln
σ−
+σ
−=σ∂
σ∂.
Se obŃine:
∑ ∑ ∑= = =
−=−
=∂
∂=
∂∂ n
k
n
k
n
k
kkk mX
mX
m
mXf
m
V
1 1 122 )(1),;(lnln
σσσ
şi
∑∑ ∑== =
−+−=−
+−=∂
∂=
∂∂ n
k
k
n
k
n
k
kk mXmXmXfV
1
22
1 133
2
])([1
])(1
[),;(lnln
σσσσσ
σσ
.
ObŃinem sistemul
=−+σ−
=−
∑
∑
=
=
0])mX([
0)mX(
n
1k
2k
2
n
1kk
Care conduce la soluŃia
=−=
==
∑
∑
=
∗
=
∗
21
2
1
)(1
1
µσn
k
k
n
k
k
XXn
XXn
m
.
VIII.3. Metoda momentelor
Această metodă constă în estimarea parametrilor necunoscuŃi din condiŃiile ca momentele teoretice ale variabilei aleatoare X, cu funcŃia densitate de probabilitate ( )nxff λλλ ,...,,, 21= , să fie egale cu momentele
de selecŃie de acelaşi ordin. Momentul teoretic de ordin k este
102
( ) ( )∫+∞
∞−
= dxxfxXM n
k
k λλλ ,...,,, 21
Momentul de selecŃie de ordin k este
( )n
x
XM
n
i
k
i
k
∑== 1* .
Din egalitatea ( ) ( )XMXM kk
*= , nk ,1= se obŃine un sistem din care
se găsesc estimatorii parametrilor nλλλ ,...,, 21 .
Exemplu. Se consideră caracteristica X, care urmează legea gamma
de parametrii a>b>0 necunoscuŃi. Vom estima aceşti parametri, folosind metoda momentelor, pe baza datelor n21 x,...,x,x de selecŃie.
SoluŃie.FuncŃia densitate de probabilitate a caracteristicii X este:
≤
>Γ=
−−
0xdaca,0
0xdaca,exb)a(
1)b,a;x(f
b
x1a
a ,
unde Γ este funcŃia lui Euler de speŃa a doua, adică ∫∞ −−=Γ0
x1a dxex)a( .
În cazul de faŃă este vorba de doi parametri, deci sistemul de ecuaŃii este
format din două ecuaŃii, anume 11 σσ = şi 22 σσ = .
Vom calcula momentul teoretic iniŃial kσ de ordin k:
∫ ∫∞
∞−
∞ −−+ ⋅−+−+==Γ
== akakabdxexba
dxbaxfx kb
x
ka
a
k
k )...2)(1(...)(
1),;(
0
1σ
. Rezultă sistemul:
+=
=
)1(22
1
aab
ab
σσ
care are soluŃia
1
212
212
21
,σσσ
σσσ −
=−
= ∗∗ ba ,
care reprezintă estimatorii pentru parametrii a şi b.
103
VIII.4. Metoda intervalelor de încredere
Fie caracteristica X care are funcŃia de probabilitate ( )θ,xf , unde θ este parametrul necunoscut. Metoda constă în determinarea a două funcŃii de
selecŃie n,1i),X,...,X,X( n21ii =θ=θ astfel încât P( 21 θ<θ<θ ) = 1-α , unde α nu depinde de θ şi poartă numele de probabilitate de risc, iar 1-α se numeşte probabilitate de încredere. Intervalul aleator ( ), 21 θθ poartă numele de interval de încredere pentru parametrul θ .
Algoritm de determinare a intervalului de încredere.
1.Se caută determinarea unei statistici );X,...,X,X(ZZ n21nn θ= a cărei lege de probabilitate să fie cunoscută şi să nu depindă de θ . 2. Se determină apoi un interval numeric ( )z,z 21 astfel încât P( 2n1 zZz << ) = 1-α . 3. Din 2n1 zZz << se exprimă inegalitatea 21 θ<θ<θ şi de aici intervalul
( ), 21 θθ este determinat.
ObservaŃie. Intervalul este cu atât mai bun cu cât are lungimea mai mică şi cu cât 1-α este mai mare. AplicaŃii
1. Interval de încredere pentru valoarea medie teoretică dacă dispersia teoretică este cunoscută.
SoluŃie.Se consideră caracteristica X care urmează legea normală N(m,σ ) cu m R∈ necunoscut şi 0>σ cunoscut. Vom determina un interval de încredere pentru m cu o probabilitate de încredere 1-α dată şi cunoscând datele de selecŃie n21 x,...,x,x , respectiv variabilele de selecŃie n21 X,...,X,X corespunzătoare.
Considerăm statistica
n
mXZn σ
−= , unde ∑
=
=n
1kkX
n
1X , care urmează legea
normală N(0,1) ce nu depinde de parametrul necunoscut m. Deci putem determina intervalul ( )z,z 21 astfel încât P( )zZz 2n1 << = 1-α adică
α−=Φ−Φ 1)z()z( 12 , ∫−
π=Φ
x
0
2
t
dte2
1)x(
2
este funcŃia lui Laplace şi care
are valorile tabelate. Intervalul are lungime minimă când este simetric faŃă de
104
origine adică 2
112 zzz α−=−= . Rezultă că
2
1)z(
21
α−=Φ α
− şi folosind
tabelele de valori pentru funcŃia Laplace găsim 2
1z α− .
Am obŃinut P( α−=<σ−
<− α−
α− 1)z
n
mXz
21
21 , adică
P( )zn
Xmzn
X2
12
1α
−α
−
σ+<<
σ− = 1-α .
Deci intervalul de încredere pentru media teoretică m este ( )m,m 21 , unde
211 z
nXm α
−
σ−= şi
212 z
nXm α
−
σ+= , iar ∑
=
=n
1kkX
n
1X .
ObservaŃie. Când X nu urmează legea normală, dar volumul selecŃiei este
mare (n>30) şi se cunoaşte 0)X( >σ=σ atunci statistica nZ =
n
mXσ−
,
unde m=M(X) este necunoscută, este aproximativ repartizată normal N(0,1). Deci se poate considera pentru m acelaşi interval de încredere obŃinut mai sus.
2. Interval de încredere pentru valoarea medie teoretică dacă dispersia teoretică este necunoscută.
SoluŃie.Fie caracteristica X ce urmează legea normală N(m, )σ cu
m=M(X) parametru necunoscut şi 0)X(D 2 >=σ necunoscută.
Considerăm statistica
n
mXT
σ−
= , unde ∑=
=n
1kkX
n
1X şi
∑=
−−
=σn
1k
2k
2 )XX(1n
1care urmează legea Student cu n-1 grade de libertate.
Determinăm intervalul ( 21 t,t ) cu P( )tTt 21 << = 1-α , adică
α−=− −− 1)t(F)t(F 11n21n , unde ∫ ∞−
+−
+Γπ
+Γ
=x
2
1n2
n ds)n
s1(
)2
n(n
)2
1n(
)x(F este
funcŃia de repartiŃie a legii Student cu n grade de libertate şi care are valorile
105
tabelate, iar )x(F1)x(F nn −=− . Deci 1
21,1n
2 ttt −== α−−
se determină astfel
încât
21)t(F
21,1n
1n
α−=α
−−− ,
apoi putem scrie
α−=<σ−
<− α−−
α−−
1)t
n
mXt(P
21,1n
21,1n
sau
ασσ
αα −=+<<−−−−−
1)(2
1,12
1,1 nnt
nXmt
nXP .
Adică, intervalul de încredere pentru m este )m,m( 21 unde
21,1
1 α
σ−−
−=nt
nXm şi
21,1
2 α
σ−−
+=nt
nXm .
3. Intervalul de încredere pentru diferenŃa mediilor a două populaŃii SoluŃie. Fie două populaŃii 1ζ şi 2ζ la care se analizează aceeaşi
caracteristică şi care pentru 1ζ este 1X ce urmează legea normală N( ),m 11 σ ,
iar pentru 2ζ este 2X ce urmează legea normală N ),m( 22 σ . Vom determina
un interval de încredere pentru diferenŃa mediilor 21 mm − cu probabilitatea
de încredere 1-α folosind datele de selecŃie 1n11211 x,...,x,x relativ la
caracteristica 1X , respectiv 2n22221 x,...,x,x relativ la caracteristica 2X .
a) Presupunem abaterile standard ( ), 21 σσ cunoscute. Statistica
2
22
1
21
2121
nn
)mm()XX(Z
σ+
σ
−−−= ,
unde ,Xn
1X,X
n
1X
21 n
1kk2
22
n
1kk1
11 ∑∑
==
== urmează legea normală N(0,1). Se
determină intervalul ( )z,z 21 astfel încât P( )zZz 21 << = 1-α la fel ca în aplicaŃia 1. Avem
α−=<σ
+σ
−−−<− α
−α
−1)z
nn
)mm()XX(z(P
21
2
22
1
21
2121
21
sau
106
))()((2
22
1
21
21
21212
22
1
21
21
21nn
zXXmmnn
zXXPσσσσ
αα ++−<−<+−−−−
adică intervalul de încredere pentru 21 mm − este (A,B) unde
A = (2
22
1
21
21
21 nnz)XX
σ+
σ−− α
− şi B =
2
22
1
21
21
21 nnz)XX(
σ+
σ+− α
−.
b) Presupunem abaterile standard σ=σ=σ 21 necunoscute. Considerăm
statistica
21
21
222
211
2121
n
1
n
12nn
)1n()1n(
)mm()XX(T
+
−+⋅
σ−+σ−
−−−= ,
unde 1X şi 2X sunt mediile de selecŃie definite anterior, iar 21σ şi
22σ dispersiile de selecŃie ∑
=
−−
=σ1n
1k
21k1
1
21 )XX(
1n
1 şi
∑=
−−
=σ2n
1k
22k2
2
22 )XX(
1n
1, care urmează legea Student cu n = 2nn 21 −+
grade de libertate. La fel ca în aplicaŃia 2. se determină intervalul )t,t( 21
astfel încât α−=<< 1)tTt(P 21 adică
α−=<+
−+
σ−+σ−
−−−<− α
−α
−1)t
n
1
n
12nn
)1n()1n(
)mm()XX(t(P
21,n
21
21
222
211
2121
21,n
.
Rezultă intervalul de încredere (A,B) pentru 21 mm − unde
A = St)XX(2
1,n21 ⋅−− α
− şi St)XX(B
21,n
21 ⋅+−= α−
cu
2nn
n
1
n
1
])1n()1n[(S21
21222
211
2
−+
+
⋅σ−+σ−= .
4. Intervalul de încredere pentru dispersia teoretică SoluŃie. Fie caracteristica X ce urmează legea normală N(m,σ ).
Considerăm statistica 2
22 )1n(
Hσ
σ−= unde ∑
=
−−
=σn
1k
2k
2 )XX(1n
1, iar
∑=
=n
1kkX
n
1X , ce urmează legea 2χ cu n-1 grade de libertate. Pentru
probabilitatea de încredere 1-α se poate determina intervalul ( )h,h 22
21 ,
astfel încât
α−=<< 1)hHh(P 22
221 .
107
2
2,1n
21 hh α
−= se determină din relaŃia
2)h(F 2
11n
α=− şi
2
21,1n
22 hh α
−−= se determină din relaŃia
21)h(F 2
21n
α−=− , unde )x(Fn este
funcŃia de repartiŃie a legii 2χ cu n grade de libertate
∫−−
Γ
=x
0
2
t1
2
n
2
nn dtet
)2
n(2
1)x(F care are valorile tabelate.
ObŃinem
ασ
σ−=<
−< 1)
)1(( 2
22
22
1 hn
hP
sau
α−=σ−
<σ<σ−
1)h
)1n(
h
)1n((P
21
22
22
2
,
adică s-a obŃinut intervalul de încredere ( ), 22
21 σσ pentru 2σ , unde
2
21,1n
22
1h
)1n(
α−−
σ−=σ şi
2
2,1n
22
2h
)1n(
α−
σ−=σ , iar intervalul de încredere pentru
abaterea standard σ este ),( 21 σσ .
UNITATEA DE STUDIU IX
VERIFICAREA IPOTEZELOR STATISTICE
IX.1. NoŃiuni generale
DefiniŃia IX.1.1. Se numeşte ipoteză statistică presupunerea care se
face cu privire la parametrul unei repartiŃii sau la legea de repartiŃie pe care o urmează anumite variabile aleatoare.
DefiniŃia IX.1.2. Procedeul de verificare a unei ipoteze statistice se
numeşte test. DefiniŃia IX.1.3. Ipoteza statistică ce urmează a fi testată se numeşte
ipoteză nulă şi se notează cu 0H . Respingerea ipotezei nule implică
acceptarea unei alte ipoteze, numită ipoteză alternativă (sau ipoteză admisibilă) , notată cu 1H .
108
DefiniŃia IX.1.4. Regiunea critică reprezintă valorile numerice ale
tesului statistic pentru care ipoteza nulă va fi respinsă. DefiniŃia IX.1.5. Eroarea pe care o facem eliminând o ipoteză nulă,
deşi ea este adevărată se numeşte eroare de genul I. Probabilitatea de a realiza o astfel de eroare reprezintă riscul de genul
I ( sau riscul furnizorului) , se notează cu α şi se umeşte nivel de semnificaŃie (sau prag de semnificaŃie).
DefiniŃia IX.1.6. Nivelul de încredere al unui test statistic este
α−1 , iar procentul ( )%1100 α− este probabilitatea de garantare a rezultatelor.
DefiniŃia IX.1.7. Eroarea pe care o facem acceptând o ipoteză nulă,
deşi ea este falsă , se numeşte eroare de genul al II-lea, iar probabilitatea comiterii unei astfel de erori se notează cu β şi reprezintă riscul beneficiarului. Valoarea β−1 se numeşte puterea testului statistic.
Fie X o caracteristică pentru care funcŃia densitate de probabilitate
este ( )θ,xf , unde θ este un parametru necunoscut. Presupunem că θ aparŃine unei mulŃimi A. Aceasta este ipoteza nulă: AH ∈θ:0 .
Această presupunere poate fi adevărată sau falsă. De aceea trebuie verificată. Pentru aceasta considerăm şi ipoteza alternativă 11 : AH ∈θ .
Pentru a verifica ipoteza nulă 0H se efecuează o selecŃie:
nXXX ,...,, 21 .
Regiunea critică este o mulŃime nRU ⊂ cu proprietatea că ( )( ) α=∈ 021 ,...,, HUxxxP n şi ( )( ) β=∉ 121 ,...,, HUxxxP n
Dacă ( ) Uxxx n ∈,...,, 21 , atunci 0H se respinge.
Dacă ( ) Uxxx n ∉,...,, 21 , atunci 0H se admite.
ObservaŃie. Nu există o metodă generală de construire a regiunii
critice U. Se cnosc însă clase de probleme pentru care s-au construit astfel de regiuni criice şi corespunzător lor, avem diferite teste de verificare a ipotezelor statistice.
109
IX.2. Testul Z
Se consideră caracteristica X, ce urmează legea normală ),( σmN , unde Rm∈ este necunoscut, iar 0>σ este cunoscut.
Relativ la media teoretică )(XMm = facem ipoteza nulă
00 : mmH = , cu alternativa 01 : mmH ≠ .
Pentru verificarea ipotezei nule 0H cu alternativa precizată mai
înainte, considerăm o selecŃie repetată de volum n şi nivelul de semnificaŃie )1,0(∈α . Fie datele de selecŃie nxxx ,,, 21 K şi corespunzător variabilele de
selecŃie nXXX ,,, 21 K . Dacă se consideră statistica
n
mXZ
σ−
= , unde ∑=
=n
k
kXn
X1
1,
care urmează legea normală )1,0(N . Prin urmare, pentru )1,0(∈α , putem
determina intervalul numeric ),(2
12
1αα
−−− zz astfel încât
ααα −=<<−−−
1)(2
12
1zZzP .
Într-adevăr, avem că αααααα −=Φ=−Φ−Φ=<<−
−−−−−1)(2)()()(
21
21
21
21
21
zzzzZzP ,
aşadar, se ia 2
1α
−z astfel încât
2
1)(
21
αα
−=Φ
−z .
Se defineşte regiunea critică nRU ⊂ ,
−∉−
∈=−−
),(),,(2
12
1
021 αασ
zz
n
muRuuuU n
nK ,
unde ∑=
=n
k
kun
u1
1.
În acest fel am obŃinut că =∈ )),,,(( 021 HUXXXP nK
=
−∉
−=
−−0
21
21
0 , Hzz
n
muP αασ
110
ααα =
−∉=
−−0
21
21
, HzzZP .
Prin urmare, am determinat regiunea critică U, astfel încât să fie satisfăcută relaŃia α=∈ )),,,(( 021 HUXXXP nK .
Folosind regiunea critică U, vom respinge ipoteza nulă 00 : mmH = ,
dacă Uxxx n ∈),,,( 21 K , adică dacă ),(2
12
1
0αασ −−
−∉−
= zz
n
mxz şi o admitem
dacă Uxxx n ∉),,,( 21 K , adică ),(2
12
1
0αασ −−
−∈−
= zz
n
mxz .
ObservaŃie. Se vede că regiunea critică U corespunde mulŃimii
complementare a intervalului numeric ),(2
12
1αα
−−− zz . Din acest motiv, în cele
ce urmează, nu vom pune în evidenŃă, de fiecare dată, regiunea critică U, ci numai intervalul numeric căruia îi aparŃine statistica utilizată pentru obŃinerea acestei regiuni.
ObservaŃie. Testul Z se poate folosi şi pentru caracteristica X ce nu urmează legea normală, când volumul n al selecŃiei este mare )30( >n , având în vedere că statistica Z urmează aproximativ legea normală )1,0(N ,
unde )(XMm = şi )(2 XD=σ .
Etapele aplicării testului Z. 1o Se dau: σα ;;,,; 021 mmxxx n =K ;
2o Se determină 2
1α
−z astfel încât
2
1)(
21
αα
−=Φ
−z ;
30 Se calculează
n
mxz
σ0−
= , unde ∑=
=n
k
kxn
x1
1;
40 Concluzii: dacă 2
1α
−< zz , ipoteza 0H este admisă, în caz contrar
ipoteza este respinsă.
ObservaŃie. Deoarece ipoteza alternativă este 01 : mmH ≠ , testul
prezentat este testul Z bilateral. Dacă ipoteza alternativă este 01 : mmH < , se
111
obŃine în mod analog testul Z unilateral stânga, respectiv pentru ipoteza alterantivă 01 : mmH > , se obŃine testul Z unilateral dreapta.
De exemplu, pentru testul Z unilateral dreapta, intervalul numeric pentru statistica Z devine ),( 1 α−−∞ z , unde α−1z este determinat astfel încât
αα −=Φ − 2
1)( 1z , iar regiunea critică U se modifică în mod corespunzător,
adică
≥−
∈= − )),,( 10
21 ασz
n
muRuuuU n
nK .
IX.3. Testul T (Student) Se consideră caracteristica X ce urmează legea normală ),( αmN cu
parametrii RXMm ∈= )( şi 0>σ necunoscuŃi. Relativ la această
caracteristică se face ipoteza nulă 00 : mmH = cu ipoteza alternativă
01 : mmH ≠ .
Pentru verificarea acestei ipoteze se consideră o selecŃie repetată de volum n, cu datele de selecŃie nxxx ,,, 21 K şi corespunzător variabilele de
selecŃie nXXX ,,, 21 K .
Construim statistica
12
−
−=
−=
n
mX
n
mXT
µσ, unde, după cum se ştie
∑=
=n
k
kXn
X1
1, 2
1
22
1)(
1
1µσ
−=−
−= ∑
= n
nXX
n
n
k
k , care urmează legea
Student cu n-1 grade de libertate. Prin urmare, pentru nivelul de semnificaŃie )1,0(∈α dat, se poate
determina intervalul numeric ),(2
1,12
1,1αα
−−−−−
nntt astfel încât
ααα −=<<−−−−−
1)(2
1,12
1,1 nntTtP .
Anume, 2
1,1α
−−nt se determină astfel ca
21
21,1
1
αα −=
−−
−n
n tF , unde
112
∫∞−
+−
∈
+
Γ
+Γ
=t
m
m Rtdxm
x
mm
m
tF ,1
2
2
1
)(2
12
π,
este funcŃia de repartiŃie pentru legea Student cu m grade de libertate (tabelată în Anexa II, pentru anumite valori).
Complementarea intervalului numeric, astfel determinat, ne defineşte regiunea critică nRU ⊂ . Astfel, avem că
≥−
∈=−−)),,(
21,1
0
21 ασ nu
n
n t
n
muRuuuU K ,
unde ∑=
=n
k
kun
u1
1, respectiv ∑
=
−−
=n
k
ku uun 1
22)(
1
1σ .
Etapele aplicării testului T. 1o Se dau: 021 ;,,; mmxxx n =Kα ;
2o Se determină 2
1,1α
−−nt astfel încât
21
21,1
1
αα −=
−−
−n
n tF ;
30 Se calculează
n
mxt
σ0−
= , unde ∑=
=n
k
kxn
x1
1,
∑=
−−
=n
k
k xxn 1
22)(
1
1σ ;
40 Concluzii: dacă 2
1,1α
−−<
ntt , ipoteza 00 : mmH = este admisă, în
caz contrar ipoteza este respinsă.
ObservaŃie. Deoarece ipoteza alternativă este 01 : mmH ≠ , testul
prezentat este testul T bilateral. Dacă ipoteza alternativă este 01 : mmH < , se
obŃine în mod analog testul T unilateral stânga, respectiv pentru ipoteza alterantivă 01 : mmH > , se obŃine testul T unilateral dreapta.
Când numărul gradelor de libertate tinde spre infinit, conform teoremei limită centrală, avem că legea Student converge în repartiŃie la legea normală )1,0(N .
Prin urmare, dacă volumul n al selecŃiei este mare )30( >n , se poate
utiliza testul Z pentru verificarea ipotezei nule 00 : mmH = , prin utilizarea
113
statisticii T în loc de statistica Z. Toate rezultatele de la testul Z rămân, aşadar, adevărate în acest caz.
IX.4. Teste pentru compararea a două medii Se consideră două populaŃii independente 'C şi ''C cercetate din
punct de vedere al aceleiaşi caracteristici. Această caracteristică este 'X pentru 'C şi urmează legea normală )','( σmN şi respectiv ''X pentru ''C şi urmează legea normală )'',''( σmN .
Relativ la mediile teoretice ale celor două caracteristici independente se face ipoteza nulă ''':0 mmH = cu alternativa ''':1 mmH ≠ .
Pentru aceasta se consideră câte o selecŃie repetată de volum 'n şi respectiv ''n din cele două populaŃii. Notăm datele de selecŃie prin
''
'2
'1 ,,, nxxx K şi respectiv ''
''''
2''
1 ,,, nxxx K , şi variabilele de selecŃie ''
'2
'1 ,,, nXXX K , respectiv ''
''''
2''
1 ,,, nXXX K .
Reamintim notaŃiile
∑=
='
1
''
'
1 n
k
kXn
X , ∑=
−−
='
1
2''2'
)(1'
1 n
k
k XXn
σ ,
∑=
=''
1
''''
''
1 n
k
kXn
X , ∑=
−−
=''
1
2''''2''
)(1''
1 n
k
k XXn
σ ,
pentru mediile de selecŃie şi respectiv dispersiile de selecŃie. Distingem în cele ce urmează trei cazuri, în funcŃie de anumite
informaŃii ce le cunoaştem relativ la dispersiile teoretice. a). Testul Z (dacă dispersiile 2'σ şi 2''σ sunt cunoscute). În acest
caz se consideră statistica ( ) ( )
''
''
'
'
'''22
'''
nn
mmXXZ
σσ+
−−−= , care urmează legea
normală )1,0(N . Se aplică prin urmare testul Z pentru compararea celor două medii teoretice.
Pentru nivelul de semnificaŃie )1,0(∈α dat se determină intervalul
numeric ),(2
12
1αα
−−− zz , astfel încât ααα −=<<−
−−1)(
21
21
zZzP . Stabilirea
acestui interval se obŃine din relaŃia 2
1)(
21
αα
−=Φ
−z , unde )(xΦ este funcŃia
lui Laplace şi care este tabelată. . Etapele aplicarii testului
114
1o Se dau: ''''
''2
''1
''
'2
'1 ,,,;,,,; nn xxxxxx KKα ;
2o Se determină 2
1α
−z astfel încât
2
1)(
21
αα
−=Φ
−z ;
30 Se calculează
''
''
'
' 22
'''
nn
xxz
σσ+
−= , unde ∑
=
='
1
''
'
1 n
k
kxn
x , şi
∑=
=''
1
''''
''
1 n
k
kxn
x ;
40 Concluzii: dacă 2
1α
−< zz , ipoteza ''' mm = este admisă, în caz
contrar ipoteza este respinsă. b). Testul T (dacă dispersiile 2'σ şi 2''σ sunt necunoscute şi
222 ''' σσσ == ). Se consideră statistica
( ) ( )
''
1
'
12'''
'')1''(')1'(
'''22
'''
nn
nn
nn
mmXXT
+
−+
−+−
−−−=
σσ, care urmează legea
Student cu 2''' −+= nnn grade de libertate. În acest caz se va aplica testul T. Pentru nivelul de semnificaŃie )1,0(∈α dat se poate determina intervalul numeric ),(
21,
21,
αα−−
−nntt , astfel
încât 2
1)(2
1,2
1,
ααα −=<<−
−− nntTtP . Pentru aceasta se foloseşte relaŃia
21
21,
αα −=
−n
n tF , unde )(xFn este funcŃia de repartiŃie de la legea Student
cu n grade de libertate şi care este tabelată Etapele aplicarii testului 1o Se dau: ''
''''
2''
1''
'2
'1 ,,,;,,,; nn xxxxxx KKα ; 2''' −+= nnn ;
2o Se determină 2
1,α
−nt astfel încât
21
21,
αα −=
−n
n tF ;
115
30 Se calculează
''
1
'
12'''
'')1''(')1'( 22
'''
nn
nn
nn
xxt
+
−+
−+−
−=
σσ, unde
∑=
='
1
''
'
1 n
k
kxn
x , ∑=
−−
='
1
2''2'
)(1'
1 n
k
k xxn
σ , ∑=
=''
1
''''
''
1 n
k
kxn
x ,
∑=
−−
=''
1
2''''2''
)(1''
1 n
k
k xxn
σ ;
40 Concluzii: dacă 2
1,α
−<
ntt , ipoteza ''' mm = este admisă, în caz
contrar ipoteza este respinsă. c) Testul T (dacă dispersiile 2'σ şi 2''σ sunt necunoscute şi
diferite). Se va considera statistica
( ) ( )
''
''
'
'
'''22
'''
nn
mmXXT
σσ+
−−−=
,
care urmează legea Student cu n grade de libertate. Numărul n al gradelor de
libertate se calculează cu formula 1''
)1(
1'
1 22
−−
+−
=n
c
n
c
n, unde
+=
''
''
'
'
'
' 222
nnnc
σσσ.
S-a ajuns la testul T, care pentru nivelul de semnificaŃie )1,0(∈α dat,
conduce la intervalul numeric ),(2
1,2
1,αα
−−−
nntt , astfel încât
ααα −=<<−−−
1)(2
1,2
1, nntTtP .
Pentru aceasta se foloseşte relaŃia 2
12
1,
αα −=
−n
n tF , unde )(xFn este
funcŃia de repartiŃie de la legea Student cu n grade de libertate şi care este tabelată.
Etapele aplicării testului 1o Se dau: ''
''''
2''
1''
'2
'1 ,,,;,,,; nn xxxxxx KKα ;
2o Se calculează
∑=
='
1
''
'
1 n
k
kxn
x , ∑=
−−
='
1
2''2'
)(1'
1 n
k
k xxn
σ ,
116
∑=
=''
1
''''
''
1 n
k
kxn
x , ∑=
−−
=''
1
2''''2''
)(1''
1 n
k
k xxn
σ ,
de unde
+=
''
''
'
'
'
' 222
nnnc
σσσ;
30 Se determină n astfel încât 1''
)1(
1'
1 22
−−
+−
=n
c
n
c
n;
4o Se determină 2
1,α
−nt astfel încât
21
21,
αα −=
−n
n tF ;
50 Se calculează
''
''
'
' 22
'''
nn
xxt
σσ+
−= ;
60 Concluzii: dacă 2
1,α
−<
ntt , atunci ipoteza ''' mm = este admisă, în
caz contrar ipoteza este respinsă.
IX.5. Testul 2χ (hi-pătrat) pentru dispersie Fie caracteristica X ce urmează legea normală ),( σmN , unde
dispersia teoretică )(22 XD=σ este necunoscută şi Rm∈ de asemenea necunoscut.
Relativ la dispersia teoretică se face ipoteza nulă 20
20 : σσ =H cu
ipoteza alternativă 20
21 : σσ ≠H .
Pentru verificarea ipotezei nule 0H cu alternativa 1H se consideră o
selecŃie repetată de volum n, cu datele de selecŃie nxxx ,,, 21 K şi
corespunzător variabilele de selecŃie nXXX ,,, 21 K .
Statistica 2
2
1
22
2 )1()(
1
σσ
σ−
=−= ∑=
nxXH
n
k
k , urmează legea 2χ cu
1−n grade de libertate. Pentru un nivel de semnificaŃie )1,0(∈α dat, se poate determina un
interval numeric ),( 2
21,1
2
2,1
αα−−− nn
hh astfel încât
ααα −=<<−−−
1)( 2
21,1
22
2,1 nn
hHhP .
ExtremităŃile acestui interval numeric se determină din relaŃiile
117
22
2,1
1
αα =
−
−n
n hF şi 2
12
21,1
1
αα −=
−−
−n
n hF ,
unde )(xFm este funcŃia de repartiŃie pentru legea 2χ cu m grade de
libertate, adică ∫ >
Γ
=−−
x tm
mm xdtetm
xF0
21
2
2
0,
22
1)( , fiind tabelată pentru
anumite valori în Anexa III. Cu ajutorul intervalului numeric ),( 2
21,1
2
2,1
αα−−− nn
hh astfel determinat,
regiunea critică va fi dată de complementarea acestui interval, adică
∉−∈=−−−=
∑ ),()(1
),,( 2
21,1
2
2,1
1
220
21 αασ nn
n
k
k
n
n hhuuRuuuU K ,
unde ∑=
=n
k
kun
u1
1.
Etapele aplicării testului 2χ
1o Se dau: ;;,,; 021 σσα =nxxx K ;
2o Se determină intervalul ),( 2
21,1
2
2,1
αα−−− nn
hh astfel încât
22
2,1
1
αα =
−
−n
n hF şi 2
12
21,1
1
αα −=
−−
−n
n hF ;
30 Se calculează ∑=
−=n
k
k xxh1
220
2 )(1
σ, unde ∑
=
=n
k
kxn
x1
1;
40 Concluzii: dacă ),( 2
21,1
2
2,1
2αα
−−−∈
nnhhh , ipoteza 0H este admisă, în
caz contrar este respinsă.
IX.6. Testul F (Snedecor-Fisher)
Se consideră două populaŃii independente 'C şi ''C cercetate din
punct de vedere al aceleaşi caracteristici. Această caracteristică este 'X pentru 'C şi urmează legea normală )','( σmN şi respectiv ''X pentru ''C şi urmează legea normală )'',''( σmN .
Relativ la dispersiile teoretice ale celor două caracteristici se face ipoteza nulă 22
0 ''': σσ =H cu alternativa 221 ''': σσ ≠H .
118
Pentru verificarea ipotezei nule 0H se efectuează câte o selecŃie
repetată de volum respectiv 'n şi ''n din cele două populaŃii 'C şi ''C .
Notăm datele de selecŃie prin ''
'2
'1 ,,, nxxx K şi respectiv ''
''''
2''
1 ,,, nxxx K , şi
variabilele de selecŃie ''
'2
'1 ,,, nXXX K , respectiv ''
''''
2''
1 ,,, nXXX K .
Cu notaŃiile
∑=
−−
='
1
2''2'
)(1'
1 n
k
k XXn
σ , ∑=
='
1
''
'
1 n
k
kXn
X ,
∑=
−−
=''
1
2''''2''
)(1''
1 n
k
k XXn
σ , ∑=
=''
1
''''
''
1 n
k
kXn
X ,
avem că statistica 2
2
2
2
''
''
'
'
σσ
σσ
=F , urmează legea Snedecor-Fisher cu
1'−= nm şi 1'' −= nn grade de libertate. Prin urmare, statistica F are funcŃia de repartiŃie, pentru 0>x , dată prin
∫+
−−
+
Γ
Γ
+Γ
=x
nmnm
nm dttn
mt
nm
nm
n
mxF
0
21
22
, 1
22
2)( .
Pentru un nivel de semnificaŃie )1,0(∈α fixat se poate determina
intervalul numeric ),(2
1,,2,,
αα−nmnm
ff , astfel încât
ααα −=<<−
1)(2
1,,2,, nmnm
fFfP .
ExtremităŃile acestui interval se determină din relaŃiile
22,,
,
αα =
nm
nm fF şi 2
12
1,,,
αα −=
−nm
nm fF .
Deoarece are loc relaŃia γ
γ−
=1,,
,,
1
mn
nmf
f , tabelele pentru funcŃia
)(, xF nm sunt, de regulă, întocmite numai pentru valori mari ale lui γ (0,95, 0,975, 0,99,..) şi pentru 1>F .
Dacă 1<F , intervalul numeric pentru F este dat prin
=−
−
2,,
21,,2
1,,2,,
1,
1),(
αααα
mnmn
nmnm ffff .
Etapele aplicării testului F 1o Se dau: ;,,,;,,,;1'';1'; ''
''''
2''
1''
'2
'1 nn xxxxxxnnnm KK−=−=α ;
2o Se determină intervalul ),(2
1,,2,,
αα−nmnm
ff astfel încât
119
22,,
,
αα =
nm
nm fF şi 2
12
1,,,
αα −=
−nm
nm fF ;
30 Se calculează 2
2
''
'
σσ
=f , unde
∑=
−−
='
1
2''2'
)(1'
1 n
k
k xxn
σ , ∑=
='
1
''
'
1 n
k
kxn
x ,
∑=
−−
=''
1
2''''2''
)(1''
1 n
k
k xxn
σ , ∑=
=''
1
''''
''
1 n
k
kxn
x .
40 Concluzii: dacă ),(
21,,
2,,
αα−
∈nmnm
fff , atunci ipoteza 22 ''' σσ = este
admisă, în caz contrar este respinsă.
IX.7. Testul de concordanŃă 2χ Fie caracteristica X, care are funcŃia de repartiŃie teoretică F. Ipoteza
statistică nulă ce o facem relativ la caracteristica X este ),,;(: 2100 sxFFH λλλ K= ,
unde sλλλ K,, 21 sunt parametri necunoscuŃi.
Pentru a verifica această ipoteză statistică, la început, folosind datele de selecŃie nxxx K,, 21 , se estimează prin metoda verosimilităŃii
maxime parametrii sλλλ K,, 21 . Fie estimaŃiile de verosimilitate maximă
pentru aceşti parametri, respectiv sλλλ ˆ,ˆ,ˆ 21 K . Prin urmare, ipoteza nulă
devine )ˆ,ˆ,ˆ;(: 2100 sxFFH λλλ K= .
Se efectuează apoi gruparea datelor de selecŃie nxxx K,, 21 ,
obŃinându-se distribuŃia empirică de selecŃie
N
N
fff
xxxX
K
K
21
''2
'1 . Pentru
clasa 'ix , dată de intervalul [ )ii aa ,1− avem că
)()()( 11 −− −=<≤= iiiii aFaFaXaPp , Ni ,1= , probabilităŃi
necunoscute, deoarece funcŃia de repartiŃie teoretică F este necunoscută. Din ipoteza nulă 0H se poate calcula probabilitatea
)ˆ,,ˆ,ˆ,()ˆ,,ˆ,ˆ;()|(ˆ 2112101 sisiiii aFaFFFaXaPp λλλλλλ KK −− −==<≤=.
120
În acest fel ipoteza nulă 0H , făcută asupra funcŃiei de repartiŃie, se poate
rescrie în NippH ii ,1,ˆ:0 == , cu ipoteza alternativă 01 : HH falsă.
Valoarea numerică ( )
∑=
−=
N
i i
ii
pn
pnfh
1
22
ˆ
ˆ este valoarea unei variabile
aleatoare 2H ce urmează legea de probabilitate 2χ cu 1−−= sNk grade de libertate.
Aşadar, pentru probabilitatea de risc α se consideră intervalul de încredere ( )2
1,,0 α−kh pentru 2H , definit prin relaŃia
αα −=< − 1)( 21,
2khHP , adică αα −=− 1)( 2
1,kk hF .
Aici funcŃia )(xFk este funcŃia de repartiŃie pentru legea 2χ cu numărul
gradelor de libertate 1−−= sNk şi care este tabelată .
Etapele aplicării testului 2χ .
1o Se consideră: ),,;(,,,, 21021 sn xFFxxx λλλα KK = ;
2o Se determină estimaŃiile de verosimilitate maximă sλλλ ˆ,ˆ,ˆ 21 K ;
30 Se determină distribuŃia empirică de selecŃie Nii
i
f
xX
,1
'
=
;
4o Se calculează probabilităŃile
)ˆ,,ˆ,ˆ,()ˆ,,ˆ,ˆ;()|(ˆ 211021001 sisiiii aFaFFFaXaPp λλλλλλ KK −− −==<≤=
, Ni ,1= ;
50 Se calculează )1(21, −−=− sNkhk α astfel încât αα −=− 1)( 2
1,kk hF ;
60 Se calculează ( )
∑=
−=
N
i i
ii
pn
pnfh
1
22
ˆ
ˆ;
70 Concluzii: dacă 21,
2α−< khh , ipoteza statistică 0FF = este admisă,
în caz contrar ipoteza este respinsă. ObservaŃie. Testul de concordanŃă 2χ nu este aplicabil dacă există
ipnˆ mai mici decât 5, caz în care se cere o regrupare a datelor de selecŃie.
121
IX.8. Testul de concordanŃă al lui Kolmogorov Fie caracteristica X de tip continuu, având funcŃia de repartiŃie
teoretică F. Dacă )(xF n este funcŃia de repartiŃie de selecŃie, avem că
( ) )(lim xKxdnP nn
=<∞→
,
unde
)()(sup xFxFd n
Rxn −=
∈,
iar ∑+∞
∞−
−−=222)1()( xkk exK este funcŃia lui Kolmogorov şi este tabelată.
Se face ipoteza nulă 0H că X urmează legea de probabilitate dată de
funcŃia de repartiŃie 0F . Dacă ipoteza nulă este adevărată, pentru
probabilitatea de risc α , se poate determina valoarea α−1x astfel încât
αα −=− 1)( 1xK .
Astfel, avem ( ) αα −=< − 11xdnP n sau αα −=
< − 11
n
xdP n .
Aşadar, dacă valoarea calculată a lui nd pentru datele de selecŃie, satisface
inegalitatea α−< 1xdn n , vom admite ipoteza nulă, în caz contrar o
respingem.
Etapele aplicării testului Kolmogorov.
1o Se consideră: α , distribuŃia empirică de selecŃie Nii
i
f
xX
,1
'
=
,
funcŃia de repartiŃie 0F , )( 21 Nfffn +++= K ;
2o Se calculează α−1x astfel încât αα −=− 1)( 1xK ;
30 Se calculează )()(max 0,1
iinNi
n aFaFd −==
, unde 2
1' iii
aax
+= − ;
4o Concluzii: dacă α−< 1xdn n , ipoteza nulă este admisă, în caz
contrar ipoteza este respinsă.
122
UNITATEA DE STUDIU X
REGRESIE ŞI CORELAłIE
X.1. NoŃiuni generale
In practică, populaŃiile depind de două sau chiar mai multe caracteristici. In plus, variabilele economice, fenomenele sociale, în general nu evoluează independent, ci sunt în legătură cu alte fenomene (variabile) . Astfel, utilizând cunoştinŃele privind nivelul unei anumite variabile se poate prognoza nivelul unei alte variabile cu care se află în relaŃie de dependenŃă. Studierea legăturii dintre fenomene se realizează utilizând regresia şi corelaŃia. Regresia descrie modul în care o variabilă dependentă evoluează în funcŃie de modificarea uneia sau a mai multor variabile independente (cauzale). Scopul regresiei este acela de a găsi funcŃii matematice care să descrie cât mai bine legăturile dintre variabile. Astfel de funcŃii sunt de forma
( ) exxxfy ni += ,...,, 21 ,
unde: iy este variabila dependentă ( sau variabilă efect, sau variabilă
rezultativă), ix sunt variabile independente (sau cauze, sau variabile
factoriale), iar e este variabila eroare (sau reziduu, sau eroare de modelare) ce reprezintă influenŃa acelor factori omişi în calcule. CorelaŃia stabileşte gradul în care o variabilă este dependentă de alte variabile. Termenii de regresie şi corelaŃie au fost împrumutaŃi din biometrie şi sunt atribuiŃi lui Galton. Acesta a studiat legătura dintre înălŃimea copiilor şi înălŃimea părinŃilor acestora. Concluzia a fost că din părinŃi foarte înalŃi se nasc copii mai mici de înălŃime, iar din părinŃi foarte scunzi se nasc copii mai înalŃi. Cu alte cuvinte are loc o regresie spre valoarea medie. Dacă nu s-ar întâmpla astfel, din părinŃi înalŃi s-ar fi ajuns la copii din ce în ce mai înalŃi, iar din părinŃi scunzi, s-ar fi ajuns la copii tot mai scunzi. Lumea s-ar fi confruntat astfel cu situaŃii de gigantism sau piticism. X.2. Metode elementare de caracterizare a legăturilor dintre variabile
a) Metoda seriilor statistice paralele interdependente
123
Această metodă constă în compararea termenilor a două serii interdependente ( )
niixX ,1= şi ( )niiyY ,1= , unde X este variabila independentă,
iar Y cea dependentă. X: nxxx ,...,,, 21
Y: nyyy ,...,,, 21
Se evidenŃiază existenŃa şi direcŃia legăturii dintre cele două variabile, după cum urmează:
• dacă valorile ambelor variabile variază în acelaşi sens, atunci există o legătură directă între variabile;
• dacă valorile variabilelor variază în sens diferit , atunci există o legătură inversă între variabile;
• dacă valorile variabilelor variază independent, sau, în timp ce valorile uneia din variabile variază, valorile celeilalte variabile rămân constante, atunci nu există legătură între variabile.
ObservaŃie. Această metodă se aplică în cazul unui număr mic de valori ale variabilelor.
b) Metoda tabelului de corelaŃie
Această metodă constă în gruparea unităŃilor unei populaŃii simultan după ambele variabile X şi Y.
1y 2y …………………..
py
1x 11n 12n ………………….. pn1
2x 21n 22n …………………… pn2
M M M …………………… M
kx 1kn 2kn ……………………. kpn
In funcŃie de modul de distribuŃie a frecvenŃelor ijn în acest tabel se
poate aprecia existenŃa, direcŃia, precum şi intensitatea legăturii dintre cele două variabile:
• dacă valorile ijn sunt dispersate relativ uniform pe toată suprfaŃa
tabelului, atunci nu există legătură între cele două variabile; • cu cât valorile ijn se concentrează mai mult în jurul diagonalelor
tabelului cu atât legătura este mai intensă (în jurul diagonalei principale “\”: legătură inversă; In jurul diagonalei secundare” /”: legătură directă).
c) Metoda grafică
124
Graficul se construieşte pornind de la perechile de valori observate ( )ii yx , care se reprezintă într-un sistem de coordonate ortogonal. Pe axa
absciselor se reprezintă valorile ix ale variabilei independente X, iar pe axa
ordonatelor se reprezintă valorile iy ale variabilei dependente. Graficul
obŃinut se numeşte corelogramă sau diagramă de împrăştiere. Dacă punctele sunt dispersate la întâmplare în plan, atunci între cele două variabile nu există legătură semnificativă. In acest caz putem considera că punctele se grupează în jurul unei drepte paralele cu axa absciselor. Dacă punctele se grupează în jurul unei drepte care nu este paralelă cu axa absciselor, atunci între cele două variabile există legături directe, sau inverse.
X.3. Modelul de regresie liniară
Prin acest model se exprimă legătura dintre două variabile printr-o relaŃie de forma
eXY ++= βα , unde Y este variabila dependentă, X este variabila independentă, iar e este eroarea ce însumează influenŃele asupra lui Y ale variabilelor neincluse în model. EcuaŃia exy ++= βα se numeşte ecuaŃie de regresie, iar panta acestei drepte, β , este coeficientul de regresie. Semnul lui β indică direcŃia legăturii dintre ele două variabile, după cum urmează:
• dacă 0>β , există legătură directă între variabile;
• dacă 0=β , nu există legătură între variabile;
• dacă 0<β , există legătură inversă între variabile. In ecuaŃia de regresie însă, parametrii α şi β sunt necunoscuŃi, iar
determinarea lor la nivelul întregii populaŃii statistice este imposibil de realizat. De acea se impune o estimare a parametrilor.
Considerăm a şi b cei doi estimatori ai parametrilor necunoscuŃi α şi β , calculaŃi la nivelul unui eşantion de volum n . EcuaŃia de regresie la nivelul eşaantionului este
ix bxayi
+= .
EcuaŃia de regresie la nivelul întregii populaŃii este
125
ixi eyyi+= .
Vom determin estimatorii din condiŃia ca iii bxaye −−= să fie minimă,
condiŃie ce implică şi faptul că suma ∑=
=n
i
ieS1
2 este minimă. Numim această
metodă, metoda celor mai mici pătrate. Pentru ca S să fie minimă trebuie îndeplinite următoarele condiŃii: i) Derivatele parŃiale de ordin I ale lui S în raport cu a şi b să fie nule:
=∂∂
=∂∂
0
0
b
S
a
S
.
Acest sistem este echivalent cu
=+
=+
∑∑∑
∑∑
===
==
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
yxxbxa
yxbna
11
2
1
11 .
SoluŃia acestui sistem este
.,
1
2
1
1
11
1
1
2
1
1
1
2
1
11
∑∑
∑
∑∑
∑
∑∑
∑
∑∑
∑∑
==
=
==
=
==
=
==
==
==
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
xx
xn
yxx
yn
b
xx
xn
xyx
xy
a
ii) Matricea derivatelor parŃiale de ordinul al II-lea să fie pozitiv definită, adică determinantul matricei
∂∂
∂∂∂
∂∂∂
∂∂
=
2
22
2
2
2
b
S
ab
Sba
S
a
S
A
să fie pozitiv, ceea ce este echivalent cu condiŃia
02
11
2 >
−
∑∑==
n
i
i
n
i
i xxn .
ObservaŃie. Dacă se studiază legătura între două variabile folosind date grupate într-un tabel de corelaŃie, sistemul de mai sus devine
126
=+
=+
∑ ∑∑∑
∑∑ ∑∑
= = ==
= = ==
.1 1 1
2
1
1 1 11
k
i
k
i
p
j
ijjiii
k
i
ii
k
i
p
j
p
j
jj
k
i
iiij
nyxnxbnxa
nynxbna
X.4. Modele de regresie neliniară
Model de regresie de tip parabolic. EcuaŃia de regresie este de forma
ecxbxay +++= 2 . Pentru o estimare a parametrilor utilizând un eşantion de volum n se rezolvă sistemul:
=++
=++
=++
∑ ∑ ∑∑
∑ ∑∑∑
∑∑∑
= = ==
= ===
===
n
i
n
i
i
n
i
iii
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
yxxcxbxa
yxxcxbxa
yxcxbna
1 1 1
243
1
2
1 1
3
1
2
1
11
2
1
.
Model de regresie de tip hiperbolic. EcuaŃia de regresie este de forma
ex
bay ++= .
Pentru o estimare a parametrilor utilizând un eşantion de volum n se rezolvă următorul sistem:
=+
=+
∑ ∑ ∑
∑ ∑
= = =
= =
n
i
n
i
n
i i
i
ii
n
i
n
i
i
i
x
y
xb
xa
yx
ban
1 1 12
1 1
11
1
.
Model de regresie de tip exponenŃial. EcuaŃia de regresie este de forma
xbay ⋅= . Pentru orice eşantion, ecuaŃia se poate liniariza prin logaritmare:
bxay lnlnln += .
127
Estimarea parametrilor se face rezolvând următorul sistem:
=+
=+
∑∑∑
∑∑
===
==
.lnlnln
lnlnln
11
2
1
11
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
i
yxxbxa
yxban
X.5. Măsurarea intensităŃii legăturii dintre variabile
Pentru a măsura cât de puternică este legătura dintre variabile se utilizează diferiŃi indicatori.
CovarianŃa. Presupunem că avem o populaŃie statistică de volum N şi două
caracteristici X şi Y cu valorile ( )Niix ,1= şi, respectiv ( )
Niiy ,1= şi valorile
medii x şi respectiv y . CovarianŃa este un indicator care indică direcŃia legăturii dintre cele
două variabile X şi Y, dar nu şi intensitatea ei. Se defineşte prin expresia
( )( )( )
N
yyxx
YXCovi
N
i
i −−=∑=1, .
• dacă ( ) 0, >YXCov , atunci există legătură directă între variabile;
• dacă ( ) 0, <YXCov , atunci există legătură inversă între variabile;
• dacă ( ) 0, =YXCov , atunci nu există legătură între variabile.
Coeficientul de corelaŃie. Presupunem că avem o populaŃie statistică de volum N şi două
caracteristici X şi Y cu valorile ( )Niix ,1= şi, respectiv ( )
Niiy ,1= , valorile
medii x şi respectiv y şi abaterile medii pătratice Xσ şi respectiv Yσ . Coeficientul de corelaŃie se defineşte prin următorul raport:
( ) ( ) ( )( )
( ) ( )∑∑
∑
==
=
−−
−−==
N
i
i
N
i
i
i
N
i
i
YXyyxx
yyxxYXCov
YX
1
2
1
2
1,,
σσρ .
128
Acest coeficient ia valori în intervalul [ ]1,1− , semnul său indică direcŃia legăturii, iar valoarea lui indică intensitatea acestei legături.
• dacă ( ) 0, >YXρ , există legătură directă între variabile;
• dacă ( ) 0, <YXρ , există legătură inversă între variabile;
• dacă ( ) 0, =YXρ , nu există legătură între variabile;
• dacă ( ) 1, ±≅YXρ , atunci legătura dintre variabile este una puternică;
• dacă ( ) 0, ≅YXρ , atunci legătura dintre variabile este foarte slabă.
O formulă simplificată pentru coeficientul de corelaŃie este următoarea:
( )
−
−
−=
∑∑∑∑
∑ ∑∑
====
= ==
2
11
22
11
2
1 11,N
i
i
N
i
i
N
i
i
N
i
i
N
i
N
i
ii
N
i
ii
yynxxn
yxyxn
YXρ .
Coeficientul de asociere Se foloseşte pentru măsurarea intensităŃii legăturii statistice dintre două caracteristici nenumerice alternative. Datele necesare calculului se grupează într-un tabel de asociere:
1y 2y
1x 11n 12n
2x 21n 22n De exemplu, dacă studiem asocierea dintre înălŃimea şi
greutatea unui grup de persoane, în cazul unei corelaŃii perfect pozitive, toate persoanele înalte trebuie să aibă greutate mare, iar cele scunde, greutate mică. In acest caz, frecvenŃele vor fi predominante în valorile 11n şi 22n .
In cazul unei corelaŃii negative, toate persoanele înalte au greutate mică, iar cele scunde , greutate mare. Acum frecvenŃele se vor concentra în 12n şi 21n .
In cazul lipsei de corelaŃie între variabile, frecvenŃele se distribuie uniform în tabel.
Măsurarea gradului de asociere dintre două variabile se face cu ajutorul coeficientului de asociere al lui Yule:
21122211
21122211
nnnn
nnnnCas +
−= .
129
Acesta este un coeficient adimensional, cu valori în intervalul [ ]1,1− . Cu cât valoarea sa este mai aproape de 1, cu atât asocierea dintre variabile este mai puternică.
Autoevaluare prin aplicaŃii
1. Un grup de oameni este intrebat care sunt tarile de provenienta ale masinilor utilizate. In tabelul frecventelor se cere sa se completeze coloanele libere.
tara Frecvent
a absoluta
Frecventa relativa
Frecvente absolute cumulate crescator
Frecvente absolute cumulate descrescator
Frecvente relative cumulate crescator
Frecvent relative cumulate descrescator
Romania 6 SUA 2 Japonia 3 Germania
5
Italia 4 Total
2. Adancimea lacului Bicaz a fost masurata in puncte diferite (in metri)
si rezultatele sunt urmatoarele: 15,4 16,7 16,9 17,0 20,2 25,3 28,8 29,1 30,4 34,5 36,7 39,1 39,4 39,6 39,8 40,1 42,3 43,5 45,6 45,9 48,3 48,5 48,7 49,0 49,1 49,3 49,5 50,1 50,2 52,3 Intocmiti un tabel al frecventelor.
3. La teza la matematica elevii dintr-o clasa au obtinut notele: 7, 4, 5, 5, 6, 8, 6, 5, 7, 9, 3, 4, 5, 6, 6, 5, 4, 5, 5, 7, 8, 6, 8, 6, 7, 7, 6, 10, 9, 6
a. Prezentati situatia notelor printr-o serie statistica; b. Completati tabelul frecventelor c. Trasati diagrama cu bastonase corespunzatoare seriei d. Se repartizeaza notele in urmatoarele clase: 3-4; 5-6; 7-8; 9-10.
Precizati noua serie statistica ce se formeaza si trasati-i diagrama prin coloane.
4. Se considera urmatoarea serie statistica reprezentand repartitia a 200
de familii dupa numarul de copii
130
Numar de copii Frecventa 0 65 1 60 2 29 3 32 4 8 5 6
a. Completati tabelul frecventelor b. Construiti diagrama seriei
5. 80 de mijloace de transport au fost distribuite dupa distantele parcurse
intr-o perioada de timp astfel
Distanta (in Km) Numar de mijloace [85,90) 3 [90,95) 15 [95,100) 20 [100,105) 23 [105,110) 14 [110,115) 5
a) Reprezentati histograma seriei statistice b) Construiti poligonul de frecvente al seriei.
6. Din cei 200 de absolventi ai unui liceu, 50 candideaza la ASE, 30 la
Facultatea de Drept, 20 la Politehnica, 10 la Facultatea de Medicina, 40 la scoli postliceale, iar restul doresc sa se angajeze.
a. Construiti tabelul frecventelor b. Reprezentati repartitia absolventilor printr-o diagrama circulara. 7. Echipa Steaua a avut pe teren la ultimul meci 11 jucatori cu
urmatoarele varste: Varsta 18 20 21 22 25 27 33 35 Nr. fotbalisti
1 3 1 1 2 1 1 1
Care a fost media de varsta a echipei Steaua in acest meci? 8. Pretul benzinei intre 1989 si 1997 a evoluat astfel:
Anul 1989 1990 1991 1992 1993 1994 1995 1996 1997 Pretul (lei)
15 25 30 30 330 450 1000 1500 2900
Care este indicele mediu de crestere a pretului?
131
9. Doua grupe de studenti, cu efective de 25 si respectiv 32 de persoane, au susŃinut un test de cultura generala. Prima grupa a obtinut media 7,8, iar a doua 8,4. Sa se gaseasca nota medie pe ansamblul celor doua grupe. 10. Se cunosc urmatoarele date
Intervale de salarii Nr. angajati 1,25-2 87 2-2,75 170 2,75-3,50 115 3,50-4,25 32 4,25-5,00 18 5,00-5,75 10 5,75-6,50 3 Total 375
Sa se calculeze salariul median si modal. 11. La o banca se analizeaza distributia debitorilor dupa situatia zilelor de intarziere a rambursarii creditelor, astfel :
Intervale de variatie a numarului de zile de intarziere a platii
Numar debitori
10-20 120 20-30 85 30-40 37 40-50 16 50-60 7 60-70 2
Sa se determine valoarea mediana. 12. In tabelul de mai jos sunt date referitoare la numarul de copii in familie in generatia actuala si numarul de copii din generatia parentala intr-un sat X:
Numar de copii Numar de familii din generatia actuala
Numar de familii din generatia parentala
1 18 6 2 66 14 3 46 34 4 21 36 5 12 30 6 22 26 7 7 15
8 6 17
132
9 2 13 10 0 5 11 0 1 12 0 1 13 0 0 14 0 0 15 0 1 16 0 1
Se cere: a. Modul, mediana si media pentru fiecare serie in parte. b. Diagrama cu coloane a fiecarei serii.
13.S-a analizat continutul de vitamina B6 in 12 loturi de biscuiti ce pretind a contine aceasta vitamina. Rezultatele obtinute in miliechivalenti pe kg sunt cuprinse in tabelul de mai jos
Continut vitamina B6 Nr. loturi 0,10 2 0,15 1 0,20 4 0,25 2 0,30 1 0,35 2
Sa se calculeze media, dispersia, abaterea medie patratica, mediana si modul. 14. Dintr-un lot de 10000 de sticle de ulei de jumatate de litru s-a masurat continutul la 100 din sticle luate la intamplare si s-au obtinut datele din tabelul de mai jos:
Clase in ml frecventa 492-493 3 493-494 3 494-495 3 495-496 2 496-497 4 497-498 6 498-499 13 499-500 17 500-501 20 501-502 9
133
502-503 5 503-504 4 504-505 3 505-506 2 506-507 2 507-508 2 508-509 2 Se cere:
a. Sa se traseze histograma seriei si poligonul frecventelor b. Sa se calculeze modul si mediana
15.Fie seria statistica
Numar piese
28 31 33 35 38 43
Numar muncitori
16 25 20 30 28 21
a. Care este media numarului de piese executate de un muncitor? b. Sa se calculeze abaterea medie patratica si coeficientul de variatie al
serie
16.La teza la matematica pe semestrul I la clasa a X-a A s-au obtinut notele:
Nota 5 6 7 8 9 10 Nr. elevi 2 5 5 5 5 2
In clasa a X-a B s-au obtinut urmatoarele note: Nota 4 5 6 7 8 9 10 Nr. elevi
1 2 4 2 7 8 0
a. Care clasa este mai buna? b. Care clasa este mai omogena ? c. Intocmiti diagramele cu coloane ale celor doua serii.
17.La proba de 100m plat a unui concurs de atletism s-au obtinut urmatoarele rezultate:
Timp realizat
11,8-12,2
12,2-12,6
12,6-13,0
13,0-13,4
13,4-13,8
13,8-14,2
14,2-14,6
14,6-15,0
Nr. concurenti
2 34 134 252 212 104 23 54
a. Reprezentati histograma seriei si poligonul frecventelor b. Determinati modul si mediana seriei c. Determinati valoarea medie a seriei , abaterea medie liniara, dipersia,
abaterea medie patratica si coeficientul de variatie.
134
18.Un controlor de trafic a urmărit lungimile cozilor la un anumit semafor. A numărat maşinile care s-au oprit şi aşteaptă la semafor pînă la apariŃia culorii verzi în 90 de perioade diferite.
Nr. maşini
0 1 2 3 4 5 6 7 8 9
Nr. perioade
3 9 12 15 15 15 11 8 2 0
CalculaŃi media şi varianŃa. 19.In tabelul următor au fost trecute distanŃele ( în km.) de la birou şi pănă la locuinŃă ale unui grup de lucrători în administraŃia unui oraş.
DistanŃa(km) [0,1) [1,2) [2,3) [3,4) [4,5) [5,6) [6,7) Nr. lucrători 5 21 24 15 20 13 2
a. CalculaŃi distanŃa medie între domiciliu şi locul de muncă. b. CalculaŃi valoarea modală şi mediana acestei serii statistice. c. ConstruiŃi histograma seriei.
20.Se măsoară diametrele a 400 de platani tineri dintr-un parc. Se obŃin următoarele rezultate :
Diametru(cm) 25 26 27 28 29 30 Procentaj 10% 15% 30% 35% 5% 5%
a. CîŃi arbori s-au găsit cu un diametru mai mare sau egal cu 27 cm ? b. Care este diametrul mediu al trunchiurilor platanilor din parc ? c. DeterminaŃi varianŃa. d. GăsiŃi valoarea modală a seriei statistice, iar apoi mediana seriei. e. RealizaŃi diagrama cu coloane, iar apoi diagrama circulară
corespunzătoare seriei statistice.
21.Intr-un magazin se comercializează 2 tipuri de pungi cu cartofi prăjiŃi provenind de la 2 firme diferite. S-au ales la întîmplare 10 pungi din fiecare tip, s-au căntărit şi s-au notat greutăŃile (în grame) : Tip I
Greutate(grame) 158 159 160 161 162 Nr. pungi 1 2 4 2 1
Tip II Greutate(grame) 157 158 159 160 161 162 163 Nr. pungi 2 1 1 1 2 2 1
a. CalculaŃi greutatea medie a unei pungi de cartofi produsă d firma I , respectiv II.
b. ComparaŃi abaterile medii pătratice corespunzătoare celor 2 serii statistice şi interpretaŃi rezultatul.
135
22..Se consideră un eşantion de 20 de clienŃi, care intră într-un magazin alimentar, pentru a cerceta frecvenŃa X cu care clienŃii fac apel la serviciile magazinului de-a lungul unei săptămâni şi respectiv pentru cercetarea cheltuielilor lunare Y în mii lei, ale clienŃilor pentru procurarea de bunuri alimentare. S-au obŃinut următoarele date de selecŃie pentru X şi respectiv Y
X: 1, 2, 1, 4, 3, 2, 5, 6, 1, 2, 3, 2, 3, 4, 6, 2, 4, 3, 1, 2; Y: 89, 90, 101, 88, 85, 77, 102, 100, 86, 97, 76, 121, 113, 110, 96, 92,
108, 112, 103, 109. Se cere:
a) distribuŃiile empirice de selecŃie pentru fiecare din caracteristicile X şi Y,
b) mediile de selecŃie, momentele centrate de selecŃie de ordinul al doilea şi dispersiile de selecŃie pentru caracteristicile X şi Y,
23. La un control de calitate se verifică diametrul pieselor prelucrate
de un strung. Pentru realizarea acestui control s-a considerat o selecŃie de 18 piese şi s-a obŃinut că diametrul X al pieselor are următoarele dimensiuni (în cm):
Diametrul (în cm)
3,98 3,99 4,00 4,01 4,02
Număr de piese 4 3 5 3 3
Să se determine: a) o estimaŃie absolut corectă pentru diametrul mediu al pieselor
realizate, b) o estimaŃie corectă şi una absolut corectă pentru dispersia
diametrelor faŃă de diametrul mediu. 3. . Fie caracteristica X, care are distribuŃia empirică de selecŃie:
X :
124242
50,4025,4000,4075,3950,3925,39.
Se cere media de selecŃie şi dispersia de selecŃie.
24. În urma unei selecŃii de volum n = 100, privind caracteristica X
s-au obŃinut următoarele date de selecŃie:
xI 10,50 10,55 10,60 10,65 10,70 10,75 10,80
fI 10 12 16 21 18 14 9
136
Se cere:
a) o estimaŃie absolut corectă pentru media teoretică m = M(X);
b) o estimaŃie corectă şi una absolut corectă pentru dispersia
teoretică .
Metoda verosimilitatii maxime 25. Pentru o selecŃie de volum n dintr-o distribuŃie exponenŃială
( )
<
≥⋅=
−
0 , 0
0 ,,
t
tetf
tλλλ
cu parametrul λ , să se găsească un estimator pentru λ . 26. Fie o selecŃie de volum n dintr-o populaŃie cu distribuŃia gamma
( ) ( )( )
<
≥−
⋅⋅⋅=
−−
0 , 0
0 ,!1
1,
1
t
tr
ettf
tr λλλλ .GăsiŃi un estimator pentru λ .
27. Presupunem că populaŃia are distribuŃia Poisson (cazul evenimentelor
rare). FuncŃia de probabilitate este !
),(x
exfxλ
λ λ−= , nx ,...,2,1,0= . Să se
estimeze parametrul λ . 28. Pe baza unei selecŃii de volum n , să se estimeze parametrii m şi σ din
repartiŃia normală : ( )( ) 2
21; ,
2
x m
f x m eσσ
σ π
− − = , Rx∈ , 0>σ .
Metoda momentelor 29..Fie variabila aleatoare cu densitatea de repartiŃie
( )( )
11, ,xx x eλρ λ
λ− −= ⋅ ⋅
Γ pentru 0,λ > 0.x > Se cere o metodă de a estima
pe λ prin selecŃii. 30. Fie o selecŃie de volum n dintr-o populaŃie cu distribuŃia gamma
( ) ( )( )
<
≥−
⋅⋅⋅=
−−
0 , 0
0 ,!1
1,
1
t
tr
ettf
tr λλλλ .
GăsiŃi un estimator pentru λ prin metoda momentelor. 31. Densitatea de probabilitate a unei variabile aleatoare X are forma:
2 , [0, ]( ; , , ) .
0, [0, ]
a bx x cf x a b c
x c
− ∈=
∉
137
Rezultatele unei selecŃii de volum 3n = dau pentru X valorile:
1 2 3 , , 1,0,1.x x x = − Să se estimeze parametrii , ,a b c prin metoda
momentelor. 32. Durata de funcŃionare a unui bec electric, până când se arde, se presupune uniform distribuită cu parametrii a şi :b
1,
( ) .0, [ , ]
a x bf x b a
x a b
≤ ≤= − ∉
Se face o selecŃie de 5 becuri şi se notează cu 1 2 3 4 5, , , ,x x x x x timpii de
funcŃionare ai acestora până când se ard. DeterminaŃi estimatori pentru a şi b prin metoda momentelor.
33.Pe baza unui sondaj efectuat aleator pe n=51 de studenti s-au inregistrat diferite caracteristici. Prelucrand datele referitoare la doua dintre aceste caracteristici s-au obtinut urmatoarele rezultate:
Culoarea ochilor deschisa inchisa
Deschis 17 6 23 Culoarea parului Inchis 9 19 28 26 25 51 Sa se determine coeficientul de asociere intre cele doua caracteristici. 34.Sa se stabileasca legatura dintre distributia populatiei pe medii si sexe in judetul Bacau la 1 iulie 2000 M F Total Urban 185 193 378 Rural 186 182 368 35.Consideram ca in conditiile cresterii intr-o anumita perioada a veniturilor cu 15%, cererea in cazul a 3 produse a inregistrat urmatoarea modificare: produsul A- o crestere cu 25%; produsul B – o crestere cu 5%; produsul C- o crestere cu 15%. Sa se determine elasticitatea cererii in functie de venit. 36.Patronul unei firme ce vinde autoturisme presupune ca relatia dintre numarul de autoturisme (Y) vandute intr-o zi si numarul de vanzatori ce
138
lucreaza in salonul de prezentare si in sectorul publicitate (X) poate fi modelata printr-o linie dreapta. Datele culese pentru 5 zile sunt: xi 6 6 4 2 3 yi 20 18 10 6 11
b. Sa se scrie ecuatia dreptei de regresie. c. Sa se determine coeficientul de corelatie. 37.Pentru a caracteriza dependenta dintre cheltuielile pentru reparatii si vechimea utilajelor unei intreprinderi s-au inregistrat cele 2 caracteristici pentru 8 utilaje de acelasi tip:
cheltuieli reparatii(mii lei)
14 13 16 15 12 17 15 17
Vechime (ani)
8 5 10 7 6 10 9 11
b. Sa se scrie ecuatia dreptei de regresie. c. Sa se determine coeficientul de corelatie.
38.Considerand datele din tabelul de mai jos sa se estimeze parametrii modelului de regresie corespunzator
Cantitate ingrasaminte (X) Productia medie de grau /ha 1 10 2 15 3 20 4 30 5 40
39.Se considera caracteristicile: II- reprezentand in provente suprafata comerciala de expunere a
marfurilor spre vanzare fata de suprafata construita Y- reprezentand volumul valoric al vanzarilor, raportat la metro Patras suprafata de prezentare a marfurilor pe luna in mii lei. Sunt cunoscute urmatoarele date de selectie:
X 10 12 15 17 26 Y 40 45 42 53 60
b. Sa se determine dreapta de regresie a lui Y fata de X c. Sa se determine coeficientul de corelatie a variabilelor X si Y. d. Cu ajutorul dreptei de regresie sa se faca prognoza volumului valoric
al vanzarilor Y cand X ia valoarea 30.
139
40. Intr.-un sezon un bun material care are pret variabil oscileaza intre 8-16 mii lei /kg si este cumparat in cantitati variate intre 0-100 kg zilnic. Cercetand cumpararile si preturile in timpul a 40 de zile, au fost obtinute urmatoarele date:
8-10 10-12 12-14 14-16 80-100 1 0 0 0 60-80 3 5 1 0 40-60 2 3 6 1 20-40 1 1 7 2 0-20 0 1 3 3 Sa se studieze corelatia si regresia
TESTE DE AUTOEVALUARE
TEST 1
1. U magazin de articole pentru femei, situat în centrul unui mare oraş, doreşte să-şi deschidă o filială într-o zonă periferică. Pentru a obŃine informaŃii despre distribuŃia geografică a clienŃilor prezenŃi, managerul magazinului organizează o anchetă în care fiecare client dintr-o zi este întrebat unde locuieşte, raportat la cele 4 cadrane ale oraşului: nord-vest(NV), nord-est (NE), sud-vest (SV), sud-est (SE). ClienŃii din afara oraşului sunt excluşi din anchetă. Rezultatul anchetei se prezintă astfel: Clientul
zona
Clientul
zona
clientul
zona
clientul
zona
clientul
zona
1 NV 7 NE 13 SV 19 NV 25 SV 2 SE 8 SV 14 NV 20 SV 26 NV 3 SE 9 NV 15 SV 21 NE 27 NV 4 SV 10 SE 16 NE 22 NV 28 SE 5 NV 11 NV 17 NE 23 SV 29 E 6 NV 12 SE 18 NV 24 SE 30 SV
a) SistematizaŃi datele disponibile. b) PrezentaŃi grafic informaŃiile sistematizate.
2. Un fabricant de roŃi industriale bănuieşte că unele comenzi profitabile sunt pierdute din cauza timpului prea mare necesar firmei pentru a stabili preŃul cerut potenŃialilor clienŃi. Pentru a investiga această siuaŃie, 40 de cereri de fixare a preŃului au fost alese aleator din totalul ultimului an şi au fost calculaŃi timpii necesari pentru fixarea preŃului. Timpii (în zile), împreună cu clasificarea comenzii în “pierdută” sau nu, sunt: C timp Co Co tim Co Co tim Co Co tim Co Co tim Co
140
omanda cu nr.
m. pierduta
manda cu nr.
p m. pierduta
manda cu nr.
p m. pierduta
manda cu nr.
p m. pierduta
manda cu nr.
p m. pierduta
1 6.4 Nu 9 3.9 Nu 17 3.9 Nu 25 4 Nu 33 7.5 Nu 2 5.7 Nu 10 6.7 Da 18 7.7 Da 26 11.
4 Da 34 6.2 Nu
3 6.6 Nu 11 3.9 Nu 19 10.2
Da 27 3.2 Nu 35 8.2 Da
4 10 Da 12 6.5 Nu 20 5.5 Nu 28 6.4 Nu 36 4.4 Nu 5 4.9 Nu 13 8.6 Nu 21 3.3 Nu 29 5.1 Nu 37 5.9 Nu 6 6.5 Nu 14 6.4 Nu 22 6 Nu 30 7.8 Da 38 9.9 Da 7 6 Nu 15 9.5 Da 23 5.9 Nu 31 4.4 Nu 39 12.
2 Da
8 4.7 Nu 16 .9 Nu 24 7.3 da 32 5.5 nu 40 9 Nu Să se sistematizeze datele prezentate şi să se reprezinte grafic distribuŃiile. 3. Nivelul de instruire pentru cei 50 de angajaŃi ai unei societăŃi comerciale este dat prin datele din următorul tabel, unde am făcut următoarele notaŃii: P=nabsolvenŃi de învăŃămănt primar, G= AbsolvenŃi de învăŃămănt gimnazial, L= absolvenŃi de învăŃămănt licea, S= absolvenŃi de învăŃămănt superior. Angajatul cu nr.
instruire
Angajatul cu nr.
instruire
Angajatul cu nr.
instruire
Angajatul cu nr.
instruire
Angajatul cu nr.
instruire
1 G 11 P 21 S 31 L 41 L 2 S 12 S 22 S 32 S 42 L 3 S 13 L 23 L 33 L 43 L 4 L 14 L 24 G 34 S 44 G 5 L 15 S 25 G 35 L 45 L 6 G 16 L 26 S 36 P 46 L 7 S 17 S 27 L 37 L 47 L 8 L 18 G 28 S 38 L 48 L 9 S 19 S 29 L 39 L 49 L 10 L 20 L 30 L 40 G 50 L
j) Să se sistematizeze datele k) Să se reprezinte grafic informaŃiile sistematizate l) Să se calculeze ponderea salariaŃilor pentru fiecare nivel de instruire
si să se reprezinte grafic rezultatele.
141
4. Venitul salarial pentru 50 de angajaŃi ai unei companii este: 62, 82, 89, 97, 114, 63, 83, 90, 98, 119, 64, 84, 90, 99, 13, 65, 84, 91, 101, 132, 69, 85, 91, 102, 133, 72, 86, 92, 104, 134, 74, 86, 93, 105, 145, 76, 87, 94, 107, 146, 77, 88, 95, 110, 164, 79, 89, 96, 113, 174. a)Să se sistematizeze datele pe 7 intervale egale de variaŃie . b) ConstruiŃi histograma şi poligonul frecvenŃelor. 5. Se dau următoarele valori: 40, 50, 10, 6, 15, 23, 39, 42, 62, 65, 1, 19, 32, 7, 24, 68, 29, 72, 74, 62, 58, 9, 23, 23, 25, 76, 22, 2, 5, 53. a) ConstruiŃi o serie de distribuŃie de frecvenŃe începănd de la valoarea 0, avănd 10 intervale de variaŃie de mărime egală. b) ) ConstruiŃi histograma şi poligonul frecvenŃelor. c) CalculaŃi frecvenŃele cumulate.
TEST 2
1. Două grupe de studenŃi, cu efective de 25 şi, respectiv, 32 de persoane, au susŃinut un test de cultură generală. Prima grupă a obŃinut media 7,8 iar a doua grupă 8,4. Să se determine nota medie pe ansamblul celor două grupe. 2.Intr-o colectivitate statistică s-au cules date privitoare la 2 variabile numerice şi s-au obŃinut rezultatele:
X: 4, 1, 1, 5, 6, 3, 2, 1 Y: 100, 90, 40, 80, 70, 5, 100, 70
Să se cerceteze după care din variabile colectivitatea este mai omogenă. 3. Care dintre următoarele colectivităŃi are cea mai mică abatere pătratică pentru variabila “inălŃime”? a) toate persoanele; b) colectivitatea bărbaŃilor; c) colectivitatea bărbaŃilor din Canada; d) colectivitatea bărbaŃilor din Canada cu varste mai mari de 30 de ani; e) colectivitatea bărbaŃilor din Canada cu varste mai mici de 30 de ani.
9. Pentru 41 de copii cunoaştem următoarea distribuŃie privind nivelurile atinse la un joc pe computer:
Nivelul FrecvenŃa A 10 B 12 C 15 D 3
142
E 1 Să se găsească nivelul median şi cel modal.
TEST 3
1. Care dintre următoarele afirmaŃii referitoare la coeficientul de omogenitate (variaŃie) nu este adevărată: a) este un indicator sintetic al împrăştierii; b) este expresia rellativă a abaterii medii pătratice; c) valori mici ale coeficientului de variaŃie semnifică un grad mare de reprezentativitate a mediei caracteristicii studiate; d) valori mici ale coeficientului de variaŃie semnifică o tendinŃă accentuată de simetrie a distribuŃiei; e) valori mici ale coeficientului de variaŃie reflectă omogenitatea colectivităŃii din punctul de vedere al caracteristicii studiate. 2. Dacă într-o serie statistică valorile individuale se simplifică de k ori , atunci dispersia noii serii este: a) de 2k ori mai mică faŃă de dispersia seriei iniŃiale; b) de k ori mai mare faŃă de dispersia seriei iniŃiale; c) egală cu dispersia seriei iniŃiale; d) de 2k ori mai mare faŃă de dispersia seriei iniŃiale; e) de k ori mai mare faŃă de dispersia seriei iniŃiale. 3. Dacă într-o serie statistică valorile individuale se micşorează cu constanta a , atunci dispersia noii serii este: a) egală cu dispersia seriei iniŃiale; b) de a ori mai mare faŃă de dispersia seriei iniŃiale; c) de a ori mai mică faŃă de dispersia seriei iniŃiale; d) mai mică decăt dispersia seriei iniŃiale cu constanta a; e) mai mare decăt dispersia seriei iniŃiale cu constanta a. 4. SalariaŃii unei firme au salariul mediu de 700 lei cu o abatere medie pătratică de 150 de lei. Patronul firmei hotărăşte să mărească fiecare salariu individual de 1,3 ori. Dispersia noilor salarii faŃă de salariul mediu va fi: a) 150; b) 22500; c) 29250; d) 253,5; e) 38025. 5. FrecvenŃa cumulată crescător a ultimei grupe este întotdeauna egală cu: a) numărul de unităŃi din colectivitatea statistică; b) numărul de unităŃi din ultima grupă; c) frecvenŃa absolută cumulată descrescător a ultimei grupe;
143
d) frecvenŃa absolută a ultimei grupe plus volumul volectivităŃii. 6. Media aritmetică a unei variabile aleatoare reprezintă: a) momentul simplu de ordinul I; b) momentul centrat de ordinul I; c) momentul simplu de ordinul II; d) momentul centrat de ordinul II; e) momentul simplu de ordinul II minus momentul simplu de ordinul I la pătrat. 7. Coeficientul lui Pearson se utilizează pentru analiza statistică a a) asimetriei; b) variaŃiei; c) boltirii; d) tendinŃei centrale; e) indicatorilor medii de poziŃie.
TEST 4
1. Intr-un proces de verificare a ipotezelor statistice, nivelul de încredere reprezintă probabilitatea: a) α ; b) α−1 ; c) β ; d) β−1 ; e) βα + . 2. Intr-un proces de testare a ipotezelor statistice, eroarea de genul al doilea este: a)eroarea pe care o facem acceptănd ipoteza nulă cănd ea este adevărată; b) eroarea pe care o facem acceptănd ipoteza alternativă cănd ea este falsă; c) eroarea pe care o facem acceptănd ipoteza nulă cănd ea este falsă; d) eroarea pe care o facem eliminănd ipoteza nulă cănd ea este adevărată; e) eroarea pe care o facem eliminănd ipoteza alternativă atunci cănd ea este falsă. 3. Intr-un proces de testare a ipotezelor statistice, eroarea de genul al doilea este: a)eroarea pe care o facem acceptănd ipoteza nulă cănd ea este adevărată; b) eroarea pe care o facem acceptănd ipoteza alternativă cănd ea este adevărată; c) eroarea pe care o facem acceptănd ipoteza nulă cănd ea este falsă; d) eroarea pe care o facem eliminănd ipoteza nulă cănd ea este adevărată;
144
e) eroarea pe care o facem eliminănd ipoteza alternativă atunci cănd ea este adevărată.. 4. Dacă notăm maxx valoarea maximă dintr-un eşantion, care dintre următorii
termeni este corect pentru a descrie maxx ?
a) valoare aşteptată; b) mediană; c) estimator; d) parametru; e) abatere medie pătratică. 5. Datele sistematizate, obŃinute în urma unui studiu statistic privind vechimea în muncă şi timpul zilnic nelucrat, efectuat de 800 de salariaŃi ai unei societăŃi comerciale sunt:
Timp nelucrat Vechimea Sub 60 min. Peste 60 min
Peste 10 ani 300 150 Sub 10 ani 100 250
Să se precizeze dacă între cele două variabile există o legătură. 6. In utilizarea tabelului de corelaŃie pentru analiza legăturilor dintre fenomene, dacă frecvenŃele sunt aproximativ egal repartizate în interiorul tabelului, atunci: a) legătura este neliniară; b) legătura este liniară directă; c) legătura este inversă; d) legătura este directă; e) legătura este slabă sau nu există legătură între variabile. 7. In utilizarea metodei regresiei pentru studiul dependenŃei dintre variabile,
modelul de forma ebx
ay ++=1
este un model:
a) liniar; b) exponenŃial; c) logaritmic; d) hiperbolic; e) parabolic. 8. Să se precizeze care dintre următoarele metode de caracterizare a legăturilor dintre variabilele statistice nu se încadrează în categoria “metodelor simple”: a) metoda seriilor interdependente; b) metoda grafică;
145
c) metoda corelaŃiei; d) metoda tabelului de corelaŃie; e) metoda grupărilor. 9. Pentru cele două variabile statistice între care există o dependenŃă liniară s-a înregistrat o mulŃime de date; statistice. In urma prelucrării acestora s-au obŃinut indicatorii:
96811
1
=∑=i
iy ; 91,18311
1
=∑=i
ix ; 6,9629911
1
2 =∑=i
iy ; 8,409911
1
2 =∑=i
ix ,
9,1948511
1
=∑=i
ii yx .
GăsiŃi ecuaŃia dreptei de regresie. 10. Pentru caracterizarea unei grupe de studenŃi din anul I al FacultăŃii de ŞtiinŃe, în funcŃie de media la admitere, unitatea statistică de observare este: a) grupa; b) studentul; c) media la admitere; d) facultatea; e) anul de studiu. 11. IdentificaŃi care dintre următoarele date nu sunt variabile statistice pentru studiul colectivităŃii studenŃilor de la Facultatea de ŞtiinŃe: a) grupa; b) media la admitere; c) facultatea; d) vărsta; e) înălŃimea. 12. Obiectivul fundamental al statisticii este: a) să demonstreze formule şi teoreme matematice; b) să rezume şi să analizeze un set de date statistice; c) să extragă eşantioane din colectivităŃi statistice; d) să detecteze valorile aberante dintr-un set de date; e) să explice diferenŃele dintre seturile de date. 13. Care dintre următoarele variante reprezintă un eşantion şi nu o colectivitate totală pentru încasările zilnice, din anul trecut, ae unui magazin? a) Lista încasărilor zilnice din anul trecut; b) lista încasărilor zilnice cu 2 ani în urmă; c) lista încasărilor din fiecare zi de sămbătă a anului trecut; d) Totalul încasărilor săptămănale din anul trecut; e) lista încasărilor zilnice previzionate pentru anul trecut.
146
14. Statistica oferă posibilitatea unei firme: a) să estimeze vănzările din luna viitoare pe baza datelor privitoare la vănzările ultimelor 12 luni; b) să estimeze vănzările din viitorii 2 ani pe baza datelor privitoare la vănzările ultimelor 12 luni; c) să estimeze vănzările formelor concurente, pe baza datelor referitoare la vănzările proprii; d) să estimeze toate variantele de mai sus; e) să nu estimeze nici una din variantele de mai sus.
147
BIBLIOGRAFIE
[1] Craiu, M. – Statistică matematică- teorie şi probleme, Editura MatrixRom, Bucureşti, 2002. [2] Isaic-Maniu, A., MitruŃ, C., Voineagu, V. – Statistică, Editura Universitară, Bucureşti, 2004 [3] Radomir, I., Ovesea, H. – Matematici speciale, editura Albastră, Cluj 2001. [4] Reischer, C., Sâmboan, A. – Culegere de probleme de teoria
probabilităŃilor şi statistică matematică, Editura Didactică şi Pedagogică, Bucureşti, 1972. [5] Sebe, G.I. – AplicaŃii ale probabilităŃilor în tehnică şi alte ştiinŃe, Editura MatrixRom, Bucureşti, 2002. [6] Tutubalin, V.N. – Teoria probabilităŃilor, Editura MatrixRom, Bucureşti, 2012.