147
1 ROMÂNIA MINISTERUL EDUCAłIEI NAłIOANALE UNIVERSITATEA Vasile Alecsandri din BACĂU FACULTATEA DE ŞTIINłE Str. Calea Mărăşeşti, nr. 157, Bacău, 600115 Tel. +40 234542411, tel./ fax +40 234571012 www.ub.ro ; e-mail: [email protected] FACULTATEA DE ŞTIINłE INFORMATICĂ INVĂłĂMÂNT CU FRECVENłĂ REDUSĂ PROBABILITΑłI ŞI STATISTICA AUTOR: Lect. Univ. Dr. LUNGU OTILIA Curs pentru studenŃii anului II

Ifr Curs Probabilitati1-1

Embed Size (px)

DESCRIPTION

COURS OF STATISTICS

Citation preview

1

ROMÂNIA

MINISTERUL EDUCAłIEI NAłIOANALE

UNIVERSITATEA Vasile Alecsandri din BACĂU FACULTATEA DE ŞTIINłE

Str. Calea Mărăşeşti, nr. 157, Bacău, 600115 Tel. +40 234542411, tel./ fax +40 234571012

www.ub.ro; e-mail: [email protected]

FACULTATEA DE ŞTIINłE

INFORMATICĂ

INVĂłĂMÂNT CU FRECVENłĂ REDUSĂ

PROBABILITΑΑΑΑłI ŞI STATISTICA

AUTOR: Lect. Univ. Dr. LUNGU OTILIA

Curs pentru studenŃii anului II

2

OBIECTIVELE DISCIPLINEI

1. Explicarea si interpretarea corectă a conceptelor matematice, folosind limbajul specific teoriei probabilitaŃilor şi statisticii matematice. 2. Aplicarea corectă a metodelor şi principiilor de bază în rezolvarea problemelor de probabilităŃi şi statistica matematică. 3. Recunoaşterea principalelor clase/tipuri de probleme matematice şi selectarea metodelor şi a tehnicilor adecvate pentru rezolvarea lor 4. Identificarea noŃiunilor de bază utilizate in descrierea unor fenomene si procese. Interpretarea rezultatelor prelucrării datelor . Evaluarea critică a rezultatelor implementării modelului, compararea cu diferite abordări alternative

COMPETENłE ASIGURATE PRIN PARCURGEREA DISCIPLINEI (grila 2 rncis, fisa

disciplinei)

C3. Utilizarea instrumentelor informatice in context interdisciplinar C4. Utilizarea bazelor teoretice ale informaticii si a modelelor formale

FOND DE TIMP ALOCAT, FORME DE ACTIVITATE, FORME DE VERIFICARE,

CREDITE (fişa disciplinei)

Forma de activitate Număr ore semestru

Număr credite

Lucrări practice/seminar 28 Studiu individual 41 Verificare finală Examen 5

3

STABILIREA NOTEI FINALE (fişa disciplinei)

Forma de verificare (Examen, Colocviu, Verificare pe parcurs)

Examen

Modalitatea de susŃinere (Scris şi Oral, Oral, Test grilă, etc.)

Scris Puncte sau procentaj

Răspunsurile la examen/colocviu/lucrari practice 5(50%) Activitati aplicative atestate /laborator/lucrări practice/proiect etc

...(.. %)

Teste pe parcursul semestrului ...(.. %) Teme de control 5(50%) N

OTARE

TOTAL PUNCTE SAU PROCENTE 10 (100%)

TIMP MEDIU NECESAR PENTRU ASIMILAREA FIECĂRUI MODUL

Timp mediu necesar Nr.

Crt. Denumire modul/tema (obligatoriu,

un modul/tema are 2-3 ore) SI LP Total 1 Obiectul de studiu al Teoriei

Probabilitatilor si Statisticii Matematice

5 3 8

2 Scheme clasice de probabilitate 5 3 8

3 Variabile aleatoare 5 3 8

4 Repartitii clasice 5 4 9

5 Elemente de statistica descriptiva 5 4 9

6 Teoria selectiei 6 4 10

7 Teoria estimatiei 5 4 9

8 Verificarea ipotezelor statistice 5 3 8

Timp total necesar 41 28 69

4

CUPRINS MODULUL I

ELEMENTE DE TEORIA PROBABILITĂłILOR

Unitatea de studiu I. Câmp de evenimente…………………………………………….

7

I.1. ExperienŃe aleatoare. Evenimente………………………………………….

7

I.2. RelaŃii între evenimente……………………………………………………

8

I.3. OperaŃii cu evenimente…………………………………………………….

8

I.4. Câmp de evenimente……………………………………………………….

9

Unitatea de studiu II. Câmp de probabilitate…………………………………………..

11

II.1. DefiniŃia clasică a probabilităŃii……………………………………………

11

II.2. DefiniŃia axiomatică a probabilităŃii……………………………………….

11

II.3. Sistem complet de evenimente……………………………………………

12

II.4. Evenimente independente…………………………………………………

12

II.5. ProbabilităŃi condiŃionate…………………………………………………

13

II.6. Scheme clasice de probabilitate………………………………………….

15

Unitatea de studiu III. Variabile aleatoare…………………………………………….

21

III.1. DefiniŃia variabilelor aleatoare………………………………………….

21

III.2. FuncŃia de repartiŃie………………………………………………………

22

III.3. Densitatea de repartiŃie…………………………………………………..

24

III.4. OperaŃii cu variabile aleatoare……………………………………………

25

III.5. Caracteristici numerice ale variabilelor aleatoare discrete……………….

27

III.6. Caracteristici numerice ale variabilelor aleatoare continue………………

33

Unitatea de studiu IV. RepartiŃii clasice……………………………………………….

39

IV.1. RepartiŃii 39

5

discrete………………………………………………………… IV.2. RepartiŃii continue………………………………………………………..

44

Unitatea de studiu V. Legi ale numerelor mari………………………………………..

52

V.1. Tipuri de convergenŃe pentru şiruri de variabile aleatoare……………….

52

V.2. InegalităŃi pentru variabile aleatoare……………………………………..

54

V.3. Legi ale numerelor mari…………………………………………………..

54

Autoevaluare prin aplicaŃii 58 Teste de autoevaluare 69

MODULUL II ELEMENTE DE STATISTICĂ MATEMATICĂ

Unitatea de studiu VI. Elemente de statistică descriptivă…………………………….

72

VI.1. Obiectul statisticii……………………………………………………….

72

VI.2. Limbajul statisticii……………………………………………………….

73

VI.3. Serii statistice…………………………………………………………….

74

VI.4. Indicatori sintetici ai seriilor statistice……………………………………

75

Unitatea de studiu VII. Elemente de teoria selecŃiei…………………………………..

88

VII.1. NoŃiunea de selecŃie. Momente de selecŃie………………………………

88

VII.2. Estimarea mediei teoretice. Media e selecŃie…………………………….

89

VII.3. Estimarea dispersiei teoretice. Dispersia de selecŃie…………………….

91

VII.4. Metode de efectuare a unui sondaj………………………………………

93

Unitatea de studiu VIII. Elemente de teoria estimaŃiei………………………………..

96

VIII.1. NoŃiuni generale………………………………………………………..

96

VIII.2. Metoda verosimilităŃii maxime………………………………………

99

VIII.3. Metoda momentelor……………………………………………………

101

VIII.4. Metoda intervalelor de 103

6

încredere………………………………………. Unitatea de studiu IX. Verificarea ipotezelor statistice……………………………….

107

IX.1. NoŃiuni generale………………………………………………………….

107

IX.2. TestulZ………………………………………………………………….

109

IX.3. TestulT………………………………………………………………….

111

IX.4. Teste pentru compararea a douămedii…………………………………..

113

IX.5. Testul 2χ ………………………………………………………………..

116

IX.6.TestulF…………………………………………………………………..

117

IX.7.Testul de concordanŃă 2χ ……………………………………………….

119

IX.8. Testul de concordanŃă Kolmogorov………………………………………

121

Unitatea de studiu X. Regresie şi corelaŃie…………………………………………….

122

X.1. NoŃiuni generale…………………………………………………………..

122

X.2. Metode elementare de caracterizare a legăturii dintre variabile………….

122

X.3. Modelul liniar de regresie…………………………………………………

124

X.4. Modele neliniare de regresie………………………………………………

126

X.5. Măsurarea intensităŃii legăturii dintre variabile…………………………...

127

Autoevaluare prin aplicaŃii 129 Teste de autoevaluare 139 BIBLIOGRAFIE 147

7

MODULUL I

ELEMENTE DE TEORIA PROBABILITĂłILOR

UNITATEA DE STUDIU I

CÂMP DE EVENIMENTE

I.1 ExperienŃă aleatoare. Eveniment

În activităŃile economice, sociale, ştiinŃifice ş.a. sunt întâlnite fenomene a căror producere şi desfăşurare poate fi prevăzută cu precizie. Există însă şi fenomene a căror producere şi ale căror rezultate sunt greu de anticipat deoarece sunt condiŃionate de foarte mulŃi factori necontrolabili. Astfel de fenomene se numesc fenomene aleatoare.( exp.: starea vremii, extragerea a 6 numere la loto, apariŃia unei anumite feŃe la aruncarea unui zar)

ŞtiinŃa care modelează şi studiază fenomenele aleatoare este teoria probabilităŃilor.

DefiniŃia I.1.1. O experienŃă aleatoare este o activitate ale cărei

rezultate nu pot fi anticipate cu certitudine. Fiecare repetare a unei experienŃe aleatoare se numeşte probă.

O experienŃă aleatoare se caracterizează prin 3 elemente:

i) toate rezultatele posibile sunt cunoscute dinainte; ii) rezultatul unei singure probe nu poate fi cunoscut decât după realizarea probei; iii) experienŃa poate fi repetată în condiŃii identice.

8

DefiniŃia I.1.2. MulŃimea rezultatelor posibile ale unei experienŃe aleatoare se numeşte mulŃimea cazurilor posibile. DefiniŃia I.1.3. Se numeşte eveniment aleator (sau, pe scurt, eveniment) orice situaŃie care se poate realiza prin una sau mai multe probe. Notăm evenimentele aleatoare prin A, B, C,…. . Evenimentele care se realizează printr-o singură probă se numesc evenimente elementare, iar celelalte, evenimente compuse. DefiniŃia I.1.4. Evenimentul care nu se realizează în nici o probă a experienŃei se numeşte eveniment imposibil şi se notează cu φ .

DefiniŃia I.1.5. Evenimentul care se realizează cu certitudine în orice probă se numeşte eveniment sigur. DefiniŃia I.1.6. Numim eveniment contrar evenimentului A, acel

eveniment notat prin A care se realizează atunci şi numai atunci când nu se realizează A.

SubmulŃimile de probe ataşate evenimentelor A şi A sunt complementare faŃă de mulŃimea tuturor probelor experienŃei. Teoria probabilităŃilor este cea care modelează fenomenele aleatoare. Una dintre cele mai utilizate modelări este cea a lui Kolmogorov care are la bază teoria mulŃimilor.

I.2. RelaŃii între evenimente EchivalenŃa evenimentelor.

DefiniŃia I.2.1 Numim evenimente echivalente acele evenimente care se realizează simultan .

MulŃimile de probe ce corespund evenimentelor echivalente sunt mulŃimi egale.

Notăm: A=B.

ImplicaŃia evenimentelor. DefiniŃia I.2.2. Spunem că evenimentul A implică evenimentul B dacă realizarea evenimentului A atrage realizarea evenimentului B.

9

Orice probă care realizează evenimentul A realizează şi evenimentul B, prin urmare mulŃimea de probe ataşată evenimentului A este inclusă în mulŃimea de probe ataşată evenimentului B Notăm: BA ⊂ .

I.3. OperaŃii cu evenimente

DefiniŃia I.3.1. Numim reuniunea evenimentelor A şi B evenimentul notat BA∪ care constă în realizarea a cel puŃin unuia din evenimentele A sau B.

ObservaŃie. Următoarele relaŃii au loc:

Ω=Ω∪=Ο/∪∪=∪∪⊂=∪ AA, AA,BB AB,A AA,AA ,

( ) ( ) CBA ∪∪=∪∪ CBA .

DefiniŃia I.3.2. Numim intersecŃia evenimentelor A şi B evenimentul notat BA∩ care constă în realizarea simultană a celor două evenimente.

ObservaŃie. Următoarele relaŃii au loc:

A=Ω∩Ο/=Ο/∩∩=∩⊂∩=∩ A, AA,BB AA,B AA,AA ,

( ) ( ) CBA ∩∩=∩∩ CBA .

DefiniŃia I.3.3. Numim diferenŃa evenimentelor A şi B evenimentul notat BA − care se realizează atunci când se realizează A şi nu se realizează B.

DefiniŃia I.3.4. Evenimentele A şi B sunt incompatibile dacă φ=∩ BA adică nu se pot realiza simultan în nici o probă. În caz contrar

evenimentele sunt compatibile.

I.4.Câmp de evenimente

DefiniŃia I.4.1. Se numeşte algebră Boole o mulŃime nevidă ℑ

înzestrată cu operaŃiile ∪ (reuniune), ∩ (intersecŃie), (complementară) care verifică următoarele proprietăŃi:

1. Comutativitatea: ABBA

ABBA

∩=∩

∪=∪, ℑ∈∀ B,A .

10

2. Asociativitatea: ( ) ( )( ) ( )CBACBA

CBACBA

∩∩=∩∩

∪∪=∪∪, ℑ∈∀ C,B,A .

3. Distributivitatea: ( ) ( ) ( )( ) ( ) ( )CABACBA

CABACBA

∩∪∩=∪∩

∪∩∪=∩∪, ℑ∈∀ C,B,A .

4. AbsorbŃia: ( )( ) AABA

AABA

=∪∩

=∩∪, ℑ∈∀ B,A .

5. Complementareitatea: ( )( ) BBAA

BBAA

=∪∩

=∩∪, ℑ∈∀ B,A .

DefiniŃia I.4.2. O algebră Boole închisă la reuniunea unui şir de

elemente ( )NnnA ∈ din algebră ( adică ∀ ( ) ℑ⊂∈NnnA rezultă ℑ⊂

∈UNn

nA )

se numeşte σ - algebră Boole. DefiniŃia I.4.3. Fie o mulŃime nevidă E oarecare şi ( )EP mulŃimea

părŃilor sale. Fie ( )EPK ⊂ . K se numeşte corp de părŃi (corp de evenimente) dacă este închisă la reuniune şi complementară, adică : i) KBAKB,A ∈∪⇒∈∀ ;

ii) KAKA ∈⇒∈∀ . DefiniŃia I.4.4. O familie ( )EPK ⊂ se numeşte σ - corp de părŃi (corp borelian) dacă este închisă la complementară şi la reuniunea oricărui şir de elemente din K, adică:

i) KAKA ∈⇒∈∀ ; ii) ( ) KAKA

Nn

nNnn ⊂⇒⊂∀∈

∈ U .

DefiniŃia I.4.5. Se numeşte câmp de evenimente o mulŃime E înzestrată cu un corp de evenimente K şi notat ( )K,E . Când K este corp

borelian de evenimente, ( )K,E se numeşte câmp borelian de evenimente.

11

UNITATEA DE STUDIU II

CÂMP DE PROBABILITATE

II.1. DefiniŃia clasică a probabilităŃii Considerăm o experienŃă cu n probe egal posibile şi fie A un eveniment oarecare ataşat experienŃei care se poate realiza în m probe, nm ≤ . DefiniŃia II.1.1 Numim probabilitatea evenimentului A, numărul

( )n

mAP = ,

adică raportul dintre numărul cazurilor favorabile realizării lui A şi numărul cazurilor egal posibile. Algoritm pentru a calcula probabilitatea unui eveniment oarecare A:

1. Se determină numărul de cazuri favorabile m, adică numărul de elemente din mulŃimea de probe ce se ataşează evenimentului A.

2. Se determină numărul de cazuri posibile n, adică numărul de elemente din mulŃimea totală de probe ce se ataşează evenimentului sigur.

3. Se calculează probabilitatea ( )AP ca fiind raportul acestor două

numere: n

m.

II.2. DefiniŃia axiomatică a probabilităŃii

Această definiŃie a fost dată în anul 1929 de matematicianul rus N. A. Kolmogorov . DefiniŃia II.2.1. Fie E o mulŃime de evenimente ce reprezintă rezultate posibile ale unei experienŃe aleatoare şi ( )K,E un câmp de evenimente. Se numeşte probabilitate o aplicaŃie RK:P → care satisface următoarele axiome: 1. ( ) 10 ≤≤ AP , KA∈∀ .

2. ( ) 1=EP .

12

3. ( )∑∈∈

=

Ii

i

Ii

i APAP U , pentru orice familie cel mult numărabilă IiAi ∈

de evenimente din K, având proprietatea că sunt disjuncte în ansamblul lor, adică ji,AA ji ≠∀=∩ φ .

Tripletul ( )P,K,E se numeşte câmp de probabilitate. ProprietăŃi: 1. ( ) 0=φP .

2. ( ) ( )APAP −= 1 , KA∈∀ .

3. Dacă BA ⊂ , atunci ( ) ( )BPAP ≤ , KB,A ∈∀ .(monotonia)

4. Dacă BA ⊂ , atunci ( ) ( ) ( )APBPABP −=− , KB,A ∈∀ .

5. ( ) ( ) ( )BAPAPBAP ∩−=− , KB,A ∈∀ .

6. ( ) ( ) ( ) ( )BAPBPAPBAP ∩−+=∪ , KB,A ∈∀ .(aditivitate tare)

7. ( )∑∈∈

Ii

i

Ii

i APAP U , pentru orice familie finită IiAi ∈ de

evenimente.(finit-subaditivitate) 8. Formula lui Poincaré

( ) ( ) ( ) ( )

( ) ( )nn

sji

sji

n

j ji

jijn

A...AAP....

AAAPAAPAPA...AAP

∩∩∩−+

−∩∩+∩−=∪∪∪

<<= <∑∑∑∑ ∑∑

211

121

1

II.3. Sistem complet de evenimente

DefiniŃia II.3.1. Un sistem complet de evenimente este o mulŃime de

evenimente n,k,Ak 1= care satisfac următoarele condiŃii:

1. n,k,Ak 1=∀≠ φ .

2. n,k,j,kjAA jk 1=≠∀=∩ φ .

3. EAn

k

k ==U1

.

Dacă evenimentele n,k,Ak 1= formează un sistem complet de evenimente,

atunci

13

( ) 11

==

=

EPAPn

k

kU

II.4. Evenimente independente Două evenimente A şi B sunt independente dacă ele nu se influenŃează , adică realizarea evenimentului A nu depinde de realizarea lui B şi reciproc. DefiniŃia II.4.1. Două evenimente 1A , KA ∈2 sunt independente dacă

( ) ( ) ( )2121 APAPAAP ⋅=∩ .

DefiniŃia II.4 2. Trei evenimente KA,A,A ∈321 sunt independente dacă

( ) ( ) ( )2121 APAPAAP ⋅=∩ , ( ) ( ) ( )3131 APAPAAP ⋅=∩ ,

( ) ( ) ( )3232 APAPAAP ⋅=∩

şi ( ) ( ) ( ) ( )321321 APAPAPAAAP ⋅⋅=∩∩ .

DefiniŃia II.4.3. Spunem că evenimentele KA,...,A,A,A k ∈321 sunt

independente în totalitate dacă sunt independente “două câte două” ( adică ( ) ( ) ( ) ji,APAPAAP jiji ≠∀⋅=∩ ),

“trei câte trei”( adică ( ) ( ) ( ) ( ) sji,APAPAPAAAP sjisji ≠≠∀⋅⋅=∩∩ )

,…şi “toate k”( adică ( ) ( ) ( ) ( )kk AP...APAPA...AAP ⋅⋅⋅=∩∩∩ 2121 ).

ObservaŃie. Dacă evenimentele sunt independente două câte două nu

rezultă că sunt independente în totalitate. Dacă evenimentele sunt independente în totalitate, atunci sunt

independente si “s câte s”.

Proprietate. Dacă evenimentele n,k,Ak 1= sunt independente în

totalitate, stunci

( ) ( )( )∏∏=====

−−=−=

−=

−=

n

k

k

n

k

k

n

k

k

n

k

k

n

k

k APAPAPAPAP

11111

11111 IUU

. PropoziŃia II.4.4. Au loc următoarele afirmaŃii:

14

1) Dacă KA∈ astfel încât ( ) 0=AP , sau ( ) 1=AP , atunci, KB∈∀ avem că A şi B sunt independente.

2) Dacă KB,A ⊂ sunt evenimente in dependente, atunci şi perechile

( ) ( ) ( )B,A,B,A,B,A sunt independente.

II.5. ProbabilităŃi condiŃionate Atunci când evenimentele nu sunt independente spunem că sunt dependente. DefiniŃia II.5.1. Fie ( )P,K,E un câmp de probabilitate şi KB∈ un

eveniment pentru care ( ) 0>BP . Numim probabilitatea evenimentului A

condiŃionată de evenimentul B raportul ( ) ( )( )BP

BAPAPB

∩= .

Dacă KA∈ este un eveniment pentru care ( ) 0>AP putem defini probabilitatea evenimentului B condiŃionată de evenimentul A prin

( ) ( )( )AP

BAPBPA

∩= .

Din aceste două rapoarte obŃinem formula care leagă probabilităŃile evenimentelor reciproc condiŃionate:

( ) ( ) ( ) ( )APBPBPAP BA ⋅=⋅ .

ObservaŃie. Dacă A şi B sunt două evenimente independente, atunci ( ) ( )APAPB = şi ( ) ( )BPBPA = .

Formula de înmulŃire a probabilităŃilor( Probabilitatea intersecŃiei de evenimente)

Probabilitatea intersecŃiei a două evenimente este egală cu produsul dintre probabilitatea primului eveniment şi probabilitatea condiŃionată a celui de-al doilea de către primul:

( ) ( ) ( )APAPBAP B⋅=∩ , KB,A ∈∀ .

Generalizând, dacă KA,...,A,A n ∈21 , atunci

( ) ( ) ( ) ( ) ( )nA...AAAAAn AP...APAPAPA...AAPn 121211 32121 −∩∩∩∩ ⋅⋅⋅⋅=∩∩∩

.

Dacă evenimentele n,kA ,k 1= sunt independente, atunci relaŃia de mai sus

se reduce la ( ) ( ) ( ) ( ) ( )nn AP...APAPAPA...AAP ⋅⋅⋅⋅=∩∩∩ 32121

15

Formula de adunare a probabilităŃilor Fie KA,...,A,A n ∈21 şi KB∈ cu ( ) 0>BP . Are loc relaŃia

( ) ( ) ( ) ( )nBn

n

nji

jiB

n

i

iB

n

i

iB A...AAP...AAPAPAP ∩∩−++∩−=

≤<≤==∑∑ 21

1

111

1U .

Dacă evenimentele KA,...,A,A n ∈21 şi KB∈ sunt independente, atunci

(*)

( ) ( ) ( ) ( )nnn

nji

ji

n

i

i

n

i

i A...AAP...AAPAPAP ∩∩−++∩−=

≤<≤==∑∑ 21

1

111

1U .

Dacă în plus evenimentele n,kA ,k 1= sunt şi incompatibile, atunci relaŃia

(*) devine

( )∑==

=

n

i

i

n

i

i APAP11

U .

Formula probabilităŃii totale Fie KA,...,A,A n ∈21 un sistem complet de evenimente şi KX ∈ un

eveniment oarecare. Are loc formula:

( ) ( ) ( )∑=

⋅=n

k

Ak XPAPXPk

1

.

DemonstraŃie. Deoarece IkAk ∈, , formeazǎ un sistem complet de

evenimente, avem cǎ KAIk

k =∈U . Prin urmare, se poate scrie

( ).UUIk

k

Ik

k AXAXKXX∈∈

∩=

∩=∩=

De asemenea, deoarece ,Ο/=∩ ji AA rezultǎ cǎ şi

( ) ( )Ο/=∩∩∩ ji AXAX , pentru ji ≠ , deci

( ) ( ) ( ) ( ).∑∑∈∈

=∩=Ik

Ak

Ik

k XPAPAXPXPk

Formula lui Bayes Fie KA,...,A,A n ∈21 un sistem complet de evenimente şi KX ∈ un

eveniment oarecare. Are loc formula:

16

( )( ) ( )

( ) ( )∑=

⋅=

n

k

Ak

Aj

jX

XPAP

XPAPAP

k

j

1

.

Această formulă se aplică în următoarea situaŃie. În urma unei experienŃe poate apărea un eveniment X ca efect a n evenimente KA,...,A,A n ∈21 care

formează un sistem complet de evenimente . Presupunând că se cunosc probabilităŃile evenimentelor KA,...,A,A n ∈21 (numite şi probabilităŃi a

priori) precum şi probabilitatea de apariŃie a evenimentului X, se pot calcula

probabilităŃile condiŃionate ( ) n,k,XPkA

1= .Formula lui Bayes ne permite să

aflăm pentru fiecare n,k 1= probabilitatea ca evenimentul X să fi apărut din

cauza evenimentului kA , adică probabilitatea ( )kX AP , n,k 1= ( numită şi

probabilitate a posteriori)

II.6. Scheme clasice de probabilitate

În calculul probabilităŃilor întâlnim anumite clase de probleme , în sensul că fiecare problemă dintr-o astfel de clasă admite o abordare identică, prin particularizări ale parametrilor care intervin. Din acest motiv, pentru o anumită clasă de probleme se construieşte modelul matematic probabilistic, model ce poartă numele de schemă de probabilitate.

a) Schema bilei nerevenite

Se consideră o urnă ce conŃine bile de două culori diferite: a bile albe şi b bile negre. Se extrag n ( )ban +≤ bile fără revenire. Acest tip de extragere se poate realiza prin două modalităŃi: se extrag simultan toate cele n bile, sau, se extrage pe rând câte o bilă, făra a o reintroduce în urnă. Se cere probabilitatea ca din cele n bile extrase, k să fie albe şi n-k negre, unde ak ≤ şi bkn ≤− . Utilizând definiŃia clasică a probabilităŃii se obŃine că probabilitatea cerută este dată de formula

( )n

ba

knb

ka

C

CCk,nP

+

= .

Generalizare. Presupunem că avem o urnă cu bile de s culori diferite: 1a

bile de culoarea 1, 2a bile de culoarea 2,…, sa bile de culoarea s. Se extrag

n ( )sa...aan +++≤ 21 bile fără revenire. Se cere probabilitatea ca din cele n

17

bile extrase, 1k să fie de culoarea 1, 2k de culoarea 2,…, sk de culoarea s,

unde 11 ak ≤ , 22 ak ≤ ,…, ss ak ≤ şi nk...kk s =+++ 21 .

Utilizând definiŃia clasică a probabilităŃii se obŃine că probabilitatea cerută este dată de formula

( )n

a...aa

k

a

k

a

k

as

s

s

s

C

C...CCk,...,k,k.nP

+++

=

21

2

2

1

121 .

b) Schema bilei revenite(binomială)

Aceastǎ schemǎ de probabilitate se aplicǎ în cazul în care se fac

repetǎri independente ale unui experimant şi la fiecare repetare se are în

vedere apariŃia unui eveniment bine precizat. Evenimentul considerat se

presupune cǎ apare cu aceeaşi probabilitate la fiecare repetare a

experimentului. Se cere calcularea probabilitǎŃii ca din n repetǎri ale

experimentului evenimnetul precizat sǎ aparǎ de k ori.

Modelul probabilistic se realizeazǎ printr-o urnǎ ce conŃine bile de

douǎ culori diferite: a bile albe şi b bile negre. Se extrag n bile din urnǎ,

una câte una astfel încât fiecare bilǎ extrasǎ se reintroduce în urnǎ după ce

se constatǎ culoarea bilei extrase. Se cere determinarea probabilitǎŃii ca

din cele n bile extrase, k sǎ fie de culoarea albǎ şi n-k de culoare neagră.

Dacǎ se noteazǎ prin iA evenimantul ca la extragerea de rang i sǎ fie

extrasǎ o bilǎ de culoare albǎ, atunci iA este evenimentul ca la extragerea

de rang i sǎ fie obŃinutǎ o bilǎ de culoare neagrǎ. De asemenea, deoarece

la fiecare repetare, bila extrasǎ se depune din nou în urnǎ, probabilitatea

de a extrage o bilǎ albǎ, la fiecare repetare, este aceeaşi: ( ).iAPp = . La

fel, obŃinerea unei bile negre la fiecare repetare se realizeazǎ cu aceeaşi

probabilitate ( ) .1 pqAP i −==

Fie notat prin knB , evenimentul ca din n bile extrase sǎ fie obŃinute k

bile albe. Acest evenimant se poate scrie sub forma

18

( ).1

11

1, U

L

LLnii

iiiikn

k

nkkAAAAB

≤<<≤

∩∩∩∩∩=+

Evenimentele reuniunii sunt incompatibile douǎ câte douǎ, iar

evenimentele din fiecare intersecŃie sunt independente. Astfel se scrie

succesiv

( ) ( )

( ) ( ) ( ) ( )

.1

1

11

1

11

1

1

1,

≤<≤

≤<<≤

≤<<≤

=

==

=∩∩∩∩∩=

+

+

nii

knk

nii

iiii

nii

iiiikn

k

k

nkk

k

nkk

qp

APAPAPAP

AAAAPBP

L

L

L

LL

LL

Având în vedere cǎ toŃi termenii sumei sunt egali, iar suma are k

nC

termeni, avem cǎ probabilitatea ( )knP , de a obŃine k bile albe în n

extrageri de bile din urnǎ este datǎ prin formula

( ) ., knkk

n qpCknP −=

ObservaŃie. Dacǎ se considerǎ formula binomului lui Newton, avem cǎ

( ) ( ) .,01∑∑==

− ==+n

k

kn

k

kknkk

n

nxknPxqpCqpx

Aşadar, probabilitatea ( )knP , este coeficientul kx din dezvoltatea

binomului ( ) ,nqpx + de aici şi denumirea de schemǎ binomialǎ.

ObservaŃie. Dacǎ se ia în formula de la observaŃia precedentǎ 1=x şi

dacǎ se are în vedere cǎ 1=+ qp , se obŃine cǎ

( ) ( ) .1,0

=+=∑=

n

k

nqpknP

Generalizare. Schema bilei întoarse cu mai multe stǎri (multinomială

sau polinomialǎ)

19

Aceasǎ schemǎ de probabilitate este o generalizare a schemei

binomiale. Se aplicǎ atunci când la fiecare repetare a experimentului, se

urmǎreşte apariŃia a r evenimente, care formeazǎ un sistem complet de

evenimente. ProbabilitǎŃile de apariŃie pentru evenimentele considerate nu

depind de rangul repetǎrii, deci sunt constante. Se doreşte calculul

probabilitǎŃii ca în n repetǎri independente ale experimentului, cele r

evenimente precizate sǎ aparǎ de un numǎr de ori dat.

Modelul probabilistic este realizat printr-o urnǎ ce conŃine bile de r

culori. Din urnǎ se extrag, pe rând, bile cu întoarcerea bilei extrase în urnǎ,

dupǎ ce s-a constatat culoarea bilei extrase. Se cere sǎ se calculeze

probabilitatea ( )rkkknP ,,,; 21 L , ca din n bile extrase 1k sǎ fie de culoarea

întâi, 2k bile de culoarea a doua ş.a.m.d. rk sǎ fie de culoarea a −r a.

Folosind aceeaşi metodǎ ca la schema binomialǎ, se obŃine cǎ

( ) ,!!!

!,,,; 21

2121

21rk

r

kk

r

r pppkkk

nkkknP L

LL =

unde ,,1, ripi = sunt respectiv probabilitǎŃile de-a obŃine la o extragere bilǎ

de culoarea .,1, rii =

ObservaŃie. Dacă se dezvoltă următorul polinom

( ) ,2211n

rrxpxpxp L++

atunci probabilitatea ( )rkkknP ,,,; 21 L este coefcientul monomului

rk

r

kk xxx L2121 din această dezvoltare. De aici şi denumirea de schema

multinomială sau polinomială folosită pentru această schemă de probabilitate.

ObservaŃie. Au loc relaŃiile

121 =++ rppp L şi .21 nkkk r =+++ L

20

c) Schema lui Poisson

Se aplică în cazul în care se fac repetări independente ale unui

experiment şi la fiecare repetare se urmăreşte un anumit eveniment, care

apare, în general, cu probabilităŃi diferite la repetiŃii de ranguri diferite.

Se cere să se calculeze probabilitatea ca din n repetări ale

experimentului, evenimentul considerat să apară de k ori.

Realizarea modelului se obŃie cu ajutorul unui sistem de n urne. În

fiecare urnă se află bile de două culori diferite. În urna cu nr. 1 se află 1a bile

albe şi 1b bile negre. În urna cu nr. 2 se află 2a bile albe şi 2b bile negre. ....

În urna cu nr. n se află na bile albe şi nb bile negre. Se ia câte o bilă din

fiecare urnă şi se cere determinarea probabilităŃii ( )knP , de a obŃine k bile de

culoarea albă din cele n extrase.

Dacă se notează cu ip probabilitatea de a extrage o bilă albă

din urna cu numărul i şi prin iq probabilitatea de a extrage o bilă de culoare

neagră din urna cu numărul i, adică ii pq −= 1 , pentru fiecare ,,1 ni = atunci,

printr-un raŃionament analog cu cel de la schema binomială, se obŃine că

( ) ∑≤<<≤

+=

nii

iiii

k

nkkqqppknP

L

LL

1

111

.,

ObservaŃie. Probabilitatea ( )knP , se obŃine ca fiind coeficientul lui

kx al polinomului

( )( ) ( )nn qxpqxpqxp +++ L2211 .

ObservaŃie. Dacă ppi = , pentru fiecare ni ,1= , deci şi

pqqi −== 1 , atunci se obŃine schema lui Bernoulli cu bila întoarsă.

21

UNITATEA DE STUDIU III

VARIABILE ALEATOARE

III.1. DefiniŃia variabilelor aleatoare

Până acum, în studiul câmpului de evenimente asociat unui experiment, am fost interesaŃi de apariŃia sau neapariŃia evenimentului, deci latura calitativă a experimentului. Un studiu riguros al fenomenelor aleatoare necesită însă şi o descriere cantitativă a acestora, astfel încât să poată să fie studiate din punct de vedere matematic. Avem deci nevoie de o corespondenŃă între mulŃimea evenimentelor dintr-un corp K şi mulŃimea numerelor reale R. O astfel de corespondenŃă este realizată de variabilele aleatoare.

DefiniŃia III.1.1. Fie ( )pKE ,, un câmp borelian de probabilitate. O

aplicaŃie REX →: se numeşte variabilă aleatoare dacă Ra∈∀ avem că ( ) KaeXEe ∈>∈ .

Variabilele aleatoare sunt de două tipuri: discrete şi continue. DefiniŃia III.1.2. O variabilă aleatoare REX →: este discretă dacă

mulŃimea valorilor pe care le ia este o muŃime finită sau numărabilă. DefiniŃia III.1.3. O variabilă aleatoare discretă se numeşte simplă

dacă ia un număr finit de valori. Prin urmare, o variabilă aleatoare discretă este simplă dacă: i) RxxxEX n ⊂→ ,...,,: 21 ;

ii) ( ) niKxeXEe ii ,1, =∈=∈ .

ObservaŃie. Deoarece evenimentele nixX i ,1, == formează un

sistem complet de evenimente, avem că 11

=∑=

n

i

ip .

In general, variabilele aleatoare simple sunt reprezentate printr-un tablou de repartiŃie (distribuŃie). Acesta este de fapt un tabel alcătuit din două linii: pe prima linie sunt trecute valorile distincte ale variabilei aleatoare, iar pe a doua linie , probabilităŃile cu care apar aceste valori.

n

n

ppp

xxxX

L

L

21

21 ,

unde

22

=

=∀>

∑=

1

,1,0

1

n

i

i

i

p

nip

şi ( )ii xXPp == .

DefiniŃia III.1.4. O variabilă aleatoare este continuă dacă mulŃimea valorilor sale este un interval sau o reuniune de intervale.

III.2. FuncŃia de repartiŃie a unei variabile aleatoare

DefiniŃia III.2.1. Fie ( )pKE ,, un câmp borelian de probabilitate şi REX →: o variabilă aleatoare. FuncŃia RRF →: definită pin

( ) ( ) ( ) ( )xeXEePxXPxF <∈=<=

se numeşte funcŃie de repartiŃie a variabilei aleatoare X. Teorema III.2.1. FuncŃia de repartiŃie F corespunzătoare unei variabile aleatoare X are următoarele proprietăŃi:

(1) pentru orice R∈x , avem că ( ) ,10 ≤≤ xF

(2) pentru orice a, b∈R, a<b, avem că

( ) ( ) ( )( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ( ),

,

,

,

bXPaFbFbXaP

bXPaXPaFbFbXaP

aXPaFbFbXaP

aFbFbXaP

=+−=≤≤

=+=−−=≤<

=−−=<<

−=<≤

(3) pentru orice ( ) ( )212121 ,, xFxFcaavemxxxx ≤<∈R,

(funcŃia F este crescătoare),

(4) ( ) ( ) ( ) ( ) ,1lim,0lim =∞+==∞−=+∞→+∞→

FxFFxFxx

(5) pentru orice R∈x , avem că ( ) ( ) ( )xFxFyFxy

=−=→

0lim

(funcŃia F este continuă la stânga).

DemonstraŃie. (1) Deoarece valorile funcŃiei de repartiŃie sunt nişte

probabilităŃi, avem această afirmaŃie, deci ( ) .10 ≤≤ xF

(2) Se scrie succesiv

23

( ) ( ) ( ) ( )[ ].\, aXbXPaXbXPbXaP <<=<<=<≤

Deoarece ( ) ( ),bXaX <⊂< avem în continuare că

( ) ( ) ( ) ( ) ( ),aFbFaXPbXPbXaP −=<−<=<≤

Pentru a doua relaŃie se are în vedre că

( ) ( ) ( ),\ aXbXabXa =<≤=<<

deci

( ) ( ) ( ) ( ) ( ) ( ).aXPaFbFaXPbXaPbXaP =−−==−<≤=<<

In mod analog, se arată şi celelalte două relaŃii de la acest punct.

(3) Folosind prima formulă de la punctul precedent, avem relaŃiile

( ) ( ) ( ),0 121 xFxFxXxP −=<≤≤ de unde ( ) ( ).21 xFxF ≤

(4) Formal avem că ( ) ( ) ( ) ,0limlim =Ο/=<=−∞→−∞→

PxXPxFxx

respectiv

( ) ( ) ( ) .1limlim =Ω=<=+∞→+∞→

PxXPxFxx

(5) Un raŃioanament analog cu cel de la punctul precedent ne conduce

la faptul că funcŃia F este continuă la stânga.

PropoziŃia III.2.1. Dacă X este o variabilă aleatoare discretă cu

distribuŃia nii

i

p

xX

,1=

, atunci funcŃia de repartiŃie este dată prin

( ) ( ) ∑∑<<

===xx

i

xx

i

ii

pxXPxF , Rx∈∀ .

Altfel spus, pentru un Rx∈ dat, se adună toate probabilităŃile ip ce

corespund valorilor lui X care verifică condiŃia xxi < :

24

( )

>

≤<

≤<+

≤<

=

+=∑

n

kk

k

i

k

xx

xxxp

xxxpp

xxxp

xx

xF

,1

,

,

,

,0

11

3221

211

1

M

M

ObservaŃie. FuncŃia de repartiŃie F a unei variabile aleatoare discrete

nii

i

p

xX

,1=

este o funcŃie scară, în care punctele nixi ,1, = sunt puncte de

discontinuitate de speŃa I, iar mărimile salturilor în aceste puncte sunt date de

probabilităŃile corespunzătoare nipi ,1, = .

Până acum am facut referire cu precădere la variabile aleatoare

discrete. Pentru a putea face o descriere a varibilelor aleatoare continue avem

nevoie de o nouă noŃiune, pe care o vom introduce în continuare.

III.3. Densitatea de probabilitate ( repartiŃie).

DefiniŃia III.3.1. Fie X o variabilă aleatoare şi F funcŃia sa de

repartiŃie. Dacă există o funcŃie RRf →: , integrabilă pe R astfel încât

( ) ( )∫∞−

=x

dttfxF , Rx∈∀ , atunci funcŃia f se numeşte densitate de repartiŃie

sau densitate de probabilitate a variabilei aleatoare X.

25

DefiniŃia III.3.2. Fie X o variabilă aleatoare şi F funcŃia sa de

repartiŃie. Spunem că X este o variabilă aleatoare continuă dacă funcŃia de

repartiŃie F se spoate scrie sub forma ( ) ( )∫∞−

=x

dttfxF , Rx∈∀ .

Teorema III.3.1. Densitatea de repartiŃie f a unei variabile aleatoare

continue X are următoarele proprietăŃi:

(1) pentru orice R,∈x avem că ( ) ,0≥xf

(2) ( ) ( ),' xfxF = aproape peste tot pe R

(3) pentru a < b, avem că ( ) ( ) ,∫=<≤b

a

dxxfbXaP

(4) ( ) .1=∫+∞

∞−

dxxf

ObservaŃie. Dacă X este o variabilă aleatoare continuă, atunci tabloul

său de distribuŃie este

( )Rx

xf

xX

,

unde

( )

( )

=

∈∀≥

∫∞+

∞−

.1

,0

dxxf

Rxxf

III.4. OperaŃii cu variabile aleatoare.

Teorema III.4.1. Fie ( )pKE ,, un câmp borelian de probabilitate,

REX →: o variabilă aleatoare şi 0−∈ Ra o constantă. Atunci şi

aplicaŃiile:

26

1) aX + ,

2) aX ,

3) X ,

4) nX , *Nn∈ ,

5) 0,1

≠XX

definite pe E cu valori reale, sunt de asemenea variabile aleatoare.

ObservaŃie. Dacă

n

n

ppp

xxxX

L

L

21

21 ,cu

=

=∀>

∑=

1

,1,0

1

n

i

i

i

p

nip

este o

variabilă aleatoare discretă simplă, atunci:

1)

++++

n

n

ppp

axaxaxaX

L

L

21

21 ,

2)

n

n

ppp

axaxaxaX

L

L

21

21 ,

3)

n

n

ppp

xxxX

L

L

21

21 ,

4)

n

n

n

nn

n

ppp

xxxX

L

L

21

21 ,

5)

n

n

ppp

xxxX

L

L

21

21

1111

.

Teorema III.4.2. Fie ( )pKE ,, un câmp borelian de probabilitate şi

REX →: , REY →: două variabile aleatoare. Atunci şi

1) YX + ,

2) YX − ,

3) YX ⋅

4) 0, ≠YY

X

sunt de asemenea variabile aleatoare.

27

PropoziŃia III.4.1. Dacă nii

i

p

xX

,1=

şi

mjj

j

q

yY

,1=

sunt două

variabile aleatoare discrete simple, atunci:

i) mjniij

ji

p

yxYX

,1,,1 ==

++ ,

ii) mjniij

ji

p

yxXY

,1,,1 ==

,

unde ( ) ( )( )jiij yYxXPp =∩== .

ObservaŃie. Dacă variabilele aleatoare nii

i

p

xX

,1=

şi

mjj

j

q

yY

,1=

sunt

independente, atunci jiij qpp ⋅= .

Dacă există ji ≠ astfel încât ji xx = , atunci, în tabloul de repartiŃie

al variabilei corespunzătoare se va trece o singură dată valoarea ix cu

probabilitatea ji pp + .

III.5. Caracteristici numerice ale variabilelor aleatoare discrete.

Fie REX →: o variabilă aleatoare discretă , nii

i

p

xX

,1=

, unde

=

=∀>

∑=

1

,1,0

1

n

i

i

i

p

nip

.

• Valoarea medie

DefiniŃia III.5.1. Numim valoare medie a variabilei aleatoare

discrete X acea valoare notată prin m, sau X , sau ( )XM şi definită prin

∑=

=n

i

ii pxm1

.

28

ProprietăŃi. Valoarea medie are următoarele proprietăŃi:

1) ( ) ( ) ,bXaMbaXM +=+ Rba ∈∀ ,

2) ( ) ( ) ( ),YMXMYXM +=+

3) Dacă variabilele aleatoare X şi Y sunt independente, atunci

( ) ( ) ( ).YMXMXYM =

DemonstraŃie. Vom considera variabilele aleatoare X şi Y de tip discret

cu distribuŃiile

,,Jjj

j

Iii

i

q

yY

p

xX

∈∈

pentru care există ( )XM şi ( ).YM

1) Scriem succesiv

( ) ( ) ( )

( ) ,bXaMpbpxa

bppaxpbaxbaXM

Ii

i

Ii

ii

Ii

iii

Ii

ii

+=+=

=+=+=+

∑∑

∑∑

∈∈

∈∈

de unde ( ) ( ) .bXaMbaXM +=+

2) Dacă variabilele aleatoare X şi Y au distribuŃiile, precizate mai sus,

atunci variabila aleatoare YX + are distribuŃia

( ).,,),(

jiij

JIjiij

jiyYxXPpunde

p

yxYX ===

++

×∈

Prin urmare, avem că

( ) ( )

∑ ∑ ∑∑

∑ ∑∑∑∑∑

∈ ∈ ∈∈

∈ ∈ ∈∈∈ ∈

+=

=+=+=+

Ii Ii Jj

ijj

Jj

iji

Ii Ii Jj

ijj

Jj

iji

Ii Jj

ijji

pypx

pypxpyxYXM

).()(

Se obŃine că

( ) ( ) ( ).YMXMqypxYXMJj

jj

Ii

ii +=+=+ ∑∑∈∈

29

3) Având în vedere că variabilele aleatoare X şi Y sunt independente, se

obŃine distribuŃia variabilei aleatoare produs

( )

., JIjiji

ji

qp

yxXY

×∈

Aşadar, putem scrie sucesiv

( ) ( ) ( ),YMXMqypxqpyxXYMJj

jj

Ii

ii

Ii Jj

jiji =

== ∑∑∑∑

∈∈∈ ∈

adică ( ) ( ) ( ).YMXMXYM =

ObservaŃie. Dacă în propoziŃia precedentă, la punctul (1) se ia 0=a ,

atunci se obŃine că valoarea medie a unei constante este constanta însăşi, iar

punctele (2) şi (3) se pot extinde pentru un număr finit de variabile aleatoare.

• Momentul de ordin r

DefiniŃia III.5.2. Numim momentul de ordin r al variabilei aleatoare

X, valoarea medie a variabilei rX .

Vom nota momentul de ordin r cu ( )XM r :

( ) ( ) ∑=

==n

i

i

r

i

r

r pxXMXM1

.

• Valoarea medie de ordin r

DefiniŃia III.5.3. Valoarea medie de ordin r a unei variabile

aleatoare X este radicalul de ordin r al momentului de ordin r:

( ) r

n

i

i

r

ir

rr pxXM ∑=

==1

η

• Abaterea

30

DefiniŃia III.5.4. Numim abaterea variabilei aleatoare X , având

valoarea medie m, variabila aleatoare mX −=ξ .

ObservaŃie. Dacă nii

i

p

xX

,1=

, atunci

nii

i

p

mx

,1=

−ξ şi ( ) 0=ξM .

• Momentul centrat de ordin r

DefiniŃia III.5.5. Momentul centrat de ordin r al variabilei

aleatoare X este momentul de ordin r al abaterii.

( ) ( ) ( )( ) ( )∑=

−=−===n

i

i

r

i

rr

rr pmxmXMMM1

ξξµ .

Teorema III.5.1. Intre momentele de ordin r şi momentele centrate

de ordinul r ale unei variabile aleatoare X există următoarea relaŃie:

( ) ( )[ ] ( )∑−

−−=r

k

kr

kk

r

k

r XMXMC0

1µ .

ObservaŃie. In statistica matematică se utilizează momente centrate

până la ordinul 4:

01 =µ ;

( ) ( )[ ]222 XMXM −=µ ;

( ) ( ) ( ) ( )[ ]323 233 XMXMXMXM +−=µ ;

( ) ( ) ( ) ( )[ ] ( ) ( )[ ]422

244 364 XMXMXMXMXMXM −+−=µ

• Dispersia.

DefiniŃia III.5.6. Momentul centrat de ordin 2 se numeşte dispersie.

( ) ( ) ( )[ ] ( ) ( ) ( )[ ]221

222 XMXMpmxmXMXXD

n

i

ii −=−=−== ∑=

µ

.

ProprietăŃi. Dispersia verifică următoarele proprietăŃi:

31

1) ( ) 0=cD , Rc∈∀ .

2) ( ) ( )XDccXD 2= .

3) Dacă variabilele aleatoare X şi Y sunt independente, atunci

( ) ( ) ( ).YDXDYXD +=+

DemonstraŃie.

1) ( ) ( ) ( )[ ] 02222 =−=−= cccMcMcD

2) Dacă nii

i

p

xX

,1=

, atunci X are abaterea

nii

i

p

mx

,1=

−ξ şi cX are

abatrea nii

i

p

cmcxc

,1=

−ξ . Prin urmare avem:

( ) ( ) ( )( ) ( ) ( ) ( ) cpmxcpmxcpcmcxcMcXcXDn

i

ii

n

i

ii

n

i

ii

1

22

1

22

1

222 =−=−=−=== ∑∑∑

===

ξµ

3) Deoarece vriabilele aleatoare X şi Y sunt independente, rezultă

succesiv

( ) ( )[ ][ ]( )( ) ( )( ) ( )( ) ( )( )[ ]

( ) ( ) ( ) ( ) ( )[ ] ( )( ) ( ) ( ) ( )[ ] ( ) ( ) ( ).2

2

2 22

2

YDXDYDYMXMXYMXD

YDYMXMXYMYXMXYMXD

YMYYMYXMXXMXM

YXMYXMYXD

+=+−−=

=++−−−=

=−+−−−−=

=+−+=+

• Abaterea medie pătratică.

DefiniŃia III.5.7. Media de ordin 2 a abaterii se numeşte abatere

medie pătratică.

( )XD=σ .

• Modul (Valoarea modală; valoarea dominantă)

32

DefiniŃia III.5.8. Valoarea modală a unei variabile aleatoare discrete

X este acea valoare kx a variabilei, pentru care probabilitatea

corespunzătoare kp este maximă.

• FuncŃia caracteristică

Fiind dată o variabilă aleatoare discretă nkk

k

p

xX

,1=

, putem considera

variabila aleatoare nkk

itx

itX

p

ee

k

,1=

, cu 12 −=i şi

kk

itxtxitxe k sincos += .

DefiniŃia III.5.9. FuncŃia caracteristică a variabilei aleatoare X este

media variabilei aleatoare itXe , adică

( ) ( ) ∑∑ ∑== =

+===n

k

kk

n

k

n

k

kkk

itxitX txpitxppeeMt k

11 1

sincosϕ .

ProprietăŃi. FuncŃia caracteristică a unei variabile aleatoare discrete

are următoarele proprietăŃi:

1) ( ) 10 =ϕ şi ( ) 1≤tϕ , Rt∈∀ .

2) ( )tϕ este uniform continuă pe R.

3) ( ) ( )tt ϕϕ =− .

4) ( ) ( )atet X

itb

baX ϕϕ =+ , Rba ∈∀ , .

5) Dacă X şi Y sunt două variabile aleatoare independente, atunci

( ) ( ) ( )ttt YXYX ϕϕϕ +=+

adică, funcŃia caracteristică a unei sume de două variabile aleatoare

independente este egală cu produsul funcŃiilor caracteristice ale celor două

variabile.

• FuncŃia generatoare

33

Fiind dată o variabilă aleatoare discretă nkk

k

p

xX

,1=

, putem considera

variabila aleatoare nkk

tx

tX

p

ee

k

,1=

.

DefiniŃia III.5.10. FuncŃia generatoare ataşată unei variabile

aleatoare discrete X este media variabilei tXe , adică

( ) ( ) ∑=

==n

k

k

txtX peeMtg k

1

.

Au loc următoarele relaŃii:

( ) ∑=

=n

k

tx

kkkexptg

1

' şi ( ) ( )XMxpgn

k

kk ==∑=1

0' .

( ) ∑=

=n

k

tx

kkkexptg

1

2'' şi ( ) ( )XMxpgn

k

kk 21

20'' ==∑=

.

M

( ) ∑=

=n

k

txr

kk

r kexptg1

şi ( ) ( )XMxpg r

n

k

r

kk

r ==∑=1

0 .

In concluzie, funcŃia generatoare se foloseşte pentru a calcula

momente de diferite ordine ale unei variabile aleatoare discrete. Acestea se

obŃin derivând funcŃia generatoare în 0=t .

III.6. Caracteristici numerice ale variabilelor aleatoare continue

Fie X o variabilă aleatoare continuă, cu funcŃia de repartiŃie F şi

funcŃia densitate

de probabilitate f: ( )

Rxxf

xX

,unde

( )

( )

=

∈∀≥

∫∞+

∞−

.1

,0

dxxf

Rxxf

34

• Valoarea medie

DefiniŃia III.6.1. Numim valoare medie a variabilei aleatoare

discrete X acea valoare notată prin m, sau X , sau ( )XM şi definită prin

( )∫+∞

∞−

= dxxxfm .

ProprietăŃi. Valoarea medie are următoarele proprietăŃi:

1) ( ) ( ) ,bXaMbaXM +=+ Rba ∈∀ ,

2) ( ) ( ) ( ),YMXMYXM +=+

3) Dacă variabilele aleatoare X şi Y sunt independente, atunci

( ) ( ) ( ).YMXMXYM =

4) Dacă ( )NnnX ∈ este un şir de variabile aleatoare continue

independente două câte două, atunci

( ) ( ) ( )∑ ∑∑= ≤<≤=

+=

n

i nji

jii

n

i

i XMXMXMXM1 1

22

1

2 .

5) Dacă X este o variabilă aleatoare continuă cu funcŃia de repartiŃie F şi

media m, atunci:

i) ( )( ) 01lim =−+∞→

xFxx

.

ii) ( ) 0lim =−∞→

xxFx

.

ObservaŃie. Dacă în propoziŃia precedentă, la punctul 1) se ia 0=a ,

atunci se obŃine că valoarea medie a unei constante este constanta însăşi, iar

punctele 2) şi 3) se pot extinde pentru un număr finit de variabile aleatoare.

• Momentul de ordin r

DefiniŃia III.6.2. Numim momentul de ordin r al variabilei aleatoare

X, valoarea medie a variabilei rX .

Vom nota momentul de ordin r cu ( )XM r :

35

( ) ( ) ( )∫+∞

∞−

== dxxfxXMXM rr

r .

• Valoarea medie de ordin r

DefiniŃia III.6.3. Valoarea medie de ordin r a unei variabile

aleatoare X este radicalul de ordin r al momentului de ordin r:

( ) ( )rrr

rr dxxfxXM ∫+∞

∞−

==η

• Abaterea

DefiniŃia III.6.4. Numim abaterea variabilei aleatoare X , având

valoarea medie m, variabila aleatoare mX −=ξ .

ObservaŃie. Dacă ( )

Rxxf

xX

, atunci

( )Rx

xf

mx

−ξ şi ( ) 0=ξM .

• Momentul centrat de ordin r

DefiniŃia III.6.5. Momentul centrat de ordin r al variabilei

aleatoare X este momentul de ordin r al abaterii.

( ) ( ) ( )( ) ( ) ( )∫+∞

∞−

−=−=== xfmxmXMMMrrr

rr ξξµ .

• Dispersia.

DefiniŃia III.6.6. Momentul centrat de ordin 2 se numeşte dispersie.

( ) ( ) ( )[ ] ( ) ( ) ( ) ( )[ ]2222

2 XMXMdxxfmxmXMXXD −=−=−== ∫+∞

∞−

µ

.

ProprietăŃi. Dispersia verifică următoarele proprietăŃi:

1) ( ) 0=cD , Rc∈∀ .

36

2) ( ) ( )XDccXD 2= .

3) Dacă variabilele aleatoare X şi Y sunt independente, atunci

( ) ( ) ( ).YDXDYXD +=+

• Abaterea medie pătratică.

DefiniŃia III.6.7. Media de ordin 2 a abaterii se numeşte abatere

medie pătratică.

( )XD=σ .

• Modul (Valoarea modală; valoarea dominantă)

DefiniŃia III.6.8. Valoarea modală a unei variabile aleatoare continue

X este acea valoare a variabilei, pentru care funcŃia densitate de probabilitate

este maximă.

Dacă ( )

Rxxf

xX

este o variabilă aleatoare continuă, atunci valoarea

sa modală este soluŃia sistemului ( )( )

<

=

0"

0'

xf

xf.

• Mediana

DefiniŃia III.6.9. Mediana unei variabile aleatoare continue este un

număr real Me pentru care avem

( ) ( )MeXPMeXP ≥=< .

Dacă variabila X are funcŃia de repartiŃie F, atunci

( ) ( )xFMeXP =< şi ( ) ( )xFMeXP −=≥ 1 .

37

Prin urmare obŃinem că ( )2

1=xF . Aşadar, mediana este soluŃia ecuaŃiei

( )2

1=xF .

ObservaŃie. Mediana unei variabile aleatoare este un număr real şi nu

este neapărat o valoare a variabilei.

Se poate ca o variabilă aleatoare să nu admită medie, dar orice

variabilă aleatoare admite cel puŃin o mediană.

• FuncŃia caracteristică

Fiind dată o variabilă aleatoare continuă ( )

Rxxf

xX

, putem

considera variabila aleatoare nkk

itx

itX

p

ee

k

,1=

, cu 12 −=i şi

kk

itxtxitxe k sincos += .

DefiniŃia III.6.10. FuncŃia caracteristică a variabilei aleatoare X

este media variabilei aleatoare itXe , adică

( ) ( ) ∑∑ ∑== =

+===n

k

kk

n

k

n

k

kkk

itxitX txpitxppeeMt k

11 1

sincosϕ .

ProprietăŃi. FuncŃia caracteristică a unei variabile aleatoare discrete

are următoarele proprietăŃi:

1) ( ) 10 =ϕ şi ( ) 1≤tϕ , Rt∈∀ .

2) ( )tϕ este uniform continuă pe R.

3) ( ) ( )tt ϕϕ =− .

4) ( ) ( )atet X

itb

baX ϕϕ =+ , Rba ∈∀ , .

5) Dacă X şi Y sunt două variabile aleatoare independente, atunci

( ) ( ) ( )ttt YXYX ϕϕϕ +=+

38

adică, funcŃia caracteristică a unei sume de două variabile aleatoare

independente este egală cu produsul funcŃiilor caracteristice ale celor două

variabile.

• FuncŃia generatoare

Fiind dată o variabilă aleatoare discretă nkk

k

p

xX

,1=

, putem considera

variabila aleatoare nkk

tx

tX

p

ee

k

,1=

.

DefiniŃia III.6.11. FuncŃia generatoare ataşată unei variabile

aleatoare discrete X este media variabilei tXe , adică

( ) ( ) ∑=

==n

k

k

txtX peeMtg k

1

.

Au loc următoarele relaŃii:

( ) ∑=

=n

k

tx

kkkexptg

1

' şi ( ) ( )XMxpgn

k

kk ==∑=1

0' .

( ) ∑=

=n

k

tx

kkkexptg

1

2'' şi ( ) ( )XMxpgn

k

kk 21

20'' ==∑=

.

M

( ) ∑=

=n

k

txr

kk

r kexptg1

şi ( ) ( )XMxpg r

n

k

r

kk

r ==∑=1

0 .

In concluzie, funcŃia generatoare se foloseşte pentru a calcula

momente de diferite ordine ale unei variabile aleatoare discrete. Acestea se

obŃin derivând funcŃia generatoare în 0=t .

39

UNITATEA DE STUDIU IV

REPARTIłII CLASICE

IV.1. RepartiŃii discrete

1. RepartiŃia discretă uniformă

DefiniŃia IV.1.1. Spunem că variabila aleatoare X are repartiŃie discretă uniformă de parametru n dacă pentru orice 1,2,..., ,k n∈

( ) 1.kp P X k

n= = =

Tabloul de repartiŃie este: 1 2 ...

.1 1 1...

n

n n n

PropoziŃia IV.1.1. Dacă X este o variabilă aleatoare cu repartiŃie

discretă uniformă atunci media este ( ) 1,

2

nM X

+= iar dispersia de

( )2 1

.12

nD X

−=

DemonstraŃie.

( ) ( )

( )1 1

1 1 1 11 2 ...

11 2 ... 12 ;

2

n n

k

k k

M X k p x k nn n n n

n n

n n

n n

= =

= ⋅ = ⋅ = ⋅ + ⋅ + + ⋅ =

++ + + +

= = =

∑ ∑

( ) ( ) ( )2

2 2 2 2 2

1

1 1 1 11 2 ...

2

=

+ = ⋅ − = ⋅ + ⋅ + + ⋅ − =

∑n

k

k

nD X k p x M X n

n n n

( )( )2 22 2 2 2

1 2 11 2 ... 1 1 16 .

2 2 12

n n n

n n n n

n n

+ ++ + + + + − = − = − =

40

2. RepartiŃia binomială

DefiniŃia IV.1.2. Spunem că variabila aleatoare X are repartiŃie binomială de parametri n şi p (n întreg pozitiv, 0 1p< < ) dacă pentru

orice 0,1, 2,..., ,k n∈

( ) ,k k n k

k np P X k C p q −= = =

unde 1 .q p= −

Tabloul de repartiŃie este:

−− nknkk

n

n

n

n pqpCpqCq

nkX

LL

LL11

10.

PropoziŃia IV.1.2 . Dacă X este o variabilă aleatoare cu repartiŃie

binomială atunci media, respectiv dispersia sunt date de: ( ) ,M X n p= ⋅

respectiv ( ) .D X n p q= ⋅ ⋅

DemonstraŃie. Folosim identitatea:

( )0

.n

n k k k n k

n

k

px q C p x q −

=

+ =∑

Prin derivarea acestei identităŃi în raport cu x obŃinem:

( ) 1 1

0

.n

n k k k n k

n

k

np px q kC p x q− − −

=

+ =∑ (*)

Dar ( )0

,n

k k n k

n

i

M X kC p q −

=

=∑ ceea ce înseamnă că în relaŃia de mai sus,

considerând 1x = obŃinem ( ) ( ) 1.

nM X np p q

−= + Deoarece 1,p q+ = avem

( ) .M X np=

Pentru calcularea dispersiei utilizăm formula ( ) ( ) ( )2 2 ;D X M X M X= −

Pentru a determina momentul de ordin 2 ( )2 2

0

.n

k k n k

n

k

M X k C p q −

=

=∑ înmulŃim

relaŃia (*) cu x şi o derivăm încă o dată, obŃinând:

( ) ( ) ( )1 22 2 1

0

1 .n

n n k k k n k

n

k

np px q np n x px q k C p x q− − − −

=

+ + − + =∑

În această relaŃie îl luăm pe 1x = şi Ńinând cont de faptul că membrul drept

reprezintă chiar ( )2M X şi că 1,p q+ = rezultă:

( ) ( ) ( ) ( )2 21 1 .M X np n n p np np p np np q= + − = + − = +

Dispersia va fi în acest caz: ( ) ( ) ( )2 .D X np np q np npq= + − =

41

3. RepartiŃia Poisson

DefiniŃia IV.1.3. Variabila aleatoare X are repartiŃia Poisson cu parametrul 0,λ > dacă ea poate lua orice valoare întreagă pozitivă şi

( )!

kk

kp P X k ek

λ −= = = , 0,1, 2,...k =

Tabloul de repartiŃie este:

−−−

LL

LL

λλλ λλ e

nee

nX

n

!

10

PropoziŃia IV.1.3. Dacă X este o variabilă aleatoare cu repartiŃie

Poisson atunci: ( )M X λ= şi ( ) .D X λ=

DemonstraŃie. Avem că

( )( ) ( )

1

1 1 1

.! 1 ! 1 !

k k k

k k k

M X k e e e e ek k k

λ λ λ λ λλ λ λλ λ λ

−∞ ∞ ∞− − − −

= = =

= ⋅ ⋅ = ⋅ = = =− −∑ ∑ ∑

Pentru calcularea dispersiei utilizăm formula ( ) ( ) ( )2 2 .D X M X M X= −

Folosim următorul artificiu de calcul:

( )( )

( ) ( ) ( )

22 2 2

2 1

2

1 1

2 2

12 ! !

! !

,

k k

k k

k k

k k

e e e e k kk k

e k e kk k

M X M X M X

λ λ λ λ

λ λ

λ λλ λ λ

λ λ

λ

−∞ ∞− − −

= =

∞ ∞− −

= =

= = = − =−

= − =

== − = −

∑ ∑

∑ ∑

de unde rezultă că ( )2 2 .M X λ λ= +

În final obŃinem ( ) ( ) ( )2 2 2 2 .D X M X M X λ λ λ λ= − = + − =

ObservaŃie. Legea lui Poisson se mai numeşte şi legea evenimentelor rare şi se poate obŃine ca un caz limită al legii binomiale pentru p foarte mic şi n foarte mare.

4. RepartiŃia hipergeometrică

DefiniŃia IV.1.4. Variabila aleatoare X are repartiŃia hipergeometrică de parametri ,a b şi n ( , ,a b n numere întregi pozitive,

n a b≤ + ) dacă pentru orice ,k ( ) ( )max 0, min ,n b k n a− ≤ ≤ avem:

PropoziŃia IV.1.4. Dacă X este o variabilă aleatoare cu repartiŃie hipergeometrică atunci media, respectiv dispersia sunt:

42

( ) ,na

M Xa b

=+

respectiv ( ) ( )( ) ( )2 .

1

nab a b nD X

a b a b

+ −=

+ + −

DemonstraŃie. Avem că valoare medie este

( )0

.k n kna b

nk a b

C CM X k

C

= +

=∑

Pentru determinarea mediei utilizăm următoarele calcule:

1) ( )

( )( ) ( )

( )( ) ( )

11

1 ! 1 !!;

! ! 1 ! ! 1 ! !k k

a a

a a aakC k k a aC

k a k k k a k k a k

−−

− −= = = =

− − − − −

( ) .k n k

a bk n

a b

C Cp P X k

C

+

= = =

2) 1 11 1

0 1 1

,n n n

k n k k n k k n k n

a b a b a b a b

k k k

C C kC C a C C aC− − − − −− + −

= = =

= = =∑ ∑ ∑

unde Ńinem cont de faptul că 0

.n

k n k n

a b a b

k

C C C−+

=

=∑

Astfel, media este:

( ) ( )( ) ( )

( )( )

11

1 ! ! !.

1 ! ! !

n

a b

n

a b

a b n a b naC naM X a

C n a b n a b a b

−+ −

+

+ − + −= = ⋅ =

− + − + +

Pentru calcularea dispersiei utilizăm formula ( ) ( ) ( )2 2 ,D X M X M X= −

Mai întâi calculăm momentul de ordin 2:

( )

( )

( ) ( )

2 2 2

0 0

0 0

0

1

1 11

1 1

k n kn nk n ka ba bn n

k ka b a b

n nk n k k n k

a b a bn nk ka b a b

nk n k

a bnka b

C CM X k k C C

C C

k k C C kC CC C

k k C C M XC

−−

= =+ +

− −

= =+ +

=+

= = =

= − + =

= − +

∑ ∑

∑ ∑

unde evident ( )2 1 .k k k k= − +

( ) ( )( )

( ) ( )( ) ( )

( )

0 2

22

2 2

!1 1

! !

2 !1 1 .

2 ! !

n nk

a

k k

n nk

a

k k

ak k C k k

k a k

aa a a a C

k a k

= =

−−

= =

− = − =−

−= − = −

− −

∑ ∑

∑ ∑

Revenind în formula pentru momentul de ordinul 2 avem:

( ) ( ) ( )2 22

2

1k n k

a bnka b

a aM X C C M X

C

− −−

=+

−= + =∑

( ) ( )( )( ) ( ) ( )

( )( )( )

1 ! ! 2 !.

! 2 ! ! 1

a a n a b n a b na na b nna

a b n a b n a b a b a b

− + − + − + −= + =

+ − + − + + + −

43

Dispersia este:

( ) ( ) ( ) ( )( )( ) ( )

( )( ) ( )

2 22 2

2 2 .1 1

na na b n nab a b nn aD X M X M X

a b a b a b a b a b

+ − + −= − = − =

+ + − + + + −

5. RepartiŃia geometrică DefiniŃia IV.1.5. Variabila aleatoare X are repartiŃie geometrică de parametru p cu proprietatea ( 0 1p< < ) dacă ea poate lua orice valoare întreagă pozitivă şi

( ) 1,k

kp P X k pq −= = =

unde 1 .q p= −

PropoziŃia IV.1.5. Dacă X este o variabilă aleatoare cu repartiŃie geometrică atunci:

( ) 1,M X

p= ( ) 2

.q

D Xp

=

DemonstraŃie.Vom calcula media şi momentul de ordin doi utilizând funcŃia generatoare

1

1 1

( ) ( ) ,1 1

t ttk k t k

t tk k

p p e q e pF t e pq e q

q q e q e q

∞ ∞−

= =

⋅ ⋅= = = ⋅ =

− ⋅ − ⋅∑ ∑

unde am avut în vedere că 0 1.q< < Calculăm derivata de ordinul întâi a funcŃiei ( )F t în raport cu t :

2'( )

(1 )

t

t

peF t

e q=

− şi considerând 0t = rezultă că media variabilei aleatoare

X va fi: 1

( ) '(0) ;M X Fp

= =

Calculăm derivata de ordinul doi a funcŃiei ( )F t în raport cu t :

23 3 2 2

( 1) ( 1) 1 1"( ) "(0) ( ) "(0) ;

(1 ) (1 )

t t

t

pe qe p q q qF t F M X F

e q q p p

+ + + += ⇒ = = ⇒ = =

− −

Utilizăm formula dispersiei:

2 22

( ) ( ) ( ) .q

D X M X M Xp

= − =

44

IV.2. RepartiŃii continue

1. RepartiŃia continuă uniformă

DefiniŃia IV.2.1. Variabila aleatoare X are repartiŃie continuă uniformă de parametri ,a b dacă densitatea de probabilitate este:

( ) [ ]1, ,

0 , ( , ) ( , )

x a bf x b a

x a b

∈= − ∈ −∞ ∪ ∞

.

Se pot verifica următoarele condiŃii: 0f ≥ şi ( ) 1.f x dx

+∞

−∞

=∫

PropoziŃia IV.2.1. Dacă variabilă aleatoare X are repartiŃia uniformă de parametri ,a b atunci:

( ) ,2

a bM X

+= ( ) ( )2

.12

b aD X

−=

DemonstraŃie. Avem că

( ) ( ) ( ) ( ) ( )a b

a b

M x x x dx x x dx x x dx x x dxρ ρ ρ ρ+∞ +∞

−∞ −∞

= = + +∫ ∫ ∫ ∫

şi Ńinând cont de faptul că funcŃia are valoarea 0 în afara intervalului [ ],a b

obŃinem:

( )2 2 21 1 1

.2 2 2

b

a

bx b a a bM x x dx

ab a b a b a

− += = ⋅ = ⋅ =

− − −∫

Dispersia este dată de formula: ( ) ( ) ( )2 2 .D X M X M X= −

Calculăm mai întâi momentul de ordin 2:

( ) ( )3 2 2

2 2 2 1 1.

3 3

b

a

bx b ab aM X x x dx x dx

ab a b aρ

+∞

−∞

+ += = = =

− −∫ ∫

şi dispersia va fi obŃinem:

( ) ( )22 2 2 22.

3 4 12

a bb ab a b ab aD X

++ + − += − =

2. RepartiŃia exponenŃială

DefiniŃia IV.2.2. O variabilă aleatoare X are repartiŃie

exponenŃială de parametru 0λ > dacă densitatea de probabilitate este:

( ) , 0.

0 , 0

xe xf x

x

λλ − ≥=

<

45

PropoziŃia IV.2.2. Dacă variabila aleatoare X are repartiŃia

exponenŃială de parametru 0,λ > atunci:

( ) 1M X

λ= şi ( ) 2

1.D X

λ=

DemonstraŃie.Atât pentru calcularea mediei cât şi a dispersiei vom utiliza metoda integrării prin părŃi.

( ) ( ) ( )'0 0

0

1 1 0 .

0 0

x x

x x x

M X x x dx x e dx x e dx

xe e dx e

λ λ

λ λ λ

ρ λ

λ λ

+∞ +∞ +∞− −

−∞

+∞− − −

= = = − =

+∞ +∞= − + = − =

∫ ∫ ∫

( ) ( )2 2 2 2

0 0

20

+∞ +∞ +∞− − −

−∞

+∞= = = − + =∫ ∫ ∫x x xM X x x dx x e dx x e xe dxλ λ λρ λ

20

2 2 1 2 0 .xx e dxλλ

λ λ λ λ

+∞−= + = ⋅ =∫

Prin înlocuire în formula dispersiei obŃinem: ( ) 2 2 2

2 1 1.D X

λ λ λ= − =

3. RepartiŃia gamma

DefiniŃia IV.2.3. O variabilă aleatoare X are repartiŃie gamma de parametri a şi b ( 0, 0a b> > ) şi notăm ( ),X a bγ∈ dacă funcŃia densitate

de probabilitate este:

46

( ) ( )11

, 0.

0 , 0

x

a bax e x

f x a b

x

−−>

= Γ <

PropoziŃia IV.2.3. Dacă variabilă aleatoare X are repartiŃia gamma, atunci:

( )M X ab= şi ( ) 2.D X ab=

DemonstraŃie. În cele ce urmează vom aminti noŃiunea de integrală

gamma: ( ) 1

0

a xa x e dx

+∞− −Γ = ∫

şi relaŃia de recurenŃă pentru aceasta:

( ) ( )1 .a a aΓ + = Γ

Pentru calculul mediei avem că

( ) ( )( ) ( )

1

0 0

1 1 1 1.

x x

a ab ba a

M X x x dx x x e dx x e dxa b a b

ρ+∞ +∞ +∞

− −−

−∞

= = = ⋅Γ Γ∫ ∫ ∫

Pentru rezolvarea acestei integrale vom face următoarea substituŃie: x

t x bt dx bdtb= ⇒ = ⇒ =

şi observând că limitele de integrare se păstrează, obŃinem:

( )( ) ( ) ( )

( )( )

( )0 0

1 11 .a a t a t

a

b b bM X t b e bdt t e dt a a a ab

a b a a a

+∞ +∞− −= ⋅ = = Γ + = Γ =

Γ Γ Γ Γ∫ ∫Calculăm momentul de ordinul 2:

( ) ( )( )

2 2 1

0

1 1 x

a ba

M X x x dx x e dxa b

ρ+∞ +∞

−+

−∞

= = ⋅Γ∫ ∫

şi utilizând substituŃia anterioară avem:

47

( ) ( ) ( ) ( )( )

2 22 1 1 1

0 0

1 12a a t a t

a

b bM X b t e bdt t e dt a

a b a a

+∞ +∞+ + − + −= ⋅ = = Γ + =

Γ Γ Γ∫ ∫

( ) ( )( )

( )2

211 .

a a b aa a b

a

+ Γ= = +

Γ

Prin înlocuirea în formula dispersiei obŃinem:

( ) ( ) ( )22 21 .D X a a b ab ab= + − =

4. RepartiŃia beta

DefiniŃia IV.2.4. Variabila aleatoare X are repartiŃie beta de parametri a şi b ( 0, 0)a b> > şi notăm ( ),X a bγ∈ dacă are densitatea de

probabilitate:

( ) ( )( ) ( )

( )

1111 , 0,1

, .

0 , 0,1

bax x xa bf x

x

β−− − ∈

= ∉

PropoziŃia IV.2.4. Dacă variabilă aleatoare X are repartiŃia beta,

atunci:

( ) aM X

a b=

+ şi ( )

( ) ( )2 .1

abD X

a b a b=

+ + +

DemonstraŃie. Mai întâi amintim noŃiunea de integrală beta:

( ) ( )1

11

0

, 1baa b x x dxβ−−= −∫

şi relaŃia de legătură între integrala beta şi integrala gamma:

( ) ( ) ( )( )

, .a b

a ba b

βΓ Γ

=Γ +

Calculăm media:

( ) ( ) ( ) ( ) ( )0 1

0 1

.M X x x dx x x dx x x dx x x dxρ ρ ρ ρ+∞ +∞

−∞ −∞

= = + +∫ ∫ ∫ ∫

Prima şi ultima integrală sunt egale cu 0 conform definiŃiei şi prin urmare avem:

( )( )

( ) ( )( )

( ) ( )( )

( )( ) ( )

11

0

1, 111

, , 1

baa b a a a b

M X x x dxa b a b a b a b

ββ β

− + Γ + Γ Γ += − = = ⋅ =

Γ + + Γ Γ∫

48

( )( ) ( )

( )( )

.a a a b a

a b a b a a b

Γ Γ += ⋅ =

+ Γ + Γ +

( ) ( ) ( )( )

( )1 1

12 2 2 1

0 0

11

,

baM X x x dx x x dx x x x dxa b

ρ ρβ

+∞−−

−∞

= = = − =∫ ∫ ∫

( )( ) ( )

( )( ) ( )( )

( )( ) ( )

111

0

2, 211

, , 2

baa b a b a b

x x dxa b a b a b a b

ββ β

−+ + Γ + Γ Γ += − = = ⋅ =

Γ + + Γ Γ∫

( ) ( )( ) ( ) ( )

( )( )

( )( )( )

1 1.

1 1

a a a a b a a

a b a b a b a a b a b

+ Γ Γ + += ⋅ =

+ + + Γ + Γ + + +

Dispersia va fi dată de : ( )( ) ( )2 .

1

abD X

a b a b=

+ + +

5. RepartiŃia normală

DefiniŃia IV.2.5. Variabila aleatoare X are repartiŃie normală de parametri m şi σ şi notăm ( ), ,X N m σ∈ dacă funcŃia densitate de

probabilitate este:

( )( )2

221, .

2

x m

f x e xσ

σ π

−−

= ∀ ∈

ObservaŃie. FuncŃia ( )f x este simetrică faŃă de m şi are puncte de inflexiune:

.x m σ= ± Pentru 0m = şi 1σ = se obŃine repartiŃia normală “normată”, ( )0,1 ,N a

cărei densitate este: ( )2

21, .

2

x

f x e xπ

−= ∀ ∈

DefiniŃia IV.2.6. FuncŃia de repartiŃie a variabilei normale normate

este

( )21

21

2

xt

x e dtπ

−∞

Φ = ∫

şi se numeşte funcŃia lui Laplace. Din simetria lui ( )xΦ rezultă:

( ) ( ) ( ) ( ) ( )1 1x P X x P X x P X x xΦ − = < − = > = − < = −Φ

de unde:

49

( ) ( ) 1.x xΦ +Φ − =

FuncŃia lui Laplace este tabelată pentru diferite valori ale lui .x Cu aceste tabele putem găsi probabilităŃile asociate evenimentelor privind orice variabilă normală.

ObservaŃie. Dacă ( ), ,X N m σ∈ atunci:

a) ( ) ;b m

P X bσ− < = Φ

b) ( ) .b m a m

P a X bσ σ− − < < = Φ −Φ

PropoziŃia IV.2.5. Dacă X este o variabilă aleatoare cu repartiŃie

normală, atunci: ( )M X m= şi ( ) 2.D X σ=

DemonstraŃie.

( ) ( )22

2

( )221 1

.2 2

x mx m

M X x x dx x e dx xe dxσσρσ π σ π

− −+∞ +∞ +∞ −−

−∞ −∞ −∞

= = =∫ ∫ ∫

Rezolvăm această integrală făcând următoarea substituŃie:

2 22

x mt x m t dx dtσ σ

σ−

= ⇒ = + ⇒ =

şi observând că nu se modifică nici unul dintre capetele integralei.

( ) ( ) 2 2 21 22 2 .

2t t tm

M X m t e dt te dt e dtσ

σ σσ π π π

+∞ +∞ +∞− − −

−∞ −∞ −∞

= + = +∫ ∫ ∫

Deoarece funcŃia de sub prima integrală este o funcŃie impară

( ) ( )( ),f t f t− = − rezultă că integrala se anulează şi Ńinând cont de integrala

Gauss:2

0

,2

xe dxπ+∞

− =∫ obŃinem:

50

( )2 2

0

2 2.

2t tm m m

M X e dt e dt mπ

π π π

+∞ +∞− −

−∞

= = = ⋅ =∫ ∫

( ) ( )( ) ( ) ( )2

2 2 21.

2

x m

D X x M X x dx x m e dxσρσ π

− +∞ +∞ −

−∞ −∞

= − = −∫ ∫

Utilizând aceeaşi substituŃie integrala devine:

( ) ( ) 2 2 22 22

2 2

0

1 2 42 2 .

2t t tD X t e dt t e dt t e dt

σ σσ σ

σ π π π

+∞ +∞ +∞− − −

−∞ −∞

= = =∫ ∫ ∫

Scriem 2

2

'

2

tt e

te−

= − şi folosim metoda integrării prin părŃi:

( )2

22 2 2

2

0

4 2 20 .

02 2

tte

D X t e dtσ σ σ π

σπ π π

+∞−−+∞

= + = + ⋅ =− ∫

6. RepartiŃia hi-pătrat 2( )χ

DefiniŃia IV.2.7. Variabila aleatoare X are repartiŃia 2χ cu n grade de libertate dacă are densitatea de probabilitate:

( )

12 2

2

1, 0

.22

0 , 0

n x

nx e x

nf x

x

− −>

= Γ

<

.

PropoziŃia IV.2.6. Pentru o variabilă aleatoare X ce satisface repartiŃia 2χ avem:

( )M X n= şi ( ) 2 .D X n=

DemonstraŃie.

51

( ) ( ) ( )1

2 2

0 0 2

1.

22

n x

nM X x x dx x x dx x x e dx

nρ ρ

+∞ +∞ +∞− −

−∞

= = = Γ

∫ ∫ ∫

Facem următoarea substituŃie: 2 22

xt x t dx dt= ⇒ = ⇒ = şi astfel media

devine:

( ) ( ) 2 22

0 0 02

1 2 22 2

22 22

n nnt t t

nM X t e dt t e dt t e dt

n nn

+∞ +∞ +∞− − −= = = =

Γ ΓΓ

∫ ∫ ∫

2 21 .

2 2 22 2

n n nn

n n

= Γ + = Γ = Γ Γ

( ) ( ) ( )12 2 2 2 2 2

0 0 2

1.

22

n x

nM X x x dx x x dx x x e dx

nρ ρ

+∞ +∞ +∞− −

−∞

= = = Γ

∫ ∫ ∫

Folosim aceeaşi substituŃie şi avem:

( ) ( )112 22

0 02

1 4 42 2 2

22

2 22

nnt t

n

nM X t e dt t e dt

n nn

+∞ +∞++ − − = = = Γ + = Γ ΓΓ

∫ ∫

( )42 2 .

2 2 22

n n nn n

n

= + Γ = + Γ

În final, putem calcula dispersia:

( ) ( ) ( ) ( )22 22 2 .D X M X M X n n n n= − = + − =

7. RepartiŃia Student

DefiniŃia IV.2.8 Variabila aleatoare X are o repartiŃie Student cu n grade de libertate dacă funcŃia densitate de probabilitate este

( )1

2 2

1

21 , .

2

nn

xf x x

n nnπ

+−

+ Γ = + ∈ Γ

PropoziŃia IV.2.7. Dacă variabilă aleatoare X are repartiŃia Student,

atunci:

52

( ) 0M X = şi ( ) .2

nD X

n=

DemonstraŃie.

( ) ( )1

2 2

1

21 0

2

nn

xM X x x dx x dx

n nn

ρπ

+−+∞ +∞

−∞ −∞

+ Γ = = + = Γ

∫ ∫ ,deoarece funcŃia de

sub integrală este impară iar intervalul de integrare este simetric.

UNITATEA DE STUDIU V

LEGI ALE NUMERELOR MARI

V.1.Tipuri de convergenŃe pentru şiruri de variabile aleatoare

Fie ( )pKE ,, un câmp borelian de probabilitate şi ( ) 1≥nnX un şir de

variabile aleatoare definite pe acest câmp. Spre deosebire de convergenŃa şirurilor de funcŃii din analiza matematică clasică, există mai multe tipuri de convergenŃă a unui astfel de şir de variabile aleatoare. ConvergenŃa în probabilitate DefiniŃia V.1.1. Un şir de variabile aleatoare ( ) 1≥nnX converge în probabilitate la variabila aleatoare X dacă

( ) ( ) 1lim =<−∈∞→

εeXeXEeP nn

, 0>∀ε .

Notăm convergenŃa în probabilitate prin XX P

n → .

ProprietăŃi. 1. Limita unui şir de variabile aleatoare convergent în probabilitate este

unică aproape sigur.

53

2. Dacă ( ) 1≥nnX şi ( ) 1≥nnY sunt două şiruri de variabile aleatoare astfel

încât XX P

n → şi YY P

n → atunci bYaXbYaX P

nn +→+ ,

pentru oricare numere reale a şi b. 3. Dacă ( ) 1≥nnX este un şir de variabile aleatoare astfel încât

XX P

n → , atunci XXP

n → .

ConvergenŃa în repartiŃie Fie ( ) 1≥nnX este un şir de variabile aleatoare căruia îi corespunde un

şir de funcŃii de repartiŃie ( ) 1≥nnF şi X o variabilă aleatoare cu funcŃia de

repartiŃie F . DefiniŃia V.1.2. Spunem că ( ) 1≥nnX converge în repartiŃie la X

dacă şirul de funcŃii ( ) 1≥nnF converge către funcŃia F în fiecare punct de

continuitate a acesteia.

Notăm convergenŃa în repartiŃie XX rep

n → . .

Teorema V.1.1.

1. Dacă XX P

n → , atunci XX rep

n → . .

2. Dacă c este o constantă reală şi dacă cX rep

n → . , atunci cX P

n → .

ConvergenŃa aproape sigură (ConvergenŃă tare) DefiniŃia V.1.3. Un şir de variabile aleatoare ( ) 1≥nnX converge

aproape sigur la variabila aleatoare X dacă mulŃimea punctelor e în care şirul ( ) 1≥nnX converge punctual formează un eveniment de probabilitate 1.

( ) ( ) 1lim =

=∈

∞→eXeXEeP n

n.

Notăm convergenŃa aproape sigură

XX sa

n → .. .

Teorema V.1.2. Dacă XX sa

n → .. , atunci XX P

n → .

Teorema V.1.3. XX P

n → dacă şi numai dacă din orice subşir al

şirului ( ) 1≥nnX se poate extrage alt subşir ( )1≥nnk

X astfel încât XXsa

nk→ .. .

54

ConvergenŃa în medie DefiniŃia V.1.4. Fie ( ) 1≥nnX un şir de variabile aleatoare şi X o

variabilă aleatoare. Dacă există momentele de ordin r ale variabilelor nX şi

X , notate ( )rnXM şi ( )rXM şi dacă ( ) 0lim =−∞→

r

nn

XXM , atunci spunem

că şirul ( ) 1≥nnX converge în medie r la X .

DefiniŃia V.1.5. ConvergenŃa în medie de ordin 2 implică convergenŃa în probabilitate.

V.2. InegalităŃi pentru variabile aleatoare

Teorema V.2.1.(Inegalitatea Cebîşev). Fie X o variabilă aleatoare pentru care există valoarea medie ( )XM şi dispersia ( )XD finite. Pentru

0>∀ε are loc inegalitatea

( )( ) ( )2

εXD

XMXP −≥<− ,

sau, echivalent

( )( ) ( )2ε

εXD

XMXP <≥− .

ObservaŃie. Inegalitatea afirmă că probabilitatea ca modulul abaterii unei variabile aleatoare să ia valori mai mari decît un număr 0>ε este mai

mică decât raportul ( )2εXD

. Prin urmare, dacă dispersia unei variabile

aleatoare este mică, atunci abateri mari de la medie sunt puŃin probabile. Teorema V.2.2.(Inegalitatea Markov) Dacă X este o variabilă aleatoare continuă ce ia valori pozitive, atunci

( )( ) ( ) ( )[ ]( )XM

XMXMXP

2

221 αα −>> ,

unde ( )1,0∈α .

V.3. Legi ale numerelor mari

Legile numerelor mari reprezintă un grup de teoreme referitoare la variabile aleatoare care urmează o repartiŃie binomială.

55

Teorema V.3.1.(Teorema lui Bernoulli). Fie un eveniment A de probabilitate teoretică p. Notăm cu α numărul de apariŃii a evenimentului A

în n probe. Numim frecvenŃă relativă raportul n

f nα

= . In aceste condiŃii

avem că nf converge în probabilitate la p, adică

( ) 1lim =<−∞→

εpfP nn

, 0>∀ε .

DemonstraŃie. Din inegalitatea Cebîşev avem că

( )2

2

1εσ

ε −≥<− aXP .

In repartiŃia binomială avem însă că npqD ==2σ . ObŃinem astfel

( ) ( )22222

2

111εεε

σεαε

αε

n

pq

n

npq

nnnpPp

nPpfP n −=−=−≥<−=

<−=<−

. Rezultă inegalitatea

( ) 112

≤<−<− εε

pfPn

pqn ,

din care, aplicând teorema cleştelui obŃinem concluzia. ObservaŃie. Din teorema Bernoulli obŃinem că în cazul unei populaŃii de volum mare, dacă se efectuează o selecŃie de volum n şi se obŃin α rezultate favorabile, atunci, cu o probabilitate apropiată de 1 putem afirma că probabilitatea evenimentului cercetat este dată de frecvenŃa relativă. Prin urmare, în studiul populaŃiilor pentru care nu putem determina probabilitatea p aceasta se poate exprima pe cale experimentală prin frecvenŃa relativă

nf n

α= a evenimentului cinsiderat.

Teorema V.3.2. (Teorema lui Poisson) Fie un şir de evenimente independente ,...,...,, 21 nAAA cu probabilităŃile teoretice ,...,..,, 21 nppp şi

presupunem că există n

pppp n

n

...lim 21 ++

=∞→

. Notăm cu nf frecvenŃa de

apariŃie a evenimentului nAAA ∪∪∪ ...21 în n probe. In aceste condiŃii

avem că pf P

n → .

DemonstraŃie. Presupunem că evenimentelor ,...,...,, 21 nAAA le

corespund variabilele aleatoare ,..2,1

01

=

=

kkk

kqp

X , iar evenimentului

56

nAAA ∪∪∪ ...21 îi corespunde variabila aleatoare n

XXY n

n

++=

...1 .

Avem că ( ) kk pXM = şi ( ) kkk qpXD = .

ObŃinem că media variabilei nY este

( ) ( ) ( ) ∑∑==

==++=n

k

k

n

k

knn pn

XMn

XXMn

YM11

1

11...

1

şi dispersia

( )

=

= ∑∑

=

=n

k

k

n

k

k

n XDnn

X

DYD1

21 1

.

Rezultă

( )22

112

2 ...11

εεσ

εn

qpqppfP nn

n

++−=−≥<− .

Cum 1=+ kk qp şi 0,0 >> kk qp , obŃinem că 4

1≤kkqp , nk ,1=∀ .

Drept urmare,

2222211

4

1

4

...

εεε nn

n

n

qpqp nn =≤++

.

ObŃinem astfel că

( ) 14

11

2≤<−<− ε

εpfP

nn

şi de aici, aplicând teorema cleştelui obŃinem concluzia. Teorema V.3.3.(Teorema Cebîşev). Fie ( ) 1≥nnX un şir de variabile

aleatoare independente două câte două, având dispersiile mărginite de aceeaşi constantă c:

( ) cXD n ≤ , ,...2,1=n .

Atunci, 0>∀ε avem că

( ) 011

lim11

=

>− ∑∑==

∞→ε

n

i

i

n

i

in

XMn

Xn

P ,

Adică, şirul de variabile aleatoare ( )( )∑=

−n

i

ii XMXn 1

1 converge în

probabilitate la 0. DemonstraŃie. Avem că

( )∑∑==

=

n

i

i

n

i

i XMn

Xn

M11

11

şi, Ńinând seama că variabilele date sunt independente avem şi

57

( )∑∑==

=

n

i

i

n

i

i XDn

Xn

D1

21

11.

Din ipoteză rezultă

n

cX

nD

n

i

i ≤

∑=1

1.

Inegalitatea Cebîşev pentru variabila ∑=

n

i

iXn 1

1 conduce la

( )

<

>− ∑∑==

211

11

εε

n

cXM

nX

nP

n

i

i

n

i

i ,

de unde, trecând la limită, obŃinem concluzia. Caz particular. Dacă ( ) ( ) ( ) mXMXMXM n ==== ...21 , atunci

obŃinem că

0...

lim 21 =

>−

+++∞→

εmn

XXXP n

n.

Astfel se explică de ce putem face observaŃii asupra mediei unei populaŃii pe baza unei selecŃii de voum mic comparativ cu volumul întregii populaŃii. ObservaŃie. Teorema Cebîşev ne spune că, deşi variabilele aleatoare independente pot lua valori departe de mediile lor, media aritmetică a unui număr suficient de mare de astfel de variabile aleatoare ia, cu o probabilitate

foarte mare, valori în vecinătatea constantei ( )∑=

n

i

iXMn 1

1. Această observaŃie

ne arată că între comportarea fiecărei variabile aleatoare şi a mediei lor aritmetice există o mare deosebire, în sensul că nu putem preciza ce valoare va lua fiecare variabilă aleatoare, dar putem preciza cu o probabilitate apropiată de 1 ce valoare va lua media aritmetică a acestor variabile. Teorema Cebîşev scoate în evidenŃă esenŃa numerelor mari: dacă anumite caracteristici ataşate unei populaŃii de volum mare conŃin erori, aceste erori devin neglijabile atunci când numărul lor este foarte mare.

58

Autoevaluare prin aplicaŃii

1. Din şirul primelor 100 de numere naturale se alege la întâmplare un număr.

Fie A evenimentul ca numărul ales să fie par. Ce înseamnă evenimentul A ? 2. Din şirul primelor 100 de numere naturale se alege la întâmplare un

număr. Fie A evenimentul ca numârul ales să înceapă cu cifra 3 şi B evenimentul ca numărul ales să aibă ultima cifră 5. Ce înseamnă evenimentul

BA − ? 3. Doi studenŃi joacă o partida de şah. Fie A evenimentul ca primul

student să câştige partida şi B evenimentul ca al doilea student să câştige .Partida s-a terminat remiză. Să se scrie evenimentul realizat prin intermediul evenimentelor A şi B.

4. Fie un lot de 10 piese ce se supune unui control de calitate. Notăm cu

iA evenimentul ca piesa i să fie defectă, cu 101,i = . Să se scrie următoarele

evenimente: a) niciuna din piese nu este defectă; b) cel puŃin una din piese este defectă; c) numai una din piese este defectă; d) toate piesele sunt defecte; 5. Cineva telefonează pe rând la 4 numere diferite. Fiecare număr este

format o singură dată. Se notează cu iA evenimentul ca la apelul i să nu se

primească răspuns, cu 41,i = . Să se scrie următoarele evenimente: a) s-a primit răspuns la toate apelurile; b) s-a primit răspuns la un singur apel; c) nu s-a primit răspuns la nici un apel;

d) nu s-a primit răspuns la un singur apel; e) nu s-a primit răspuns cel mult la primul apel.

6.Un aparat este format din trei componenete. Se noteazǎ cu A , B şi C respectiv evenimentele ca prima, a doua şi a treia componentǎ sǎ fie defectǎ. Sǎ se exprime cu ajutorul evenimentelor A , B şi C evenimentul ca:

a) cel puŃin o componentǎ este defectǎ, b) exact o componentǎ este defectǎ, c) nici o componentă nu este defectǎ,

59

d) toate componentele sunt defecte.

7. Într-o urnă sunt 3 bile albe şi 5 bile negre. Se cere probabilitatea de a se extrage o bilă albă.

8.. Se aruncă 2 zaruri. Se cer probabilităŃile: a. de a se obŃine dublă; b. de a se obŃine un total de 7 puncte; c. de a se obŃine un total de cel puŃin 3 puncte. 9. Zece obiecte metalice de greutăŃi diferite sunt aşezate pe un raft. Care

este probabilitatea ca acestea să fie aşezate în ordine crescătoare a greutăŃii?

10.Pe un raft sunt aşezate la întâmplare 10 cǎrŃi, dintre care trei reprezintǎ cele trei volume ale aceluiaşi roman. Sǎ se calculeze probabilitatea ca:

a) cele trei volume ale romanului sǎ fie aşezate unul lângă altul în ordinea naturalǎ (vol.1,2,3),

b) cele trei volume ale romanului sǎ fie aşezate unul lângǎ altul în orice ordine,

c) cele trei volume ale romanului sǎ fie aşezate unul lângǎ altul în ordinea naturalǎ, la începutul raftului.

11. Zece studenŃi sunt aşezaŃi într-o ordine aleatoare pe o bancă. Se cere probabilitatea ca doi dintre ei să stea mereu unul lângă celălalt.

12. Pentru un examen oral sunt pregătite 25 de bilete. Pe fiecare bilet sunt

câte 2 subiecte: 10 bilete conŃin câte 1 subiect de algebră şi 1 subiect de geometrie, 7 bilete conŃin 1 subiect de algebră şi unul de trigonometrie şi 8 bilete conŃin câte 1 subiect de geometrie şi unul de trigonometrie. Care este probabilitatea ca trăgand 2 bilete să nimeresc 2 subiecte de algebră?

13. Fiecare coeficient al ecuaŃiei trigonometrice batgx = este determinat

prin aruncarea unui zar şi luarea numărului de puncte ieşit. Care este

probabilitatea ca ecuaŃia dată să admită soluŃiile ,...1,0,4

=+= kka ππ

?

14. Trei tunuri trag simultan asupra unei Ńinte. ProbabilităŃile de

nimerire a Ńintei pentru cele trei tunuri sunt respectiv 601 ,p = , 802 ,p = ,

703 ,p = . Să se determine probabilitatea ca Ńinta să fie nimerită cel puŃin o

dată.

60

15. O persoană scrie n scrisori la n corespondenŃi. Amestecă scrisorile şi le introduce la întâmplare în n plicuri pe care erau deja scrise adresele. Care este probabilitatea ca cel puŃin un destinatar să primească scrisoarea adresată lui?

16. În magazia unei uzine se găsesc piese de acelaşi fel provenite de la 3 secŃii ale uzinei. Se ştie că prima secŃie produce 25% din totalul pieselor, a doua secŃie, 35% şi a treia secŃie 40% din totalul pieselor. Rebuturile sunt de 2%, 3%, respectiv 1% pentru cele 3 secŃii. a) Să se calculeze probabilitatea ca luând o piesă din magazie aceasta să fie rebut. b) Ştiind că o piesă aleasă la întâmplare este rebut, să se calculeze probabilitatea ca ea să provină de la a treia secŃie. 17. Pentru însămânŃări s-au pregătit seminŃe de grâu de 4 calităŃi diferite. ProbabilităŃile ca un bob luat la întâmplare să fie de una din cele 4 calităŃi sunt respectiv 0,7 , 0,25 , 0,4 , 0,1 . ProbabilităŃile ca dintr-un bob din cele 4 calităŃi să crească un spic bogat sunt respectiv 0,9 , 0,8 , 0,6 , 0,5 . Care este probabilitatea ca un spic recoltat să fie bogat? 18. Într-o anumită casă, probabilitatea că “există caşcaval” la micul dejun este 0,8, iar probabilitatea că “ există lapte” este 0,7. Probabilitatea că “există şi lapte şi caşcaval” la micul dejun este 0,5. CalculaŃi probabilitatea să fie caşcaval cu condiŃia să fie şi lapte, iar apoi probabilitatea să fie lapte cu condiŃia să fie şi caşcaval la micul dejun. 19. Din n bilete de examen, a sunt considerate favorabile. StudenŃii vin pe rând şi extrag câte un bilet. Dintre primii doi studenŃi care are şansa mai mare de a extrage un bilet favorabil? 20. Probabilitatea ca o echipă de fotbal să piardă primul meci din campionat este 0,9. Dacă pierde acest meci, probabilitatea de a-l pierde şi pe al doilea este 0,3. Dacă însă câştigă primul meci, probabilitatea de al pierde pe al doilea este 0,8. Ştiind că echipa a pierdut al doilea meci, găsiŃi probabilitatea să-l fi pierdut şi pe primul. 21. Ionel spală vasele de 3 ori pe săptămână, iar sora sa, Maria, de 4 ori. Zilele în care aceştia spală vasele se aleg la întâmplare în fiecare săptămână. Probabilitatea ca Ionel să spargă vase în timpul spălării este 0,2, iar probabilitatea ca Maria să spargă vase este 0,1. Într-o zi, tatăl, auzind zgomot de vase sparte spune: “ aceasta este ziua în care Ionel spală vase” Care este probabilitatea ca tatăl să aibă dreptate?

61

22 48% din populaŃia unei localităŃi sunt bărbaŃi. Doar 60% din ei ating vârsta de 70 de ani. Aceeaşi vârstă este atinsă de femei în procent de 75%. Care este probabilitatea ca o persoană din acea localitate să atingă vârsta de 70 de ani? 23. La o uzină, într-o zi de lucru, trei maşini A, B, C produc piese: 3900 de piese sunt produse de maşina A, 4200 de B şi 3600 de C. Probabilitatea ca o piesă să fie defectă este de 0,01 pentru maşina A, 0,02 pentru B şi 0,04 pentru C. La un control de calitate o piesa este aleasă la întâmplare din producŃia acelei zile şi se constată că ea este defectă. Care este probabilitatea ca ea să fi fost produsă de maşina B? 24. Un aparat este construit din două unităŃi. Pentru ca aparatul să funcŃioneze trebuie ca ambele unităŃi să fie în stare bună. Într-un anumit interval de timp, însă, ele se pot defecta, în mod independent, cu probabilităŃile 0,1 şi respectiv 0,2. Ştiind că aparatul s-a defectat, se cere probabilitatea să se fi defectat numai prima unitate. 25. Tragerea de pe un avion contra altui avion inamic poate să se producă de la distanŃele de 800m, 600m, sau 400m. Probabilitatea ca tragerea să se producă de la 800m este 0,5, de la 600m este 0,3 şi de la 400m este 0,2. Probabilitatea doborârii avionului inamic de la distanŃa de 800m este 0,4, de la 600m, 0,6 şi de la 400m, 0,8. Se efectuează o tragere al cărei efect este doborârea avionului inamic. Să se determine probabilitatea ca ragerea sa se fi efectuat de la 600m. 26.Se presupune că un sistem de detecŃie poate greşi asupra prezenŃei unei Ńinte ( de exemplu un avion inamic) cu probabilitatea 0,05, iar în prezenŃa reală a Ńintei, o detectează cu probabilitatea 0,9. Presupunând că probabilitatea de apariŃie a unei Ńinte în zona sistemului de detecŃie este 0,25, să se determine probabilitatea unei alarme false, imediat ce sistemul primeşte un semnal relativ la prezenŃa Ńintei.

27. Într-o grupă de studenŃi sunt 20 de băieŃi şi 10 fete. Care este probabilitatea

ca alegând la întâmplare 10 studenŃi pentru a forma o echipă, aceasta să fie alcătuită din 6 băieŃi şi 4 fete?

28. Într-o ladă sunt 1000 de şuruburi, din care 40 nu au filet. Care este probabilitatea ca din 200 de şuruburi luate la întâmplare, 10 să fie fără filet? 29. Un vânzător are la vânzare 100 de cutii identice din care 30 sunt cu pantofi, iar restul cu bocanci. Până la ora 12 au fost vândute 10 cutii. Să se afle probabilitatea ca 3 cutii să fi fost cu bocanci.

62

30. Dintr-un lot de 40 de maşini de spălat primite la un magazin, 3 nu încălzesc apa. Un cumpărător achiziŃionează 2 maşini de spălat. Care este probabilitatea ca acestea să funcŃioneze perfect? 31. O urnă conŃine 7 bile albe, 6 bile negre şi 10 bile verzi. Se extrag 9 bile. Care este probabilitatea de a se obŃine câte 3 bile din fiecare culoare?

32. Pe un raft, într-un magazin, se aflǎ 50 de piese de acelaşi tip, care provin de la douǎ fabrici, respectiv 20 de la una dintre ele şi 30 de la cealaltǎ. Intr-o zi s-au vândut şase astfel de piese. Sǎ se calculeze probabilitatea sǎ se fi vândut acelaşi numǎr (câte trei) de piese de la cele douǎ fabrici.

33. Se aruncă 7 monede. Care este probabilitatea să apară de 5 ori marca?

34. Se aruncă un zar de 4 ori. Să se determine probabilitatea de a se

obŃine faŃa cu 5 puncte de 3 ori.

35. Se ştie că 3 studenŃi din 200 fac alergie la Coca-Cola. Care este

probabilitatea ca într-o grupă de 50 de studenŃi să fie 4 alergici?

36. Se aruncă 2 zaruri de 100 de ori. Care este probabilitatea ca de 20 de

ori să se obŃină suma punctelor 4?

37. O bancă creditează pe o perioadă determinată de timp 8 societăŃi

comerciale. Probabilitatea de solvabilitate a acestora este de 0,9. Să se

determine probabilitatea ca 5 societăŃi să fie solvabile.

38. Un lot de 20 de porumbei călători sunt trimişi spre o

destinaŃie.Probabilitatea ca un porumbel să se întorcă este 6,0=p şi este

aceeaşi pentru toŃi porumbeii. Se cere probabilitatea ca să se întoarcă 14

porumbei.

63

39. Probabilitatea ca un portar al unei echipe de fotbal să prindă mingea

la o lovitură de la 11 metri este 3,0=p . Se cere probabilitatea ca din 5

lovituri să nu ia nici un gol.

40. Un tren soseşte la ora fixată cu probabilitatea 0,9. Să se determine

probabilitatea ca într-o săptămână trenul să întârzie de două ori, ştiind că face

o singură cursa pe zi.

41. Intr-un joc faŃă de un adversar la fel de puternic, ce este mai probabil

să se câştige: 3 partide din 4, sau 5 din 8?

42. Dacǎ o familie are 6 copii, se cere sǎ se calculeze probabilitatea ca: a) patru din cei şase copii sǎ fie bǎieŃi; b)cel puŃin doi din cei şase copii sǎ fie bǎieŃi.

43. .La un magazin se gǎsesc articole de îmbrǎcăminte dintre care 90% satisfac standardele, 7% prezintǎ defecŃiuni retuşabile, iar 3% prezintǎ defecŃiuni neretuşabile. Sǎ se calculeze probabilitatea ca din şase articole luate la întâmplare, trei sǎ satisfacǎ standardele, douǎ sǎ fie retuşabile şi unul sǎ fie neretuşabil.

44. Se dau 3 loturi a câte 100 de piese. În fiecare lot există şi piese

defecte: 3 în primul lot, 4 în al doilea şi 5 în al treilea. Dacă luăm câte o piesă

din fiecare lot, care este probabilitatea să obŃinem 2 piese bune şi una

defectă?

44. Trei vânători trag simultan asupra unei Ńinte. Se ştie că

probabilităŃile ca vânătorii să nimerească Ńinta sunt de 0,7, 0,8, respectiv 0,6.

care este probabilitatea ca Ńinta să fie nimerită exact o singură dată?

45. O societate comercială se aprovizionează de la 4 furnizori. Acesta

estimează că probabilităŃile cu care furnizorii pot onora comenzile la

64

termenul stabilit sunt 5

41 =p ,

2

12 =p ,

7

33 =p ,

3

14 =p . Să se detrmine

probabilitatea ca toŃi furnizorii să-şi onoreze comenzile la termen.

46. Intr-o secŃie sunt 3 strunguri care execută piese mari şi piese mici.

Primul, execută 10% piese mici, al doilea execută 15% piese mici, iar al

treilea 75% piese mari. Se ia câte o piesă la întâmplare de la fiecare strung.

Care este probabilitatea ca 2 piese să fie mici şi una mare?

47. Pe 4 tăvi dintr-o cofetărie sunt câte 30 de prăjituri, printre care se

află 2, 3, 1, respectiv 2 prăjituri mai necoapte. Vânzătoarea ia la întâmplare

câte o prăjitură de pe fiecare tavă. Care este probabilitatea ca toate să fie

coapte bine?

48. Cinci maşini, care produc acelaşi tip de piese, dau rebuturi în

procente 2%, 1%, 5%, 4%, 6% respectiv. Se ia câte o piesǎ produsǎ de la fiecare. Sǎ se calculeze probabilitatea ca din cele cinci piese luate, exact douǎ sǎ fie rebut, precum şi probabilitatea ca cel puŃin una sǎ fie rebut.

49. Se dau variabilele aleatoare independente

2,01,03,0

4321

pX şi

aY

8

1

4

1

8

13201

.

a) Să se determine parametrii reali p şi a.

b) Să se calculeze YXYXYX ⋅++ ,,4,5 .

c) Să se calculeze media, momentele de ordin 2 şi 3 , precum şi dispersia

celor două variabile aleatoare.

50. Se dau variabilele aleatoare independente

++

3

1

3

1

6

1101

baX şi

−2122

3

1201

abaY .

65

a) Să se determine parametrii reali b şi a.

b) Să se calculeze YXYXYX ⋅++ ,32, .

c) Să se calculeze media, momentele de ordin 2 şi 3 , precum şi dispersia

celor două variabile aleatoare.

51. CalculaŃi valoare medie următoarelor variabile aleatoare:

a)

100

1

100

1

100

1

100

1100321

L

LX

b)

⋅⋅⋅⋅

100

1

100

1

100

1

100

1101100

1

43

1

32

1

21

1

L

L

Y

c)

99299 2

1

2

1

2

1

2

1100321

L

LZ .

52. O variabilă aleatoare X are repartiŃia

321

201

pppX . Dacă

( )3

1=XM şi ( )

3

4=XD , calculaŃi 321 ,, ppp .

53. Se aruncă 2 zaruri. Se acordă 12 puncte dacă suma punctelor de pe

cele două feŃe este 2 sau 12, 4 puncte dacă suma este 7 şi un punct pentru

celelalte cazuri. Să se scrie tabelul de distribuŃie al variabilei aleatoare N

ce ia dret valori numărul de puncte acordate celui care aruncă zarul.

CalculaŃi apoi valoarea medie şi dispersia acestei variabile.

54. Se experimentează 3 prototipuri de aparate. ProbabilităŃile ca

acestea să corespundă sunt respectiv 9,01 =p , 8,02 =p şi 7,03 =p . Să

se scrie tabelul de distribuŃie al variabilei aleatoare ce ia ca valori

66

numărul de prototipuri care corespund. CalculaŃi apoi valoarea medie şi

abaterea medie pătratică a acestei variabile.

55. La un antrenament, un jucător de baschet nimereşte în coş la o

singură aruncare a mingii cu probabilitatea 7,0 . Să se scrie tabelul de

distribuŃie al variabilei aleatoare ce ia ca şi valori numărul de nimeriri la

coş, atunci când jucătorul aruncă mingea de 4 ori. CalculaŃi apoi valoarea

medie şi abaterea medie pătratică a acestei variabile.

56. La o şedinŃă se convoacă prin telefon 4 persoane. Probabilitatea ca

la un singur apel să se găsească telefonul ocupat este 0,1, 0,3, 0,2 şi

respectiv 0,25. Să se scrie tabelul de distribuŃie al variabilei aleatoare care

ia drept valori numărul persoanelor care au răspuns la telefon, atunci când

se dă un singur telefon la fiecare din cele 4 persoane.

57. Fie A şi B două evenimente astfel încât ( )4

1=AP , ( )

2

1=BPA şi

( )4

1=APB . Definim o variabilă aleatoare X, astfel: 1=X , sau 0=X ,

după cum se realizează sau nu evenimentul A. Definim de asemenea o

variabilă aleatoare Y, astfel: 1=Y , sau 0=Y , după cum se realixează

sau nu evenimentul B. CalculaŃi ( )XM şi ( )YM .

58. Fie funcŃia RRf →: , ( ) [ ]( ) ( )

+∞∪−∞−∈

−∈=

,11,,0

1,1,2

x

xkxxf , unde

Rk ∈ .

a) Să se determine parametrul real k astfel încât funcŃia f să fie o funcŃie

densitate de probabilitate.

b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de

repartiŃie de f.

67

c) Să se determine funcŃia de repartiŃie corespunzătoare.

59. Fie funcŃia RRf →: , ( ) [ ]

( ) ( )

+∞∪−∞−∈

−∈+=

,11,,0

1,1,1 2

x

xx

a

xf , unde Ra∈ .

a) Să se determine parametrul real a astfel încât funcŃia f să fie o funcŃie

densitate de probabilitate.

b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de

repartiŃie de f.

c) Să se determine funcŃia de repartiŃie corespunzătoare.

60. Fie funcŃia RRf →: , ( )[ ]

( ) ( )

+∞∪−∞−∈

−∈−=

,,,0

,,22

aax

aaxxa

a

xf , unde

Ra∈ .

a) Să se determine parametrul real a astfel încât funcŃia f să fie o funcŃie

densitate de probabilitate.

b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de

repartiŃie de f.

c) Să se determine funcŃia de repartiŃie corespunzătoare.

61. Fie funcŃia RRf →: , ( )[ ]

( ) ( )

+∞∪∞−∈

∈−−=

,20,,0

2,0,11

x

xxxf

Să se precizeze dacă f este o funcŃie densitate de probabilitate şi în caz

afirmativ, calculaŃi valoarea medie şi dispersia variabilei aleatoare

( )Rx

xf

xX

.

68

62. O variabilă aleatoare continuă X are funcŃia densitate de

probabilitate RRf →: , ( ) [ ]

( ) ( )

+∞∪∞−∈

∈=

,0,,0

,0,ln

ax

axx

ac

xf , unde a este fixat şi

Rc∈ .

a) Să se calculeze valoarea parametrului real c.

b) Să se scrie funcŃia de repartiŃie a variabilei aleatoare X.

c) Să se calculeze media şi dispersia variabilei aleatoare X.

63. Se consideră funcŃia RRf →: ,

( ) [ ]

( ) ( )

+∞+∪−∞−∈

+−∈=

,11,,0

1,1,1

aax

aaxxxf , unde Ra∈ .

a) Să se determine parametrul real a astfel încât funcŃia f să fie o funcŃie

densitate de probabilitate.

b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de

repartiŃie de f.

c) Să se determine funcŃia de repartiŃie corespunzătoare.

64. Fie X o variabilă aleatoare continuă cu funcŃia densitate de

probabilitate

RRf →: , ( )

>=

0,0

0,!x

xem

x

xfx

m

, unde *Nm∈ . CalculaŃi media şi

dispersia acestei variabile aleatoare.

69

TESTE DE AUTOEVALUARE

TEST 1

1. Se consideră funcŃia

RRf →: , ( )

[ ]

](

( ) ( )

+∞∪∞−∈

=

,20,,0

2,1,2

1

1,0,32

x

xax

xxa

xf , unde Ra∈ .

a) Să se determine parametrul real a astfel încât funcŃia f să fie o funcŃie

densitate de probabilitate.

b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de

repartiŃie de f.

c) Să se determine funcŃia de repartiŃie corespunzătoare.

2. Intr-un lot de 100 de piese prelucrate la un strung, 10 sunt defecte. Pentru

un control de calitate, se extrag la întâmplare 3 piese. Să se scrie tabelul de

distribuŃie al variabilei aleatoare care ia ca valori numărul de piese defecte

extrase. CalculaŃi apoi valoarea medie şi dispersia acestei variabile.

3.Se presupune că un sistem de detecŃie poate greşi asupra prezenŃei unei

Ńinte ( de exemplu un avion inamic) cu probabilitatea 0,05, iar în prezenŃa

reală a Ńintei, o detectează cu probabilitatea 0,9. Presupunând că

probabilitatea de apariŃie a unei Ńinte în zona sistemului de detecŃie este 0,25,

să se determine probabilitatea unei alarme false, imediat ce sistemul primeşte

un semnal relativ la prezenŃa Ńintei.

TEST 2

70

1. Se aruncă 2 zaruri. Se acordă 12 puncte dacă suma punctelor de pe cele

două feŃe este 2 sau 12, 4 puncte dacă suma este 7 şi un punct pentru

celelalte cazuri. Să se scrie tabelul de distribuŃie al variabilei aleatoare N

ce ia dret valori numărul de puncte acordate celui care aruncă zarul.

CalculaŃi apoi valoarea medie şi dispersia acestei variabile.

2. Un tren soseşte la ora fixată cu probabilitatea 0,9. Să se determine

probabilitatea ca într-o săptămână trenul să întârzie de două ori, ştiind că face

o singură cursa pe zi.

3. Fiecare coeficient al ecuaŃiei trigonometrice batgx = este determinat prin aruncarea unui zar şi luarea numărului de puncte ieşit. Care este

probabilitatea ca ecuaŃia dată să admită soluŃiile ,...1,0,4

=+= kka ππ

?

TEST 3

1. Un vânzător are la vânzare 100 de cutii identice din care 30 sunt cu pantofi, iar restul cu bocanci. Până la ora 12 au fost vândute 10 cutii. Să se afle probabilitatea ca 3 cutii să fi fost cu bocanci. 2. Intr-o secŃie sunt 3 strunguri care execută piese mari şi piese mici. Primul,

execută 10% piese mici, al doilea execută 15% piese mici, iar al treilea 75%

piese mari. Se ia câte o piesă la întâmplare de la fiecare strung. Care este

probabilitatea ca 2 piese să fie mici şi una mare?

P.12. Fie funcŃia RRf →: , ( )[ ]

( ) ( )

+∞∪−∞−∈

−∈−=

,,,0

,,22

aax

aaxxa

a

xf , unde

Ra∈ .

a) Să se determine parametrul real a astfel încât funcŃia f să fie o funcŃie

densitate de probabilitate.

71

b) Să se calculeze media şi dispersia variabilei aleatoare cu densitatea de

repartiŃie de f.

c) Să se determine funcŃia de repartiŃie corespunzătoare.

72

MODULUL II

ELEMENTE DE STATISTICĂ MATEMATICĂ

UNITATEA DE STUDIU VI

ELEMENTE DE STATISTICĂ DESCRIPTIVĂ

VI.1. Obiectul statisticii Numeroase fenomene din viaŃa economică şi socială, din fizică,

biologie, psihologie etc. necesită în studiul lor un instrument matematic special: statistica matematica.

De exemplu, pentru a cunoaşte starea de spirit a populaŃiei unei tări înaintea alegerilor, nu pot fi chestionaŃi toŃi cetăŃenii, ci se efectuează un sondaj de opinie, adică se stabileşte un eşantion reprezentativ al populaŃiei, numeric limitat, se calculează procentul cetăŃenilor care au o anumită opinie, după care se extrapolează rezultatul la întreaga populaŃie.

Aşadar statistica utilizează raŃionamente inductive : prin inducŃie se ajunge de la parte la intreg. Din punct de vedere al preciziei, raŃionamentul inductiv este mai puŃin precis decât cel deductiv. Prin urmare, afirmaŃiile se fac cu un anumit grad de neîncredere, deci cu erori.

Statistica are ca obiect sistematizarea, analiza, prelucrarea şi interpretarea datelor referitoare la anumite fenomene în vederea studierii pe cale inductivă a fenomenelor aleatoare de masă precum şi în vederea realizării de previziuni privind producerea unor anumite fenomene. Vom studia pe rând elemente de statistica descriptiva şi statistică analitică (matematică)

Statistica descriptivă se ocupă de culegerea , gruparea şi analiza datelor rezultate din observaŃia diferitelor fenomene.

Statistica matematică elaborează o metodologie fundamentată pe teoria probabilităŃilor care să asigure o verosimilitate cât mai mare în raŃionamentele cu caracter inductiv.

73

VI.2. Limbajul statisticii Există câteva elemente şi concepte comune tuturor cercetărilor statistice, concepte care alcătuiesc limbajul de bază al statisticii.

• PopulaŃia (colectivitatea) statistică reprezintă totalitatea elementelor de aceeaşi

natură, care au trăsături esenŃiale comune şi care sunt supuse unui studiu statistic. Termenul de populaŃie nu se referă doar la un grup de persoane. Prin populatie se înŃelege o mulŃime de obiecte, păreri, evenimente, opinii etc. O populaŃie statistică include întreaga colecŃie de obiecte sau observaŃii pe care le analizăm statistic pentru a trage concluzii. In genearal, populaŃia este bine definită în timp, spaŃiu şi ca formă organizatorică şi în plus este considerată a fi finită.

• Eşantionul reprezintă un subset de elemente selectate dintr-o colectivitate

statistică. Cu cât este mai numeroasă o colectivitate, cu atât devine mai dificilă cercetarea tuturor elementelor ei, fiind consumatoare de timp şi costisitoare. In acest caz soluŃia este extragerea unei subcolectivităŃi (eşantion) din colectivitatea generală. In felul acesta se vor estima parametrii populaŃiei totale pe baza rezultatelor obŃinute în eşantion, iar ceea ce a fost determinat ca fiind tipic, esenŃial şi caracteristic în eşantion, se presupune că ar fi fost găsit şi dacă s-ar fi cercetat colectivitatea generală. Exactitatea acestei presupuneri depinde de modul în care a fost extras eşantionul, iar de acurateŃea acestui proces depinde succesul mersului statistic. Reprezentativitatea eşantionului este aşadar aspectul crucial al oricărui proces de cercetare pe bază de sondaj statistic.

• InferenŃa statistică reprezintă o decizie, o estimaŃie, o predicŃie sau o generalizare privitoare la o colectivitate generală, bazată pe informaŃiile statistice obŃinute pe un eşantion.

• Unitatea statistică reprezintă elementul constitutiv al unei colectivităŃi şi care este purtătorul fiecărei trăsaturi supuse observării şix cercetării statistice. Definirea clară a unităŃii statistice trebuie să evite orice ambiguitate, să facă posibilă identificarea ei exactă şi să fie posibilă înregistrarea datelor statistice. UnităŃile statistice pot fi simple sau complexe. UnităŃile complexe sunt rezultate ale organizării sociale sau economice (ex. familia).

• Caracteristica statistică reprezintă trasatura comuna tuturor unitătilor unei colectivităŃi şi care variază ca nivel, sau valoare de la o unitate

74

la alta a colectivităŃii. Este numită şi variabilă statistică sau variabilă aleatoare. Caracteristicile statistice se pot clasifica după mai multe criterii, astfel: După modul de exprimare:calitative( nominative) ;cantitative (numerice). După numărul variantelor de răspuns:alternative ( binare);nealternative. După natura variaŃiei caracteristicilor numerice:continue;discrete. După conŃinut:de timp;de spaŃiu;atributive.

VI.3. Serii statistice

Analiza statistică a unui fenomen, în raport cu o singură caracteristică ne conduce la o serie de perechi de valori care poartă denumirea de serie statistică. DefiniŃia VI.3.1. Fie o populaŃie statistică având o caracteristică X

care ia valorile pxxx ,..., 21 şi in cu pi ,1= numărul de unităŃi statistice

pentru care caracteristica X ia valoarea ix . MulŃimea perechilor ( )piii nx ,1, = se

numeşte serie statistică, iar numerele in se numesc frecvenŃe absolute. O serie statistică este de obicei prezentată sub forma unui tabel de tipul următor: Valoarea caracteristicii ( ix ) 1x 2x .......................

px

FrecvenŃa absolută ( in ) 1n 2n ....................... pn

Există şi serii statistice în care valorile caracteristicii urmărite sunt exprimate prin intervale. In acest caz, spunem că avem o serie statistică în care distribuŃia frecvenŃelor este pe intervale.: Valoarea caracteristicii ( [ )1, +ii xx )

[ )21 , xx [ )32 , xx ....................... [ )1, +pp xx

FrecvenŃa absolută ( in ) 1n 2n ....................... pn

75

DefiniŃia VI.3.2. Fie ( )piii nx ,1, = o serie statistică cu efectivul total al

populaŃiei ∑=

=p

i

inN1

. Numărul N

nf ii = se numeşte frecvenŃa relativă a

valorii ix .

DefiniŃia VI.3.3. Fie ( )

piii nx ,1, = o serie statistică. Numărul

∑=

=i

k

ki nN1

, reprezentând suma tuturor frecvenŃelor absolute până la in

inclusiv, se numeşte frecvenŃă absolută cumulată crescător. DefiniŃia VI.3.4. Fie ( )

piii nx ,1, = o serie statistică. Numărul

∑=

=p

ik

ki nN* , reprezentând suma tuturor frecvenŃelor absolute care apar

începând cu in inclusiv, se numeşte frecvenŃă absolută cumulată

descrescător.

VI.4. Indicatori sintetici ai seriilor statistice

Analiza frecvenŃelor unei serii statistice are neajunsul de a manipula întreaga cantitate de date, respectiv toate valorile distribuŃiei statistice. Pentru a elimina acest neajuns sun utilizaŃi aşa- numiŃii indicatori sintetici. Ei sunt descriptori umerici ce condensează într-o valoare unică o anumită caracteristică a întregii serii statitice. Principalele avantaje ale acestor indicatori sunt concentrarea semnificaŃiei şi uşurinŃa utilizării. In acelaşi timp însă, dată fiind natura lor sintetică, prezintă şi dezavantaje, în sensul că fiecare indicator pierde o anumită cantitate de informaŃie care Ńine de alte caracteristici pe care nu le surprinde. Există 3 clase mari de indicatori sintetici:

a) Indicatori ai tendinŃei centrale: sunt valori tipice pentru întreaga distribuŃie.

b) Indicatori ai împrăştierii: sunt valori ce descriu caracteristica de împrăştiere a distribuŃiei.

76

c) Indicatori ai formei distribuŃiei: se referă la forma curbei de reprezentare grafică a distribuŃiei.

a) Indicatori ai tendinŃei centrale

a1) Mărimi medii i) Media aritmetică Media aritmetică a valorilor individuale nxxx ,....,, 21 ale

caracteristicii numerice X reprezintă acea valoare care s-ar fi înregistrat dacă toŃi factorii de influenŃă ar fi acŃionat constant (cu aceeaşi intensitate) la nivelul fiecărei unităŃi înregistrate. Aceasta înseamnă că dacă media aritmetică ar substitui fiecare o valoare individuală ix ,

i = n,1 ,valoarea totalizată obiectiv formată a caracteristicii urmărite nu s-ar modifica. DefiniŃia VI.4.1. Fiind dată seria statistică ( )

piii nx ,1, = , numărul

=

==p

i

i

p

i

ii

n

nx

x

1

1 se numeşte valoarea medie a seriei statistice.

ObservaŃii. i)DefiniŃia dată valorii medii este adevarată numai dacă valorile individuale înregistrate sunt numerice.

ii) Valoarea medie este unică. iii) Suma diferenŃelor dintre toate valorile individuale înregistrate şi

media lor aritmetică este nulă: ( )∑=

=−p

i

i xx1

0 .

iv) Media aritmetică este legată de toate valorile numerice înregistrate. Prin urmare ea este sensibilă la prezenŃa valorilor aberante ( valori foarte mari, sau foarte mici, în comparaŃie cu majoritatea datelor înregistrate). ExistenŃa unor astfel de valori are drept efect o valoare medie nereprezentativă pentru caracteristica studiată.

v) Dacă avem o serie statisticăîn care distribuŃia se face pe intervale, pentru a calcula o valoare medie căt mai apropiată de cea reală se vor lua în calcul centrele intervalelor e forma [ )1, +ii xx .

77

Teorema VI.4.1. Dacă x este valoarea medie a unei serii statistice

( )piii nx ,1, = , atunci bxa + este valoarea medie a seriei ( )

piii nbax ,1, =+ .

ObservaŃie. Această teoremă ne permite un calcul mai rapid al valorii medii atunci când dispunem de un număr mare de valori ale caracteristicii studiate, valori exprimate prin numere mari. Practic, în loc să calculăm media

y a unei serii ( )piii ny ,1, = , calculăm media x a seriei ( )

piii nx ,1, = cu

a

byx ii

−= , iar apoi avem că bxay += .

ii)Media armonică Media armonică se defineşte ca valoarea inversă a mediei aritmetice a inverselor valorilor individuale înregistrate. Aplicarea mediei armonice pentru exprimarea numerică a tendinŃei centrale are sens numai dacă este obiectivă însumarea inverselor valorilor individuale. DefiniŃia VI.4.2. Fiind dată seria statistică ( )

piii nx ,1, = , numărul

=

==p

i i

i

p

i

i

h

x

n

n

x

1

1 se numeşte medie armonică a seriei statistice.

ObservaŃii. i)Media armonică este mai mică decât media aritmeticăa pentru aceleaşi valori pozitive. ii) In cazul în care între două variabile există o relaŃie de inversă

proporŃionalitate, (x

y1

= ) aceasta se pastrează şi între mediile calculate

pentru fiecare variabilă. iii) Media armonică se foloseşte pentru calculul valorii medii a unei serii statistice în care valorile caracteristicii urmărite sunt, la rândul lor, valori medii. iii)Media pătratică (sau momentul iniŃial de ordinul doi)

Media pătratică ( px ) exprimă tendinŃa centrală a valorilor numerice înregistrate pentru variabila observată dacă are sens obiectiv însumarea pătratelor valorice individuale. Ea reprezintă acea valoare a caracteristicii care, dacă ar înlocui fiecare valoare individuală din serie, suma pătratelor termenilor seriei nu s-ar modifica.

78

DefiniŃia VI.4.3. Fiind dată seria statistică ( )piii nx ,1, = , numărul

=

==p

i

i

p

i

ii

p

n

nx

x

1

1

2

se numeşte medie pătratică a seriei statistice.

ObservaŃii. i)Cu toate că media pătratică se poate calcula atât pentru valori individuale pozitive, nule sau negative, ea nu are sens din punct de vedere economic decât dacă se calculează pentru valori pozitive. ii)Valoarea mediei pătratice este mai mare decât cea a mediei aritmetice atunci când ele se calculează cu aceleaşi date. iii) Media pătratică se utilizează frecvent la calculul abaterii medii pătratice, adică a abaterii valorilor caracteristicii faŃă de valoarea lor medie. . iv) Media geometrică Spre deosebire de tipurile de medii prezentate anterior, care au la bază o relaŃie de aditivitate între termenii unei serii statistice, media geometrică se calculează pe baza unei relaŃii obiective multiplicative între termenii aceleiaşi

serii. Prin urmare, media geometrică ( gx ) reprezintă acea valoare a

caracteristicii observate care, dacă ar înlocui fiecare valoare individuală din serie, produsul acestora nu s-ar modifica.

DefiniŃia VI.4.4. Fiind dată seria statistică ( )piii nx ,1, = , numărul

gx =pp

i

ix

1

1

∏=

se numeşte medie geometrică a seriei statistice. ObservaŃii. i) Media geometrică uneori se mai numeşte şi medie logaritmică deoarece se poate determina prin logaritmii valorilor individuale, după cum urmează:

( )n

x

x

n

i

i

g

∑== 1

lnln , de unde

= ∑

=

n

i

ig xn

x1

ln1

exp

ii) Dacă cel puŃin o valoare individuală este nulă sau negativă, calculul mediei geometrice este lipsit de sens. iii) Media geometrică se utilizează frecvent pentru calculul indicelui mediu al dinamicii, pentru caracterizarea tendinŃei centrale din seria indicilor de dinamica cu baza mobilă.

79

. a2)Indicatori de poziŃie Caracterizarea tendinŃei centrale în seriile statistice presupune luarea în considerare nu numai a valorilor individuale ale caracteristicii urmărite, dar şi a formei în care se repartizează unităŃile colectivităŃii după caracteristica respectivă. De multe ori, informaŃii mult mai utile fundamentării deciziilor, decât cele oferite de indicatorii medii, le furnizează indicatorii de poziŃie. Aceasta înseamnă că pentru caracterizarea tendinŃei centrale în seriile statistice rolul de valoare tipică poate fi jucat nu numai de medie ci şi de indicatorii de poziŃie: modul , mediana si cuantilele.

i)Valoarea modală (valoarea dominantă sau modul) DefiniŃia VI.4.5. Fiind dată seria statistică ( )

piii nx ,1, = , modul

reprezintă acea valoare kx a caracteristicii , pentru care frecvenŃa kn este

maximă. ObservaŃie. Pot exista mai multe valori modale.

Calcul. Pentru o serie avănd distribuŃia frecvenŃelor pe intervale, valoarea modală se calculează astfel:

• Se idetifică intervalul modal, ca fiind acel interval pentru care frecvenŃa este maximă.

• Se calculează modul după formula:

21

1000 ∆+∆

∆+= jMjM hxM ,

unde: 0jMx - limita inferioară a intervalului modal “j”;

0jMh - marimea intervalului modal;

1∆ - diferenŃa dintre frecvenŃa intervalului modal şi frecvenŃa intervalului predecesor; 2∆ - diferenŃa dintre frecvenŃa intervalului modal şi cea a intervalului succesor. ii) Mediana DefiniŃia VI.4.6. Fiind dată seria statistică ( )

piii nx ,1, = , mediana

reprezintă acea valoare a caracteristicii localizată în mijlocul unei serii statistice în care valorile au fost ordonate.

80

Cu alte cuvinte, mediana împarte populaŃia statistică ordonată în două părŃi: jumătate cu valori superioare medianei şi jumătate cu valori inferioare medianei. Calcul. Pentru o serie statistică ( )

piii nx ,1, = , mediana se calculează astfel:

• Se cumulează crescător frecvenŃele; • Mediana este acea valoare a caracteristicii care corespunde primei

frecvenŃe

cumulate crescător mai mare decât 2

11∑=

+p

i

in

.

Pentru o serie în care distribuŃia frecvenŃelor se face pe intervale, mediana se calculează astfel:

• Se cumulează crescător frecvenŃele; Se determină intervalul median ca fiind primul interval a cărui frecvenŃă

cumulată este mai mare decât 2

11∑=

+p

i

in

.

• Se determină mediana după formula:

Me

Me

p

i

i

n

F

n

hxMe1

1

02

1

−= −

+

+=

,

unde:

0x - limita inferioară a intervalului median;

0h - marimea intervalului median;

Men - frecvenŃa intervalului median;

1−MeF - frecvenŃa cumulată crescător a intervalului predecesor celui median.

iii) Cuantilele Cuantilele sunt indicatori care descriu anumite poziŃii localizate în mod particular în cadrul seriilor statistice.. Conceptul de “cuantilă” indică o divizare a distribuŃiei observaŃiilor într-un număr oarecare de părŃi.

DefiniŃia VI.4.7. Cuantilele de ordin “r” sunt valori ale caracteristicii urmărite care împart distribuŃia ordonată a observaŃiilor în “r” părŃi egale. Fiecare parte are acelaşi efectiv, adică l/r din numărul total al unităŃilor statistice. Frecvent se utilizează următoarele cuantile:

81

*mediana sau cuantila de ordinul 2 (r=2); *cuartilele sau cuantilele de ordinul 4 (r=4); *decilele sau cuantilele de ordinul 10 (r=10); *centilele sau cuantilele de ordinul 100 (r=100)

Cuantilele de ordin superior (r > 4) se calculeaza in cazul distributiilor cu numar mare de grupe sau clase de valori individuale.

b)Indicatori ai împrăştierii ( de variaŃie) Un exemplu simplu sugerează insuficienŃa indicatorilor tendinŃei centrale în caracterizarea uni serii statistice: să presupunem că doi elevi au obŃinut la un anumit obiect următoarele note:

7786:

96103:

Y

X

Se observă că media aritmetică a celor doi elevi este aceeaşi: 7. Această notă insă, caracterizează mult mai bine notele elevului Y, decât pe cele ale lui X, care sunt foarte dispersate. In cele ce urmează vom descrie indicatorii de variaŃie care stabilesc în ce măsură o medie va caracteriza valorile unei serii statistice, dacă acestea sunt mai apropiate sau mai îndepărtate de medie. Se disting două tipuri de indicatori de variaŃie: b1) indicatori simpli ai variaŃiei (calculaŃi la nivelul unei unităŃi statistice); b2) indicatori sintetici ai variaŃiei (calculaŃi la nivelul întregii populaŃii statistice). b1)Indicatorii simpli ai variaŃiei

Această clasă de indicatori compară sub formă de diferenŃă mărimea a doi termeni ai seriei sau mărimea unui termen al seriei cu nivelul mediu al acesteia. Se exprimă în unitatea de măsură a caracteristicii pentru care s-au calculat. i)Amplitudinea absolută a variaŃiei:

82

DefiniŃia VI.4.8. Intro serie statistică ( )piii nx ,1, = amplitudinea

absolută a variaŃiei este diferenŃa dintre cea mai mare şi cea mai vică valoare a caracteristicii studiate

minmax xxA −=

ObservaŃii:

i)Dacă cele două valori extreme sunt valori aberante, amplitudinea nu mai prezintă o semnificaŃie deosebită (este sensibilă la valorile extreme). ii)Nu poate fi folosită în comparaŃii, decât pentru serii care se referă la aceeaşi caracteristică (care se exprimă în aceeaşi unitate de măsură). iii)Este destul de instabilă, pe măsura adăugării de noi date. iv)Dacă într-o distribuŃie de frecvenŃe pe intervale de valori nu se cunosc limitele inferioară şi superioară, atunci amplitudinea nu poate fi calculată, decât făcând anumite presupuneri pe baza mărimii intervalelor de grupare. v) Amplitudinea se utilizează frecvent în prelucrarea statistică la alegerea numărului de intervale de grupare a datelor şi la stabilirea mărimii intervalelor. ii) Abaterile individuale DefiniŃia VI.4.9. Intro serie statistică ( )

piii nx ,1, = abaterile

individuale exprimă cu câte unităŃi de măsură se abate o numită valoare a caracteristicii studiate de la valoarea medie. Abaterea individuală absolută :

xxd ii −= , pi ,1= .

Abaterea maximă pozitivă (în expresie absolută):

xxd −=+maxmax .

Abaterea maximă negativă (în expresie absolută):

xxd −=−minmax .

b2) Indicatorii sintetici Indicatorii sintetici ai împrăştierii, spre deosebire de indicatorii simpli, sintetizează într-o singură expresie numerică variaŃia valorilor caracteristicilor unei serii statistice corespunzătoare unei populaŃii statistice. La baza determinării indicatorilor sintetici stau abaterile individuale, dar pentru a se evita compensarea acestora, ele vor fi utilizate în valoare absolută, sau se va opera cu pătratele acestora. i)Abaterea medie liniară

83

DefiniŃia VI.4.10. Abaterea medie liniară reprezintă media

aritmetică simplă sau ponderată a abaterilor tuturor valorilor individuale luate în valoarea absolută, ale termenilor seriei faŃă de media lor.

Arată cu câte unităŃi de măsură concrete s-a modificat în medie un termen al seriei faŃă de nivelul mediu al acesteia. Pentru serie statistică ( )

piii nx ,1, = avem că abaterea medie liniară este

dată de

=

=

−=

p

i

i

p

i

ii

n

xxn

d

1

1 .

In cazul în care avem o serie cu distribuŃia frecvenŃelor pe intervale, pentru calculul abaterii medii liniare se vor lua în considerare centrele intervalelor de forma [ )1, +ii xx .

ii) Dispersia (sau varianŃa)

DefiniŃia VI.4.11. Dispersia este media aritmetică simplă sau ponderată a pătratelor abaterilor individuale absolute, ale termenilor seriei faŃă de media lor.

Pentru serie statistică ( )piii nx ,1, = avem că dispersia este dată de

( )

=

=

−=

p

i

i

p

i

ii

n

xxn

D

1

1

2

.

ObservaŃii: i)Dispersia nu are unitate de măsură; ii)Cu cât este mai apropiată de 0 cu atât variaŃia este mai mică; cu cât este mai depărtată de 0, cu atât variaŃia este mia mare. iii) Cu cât valorile caracteristicii urmărite sunt mai omogene ( mai apropiate între ele), cu atât mărimea dispersiei este mai mică .

ProprietăŃi . 1. Pentru un şir de valori constante, dispersia este întotdeauna nulă.Altfel spus, dacă toate valorile individuale sunt egale între ele (ceea ce ar însemna omogenitate perfectă) dispersia este nulă. 2. Dacă într-o serie statistică fiecare termen se măreşte sau se micşorează cu o aceeaşi constantă „a”, atunci dispersia seriei nu se modifică.

84

3. Dacă într-o serie statistică, fiecare termen se măreşte sau se micşorează de un acelaşi număr de ori (h), atunci dispersia seriei se va modifica şi ea în acelaşi sens de „h2” ori, faŃă de dispersia seriei iniŃiale. ObservaŃie. Aceste proprietăŃi sugerează posibilitatea de a calcula dispersia printr-o expresie care simplifică operaŃiile de calcul fără să afecteze rezultatul. RelaŃia de calcul simplificat a dispersiei:

( )22

1

1

2

cxh

n

nh

cx

Dn

i

i

p

i

ii

−−

=

=

= ,

unde, de regulă, c şi h sunt valori convenabil stabilite. De exemplu, în cazul distribuŃiei pe intervale egale de grupare se consideră c= centrul intervalului cu cea mai mare frecvenŃă şi h=mărimea intervalului de grupare.

. iii) Abaterea medie pătratică (sau abatere standard, sau deviaŃie standard)

DefiniŃia VI.4.12. Abaterea medie pătratică este media pătratică simplă sau ponderată a abaterilor individuale absolute faŃă de medie:

Pentru serie statistică ( )piii nx ,1, = avem că abaterea medie pătratică

este dată de

( )

=

=

−==

p

i

i

p

i

ii

n

xxn

D

1

1

2

σ .

ObservaŃie. In analizele statistice se preferă abaterea medie pătratică în locul dispersiei deoarece este un parametru al legii de repartiŃie normale şi majoritatea metodelor de prelucrare statistică au la bază ipoteza normalităŃii repartiŃiilor. iv)Coeficientul de variaŃie (Coeficient de omogenitate)

85

DefiniŃia VI.4.13. Coeficientul de variaŃie este indicatorul sintetic al variaŃiei care măsoară în mod relativ şi sintetic gradul de împrăştiere a

valorilor faŃă de tendinŃa centrală a seriei: 100⋅=x

.

ObservaŃie. Coeficientul de omogenitate nu depinde de unitatea de

măsură a caracteristicii urmărite, de aceea poate fi folosit pentru a compara omogenitatea sau, dimpotrivă, eterogenitatea a două sau mai multe serii, care se referă la variabile diferite.

ProprietăŃi: -dacă valoarea coeficientului de variaŃie este mai mică sau cel mult egală cu 30 - 35%, atunci seria este omogenă şi media este reprezentativă pentru valorile din care s-a calculat. -dacă, dimpotrivă, valoarea coeficientului de variaŃie este de peste 65-70%, seria este eterogenă, media calculată îşi pierde semnificaŃia şi nu mai este reprezentativă.

c) Indicatori ai formei distribuŃiei Această categorie e indicatori ne permite să analizăm seriile statistice în funcŃie de curba de reprezentare a frecvenŃelor. Concret se va analiza simetria/asimetria şi aplatizarea/boltirea curbei frecvenŃelor. c1) Simetria/ Asimetria distribuŃiilor statistice Asimetria este dată de diferenŃa dintre valoarea medie şi cea modală:

• Dacă Mox = , spunem că avem o distribuŃie simetrică. In acest caz, observaŃiile înregistrate sunt egal dispersate de o parte şi de alta a valorii lor medii..

• Dacă Mox > , spunem că avem asimetrie pozitivă („ coadă la dreapta”).

• Dacă Mox < , spunem că avem asimetrie negativă („coadă la stânga”).

Pentru a aprecia calitativ asimetria se utilizează frecvent anumiŃi coeficienŃi adimensionali. i) Coeficientul de asimetrie Pearson:

σMox

Cas

−=

86

Pentru repartiŃii moderat asimetrice, există relaŃia: ( )MexMox −≈− 3 şi drept urmare

σMex

Cas

−≈ 3

Interpretare: Coeficientul de asimetrie Pearson ia valori în intervalul [ ]1,1 +− .

Dacă MoMexCas ==⇒= 0 , seria este perfect simetrică.

Dacă MoMexCas >>⇒> 0 , seria este pozitiv asimetrică, în ea predominând valorile mici;

Dacă MoMexCas <<⇒<0 , seria este negativ asimetrică, în ea predominând valorile mari;

Dacă Cas ia valori apropiate de ±1, distribuŃia are asimetrie pronunŃată (pozitivă sau negativă); Dacă Cas ia valori apropiate de 0, distribuŃia are asimetrie uşoară (pozitivă sau negativă). ii) Coeficientul de asimetrie Fisher:

33

σµ

=FC ,

unde

( )

=

=

−=

p

i

i

p

i

ii

n

xxn

1

1

3

3µ este momentul centrat de ordin 3.

Interpretare: Dacă 0=FC , seria este perfect simetrică..

Dacă 0>FC , seria este pozitiv asimetrică.

Dacă 0<FC , seria este negativ asimetrică. c2) Aplatizarea / Boltirea distribuŃiilor statistice Graficele seriilor statistice pot fi comparate cu clopotul lui Gauss corespunzător repartiŃiei normale. In comparaŃie cu acesta, graficele pot fi mai mult sau mai puŃin boltite/ aplatizate. Există indicatori care dau o măsură a gradului de aplatizare/ boltire. i) Coeficientul de aplatizare :

87

44

σµ

=AC ,

unde

( )

=

=

−=

p

i

i

p

i

ii

n

xxn

1

1

4

4µ este momentul centrat de ordin 4.

Interpretare: Dacă 3=AC seria are o distribuŃie echivalentă cu cea normală.

Dacă 3>AC seria are o reprezentare grafică cu vârf mai ascuŃit şi cozi mai lungi decât în cazul repartiŃiei normale. Dacă 3<AC seria are o reprezentare grafică cu vârf mai turtit şi cozi mai scurte decât în cazul repartiŃiei normale. ii) Coeficientul de exces:

3−= ACEx

Interpretare: Dacă 0=Ex seria are o distribuŃie echivalentă cu cea normală. Dacă 0>Ex seria are o reprezentare grafică cu vârf mai ascuŃit şi cozi mai lungi decât în cazul repartiŃiei normale. Dacă 0<Ex seria are o reprezentare grafică cu vârf mai turtit şi cozi mai scurte decât în cazul repartiŃiei normale.

88

UNITATEA DE STUDIU VII

ELEMENTE DE TEORIA SELECłIEI

VII.1. NoŃiunea de selecŃie. Momente de selecŃie

Presupunem că avem o colectivitate Γ , discretă sau continuă, de volum N pentru care este nepractică sau imposibilă cunoaşterea individuală a tuturor elementelor ce o constituie. FaŃă de această colectivitate se cercetează o proprietate sau un fenomen care generează o variabilă aleatoare X. Pentru aceasta se va considera o subcolectivitate γ ( numită şi eşantion, selecŃie sau sondaj ) cu volumul n . Avem deci Γ⊂γ şi Nn < . Vom cerceta proprietatea sau fenomenul care defineşte variabila X în Γ prin intermediul valorilor ce le ia X în γ . Considerăm nXXX ,...,, 21 variabile aleatoare ce reprezintă valorile

variabilei X observate la elementele din γ . Dacă sondajul este efectuat la

întâmplare, variabilele njX j ,1, = au aceeaşi şansă de a se realiza. De aceea,

ele determină următoarea variabilă aleatoare discretă cu distribuŃie uniformă:

nnn

XXX

Xn

1...

11...21

* ,

pe care o numim variabilă de selecŃie. X se numeşte variabilă teoretică. DefiniŃia VII.1.1. Numim medie de selecŃie expresia

( ) ∑=

==n

i

iXn

XMm1

** 1.

DefiniŃia VII.1.2. Numim moment de selecŃie de ordin k expresia

( )( ) ( )∑=

==n

i

k

i

k

k Xn

XMM1

** 1.

DefiniŃia VII.1.3. Numim moment centrat de selecŃie de ordin k expresia

( )∑=

−=n

i

k

ik mXn 1

** 1µ .

DefiniŃia VII.1.4. Numim dispersie de selecŃie expresia

( )∑=

−==n

i

i mXn

D1

2**2

* 1µ .

89

Spunem că o selecŃie este corect efectuată atunci când caracteristicile variabilei teoretice X sunt egale cu cele ale variabilei de selecŃie *X . Ideal ar fi cazul în care ( ) ( )*XMXM = , ( ) ( )*XMXM kk = , ( ) ( )*XDXD = .

Intrucât variabila teoretică X este necunoscută, nici caracteristicile sale numerice nu sunt cunoscute. De aceea, în practică se procedează oarecum invers:

- se alege subcolectivitatea γ şi se obŃine variabila de selecŃie *X ;

- se deterimnă caracteristicile variabilei de selecŃie *X ; - se cercetează în ce condiŃii valorile obŃinute pentru *X aproximează

suficient de bine caracteristicile corespuzătoare ale variabilei teoretice X;

Această aproximare are loc în sens probabilistic şi se numeşte estimare. Estimările pot fi corecte sau absolut corecte. DefiniŃia VII.1.5. Spunem că variabila de selecŃie *X estimează corect variabila teoretică X dacă: i ) ( ) ( )XMXM Nn → →* ;

ii) ( ) 0* → →NnXD .

DefiniŃia VII.1.6. Spunem că variabila de selecŃie *X estimează absolut corect variabila teoretică X dacă: i ) ( ) ( )XMXM =* ;

ii) ( ) 0* → →NnXD .

DefiniŃia VII.1.7. DiferenŃa ( ) ( )XMXM −* se numeşte distorsiunea estimaŃiei. ObservaŃii. Dacă estimaŃia este absolut corectă, atunci distorsiunea este 0. Dacă distorsiunea are ca limită o constantă a, adică

( ) ( ) aXMXM Nn →− →* , atunci a se numeşte eroare sistematică. Este evident că dacă eroarea sistematică a este cunoscută, atunci estimarea lui X este dată de aX −* .

VII.2.Estimarea mediei teoretice. Media de selecŃie.

Teorema VII.2.1. Media de selecŃie estimează absolut corect media teoretică. DemonstraŃie. Vom arăta că sunt verificate cele două condiŃii din definiŃia estimaŃiei absolut corecte. Pentru aceasta vom calcula ( )*mM şi

( )*mD . Avem că

90

( ) ( ) mnmn

mn

XMn

XMnn

X

MmMn

i

n

i

i

n

i

i

n

i

i

===

=

=

= ∑∑∑∑

===

= 1111

111

1*

şi

( ) ( ) ( )[ ]2**2

* mMmMmD −= Calculăm mai înâi

( ) ( )( ) ( )

( )

+=

+=

==

∑ ∑

∑ ∑∑

= =≠

= =≠

=

n

i

j

n

njiji

ii

n

i

j

n

njiji

ii

n

i

i

XXMXMn

XXXMnn

X

MmMmM

1 1,,

2

2

1 1,,

2

2

2

12**2

21

21

Variabilele aleatoare iX sunt independente, deoarece eşantioanele se iau la

întâmplare, iar compoziŃia unuia nu depinde de cea a altuia. Prin urmare avem că

( ) ( )jn

njiji

ij

n

njiji

i XMXMXXM ∑∑=≠=≠

=

1,,1,,

.

ObŃinem

( ) ( ) ( ) ( )

( ) ( ) ( )( ) ( ) ( )( )22

2

21

2

1,,2

1

2

2*

2

1

2

121

21

XMn

n

n

XMXM

nn

nn

XM

n

XMXMn

XMn

mM

n

i

i

j

n

njiji

i

n

i

i

−+=

−⋅+

=

+

=

∑∑

=

=≠=.

Inlocuind în expresia dispersiei găsim

( ) ( ) ( )XDn

mmn

n

n

XMmD

11 222

* =−−

+= .

Rezultă că ( ) 0lim * =

∞→mD

n

Şi astfel teorema este demonstrată. Teorema VII.2.2. DistribuŃia mediei de selecŃie *m pentru n suficient

de mare este aproximată de distribuŃia normală cu parametri m şi n

σ.

91

Practic, cele două teoreme permit aplicarea rezultatelor de la distribuŃia normală în cazul estimării mediei prin media de selecŃie.In cazul distribuŃiilor aproape simetrice, această aproximare este satisfăcătoare şi pentru 10>n , iar la cele nesimetrice pentru 30>n .

VII.3.Estimarea dispersiei teoretice. Dispersia de selecŃie.

Teorema VII.3.1. Dispersia de selecŃie estimează corect dispersia teoretică. DemonstraŃie. Vom arăta că sunt verificate cele două condiŃii din definiŃia estimaŃiei corecte. In acest scop, vom calcula ( )*DM şi ( )*DD .

Pentru a calcula ( )*DM considerăm egalitatea

( ) ( )mmmXmX ii −+−=− ** ,

care, prin ridicare la pătrat devine

( ) ( ) ( ) ( )( )mmmXmmmXmX iii −−+−+−=− **2*2*2 2 .

Sumând, găsim

( ) ( ) ( ) ( )( )∑∑∑∑====

−−+−+−=−n

i

i

n

i

n

i

i

n

i

i mmmXmmmXmX1

**

1

2*

1

2*

1

2 2

sau, echivalent

( ) ( ) ( )2*

1

2*

1

2mmnmXmX

n

i

i

n

i

i −+−=− ∑∑==

.

De aici rezultă

( ) ( )( )2*1

2*

1

2

mmn

mX

n

mXn

i

i

n

i

i

−+−

=− ∑∑

== ,

adică

( )( )2*1

2

* mmn

mX

D

n

i

i

−−−

=∑= .

ObŃinem

( )( )

( )( )2*1

2

* mmMn

mX

MDM

n

i

i

−−

=∑= ,

adică ( ) ( )** mDDDM −= .

92

Am găsit astfel că media dispersiei de selecŃie este mai mică dcât dispersia teoretică cu dispersia mediei de selecŃie. In plus avem

( )n

DmD =* ,

de unde rezultă

( ) Dn

n

n

DDDM

1* −=−= .

Prin urmare,

( ) 01* →−=− ∞→nDn

DDM .

Am obŃinut că estimarea dispersiei teoretice D prin dispersia de selecŃie *D

se face întotdeauna cu o distorsiune de valoare n

D− . Prin urmare nu avem o

estimare absolut corectă pentru dispersie. Pentru a găsi totuşi o estimare absolut corectă cu ajutorul datelor de

selecŃie, considerăm dispersia corectată ~

D : *

~

1D

n

nD

−= ,

sau, echivalent,

( ) ( )11

1

2*

1

2*~

−=

−=

∑∑ =

= n

mX

n

mX

n

nD

n

i

in

i

i .

Rezultă că

( )*~

1DM

n

nDM

−=

şi cum

( ) Dn

nDM

1* −= ,

obŃinem

DDM =

~

.

Calculând dispersia lui ~

D găsim că

( )24

~

1

3D

nn

n

n

MDD

−−

−=

şi de aici

0~

=

DD .

93

In concluzie, dispersia corectată ~

D estimează absolut corect dispersia teoretică D. Practic, dispersia teoretică D se estimează absolut corect printr-o sumă de tipul dispersiei de selecŃie în care însă se înlocuieşte numitorul n cu

1−n .Evident, pentru n suficient de mare, cele două estimări ale dispersiei

teoretice *D şi ~

D vor diferi neesenŃial, ambele mărimi tinzând în probbilitate la D. Valoarea dispersiei de selecŃie *D conŃine o imprecizie (bias) care conduce la subestimarea împrăştierii la nivelul întregii populaŃii. Astfel, chiar dacă luăm în considerare un număr mare de eşantioane extrase succesiv dintr-o populaŃie, indicatorii împrăştierii vor fi mai mici decât împrăştierea reală la nvelul întregii populaŃii. CorecŃia se face prin utilizarea la numitor a expresiei

1−n . In acest mod, cu cât eşantionul este mai mic, cu atât indicatorul respectiv al împrăştierii va fi influenŃat mai mult de expresia de la numitor.

VII.4. Metode de efectuare a unui sondaj

Am văzut că cercetarea unei variabile X se face prin intermediul unui eşantion γ constituit din unităŃi de sondaj a căror alegere se efecuează după anumite metode pe care le vom prezenta în continuare.

a) SelecŃia repetată ( Sondaj cu întoarcere) (non-exhaustiv)

In acest tip de selecŃie fiecare unitate de sondaj extrasă pentru a fi cercetată este lăsată în colectivitatea Γ după cercetare. Efectuarea sondajului cu întoarcere pentru n unităŃi de sondaj are ca schemă probabilistică schema bilei revenite a lui Bernoulli. Dacă numărul unităŃilor de sondaj este N, atunci

se pot realiza un număr de !n

N n

selecŃii repetate astfel ca oricare două

eşantioane să difere cel puŃin prin natura unei unităŃi de sondaj. Sondajele cu întoarcere sunt echiprobabile, iar variabilele de selecŃie obŃinute sunt independente.

94

Calculul erorilor pentru selecŃia repetată DefiniŃia VII.4.1. Se numeşte eroare de selecŃie abaterea care există

între valorile calculate prin prelucrarea datelor din eşantion şi ceea ce s-ar fi obŃinut dacă s-ar fi organizat o observare a întregii populaŃii şi s-ar fi prelucrat toate datele obŃinute.

DefiniŃia VII.4.2. Eroarea standard a mediei este

nEm

σ= ,

unde σ este abaterea medie pătratică a eşantionului, iar n este volumul eşantionului.

ObservaŃie. Deoarece am extras un eşantion de volum n dintr-o

populaŃie de volum N, nu putem fi siguri 100% în privinŃa valorii adevărate a mediei întregii populaŃii. Cu toate acestea, dacă eşantionul este de volum destul de mare ( 30>n ) putem construi un interval de încredere cu o probabilitate ( )%1100 α− de garantare a rezultatelor.

Pentru ca probabilitatea cu care garantăm rezultatele să fie

( )%1100 α− , eroarea maximă (limită )este

nzmm

X

σα 2/

** =−=∆ .

Intervalul de încredere pentru medie desemnează zona probabilă în interiorul căreia se va plasa media populaŃiei totale:

**

mmm ∆<−

***

mmmm ∆<−<∆−

****

mmmmm ∆+<<∆−

nzmm

nzm

σσαα 2/

*2/

* +<<− ,

unde 2/αz este argumentul funcŃiei Gauss-Laplace şi are valorile tabelate.

Intervalul

+−

nzm

nzm

σσαα 2/

*2/

* , va conŃine adevărata

valoare a mediei teoretice m, în ( )%1100 α− din cazuri. Volumul eşantionului La organizarea unei cercetări prin sondaj, una din problemele foarte

importante este asigurarea reprezentativităŃii eşantionului.Teoria şi practica

95

au demonstrat că în acest scop trebuie respectate cu stricteŃe următoarele condiŃii:

- includerea în eşantion a unităŃilor statistice în mod obiectiv, fără a acorda prioritate unora în defavoarea altora;

- includerea fiecărei unităŃi statistice în eşantion trebuie să se facă independent de alte unităŃi;

- eşantionul trebuie să fie suficient de mare astfel încât să permită redarea trăsăturilor esenŃiale ale populaŃiei studiate, dar, în acelaşi timp, trebuie să fie cât mai mic astfel încât să satisfacă şi criterii de economicitate.

Pentru a determina volumul eşantionului trebuie să ne concentrăm atenŃia asupra a 3 factori esenŃiali:

- nivelul de încredere dorit; - eroarea limită permisă ; - omogenitatea datelor.

Pentru a estima parametrul colectivităŃii generale cu o eroare maximă *m∆ cu

un nivel de încredere α−1 ( adică pentru a avea o probabilitate de garantare a rezultatelor de ( )%1100 α− ) volumul n al eşantionului se determină din

relaŃia n

zX

σα 2/* =∆ şi se obŃine

2

22/

2

∆= ασ z

n .

Valoarea n astfel obŃinută va trebui rotunjită la un număr întreg, prin adaus, pentru a fi siguri că mărimea eşantionului este suficientă în scopul obŃinerii preciziei dorite.

b) SelecŃia nerepetată ( Sondaj fără întoarcere) (exhaustiv)

In acest tip de selecŃie fiecare unitate de sondaj extrasă pentru a fi cercetată este îndepărtată din colectivitatea Γ după cercetare.Efectuarea sondajului fără întoarcere are drept schemă probabilistică schema bilei nerevenite. Dacă notăm cu N numărul de unităŃi statistice din colectivitatea cercetată, atunci numărul eşantioanelor distincte de volum n ce se pot constitui este n

NC . Acestea sunt echiprobabile, iar variabilele de selecŃie

corespunzătoare sunt independente.

DefiniŃia VII.4.3. Eroarea standard a mediei este

1−−

=N

nN

nEm

σ,

96

unde σ este abaterea medie pătratică a eşantionului, iar n este volumul eşantionului.

Dacă volumul N al populaŃiei este foarte mare, iar volumul n al

eşantionului este redus, atunci 11→

−−

N

nN. Astfel, se obŃine o eroare ce

coincide cu cea din selecŃia repetată. Dacă nN = , atunci 0=mE , deci eroarea dispare. Acest lucru este de

altfel evident întrucât cercetarea parŃială s-a transformat într-o cercetare a întregii populaŃii, ceea ce nu mai generează erori care sunt specifice numai lucrului cu eşantioane.

In general, eroarea în cazul selecŃiei nerepetate este mai mică decât în cazul selecŃiei repetate, deoarece, în acel caz, reîntoarcerea repetată a aceloraşi unităŃi în eşantion înrăutăŃeşte reprezentativitatea.

Pentru ca probabilitatea cu care garantăm rezultatele să fie

( )%1100 α− , eroarea maximă (limită )este

N

n

nz

X−=∆ 12/*

σα ,

iar volumul eşantionului este

N

z

zn

m

222/2

222/

*

σσ

α

α

+∆

= .

UNITATEA DE STUDIU VIII

ELEMENTE DE TEORIA ESTIMAłIEI

VIII.1. NoŃiuni generale

In unele aplicaŃii ale statisticii matematice repartiŃia fenomenului

studiat este dată de o funcŃie cunoscută în care intră anumiŃi parametri cu

valori necunoscute. Pentru aplicaŃii practice nu ne putem mulŃumi cu atât, ci

trebuie să cunoaştem repartiŃia exactă, cu alte cuvinte trebuie să determinăm

valorile numerice ale parametrilor. Determinarea acestora se face folosind

97

rezultatele a n experienŃe care ne conduc la valorile nxxx ,...,, 21 pentru o

caracteristică X studiată .

OpraŃia prin care determinăm valorile parametrilor se numeşte

estimarea parametrilor. Există mai multe metode prin care se poate realiza

această estimare. Inainte însă de a le descrie vom introduce unele noŃiuni

legate de teoria estimaŃiei.

Se consideră caracteristica X care urmează legea de probabilitate dată prin funcŃia densitate de probabilitate ( )λ,xf , unde λ este un parametru

necunoscutce urmează a fi estimat folosind datele de selecŃie n21 x,...,x,x şi bazându-ne pe rezultatele teoretice relative la variabilele de selecŃie

n21 X,...,X,X . DefiniŃia VIII.1.1. Se numeşte funcŃie de estimaŃie (punctuală) sau

estimator al parametrului necunoscut λ funcŃia de selecŃie (statistica) )X,...,X,X( n21

∗∗ λ=λ cu ajutorul căreia se trag concluzii relative la λ .

DefiniŃiaVIII.1.2. Spunem că funcŃia de estimaŃie este estimator

consistent dacă 0,1)(Plimn

>ε∀=ε<λ−λ∗∞→

,

adică λ→λ∗ P

n21 )X,...,X,X( ,

iar valoarea numerică )x,...,x,x( n21∗λ se numeşte estimaŃie consistentă

pentru λ .

DefiniŃia VIII.1.3. Spunem că funcŃia de estimaŃie este estimator absolut corect pentru λ dacă λ=λ∗ )(M şi 0)(D 2 →λ∗ când n ∞→ , iar

valoarea numerică )x,...,x,x( n21∗λ se numeşte estimaŃie absolut corectă

pentru λ .

DefiniŃiaVIII.1.4. Spunem că funcŃia de estimaŃie este estimator corect pentru λ dacă λ=λ∗

∞→)(Mlim

n şi 0)(Dlim 2

n=λ∗

∞→, iar valoarea

numerică )x,...,x,x( n21∗λ se numeşte estimaŃie corectă pentru λ .

DefiniŃia VIII.1.5. Se numeşte distorsiunea (deplasarea)

estimatorului ∗λ diferenŃa M( λ−λ∗ ) , iar dacă distorsiunea este nulă,

estimatorul ∗λ se numeşte nedeplasat.

98

PropoziŃia VIII.1.1. Dacă )X,...,X,X( n21∗∗ λ=λ este un estimator

absolut corect pentru λ , atunci estimatorul este consistent. DemonstraŃie. Din ipoteză avem că λλ =)( *M şi folosind

inegalitatea lui Cebîşev pentru λ* obŃinem ( )2

*2* )(

1ελ

ελλD

P −≥<− ,

pentru orice ε > 0. Deoarece 0)(lim *2 =

∞→λD

n din inegalitatea lui Cebîşev se obŃine

( ) 1lim * =<−∞→

ελλPn

, pentru orice ε > 0, deci λ* este un estimator consistent

pentru parametrul λ.

PropoziŃia VIII.1.2. Momentul de selecŃie kσ de ordin k este estimator absolut corect pentru momentul teoretic );( k

k XM=σ

DemonstraŃie. Avem că

kk

n

i

k

n

i

kn

i

k

i

n

i

k

ikn

n

nXM

nXM

nX

nMM σ

σσσ =====

= ∑∑∑∑

==== 1111

1)(

1)(

11)( ,

respectiv

==

= ∑∑

==

n

i

k

i

n

i

k

ik XDn

Xn

DD1

22

1

22 )(11

)(σ

0)()(

)(1 2

2

2

1

22

→=== ∑= n

XD

n

XnDXD

n

kkn

i

k ,

când n → ∞ se obŃine că kσ este estimator absolut corect pentru kσ .

PropoziŃia VIII.1.3. Momentul centrat de selecŃie de ordin doi 2µ

este estimator corect pentru momentul centrat teoretic de ordin doi )X(D 2

2 =µ , adică pentru dispersia teoretică; DemonstraŃie.Avem succesiv

)()(11

)(1

)( 222

2

12 XDXD

n

n

n

nXX

nMM

n

k

k →−

=−

=

−= ∑

=

µµ

Când n → ∞, respectiv

0)3)(1()1(

)( 22343

2

22 →

−−−

−= µµµ

n

nn

n

nD

când n → ∞ şi rezultă că 2µ este un estimator corect pentru 2µ .

PropoziŃia VIII.1.4.Dispersia de selecŃie 2σ este estimator absolut corect pentru dispersia teoretică )X(D 2 .

99

DemonstraŃie.Folosind relaŃia 22

1µσ

−=

n

n se obŃine

)()(1

1)(

11)( 22

222 XDXD

n

n

n

nM

n

n

n

nMM =

−−

=−

=

= µµσ ,

respectiv

0)(11

)( 22

2

2222 →

=

= µµσ Dn

n

n

nDD ,

când n → ∞ şi deci 2σ este un estimator absolut corect pentru dispersia teoretică.

DefiniŃia VIII.1.6. Numim cantitate de informaŃie relativ la parametrul λ expresia:

I(

λ∂

λ∂⋅=λ

2),x(fln

Mn) .

ObservaŃie. Se arată că estimatorul absolut corect ∗λ al lui λ verifică inegalitatea Rao-Cramer

)(I

1)(D 2

λ≥λ∗ .

DefiniŃia VIII.1.7. Estimatorul ∗λ absolut corect pentru parametrul λ

se numeşte eficient dacă )(I

1)(D 2

λ=λ∗ , iar raportul

)(D

)](I[)(e

2

1

−∗

λ

λ=λ se

numeşte eficienŃa estimatorului ∗λ .

VIII.2. Metoda verosimilităŃii maxime

Considerăm o populaŃie în care se urmăreşte o caracteristică numerică ce este o variabilă aleatoare X având funcŃia densitate de probabilitatea ( )λ,xf , unde λ este un parametru necunoscut.Pentru estimarea lui se

realizează o selecŃie în urma căreia se obŃin valorile nxxx ,...,, 21 .

DefiniŃia VIII.2.1. FuncŃia ( ) ( ) ( ) ( )λλλλ ,...,,,,...,, 2121 nn xfxfxfxxxV ⋅⋅⋅= se numeşte funcŃie de

verosimilitate. DefiniŃia VIII.2.2. Spunem că o valoare *λ este un estimator pentru parametrul λ dacă realizează maximul funcŃiei de verosimilitate. Cu alte cuvinte, cea mai verosimilă valoare a parametrului λ este aceea pentru care funcŃia V are valoare maximă.

100

In concluzie, pentru a determina estimatorul parametrului necunoscut λ se rezolvă ecuaŃia

0=∂∂λV

.

ObservaŃie. FuncŃia V are valoare maximă dacă şi numai dacă funcŃia Vln are valoare maximă.

Drept urmare, estimatorul căutat este soluŃie şi pentru ecuaŃia ( )

0ln

=∂

∂λV

.

Algoritm de determinare a estimatorului. 1. Se construieşte funcŃia de verosimilitate

( ) ( ) ( ) ( )λλλλ ,...,,,,...,, 2121 nn xfxfxfxxxV ⋅⋅⋅= .

2. Se calculează ( )λ,,...,,ln 21 nxxxV .

3. Se calculează ( )

λλ

∂ ,,...,, 21 nxxxV.

4. Se rezolvă ecuaŃia ( )

0,,...,, 21 =

λλnxxxV

.

Generalizare.Dacă funcŃia densitate de probabilitate f depinde de n parametri necunoscuŃi nλλλ ,...,, 21 , adică ( )nxff λλλ ,...,,, 21= , atunci

funcŃia de verosimilitate este ( ) ( ) ( ) ( )nnnnnn xfxfxfxxxV λλλλλλλλλλλλ ,...,,,...,...,,,,...,,,,...,,,,...,, 212122112121 ⋅⋅⋅=

Pentru a găsi estimatorii parametrilor necunoscuŃi se rezolvă sistemul:

=∂∂

=∂∂

=∂∂

,0

0

0

2

1

n

V

V

V

λ

λ

λ

M

sau, sistemul echivalent ( )

( )

( )

=∂

=∂

=∂

.0ln

0ln

0ln

2

1

n

V

V

V

λ

λ

λ

M

101

Exemplu.Să se determine estimatorii de verosimilitate maximă pentru

valoarile mediei şi abaterei standard dacă se consideră caracteristica X, care urmează legea normală N(m,σ ).

SoluŃie. Avem că

M(X) = m şi σ=σ )X( , f(x; m,2

2

2

)mx(

e2

1) σ

−−

πσ=σ .

Pentru a scrie sistemul de verosimilitate maximă avem:

ln f(x; m,σ ) = - ln 2

2

2

)mx(ln2

σ−

−σ−π ,

de unde

2

mx

m

),m;x(fln

σ−

=∂

σ∂, iar

3

2)mx(1),m;x(fln

σ−

−=σ∂

σ∂.

Se obŃine:

∑ ∑ ∑= = =

−=−

=∂

∂=

∂∂ n

k

n

k

n

k

kkk mX

mX

m

mXf

m

V

1 1 122 )(1),;(lnln

σσσ

şi

∑∑ ∑== =

−+−=−

+−=∂

∂=

∂∂ n

k

k

n

k

n

k

kk mXmXmXfV

1

22

1 133

2

])([1

])(1

[),;(lnln

σσσσσ

σσ

.

ObŃinem sistemul

=−+σ−

=−

=

=

0])mX([

0)mX(

n

1k

2k

2

n

1kk

Care conduce la soluŃia

=−=

==

=

=

21

2

1

)(1

1

µσn

k

k

n

k

k

XXn

XXn

m

.

VIII.3. Metoda momentelor

Această metodă constă în estimarea parametrilor necunoscuŃi din condiŃiile ca momentele teoretice ale variabilei aleatoare X, cu funcŃia densitate de probabilitate ( )nxff λλλ ,...,,, 21= , să fie egale cu momentele

de selecŃie de acelaşi ordin. Momentul teoretic de ordin k este

102

( ) ( )∫+∞

∞−

= dxxfxXM n

k

k λλλ ,...,,, 21

Momentul de selecŃie de ordin k este

( )n

x

XM

n

i

k

i

k

∑== 1* .

Din egalitatea ( ) ( )XMXM kk

*= , nk ,1= se obŃine un sistem din care

se găsesc estimatorii parametrilor nλλλ ,...,, 21 .

Exemplu. Se consideră caracteristica X, care urmează legea gamma

de parametrii a>b>0 necunoscuŃi. Vom estima aceşti parametri, folosind metoda momentelor, pe baza datelor n21 x,...,x,x de selecŃie.

SoluŃie.FuncŃia densitate de probabilitate a caracteristicii X este:

>Γ=

−−

0xdaca,0

0xdaca,exb)a(

1)b,a;x(f

b

x1a

a ,

unde Γ este funcŃia lui Euler de speŃa a doua, adică ∫∞ −−=Γ0

x1a dxex)a( .

În cazul de faŃă este vorba de doi parametri, deci sistemul de ecuaŃii este

format din două ecuaŃii, anume 11 σσ = şi 22 σσ = .

Vom calcula momentul teoretic iniŃial kσ de ordin k:

∫ ∫∞

∞−

∞ −−+ ⋅−+−+==Γ

== akakabdxexba

dxbaxfx kb

x

ka

a

k

k )...2)(1(...)(

1),;(

0

. Rezultă sistemul:

+=

=

)1(22

1

aab

ab

σσ

care are soluŃia

1

212

212

21

,σσσ

σσσ −

=−

= ∗∗ ba ,

care reprezintă estimatorii pentru parametrii a şi b.

103

VIII.4. Metoda intervalelor de încredere

Fie caracteristica X care are funcŃia de probabilitate ( )θ,xf , unde θ este parametrul necunoscut. Metoda constă în determinarea a două funcŃii de

selecŃie n,1i),X,...,X,X( n21ii =θ=θ astfel încât P( 21 θ<θ<θ ) = 1-α , unde α nu depinde de θ şi poartă numele de probabilitate de risc, iar 1-α se numeşte probabilitate de încredere. Intervalul aleator ( ), 21 θθ poartă numele de interval de încredere pentru parametrul θ .

Algoritm de determinare a intervalului de încredere.

1.Se caută determinarea unei statistici );X,...,X,X(ZZ n21nn θ= a cărei lege de probabilitate să fie cunoscută şi să nu depindă de θ . 2. Se determină apoi un interval numeric ( )z,z 21 astfel încât P( 2n1 zZz << ) = 1-α . 3. Din 2n1 zZz << se exprimă inegalitatea 21 θ<θ<θ şi de aici intervalul

( ), 21 θθ este determinat.

ObservaŃie. Intervalul este cu atât mai bun cu cât are lungimea mai mică şi cu cât 1-α este mai mare. AplicaŃii

1. Interval de încredere pentru valoarea medie teoretică dacă dispersia teoretică este cunoscută.

SoluŃie.Se consideră caracteristica X care urmează legea normală N(m,σ ) cu m R∈ necunoscut şi 0>σ cunoscut. Vom determina un interval de încredere pentru m cu o probabilitate de încredere 1-α dată şi cunoscând datele de selecŃie n21 x,...,x,x , respectiv variabilele de selecŃie n21 X,...,X,X corespunzătoare.

Considerăm statistica

n

mXZn σ

−= , unde ∑

=

=n

1kkX

n

1X , care urmează legea

normală N(0,1) ce nu depinde de parametrul necunoscut m. Deci putem determina intervalul ( )z,z 21 astfel încât P( )zZz 2n1 << = 1-α adică

α−=Φ−Φ 1)z()z( 12 , ∫−

π=Φ

x

0

2

t

dte2

1)x(

2

este funcŃia lui Laplace şi care

are valorile tabelate. Intervalul are lungime minimă când este simetric faŃă de

104

origine adică 2

112 zzz α−=−= . Rezultă că

2

1)z(

21

α−=Φ α

− şi folosind

tabelele de valori pentru funcŃia Laplace găsim 2

1z α− .

Am obŃinut P( α−=<σ−

<− α−

α− 1)z

n

mXz

21

21 , adică

P( )zn

Xmzn

X2

12

−α

σ+<<

σ− = 1-α .

Deci intervalul de încredere pentru media teoretică m este ( )m,m 21 , unde

211 z

nXm α

σ−= şi

212 z

nXm α

σ+= , iar ∑

=

=n

1kkX

n

1X .

ObservaŃie. Când X nu urmează legea normală, dar volumul selecŃiei este

mare (n>30) şi se cunoaşte 0)X( >σ=σ atunci statistica nZ =

n

mXσ−

,

unde m=M(X) este necunoscută, este aproximativ repartizată normal N(0,1). Deci se poate considera pentru m acelaşi interval de încredere obŃinut mai sus.

2. Interval de încredere pentru valoarea medie teoretică dacă dispersia teoretică este necunoscută.

SoluŃie.Fie caracteristica X ce urmează legea normală N(m, )σ cu

m=M(X) parametru necunoscut şi 0)X(D 2 >=σ necunoscută.

Considerăm statistica

n

mXT

σ−

= , unde ∑=

=n

1kkX

n

1X şi

∑=

−−

=σn

1k

2k

2 )XX(1n

1care urmează legea Student cu n-1 grade de libertate.

Determinăm intervalul ( 21 t,t ) cu P( )tTt 21 << = 1-α , adică

α−=− −− 1)t(F)t(F 11n21n , unde ∫ ∞−

+−

+Γπ

=x

2

1n2

n ds)n

s1(

)2

n(n

)2

1n(

)x(F este

funcŃia de repartiŃie a legii Student cu n grade de libertate şi care are valorile

105

tabelate, iar )x(F1)x(F nn −=− . Deci 1

21,1n

2 ttt −== α−−

se determină astfel

încât

21)t(F

21,1n

1n

α−=α

−−− ,

apoi putem scrie

α−=<σ−

<− α−−

α−−

1)t

n

mXt(P

21,1n

21,1n

sau

ασσ

αα −=+<<−−−−−

1)(2

1,12

1,1 nnt

nXmt

nXP .

Adică, intervalul de încredere pentru m este )m,m( 21 unde

21,1

1 α

σ−−

−=nt

nXm şi

21,1

2 α

σ−−

+=nt

nXm .

3. Intervalul de încredere pentru diferenŃa mediilor a două populaŃii SoluŃie. Fie două populaŃii 1ζ şi 2ζ la care se analizează aceeaşi

caracteristică şi care pentru 1ζ este 1X ce urmează legea normală N( ),m 11 σ ,

iar pentru 2ζ este 2X ce urmează legea normală N ),m( 22 σ . Vom determina

un interval de încredere pentru diferenŃa mediilor 21 mm − cu probabilitatea

de încredere 1-α folosind datele de selecŃie 1n11211 x,...,x,x relativ la

caracteristica 1X , respectiv 2n22221 x,...,x,x relativ la caracteristica 2X .

a) Presupunem abaterile standard ( ), 21 σσ cunoscute. Statistica

2

22

1

21

2121

nn

)mm()XX(Z

σ+

σ

−−−= ,

unde ,Xn

1X,X

n

1X

21 n

1kk2

22

n

1kk1

11 ∑∑

==

== urmează legea normală N(0,1). Se

determină intervalul ( )z,z 21 astfel încât P( )zZz 21 << = 1-α la fel ca în aplicaŃia 1. Avem

α−=<σ

−−−<− α

−α

−1)z

nn

)mm()XX(z(P

21

2

22

1

21

2121

21

sau

106

))()((2

22

1

21

21

21212

22

1

21

21

21nn

zXXmmnn

zXXPσσσσ

αα ++−<−<+−−−−

adică intervalul de încredere pentru 21 mm − este (A,B) unde

A = (2

22

1

21

21

21 nnz)XX

σ+

σ−− α

− şi B =

2

22

1

21

21

21 nnz)XX(

σ+

σ+− α

−.

b) Presupunem abaterile standard σ=σ=σ 21 necunoscute. Considerăm

statistica

21

21

222

211

2121

n

1

n

12nn

)1n()1n(

)mm()XX(T

+

−+⋅

σ−+σ−

−−−= ,

unde 1X şi 2X sunt mediile de selecŃie definite anterior, iar 21σ şi

22σ dispersiile de selecŃie ∑

=

−−

=σ1n

1k

21k1

1

21 )XX(

1n

1 şi

∑=

−−

=σ2n

1k

22k2

2

22 )XX(

1n

1, care urmează legea Student cu n = 2nn 21 −+

grade de libertate. La fel ca în aplicaŃia 2. se determină intervalul )t,t( 21

astfel încât α−=<< 1)tTt(P 21 adică

α−=<+

−+

σ−+σ−

−−−<− α

−α

−1)t

n

1

n

12nn

)1n()1n(

)mm()XX(t(P

21,n

21

21

222

211

2121

21,n

.

Rezultă intervalul de încredere (A,B) pentru 21 mm − unde

A = St)XX(2

1,n21 ⋅−− α

− şi St)XX(B

21,n

21 ⋅+−= α−

cu

2nn

n

1

n

1

])1n()1n[(S21

21222

211

2

−+

+

⋅σ−+σ−= .

4. Intervalul de încredere pentru dispersia teoretică SoluŃie. Fie caracteristica X ce urmează legea normală N(m,σ ).

Considerăm statistica 2

22 )1n(

σ−= unde ∑

=

−−

=σn

1k

2k

2 )XX(1n

1, iar

∑=

=n

1kkX

n

1X , ce urmează legea 2χ cu n-1 grade de libertate. Pentru

probabilitatea de încredere 1-α se poate determina intervalul ( )h,h 22

21 ,

astfel încât

α−=<< 1)hHh(P 22

221 .

107

2

2,1n

21 hh α

−= se determină din relaŃia

2)h(F 2

11n

α=− şi

2

21,1n

22 hh α

−−= se determină din relaŃia

21)h(F 2

21n

α−=− , unde )x(Fn este

funcŃia de repartiŃie a legii 2χ cu n grade de libertate

∫−−

Γ

=x

0

2

t1

2

n

2

nn dtet

)2

n(2

1)x(F care are valorile tabelate.

ObŃinem

ασ

σ−=<

−< 1)

)1(( 2

22

22

1 hn

hP

sau

α−=σ−

<σ<σ−

1)h

)1n(

h

)1n((P

21

22

22

2

,

adică s-a obŃinut intervalul de încredere ( ), 22

21 σσ pentru 2σ , unde

2

21,1n

22

1h

)1n(

α−−

σ−=σ şi

2

2,1n

22

2h

)1n(

α−

σ−=σ , iar intervalul de încredere pentru

abaterea standard σ este ),( 21 σσ .

UNITATEA DE STUDIU IX

VERIFICAREA IPOTEZELOR STATISTICE

IX.1. NoŃiuni generale

DefiniŃia IX.1.1. Se numeşte ipoteză statistică presupunerea care se

face cu privire la parametrul unei repartiŃii sau la legea de repartiŃie pe care o urmează anumite variabile aleatoare.

DefiniŃia IX.1.2. Procedeul de verificare a unei ipoteze statistice se

numeşte test. DefiniŃia IX.1.3. Ipoteza statistică ce urmează a fi testată se numeşte

ipoteză nulă şi se notează cu 0H . Respingerea ipotezei nule implică

acceptarea unei alte ipoteze, numită ipoteză alternativă (sau ipoteză admisibilă) , notată cu 1H .

108

DefiniŃia IX.1.4. Regiunea critică reprezintă valorile numerice ale

tesului statistic pentru care ipoteza nulă va fi respinsă. DefiniŃia IX.1.5. Eroarea pe care o facem eliminând o ipoteză nulă,

deşi ea este adevărată se numeşte eroare de genul I. Probabilitatea de a realiza o astfel de eroare reprezintă riscul de genul

I ( sau riscul furnizorului) , se notează cu α şi se umeşte nivel de semnificaŃie (sau prag de semnificaŃie).

DefiniŃia IX.1.6. Nivelul de încredere al unui test statistic este

α−1 , iar procentul ( )%1100 α− este probabilitatea de garantare a rezultatelor.

DefiniŃia IX.1.7. Eroarea pe care o facem acceptând o ipoteză nulă,

deşi ea este falsă , se numeşte eroare de genul al II-lea, iar probabilitatea comiterii unei astfel de erori se notează cu β şi reprezintă riscul beneficiarului. Valoarea β−1 se numeşte puterea testului statistic.

Fie X o caracteristică pentru care funcŃia densitate de probabilitate

este ( )θ,xf , unde θ este un parametru necunoscut. Presupunem că θ aparŃine unei mulŃimi A. Aceasta este ipoteza nulă: AH ∈θ:0 .

Această presupunere poate fi adevărată sau falsă. De aceea trebuie verificată. Pentru aceasta considerăm şi ipoteza alternativă 11 : AH ∈θ .

Pentru a verifica ipoteza nulă 0H se efecuează o selecŃie:

nXXX ,...,, 21 .

Regiunea critică este o mulŃime nRU ⊂ cu proprietatea că ( )( ) α=∈ 021 ,...,, HUxxxP n şi ( )( ) β=∉ 121 ,...,, HUxxxP n

Dacă ( ) Uxxx n ∈,...,, 21 , atunci 0H se respinge.

Dacă ( ) Uxxx n ∉,...,, 21 , atunci 0H se admite.

ObservaŃie. Nu există o metodă generală de construire a regiunii

critice U. Se cnosc însă clase de probleme pentru care s-au construit astfel de regiuni criice şi corespunzător lor, avem diferite teste de verificare a ipotezelor statistice.

109

IX.2. Testul Z

Se consideră caracteristica X, ce urmează legea normală ),( σmN , unde Rm∈ este necunoscut, iar 0>σ este cunoscut.

Relativ la media teoretică )(XMm = facem ipoteza nulă

00 : mmH = , cu alternativa 01 : mmH ≠ .

Pentru verificarea ipotezei nule 0H cu alternativa precizată mai

înainte, considerăm o selecŃie repetată de volum n şi nivelul de semnificaŃie )1,0(∈α . Fie datele de selecŃie nxxx ,,, 21 K şi corespunzător variabilele de

selecŃie nXXX ,,, 21 K . Dacă se consideră statistica

n

mXZ

σ−

= , unde ∑=

=n

k

kXn

X1

1,

care urmează legea normală )1,0(N . Prin urmare, pentru )1,0(∈α , putem

determina intervalul numeric ),(2

12

1αα

−−− zz astfel încât

ααα −=<<−−−

1)(2

12

1zZzP .

Într-adevăr, avem că αααααα −=Φ=−Φ−Φ=<<−

−−−−−1)(2)()()(

21

21

21

21

21

zzzzZzP ,

aşadar, se ia 2

−z astfel încât

2

1)(

21

αα

−=Φ

−z .

Se defineşte regiunea critică nRU ⊂ ,

−∉−

∈=−−

),(),,(2

12

1

021 αασ

zz

n

muRuuuU n

nK ,

unde ∑=

=n

k

kun

u1

1.

În acest fel am obŃinut că =∈ )),,,(( 021 HUXXXP nK

=

−∉

−=

−−0

21

21

0 , Hzz

n

muP αασ

110

ααα =

−∉=

−−0

21

21

, HzzZP .

Prin urmare, am determinat regiunea critică U, astfel încât să fie satisfăcută relaŃia α=∈ )),,,(( 021 HUXXXP nK .

Folosind regiunea critică U, vom respinge ipoteza nulă 00 : mmH = ,

dacă Uxxx n ∈),,,( 21 K , adică dacă ),(2

12

1

0αασ −−

−∉−

= zz

n

mxz şi o admitem

dacă Uxxx n ∉),,,( 21 K , adică ),(2

12

1

0αασ −−

−∈−

= zz

n

mxz .

ObservaŃie. Se vede că regiunea critică U corespunde mulŃimii

complementare a intervalului numeric ),(2

12

1αα

−−− zz . Din acest motiv, în cele

ce urmează, nu vom pune în evidenŃă, de fiecare dată, regiunea critică U, ci numai intervalul numeric căruia îi aparŃine statistica utilizată pentru obŃinerea acestei regiuni.

ObservaŃie. Testul Z se poate folosi şi pentru caracteristica X ce nu urmează legea normală, când volumul n al selecŃiei este mare )30( >n , având în vedere că statistica Z urmează aproximativ legea normală )1,0(N ,

unde )(XMm = şi )(2 XD=σ .

Etapele aplicării testului Z. 1o Se dau: σα ;;,,; 021 mmxxx n =K ;

2o Se determină 2

−z astfel încât

2

1)(

21

αα

−=Φ

−z ;

30 Se calculează

n

mxz

σ0−

= , unde ∑=

=n

k

kxn

x1

1;

40 Concluzii: dacă 2

−< zz , ipoteza 0H este admisă, în caz contrar

ipoteza este respinsă.

ObservaŃie. Deoarece ipoteza alternativă este 01 : mmH ≠ , testul

prezentat este testul Z bilateral. Dacă ipoteza alternativă este 01 : mmH < , se

111

obŃine în mod analog testul Z unilateral stânga, respectiv pentru ipoteza alterantivă 01 : mmH > , se obŃine testul Z unilateral dreapta.

De exemplu, pentru testul Z unilateral dreapta, intervalul numeric pentru statistica Z devine ),( 1 α−−∞ z , unde α−1z este determinat astfel încât

αα −=Φ − 2

1)( 1z , iar regiunea critică U se modifică în mod corespunzător,

adică

≥−

∈= − )),,( 10

21 ασz

n

muRuuuU n

nK .

IX.3. Testul T (Student) Se consideră caracteristica X ce urmează legea normală ),( αmN cu

parametrii RXMm ∈= )( şi 0>σ necunoscuŃi. Relativ la această

caracteristică se face ipoteza nulă 00 : mmH = cu ipoteza alternativă

01 : mmH ≠ .

Pentru verificarea acestei ipoteze se consideră o selecŃie repetată de volum n, cu datele de selecŃie nxxx ,,, 21 K şi corespunzător variabilele de

selecŃie nXXX ,,, 21 K .

Construim statistica

12

−=

−=

n

mX

n

mXT

µσ, unde, după cum se ştie

∑=

=n

k

kXn

X1

1, 2

1

22

1)(

1

1µσ

−=−

−= ∑

= n

nXX

n

n

k

k , care urmează legea

Student cu n-1 grade de libertate. Prin urmare, pentru nivelul de semnificaŃie )1,0(∈α dat, se poate

determina intervalul numeric ),(2

1,12

1,1αα

−−−−−

nntt astfel încât

ααα −=<<−−−−−

1)(2

1,12

1,1 nntTtP .

Anume, 2

1,1α

−−nt se determină astfel ca

21

21,1

1

αα −=

−−

−n

n tF , unde

112

∫∞−

+−

+

Γ

=t

m

m Rtdxm

x

mm

m

tF ,1

2

2

1

)(2

12

π,

este funcŃia de repartiŃie pentru legea Student cu m grade de libertate (tabelată în Anexa II, pentru anumite valori).

Complementarea intervalului numeric, astfel determinat, ne defineşte regiunea critică nRU ⊂ . Astfel, avem că

≥−

∈=−−)),,(

21,1

0

21 ασ nu

n

n t

n

muRuuuU K ,

unde ∑=

=n

k

kun

u1

1, respectiv ∑

=

−−

=n

k

ku uun 1

22)(

1

1σ .

Etapele aplicării testului T. 1o Se dau: 021 ;,,; mmxxx n =Kα ;

2o Se determină 2

1,1α

−−nt astfel încât

21

21,1

1

αα −=

−−

−n

n tF ;

30 Se calculează

n

mxt

σ0−

= , unde ∑=

=n

k

kxn

x1

1,

∑=

−−

=n

k

k xxn 1

22)(

1

1σ ;

40 Concluzii: dacă 2

1,1α

−−<

ntt , ipoteza 00 : mmH = este admisă, în

caz contrar ipoteza este respinsă.

ObservaŃie. Deoarece ipoteza alternativă este 01 : mmH ≠ , testul

prezentat este testul T bilateral. Dacă ipoteza alternativă este 01 : mmH < , se

obŃine în mod analog testul T unilateral stânga, respectiv pentru ipoteza alterantivă 01 : mmH > , se obŃine testul T unilateral dreapta.

Când numărul gradelor de libertate tinde spre infinit, conform teoremei limită centrală, avem că legea Student converge în repartiŃie la legea normală )1,0(N .

Prin urmare, dacă volumul n al selecŃiei este mare )30( >n , se poate

utiliza testul Z pentru verificarea ipotezei nule 00 : mmH = , prin utilizarea

113

statisticii T în loc de statistica Z. Toate rezultatele de la testul Z rămân, aşadar, adevărate în acest caz.

IX.4. Teste pentru compararea a două medii Se consideră două populaŃii independente 'C şi ''C cercetate din

punct de vedere al aceleiaşi caracteristici. Această caracteristică este 'X pentru 'C şi urmează legea normală )','( σmN şi respectiv ''X pentru ''C şi urmează legea normală )'',''( σmN .

Relativ la mediile teoretice ale celor două caracteristici independente se face ipoteza nulă ''':0 mmH = cu alternativa ''':1 mmH ≠ .

Pentru aceasta se consideră câte o selecŃie repetată de volum 'n şi respectiv ''n din cele două populaŃii. Notăm datele de selecŃie prin

''

'2

'1 ,,, nxxx K şi respectiv ''

''''

2''

1 ,,, nxxx K , şi variabilele de selecŃie ''

'2

'1 ,,, nXXX K , respectiv ''

''''

2''

1 ,,, nXXX K .

Reamintim notaŃiile

∑=

='

1

''

'

1 n

k

kXn

X , ∑=

−−

='

1

2''2'

)(1'

1 n

k

k XXn

σ ,

∑=

=''

1

''''

''

1 n

k

kXn

X , ∑=

−−

=''

1

2''''2''

)(1''

1 n

k

k XXn

σ ,

pentru mediile de selecŃie şi respectiv dispersiile de selecŃie. Distingem în cele ce urmează trei cazuri, în funcŃie de anumite

informaŃii ce le cunoaştem relativ la dispersiile teoretice. a). Testul Z (dacă dispersiile 2'σ şi 2''σ sunt cunoscute). În acest

caz se consideră statistica ( ) ( )

''

''

'

'

'''22

'''

nn

mmXXZ

σσ+

−−−= , care urmează legea

normală )1,0(N . Se aplică prin urmare testul Z pentru compararea celor două medii teoretice.

Pentru nivelul de semnificaŃie )1,0(∈α dat se determină intervalul

numeric ),(2

12

1αα

−−− zz , astfel încât ααα −=<<−

−−1)(

21

21

zZzP . Stabilirea

acestui interval se obŃine din relaŃia 2

1)(

21

αα

−=Φ

−z , unde )(xΦ este funcŃia

lui Laplace şi care este tabelată. . Etapele aplicarii testului

114

1o Se dau: ''''

''2

''1

''

'2

'1 ,,,;,,,; nn xxxxxx KKα ;

2o Se determină 2

−z astfel încât

2

1)(

21

αα

−=Φ

−z ;

30 Se calculează

''

''

'

' 22

'''

nn

xxz

σσ+

−= , unde ∑

=

='

1

''

'

1 n

k

kxn

x , şi

∑=

=''

1

''''

''

1 n

k

kxn

x ;

40 Concluzii: dacă 2

−< zz , ipoteza ''' mm = este admisă, în caz

contrar ipoteza este respinsă. b). Testul T (dacă dispersiile 2'σ şi 2''σ sunt necunoscute şi

222 ''' σσσ == ). Se consideră statistica

( ) ( )

''

1

'

12'''

'')1''(')1'(

'''22

'''

nn

nn

nn

mmXXT

+

−+

−+−

−−−=

σσ, care urmează legea

Student cu 2''' −+= nnn grade de libertate. În acest caz se va aplica testul T. Pentru nivelul de semnificaŃie )1,0(∈α dat se poate determina intervalul numeric ),(

21,

21,

αα−−

−nntt , astfel

încât 2

1)(2

1,2

1,

ααα −=<<−

−− nntTtP . Pentru aceasta se foloseşte relaŃia

21

21,

αα −=

−n

n tF , unde )(xFn este funcŃia de repartiŃie de la legea Student

cu n grade de libertate şi care este tabelată Etapele aplicarii testului 1o Se dau: ''

''''

2''

1''

'2

'1 ,,,;,,,; nn xxxxxx KKα ; 2''' −+= nnn ;

2o Se determină 2

1,α

−nt astfel încât

21

21,

αα −=

−n

n tF ;

115

30 Se calculează

''

1

'

12'''

'')1''(')1'( 22

'''

nn

nn

nn

xxt

+

−+

−+−

−=

σσ, unde

∑=

='

1

''

'

1 n

k

kxn

x , ∑=

−−

='

1

2''2'

)(1'

1 n

k

k xxn

σ , ∑=

=''

1

''''

''

1 n

k

kxn

x ,

∑=

−−

=''

1

2''''2''

)(1''

1 n

k

k xxn

σ ;

40 Concluzii: dacă 2

1,α

−<

ntt , ipoteza ''' mm = este admisă, în caz

contrar ipoteza este respinsă. c) Testul T (dacă dispersiile 2'σ şi 2''σ sunt necunoscute şi

diferite). Se va considera statistica

( ) ( )

''

''

'

'

'''22

'''

nn

mmXXT

σσ+

−−−=

,

care urmează legea Student cu n grade de libertate. Numărul n al gradelor de

libertate se calculează cu formula 1''

)1(

1'

1 22

−−

+−

=n

c

n

c

n, unde

+=

''

''

'

'

'

' 222

nnnc

σσσ.

S-a ajuns la testul T, care pentru nivelul de semnificaŃie )1,0(∈α dat,

conduce la intervalul numeric ),(2

1,2

1,αα

−−−

nntt , astfel încât

ααα −=<<−−−

1)(2

1,2

1, nntTtP .

Pentru aceasta se foloseşte relaŃia 2

12

1,

αα −=

−n

n tF , unde )(xFn este

funcŃia de repartiŃie de la legea Student cu n grade de libertate şi care este tabelată.

Etapele aplicării testului 1o Se dau: ''

''''

2''

1''

'2

'1 ,,,;,,,; nn xxxxxx KKα ;

2o Se calculează

∑=

='

1

''

'

1 n

k

kxn

x , ∑=

−−

='

1

2''2'

)(1'

1 n

k

k xxn

σ ,

116

∑=

=''

1

''''

''

1 n

k

kxn

x , ∑=

−−

=''

1

2''''2''

)(1''

1 n

k

k xxn

σ ,

de unde

+=

''

''

'

'

'

' 222

nnnc

σσσ;

30 Se determină n astfel încât 1''

)1(

1'

1 22

−−

+−

=n

c

n

c

n;

4o Se determină 2

1,α

−nt astfel încât

21

21,

αα −=

−n

n tF ;

50 Se calculează

''

''

'

' 22

'''

nn

xxt

σσ+

−= ;

60 Concluzii: dacă 2

1,α

−<

ntt , atunci ipoteza ''' mm = este admisă, în

caz contrar ipoteza este respinsă.

IX.5. Testul 2χ (hi-pătrat) pentru dispersie Fie caracteristica X ce urmează legea normală ),( σmN , unde

dispersia teoretică )(22 XD=σ este necunoscută şi Rm∈ de asemenea necunoscut.

Relativ la dispersia teoretică se face ipoteza nulă 20

20 : σσ =H cu

ipoteza alternativă 20

21 : σσ ≠H .

Pentru verificarea ipotezei nule 0H cu alternativa 1H se consideră o

selecŃie repetată de volum n, cu datele de selecŃie nxxx ,,, 21 K şi

corespunzător variabilele de selecŃie nXXX ,,, 21 K .

Statistica 2

2

1

22

2 )1()(

1

σσ

σ−

=−= ∑=

nxXH

n

k

k , urmează legea 2χ cu

1−n grade de libertate. Pentru un nivel de semnificaŃie )1,0(∈α dat, se poate determina un

interval numeric ),( 2

21,1

2

2,1

αα−−− nn

hh astfel încât

ααα −=<<−−−

1)( 2

21,1

22

2,1 nn

hHhP .

ExtremităŃile acestui interval numeric se determină din relaŃiile

117

22

2,1

1

αα =

−n

n hF şi 2

12

21,1

1

αα −=

−−

−n

n hF ,

unde )(xFm este funcŃia de repartiŃie pentru legea 2χ cu m grade de

libertate, adică ∫ >

Γ

=−−

x tm

mm xdtetm

xF0

21

2

2

0,

22

1)( , fiind tabelată pentru

anumite valori în Anexa III. Cu ajutorul intervalului numeric ),( 2

21,1

2

2,1

αα−−− nn

hh astfel determinat,

regiunea critică va fi dată de complementarea acestui interval, adică

∉−∈=−−−=

∑ ),()(1

),,( 2

21,1

2

2,1

1

220

21 αασ nn

n

k

k

n

n hhuuRuuuU K ,

unde ∑=

=n

k

kun

u1

1.

Etapele aplicării testului 2χ

1o Se dau: ;;,,; 021 σσα =nxxx K ;

2o Se determină intervalul ),( 2

21,1

2

2,1

αα−−− nn

hh astfel încât

22

2,1

1

αα =

−n

n hF şi 2

12

21,1

1

αα −=

−−

−n

n hF ;

30 Se calculează ∑=

−=n

k

k xxh1

220

2 )(1

σ, unde ∑

=

=n

k

kxn

x1

1;

40 Concluzii: dacă ),( 2

21,1

2

2,1

2αα

−−−∈

nnhhh , ipoteza 0H este admisă, în

caz contrar este respinsă.

IX.6. Testul F (Snedecor-Fisher)

Se consideră două populaŃii independente 'C şi ''C cercetate din

punct de vedere al aceleaşi caracteristici. Această caracteristică este 'X pentru 'C şi urmează legea normală )','( σmN şi respectiv ''X pentru ''C şi urmează legea normală )'',''( σmN .

Relativ la dispersiile teoretice ale celor două caracteristici se face ipoteza nulă 22

0 ''': σσ =H cu alternativa 221 ''': σσ ≠H .

118

Pentru verificarea ipotezei nule 0H se efectuează câte o selecŃie

repetată de volum respectiv 'n şi ''n din cele două populaŃii 'C şi ''C .

Notăm datele de selecŃie prin ''

'2

'1 ,,, nxxx K şi respectiv ''

''''

2''

1 ,,, nxxx K , şi

variabilele de selecŃie ''

'2

'1 ,,, nXXX K , respectiv ''

''''

2''

1 ,,, nXXX K .

Cu notaŃiile

∑=

−−

='

1

2''2'

)(1'

1 n

k

k XXn

σ , ∑=

='

1

''

'

1 n

k

kXn

X ,

∑=

−−

=''

1

2''''2''

)(1''

1 n

k

k XXn

σ , ∑=

=''

1

''''

''

1 n

k

kXn

X ,

avem că statistica 2

2

2

2

''

''

'

'

σσ

σσ

=F , urmează legea Snedecor-Fisher cu

1'−= nm şi 1'' −= nn grade de libertate. Prin urmare, statistica F are funcŃia de repartiŃie, pentru 0>x , dată prin

∫+

−−

+

Γ

Γ

=x

nmnm

nm dttn

mt

nm

nm

n

mxF

0

21

22

, 1

22

2)( .

Pentru un nivel de semnificaŃie )1,0(∈α fixat se poate determina

intervalul numeric ),(2

1,,2,,

αα−nmnm

ff , astfel încât

ααα −=<<−

1)(2

1,,2,, nmnm

fFfP .

ExtremităŃile acestui interval se determină din relaŃiile

22,,

,

αα =

nm

nm fF şi 2

12

1,,,

αα −=

−nm

nm fF .

Deoarece are loc relaŃia γ

γ−

=1,,

,,

1

mn

nmf

f , tabelele pentru funcŃia

)(, xF nm sunt, de regulă, întocmite numai pentru valori mari ale lui γ (0,95, 0,975, 0,99,..) şi pentru 1>F .

Dacă 1<F , intervalul numeric pentru F este dat prin

=−

2,,

21,,2

1,,2,,

1,

1),(

αααα

mnmn

nmnm ffff .

Etapele aplicării testului F 1o Se dau: ;,,,;,,,;1'';1'; ''

''''

2''

1''

'2

'1 nn xxxxxxnnnm KK−=−=α ;

2o Se determină intervalul ),(2

1,,2,,

αα−nmnm

ff astfel încât

119

22,,

,

αα =

nm

nm fF şi 2

12

1,,,

αα −=

−nm

nm fF ;

30 Se calculează 2

2

''

'

σσ

=f , unde

∑=

−−

='

1

2''2'

)(1'

1 n

k

k xxn

σ , ∑=

='

1

''

'

1 n

k

kxn

x ,

∑=

−−

=''

1

2''''2''

)(1''

1 n

k

k xxn

σ , ∑=

=''

1

''''

''

1 n

k

kxn

x .

40 Concluzii: dacă ),(

21,,

2,,

αα−

∈nmnm

fff , atunci ipoteza 22 ''' σσ = este

admisă, în caz contrar este respinsă.

IX.7. Testul de concordanŃă 2χ Fie caracteristica X, care are funcŃia de repartiŃie teoretică F. Ipoteza

statistică nulă ce o facem relativ la caracteristica X este ),,;(: 2100 sxFFH λλλ K= ,

unde sλλλ K,, 21 sunt parametri necunoscuŃi.

Pentru a verifica această ipoteză statistică, la început, folosind datele de selecŃie nxxx K,, 21 , se estimează prin metoda verosimilităŃii

maxime parametrii sλλλ K,, 21 . Fie estimaŃiile de verosimilitate maximă

pentru aceşti parametri, respectiv sλλλ ˆ,ˆ,ˆ 21 K . Prin urmare, ipoteza nulă

devine )ˆ,ˆ,ˆ;(: 2100 sxFFH λλλ K= .

Se efectuează apoi gruparea datelor de selecŃie nxxx K,, 21 ,

obŃinându-se distribuŃia empirică de selecŃie

N

N

fff

xxxX

K

K

21

''2

'1 . Pentru

clasa 'ix , dată de intervalul [ )ii aa ,1− avem că

)()()( 11 −− −=<≤= iiiii aFaFaXaPp , Ni ,1= , probabilităŃi

necunoscute, deoarece funcŃia de repartiŃie teoretică F este necunoscută. Din ipoteza nulă 0H se poate calcula probabilitatea

)ˆ,,ˆ,ˆ,()ˆ,,ˆ,ˆ;()|(ˆ 2112101 sisiiii aFaFFFaXaPp λλλλλλ KK −− −==<≤=.

120

În acest fel ipoteza nulă 0H , făcută asupra funcŃiei de repartiŃie, se poate

rescrie în NippH ii ,1,ˆ:0 == , cu ipoteza alternativă 01 : HH falsă.

Valoarea numerică ( )

∑=

−=

N

i i

ii

pn

pnfh

1

22

ˆ

ˆ este valoarea unei variabile

aleatoare 2H ce urmează legea de probabilitate 2χ cu 1−−= sNk grade de libertate.

Aşadar, pentru probabilitatea de risc α se consideră intervalul de încredere ( )2

1,,0 α−kh pentru 2H , definit prin relaŃia

αα −=< − 1)( 21,

2khHP , adică αα −=− 1)( 2

1,kk hF .

Aici funcŃia )(xFk este funcŃia de repartiŃie pentru legea 2χ cu numărul

gradelor de libertate 1−−= sNk şi care este tabelată .

Etapele aplicării testului 2χ .

1o Se consideră: ),,;(,,,, 21021 sn xFFxxx λλλα KK = ;

2o Se determină estimaŃiile de verosimilitate maximă sλλλ ˆ,ˆ,ˆ 21 K ;

30 Se determină distribuŃia empirică de selecŃie Nii

i

f

xX

,1

'

=

;

4o Se calculează probabilităŃile

)ˆ,,ˆ,ˆ,()ˆ,,ˆ,ˆ;()|(ˆ 211021001 sisiiii aFaFFFaXaPp λλλλλλ KK −− −==<≤=

, Ni ,1= ;

50 Se calculează )1(21, −−=− sNkhk α astfel încât αα −=− 1)( 2

1,kk hF ;

60 Se calculează ( )

∑=

−=

N

i i

ii

pn

pnfh

1

22

ˆ

ˆ;

70 Concluzii: dacă 21,

2α−< khh , ipoteza statistică 0FF = este admisă,

în caz contrar ipoteza este respinsă. ObservaŃie. Testul de concordanŃă 2χ nu este aplicabil dacă există

ipnˆ mai mici decât 5, caz în care se cere o regrupare a datelor de selecŃie.

121

IX.8. Testul de concordanŃă al lui Kolmogorov Fie caracteristica X de tip continuu, având funcŃia de repartiŃie

teoretică F. Dacă )(xF n este funcŃia de repartiŃie de selecŃie, avem că

( ) )(lim xKxdnP nn

=<∞→

,

unde

)()(sup xFxFd n

Rxn −=

∈,

iar ∑+∞

∞−

−−=222)1()( xkk exK este funcŃia lui Kolmogorov şi este tabelată.

Se face ipoteza nulă 0H că X urmează legea de probabilitate dată de

funcŃia de repartiŃie 0F . Dacă ipoteza nulă este adevărată, pentru

probabilitatea de risc α , se poate determina valoarea α−1x astfel încât

αα −=− 1)( 1xK .

Astfel, avem ( ) αα −=< − 11xdnP n sau αα −=

< − 11

n

xdP n .

Aşadar, dacă valoarea calculată a lui nd pentru datele de selecŃie, satisface

inegalitatea α−< 1xdn n , vom admite ipoteza nulă, în caz contrar o

respingem.

Etapele aplicării testului Kolmogorov.

1o Se consideră: α , distribuŃia empirică de selecŃie Nii

i

f

xX

,1

'

=

,

funcŃia de repartiŃie 0F , )( 21 Nfffn +++= K ;

2o Se calculează α−1x astfel încât αα −=− 1)( 1xK ;

30 Se calculează )()(max 0,1

iinNi

n aFaFd −==

, unde 2

1' iii

aax

+= − ;

4o Concluzii: dacă α−< 1xdn n , ipoteza nulă este admisă, în caz

contrar ipoteza este respinsă.

122

UNITATEA DE STUDIU X

REGRESIE ŞI CORELAłIE

X.1. NoŃiuni generale

In practică, populaŃiile depind de două sau chiar mai multe caracteristici. In plus, variabilele economice, fenomenele sociale, în general nu evoluează independent, ci sunt în legătură cu alte fenomene (variabile) . Astfel, utilizând cunoştinŃele privind nivelul unei anumite variabile se poate prognoza nivelul unei alte variabile cu care se află în relaŃie de dependenŃă. Studierea legăturii dintre fenomene se realizează utilizând regresia şi corelaŃia. Regresia descrie modul în care o variabilă dependentă evoluează în funcŃie de modificarea uneia sau a mai multor variabile independente (cauzale). Scopul regresiei este acela de a găsi funcŃii matematice care să descrie cât mai bine legăturile dintre variabile. Astfel de funcŃii sunt de forma

( ) exxxfy ni += ,...,, 21 ,

unde: iy este variabila dependentă ( sau variabilă efect, sau variabilă

rezultativă), ix sunt variabile independente (sau cauze, sau variabile

factoriale), iar e este variabila eroare (sau reziduu, sau eroare de modelare) ce reprezintă influenŃa acelor factori omişi în calcule. CorelaŃia stabileşte gradul în care o variabilă este dependentă de alte variabile. Termenii de regresie şi corelaŃie au fost împrumutaŃi din biometrie şi sunt atribuiŃi lui Galton. Acesta a studiat legătura dintre înălŃimea copiilor şi înălŃimea părinŃilor acestora. Concluzia a fost că din părinŃi foarte înalŃi se nasc copii mai mici de înălŃime, iar din părinŃi foarte scunzi se nasc copii mai înalŃi. Cu alte cuvinte are loc o regresie spre valoarea medie. Dacă nu s-ar întâmpla astfel, din părinŃi înalŃi s-ar fi ajuns la copii din ce în ce mai înalŃi, iar din părinŃi scunzi, s-ar fi ajuns la copii tot mai scunzi. Lumea s-ar fi confruntat astfel cu situaŃii de gigantism sau piticism. X.2. Metode elementare de caracterizare a legăturilor dintre variabile

a) Metoda seriilor statistice paralele interdependente

123

Această metodă constă în compararea termenilor a două serii interdependente ( )

niixX ,1= şi ( )niiyY ,1= , unde X este variabila independentă,

iar Y cea dependentă. X: nxxx ,...,,, 21

Y: nyyy ,...,,, 21

Se evidenŃiază existenŃa şi direcŃia legăturii dintre cele două variabile, după cum urmează:

• dacă valorile ambelor variabile variază în acelaşi sens, atunci există o legătură directă între variabile;

• dacă valorile variabilelor variază în sens diferit , atunci există o legătură inversă între variabile;

• dacă valorile variabilelor variază independent, sau, în timp ce valorile uneia din variabile variază, valorile celeilalte variabile rămân constante, atunci nu există legătură între variabile.

ObservaŃie. Această metodă se aplică în cazul unui număr mic de valori ale variabilelor.

b) Metoda tabelului de corelaŃie

Această metodă constă în gruparea unităŃilor unei populaŃii simultan după ambele variabile X şi Y.

1y 2y …………………..

py

1x 11n 12n ………………….. pn1

2x 21n 22n …………………… pn2

M M M …………………… M

kx 1kn 2kn ……………………. kpn

In funcŃie de modul de distribuŃie a frecvenŃelor ijn în acest tabel se

poate aprecia existenŃa, direcŃia, precum şi intensitatea legăturii dintre cele două variabile:

• dacă valorile ijn sunt dispersate relativ uniform pe toată suprfaŃa

tabelului, atunci nu există legătură între cele două variabile; • cu cât valorile ijn se concentrează mai mult în jurul diagonalelor

tabelului cu atât legătura este mai intensă (în jurul diagonalei principale “\”: legătură inversă; In jurul diagonalei secundare” /”: legătură directă).

c) Metoda grafică

124

Graficul se construieşte pornind de la perechile de valori observate ( )ii yx , care se reprezintă într-un sistem de coordonate ortogonal. Pe axa

absciselor se reprezintă valorile ix ale variabilei independente X, iar pe axa

ordonatelor se reprezintă valorile iy ale variabilei dependente. Graficul

obŃinut se numeşte corelogramă sau diagramă de împrăştiere. Dacă punctele sunt dispersate la întâmplare în plan, atunci între cele două variabile nu există legătură semnificativă. In acest caz putem considera că punctele se grupează în jurul unei drepte paralele cu axa absciselor. Dacă punctele se grupează în jurul unei drepte care nu este paralelă cu axa absciselor, atunci între cele două variabile există legături directe, sau inverse.

X.3. Modelul de regresie liniară

Prin acest model se exprimă legătura dintre două variabile printr-o relaŃie de forma

eXY ++= βα , unde Y este variabila dependentă, X este variabila independentă, iar e este eroarea ce însumează influenŃele asupra lui Y ale variabilelor neincluse în model. EcuaŃia exy ++= βα se numeşte ecuaŃie de regresie, iar panta acestei drepte, β , este coeficientul de regresie. Semnul lui β indică direcŃia legăturii dintre ele două variabile, după cum urmează:

• dacă 0>β , există legătură directă între variabile;

• dacă 0=β , nu există legătură între variabile;

• dacă 0<β , există legătură inversă între variabile. In ecuaŃia de regresie însă, parametrii α şi β sunt necunoscuŃi, iar

determinarea lor la nivelul întregii populaŃii statistice este imposibil de realizat. De acea se impune o estimare a parametrilor.

Considerăm a şi b cei doi estimatori ai parametrilor necunoscuŃi α şi β , calculaŃi la nivelul unui eşantion de volum n . EcuaŃia de regresie la nivelul eşaantionului este

ix bxayi

+= .

EcuaŃia de regresie la nivelul întregii populaŃii este

125

ixi eyyi+= .

Vom determin estimatorii din condiŃia ca iii bxaye −−= să fie minimă,

condiŃie ce implică şi faptul că suma ∑=

=n

i

ieS1

2 este minimă. Numim această

metodă, metoda celor mai mici pătrate. Pentru ca S să fie minimă trebuie îndeplinite următoarele condiŃii: i) Derivatele parŃiale de ordin I ale lui S în raport cu a şi b să fie nule:

=∂∂

=∂∂

0

0

b

S

a

S

.

Acest sistem este echivalent cu

=+

=+

∑∑∑

∑∑

===

==

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

yxxbxa

yxbna

11

2

1

11 .

SoluŃia acestui sistem este

.,

1

2

1

1

11

1

1

2

1

1

1

2

1

11

∑∑

∑∑

∑∑

∑∑

∑∑

==

=

==

=

==

=

==

==

==

n

i

i

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

xx

xn

yxx

yn

b

xx

xn

xyx

xy

a

ii) Matricea derivatelor parŃiale de ordinul al II-lea să fie pozitiv definită, adică determinantul matricei

∂∂

∂∂∂

∂∂∂

∂∂

=

2

22

2

2

2

b

S

ab

Sba

S

a

S

A

să fie pozitiv, ceea ce este echivalent cu condiŃia

02

11

2 >

∑∑==

n

i

i

n

i

i xxn .

ObservaŃie. Dacă se studiază legătura între două variabile folosind date grupate într-un tabel de corelaŃie, sistemul de mai sus devine

126

=+

=+

∑ ∑∑∑

∑∑ ∑∑

= = ==

= = ==

.1 1 1

2

1

1 1 11

k

i

k

i

p

j

ijjiii

k

i

ii

k

i

p

j

p

j

jj

k

i

iiij

nyxnxbnxa

nynxbna

X.4. Modele de regresie neliniară

Model de regresie de tip parabolic. EcuaŃia de regresie este de forma

ecxbxay +++= 2 . Pentru o estimare a parametrilor utilizând un eşantion de volum n se rezolvă sistemul:

=++

=++

=++

∑ ∑ ∑∑

∑ ∑∑∑

∑∑∑

= = ==

= ===

===

n

i

n

i

i

n

i

iii

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

yxxcxbxa

yxxcxbxa

yxcxbna

1 1 1

243

1

2

1 1

3

1

2

1

11

2

1

.

Model de regresie de tip hiperbolic. EcuaŃia de regresie este de forma

ex

bay ++= .

Pentru o estimare a parametrilor utilizând un eşantion de volum n se rezolvă următorul sistem:

=+

=+

∑ ∑ ∑

∑ ∑

= = =

= =

n

i

n

i

n

i i

i

ii

n

i

n

i

i

i

x

y

xb

xa

yx

ban

1 1 12

1 1

11

1

.

Model de regresie de tip exponenŃial. EcuaŃia de regresie este de forma

xbay ⋅= . Pentru orice eşantion, ecuaŃia se poate liniariza prin logaritmare:

bxay lnlnln += .

127

Estimarea parametrilor se face rezolvând următorul sistem:

=+

=+

∑∑∑

∑∑

===

==

.lnlnln

lnlnln

11

2

1

11

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

i

yxxbxa

yxban

X.5. Măsurarea intensităŃii legăturii dintre variabile

Pentru a măsura cât de puternică este legătura dintre variabile se utilizează diferiŃi indicatori.

CovarianŃa. Presupunem că avem o populaŃie statistică de volum N şi două

caracteristici X şi Y cu valorile ( )Niix ,1= şi, respectiv ( )

Niiy ,1= şi valorile

medii x şi respectiv y . CovarianŃa este un indicator care indică direcŃia legăturii dintre cele

două variabile X şi Y, dar nu şi intensitatea ei. Se defineşte prin expresia

( )( )( )

N

yyxx

YXCovi

N

i

i −−=∑=1, .

• dacă ( ) 0, >YXCov , atunci există legătură directă între variabile;

• dacă ( ) 0, <YXCov , atunci există legătură inversă între variabile;

• dacă ( ) 0, =YXCov , atunci nu există legătură între variabile.

Coeficientul de corelaŃie. Presupunem că avem o populaŃie statistică de volum N şi două

caracteristici X şi Y cu valorile ( )Niix ,1= şi, respectiv ( )

Niiy ,1= , valorile

medii x şi respectiv y şi abaterile medii pătratice Xσ şi respectiv Yσ . Coeficientul de corelaŃie se defineşte prin următorul raport:

( ) ( ) ( )( )

( ) ( )∑∑

==

=

−−

−−==

N

i

i

N

i

i

i

N

i

i

YXyyxx

yyxxYXCov

YX

1

2

1

2

1,,

σσρ .

128

Acest coeficient ia valori în intervalul [ ]1,1− , semnul său indică direcŃia legăturii, iar valoarea lui indică intensitatea acestei legături.

• dacă ( ) 0, >YXρ , există legătură directă între variabile;

• dacă ( ) 0, <YXρ , există legătură inversă între variabile;

• dacă ( ) 0, =YXρ , nu există legătură între variabile;

• dacă ( ) 1, ±≅YXρ , atunci legătura dintre variabile este una puternică;

• dacă ( ) 0, ≅YXρ , atunci legătura dintre variabile este foarte slabă.

O formulă simplificată pentru coeficientul de corelaŃie este următoarea:

( )

−=

∑∑∑∑

∑ ∑∑

====

= ==

2

11

22

11

2

1 11,N

i

i

N

i

i

N

i

i

N

i

i

N

i

N

i

ii

N

i

ii

yynxxn

yxyxn

YXρ .

Coeficientul de asociere Se foloseşte pentru măsurarea intensităŃii legăturii statistice dintre două caracteristici nenumerice alternative. Datele necesare calculului se grupează într-un tabel de asociere:

1y 2y

1x 11n 12n

2x 21n 22n De exemplu, dacă studiem asocierea dintre înălŃimea şi

greutatea unui grup de persoane, în cazul unei corelaŃii perfect pozitive, toate persoanele înalte trebuie să aibă greutate mare, iar cele scunde, greutate mică. In acest caz, frecvenŃele vor fi predominante în valorile 11n şi 22n .

In cazul unei corelaŃii negative, toate persoanele înalte au greutate mică, iar cele scunde , greutate mare. Acum frecvenŃele se vor concentra în 12n şi 21n .

In cazul lipsei de corelaŃie între variabile, frecvenŃele se distribuie uniform în tabel.

Măsurarea gradului de asociere dintre două variabile se face cu ajutorul coeficientului de asociere al lui Yule:

21122211

21122211

nnnn

nnnnCas +

−= .

129

Acesta este un coeficient adimensional, cu valori în intervalul [ ]1,1− . Cu cât valoarea sa este mai aproape de 1, cu atât asocierea dintre variabile este mai puternică.

Autoevaluare prin aplicaŃii

1. Un grup de oameni este intrebat care sunt tarile de provenienta ale masinilor utilizate. In tabelul frecventelor se cere sa se completeze coloanele libere.

tara Frecvent

a absoluta

Frecventa relativa

Frecvente absolute cumulate crescator

Frecvente absolute cumulate descrescator

Frecvente relative cumulate crescator

Frecvent relative cumulate descrescator

Romania 6 SUA 2 Japonia 3 Germania

5

Italia 4 Total

2. Adancimea lacului Bicaz a fost masurata in puncte diferite (in metri)

si rezultatele sunt urmatoarele: 15,4 16,7 16,9 17,0 20,2 25,3 28,8 29,1 30,4 34,5 36,7 39,1 39,4 39,6 39,8 40,1 42,3 43,5 45,6 45,9 48,3 48,5 48,7 49,0 49,1 49,3 49,5 50,1 50,2 52,3 Intocmiti un tabel al frecventelor.

3. La teza la matematica elevii dintr-o clasa au obtinut notele: 7, 4, 5, 5, 6, 8, 6, 5, 7, 9, 3, 4, 5, 6, 6, 5, 4, 5, 5, 7, 8, 6, 8, 6, 7, 7, 6, 10, 9, 6

a. Prezentati situatia notelor printr-o serie statistica; b. Completati tabelul frecventelor c. Trasati diagrama cu bastonase corespunzatoare seriei d. Se repartizeaza notele in urmatoarele clase: 3-4; 5-6; 7-8; 9-10.

Precizati noua serie statistica ce se formeaza si trasati-i diagrama prin coloane.

4. Se considera urmatoarea serie statistica reprezentand repartitia a 200

de familii dupa numarul de copii

130

Numar de copii Frecventa 0 65 1 60 2 29 3 32 4 8 5 6

a. Completati tabelul frecventelor b. Construiti diagrama seriei

5. 80 de mijloace de transport au fost distribuite dupa distantele parcurse

intr-o perioada de timp astfel

Distanta (in Km) Numar de mijloace [85,90) 3 [90,95) 15 [95,100) 20 [100,105) 23 [105,110) 14 [110,115) 5

a) Reprezentati histograma seriei statistice b) Construiti poligonul de frecvente al seriei.

6. Din cei 200 de absolventi ai unui liceu, 50 candideaza la ASE, 30 la

Facultatea de Drept, 20 la Politehnica, 10 la Facultatea de Medicina, 40 la scoli postliceale, iar restul doresc sa se angajeze.

a. Construiti tabelul frecventelor b. Reprezentati repartitia absolventilor printr-o diagrama circulara. 7. Echipa Steaua a avut pe teren la ultimul meci 11 jucatori cu

urmatoarele varste: Varsta 18 20 21 22 25 27 33 35 Nr. fotbalisti

1 3 1 1 2 1 1 1

Care a fost media de varsta a echipei Steaua in acest meci? 8. Pretul benzinei intre 1989 si 1997 a evoluat astfel:

Anul 1989 1990 1991 1992 1993 1994 1995 1996 1997 Pretul (lei)

15 25 30 30 330 450 1000 1500 2900

Care este indicele mediu de crestere a pretului?

131

9. Doua grupe de studenti, cu efective de 25 si respectiv 32 de persoane, au susŃinut un test de cultura generala. Prima grupa a obtinut media 7,8, iar a doua 8,4. Sa se gaseasca nota medie pe ansamblul celor doua grupe. 10. Se cunosc urmatoarele date

Intervale de salarii Nr. angajati 1,25-2 87 2-2,75 170 2,75-3,50 115 3,50-4,25 32 4,25-5,00 18 5,00-5,75 10 5,75-6,50 3 Total 375

Sa se calculeze salariul median si modal. 11. La o banca se analizeaza distributia debitorilor dupa situatia zilelor de intarziere a rambursarii creditelor, astfel :

Intervale de variatie a numarului de zile de intarziere a platii

Numar debitori

10-20 120 20-30 85 30-40 37 40-50 16 50-60 7 60-70 2

Sa se determine valoarea mediana. 12. In tabelul de mai jos sunt date referitoare la numarul de copii in familie in generatia actuala si numarul de copii din generatia parentala intr-un sat X:

Numar de copii Numar de familii din generatia actuala

Numar de familii din generatia parentala

1 18 6 2 66 14 3 46 34 4 21 36 5 12 30 6 22 26 7 7 15

8 6 17

132

9 2 13 10 0 5 11 0 1 12 0 1 13 0 0 14 0 0 15 0 1 16 0 1

Se cere: a. Modul, mediana si media pentru fiecare serie in parte. b. Diagrama cu coloane a fiecarei serii.

13.S-a analizat continutul de vitamina B6 in 12 loturi de biscuiti ce pretind a contine aceasta vitamina. Rezultatele obtinute in miliechivalenti pe kg sunt cuprinse in tabelul de mai jos

Continut vitamina B6 Nr. loturi 0,10 2 0,15 1 0,20 4 0,25 2 0,30 1 0,35 2

Sa se calculeze media, dispersia, abaterea medie patratica, mediana si modul. 14. Dintr-un lot de 10000 de sticle de ulei de jumatate de litru s-a masurat continutul la 100 din sticle luate la intamplare si s-au obtinut datele din tabelul de mai jos:

Clase in ml frecventa 492-493 3 493-494 3 494-495 3 495-496 2 496-497 4 497-498 6 498-499 13 499-500 17 500-501 20 501-502 9

133

502-503 5 503-504 4 504-505 3 505-506 2 506-507 2 507-508 2 508-509 2 Se cere:

a. Sa se traseze histograma seriei si poligonul frecventelor b. Sa se calculeze modul si mediana

15.Fie seria statistica

Numar piese

28 31 33 35 38 43

Numar muncitori

16 25 20 30 28 21

a. Care este media numarului de piese executate de un muncitor? b. Sa se calculeze abaterea medie patratica si coeficientul de variatie al

serie

16.La teza la matematica pe semestrul I la clasa a X-a A s-au obtinut notele:

Nota 5 6 7 8 9 10 Nr. elevi 2 5 5 5 5 2

In clasa a X-a B s-au obtinut urmatoarele note: Nota 4 5 6 7 8 9 10 Nr. elevi

1 2 4 2 7 8 0

a. Care clasa este mai buna? b. Care clasa este mai omogena ? c. Intocmiti diagramele cu coloane ale celor doua serii.

17.La proba de 100m plat a unui concurs de atletism s-au obtinut urmatoarele rezultate:

Timp realizat

11,8-12,2

12,2-12,6

12,6-13,0

13,0-13,4

13,4-13,8

13,8-14,2

14,2-14,6

14,6-15,0

Nr. concurenti

2 34 134 252 212 104 23 54

a. Reprezentati histograma seriei si poligonul frecventelor b. Determinati modul si mediana seriei c. Determinati valoarea medie a seriei , abaterea medie liniara, dipersia,

abaterea medie patratica si coeficientul de variatie.

134

18.Un controlor de trafic a urmărit lungimile cozilor la un anumit semafor. A numărat maşinile care s-au oprit şi aşteaptă la semafor pînă la apariŃia culorii verzi în 90 de perioade diferite.

Nr. maşini

0 1 2 3 4 5 6 7 8 9

Nr. perioade

3 9 12 15 15 15 11 8 2 0

CalculaŃi media şi varianŃa. 19.In tabelul următor au fost trecute distanŃele ( în km.) de la birou şi pănă la locuinŃă ale unui grup de lucrători în administraŃia unui oraş.

DistanŃa(km) [0,1) [1,2) [2,3) [3,4) [4,5) [5,6) [6,7) Nr. lucrători 5 21 24 15 20 13 2

a. CalculaŃi distanŃa medie între domiciliu şi locul de muncă. b. CalculaŃi valoarea modală şi mediana acestei serii statistice. c. ConstruiŃi histograma seriei.

20.Se măsoară diametrele a 400 de platani tineri dintr-un parc. Se obŃin următoarele rezultate :

Diametru(cm) 25 26 27 28 29 30 Procentaj 10% 15% 30% 35% 5% 5%

a. CîŃi arbori s-au găsit cu un diametru mai mare sau egal cu 27 cm ? b. Care este diametrul mediu al trunchiurilor platanilor din parc ? c. DeterminaŃi varianŃa. d. GăsiŃi valoarea modală a seriei statistice, iar apoi mediana seriei. e. RealizaŃi diagrama cu coloane, iar apoi diagrama circulară

corespunzătoare seriei statistice.

21.Intr-un magazin se comercializează 2 tipuri de pungi cu cartofi prăjiŃi provenind de la 2 firme diferite. S-au ales la întîmplare 10 pungi din fiecare tip, s-au căntărit şi s-au notat greutăŃile (în grame) : Tip I

Greutate(grame) 158 159 160 161 162 Nr. pungi 1 2 4 2 1

Tip II Greutate(grame) 157 158 159 160 161 162 163 Nr. pungi 2 1 1 1 2 2 1

a. CalculaŃi greutatea medie a unei pungi de cartofi produsă d firma I , respectiv II.

b. ComparaŃi abaterile medii pătratice corespunzătoare celor 2 serii statistice şi interpretaŃi rezultatul.

135

22..Se consideră un eşantion de 20 de clienŃi, care intră într-un magazin alimentar, pentru a cerceta frecvenŃa X cu care clienŃii fac apel la serviciile magazinului de-a lungul unei săptămâni şi respectiv pentru cercetarea cheltuielilor lunare Y în mii lei, ale clienŃilor pentru procurarea de bunuri alimentare. S-au obŃinut următoarele date de selecŃie pentru X şi respectiv Y

X: 1, 2, 1, 4, 3, 2, 5, 6, 1, 2, 3, 2, 3, 4, 6, 2, 4, 3, 1, 2; Y: 89, 90, 101, 88, 85, 77, 102, 100, 86, 97, 76, 121, 113, 110, 96, 92,

108, 112, 103, 109. Se cere:

a) distribuŃiile empirice de selecŃie pentru fiecare din caracteristicile X şi Y,

b) mediile de selecŃie, momentele centrate de selecŃie de ordinul al doilea şi dispersiile de selecŃie pentru caracteristicile X şi Y,

23. La un control de calitate se verifică diametrul pieselor prelucrate

de un strung. Pentru realizarea acestui control s-a considerat o selecŃie de 18 piese şi s-a obŃinut că diametrul X al pieselor are următoarele dimensiuni (în cm):

Diametrul (în cm)

3,98 3,99 4,00 4,01 4,02

Număr de piese 4 3 5 3 3

Să se determine: a) o estimaŃie absolut corectă pentru diametrul mediu al pieselor

realizate, b) o estimaŃie corectă şi una absolut corectă pentru dispersia

diametrelor faŃă de diametrul mediu. 3. . Fie caracteristica X, care are distribuŃia empirică de selecŃie:

X :

124242

50,4025,4000,4075,3950,3925,39.

Se cere media de selecŃie şi dispersia de selecŃie.

24. În urma unei selecŃii de volum n = 100, privind caracteristica X

s-au obŃinut următoarele date de selecŃie:

xI 10,50 10,55 10,60 10,65 10,70 10,75 10,80

fI 10 12 16 21 18 14 9

136

Se cere:

a) o estimaŃie absolut corectă pentru media teoretică m = M(X);

b) o estimaŃie corectă şi una absolut corectă pentru dispersia

teoretică .

Metoda verosimilitatii maxime 25. Pentru o selecŃie de volum n dintr-o distribuŃie exponenŃială

( )

<

≥⋅=

0 , 0

0 ,,

t

tetf

tλλλ

cu parametrul λ , să se găsească un estimator pentru λ . 26. Fie o selecŃie de volum n dintr-o populaŃie cu distribuŃia gamma

( ) ( )( )

<

≥−

⋅⋅⋅=

−−

0 , 0

0 ,!1

1,

1

t

tr

ettf

tr λλλλ .GăsiŃi un estimator pentru λ .

27. Presupunem că populaŃia are distribuŃia Poisson (cazul evenimentelor

rare). FuncŃia de probabilitate este !

),(x

exfxλ

λ λ−= , nx ,...,2,1,0= . Să se

estimeze parametrul λ . 28. Pe baza unei selecŃii de volum n , să se estimeze parametrii m şi σ din

repartiŃia normală : ( )( ) 2

21; ,

2

x m

f x m eσσ

σ π

− − = , Rx∈ , 0>σ .

Metoda momentelor 29..Fie variabila aleatoare cu densitatea de repartiŃie

( )( )

11, ,xx x eλρ λ

λ− −= ⋅ ⋅

Γ pentru 0,λ > 0.x > Se cere o metodă de a estima

pe λ prin selecŃii. 30. Fie o selecŃie de volum n dintr-o populaŃie cu distribuŃia gamma

( ) ( )( )

<

≥−

⋅⋅⋅=

−−

0 , 0

0 ,!1

1,

1

t

tr

ettf

tr λλλλ .

GăsiŃi un estimator pentru λ prin metoda momentelor. 31. Densitatea de probabilitate a unei variabile aleatoare X are forma:

2 , [0, ]( ; , , ) .

0, [0, ]

a bx x cf x a b c

x c

− ∈=

137

Rezultatele unei selecŃii de volum 3n = dau pentru X valorile:

1 2 3 , , 1,0,1.x x x = − Să se estimeze parametrii , ,a b c prin metoda

momentelor. 32. Durata de funcŃionare a unui bec electric, până când se arde, se presupune uniform distribuită cu parametrii a şi :b

1,

( ) .0, [ , ]

a x bf x b a

x a b

≤ ≤= − ∉

Se face o selecŃie de 5 becuri şi se notează cu 1 2 3 4 5, , , ,x x x x x timpii de

funcŃionare ai acestora până când se ard. DeterminaŃi estimatori pentru a şi b prin metoda momentelor.

33.Pe baza unui sondaj efectuat aleator pe n=51 de studenti s-au inregistrat diferite caracteristici. Prelucrand datele referitoare la doua dintre aceste caracteristici s-au obtinut urmatoarele rezultate:

Culoarea ochilor deschisa inchisa

Deschis 17 6 23 Culoarea parului Inchis 9 19 28 26 25 51 Sa se determine coeficientul de asociere intre cele doua caracteristici. 34.Sa se stabileasca legatura dintre distributia populatiei pe medii si sexe in judetul Bacau la 1 iulie 2000 M F Total Urban 185 193 378 Rural 186 182 368 35.Consideram ca in conditiile cresterii intr-o anumita perioada a veniturilor cu 15%, cererea in cazul a 3 produse a inregistrat urmatoarea modificare: produsul A- o crestere cu 25%; produsul B – o crestere cu 5%; produsul C- o crestere cu 15%. Sa se determine elasticitatea cererii in functie de venit. 36.Patronul unei firme ce vinde autoturisme presupune ca relatia dintre numarul de autoturisme (Y) vandute intr-o zi si numarul de vanzatori ce

138

lucreaza in salonul de prezentare si in sectorul publicitate (X) poate fi modelata printr-o linie dreapta. Datele culese pentru 5 zile sunt: xi 6 6 4 2 3 yi 20 18 10 6 11

b. Sa se scrie ecuatia dreptei de regresie. c. Sa se determine coeficientul de corelatie. 37.Pentru a caracteriza dependenta dintre cheltuielile pentru reparatii si vechimea utilajelor unei intreprinderi s-au inregistrat cele 2 caracteristici pentru 8 utilaje de acelasi tip:

cheltuieli reparatii(mii lei)

14 13 16 15 12 17 15 17

Vechime (ani)

8 5 10 7 6 10 9 11

b. Sa se scrie ecuatia dreptei de regresie. c. Sa se determine coeficientul de corelatie.

38.Considerand datele din tabelul de mai jos sa se estimeze parametrii modelului de regresie corespunzator

Cantitate ingrasaminte (X) Productia medie de grau /ha 1 10 2 15 3 20 4 30 5 40

39.Se considera caracteristicile: II- reprezentand in provente suprafata comerciala de expunere a

marfurilor spre vanzare fata de suprafata construita Y- reprezentand volumul valoric al vanzarilor, raportat la metro Patras suprafata de prezentare a marfurilor pe luna in mii lei. Sunt cunoscute urmatoarele date de selectie:

X 10 12 15 17 26 Y 40 45 42 53 60

b. Sa se determine dreapta de regresie a lui Y fata de X c. Sa se determine coeficientul de corelatie a variabilelor X si Y. d. Cu ajutorul dreptei de regresie sa se faca prognoza volumului valoric

al vanzarilor Y cand X ia valoarea 30.

139

40. Intr.-un sezon un bun material care are pret variabil oscileaza intre 8-16 mii lei /kg si este cumparat in cantitati variate intre 0-100 kg zilnic. Cercetand cumpararile si preturile in timpul a 40 de zile, au fost obtinute urmatoarele date:

8-10 10-12 12-14 14-16 80-100 1 0 0 0 60-80 3 5 1 0 40-60 2 3 6 1 20-40 1 1 7 2 0-20 0 1 3 3 Sa se studieze corelatia si regresia

TESTE DE AUTOEVALUARE

TEST 1

1. U magazin de articole pentru femei, situat în centrul unui mare oraş, doreşte să-şi deschidă o filială într-o zonă periferică. Pentru a obŃine informaŃii despre distribuŃia geografică a clienŃilor prezenŃi, managerul magazinului organizează o anchetă în care fiecare client dintr-o zi este întrebat unde locuieşte, raportat la cele 4 cadrane ale oraşului: nord-vest(NV), nord-est (NE), sud-vest (SV), sud-est (SE). ClienŃii din afara oraşului sunt excluşi din anchetă. Rezultatul anchetei se prezintă astfel: Clientul

zona

Clientul

zona

clientul

zona

clientul

zona

clientul

zona

1 NV 7 NE 13 SV 19 NV 25 SV 2 SE 8 SV 14 NV 20 SV 26 NV 3 SE 9 NV 15 SV 21 NE 27 NV 4 SV 10 SE 16 NE 22 NV 28 SE 5 NV 11 NV 17 NE 23 SV 29 E 6 NV 12 SE 18 NV 24 SE 30 SV

a) SistematizaŃi datele disponibile. b) PrezentaŃi grafic informaŃiile sistematizate.

2. Un fabricant de roŃi industriale bănuieşte că unele comenzi profitabile sunt pierdute din cauza timpului prea mare necesar firmei pentru a stabili preŃul cerut potenŃialilor clienŃi. Pentru a investiga această siuaŃie, 40 de cereri de fixare a preŃului au fost alese aleator din totalul ultimului an şi au fost calculaŃi timpii necesari pentru fixarea preŃului. Timpii (în zile), împreună cu clasificarea comenzii în “pierdută” sau nu, sunt: C timp Co Co tim Co Co tim Co Co tim Co Co tim Co

140

omanda cu nr.

m. pierduta

manda cu nr.

p m. pierduta

manda cu nr.

p m. pierduta

manda cu nr.

p m. pierduta

manda cu nr.

p m. pierduta

1 6.4 Nu 9 3.9 Nu 17 3.9 Nu 25 4 Nu 33 7.5 Nu 2 5.7 Nu 10 6.7 Da 18 7.7 Da 26 11.

4 Da 34 6.2 Nu

3 6.6 Nu 11 3.9 Nu 19 10.2

Da 27 3.2 Nu 35 8.2 Da

4 10 Da 12 6.5 Nu 20 5.5 Nu 28 6.4 Nu 36 4.4 Nu 5 4.9 Nu 13 8.6 Nu 21 3.3 Nu 29 5.1 Nu 37 5.9 Nu 6 6.5 Nu 14 6.4 Nu 22 6 Nu 30 7.8 Da 38 9.9 Da 7 6 Nu 15 9.5 Da 23 5.9 Nu 31 4.4 Nu 39 12.

2 Da

8 4.7 Nu 16 .9 Nu 24 7.3 da 32 5.5 nu 40 9 Nu Să se sistematizeze datele prezentate şi să se reprezinte grafic distribuŃiile. 3. Nivelul de instruire pentru cei 50 de angajaŃi ai unei societăŃi comerciale este dat prin datele din următorul tabel, unde am făcut următoarele notaŃii: P=nabsolvenŃi de învăŃămănt primar, G= AbsolvenŃi de învăŃămănt gimnazial, L= absolvenŃi de învăŃămănt licea, S= absolvenŃi de învăŃămănt superior. Angajatul cu nr.

instruire

Angajatul cu nr.

instruire

Angajatul cu nr.

instruire

Angajatul cu nr.

instruire

Angajatul cu nr.

instruire

1 G 11 P 21 S 31 L 41 L 2 S 12 S 22 S 32 S 42 L 3 S 13 L 23 L 33 L 43 L 4 L 14 L 24 G 34 S 44 G 5 L 15 S 25 G 35 L 45 L 6 G 16 L 26 S 36 P 46 L 7 S 17 S 27 L 37 L 47 L 8 L 18 G 28 S 38 L 48 L 9 S 19 S 29 L 39 L 49 L 10 L 20 L 30 L 40 G 50 L

j) Să se sistematizeze datele k) Să se reprezinte grafic informaŃiile sistematizate l) Să se calculeze ponderea salariaŃilor pentru fiecare nivel de instruire

si să se reprezinte grafic rezultatele.

141

4. Venitul salarial pentru 50 de angajaŃi ai unei companii este: 62, 82, 89, 97, 114, 63, 83, 90, 98, 119, 64, 84, 90, 99, 13, 65, 84, 91, 101, 132, 69, 85, 91, 102, 133, 72, 86, 92, 104, 134, 74, 86, 93, 105, 145, 76, 87, 94, 107, 146, 77, 88, 95, 110, 164, 79, 89, 96, 113, 174. a)Să se sistematizeze datele pe 7 intervale egale de variaŃie . b) ConstruiŃi histograma şi poligonul frecvenŃelor. 5. Se dau următoarele valori: 40, 50, 10, 6, 15, 23, 39, 42, 62, 65, 1, 19, 32, 7, 24, 68, 29, 72, 74, 62, 58, 9, 23, 23, 25, 76, 22, 2, 5, 53. a) ConstruiŃi o serie de distribuŃie de frecvenŃe începănd de la valoarea 0, avănd 10 intervale de variaŃie de mărime egală. b) ) ConstruiŃi histograma şi poligonul frecvenŃelor. c) CalculaŃi frecvenŃele cumulate.

TEST 2

1. Două grupe de studenŃi, cu efective de 25 şi, respectiv, 32 de persoane, au susŃinut un test de cultură generală. Prima grupă a obŃinut media 7,8 iar a doua grupă 8,4. Să se determine nota medie pe ansamblul celor două grupe. 2.Intr-o colectivitate statistică s-au cules date privitoare la 2 variabile numerice şi s-au obŃinut rezultatele:

X: 4, 1, 1, 5, 6, 3, 2, 1 Y: 100, 90, 40, 80, 70, 5, 100, 70

Să se cerceteze după care din variabile colectivitatea este mai omogenă. 3. Care dintre următoarele colectivităŃi are cea mai mică abatere pătratică pentru variabila “inălŃime”? a) toate persoanele; b) colectivitatea bărbaŃilor; c) colectivitatea bărbaŃilor din Canada; d) colectivitatea bărbaŃilor din Canada cu varste mai mari de 30 de ani; e) colectivitatea bărbaŃilor din Canada cu varste mai mici de 30 de ani.

9. Pentru 41 de copii cunoaştem următoarea distribuŃie privind nivelurile atinse la un joc pe computer:

Nivelul FrecvenŃa A 10 B 12 C 15 D 3

142

E 1 Să se găsească nivelul median şi cel modal.

TEST 3

1. Care dintre următoarele afirmaŃii referitoare la coeficientul de omogenitate (variaŃie) nu este adevărată: a) este un indicator sintetic al împrăştierii; b) este expresia rellativă a abaterii medii pătratice; c) valori mici ale coeficientului de variaŃie semnifică un grad mare de reprezentativitate a mediei caracteristicii studiate; d) valori mici ale coeficientului de variaŃie semnifică o tendinŃă accentuată de simetrie a distribuŃiei; e) valori mici ale coeficientului de variaŃie reflectă omogenitatea colectivităŃii din punctul de vedere al caracteristicii studiate. 2. Dacă într-o serie statistică valorile individuale se simplifică de k ori , atunci dispersia noii serii este: a) de 2k ori mai mică faŃă de dispersia seriei iniŃiale; b) de k ori mai mare faŃă de dispersia seriei iniŃiale; c) egală cu dispersia seriei iniŃiale; d) de 2k ori mai mare faŃă de dispersia seriei iniŃiale; e) de k ori mai mare faŃă de dispersia seriei iniŃiale. 3. Dacă într-o serie statistică valorile individuale se micşorează cu constanta a , atunci dispersia noii serii este: a) egală cu dispersia seriei iniŃiale; b) de a ori mai mare faŃă de dispersia seriei iniŃiale; c) de a ori mai mică faŃă de dispersia seriei iniŃiale; d) mai mică decăt dispersia seriei iniŃiale cu constanta a; e) mai mare decăt dispersia seriei iniŃiale cu constanta a. 4. SalariaŃii unei firme au salariul mediu de 700 lei cu o abatere medie pătratică de 150 de lei. Patronul firmei hotărăşte să mărească fiecare salariu individual de 1,3 ori. Dispersia noilor salarii faŃă de salariul mediu va fi: a) 150; b) 22500; c) 29250; d) 253,5; e) 38025. 5. FrecvenŃa cumulată crescător a ultimei grupe este întotdeauna egală cu: a) numărul de unităŃi din colectivitatea statistică; b) numărul de unităŃi din ultima grupă; c) frecvenŃa absolută cumulată descrescător a ultimei grupe;

143

d) frecvenŃa absolută a ultimei grupe plus volumul volectivităŃii. 6. Media aritmetică a unei variabile aleatoare reprezintă: a) momentul simplu de ordinul I; b) momentul centrat de ordinul I; c) momentul simplu de ordinul II; d) momentul centrat de ordinul II; e) momentul simplu de ordinul II minus momentul simplu de ordinul I la pătrat. 7. Coeficientul lui Pearson se utilizează pentru analiza statistică a a) asimetriei; b) variaŃiei; c) boltirii; d) tendinŃei centrale; e) indicatorilor medii de poziŃie.

TEST 4

1. Intr-un proces de verificare a ipotezelor statistice, nivelul de încredere reprezintă probabilitatea: a) α ; b) α−1 ; c) β ; d) β−1 ; e) βα + . 2. Intr-un proces de testare a ipotezelor statistice, eroarea de genul al doilea este: a)eroarea pe care o facem acceptănd ipoteza nulă cănd ea este adevărată; b) eroarea pe care o facem acceptănd ipoteza alternativă cănd ea este falsă; c) eroarea pe care o facem acceptănd ipoteza nulă cănd ea este falsă; d) eroarea pe care o facem eliminănd ipoteza nulă cănd ea este adevărată; e) eroarea pe care o facem eliminănd ipoteza alternativă atunci cănd ea este falsă. 3. Intr-un proces de testare a ipotezelor statistice, eroarea de genul al doilea este: a)eroarea pe care o facem acceptănd ipoteza nulă cănd ea este adevărată; b) eroarea pe care o facem acceptănd ipoteza alternativă cănd ea este adevărată; c) eroarea pe care o facem acceptănd ipoteza nulă cănd ea este falsă; d) eroarea pe care o facem eliminănd ipoteza nulă cănd ea este adevărată;

144

e) eroarea pe care o facem eliminănd ipoteza alternativă atunci cănd ea este adevărată.. 4. Dacă notăm maxx valoarea maximă dintr-un eşantion, care dintre următorii

termeni este corect pentru a descrie maxx ?

a) valoare aşteptată; b) mediană; c) estimator; d) parametru; e) abatere medie pătratică. 5. Datele sistematizate, obŃinute în urma unui studiu statistic privind vechimea în muncă şi timpul zilnic nelucrat, efectuat de 800 de salariaŃi ai unei societăŃi comerciale sunt:

Timp nelucrat Vechimea Sub 60 min. Peste 60 min

Peste 10 ani 300 150 Sub 10 ani 100 250

Să se precizeze dacă între cele două variabile există o legătură. 6. In utilizarea tabelului de corelaŃie pentru analiza legăturilor dintre fenomene, dacă frecvenŃele sunt aproximativ egal repartizate în interiorul tabelului, atunci: a) legătura este neliniară; b) legătura este liniară directă; c) legătura este inversă; d) legătura este directă; e) legătura este slabă sau nu există legătură între variabile. 7. In utilizarea metodei regresiei pentru studiul dependenŃei dintre variabile,

modelul de forma ebx

ay ++=1

este un model:

a) liniar; b) exponenŃial; c) logaritmic; d) hiperbolic; e) parabolic. 8. Să se precizeze care dintre următoarele metode de caracterizare a legăturilor dintre variabilele statistice nu se încadrează în categoria “metodelor simple”: a) metoda seriilor interdependente; b) metoda grafică;

145

c) metoda corelaŃiei; d) metoda tabelului de corelaŃie; e) metoda grupărilor. 9. Pentru cele două variabile statistice între care există o dependenŃă liniară s-a înregistrat o mulŃime de date; statistice. In urma prelucrării acestora s-au obŃinut indicatorii:

96811

1

=∑=i

iy ; 91,18311

1

=∑=i

ix ; 6,9629911

1

2 =∑=i

iy ; 8,409911

1

2 =∑=i

ix ,

9,1948511

1

=∑=i

ii yx .

GăsiŃi ecuaŃia dreptei de regresie. 10. Pentru caracterizarea unei grupe de studenŃi din anul I al FacultăŃii de ŞtiinŃe, în funcŃie de media la admitere, unitatea statistică de observare este: a) grupa; b) studentul; c) media la admitere; d) facultatea; e) anul de studiu. 11. IdentificaŃi care dintre următoarele date nu sunt variabile statistice pentru studiul colectivităŃii studenŃilor de la Facultatea de ŞtiinŃe: a) grupa; b) media la admitere; c) facultatea; d) vărsta; e) înălŃimea. 12. Obiectivul fundamental al statisticii este: a) să demonstreze formule şi teoreme matematice; b) să rezume şi să analizeze un set de date statistice; c) să extragă eşantioane din colectivităŃi statistice; d) să detecteze valorile aberante dintr-un set de date; e) să explice diferenŃele dintre seturile de date. 13. Care dintre următoarele variante reprezintă un eşantion şi nu o colectivitate totală pentru încasările zilnice, din anul trecut, ae unui magazin? a) Lista încasărilor zilnice din anul trecut; b) lista încasărilor zilnice cu 2 ani în urmă; c) lista încasărilor din fiecare zi de sămbătă a anului trecut; d) Totalul încasărilor săptămănale din anul trecut; e) lista încasărilor zilnice previzionate pentru anul trecut.

146

14. Statistica oferă posibilitatea unei firme: a) să estimeze vănzările din luna viitoare pe baza datelor privitoare la vănzările ultimelor 12 luni; b) să estimeze vănzările din viitorii 2 ani pe baza datelor privitoare la vănzările ultimelor 12 luni; c) să estimeze vănzările formelor concurente, pe baza datelor referitoare la vănzările proprii; d) să estimeze toate variantele de mai sus; e) să nu estimeze nici una din variantele de mai sus.

147

BIBLIOGRAFIE

[1] Craiu, M. – Statistică matematică- teorie şi probleme, Editura MatrixRom, Bucureşti, 2002. [2] Isaic-Maniu, A., MitruŃ, C., Voineagu, V. – Statistică, Editura Universitară, Bucureşti, 2004 [3] Radomir, I., Ovesea, H. – Matematici speciale, editura Albastră, Cluj 2001. [4] Reischer, C., Sâmboan, A. – Culegere de probleme de teoria

probabilităŃilor şi statistică matematică, Editura Didactică şi Pedagogică, Bucureşti, 1972. [5] Sebe, G.I. – AplicaŃii ale probabilităŃilor în tehnică şi alte ştiinŃe, Editura MatrixRom, Bucureşti, 2002. [6] Tutubalin, V.N. – Teoria probabilităŃilor, Editura MatrixRom, Bucureşti, 2012.