10
UNITATEA DE ÎNVĂŢARE 2 Testarea ipotezelor statistice Obiectivele cursului: 1. Cunoaşterea considerentelor teoretico-metodologice privind testarea ipotezelor statistice; 2. Testarea ipotezei privind media populaţiei generale pentru eşantioane de volum redus, respectiv de volum mare 3. Compararea mediilor dintre două eşantioane de volum redus. Prin ipoteză statistică se înţelege “presupunerea” care se face cu privire la parametrul unei repartiţii sau a legii de repartiţie pe care o urmează anumite variabile aleatoare. Există două ipoteze statistice: ipoteza nulă este ipoteza care urmează a fi testată şi este notată cu H 0 . Aceasta presupune că nu există deosebiri esenţiale sau că eventualele deosebiri au un caracter întâmplător; ipoteza alternativă reprezintă negarea ipotezei nule şi se noteaza cu H 1 . Procedeul de verificare a unei ipoteze statistice se numeste test sau criteriu de semnificatie . Pentru cele mai multe testari statistice, testul este derivat din estimatorul punctual al parametrului ce va fi testat. Ipoteza alternativă poate avea una din următoarele trei forme. De exmplu, dacă testăm parametrul µ numit medie al unei colectivităţi generale cu valoarea µ 0 putem obţine următoarele trei situaţii privind ipoteza alternativă: 1

UNITATEA DE INVATARE 2.docx

Embed Size (px)

Citation preview

UNITATEA DE NVARE 2Testarea ipotezelor statisticeObiectivele cursului:1. Cunoaterea considerentelor teoretico-metodologice privind testarea ipotezelor statistice;2. Testarea ipotezei privind media populaiei generale pentru eantioane de volum redus, respectiv de volum mare3. Compararea mediilor dintre dou eantioane de volum redus.Prin ipotez statistic se nelege presupunerea care se face cu privire la parametrul unei repartiii sau a legii de repartiie pe care o urmeaz anumite variabile aleatoare.Exist dou ipoteze statistice: ipoteza nul este ipoteza care urmeaz a fi testat i este notat cu H0. Aceasta presupune c nu exist deosebiri eseniale sau c eventualele deosebiri au un caracter ntmpltor; ipoteza alternativ reprezint negarea ipotezei nule i se noteaza cu H1.Procedeul de verificare a unei ipoteze statistice se numeste test sau criteriu de semnificatie. Pentru cele mai multe testari statistice, testul este derivat din estimatorul punctual al parametrului ce va fi testat.Ipoteza alternativ poate avea una din urmtoarele trei forme. De exmplu, dac testm parametrul numit medie al unei colectiviti generale cu valoarea 0 putem obine urmtoarele trei situaii privind ipoteza alternativ: test bilateral: H0: = 0 H1: 0 test unilateral de dreapta: H0: = 0 H1: > 0 test unilateral de stnga: H0: = 0 H1: < 0 n testul bilateral, regiunea de respingere a ipotezei H0 corespunde unui interval, divizat n dou subintervale, delimitate la un capt de o valoare critic (prag critic),iar la cellalt capt de infinit: (-; valoarea critic inferioar] i [valoarea critic superioar;+).Tabelul de mai jos ilustreaz relaia dintre decizia luat referitoare la ipoteza nul i adevrul sau falsitatea acestei ipoteze.n testarea ipotezelor statistice se disting dou tipuri de teste: Testele parametrice -presupun cunoaterea distribuiei populaiei (legii de distribuie) considerate. Cel mai cunoscut este testul Student (testul t). De asemenea, acesta este utilizat pentru testarea valorii unui coeficient de regresie, precum i a valorii coeficientului de corelatie. Testele neparametrice -presupun testarea ipotezelor statistice fr a cere specificarea formei parametrice a distribuiei populaiilor comparate: - testul Wilcoxon (utilizat pentru a verifica, pe baza de sondaj, dac exist diferene semnificative ntre dou populaii), - testul Mann-Whitney (utilizat pentru verificarea existenei egalitii dintre dou populaii), - testul Kolmogorov-Smirnov (testeaz identitatea a dou funcii de repartiie), etc. Admitem ca parametru - nivelul mediu al distribuiei unei medii i un estimator al acestuia. Testarea ipotezei ca o valoare a estimatorului estimeaz valoarea parametrului , presupune parcurgerea urmtoarele etape:1. formularea ipotezelor ipotezele pot fi sub forma testului bilateral sau unilateral de stnga sau de dreapta; 2. alegerea testului statistic depinde de volumul eantionului extras i de cunoaterea sau necunoaterea variantei distribuiei.3. specificarea unui prag de semnificaie al test se asociaz testului o probabilitate pragul de semnificaie asociat testului, adic riscul pe care l admitem n respingerea ipotezei nule cnd aceasta este adevrat.4.definirea regiunii de respingere 5. calcularea valorii numerice a statisticii test folosind datele rezultate din observarea eantionului.6. formularea concluziilor (decizia) se compar valoarea calculate a statisticii respective cu valoarea critic a lui z sau t cu (n-1) grade de libertate pentru pragul de semnificaie ales: dac valoarea numeric calculat a statisticii cade n regiunea de respingere, se poate spune c ipoteza alternativ este adevarat; daca valoarea statisticii nu cade n regiunea de respingere, avem rezerve s spunem c ipoteza este adevarat. Considerente teoretico-metodologice-Pentru eantioanele de volum redus , forma distribuiei de eantionare a mediei depinde de forma populaiei generale din care este extras eantionul-Dac nu se cunoate dispersia colectivitii generale , atunci dispersia eantionului este posibil s nu ofere o aproximare foarte bun a lui -n consecin, n locul statisticii z care necesit cunoaterea cu o bun aproximare a lui se utilizeaz statistica: Testarea ipotezei privind media populaiei generaleIpotezele statistice vor fi, n aceste condiii: pentru test bilateral;H0: = 0 H1: 0 pentru test unilateral dreapta;H0: = 0 H1: > 0 pentru test unilateral stnga;H0: = 0 H:1 < 0 Pentru eantioane de volum mic , testul statistic utilizat este:,

Dac pragul de semnificaie este stabilit atunci regiunea critic este: pentru test bilateralpentru test unilateral dreaptapentru test unilateral stngaExempluConducerea unei companii apeleaz la 5 experi pentru a previziona profitul companiei n anul curent. Valorile previzionate sunt 2,6; 3,32; 1,80; 3,43; 2,00 (miliarde lei). tiind c profitul n anul anterior profitul a fost de 2,01 miliarde lei, se poate concluziona cu o probabilitate de 95% c media previziunilor experilor este semnificativ mai mare dect cifra anului anterior ? Rezolvare:E1: H0: = 0 H1: > 0 E2: Se alege nivelul de ncredere al testului statisticE3:se stabilete testul statistic utilizat drept criteriu de acceptate sau respingere a ipotezei nule ( ), n funcie de volumul eantionului i obiectivul urmrit volum mic ( ) -> testul t - H1: > 0 - testul unilateral dreapta E4: se calculeaz valoarea numeric a testului statistic pe baza datelor din eantion

E5 Se determin astfel:

Se caut n tabelul cu valorile repartiiei Student n funcie de probabilitate i numrul gradelor de libertate (f=n-1)

E6:Se verific dac valoarea testului cade n regiunea critic i se ia decizia Cum acceptm ipoteza nul i respingem Rezult c nu se poate trage concluzia c media profitului previzionat pentru anul curent va fi semnificativ mai mare dect profitul anului trecut (2,01 milioane lei) Pentru eantioane de volum mare (n>30) , testul statistic utilizat este:,

Dac pragul de semnificaie este stabilit atunci regiunea critic este: pentru test bilateral , pentru test unilateral dreapta ,pentru test unilateral stngaExempluPatronul unei firme de prestri servicii dorete s fluidizeze servirea clienilor i, pn n prezent, el presupunea c timpul de servire al clienilor este normal distribuit, de medie 130 minute i abatere medie ptratic de 15 minute. El este de acord cu abaterea medie ptratic, dar se ndoiete de faptul c durata medie de servire a unui client este de 130 minute. Pentru a studia aceast problem, nregistreaz timpii de servire pentru 100 clieni. Timpul mediu obinutn eantion este de 120 minute. Poate patronul s concluzioneze faptul c timpul mediu este diferit de intervalul de 130 minute pentru o probabilitate de 99%?Rezolvare:E1: H0: = 0 H1: 0E2: Se alege nivelul de ncredere al testului statisticE3:se stabilete testul statistic utilizat drept criteriu de acceptate sau respingere a ipotezei nule ( ), n funcie de volumul eantionului i obiectivul urmrit volum mare ( ) -> testul z - H1: 0- testul bilateralE4: se calculeaz valoarea numeric a testului statistic pe baza datelor din eantion

E5: Se determin astfel: E6:Se verific dac valoarea testului cade n regiunea critic i se ia decizia Cum se respinge H0 i se accept H1. Rezult c nu sunt suficiente dovezi pentru a respinge ipoteza nul H0 i pentru a accepta ipoteza alternativ, aceea c timpul mediu de servire al unui client este diferit de 130 minute.

Aplicaii propuse spre rezolvare:1. Un fabricant de automobile a estimat c un nou tip de maini obine un consum mediu de 11 litri la 100 km, dar compania care dorea s comercializeze aceste maini pretindea c acest consum depete estimaia productorului. Pentru a susine afirmaia, compania a selectat 36 de maini i a nregistrat consumul. Au rezultat datele: litri / 100 km; s = 3,0 litri / 100 km.a) Dac cei interesai doresc s arate c media consumului este mai mare de 11 litri / 100 km, care este ipoteza nul? Dar ipoteza alternativ?b) Efectuai testarea pentru = 0,05.2.

Analiza unui eantion aleator de 49 de observaii a dus la urmtoarele rezultate: ; .a)

Testai ipoteza nul , cu ipoteza alternativ: , utiliznd o probabilitate de 99%.b)

Testai ipoteza nul cu ipoteza alternativ utiliznd o probabilitate de 90%.3. Un productor de imprimante pentru calculatoare personale dorete s estimeze media numrului de caractere tiprite pn cnd se consum cerneala. Costul crescut al unei astfel de anchete impune utilizarea unui eantion de volum redus. Presupunem c au fost testate n = 15 imprimante i s-au calculat: milioane caractere, s = 0,27 milioane caractere.a) S se testeze cu o probabilitate de 90% intervalul de ncredere pentru numrul mediu de caractere.b)

S se testeze ipoteza nul milioane, cu ipoteza alternativ milioane caractere, utiliznd o probabilitate de 95%, n ipoteza distribuiei normale a numrului de caractere n colectivitatea general.7