Upload
nelu-stoica
View
123
Download
4
Embed Size (px)
DESCRIPTION
MTC
Citation preview
PROIECT STATISTICA Student STOICA P. ION Grupa C
Cuprins
TEMA PROIECTULUI............................................................................................................2
1 EXTRAGEREA EŞANTIONULUI......................................................................................3
2 GRUPAREA DATELOR ÎNREGISTRATE.......................................................................4
2.1 Gruparea pe intervale de variaţie egale..............................................................................4
2.2 Gruparea pe intervale de variaţie neegale..........................................................................7
3 CALCULUL MĂRIMILOR RELATIVE DE STRUCTURĂ............................................8
4 CARACTERIZAREA STATISTICĂ A REPARTIŢIILOR OBŢINUTE......................10
4.A. Repartiţia vânzătorilor după vârstă..................................................................................11
4.C. Repartiţia vânzătorilor după orele lucrate.....................................................................12
5 ANALIZA CORELAŢIEI DINTRE SALARIUL NET ȘI ORELE LUCRATE............14
BIBLIOGRAFIE...........................................................................................................................16
1
PROIECT STATISTICA Student STOICA P. ION Grupa C
0 TEMA PROIECTULUI
Un agent economic dispune de o reţea de unităţi economice cu profilul alimentaţie
publică în care sunt angajaţi 500 de vânzători.
Pentru cei 500 de vânzători, consideraţi ca o colectivitate generală, s-a întocmit o bază de
sondaj. Înscrierea în baza de sondaj a vânzătorilor s-a făcut în ordine alfabetică, ceea ce
constituie un criteriu aleator şi li s-a dat un cod (nr. crt.).
Considerând cei 500 de vânzători ca formând o colectivitate statistică se cere:
1. să se extragă printr-un procedeu de sondaj un eşantion de 60 de unităţi şi să se centralizeze
nivelurile individuale ale fiecăruia din variabilele prezentate potrivit conţinutului lor;
2. să se grupeze datele înregistrate la punctul precedent folosind grupările simple pentru toate
caracteristicile înregistrate pe intervale egale şi neegale (se vor folosi minim 8 grupe pentru
intervale egale şi minim 3 grupe pentru intervale neegale) şi să se centralizeze datele
condiţionate de grupările folosite. Să se reprezinte grafic seriile obţinute,
3. să se calculeze toate mărimile relative posibile şi să se reprezinte grafic mărimile obţinute
folosind diagramele adecvate;
4. să se calculeze indicatorii tendinţei centrale, indicatorii variaţiei şi ai asimetriei pentru
variabilele înregistrate;
5. să se aplice metoda corelaţiei şi regresiei pentru datele din eşantion. Să se măsoare gradul de
intensitate al corelaţiei. Pentru date grupate se vor lua în calcul primele 10 unităţi din
eşantion, la care se vor calcula şi coeficienţii de corelaţie a rangurilor.
2
PROIECT STATISTICA Student STOICA P. ION Grupa C
1 EXTRAGEREA EŞANTIONULUI
1. Din baza de sondaj se extrage un eşantion format din 60 de vânzători. La extragere s-a folosit
procedeul selecţiei mecanice cu pas de numărare egal cu 8 şi prima unitate
extrasă … .S-au înregistrat datele privind sexul, vârsta (ani), zile lucrate, ore lucrate, valoarea desfacerilor lunare (lei) şi salariul net lunar (lei) din luna februarie 2009.
Nr. crt. Sex Vârsta Zile Ore Valoarea desfacerilor
(lei)
Salariul net lunar
(ani) lucrate lucrate (lei)
A B C D E F G
72 F 26 17 135 110500 1181 80 F 23 22 182 171600 1593 88 F 23 21 174 117600 1392 96 F 23 23 187 148350 1636
104 M 25 21 173 155400 1514112 F 19 17 140 123250 1100120 F 19 18 146 144000 1278128 F 26 17 135 110500 1181136 F 25 23 178 181700 1558144 F 20 22 157 145200 1374152 F 20 21 157 156450 1374160 M 24 22 192 156200 1680168 F 23 24 183 168000 1601176 F 20 22 157 145200 1374184 F 24 21 175 147600 1531192 F 23 22 182 171600 1593200 M 22 24 211 189600 1846208 M 23 22 187 149600 1636216 M 23 18 142 118800 1243224 F 23 23 187 148350 1636232 F 22 21 190 156450 1663240 M 22 19 151 149150 1321248 F 23 22 176 160600 1540256 F 22 17 147 119000 1286264 F 26 17 135 110500 1181272 M 23 22 176 156200 1540280 F 26 23 180 172500 1575
3
PROIECT STATISTICA Student STOICA P. ION Grupa C
288 M 25 21 173 155400 1514296 F 20 19 165 152000 1444304 M 21 21 150 115500 1313312 M 25 23 184 138000 1610320 M 22 19 151 149150 1321328 M 22 24 211 189600 1846336 F 26 17 135 110500 1181344 F 19 17 140 123250 1100352 M 23 22 187 149600 1636360 F 21 17 140 132600 1225368 M 25 23 184 138000 1610376 F 24 23 188 184800 1504384 F 23 21 174 117600 1392392 M 22 19 151 149150 1321400 F 20 19 166 125400 1453408 F 21 23 191 179400 1671416 M 25 23 184 138000 1610424 M 22 24 211 189600 1846432 M 21 22 181 173800 1584444 F 20 21 157 156450 1374448 M 23 22 187 149600 1636456 M 23 18 166 125100 1453464 F 24 23 188 184800 1504472 F 21 24 184 165900 1472480 M 24 22 179 163900 1566488 F 26 17 135 110500 1181496 F 20 19 166 125400 14534 F 21 24 184 165900 147212 F 23 24 183 168000 160120 F 20 19 166 125400 145328 F 27 21 168 147000 147036 F 24 23 193 155250 168944 F 26 23 180 172500 1575
Total Total 1258 10237 8910950 88507
Interpretare.....
2 GRUPAREA DATELOR ÎNREGISTRATE
2.1 Gruparea pe intervale de variaţie egale
1. Gruparea datelor înregistrate 1.1. Gruparea pe intervale de variaţie egale
4
PROIECT STATISTICA Student STOICA P. ION Grupa C
Gruparea pe intervale egale implică următoarele etape:a) calculul amplitudinii absolute de variaţiei (A) care exprimă împrăştierea maximă a
valorilor serei.Ax
a = Xmax – Xmin; Dacă variaţia este foarte mică (în cazul nostru Ax
a 10) se va forma o distribuţie pe variante (valabil în cazul caracteristicilor: vârsta; zile lucrate).b) stabilirea în parametrii într-un anumit număr de grupe (r) se poate stabili astfel:
dacă variaţia caracteristicii este relativ uniformă şi volumul de unităţi nu este suficient de mare numărul de grupe se poate fixa anterior (din cerinţele proiectului se vor folosi minimul 8 grupe pentru intervale egale);
iar dacă numărul grupelor nu este anterior cunoscut şi volumul unităţilor este suficient de mare se recomandă stabilirea grupelor conform relaţiei lui Sturgers,
r = 1+3,322log nunde: n - nr. caracteristicilor.
c)determinarea mărimii intervalului de grupare (h), se calculează ca raport între amplitudinea absolută a variaţiei şi numărul de grupe:
sau
Notă: Mărimea intervalului (h) se rotunjeşte la întreg în plus (ex.3,254) Prima grupă se porneşte de la xmin adăugându-se succesiv mărimea intervalului de grupare
(h) rezultat din calculul anterior. Valoarea din stânga intervalului va fi considerată ca limită inferioară, iar valoarea din dreapta ca limită superioară. Valorile care formează limitele intervalelor se înregistrează fie numai ca limită superioară fie ca limită inferioară pentru a evita înregistrări duble a caracteristicilor.
Analog se rezolvă pentru orice variabilă.
2A. Gruparea pe intervale egale a vânzătorilor după vârstăa) Amplitudinea variaţiei Ax
a = Xmax – Xmin = 27-19=8 -10
Repartiţia vânzătorilor după vârstă
Vârsta(ani)
Nr.vânzatori
Valori centralizate pentruZile
lucrateOre
lucrateValoarea
Desfacerilor (lei)Fondul de
salariu lunar (lei)19 3 52 426 390,500 4,02620 8 162 1,291 1,131,500 11,61021 6 131 1,030 933,100 9,03622 8 167 1,423 1,291,700 12,00723 15 326 2,673 2,220,600 22,84124 6 134 1,115 992,550 8,75925 6 134 1,076 906,500 9,33526 7 131 1,035 897,500 9,71227 1 21 168 147,000 1,181
Total 60 1,258 10,237 8,910,950 88,507
Reprezentarea grafică a repartiţiei vânzătorilor după vârstă se ilustrează prin poligonul frecvenţelor şi prin curba cumulativă a frecvenţelor.
Vârsta(ani)
Frecventa Frecvente cumulatecrescator descrescator
5
PROIECT STATISTICA Student STOICA P. ION Grupa C
Total 60
2C. Gruparea pe intervale egale a vânzătorilor după ore lucratea) Amplitudinea variaţiei Ax
a = Xmax -Xmin = 211-135=75 -10b) Nr. de grupe r = 8c) Mărimea intervalului h = 76/8=9,5 10
Repartiţia vânzătorilor după numărul de ore lucrateGrupe de
vanzatori dupanr. ore lucrate
Nr.vanzatori
Valori centralizate pentru:Zile
lucrateValoarea desfacerilor
lunare (lei)Fondul de
salariulunar (lei)
Total 60Nota: Limita superioară este inclusă în interval.
Repartizarea grafică a repartiţiei vânzătorilor după numărul de ore lucrate se ilustrează prin poligonl frecvenţelor şi prin curba cumulativă a frecvenţelor.
Grupe de vânzători după nr.ore lucrate
Frecvenţa Frecvenţe cumulatecrescător descrescător
Total 60
2E. Gruparea pe intervale egale a vânzătorilor după salariul neta) Amplitudinea variaţiei Ax
a = Xmax -Xmin = 1846-1100-746
6
PROIECT STATISTICA Student STOICA P. ION Grupa C
b) Nr. de grupe r = 8c) Mărimea intervalului h =746/8=93,25
Repartiţia vânzătorilor după numărul de salariul netGrupe de
vanzatori dupasalariul net
Nr.vanzatori
Valori centralizate pentru:Zile
lucrateOre lucrate Valoarea
desfacerilorlunare (lei)
Total 60Nota: Limita superioară este inclusă în interval.
Repartizarea grafică a repartiţiei vânzătorilor după numărul de ore lucrate se ilustrează prin poligonl frecvenţelor şi prin curba cumulativă a frecvenţelor.
Grupe de vânzători
după salariul netFrecvenţa Frecvenţe cumulate
crescător descrescător
Total 60
Gruparea pe intervale egale permite structurarea colectivităţii pe grupe cât mai omogene, iar gruparea statistică este cea mai semnificativă modalitate a sistemetizării datelor după o caracteristică numerică sau nominativă.
Sistematizarea datelor printr-o grupare pe intervale egale răspunde necesităţii de sistematizare şi omogenizare a datelor unei observaţii statistice de masă şi a caracterizării independente a fiecărei variabile din propria observare.
2.2 Gruparea pe intervale de variaţie neegale
Pentru analiza structurii colectivităţii pe grupe tipice se foloseşte gruparea pe intervale neegale.
Gruparea pe intervale neegale presupune regruparea intervalelor egale.
7
PROIECT STATISTICA Student STOICA P. ION Grupa C
Un prim principiu al grupării pe intervale neegale este trecerea de la variaţia lineară (interval de mărime constantă) la variaţia neuniformă a unor intervale de grupare din ce în ce mai mari.
Un alt principiu de grupare are în vedere separarea unităţilor pe trei grupe: mici, mijlocii şi mari.
2.2.C. Gruparea pe intervale neegale a vânzătorilor după orele lucrate
Nivelul mediu
Grupe de vânzători
după nr. ore lucrate
Nr. vânz
Valori centralizate pentru:Zile
lucrateValoarea desfacerii
(lei)
Fondul de salariu lunar
(lei)
Calificativ
MinimumMediuMaxim
Total 60Notă: Limita superioară inclusă în interval
3 CALCULUL MĂRIMILOR RELATIVE DE STRUCTURĂ
Din cele 5 mărimi relative întâlnite în statistică, în proiectul de faţă se pot determina trei:
1. Mărimile relative de structură se obţin ca raport între parte şi întreg. Forma cea mai obişnuita de exprimare a mărimilor relative de structură este cea a procentelor care arată câte unităţii din indicatorul raportat revin la 100 unităţi ale indicatorului bază de raportare. Se pot calcula atât pe baza frecvenţelor absolute şi în acest caz au sens de frecvenţe relative ( )
cât şi pe baza valorilor centralizate privind : vârsta, zilele lucrate, orele lucrate, volumul desfacerilor şi salariul net, obţinându-se în acest caz ponderea sau greutatea specifică ( ) a
unei valori ( ) în totalul valorilor colectivităţii ( ):
2. Mărimile relative de coordonare se obţin ca raport între două grupe sau între două colectivităţi ce coexistă în spaţiu.
Pentru o colectivitate împărţită în două grupe pentru care nivelul pe grupe al variabilei studiate este xA şi xB :
sau
Dacă sunt mai multe grupe, se alege una ca bază de comparaţie şi se raportează, pe rând, fiecare grupă la baza aleasă.
8
PROIECT STATISTICA Student STOICA P. ION Grupa C
3. Mărimile relative de intensitate se obţin prin raportarea a doi indicatori cu conţinut diferit dar între care există o relaţie de interdependenţă.
la nivel parţial: ; la nivelul ansamblului:
3.C Calculul mărimilor relative pe baza repartiţiei vânzătorilor după numărul de ore lucrate
Repartiţia timpului lucrat în zile a fondului de salarii şi a structurii acestora în funcţie de numărul de ore lucrate
Interval de variaţie a orelor
lucrateCalificativ
Mărimi relative de structură %Frecvenţe relative
gi
Zile lucr Fond salariu
Valoarea desfacerii
Total 100 100 100 100
Repartiţia timpului lucrat (în zile şi ore), a fondului de salarii şi a raportului acestora faţă de prima grupa, în funcţie de valoarea desfacerii
Interval de variaţie a orelor
lucrate
Nr. vânz
ni
Valori centralizate Mărimile relative de coordonareZile lucr.
xi
Fond salariu
yi
Valoarea desfacerii
zi
Nr. vzni/n1
Zile lucr xi/x1
Fond sal. yi/y1
Val.desf.. zi/z1
Total 60
Repartiţia timpului lucrat (în zile şi ore), a fondului de salarii pe total şi în medie pe un vânzător în funcţie de valoarea desfacerii
Interval de variaţie a orelor
lucrate
Nr. vânz
ni
Valori centralizate pentru: Mărimi relative de intensitateZile lucr.
xi
Ore lucr.
yi
Fond salariu
zi
Zile lucr xi/ni
Fond sal
yi/n1
Val desf.. zi/n1
Total 60
9
PROIECT STATISTICA Student STOICA P. ION Grupa C
4 CARACTERIZAREA STATISTICĂ A REPARTIŢIILOR OBŢINUTE
Caracterizarea statistică în cazul dat se referă la determinarea:a) Indicatorilor tendinţei centrale:
Media aritmetică
Modul (modulul, dominanta)
Mediana (Me)
b) Indicatorii sintetici ai variaţiei şi ai asimetriei: Abaterea medie liniară :
Dispersia
Abaterea medie pătratică
Coeficientul de variaţie (v):
respectiv
Coeficientul de asimetrie
sau
10
PROIECT STATISTICA Student STOICA P. ION Grupa C
4.A. Repartiţia vânzătorilor după vârstă
Vârsta(ani)
Nr. vânzători xini
Frecvenţe cumulate crescător
TOTAL 60
a) Calculul indicatorilor tendinţei centrale: Media aritmetică
Modul (modulul, dominanta)Fiind o serie pe variante Mo este valoarea cu frecvenţa maximă
Mediana (Me)
locul medianei:
b) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei Dispersia
Abaterea medie pătratică
Coeficientul de variaţie (v):
v` şi v < 35% - seria este omogenă şi media este reprezentativă pentru serie Coeficientul de asimetrie
Rezultă asimetrie
11
PROIECT STATISTICA Student STOICA P. ION Grupa C
4.C. Repartiţia vânzătorilor după orele lucrate
Grupe de vânzători după ore lucrate
Nr, Vânz,
Centrul intervalului
xixini
Frecvenţe cumulate crescător
Total 60 -
c) Calculul indicatorilor tendinţei centrale: Media aritmetică
Modul (modulul, dominanta)Fiind o serie pe variante Mo este valoarea cu frecvenţa maximă
Mediana (Me)
locul medianei:
Variabila 23 ani este prima a cărei frecvenţă cumulată crescător este mai mare de 30,5
d) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei Dispersia
Abaterea medie pătratică
Coeficientul de variaţie (v):
v` şi v < 35% - seria este omogenă şi media este reprezentativă pentru serie
12
PROIECT STATISTICA Student STOICA P. ION Grupa C
Coeficientul de asimetrie
Rezultă asimetrie .....
Pentru interpretarea rezultatelor se vor trece indicatorii obţinuţi într-un tabel sintetic.Indicatorii tendinţei centrale, de variaţie totală şi de asimetrie pentru variabilele
înregistrate în eşantion
Denumirea indicatoruluiVariabilele înregistrate
Vârsta Zile lucrate Ore lucrate
Media aritmetică ModulMedianaAbaterea medie liniarăAbaterea medie pătratică
DispersiaCoeficientul de variaţie % după:
Coeficientul de asimetrie după
MoMe
13
PROIECT STATISTICA Student STOICA P. ION Grupa C
5 ANALIZA CORELAŢIEI DINTRE SALARIUL NET ȘI ORELE LUCRATE
Se aplică pentru primele 10 unităţi din eşantion, privind numărul de ore lucrate (x i) şi salariul net lunar (yi ) - mii lei. Seria se va ordona crescător după numărul de ore lucrate (x i) menţinându-se salariul net lunar (yi ) corespunzător.Dintre metodele simple de cercetare a legaturilor statistice recurgem la :
A) Metoda seriilor paralele interdependente
Nr. crt Ore lucrate (xi)
Salariul net lunar(lei) (yi)
1.2.3.4.5.6.7.8.9.10.
Concluzie: Valorile xi fiind ordonate crescător se poate observa că şi valorile yi cresc în cea mai mare parte, ceea ce sugerează o legătură directă.
B) Metoda grafică este o altă cale de a stabili legătura dintre fenomene.Pentru a obţine graficul de corelaţie, denumit şi corelograma, valorile caracteristicii
factoriale (xi) sau intervalele acesteia se trec pe abscisa, iar pe ordonate valorile caracteristicii rezultative (yi) sau intervalele respective. Fiecare unitate observată a celor două caracteristici se reprezintă grafic printr-un punct.
Graficul de asemenea confirmă o legătură directă de formă liniară.În cazul de fata am apelat la modelul de regresie unifactorială liniar considerând legătura
dintre y şi x de tipul yxi = a +bxi. Parametri ecuaţiei în acest caz se determină prin rezolvarea următorului sistem de ecuaţii:
Dacă se foloseşte metoda determinanţilor se obţine:
14
PROIECT STATISTICA Student STOICA P. ION Grupa C
Datele necesare calculării celor doi parametri sunt prezentate în tabelul de mai jos.
Nr ctr. xi yi xiyi Yxi=
1.2.3.4.5.6.7.8.9.10.
Total
Funcţia de regresie este: yxi = a +bxi
Intensitatea legăturii se măsoară prin coeficientul de corelaţie (ry/x).
Interpretare ....
15
PROIECT STATISTICA Student STOICA P. ION Grupa C
6 BIBLIOGRAFIE
1. Emilia Gogu, „Statistica în turism şi comerţ - teorie şi studii de caz”, Editura Oscar Print Bucureşti, 2009,
2. Elena-Maria Biji, Eugenia Lilea, Mihaela Vătui, Emilia Gogu, “Statistică aplicată în economie”, Editura Oscar Print, 2007
3. Elena-Maria Biji, Eugenia Lilea, Mihaela Vătui, Emilia Gogu, “Aplicaţii statistice în studiul fenomenelor economice”, Editura Oscar Print, Bucureşti 2007
16