28
BAZELE STATISTICII - anul universitar 2014-2015 - Lect. univ. dr. Dana Viorică BAZELE STATISTICII - anul universitar 2014-2015 - Programa analitică Noţiuni introductive Analiza unei serii statistice unidimensionale, folosind metode grafice şi numerice (variabile cantitative: indicatori ai tendinţei centrale, indicatori ai dispersiei şi indicatori ai formei; variabile calitative). Analiza unei serii statistice bidimensionale. Probabilităţi şi distribuţii teoretice Estimarea parametrilor unei populaţii Testarea statistică Indicatori ai seriilor de timp Bibliografie Andrei, T., Statistică şi econometrie, Ed. Economică, 2003. Bărbat, A., Teoria statisticii sociale, Editura Didactică şi Pedagogică, Bucureşti, 1972.

Bazele Statisticii Curs 1,2,3,4

Embed Size (px)

DESCRIPTION

-

Citation preview

BAZELE STATISTICII - anul universitar 2014-2015 -

Lect. univ. dr. Dana VioricBAZELE STATISTICII - anul universitar 2014-2015 -Programa analiticNoiuni introductiveAnaliza unei serii statistice unidimensionale, folosind metode grafice i numerice (variabile cantitative: indicatori ai tendinei centrale, indicatori ai dispersiei i indicatori ai formei; variabile calitative).Analiza unei serii statistice bidimensionale.Probabiliti i distribuii teoreticeEstimarea parametrilor unei populaiiTestarea statistic Indicatori ai seriilor de timp

BibliografieAndrei, T., Statistic i econometrie, Ed. Economic, 2003.Brbat, A., Teoria statisticii sociale, Editura Didactic i Pedagogic, Bucureti, 1972.Biji, E.M., Lilea, E., Roca, E., Vtui, M., Statistic aplicat n economie, Editura Universal Dalsi, 2000Jaba, E., Statistica, ed. a 3-a, Ed. Economic, Bucureti, 2002.BibliografieJaba, E., Pintilescu, C. Statistic. Teste gril i probleme, ed. a 2-a, Editura Sedcom Libris, Iai, 2007James T. McClave, P. George Benson, Terry Sincich, Statistics for Business and Economics, Pearson, Education New Jersey , 2008 arc, M., Tratat de statistic aplicat, Editura Didactic i Pedagogic, Bucureti, 1998.Wonnacott, H., Wonnacott, T., Statistiques, Economica, Paris, 1991.EVALUARE:40% - Test susinut n sptmna 30.03-04.04;

20% - Not seminar;

40% - Examen.1.1. Rolul statisticii n economie1.2. Concepte fundamentale1.3. Tipuri de variabile statistice1.4. Scale de msurare1.5. Metode de culegere a datelor1.1. Rolul statisticii n economieScopul statisticii este cunoaterea fenomenelor de mas, caracterizate prin variabilitate.

Statistica descriptiv: descrie observaiile existente n baza de date

Statistica inferenial: folosete observaiile din baza de date, nregistrate la nivelul unui eantion pentru a face extrapolri (inferri) asupra unor situaii care nu s-au petrecut nc, la nivelul populaiei din care a fost extras eantionul Descriptiv sau Inferenial?Merg cu bicicleta, n medie, aproximativ 50 km pe sptmn.Ne ateptm la mari cantiti de ploaie n acest anotimp.1.2. Concepte fundamentale ale statisticiiPopulaia statisticreprezint o mulime de elemente unite ntre ele printr-o trstur comun.pentru a fi bine definit, o populaie statistic trebuie s aib precizat omogenitatea elementelor sale componente din punct de vedere calitativ, de timp i de spaiu.- volumul unei populaii se noteaz cu N.b. EantionulReprezint un sub-ansamblu de uniti ale unei populaii extras din populaia statistic dup anumite procedee.Aplicarea acestor procedee trebuie s asigure reprezentativitatea eantionului. Volumul eantionului se noteaz cu n.

Statisticile descriptive doar descriu un eantionStatisticile infereniale generalizeaz rezultatele obinute la nivelul eantionului la ntreaga populaiec. Unitile statisticesunt elementele componente ale unei populaii statistice.se noteaz cu ni.

d. Variabila statisticreprezint nsuirea, trstura esenial purtat de unitile statistice ale unei populaii. se noteaz cu X. Valorile (categoriile) variabilei se noteaz cu xi.

e. Indicatorul statisticmrime statistic, rezultatul numeric al unei numrri, al unei msurri statistice sau al unui calcul asupra datelor obinute printr-o nregistrare statistic.f. Indice statisticmrime statistic relativ care se obine prin compararea, sub form de raport, a dou valori ale unui indicator statistic.1.3. Tipuri de variabile statistice dup modul de exprimare:1. Variabile numerice (cantitative): variabile discrete; variabile continue.

2. Variabile nenumerice (calitative): variabile nominale. Caz particular: variabile alternative (dummy). variabile ordinale.Tipuri de VariabileCare sunt variabilele pe care le luai n considerare atunci cnd cumprai obiciclet second-hand?

Marca (DHS, Trek, Shimano) Tipul (ora, munte, vitez) Componentele (marc sau no-name) Vrsta Starea (excelent, bun, rea) Preul Mrimea cadrului Numrul de viteze1.4. Scale de msurareDefinire:Scala este un continuum de cifre sau de simboluri, plasate ierarhic, de la inferior la superior.

Tipuri de scale1. Variabile calitativeScala nominal presupune acordarea de numere (coduri) fiecrei categorii a unei populaii (doi indivizi care aparin unor categorii distincte au valori diferite). b. Scala ordinal presupune ca atribuirea de coduri numerice pentru fiecare categorie s se realizeze n ordine descresctoare, dup importana lor.

2. Variabile cantitativea. Scala interval are ca proprieti identitatea, ordinea i faptul c intervalul ntre numere are un sens.1.4. Scale de msurarese poate, astfel, compara diferena dintre dou valori ale aceleiai variabile.

Exemplu: temperatura n sistemul Celsius i n sistemul Fahrenheit: diferena dintre dou temperaturi are un sens;scorurile obinute la testele de evaluare.1.4. Scale de msurareb. Scala raport are aceleai proprieti ca scala interval i, n plus, posed un zero absolut (considerat punct de referin).diferena i raportul dintre dou valori au un sens.

Exemplu: Rata omajului, PIB/locuitor, rata natalitii, vrsta, nlimea, greutatea ...1.5. Metode de culegere a datelorSurse de date statistice

Anuarul Statistic al Romniei (INS).

Sursa de date statistice la nivel european: Oficiul Statistic al Comunitii Europene EUROSTAT.

Adresa: http://europa.eu.int/comm/eurostat

2. Lucrri de nregistrare statistica. Recensmntul reprezint o lucrare de nregistrare exhaustiv, la un moment dat, a unei populaii. - nregistrarea surprinde starea populaiei la un moment dat, numit moment critic.

b. Rapoarte statisticereprezint lucrri de nregistrare total (evenimente, fapte).

c. Anchete prin sondaj

d. Monografia statisticare ca obiectiv cunoaterea unei singure uniti complexe sau a unei singure probleme.

Aplicaii:I. Pentru ansamblul firmelor din judeul Iai care desfoar activitate de producie se nregistreaz valoarea cifrei de afaceri (mld. lei) la 31 decembrie 2010. Se cere:

s se precizeze dac nregistrarea statistic realizat asupra firmelor observate presupune o cercetare exhaustiv.

s se defineasc unitatea statistic i variabila de grupare .

s se precizeze tipul variabilei studiate.Un eantion de angajai ai unei firme a rspuns la cteva ntrebri cu caracter personal i profesional. Precizai natura urmtoarelor variabile i tipul de scal specific: numrul de animale al familiei locul naterii anul naterii vrsta n ani mplinii fumator (da, nu) nivelul ultimei diplome de studii obinut (liceu, facultate, master, doctorat, post-doctorat) tipul de main deinut: autohton sau de import distana, n km, de acas pn la locul de munc valoarea IQ-ului poziia ierarhic ocupat n firm (funcionar, middle management, top management) calificativul obinut la ultima evaluare la locul de munc poziia privind politica firmei de a reduce salariile n locul reducerii personalului existent (acord total, acord, indiferent, dezacord, dezacord total) numrul de ore petrecute zilnic navignd pe internet

II. Se extrage aleator un eantion format din 50 de studeni din anul I de la FEAA, n anul universitar 2010-2011, i se nregistreaz nota obinut la un examen. Se cere: s se precizeze dac nregistrarea statistic realizat presupune o cercetare exhaustiv. s se defineasc unitatea statistic i variabila de grupare. s se precizeze tipul variabilei studiate.Observaii: Cunoaterea unei colectiviti statistice, atunci cnd se dispune de valorile luate de una sau mai multe variabile statistice asupra ansamblului, presupune aplicarea statisticii descriptive.

2. Atunci cnd se dispune de valorile luate de una sau mai multe variabile statistice asupra unui eantion, cunoaterea ntregii colectiviti din care este extras eantionul presupune folosirea statisticii infereniale.

Analiza unei serii statistice unidimensionale2.1. Variabile cantitative

Variabil discret

A.1. Prezentarea seriei (distribuiei) statistice Frecvene absolute cumulate cresctor (Ni ) sau descresctor (Ni )- exprim numrul de uniti statistice cumulate pn la sau peste nivelul considerat al caracteristicii, adic valori xi, respectiv xi.

Frecvene relative cumulate cresctor (Fi ) sau descresctor (Fi )- exprim ponderea unitilor statistice cumulate pn la sau peste nivelul considerat al caracteristicii, adic valori xi, respectiv xi.

A.2. Analiza seriei folosind metode numericePresupune calculul indicatorilor statisticii descriptive, cunoscui i sub denumirea de caracteristici numerice ale unei distribuii.

A.2.1. Indicatori ai tendinei centrale (mrimi medii)

a. Definire: mediile sunt acele valori n jurul crora se repartizeaz unitile unei populaii. cele mai importante mrimi medii sunt media aritmetic, modul i mediana .A.2. Analiza seriei folosind metode numericeb. Media aritmetic ( ) Media aritmetic este valoarea pe care am observa-o dac unitile statistice ar nregistra aceleai valori ale variabilei (dac nu ar exista variaii ale valorilor nregistrate de unitile statistice).

Mod de calcul n cazul seriilor simple i seriilor cu frecvene diferite (variabil discret) Media simpl:

Media ponderat:

Sau

Observaie: Media aritmetic este sensibil la prezena valorilor extreme (outliers).

Cele mai importante proprieti ale mediei aritmetice:1. Media unei distribuii este o valoare intern:2. Media este o mrime normal: suma abaterilor valorilor individuale ale unei variabile X de la media lor este egal cu zero.

Exemplu: S considerm distribuia membrilor unei familii dup numrul de litri de Coca-Cola consumai ntr-o sptmn: 1, 1, 4, 6, 8.

c. Modul (Mo) este valoarea variabilei cea mai frecvent observat ntr-o distribuie, adic valoarea xi care corespunde frecvenei maxime (nimax).Observaie: modul poate fi aflat doar n cazul seriilor cu frecvene diferite.o distribuie poate avea una, dou sau mai multe valori modale (serii unimodale, bimodale sau plurimodale).

Interpretare: Cele mai multe uniti nregistreaz valoarea modal.

d. Mediana (Me) este acea valoare a variabilei unei serii ordonate, cresctor sau descresctor, pn la care i peste care sunt distribuite n numr egal unitile colectivitii: jumtate din uniti au valori mai mici dect mediana, iar jumtate au valori mai mari dect mediana. corespunde locului unitii mediane calculate astfel:

Aflarea medianei se face diferit n funcie de tipul seriei:

1. Serii simple: numr impar de termeni. Exemplu: 7, 3, 8, 4, 5 numr par de termeni. Exemplu: 7, 3, 8, 4, 5, 5

2. Serii cu frecvene diferite se calculeaz unitatea median (UMe). valoarea xi corespunztoare acesteia este Me.

Observaie:mediana nu este influenat de valorile extreme.

Exemplu: 1, 1, 2, 4, 4, 80f. Quartilele sunt valori ale variabilei care mpart volumul eantionului n 4 pri egale. reprezentare grafic i mod de calcul ( Q1, Q2, Q3).

g. Decile sunt valori ale variabilei care mpart volumul eantionului n 4 pri egale. decila unu (D1) i decila 9 (D9).

A.2.2. Indicatori ai dispersiei (variaiei) Definire: dispersia exprim gradul de variaie a valorilor individuale ale unei variabile fa de nivelul mediu. aprecierea fenomenului de dispersie al unei distribuii permite identificarea gradului de reprezentativitate a mediei unei distribuii.

Indicatori sintetici ai dispersiei:1. Abaterea medie liniar1. Variana, respectiv Variana este ntotdeauna pozitiv, nu are unitate de msur i nu se interpreteaz.Prin ridicarea la ptrat a abaterilor valorilor xi fa de medie crete influena valorilor extreme asupra nivelului varianei.3. Abaterea standard (s) arat cu ct variaz, n medie, valorile xi ale variabilei fa de nivelul mediu al distribuiei, n sens pozitiv i negativ. Se calculeaz ca radical din varian se exprim n aceeai unitate de msur cu cea a variabilei.

4. Coeficientul de variaie (v)

se exprim n procente. valori ridicate ale acestui coeficient (v>50%) arat o distribuie eterogen, care se caracterizeaz printr-o variaie mare a valorilor xi fa de nivelul mediu i o medie nereprezentativ. este sensibil fa de valoarea mediei: cu ct media este mai apropiat de zero, cu att coeficientul de variaie este mai dificil de folosit (tinde spre infinit).

5. Intervalul interquartilicIQ=Q3-Q1.- cuprinde 50% din volumul eantionului.

n mod sintetic, cele mai importante caracteristici numerice ale unei distribuii pot fi cuplate astfel:media - abaterea standard - coeficientul de variaiemediana - intervalul interquartilicmedia - medianaA.2.3. Indicatori ai formei Asimetria: - reprezint o deviere de la forma simetric a unei distribuii.

Asimetria poate fi apreciat: pe cale grafic: curba frecvenelor, diagrama box-plot. pe cale numeric: - prin calculul indicatorilor de asimetrie (Skewness). Coeficientul de asimetrie Fisher:

Relaii ntre cele trei mrimi medii Arat forma unei distribuii: Cnd distribuia este simetric. Cnd distribuia este asimetric la dreapta (asimetrie pozitiv). Cnd distribuia este asimetric la stnga (asimetrie negativ).

2. Boltirea- este definit prin compararea distribuiei empirice cu distribuia normal din punctul de vedere al variaiei variabilei X i a frecvenei ni.Boltirea poate fi apreciat: pe cale grafic: curba frecvenelor. numeric: prin calculul indicatorilor boltirii (kurtosis).Coeficientul de boltire Fisher:

A.3. Analiza seriei folosind metode grafice Poligonul frecvenelor: construirea acestuia presupune gsirea locului geometric al punctelor Ai de coordonate (xi,ni) sau (xi,fi) i unirea acestora prin segmente de dreapt. aproximeaz forma unei distribuii.b. Histogramac. Curba frecvenelor: presupune ajustarea printr-o linie curb, continu a histogramei. aproximeaz mai bine forma de distribuie a colectivitii dup variabila considerat.

d. Reprezentarea diagramei box-plot sau box-and-whiskersForma diagramei (D1, Q1, Q2, Q3, D9);

Avantaje: - permite aprecierea nivelului mediu (Me), dispersiei i asimetriei unei distribuiei;- faciliteaz compararea mai multor distribuii (prin reprezentarea simultan a diagramelor).Exemplu: Pentru o distributie s-au inregistrat valorile: D1=5, Q1=12, Q2=20, Q3=22, D9=25. Sa se interpreteze asimetria distributiei folosind diagrama box-plot.

Diagrama box-plot

Indicatorii statisticii descriptive n Excel

Column1

Mean8.6

Standard Error0.347735

Median8

Mode10

Standard Deviation1.904622

Sample Variance3.627586

Kurtosis-0.14315

Skewness-0.40554

Range8

Minimum4

Maximum12

Sum258

Count30

B. Variabil continuB.1 Prezentarea seriei statistice gruparea unitilor statistice este realizat pe intervale de variaie. Observaie: Gruparea pe intervale de variaie duce la pierderea unei pri a informaiei iniiale.B.2. Indicatori ai statisticii descriptive se calculeaz n mod identic, prin discretizarea variabilei (calculul mijlocului intervalelor de variaie).

B.3. Prelucrarea seriei statistice folosind metode grafice Histograma Poligonul frecvenelor Curba frecvenelor Box-plot

Distribuia unui eantion de firme dup valoarea profitului (mil. lei), n anul 2012

2. Analiza unei serii univariate2.1. Variabil cantitativ Variabil discret Variabil continu

2.2. Variabil calitativ

I. Tipuri de variabile Variabile nominale Variabile ordinale

III. Indicatori statistici specificia) Variabile nominale:1. Mrimi relative frecvene relative (fi)

2. Indicatori ai tendinei centrale modul arat categoria cea mai frecvent observat.II. Reprezentare graficReligienifi (%)

Budism76,80

Catolic4139,81

Hinduism10,97

Iudaism10,97

Islam2726,21

Ortodox87,77

Protestantism1615,53

Taoism21,94

Total103100

a) Variabile nominale: Pentru a reprezenta structura pe categorii la nivelul unui eantion se calculeaz frecvene relative; Reprezentarea structurii unui eantion se realizeaz folosind diagrame de structur: dreptunghiul, ptratul i cercul de structur (Pie Chart) sau folosing diagrame prin coloane (Bar Chart).

b) Variabile ordinale:

1. Mrimi relative frecvene relative (fi) frecvene relative cumulate (Fi)

2. Indicatori ai tendinei centrale mediana i modul.

3. Reprezentare grafica Histograma Poligonul frecvenelor Box-plot