Subiecte Tratate Informatica Statistica

Embed Size (px)

Citation preview

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    1/17

    1. Indicatorii tendin ei centrale: enumerare, descriere.Indicatorii tendintei centrale sunt utilizati n analiza statistica a fenomenelor de masa,reprezentnd expresia sintetizarii ntr-un singur nivel reprezentativ a ceea ce este esential, tipic sigeneral n aparitia, manifestarea si dezvoltarea fenomenelor.Principalii indicatori ai tendintei centrale sunt:

    1. valoarea medie ( );2. valoarea mediana (M);3. valoarea dominanta (D).xemplu:

    !otele o"tinute la examen de cinci studenti sunt urmatoarele: 1#, $, %, 1#, &.Pentru a analiza pe ansam"lu situatia celor cinci studenti, se calculeaza cei trei indicatori:- media'nota medie(, care se determina ca raport ntre suma notelor o"tinute si numarulstudentilor:

    - mediana'nota mediana(, care este valoarea ce mparte seria de studenti n doua parti egale:

    )#* se situeaza su" nota mediana, )#* se situeaza peste nota mediana; se determina ca valoare'nota( centrala, dupa aran+area valorilor seriei n ordine crescatoare sau descrescatoare. valori n ordine crescatoare:

    &, $, %, 1#, 1#

    M % ')#* dintre studenti au o"tinut note su" %, iar )#* peste %(

    - dominanta'nota dominanta(, reprezentnd nota care se nregistreaza la cei mai multi studenti:D 1# 'pentru ca aceasta nota apare la un numar de doi studenti, n timp ce notele celelalte aparla cte un singur student(.Ca urmare s-au calculat cei trei indicatori ai tendintei centrale, care caracterizeaza seria statistica respectiva:

    %,&

    M %D = 1#alorile acestora sunt diferite, urmare a faptului ca si continutul si semnificatia indicatorilordifera.

    1

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    2/17

    2.Indicatorii varia iei: enumerare descriere.

    Indicatorii simpli ai variaieindicatorii simpli ai varia/iei servesc la caracterizarea gradului de mpra0tiere a mrimilor serieistatistice. e pot exprima att n mrimi a"solute ct 0i n mrimi relative.

    in aceasta grupa fac parte :amplitudinea variaiei (absolut i relativ);4mplitudinea a"solut se calculeaza ca diferen/a dintre valoarea maxim 0i valoarea minim alcaracteristicii :

    4mplitudinea relativa se exprima de regul n procente 0i se calculeaz ca un raport ntreamplitudinea a"solut 0i media aritmetic :

    abaterile individuale (absolute i relative).

    4"aterile individuale a"solute ' ( se calculeaz ca diferen/a ntre fiecare valoare 0i mediaaritmetic :

    4"aterile individuale relative ' ( se calculeaz ca raportul dintre a"aterile individuale a"solute 0imedia aritmetic 'se exprima n procente( :

    5radul de varia/ie al unei caracteristici depinde de toate a"aterile variantelor nregistrate 0i defrecventa lor de apari/ie 0i prin urmare indicatorii simpli ai varia/iei nu pot exprima ntreagavaria/ie a unei popula/ii statistice. e aceea a fost necesar introducerea indicatorilor sintetici ai

    varia/iei.Indicatorii sintetici ai variaieindicatorii sintetici ai varia/iei, la fel ca 0i indicatorii tendintei centrale tre"uie s se "azeze petoate o"serva/iile, sa fie usor de calculat, u0or de nteles 0i s fie ct mai pu/in afecta/i defluctua/iile de selec/ie.ndicatorii sintetici ai varia/iei sunt :1.abaterea medie liniar ;2.abaterea medie patratic;3.dispersia;.coeficientul de variaie.!baterea medie liniar se calculea" ca o medie aritmetic simpl sau ponderat, luate #nvaloare absolut :Pentru o serie simpl

    4"aterea medie liniar prezint dezavanta+ul c nu /ine seama de faptulc a"aterile mai mari n valoare a"solut influenteaz n mai mare masurgradul de varia/ie a unei caracteristici, n compara/ie cu a"aterile mici. 6n

    plus, nu este indicat s se renun/e n mod ar"itrar la semnul valorilor din care se calculeaz ovaloare medie. in aceste considerente se folose0te ca principal indicator sintetic al varia/ieia"aterea medie patratic.!baterea medie patratic sau abaterea standard' ( se calculeaz ca o medie patratic din

    a"aterile tuturor elementelor seriei de la media lor aritmetic:4cest indicator este mai concludent dect a"aterea medie liniar. Prin ridicarea la ptrat se d o

    importan/ mai mare a"aterilor mari n valoare a"solut, acestea

    2

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    3/17

    influen/nd ntr-o msura mai mare gradul de variatie al varia"ilelor analizate. 6n literatura despecialitate se apreciaz ca pentru o serie de distri"u/ie normal a"aterea medie liniar este egalcu &7) din valoarea a"aterii medii ptratice.4"aterea medie ptratic este un indicator de "az, care se folose0te la analiza varia/iei, laestimarea erorilor de selec/ie n calculul de corela/ie.8a fel ca a"aterea medie liniar, a"aterea medie ptratic se exprim n unitatea de masur a

    varia"ilei a carei varia/ie o caracterizeaz. Prin urmare cei doi indicatori nu se pot folosi pentrucompararea gradului de varia/ie 0i n aceasta situa/ie se recurge la un alt indicator de varia/ie :coeficientul de varia/ie.$oeficientul de variatie ( )se calculeaza ca un raport ntre a"aterea medie ptratic 0i mediaaritmetic. e o"icei se exprim su" form de procente :

    emnifica/ie. 9u ct valoarea lui v este mai aproape de zero cu att varia/ia este mai sla",colectivitatea este mai omogen, media avnd un grad ridicat de reprezentativitate. 9u ct valoarealui v este mai mare cu att varia/ia este mai intens, colectivitatea este mai eterogen, iar mediaare un nivel de semnifica/ie sczut.

    e apreciaz c la un coeficient de peste 3)-*, media nu mai este reprezentativ 0i dateletre"uie separate n serii de componente, pe grupe, n func/ie de varia/ia unei alte caracteristici degrupare.e poate afirma c acest indicator poate fi folosit ca un test n aplicarea metodei gruprii. acmedia aritmetic este aroape de zero, coeficientul de varia/ie nu are semnifica/ie.

    %ispersia ( ) este media ptratelor abaterilor de la mediaaritmetic :

    3

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    4/17

    3.&tape #n accesarea '''ului: enumerare, descriere.

    P-ul for indos este accesat n general prin folosirea "utoanelor 0i meniurilor folosindpentru aceasta clicuri ale mouse-ului.

    1.e da du"lu clic pe imagine

    2.ac imaginea nu apare peecran atunci accesa/i Programe>P.

    4ceast fereastr va aprea dup cteva momente 0i se pot alege oricare dintre op/iunile dinfereastr.?ereastra senume0te

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    5/17

    alvarea unui fi0ier se realizeaz prin pictograma ave din "ara de instrumente tandard sau cua+utorul comenzilor ave sau ave 4s 0i meniul ?ile4ceste comenzi desc@id fereastra ave ata 4s n care se pot sta"ili:numele fi0ierului '?ile name(;tipul fi0ierului 'ave as tEpe(; loca/ia n care s ai" locs alvarea 'ave n(.&

    +. %escriei modul de folosire a variabilei -ie/ pentru crearea i etic0etarea

    variabilelor.

    4psarea meniului

    )

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    6/17

    6. 7erestre utili"ate #n ''': enumerare i descriere.9ele mai frecvent utilizate ferestre in P sunt

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    7/17

    e selecteaz

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    8/17

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    9/17

    1.%istribuia asimetric la dreapta: descriere, repre"entare 5rafic,interpretare.

    >ntro distribuie asimetric la dreapta'distri"u/ie sHeness pozitiv, vezi figura alturat(,

    predomin scorurile mici. 6n acest caz, modululeste valoarea situat cel mai la stnga n 0irul de

    date, iar mediana este mai mare dect media.vident, mediana fiind valoarea care mparte 0irulordonat de date n dou pr/i egale, iar dac ndistri"u/ie predomin scorurile mici, atunciscorurile mari sunt considerate ca scoruri extreme.Utim, de la analiza preciziei indicatorilor tendin/eicentrale, c ntr-o serie de date n care ntlnim scoruri extreme mari, media tinde s le pun nvaloare. at c acest fapt este ilustrat grafic n figura de mai sus. G"serva/i rela/ia existent ntr-oasemenea distri"u/ie: ?o@?e@m. 4ceast rela/ie este rela/ia caracteristic a unei distri"u/iiasimetrice pozitiv

    1*.%istribuia asimetric la stAn5a: descriere, repre"entare 5rafic,interpretare.>ntro distribuie asimetric la stAn5a 'distri"u/ie sHeness negativ, vezi figura alturat(,

    predomin scorurile mari. 6n acest caz, modulul este valoarea situat cel mai la dreapta n 0irul de

    date, iar mediana este mai mare dect media. vident, mediana fiind valoarea care mparte 0irul

    ordonat de date n dou pr/i egale, iar dac

    n distri"u/ie predomin scorurile mari, atunci

    scorurile mici sunt considerate ca scoruri

    extreme.

    Utim, de la analiza preciziei indicatorilor

    tendin/ei centrale, c ntr-o serie de date n

    care ntlnim scoruri extreme mici, media

    tinde s le pun n valoare. at c acest fapt

    este ilustrat grafic n figura de mai sus n care se o"serv rela/ia existent.

    6ntr-o asemenea distri"u/ie: ?oB?eBm. 4ceast rela/ie este rela/ia caracteristic a unei

    distri"u/ii asimetrice negativ.

    1+.Coltirea: definiie, tipuri de distribuie: enumerare, repre"entare 5rafic,interpretare.

    Koltirea msoar nl/imea, adic alungirea sau aplatizarea cur"ei, comparativ cu cea

    normal.

    R

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    10/17

    4simetria pe orizontal, presupune, dup cum am vzut, o deplasare a tendin/ei centrale spre

    stnga sau spre dreapta, ctre scoruri mici sau ctre scoruri mari. 4ceasta este singura

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    11/17

    distribuie platicurtic, plat, este o distri"u/ie n care rezultatele sunt foarte mpr0tiate fa/de medie 0i indic un grad ridicat de eterogenitate a scorurilor. Pro"lema general a acesteidistri"u/ii, n opozi/ie cu distri"u/ia leptoHurtic, este aceea c diferen/iaz greu la extreme 0idestul de "ine n zonamediei. a fi greu, utiliznd o asemenea distri"u/ie, s facem diferen/ierintre elevii sla"i 0i ntre elevii "uni, de0i putem diferen/ia relativ u0or elevii medii.atorit acestuifapt, o distri"u/ie platicurtic nu este nici ea o distri"u/ienormal.

    distribuie normaleste o distri"u/ie mezocurtic.4naliza unei distri"u/ii su" aspectul normalit/ii este primul pas pe care lfacem n orice prelucrarede date. eoarece, n func/ie de rezultatul acesteianalize, vom putea alege te@nicile 0i procedeelestatistice pe care le

    putemfolosi, aceast etap o ntlnim, de o"icei, la nceputul oricrui raport decercetare, imediatdup descrierea e0antionului

    1.!baterea standard: definiie, procedur de lucru #n '''.4"aterea standard este un indice care arat ct de mult deviaz 'difer( unele scoruri

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    12/17

    T !otele

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    13/17

    9rearea ta"elelor de asociere '9rossta"s(.asul +:e selecteaz: nu exista nici o corelatie;r S7- 1 > corelatia este perfectan general, r ^ #.& > corelatie "unae utilizeaza pentru valori normal distri"uite 'uniforme(; pentru cele neuniforme se utilizeazacoeficientul de corelatie pearman 'rs(ste independenta de unitatea de masura si nu se utilizeaza decat pentru valori normal distri"uiteT r [ \#; #.2] > corelatie foarte sla"aT r [ \#.2; #.&] > corelatie sla"aT r [ \#.&; #.$] > corelatie rezona"ilaT r [ \#.$; #.F] > corelatie inaltaT r [ \#.F; 1] > corelatie foarte inalta > relatie foarte strinsa intre varia"ile sau eroare de calcul Z

    21.$oeficientul de corelaie 'pearman: definiie, descriere, procedur de lucru#n '''.

    9oeficientul de corelatie al rangurilor 'pearman( testeaza gradul de corelare intre 2varia"ilecalitative; este alternativa neparametrica a Ccoeficientului de corelatie Pearson=.

    T 4cest coeficient variaza intre -1 si S1. G valoare apropiata de S1, inseamna ca suma patratelordiferentelor este aproape nula, deci avem clasamente identice.

    TG valoare apropiata de #, inseamna necorelarea varia"ilelor, iar valoarea apropiata de -1 pune inevidenta discordanta maxima a varia"ilelor.

    13

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    14/17

    22.&numerai i descriei tipurile de corelaie1.1. FG!%H %& %&&J%&J4!

    Q SPATIUL (DIAGAMA) STAIL!Q " I#DI$ID = " PU#%T (Scatter)

    a( 4D4K8 !P!!A_" concentratia @emoglo"inei@ inaltimea

    "( 4D4K8 P!!A\G2] in sange - pG2atmosferic

    Delatie cauzala - model matematicc( 4D4K8 9GD84A5 greutate, @ inaltime1.2. $G&!4I! IJ&!G!a( 9G?9!A 9GD84A 'Pearson(r&'= s&' s&s'

    s&'= coaria*tas&= aria*ta aria+ilei &

    s'= aria*ta aria+ilei '

    "( PDGPDA4A: 48GD \ -1, S1] AP: r B < KKB $G&!4I& %IG&$4! r @ < KKB $G&!4I& IJ-&G'!

    !A!A4A4 9GD84A:

    T '!C! K !G!& %&

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    15/17

    23.Ge5resia: definiie, descriere, tipuri de re5resie.G&FG&'I! NI $G&!OI 'I?P IJI!GP.G&FG&'I! NI $G&!OI 'I?P IJI!GP.

    1. Ge5resie multipl stepise.

    ste o modalitate de alegere a predictorilor unei anumite varia"ile dependente pe "azacriteriilor satistice.

    Practic, procedura @otr0te care varia"il independent reprezint cel mai "un

    predictor, al doilea ca valoare, etc.

    e pune accentul pe identificarea celor mai "uni predictori pentru fiecare etap. 9nd

    predictorii se afl ntr-o rela/ie strns de corela/ie att ntre ei ct 0i cu varia"ila

    dependent, adeseori, o vari"il a+unge s fie enumerat ca fiind predictor, iar cealalt

    nu. 4cest lucru nseamn c a doua varia"il nu constituie un predictor, ci doar c nu

    adaug nicio informa/ie n plus predic/iei fa/ de cele oferite de primul predictor.

    2. Ge5resia multipl ierar0ic.

    Permite cercettorului n ce ordine s foloseasc o list de predictori. 4cest lucru se

    realizeaz prin asocierea predictorilor sau a grupurilor de predictori n "locuri de

    varia"ile.

    2.4estul Dt/ pentru un e antion: definiie, caracteristici, procedur de lucru #n'''.

    2*.4estul Dt/ pentru eantioane perec0i: definiie, caracteristici, procedur delucru #n '''.

    2+.4estul Dt/ pentru eantioane independente: definiie, caracteristici,procedur de lucru #n '''.

    Aestul t este folosit pentru evaluarea semnifica/iei statistice a diferen/eidintre mediile pentru dou

    seturi de scoruri. 9u a+utorul testului t se pune neviden/ dac valoarea medie pentru un set descoruri difer n medie devaloarea medie pentru alt set de scoruri.

    Aestul t are dou variante:

    1. prima variant este folosit atunci cnd cele dou seturi de scorurice tre"uie comparate provindintr-un singur e0antion sau cndcoeficientul de corela/ie ntre cele dou seturi este mare Qtestul t pentru e0antioane perec@i; O Aestul t pentru e0antioane perec@i este optim dac distri"u/iadiferen/elor dintrecele dou seturi de valori se prezint 'aproximativ( su" form de clopot 'atuncicnddistri"u/ia este normal(. ac distri"u/ia este foarte diferit de forma de clopot ar tre"uiluatn considerare utilizarea unei te@nici statistice rela/ionate nonparametric pentrue0antioane perec@i, cum ar fi testul de perec@i ilcoxon.

    1)

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    16/17

    2. a doua variant a testului t este utilizat n momentul n care douseturi diferite de valori provindin grupe diferite de participan/i. Q testul t pentru e0antioane independente.

    2.4estul $0isQuare: definiie, descriere, procedur de lucru #n '''.

    9ompara o distri"utie de frecvente a"solute o"servate cu o distri"utie teoretica'asteptata( de frecvente a"solute pe "aza distri"utiei de pro"a"ilitate c@i patrat.ste o distri"utie continua, simetrica si se "azeaza pe aproxiamtia normala adistri"utiei "inomiale. istri"utia c@i patrat cu 1 grad de li"ertate este identica cudistri"utia patratului raportului critic.Aestul c@i patrat de tip rxc este folosit pentru a compara o distri"utie o"servata cu odistri"utie teoretica sau compara 2 sau mai multe distri"utii o"servate.9ategoriile de date folosite tre"uie sa fie mutual exclusive si discrete.Are"uie folosite numai valori a"solute.

    ?recventele teoretice tre"uie sa fie mai mari decat ), cele o"servate pot fi mai micidecat ).alorile pro"a"ilitatii pentru respingerea ipotezei nule sunt o"tinute din ta"elespeciale pentru distri"utia c@i patrat corespunzator numarului de grade de li"ertate.

    26.Gecodificarea variabilelor: definiie, descriere, procedur de lucru #n '''.Decodificarea unei varia"ile nseamn convertirea valorilor acesteia, cu scopulo"/inerii uneidistri"u/ii "azat pe frecven/e cumulate. Procesul este similar cu crearea unei ta"ele de frecven/egrupate 0i ne reamintim c poate fi derulat n maniera descris mai +os:Pa0i pentru gruprii de frecven/e:T e face diferen/a dintre valoarea cea mai mare 0i valoarea cea mai mic a uneidistri"u/iiTe mparte valoarea o"/inut la mrimea posi"il 'estimat( a intervaluluiTe selecteaz mrimea intervalului care conduce la un numr de clase cuprins ntre) 0i 1)Te determin limita inferioar a primului interval 'tre"uie s fie un multiplu almrimiiintervalului(Te determin limita superioar a primului intervalTe construiesc intervalele de clas pentru fiecare interval, fiind aten/i s avem clase

  • 7/21/2019 Subiecte Tratate Informatica Statistica

    17/17

    3