Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
1
Probabilităţi
= şansa ca un eveniment să aibă loc considerând toate rezultatele posibile
Valoarea predictivă a probabilităţii: Reflectă ce “ar trebui” să se întâmple şi nu ce o
să se întâmple efectiv
Pentru un pacient supus unei operaţii cu o rată de succes de 75% rezultatul nu poate fi 75% succes
Probabilitatea poate fi privită ca o măsură a capacităţii eşantionului analizat de a estima caracteristica unei populaţii
2
Exemplu: distribuţia greutatii
Media = 69, s = 3
68,26% = 66-72
(168-183)
p=0,68
Mai mare de 78
(198)
P=0,0013
3
Principii generale In studiul într-o populaţie P a parametrilor a unei
caracteristici oarecare (cantitative sau calitative) adesea este necesar să se urmeze procedeul: 1. Se extrage un eşantion reprezentativ al acestei populaţii.
2. Prin mijloacele statisticii descriptive se descrie distribuţia caracteristicii pe eşantionul extras la etapa 1, fiindcă talia acestuia permite o investigare exhaustivă a sa. Astfel se poate determina frecvenţa observată, dacă este vorba de o caracteristică calitativă, sau se calculează media şi variaţia, în cazul unei caracteristici cantitative.
3. Prin mijloacele statisticii inferenţiale sau inductive se extind la întreaga populaţie rezultatele observate pe eşantion. Adica, pornind de la parametrii observaţi (frecvenţa, media, variaţia, etc) pe eşantion se încearcă să se estimeze parametrii “teoretici” ai întregii populaţii.
4
Cazul unei variabile X calitative
Frecvenţa teoretică p a variabilei X în populaţia P este
necunoscută.
Din populaţia P se extrage la întâmplare
eşantionul E reprezentativ.
In eşantionul E pentru variabila X se observă o
frecvenţă f.
Se încearcă să se estimeze valoarea
necunoscută a lui p cu ajutorul lui f observat.
5
Cazul unei variabile X cantitative
Media teoretică a variabilei X ca şi
variaţia sa teoretică 2 în populaţia P sunt
necunoscute.
○ Din populaţia P se extrage la întâmplare
eşantionul E reprezentativ.
○ In eşantionul E pentru variabila X se
observă o medie m şi o variaţie s2.
○ Se încearcă să se estimeze valorile
necunoscute ale lui şi 2 cu ajutorul lui m
şi s2 observate.
6
Definiţia unui estimator
Estimatorul unui parametru este o funcţie
depinzând de observaţiile efectuate pe un
eşantion extras la întâmplare care furnizează
o valoare aleatoare numită estimarea
punctuală a parametrului.
Dacă eşantionul E are valorile x1,...,xn
pentru caracteristica studiată, estimatorul
mediei aritmetice a unei populaţii P este m
= (x1+x2+...+xn)/n
7
ESTIMAREA PUNCTUALĂ
Calităţile unui estimator:
• corectitudinea estimării obţinute,
• precizia acesteia.
Cele două noţiuni sunt distincte cum va rezultă şi
din prezentarea care urmează.
8
Estimator fără bias
Fie T estimarea punctuală a unui parametru teoretic al unei
populaţii.
T este o variabila aleatoare valorile ei variînd întâmplător odată
cu eşantionul pe baza căruia se calculează.
Estimatorul T se spune că este fără bias dacă speranţa
matematică a lui T este egală cu valoarea adevărată (teoretică)
a parametrului estimat adică M(T) = .
Se spune în acest caz că estimarea dată de T este corectă.
9
ESTIMAREA PUNCTUALĂ Proprietăţi ale estimatorilor medie si frecventa:
P1. Speranţa matematică a mediilor observate, m, pe eşantioane
extrase aleator este egală cu media teoretică a populaţiei din care sau extras eşantioanele, medie considerată pentru valorile unei variabile cantitative luată în studiu: M(m) = .
P2. Speranţa matematică a frecvenţelor observate, f, pe eşantioane
extrase aleator este egală cu frecvenţa teoretică p a populaţiei din care sau extras eşantioanele, frecvenţă considerată pentru valorile unei variabile calitative luată în studiu: M(f) = p.
Din P1 şi P2 rezultă că m şi f sunt estimatori fără bias şi că
estimările realizate cu ajutorul lor sunt corecte.
10
ESTIMAREA PUNCTUALĂ
P3. Speranţa matematică a variaţiilor descriptive observate s2 pe eşantioane de talie n, extrase aleator este diferită de variaţia teoretică 2 a populaţiei din care sau extras eşantioanele, variaţie considerată pentru valorile unei variabile cantitative luată în studiu:
P4. Variaţia punctuală de eşantionare este un estimator fără bias pentru 2:
11
21)2(M
n
ns
s21n
nS2
Concluzie
Media, frecvenţa şi variaţia de
eşantionare observate pe eşantioane
corect extrase (reprezentative) dintr-o
populaţie P sunt estimatori fără bias ale
mediei, frecvenţei şi respectiv variaţiei
teoretice ale populaţiei P
12
ESTIMAREA CU INTERVALE DE
INCREDERE
Un estimator că este cu atât mai eficace cu cât variaţia sa este mai mică, sau precizia sa depinde de mărimea variaţiei sale.
Estimarea punctuală a unui parametru teoretic furnizează o valoare pentru parametrul teoretic estimat.
Valoarea sa este tributară fluctuaţiilor de eşantionare şi poate fi la o mare distanţă de valoarea reală a parametrului estimat.
Este recomandabil să se estimeze un parametru teoretic nu printr-o singură valoare ci printr-un interval, numit interval de încredere, în care să se poată afirma că parametrul estimat se găseşte cu o probabilitate ridicată.
13
ESTIMAREA CU AJUTORUL INTERVALULUI DE
INCREDERE
Intervalul de încredere este un interval mărginit
de valori (limitele poartă numele de limite de
încredere) care include media caracteristicii
studiate.
Cu cât intervalul este mai larg cu atât suntem mai
siguri că media caracteristicii studiate se va
regăsi în acel interval.
Mărimea încrederii, confidenţa, este dată de
probabilitatea ca valoarea (valorile) studiate să se
găsească în acel interval.
14
ESTIMAREA UNEI MEDII
Fie P o populaţie în care variabila X are o media teoretică necunoscută. Din populaţia P se extrage la întâmplare eşantionul E reprezentativ. In eşantionul E pentru variabila X se observă o medie m şi se calculează o variaţie punctuală estimată
Se încearcă să se determine pentru valoarea
necunoscută a mediei teoretice un interval de încredere cu pragul , (cu ajutorul lui m şi S2 observate), adică să se determine un interval [a,b] în care probabilitatea ca media teoretică să se afle este 1-:
Pr(a b) = 1 - .
15
2n
( m)xin i 12 2S s
n 1n 1
ESTIMAREA UNEI MEDII: ESANTIOANE MARI
N>=30
media de eşantionare m este o variabilă aleatoare normală
Atunci variabila aleatoare centrată redusă este o variabilă aleatoare N(0,1).
Pentru un prag de semnificaţie se determină (de exemplu, din tabela ecartului redus) valoarea Z pentru care probabilitatea ca variabila aleatoare Z să fie în intervalul [-Z,Z] este 1-, adică:
Pr(-Z Z Z) = 1 - .
16
( , )n
N m
Z
n
ESTIMAREA UNEI MEDII: ESANTIOANE MARI
Deci cu o probabilitate 1- se poate
afirma că are loc:
de unde rezultă :
17
mZ Z
n
m Z m Zn n
ESTIMAREA UNEI MEDII: ESANTIOANE MARI
Prin urmare, intervalul de încredere
pentru media cu pragul de semnificaţie
este
Atunci când nu se cunoaşte, ea poate
fi estimata corect prin s şi în acest caz
intervalul de încredere cu pragul de
semnificaţie pentru media este
18
,m Z m Zn n
,1 1
s sm Z m Zn n
ESTIMAREA UNEI MEDII: ESANTIOANE MARI
Cel mai frecvent se utilizează un prag
de semnificaţie = 0.05. Atunci Z=1.96
şi deci intervalul de încredere cel mai
utilizat în cazul eşantioanelor mari este
19
1,96 , 1,961 1
s sm mn n
Exemplu
Într-o populaţie de 50 cunoaştem media greutăţii la naştere a noilor născuţi: 3400g şi abaterea standard: 142
Pe un eşantion aleator de 10 nou născuţi: media=3275g, abaterea standard=854
Eşantionul este sau nu caracteristic pentru populaţie?
3275+/-1,96*854/3= 3275+/-558
3400 +/-1,96*142/1000= 3275+/-39,36
Eşantionarea aleatoare implică “dreptul” fiecărui membru al populaţiei de a fi ales dar nu garantează reprezentativitatea proporţională a tuturor părţilor unei populaţii
Alt eşantion altă medie, altă abatere
20
Exemplu
A – distribuţia de eşantionare a mediei pentru n=10
B – distribuţia de eşantionare a mediei pentru n=50
Pe măsură ce creşte n eroarea de eşantionare scade şi eşantioanele devin mai reprezentative, media lor este mai apropiată de cea a populaţiei
21
Exemplu (continuare)
Deviaţia standard a
distribuţiei de
eşantionare este un
indicator al erorii de
eşantionare
22
Deviaţia standard a distribuţiei de eşantionare
În practică este
imposibil să construim
distribuţia de
eşantionare
estimarea deviaţiei
standard a mediei pe
baza deviaţiei standard
şi a dimensiunii
eşantionului:
1X
ss
n
23
Exemplu (continuare)
A = media=115, abaterea standard=30 Sx=9,5
B = media=115, abaterea standard=30 Sx=4,2
Pe măsură ce creşte n scade eroarea standard a mediei
Aproximarea distribuţiei populaţiei
24
ESTIMAREA UNEI MEDII: ESANTIOANE MICI
se poate determina intervalul de
încredere al mediei doar dacă
variabila studiată X este o variabilă
aleatoare normală.
Daca se cunoaste variatia:
Nu se cunosate variatia si n<30
25
,m Z m Zn n
,1 1
s sm t m tn n
ESTIMAREA UNEI FRECVENTE
Esantioane mari np, nq>=10
F este frecventa observata
26
f(1-f) f(1-f),
n nf Z f Z
Eroarea de eşantionare a mediei
Sx= diferenţa dintre media valorilor eşantionului şi media caracteristici populaţiei din care a fost extras eşantionul
Creşterea erorii de eşantionare =>
Scăderea acurateţii mediei eşantionului de a estima caracteristica unei populaţii
Scăderea erorii de eşantionare =>
Creşterea acurateţii mediei eşantionului de a estima caracteristica unei populaţii
27
Exemplu
Studiul Fitzgerald al mobilităţii prin extensie a
coloanei lombare la indivizi de vârste cuprinse între
30 şi 39 de ani
n=42, media=40° şi s=8,8 °
Media populaţiei poate fi estimată la 40 °
Care este acurateţea acestei estimări?
Cum estimăm intervalul de încredere?
28
Intervale de încredere
= este un interval mărginit de valori (limitele
poartă numele de limite de încredere) care
include media caracteristicii studiate
Cu cât intervalul este mai larg cu atât suntem
mai siguri că media caracteristicii studiate se
va regăsi în acel interval
Mărimea încrederii probabilitate
Încrederea (confidenţa) 95%
29
Exemplu (continuare)
n=42, media=40°, s=8,8° Sx=1,36
95,45% din distribuţie este cuprinsă între ±2Sx
sau ±2Z
30
Exemplu (continuare)
Estimarea zonei de 95%
Este mărginită de un scor Z de ± 1,96
Interval de încredere de 95%
31
Intervale de încredere
Formula de determinare a limitelor
intervalului de încredere:
XszXII )(
32
Pentru intervale de încredere de 95% Z=
± 1,96
Exemplu (continuare)
95% II = 40,0± (1,96)(1,36)
95% II = 40,0±2,67
95% II = 37,33 până la 42,67
33
Exemplu 99%
Z = ± 2,576
99% II = 40,0± (2,576)(1,36)
99% II = 40,0±3,50
99% II = 36,5 până la 43,5
34
Intervale de încredere cu eşantioane mici
n<30
Cu cât eşantioanele sunt mai mici cu atât distribuţia de eşantionare este mai dispersată faţă de distribuţia normală
Se foloseşte o altă distribuţie: distribuţia t sau Student
Diferenţa majoră dintre distribuţia t şi cea normală constă în faptul că prima îşi schimbă forma odată cu schimbarea dimensiunii eşantionului
35
Calculul intervalului de încredere
df = n-1
df = grade de
libertate
XstXII )(
36
Grade de libertate
df
Direcţiile disponibile pentru mişcare într-
un spaţiu dat
Numărul de componente care pot varia
într-un set de date
n-1
37
Grade de libertate - Exemplu
5 măsurători, avem o sumă de 30 şi o
medie de 6
După ce face primele 4: 8,9,10,11 a
cincea poate fi calculată şi setul de date
are numai 4 grade de libertate
38
Calculul intervalului de încredere
n=6 df = 5 II95% t= ±2,571
n=10 df = 9 II95% t= ±2,262
n=30 II95% t= ±2,042
Creşterea lui n determină ca valoarea lui t să se apropie de 1,96 curba tinde spre distribuţia normală
39
Aplicaţii ale intervalelor de încredere
Studiul Fitzgerald a stabilit cu o precizie de 95%
intervalul de încredere pentru extensia lombară la
diferite grupe de vârstă
40
Aplicaţii ale intervalelor de încredere
Interpretare:
1. Intervalul de încredere al extensiei lombare scade cu
vârsta
2. Variabilitatea este mai scăzută la tineri
3. Intervalele de încredere se întrepătrund
41