Slajdy: metoda reprezentacyjna

Metoda reprezentacyjna


Stanisław Jaworski

Katedra Ekonometrii i StatystykiZakład Statystyki


Podstawowe pojęcia

Populacja, cecha, parametr, próba

Metoda reprezentacyjnaPrzedmiotem rozważań metody reprezentacyjnej są metody wyboru prób z populacjiskończonych oraz metody szacowania nieznanych charakterystyk populacji.

Definicja (populacja)

Populacją generalną będziemy nazywaćzbiór wszystkich jednostek badania.

Populacja generalna będzie zapisywana wpostaci:

U = u1, u2, . . . , uN lub U = 1, 2, . . . , N.

Liczbę N ∈ N nazywamy liczebnościąpopulacji.

Przykłady

Zbiór studentów, którz zdali egamin

Zbiór gospodarstw domowych wPolsce w dniu 1 stycznia bieżącegoroku

Zbiór wyborców


Podstawowe pojęcia






U = u1, u2, . . . , uN lub U = 1, 2, . . . , N.


Przykłady



Zbiór wyborców


Podstawowe pojęcia






U = u1, u2, . . . , uN lub U = 1, 2, . . . , N.


Przykłady



Zbiór wyborców


Podstawowe pojęcia


Definicja (cecha statystyczna)

Cechą statystyczną nazywamy funkcję Y:

Y : U → R

Wartość cechy dla j–tej jednostki badania,tzn. Y(uj), oznaczamy przez Yj

Przykłady

ocena z egzaminu:Y(student) = ocena z egzaminu

dochody gospodarstwa domowego:Y(gospodarstwo domowe) = dochód

Definicja (parametr populacji)

Parametrem populacji U nazywamy wektorY = [Y1, Y2, . . . , YN ]

Definicja (przestrzeń parametrów)

Zbiór możliwych parametrów populacji Unazywamy przestrzenią parametrów ioznaczamy przez Ω


Podstawowe pojęcia




Y : U → R


Przykłady








Podstawowe pojęcia




Y : U → R


Przykłady








Podstawowe pojęcia




Y : U → R


Przykłady








Podstawowe pojęcia


Definicja (Funkcja parametryczna)

Funkcją parametryczną nazywamy funkcję T : Ω→ R


Podstawowe pojęcia




Przykład (1/2)

Populacja=student1, student2, student3Cecha=ocena z egzaminuParametr=[2, 4, 5]Przestrzeń parametrów

Ω = 1, 2, 3, 4, 5 × 1, 2, 3, 4, 5 × 1, 2, 3, 4, 5

Zauważmy, że[2, 4, 5] ∈ Ω

Przykład funkcji parametrycznej T : Ω→ R:

T (Y1, Y2, Y3) =1

3

3∑i=1

Yi


Podstawowe pojęcia




Przykład (2/2)

Wartość globalna cechy Y: Y =N∑i=1

Yi

Średnia cechy Y: Y = 1N

N∑i=1

Yi

Wariancja cechy Y: S2 = 1N−1

N∑i=1

(Yi − Y )2

Minimalna wartość cechy Y: Ymin = minY1, . . . , YNMaksymalna wartość cechy Y: Ymax = maxY1, . . . , YN

Iloraz wartości globalnych cech X ,Y: R =Y

X

Kowariancja cech X ,Y: Sxy = 1N−1

N∑j=1

(Xj − X)(Yj − Y )


Podstawowe pojęcia


Rodzaje prób

Definicja (próba uporządkowana)

Próbą uporządkowaną s o liczebności n z populacji U nazywamy wektor

s = [j1, j2, . . . , jn] ∈ Un

Dla podkreślenia, że liczebność n dotyczy próby s będziemy ją oznaczać przez n(s).Zbiór wszystkich uporządkowanych prób będziemy oznaczać przez S

Definicja (próba nieuporządkowana)

Próbą nieuporządkowaną s′ o liczebności ν z populacji U nazywamy zbiór

s′ ⊂ U

Dla podkreślenia, że liczebność ν dotyczy próby s będziemy ją oznaczać przez ν(s).Zbiór wszystkich nieuporządkowanych prób będziemy oznaczać przez S ′


Podstawowe pojęcia


Rodzaje prób

Definicja (próba uporządkowana)

Próbą uporządkowaną s o liczebności n z populacji U nazywamy wektor

s = [j1, j2, . . . , jn] ∈ Un

Dla podkreślenia, że liczebność n dotyczy próby s będziemy ją oznaczać przez n(s).Zbiór wszystkich uporządkowanych prób będziemy oznaczać przez S

Definicja (próba nieuporządkowana)

Próbą nieuporządkowaną s′ o liczebności ν z populacji U nazywamy zbiór

s′ ⊂ U

Dla podkreślenia, że liczebność ν dotyczy próby s będziemy ją oznaczać przez ν(s).Zbiór wszystkich nieuporządkowanych prób będziemy oznaczać przez S ′


Podstawowe pojęcia

Plan losowania, schemat losowania, operat losowania

Definicja (plan losowania)

Planem losowania nazywamy miarę prawdopodobieństwa p określoną na zbiorze S :

p(s) ≥ 0 (∀s ∈ S )∑s∈S

p(s) = 1

Definicja (pradopodobieństwo k−tego rzędu)

Prawdopodobieństwo pierwszego rzędu: πj =∑s3j

p(s)

Prawdopodobieństwo drugiego rzędu: πj,k =∑s3j,k

p(s)

Prawdopodobieństwo k–tego rzędu: πj1,...,jk =∑

s3j1,...,jkp(s)

Zapis∑s3j,k

oznacza, że sumowanie odbywa się potakich s ∈ S , które zawierają

jednostki j, k.


Podstawowe pojęcia


Definicja (plan losowania)

Planem losowania nazywamy miarę prawdopodobieństwa p określoną na zbiorze S :

p(s) ≥ 0 (∀s ∈ S )∑s∈S

p(s) = 1

Definicja (pradopodobieństwo k−tego rzędu)

Prawdopodobieństwo pierwszego rzędu: πj =∑s3j

p(s)

Prawdopodobieństwo drugiego rzędu: πj,k =∑s3j,k

p(s)

Prawdopodobieństwo k–tego rzędu: πj1,...,jk =∑

s3j1,...,jkp(s)

Zapis∑s3j,k

oznacza, że sumowanie odbywa się potakich s ∈ S , które zawierają

jednostki j, k.


Podstawowe pojęcia


Definicja (parametry efektywnej liczebności próby)

Oczekiwana efektywna liczebność próby: ν = E[ν(S)] =∑s∈S

ν(s)p(s)

Wariancja efektywnej liczebności próby: D2[ν(S)] =∑s∈S

(ν(s)− ν)2p(s)

ν(S) oznacza zmienną losową, która przyjmuje wartość ν(s) z prawdopodobieństwemp(s)

Definicja (schemat losowania)

Schematem losowania próby nazywamy proces wyboru (jedna po drugiej) jednostek zpopulacji U ze zgóry ustalonym prawdopodobieństwem wyboru dla poszczególnychjednostek w każdym ciągnieniu.


Podstawowe pojęcia




ν(s)p(s)


(ν(s)− ν)2p(s)





Podstawowe pojęcia




ν(s)p(s)


(ν(s)− ν)2p(s)




Przykład (1/2): Losowanie proste ze zwracaniem (lpzz)

Niech u, u1, u2, . . . , ui−1 ∈ U oraz U ma rozmiar N

Au–zdarzenie oznaczające, że w i−tym ciągnięciu wylosowaliśmy element u

Au1,...,ui−1–zdarzenie oznaczające, że w poprzednich ciągnięciach (od 1 do i− 1)wyciągnęliśmy elementy u1, . . . , ui−1

W losowaniu ze zwracaniem zachodzi P (Au|Au1,...,ui−1 ) = 1N

dla dowolnychu, oraz u1, . . . , ui−1.


Podstawowe pojęcia




ν(s)p(s)


(ν(s)− ν)2p(s)




Przykład (2/2): Losowanie proste bez zwracania (lpbz)

W losowaniu bez zwracania zachodzi

P (Au|Au1,...,ui−1 ) =1

N − (i− 1)dla u /∈ u1, . . . , ui−1

orazP (Au|Au1,...,ui−1 ) = 0 w przeciwnym przypadku.


Podstawowe pojęcia


Prawdopodobieństwa pierwszego i drugiego rzędu w typowych schematach losowania

Prawdopodobieństwa pierwszego rzędu w losowaniach prostychπj – prawdopodobieństwo wylosowania j–tego elementu w próbie1− πj – prawdopodobieństwo niewylosowania j–tego elementu w próbie

Pobieramy próbę n – elementową. Losujemy ze zwracaniem.

1− πj = (1−1

N)n

Pobieramy próbę n – elementową. Losujemy bez zwracania.

πj =

(N−1n−1

)(Nn

) =n

N


Podstawowe pojęcia


Prawdopodobieństwa pierwszego i drugiego rzędu w typowych schematach losowania

Losowanie z prawdopodobieństwami proporcjonalnymi do wartości cechu X i zezwracaniem (lppxzz)

Niech składowe parametru [X1, . . . , XN ] będą większe od zera. Określamyprawdopodobieństwo pj , j = 1, . . . , N, wylosowania j–tego elementu populacjinastępująco:

pj =Xj

X

Zgodnie z zadanym rozkładem prawdopdobieństwa losujemy próbę n−elementową.Ai−zdarzenie polegające na tym, że i−ty elment nie pojawi się w próbie.Stąd

πij = 1− P (Ai ∪Aj) = 1− P (Ai)− P (Aj) + P (Ai ∩Aj) =

= 1− (1− pi)n − (1− pj)n + (1− pi − pj)n

Zauważmy: Ai ∩Aj− zdarzenie polegające na tym, że i−ty oraz j−ty elment niepojawi się w próbie.


Podstawowe pojęcia


Definicja (operat losowania)

Operatem losowania nazywamy wykaz jednostek badania lub ich zespołów, zwanychjednostkami losowania. Każdej jednostce jest przyporządkowany identyfikator. Jeżelilosujemy jednostki badania, mówimy o losowaniu indywidualnym, jeżeli zespoły, ozespołowym.

Definicja (przestrzeń prób)

Niech U = 1, 2, . . . , N. Możemy wówczas przyjąć, że Ω = Ω1 × . . .ΩN . NiechΩs = Ωj1 × . . .× Ωjn dla s = (j1, . . . , jn) ∈ S . Zbiór

P =⋃s∈S

Ωs

nazywamy przestrzenią prób.


Podstawowe pojęcia

Statystyka, estymator

Definicja (statystyka)

Funkcję t : P → R nazywamy statystyką.

Definicja (estymator)

Niech T : Ω→ R oznacza funkcję parametryczną oraz Θ = T (Ω). Statystykęt : P → Θ nazywamy estymatorem funkcji parametrycznej T . Jeśli Y ∈ P, to t(Y )nazywamy oceną funkcji parametrycznej T .

Estymatory


Podstawowe pojęcia






EstymatoryEstymator liniowy jednorodny

t(Ys) =s∑i=1

wiYji

dla s = (j1, j2, . . . , jn), Ys = (Yj1 , . . . , Yjn) oraz ustalonych w1, w2, . . . , wn ∈ R


Podstawowe pojęcia






EstymatoryEstymator Horvitza–Thompsona: yHT (plan lppbz)

t(Ys′ ) =1

N

n∑i=1

Yjiπji

dla s′ = j1, j2, . . . , jn, Ys′ = (Yj1 , . . . , Yjn ).

Oznaczenie: πi =∑s′3i p(s

′)


Podstawowe pojęcia






EstymatoryEstymator Hansena–Hurwitza: yHH (plan lppxzz)

t(Ys) =1

N

n∑i=1

Yji

npji=X

n

n∑i=1

YjiXji

dla s = (j1, j2, . . . , jn), Ys = (Yj1 , . . . , Yjn)


Podstawowe pojęcia


Parametry estymatora

Definicja (estymator nieobciążony)

Niech Y oznacza parametr populacji oraz S zmienną losową, która przyjmuje wartośćs ∈ S z prawdopodobieństwem p(s), gdzie p jest planem losowania. Estymator tnazywamy nieobciążonym dla funkcji parametrycznej T , jeżeli

Ep(t(YS)) =∑s∈S

t(Ys)p(s) = T (Y)

Wartość oczekiwaną Ep(t(YS)) będziemy dla uproszczenia oznaczać przez Ep(t) lubprzez E(t).

Jeżeli estymator jest obciążony, to różnica Ep(t(YS))− T (Y) nazywa się obciążeniemestymatora. Różnicę tę będziemy oznaczać przez B(t).


Podstawowe pojęcia



Definicja (wariancja estymatora)

Niech Y oznacza parametr populacji oraz S zmienną losową, która przyjmuje wartośćs ∈ S z prawdopodobieństwem p(s), gdzie p jest planem losowania. Wariancjąestymatora t nazywamy wyrażenie

D2p(t(YS)) =

∑s∈S

[t(Ys)− Ep(t(YS))]2p(s)

=∑s∈S

t(Ys)2p(s)− [Ep(t(YS))]2

Wariancję D2p(t(YS)) będziemy oznaczać przez D2

p(t) lub D2(t).


Podstawowe pojęcia



Definicja (błąd średniokwadratowy)

Przy oznaczeniach, jak w powyższych definicjach, średnim błędemśredniokwadratowym estymatora t jest wyrażenie

MSEp(t) =∑s∈S

(t(Ys)− T (Y))2p(s)

= D2p(t(YS)) + [B(t)]2


Podstawowe pojęcia


Wartość oczekiwana estymatora Horvitza-Thompsona

TwierdzenieEstymator Horvitza Thompsona jest nieobciążony

Pomiń dowód


Podstawowe pojęcia


Wartość oczekiwana estymatora Horvitza-Thompsona

TwierdzenieEstymator Horvitza Thompsona jest nieobciążony

Dowód

Ep(yHT ) =∑s′∈S ′

1

N

∑j∈s′

Yj

πj

p(s′)

=

N∑j=1

∑s′3j

1

N

Yj

πjp(s′)

=N∑j=1

1

N

Yj

πj

∑s′3j

p(s′) = Y


Podstawowe pojęcia


TwierdzenieWariancja estymatora Horvitza-Thompsona wynosi

D2p(yHT ) =

1

N2

N∑j=1

Y 2j

(1

πj− 1

)+

∑1≤j,k≤N ; j 6=k

(πjk

πjπk− 1

)YjYk

Pomiń dowód


Podstawowe pojęcia



D2p(yHT ) =

1

N2

N∑j=1

Y 2j

(1

πj− 1

)+

∑1≤j,k≤N ; j 6=k

(πjk

πjπk− 1

)YjYk

Dowód

D2p(yHT ) = Ep[(yHT )2]− [Ep(yHT )]2 = Ep

1

N

∑j∈S′

Yj

πj

2

− [Y ]2 =

=1

N2E

∑j∈S′

(Yj

πj

)2

+∑

j,k∈S′j 6=k

YjYk

πjπk

− [Y ]2 =


Podstawowe pojęcia



D2p(yHT ) =

1

N2

N∑j=1

Y 2j

(1

πj− 1

)+

∑1≤j,k≤N ; j 6=k

(πjk

πjπk− 1

)YjYk

Dowód

=1

N2

N∑j=1

Y 2j

π2j

∑s′3j

p(s′) +∑

1≤j,k≤Nj 6=k

YjYk

πjπk

∑s′3j,k

p(s′)

− [Y ]2 =


Podstawowe pojęcia



D2p(yHT ) =

1

N2

N∑j=1

Y 2j

(1

πj− 1

)+

∑1≤j,k≤N ; j 6=k

(πjk

πjπk− 1

)YjYk

Dowód

=1

N2

N∑j=1

Y 2j

πj+

∑1≤j,k≤N

j 6=k

πjk

πjπkYjYk

− [Y ]2 =

=1

N2

N∑j=1

Y 2j

(1

πj− 1

)+

∑1≤j,k≤N ; j 6=k

(πjk

πjπk− 1

)YjYk


Podstawowe pojęcia


TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi

D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Pomiń dowód


Podstawowe pojęcia



D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowód

ν(s) =N∑j=1

Is(j)

Epν(S) =N∑j=1

Ep(IS(j)) =N∑j=1

∑s3j

p(s) =N∑j=1

πj


Podstawowe pojęcia



D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowód

∑1≤j,k≤N

j 6=k

πjk =∑

1≤j,k≤Nj 6=k

Ep (IS(j)IS(k)) = Ep

∑1≤j,k≤N

j 6=k

IS(j)IS(k)

=

= Ep

N∑j=1

IS(j)

2

−N∑j=1

I2S(j)

= Ep

ν2(S)−N∑j=1

IS(j)

=


Podstawowe pojęcia



D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowód

= Ep(ν2(S)− ν(S)

)= Ep(ν2(S))− Ep(ν(S)) =

= D2p(ν(S)) + [Ep(ν(S))]2 − Ep(ν(S))


Podstawowe pojęcia



D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

DowódDla ν(S) ≡ ν mamy zatem tożsamości:

ν =N∑j=1

πj ,∑

1≤j,k≤Nj 6=k

πjk = ν2 − ν

N∑j=1j 6=k

πjk =N∑

j=1j 6=k

Ep(IS(j)IS(k)) = Ep(IS(k)N∑

j=1j 6=k

IS(j)) =

= Ep(IS(k)[ν(S)− IS(k)]) = (ν − 1)πk


Podstawowe pojęcia



D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowód

1

N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

=

=1

N2

∑1≤j,k≤N

j 6=k

(πkY 2j

πj+ πj

Y 2k

πk− πjk

Y 2j

π2j

− πjkY 2k

π2k

− 2YjYk + 2πjkYjYk

πjπk

)

=2

N2

∑1≤j,k≤N

j 6=k

(πkY 2j

πj− πjk

Y 2k

π2k

− YjYk + πjkYjYk

πjπk

)=?


Podstawowe pojęcia



D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

DowódPonieważ ∑

1≤j,k≤Nj 6=k

πkY 2j

πj=

N∑j=1

Y 2j

πj

N∑k=1k 6=j

πk =N∑j=1

Y 2j

πj(ν − πj) =

= νN∑j=1

Y 2j

πj−

N∑j=1

Y 2j


Podstawowe pojęcia



D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowódoraz ∑

1≤j,k≤Nj 6=k

πjkY 2j

π2j

=N∑j=1

Y 2j

π2j

N∑k=1k 6=j

πjk =N∑j=1

Y 2j

π2j

πj(ν − 1) =

= (ν − 1)N∑j=1

Y 2j

πj

∑1≤j,k≤N

j 6=k

YjYk = Y 2 −N∑j=1

Y 2j


Podstawowe pojęcia



D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowódmamy

=?2

N2

ν N∑j=1

Y 2j

πj−

N∑j=1

Y 2j − (ν − 1)

N∑j=1

Y 2j

πj− Y 2 +

N∑j=1

Y 2j +

∑1≤j,k≤N

j 6=k

πjkYjYk

πjπk

=2

N2

N∑j=1

Y 2j

πj+

∑1≤j,k≤N

j 6=k

πjk

πjπkYjYk − Y 2

=2

N2

N∑j=1

Y 2j

πj+

∑1≤j,k≤N

j 6=k

πjk

πjπkYjYk

− 2[Y ]2 = 2D2(yHT )


Podstawowe pojęcia


TwierdzenieJeżeli πj > 0 dla j = 1, . . . , N oraz πij > 0 dla i, j = 1, . . . , N, j 6= k, to statystyka

D2(yHT ) =1

N2

∑j∈S′

Y 2j

πj

(1

πj− 1

)+

∑1≤j,k∈S′

j 6=k

(πjk

πjπk− 1

)YjYk

πj,k

jest nieobciążonym estymatorem wariancji D2(yHT ).

Dla ν(S′) ≡ ν ma on postać

D2(yHT ) =1

2N2

∑j,k∈S′j 6=k

πjπk − πjkπjk

(Yj

πj−Yk

πk

)2


Podstawowe pojęcia


WniosekDla n−elementowej próby wylosowanej według planu lpbz (losowanie proste bezzwracania)

D2(yHT ) =(

1−n

N

) s2n,

gdzie

s2 =1

n− 1

∑i∈S′

(Yi − YS′ )2, YS′ =1

n

∑i∈S′

Yi

Uwaga. Jeżeli zmienna S′ zrealizuje się jako s′ = j1, . . . , jn, to dla uproszczeniabędziemy oznaczać (Yj1 , . . . , Yjn ) przez (y1, . . . , yn). Wtedy możemy zapisać

s2 =1

n− 1

n∑i=1

(yi − y)2, y =1

n

n∑i=1

yi


Podstawowe pojęcia


Wartość oczekiwana estymatora Hansena–Hurwitza (plan lppxzz, n(s) ≡ n)

Ze względu na sposób losowania estymator ten można zapisać w postaci

yHH =1

N

n∑i=1

YJinpJi

gdzie J1, J2, . . . , Jn są niezależnymi zmiennymi losowymi o tym samym rozkładzie

p :1 2 · · · Np1 p2 · · · pN

Wtedy Ep(yHH) = 1Nn

n∑i=1

Ep

(YJipJi

)= 1

Nn

n∑i=1

N∑j=1

Yj

pjpj = Y


Podstawowe pojęcia


Wariancja estymatora Hansena–Hurwitza (plan lppxzz, n(s) ≡ n)

D2(yHH) = Ep(yHH)2 − (Ep(yHH))2 = Ep

(n∑i=1

YJipJi

)2

− (Y )2 =

=1

(Nn)2Ep

n∑i=1

Y 2Ji

p2Ji

+∑

1≤j,k≤nj 6=k

YJiYJkpJipJk

− (y)2 =

=1

(Nn)2

n∑i=1

N∑k=1

pkY 2k

p2k

+∑

1≤j,k≤nj 6=k

E

(YJipJi

)E

(YJkpJk

)− (y)2 =

=1

(Nn)2

(n

N∑k=1

Y 2k

pk+ n(n− 1)N2(Y )2

)− (Y )2 =

=1

n

N∑k=1

pk

(Yk

Npk− Y

)2


Podstawowe pojęcia


Zauważmy, że dla pk = YkY

= Yk∑k Yk

zachodzi D2(yHH) = 0.

Jeżeli dla k = 1, 2, . . . , N mamy pk = 1/N , to

yHH = y =1

n

n∑i=1

yi

oraz

D2(yHH) = D2(y) =1

n·

1

N

N∑k=1

(Yk − Y )2

Uogólniony estymator różnicy dla średniej

yGD =1

N

∑i∈S′

Yi − Eiπi

+ E

gdzie E1, . . . , EN są dowolnymi stałymi. W szczególności dlaEi = cXi, i = 1, . . . , N , gdzie Xi są wartościami cechy dodatkowej X oraz c jeststałą, estymator ten przyjmuje postać:

yGD =1

N

∑i∈S′

Yi

pi+ c

X − 1

N

∑i∈S′

Xi

πi

= yHT + c(X − xHT )


Podstawowe pojęcia


Zatem E(yGD) = Y oraz

D2(yGD) = D2(yHT ) + c2D2(xHT )− 2cCov(xHT , yHT ),

która jest minimalizowana dla c =Cov(xHT ,yHT )

D2(xHT ).

Zatem najmniejsza wariancja wynosi:

D(yGD) = D2(yHT )[1− %2(xHT , yHT )]

Estymator Khamisa yK (losowanie zgodnie ze schematem lpzz)

Niech s′ = r(s), gdzie r jest funkcją redukcyjną

yK =1

ν(S′)

∑j∈S′

Yj

Estymator Khamisa jest nieobciążony: E(yK) = E(E(yK |ν(S′))) = E(Y ) = Y


Podstawowe pojęcia


Wariancja

D2(yK) = D2

1

ν(S′)

∑j∈S′

Yj

=

= D2

E 1

ν(S′)

∑j∈S′

Yj

∣∣∣∣∣∣ ν(S′)

+ E

D2

1

ν(S′)

∑j∈S′

Yj

∣∣∣∣∣∣ ν(S′)

=

= D2(Y ) + E

[(1

ν(S′)−

1

N

)Nσ2

N − 1

]

gdzie σ2 =1

N

N∑i=1

(Yi − Y )2

D2(yK) =

(E

[1

ν(S′)

]−

1

N

)Nσ2

N − 1>

(1

n−

1

N

)S2 = D2(yHT )

gdzie D2(yHT ) wyznaczone w przypadku: lpbz, ν ≡ n


Podstawowe pojęcia


W przypadku lpzz i rozmiaru próby n mamy D2(yHH) = σ2/nZauważmy:

(E

[1

ν(S′)

]−

1

N

)N

N − 1<

1

n⇐⇒

NE[

nν(S′)

]− n

N − 1< 1

ZatemD2(yHH) > D2(yK) > D2(yHT )


Podstawowe pojęcia

Strategia losowania

Definicja (strategia losowania)

Strategią losowania nazywamy parę (p, t), gdzie p jest planem losowania, natomiast tjest estymatorem funkcji parametrycznej T . Strategię losowania będziemy oznaczaćprzez H(p, t). Jeśli estymator t jest nieobciążony, powiemy o strategii, że jestnieobciążona.

Definicja (porównanie strategii)

Powiemy, że startegia H1(p1, t1) jest co najmniej tak dobra jak strategia H2(p2, t2),jeżeli

MSEp1 (t1) ≤MSEp2 (t2)

dla wszystkich Y ∈ Ω. Jeżeli dodatkowo

MSEp1 (t1) < MSEp2 (t2)

dla pewnego Y ∈ Ω, to mówimy, że strategia H1(p1, t1) jest lpesza od strategiiH2(p2, t2)

Przypomnienie:MSEp(t) =

∑s∈S

(t(Ys)− T (Y))2p(s)


Podstawowe pojęcia

Strategia losowania

PrzykładRozmiar próby: n

MSElpzz(yHH) > MSElpzz(yK) > MSElpbz(yHT )


Wybrane zagadnienia

Przedział ufności dla średniej, minimalna liczebność próby

ProblemJak ustalić liczebność próby n, aby błąd szacunku nie przekroczył zadanej wielkości dze z góry ustalonym prawdopodobieństwem 1− α?

P (|tn − T | < d) = 1− α

Definicja (minimalna liczebność próby)

Wielkość d nazywana jest maksymalnym dopuszczalnym błędem szacunku, natomiastδ = d/T maksymalnym dopuszaczalnym względnym błędem szacunku

PrzykładW przypadku szacowania Y na podstawie próby wylosowanej według schematu lpbzmamy

P (|y − Y | < d) = P (y − d < Y < y + d) = 1− α

P (y − u1−α/2D(y) < Y < y + u1−α/2D(y)) ≈ 1− α

gdzie u1−α/2 jest kwantylem rozkładu normalnegorzędu (1− α/2) oraz

D2(y) =

(1

n−

1

N

)S2


Wybrane zagadnienia

Przedział ufności dla średniej, minimalna liczebność próby

Zatemd = u1−α/2D(y)

δ = u1−α/2D(y)

Y

oraz minimalna liczebność próby n = [n?] + 1

n? =Nu2

1−α/2S2

Nd2 + u21−α/2S

2=

Nu21−α/2V

2

Nδ2 + u21−α/2V

2

gdzie V = S/Y – współczynnik zmiennościPrzy wyznaczaniu minimalnej próby parametry, których nie znamy zastępujemy ichoszacowaniami


Wybrane zagadnienia

Estymatory złożone

Definicja ( estymator produktowy (iloczynowy))

Statystykę

yp =xy

X, X > 0

nazywamy estymatorem produktowym (iloczynowym) średniej Y

TwierdzenieJeżeli n–elementowa próba wylosowana została według schematu lpbz zN–elementowej populacji, to

E(yp) = Y + (1− n/N)S2xy

nX+O(n−2)

MSE(yp) =(

1−n

N

) S2y + 2RSxy +R2S2

x

n+O(n−2)

gdzie

Sxy =1

N − 1

N∑j=1

(Xj − X)(Yj − Y )

R =Y

X


Wybrane zagadnienia


Definicja (estymator ilorazowy)

Statystykę

yq =y

xX = rX

gdzie

r =y

x

nazywamy estymatorem ilorazowym średniej Y .


E(yq) = Y + (1− n/N)RS2

x − SxynX

+O(n−2)

MSE(yq) =(

1−n

N

) S2y − 2RSxy +R2S2

x

n+O(n−2)


Wybrane zagadnienia


Definicja (estymator liniowy)

Statystykęylr = y + b(X − x)

gdzie

b =s2xy

s2x=

∑ni=1(xi − x)(yi − y)∑n

i=1(xi − x)2

nazwywamy estymatorem liniowym regresyjnym


E(ylr) = Y +(

1−n

N

)C +O(n−2)

gdzie

C =

BN∑j=1

(Yj − Y )3 −N∑j=1

(Xj − X)2(Yj − Y )

(n− 1)(N − 1)S2x


Wybrane zagadnienia


B =

N∑j=1

(Xj − X)(Yj − Y )

N∑j=1

(Xj − X)2

oraz

MSE(ylr) =(

1−n

N

) S2y(1− ρ2

xy)

n+O(n−2)

gdzie

ρxy =Sxy

SxSy= B

Sx

Sy


Wybrane zagadnienia

Losowanie warstwowe

Zagadnienie (estymacja wartości średniej w losowaniu warstwowym)

Badamy cechę mierzalną Y. Populacja generalna o liczności N podzielona jest na Lwarstw o licznościach Nh, h = 1, 2, . . . , L, przy czym

L∑h=1

Nh = N.

Frakcja elementów w warstwie h wynosi Wh = Nh/N . Z każdej warstwy oddzielnielosujemy nh elementów do próby. Dla próby n elementowej spełnione jest

nh =Nh

Nn = Whn, h = 1, 2, . . . , L.


Wybrane zagadnienia

Losowanie warstwowe

Z próby otrzymujemy wyniki

yih, i = 1, 2, . . . , nh, h = 1, 2, . . . , L.

Na podstawie próby szacujemy średnią wartość Y populacji w następujący sposób:

yw =1

N

L∑h=1

Nhyh =L∑h=1

Whyh,

gdzie

yh =1

nh

nh∑i=1

yih

Wariancja tego estymatora wynosi:

D2(yw) =

(1

n−

1

N

) L∑h=1

WhS2h,

gdzie S2h jest wariancją w h–tej warstwie (jeżeli jej nie znamy, to z dużej próby można

ją oszacować za pomocą s2h).


Wybrane zagadnienia

Losowanie warstwowe

Jeżeli badana cecha w populacji ma rozkład zbliżony do normalnego lub gdy przyinnym rozkładzie próba jest duża, to przybliżony przedział ufności dla średniej mapostać (

yw − u1−α/2D(yw), yw + u1−α/2D(yw))

Minimalna liczebność próby potrzebna do oszacowania średniej z maksymalnymdopuszczalnym błędem szacunku d wynosi

n =

L∑h=1

WhS2h

d2

u21−α/2

+1

N

L∑h=1

WhS2h


Wybrane zagadnienia

Losowanie warstwowe

Zagadnienie („optymalna” estymacja wartości średniej w losowaniu warstwowym)

Założenia są identyczne, jak w poprzednim zagadnieniu, z tą różnicą, że

• liczba wylosowanych elementów z h-tej warstwy wynosi

nh =WhShL∑h=1

WhSh

n, h = 1, 2, . . . , L

• wariancja estymatora wynosi

D2(yw) =1

n

(L∑h=1

WhSh

)2

−1

N

L∑h=1

WhS2h


Wybrane zagadnienia

Losowanie warstwowe

• minimalna liczebność próby wynosi

n =

(L∑h=1

WhSh)2

d2

u21−α/2

+1

N

L∑h=1

WhS2h

Losowanie w zagadnieniu pierwszym nazywamy proporcjonalnym (do wielkościwarstwy), a w zagadnieniu drugim optymalnym (zapewnia najmniejszą wariancjęestymatora)

Documents

Slajdy: metoda reprezentacyjna