65
Metoda reprezentacyjna Metoda reprezentacyjna Stanislaw Jaworski Katedra Ekonometrii i Statystyki Zaklad Statystyki

Slajdy: metoda reprezentacyjna

  • Upload
    trantu

  • View
    240

  • Download
    0

Embed Size (px)

Citation preview

Metoda reprezentacyjna

Metoda reprezentacyjna

Stanisław Jaworski

Katedra Ekonometrii i StatystykiZakład Statystyki

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Metoda reprezentacyjnaPrzedmiotem rozważań metody reprezentacyjnej są metody wyboru prób z populacjiskończonych oraz metody szacowania nieznanych charakterystyk populacji.

Definicja (populacja)

Populacją generalną będziemy nazywaćzbiór wszystkich jednostek badania.

Populacja generalna będzie zapisywana wpostaci:

U = u1, u2, . . . , uN lub U = 1, 2, . . . , N.

Liczbę N ∈ N nazywamy liczebnościąpopulacji.

Przykłady

Zbiór studentów, którz zdali egamin

Zbiór gospodarstw domowych wPolsce w dniu 1 stycznia bieżącegoroku

Zbiór wyborców

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Metoda reprezentacyjnaPrzedmiotem rozważań metody reprezentacyjnej są metody wyboru prób z populacjiskończonych oraz metody szacowania nieznanych charakterystyk populacji.

Definicja (populacja)

Populacją generalną będziemy nazywaćzbiór wszystkich jednostek badania.

Populacja generalna będzie zapisywana wpostaci:

U = u1, u2, . . . , uN lub U = 1, 2, . . . , N.

Liczbę N ∈ N nazywamy liczebnościąpopulacji.

Przykłady

Zbiór studentów, którz zdali egamin

Zbiór gospodarstw domowych wPolsce w dniu 1 stycznia bieżącegoroku

Zbiór wyborców

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Metoda reprezentacyjnaPrzedmiotem rozważań metody reprezentacyjnej są metody wyboru prób z populacjiskończonych oraz metody szacowania nieznanych charakterystyk populacji.

Definicja (populacja)

Populacją generalną będziemy nazywaćzbiór wszystkich jednostek badania.

Populacja generalna będzie zapisywana wpostaci:

U = u1, u2, . . . , uN lub U = 1, 2, . . . , N.

Liczbę N ∈ N nazywamy liczebnościąpopulacji.

Przykłady

Zbiór studentów, którz zdali egamin

Zbiór gospodarstw domowych wPolsce w dniu 1 stycznia bieżącegoroku

Zbiór wyborców

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Definicja (cecha statystyczna)

Cechą statystyczną nazywamy funkcję Y:

Y : U → R

Wartość cechy dla j–tej jednostki badania,tzn. Y(uj), oznaczamy przez Yj

Przykłady

ocena z egzaminu:Y(student) = ocena z egzaminu

dochody gospodarstwa domowego:Y(gospodarstwo domowe) = dochód

Definicja (parametr populacji)

Parametrem populacji U nazywamy wektorY = [Y1, Y2, . . . , YN ]

Definicja (przestrzeń parametrów)

Zbiór możliwych parametrów populacji Unazywamy przestrzenią parametrów ioznaczamy przez Ω

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Definicja (cecha statystyczna)

Cechą statystyczną nazywamy funkcję Y:

Y : U → R

Wartość cechy dla j–tej jednostki badania,tzn. Y(uj), oznaczamy przez Yj

Przykłady

ocena z egzaminu:Y(student) = ocena z egzaminu

dochody gospodarstwa domowego:Y(gospodarstwo domowe) = dochód

Definicja (parametr populacji)

Parametrem populacji U nazywamy wektorY = [Y1, Y2, . . . , YN ]

Definicja (przestrzeń parametrów)

Zbiór możliwych parametrów populacji Unazywamy przestrzenią parametrów ioznaczamy przez Ω

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Definicja (cecha statystyczna)

Cechą statystyczną nazywamy funkcję Y:

Y : U → R

Wartość cechy dla j–tej jednostki badania,tzn. Y(uj), oznaczamy przez Yj

Przykłady

ocena z egzaminu:Y(student) = ocena z egzaminu

dochody gospodarstwa domowego:Y(gospodarstwo domowe) = dochód

Definicja (parametr populacji)

Parametrem populacji U nazywamy wektorY = [Y1, Y2, . . . , YN ]

Definicja (przestrzeń parametrów)

Zbiór możliwych parametrów populacji Unazywamy przestrzenią parametrów ioznaczamy przez Ω

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Definicja (cecha statystyczna)

Cechą statystyczną nazywamy funkcję Y:

Y : U → R

Wartość cechy dla j–tej jednostki badania,tzn. Y(uj), oznaczamy przez Yj

Przykłady

ocena z egzaminu:Y(student) = ocena z egzaminu

dochody gospodarstwa domowego:Y(gospodarstwo domowe) = dochód

Definicja (parametr populacji)

Parametrem populacji U nazywamy wektorY = [Y1, Y2, . . . , YN ]

Definicja (przestrzeń parametrów)

Zbiór możliwych parametrów populacji Unazywamy przestrzenią parametrów ioznaczamy przez Ω

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Definicja (Funkcja parametryczna)

Funkcją parametryczną nazywamy funkcję T : Ω→ R

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Definicja (Funkcja parametryczna)

Funkcją parametryczną nazywamy funkcję T : Ω→ R

Przykład (1/2)

Populacja=student1, student2, student3Cecha=ocena z egzaminuParametr=[2, 4, 5]Przestrzeń parametrów

Ω = 1, 2, 3, 4, 5 × 1, 2, 3, 4, 5 × 1, 2, 3, 4, 5

Zauważmy, że[2, 4, 5] ∈ Ω

Przykład funkcji parametrycznej T : Ω→ R:

T (Y1, Y2, Y3) =1

3

3∑i=1

Yi

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Definicja (Funkcja parametryczna)

Funkcją parametryczną nazywamy funkcję T : Ω→ R

Przykład (2/2)

Wartość globalna cechy Y: Y =N∑i=1

Yi

Średnia cechy Y: Y = 1N

N∑i=1

Yi

Wariancja cechy Y: S2 = 1N−1

N∑i=1

(Yi − Y )2

Minimalna wartość cechy Y: Ymin = minY1, . . . , YNMaksymalna wartość cechy Y: Ymax = maxY1, . . . , YN

Iloraz wartości globalnych cech X ,Y: R =Y

X

Kowariancja cech X ,Y: Sxy = 1N−1

N∑j=1

(Xj − X)(Yj − Y )

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Rodzaje prób

Definicja (próba uporządkowana)

Próbą uporządkowaną s o liczebności n z populacji U nazywamy wektor

s = [j1, j2, . . . , jn] ∈ Un

Dla podkreślenia, że liczebność n dotyczy próby s będziemy ją oznaczać przez n(s).Zbiór wszystkich uporządkowanych prób będziemy oznaczać przez S

Definicja (próba nieuporządkowana)

Próbą nieuporządkowaną s′ o liczebności ν z populacji U nazywamy zbiór

s′ ⊂ U

Dla podkreślenia, że liczebność ν dotyczy próby s będziemy ją oznaczać przez ν(s).Zbiór wszystkich nieuporządkowanych prób będziemy oznaczać przez S ′

Metoda reprezentacyjna

Podstawowe pojęcia

Populacja, cecha, parametr, próba

Rodzaje prób

Definicja (próba uporządkowana)

Próbą uporządkowaną s o liczebności n z populacji U nazywamy wektor

s = [j1, j2, . . . , jn] ∈ Un

Dla podkreślenia, że liczebność n dotyczy próby s będziemy ją oznaczać przez n(s).Zbiór wszystkich uporządkowanych prób będziemy oznaczać przez S

Definicja (próba nieuporządkowana)

Próbą nieuporządkowaną s′ o liczebności ν z populacji U nazywamy zbiór

s′ ⊂ U

Dla podkreślenia, że liczebność ν dotyczy próby s będziemy ją oznaczać przez ν(s).Zbiór wszystkich nieuporządkowanych prób będziemy oznaczać przez S ′

Metoda reprezentacyjna

Podstawowe pojęcia

Plan losowania, schemat losowania, operat losowania

Definicja (plan losowania)

Planem losowania nazywamy miarę prawdopodobieństwa p określoną na zbiorze S :

p(s) ≥ 0 (∀s ∈ S )∑s∈S

p(s) = 1

Definicja (pradopodobieństwo k−tego rzędu)

Prawdopodobieństwo pierwszego rzędu: πj =∑s3j

p(s)

Prawdopodobieństwo drugiego rzędu: πj,k =∑s3j,k

p(s)

Prawdopodobieństwo k–tego rzędu: πj1,...,jk =∑

s3j1,...,jkp(s)

Zapis∑s3j,k

oznacza, że sumowanie odbywa się potakich s ∈ S , które zawierają

jednostki j, k.

Metoda reprezentacyjna

Podstawowe pojęcia

Plan losowania, schemat losowania, operat losowania

Definicja (plan losowania)

Planem losowania nazywamy miarę prawdopodobieństwa p określoną na zbiorze S :

p(s) ≥ 0 (∀s ∈ S )∑s∈S

p(s) = 1

Definicja (pradopodobieństwo k−tego rzędu)

Prawdopodobieństwo pierwszego rzędu: πj =∑s3j

p(s)

Prawdopodobieństwo drugiego rzędu: πj,k =∑s3j,k

p(s)

Prawdopodobieństwo k–tego rzędu: πj1,...,jk =∑

s3j1,...,jkp(s)

Zapis∑s3j,k

oznacza, że sumowanie odbywa się potakich s ∈ S , które zawierają

jednostki j, k.

Metoda reprezentacyjna

Podstawowe pojęcia

Plan losowania, schemat losowania, operat losowania

Definicja (parametry efektywnej liczebności próby)

Oczekiwana efektywna liczebność próby: ν = E[ν(S)] =∑s∈S

ν(s)p(s)

Wariancja efektywnej liczebności próby: D2[ν(S)] =∑s∈S

(ν(s)− ν)2p(s)

ν(S) oznacza zmienną losową, która przyjmuje wartość ν(s) z prawdopodobieństwemp(s)

Definicja (schemat losowania)

Schematem losowania próby nazywamy proces wyboru (jedna po drugiej) jednostek zpopulacji U ze zgóry ustalonym prawdopodobieństwem wyboru dla poszczególnychjednostek w każdym ciągnieniu.

Metoda reprezentacyjna

Podstawowe pojęcia

Plan losowania, schemat losowania, operat losowania

Definicja (parametry efektywnej liczebności próby)

Oczekiwana efektywna liczebność próby: ν = E[ν(S)] =∑s∈S

ν(s)p(s)

Wariancja efektywnej liczebności próby: D2[ν(S)] =∑s∈S

(ν(s)− ν)2p(s)

ν(S) oznacza zmienną losową, która przyjmuje wartość ν(s) z prawdopodobieństwemp(s)

Definicja (schemat losowania)

Schematem losowania próby nazywamy proces wyboru (jedna po drugiej) jednostek zpopulacji U ze zgóry ustalonym prawdopodobieństwem wyboru dla poszczególnychjednostek w każdym ciągnieniu.

Metoda reprezentacyjna

Podstawowe pojęcia

Plan losowania, schemat losowania, operat losowania

Definicja (parametry efektywnej liczebności próby)

Oczekiwana efektywna liczebność próby: ν = E[ν(S)] =∑s∈S

ν(s)p(s)

Wariancja efektywnej liczebności próby: D2[ν(S)] =∑s∈S

(ν(s)− ν)2p(s)

ν(S) oznacza zmienną losową, która przyjmuje wartość ν(s) z prawdopodobieństwemp(s)

Definicja (schemat losowania)

Schematem losowania próby nazywamy proces wyboru (jedna po drugiej) jednostek zpopulacji U ze zgóry ustalonym prawdopodobieństwem wyboru dla poszczególnychjednostek w każdym ciągnieniu.

Przykład (1/2): Losowanie proste ze zwracaniem (lpzz)

Niech u, u1, u2, . . . , ui−1 ∈ U oraz U ma rozmiar N

Au–zdarzenie oznaczające, że w i−tym ciągnięciu wylosowaliśmy element u

Au1,...,ui−1–zdarzenie oznaczające, że w poprzednich ciągnięciach (od 1 do i− 1)wyciągnęliśmy elementy u1, . . . , ui−1

W losowaniu ze zwracaniem zachodzi P (Au|Au1,...,ui−1 ) = 1N

dla dowolnychu, oraz u1, . . . , ui−1.

Metoda reprezentacyjna

Podstawowe pojęcia

Plan losowania, schemat losowania, operat losowania

Definicja (parametry efektywnej liczebności próby)

Oczekiwana efektywna liczebność próby: ν = E[ν(S)] =∑s∈S

ν(s)p(s)

Wariancja efektywnej liczebności próby: D2[ν(S)] =∑s∈S

(ν(s)− ν)2p(s)

ν(S) oznacza zmienną losową, która przyjmuje wartość ν(s) z prawdopodobieństwemp(s)

Definicja (schemat losowania)

Schematem losowania próby nazywamy proces wyboru (jedna po drugiej) jednostek zpopulacji U ze zgóry ustalonym prawdopodobieństwem wyboru dla poszczególnychjednostek w każdym ciągnieniu.

Przykład (2/2): Losowanie proste bez zwracania (lpbz)

W losowaniu bez zwracania zachodzi

P (Au|Au1,...,ui−1 ) =1

N − (i− 1)dla u /∈ u1, . . . , ui−1

orazP (Au|Au1,...,ui−1 ) = 0 w przeciwnym przypadku.

Metoda reprezentacyjna

Podstawowe pojęcia

Plan losowania, schemat losowania, operat losowania

Prawdopodobieństwa pierwszego i drugiego rzędu w typowych schematach losowania

Prawdopodobieństwa pierwszego rzędu w losowaniach prostychπj – prawdopodobieństwo wylosowania j–tego elementu w próbie1− πj – prawdopodobieństwo niewylosowania j–tego elementu w próbie

Pobieramy próbę n – elementową. Losujemy ze zwracaniem.

1− πj = (1−1

N)n

Pobieramy próbę n – elementową. Losujemy bez zwracania.

πj =

(N−1n−1

)(Nn

) =n

N

Metoda reprezentacyjna

Podstawowe pojęcia

Plan losowania, schemat losowania, operat losowania

Prawdopodobieństwa pierwszego i drugiego rzędu w typowych schematach losowania

Losowanie z prawdopodobieństwami proporcjonalnymi do wartości cechu X i zezwracaniem (lppxzz)

Niech składowe parametru [X1, . . . , XN ] będą większe od zera. Określamyprawdopodobieństwo pj , j = 1, . . . , N, wylosowania j–tego elementu populacjinastępująco:

pj =Xj

X

Zgodnie z zadanym rozkładem prawdopdobieństwa losujemy próbę n−elementową.Ai−zdarzenie polegające na tym, że i−ty elment nie pojawi się w próbie.Stąd

πij = 1− P (Ai ∪Aj) = 1− P (Ai)− P (Aj) + P (Ai ∩Aj) =

= 1− (1− pi)n − (1− pj)n + (1− pi − pj)n

Zauważmy: Ai ∩Aj− zdarzenie polegające na tym, że i−ty oraz j−ty elment niepojawi się w próbie.

Metoda reprezentacyjna

Podstawowe pojęcia

Plan losowania, schemat losowania, operat losowania

Definicja (operat losowania)

Operatem losowania nazywamy wykaz jednostek badania lub ich zespołów, zwanychjednostkami losowania. Każdej jednostce jest przyporządkowany identyfikator. Jeżelilosujemy jednostki badania, mówimy o losowaniu indywidualnym, jeżeli zespoły, ozespołowym.

Definicja (przestrzeń prób)

Niech U = 1, 2, . . . , N. Możemy wówczas przyjąć, że Ω = Ω1 × . . .ΩN . NiechΩs = Ωj1 × . . .× Ωjn dla s = (j1, . . . , jn) ∈ S . Zbiór

P =⋃s∈S

Ωs

nazywamy przestrzenią prób.

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Definicja (statystyka)

Funkcję t : P → R nazywamy statystyką.

Definicja (estymator)

Niech T : Ω→ R oznacza funkcję parametryczną oraz Θ = T (Ω). Statystykęt : P → Θ nazywamy estymatorem funkcji parametrycznej T . Jeśli Y ∈ P, to t(Y )nazywamy oceną funkcji parametrycznej T .

Estymatory

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Definicja (statystyka)

Funkcję t : P → R nazywamy statystyką.

Definicja (estymator)

Niech T : Ω→ R oznacza funkcję parametryczną oraz Θ = T (Ω). Statystykęt : P → Θ nazywamy estymatorem funkcji parametrycznej T . Jeśli Y ∈ P, to t(Y )nazywamy oceną funkcji parametrycznej T .

EstymatoryEstymator liniowy jednorodny

t(Ys) =s∑i=1

wiYji

dla s = (j1, j2, . . . , jn), Ys = (Yj1 , . . . , Yjn) oraz ustalonych w1, w2, . . . , wn ∈ R

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Definicja (statystyka)

Funkcję t : P → R nazywamy statystyką.

Definicja (estymator)

Niech T : Ω→ R oznacza funkcję parametryczną oraz Θ = T (Ω). Statystykęt : P → Θ nazywamy estymatorem funkcji parametrycznej T . Jeśli Y ∈ P, to t(Y )nazywamy oceną funkcji parametrycznej T .

EstymatoryEstymator Horvitza–Thompsona: yHT (plan lppbz)

t(Ys′ ) =1

N

n∑i=1

Yjiπji

dla s′ = j1, j2, . . . , jn, Ys′ = (Yj1 , . . . , Yjn ).

Oznaczenie: πi =∑s′3i p(s

′)

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Definicja (statystyka)

Funkcję t : P → R nazywamy statystyką.

Definicja (estymator)

Niech T : Ω→ R oznacza funkcję parametryczną oraz Θ = T (Ω). Statystykęt : P → Θ nazywamy estymatorem funkcji parametrycznej T . Jeśli Y ∈ P, to t(Y )nazywamy oceną funkcji parametrycznej T .

EstymatoryEstymator Hansena–Hurwitza: yHH (plan lppxzz)

t(Ys) =1

N

n∑i=1

Yji

npji=X

n

n∑i=1

YjiXji

dla s = (j1, j2, . . . , jn), Ys = (Yj1 , . . . , Yjn)

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Parametry estymatora

Definicja (estymator nieobciążony)

Niech Y oznacza parametr populacji oraz S zmienną losową, która przyjmuje wartośćs ∈ S z prawdopodobieństwem p(s), gdzie p jest planem losowania. Estymator tnazywamy nieobciążonym dla funkcji parametrycznej T , jeżeli

Ep(t(YS)) =∑s∈S

t(Ys)p(s) = T (Y)

Wartość oczekiwaną Ep(t(YS)) będziemy dla uproszczenia oznaczać przez Ep(t) lubprzez E(t).

Jeżeli estymator jest obciążony, to różnica Ep(t(YS))− T (Y) nazywa się obciążeniemestymatora. Różnicę tę będziemy oznaczać przez B(t).

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Parametry estymatora

Definicja (wariancja estymatora)

Niech Y oznacza parametr populacji oraz S zmienną losową, która przyjmuje wartośćs ∈ S z prawdopodobieństwem p(s), gdzie p jest planem losowania. Wariancjąestymatora t nazywamy wyrażenie

D2p(t(YS)) =

∑s∈S

[t(Ys)− Ep(t(YS))]2p(s)

=∑s∈S

t(Ys)2p(s)− [Ep(t(YS))]2

Wariancję D2p(t(YS)) będziemy oznaczać przez D2

p(t) lub D2(t).

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Parametry estymatora

Definicja (błąd średniokwadratowy)

Przy oznaczeniach, jak w powyższych definicjach, średnim błędemśredniokwadratowym estymatora t jest wyrażenie

MSEp(t) =∑s∈S

(t(Ys)− T (Y))2p(s)

= D2p(t(YS)) + [B(t)]2

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Wartość oczekiwana estymatora Horvitza-Thompsona

TwierdzenieEstymator Horvitza Thompsona jest nieobciążony

Pomiń dowód

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Wartość oczekiwana estymatora Horvitza-Thompsona

TwierdzenieEstymator Horvitza Thompsona jest nieobciążony

Dowód

Ep(yHT ) =∑s′∈S ′

1

N

∑j∈s′

Yj

πj

p(s′)

=

N∑j=1

∑s′3j

1

N

Yj

πjp(s′)

=N∑j=1

1

N

Yj

πj

∑s′3j

p(s′) = Y

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieWariancja estymatora Horvitza-Thompsona wynosi

D2p(yHT ) =

1

N2

N∑j=1

Y 2j

(1

πj− 1

)+

∑1≤j,k≤N ; j 6=k

(πjk

πjπk− 1

)YjYk

Pomiń dowód

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieWariancja estymatora Horvitza-Thompsona wynosi

D2p(yHT ) =

1

N2

N∑j=1

Y 2j

(1

πj− 1

)+

∑1≤j,k≤N ; j 6=k

(πjk

πjπk− 1

)YjYk

Dowód

D2p(yHT ) = Ep[(yHT )2]− [Ep(yHT )]2 = Ep

1

N

∑j∈S′

Yj

πj

2

− [Y ]2 =

=1

N2E

∑j∈S′

(Yj

πj

)2

+∑

j,k∈S′j 6=k

YjYk

πjπk

− [Y ]2 =

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieWariancja estymatora Horvitza-Thompsona wynosi

D2p(yHT ) =

1

N2

N∑j=1

Y 2j

(1

πj− 1

)+

∑1≤j,k≤N ; j 6=k

(πjk

πjπk− 1

)YjYk

Dowód

=1

N2

N∑j=1

Y 2j

π2j

∑s′3j

p(s′) +∑

1≤j,k≤Nj 6=k

YjYk

πjπk

∑s′3j,k

p(s′)

− [Y ]2 =

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieWariancja estymatora Horvitza-Thompsona wynosi

D2p(yHT ) =

1

N2

N∑j=1

Y 2j

(1

πj− 1

)+

∑1≤j,k≤N ; j 6=k

(πjk

πjπk− 1

)YjYk

Dowód

=1

N2

N∑j=1

Y 2j

πj+

∑1≤j,k≤N

j 6=k

πjk

πjπkYjYk

− [Y ]2 =

=1

N2

N∑j=1

Y 2j

(1

πj− 1

)+

∑1≤j,k≤N ; j 6=k

(πjk

πjπk− 1

)YjYk

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi

D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Pomiń dowód

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi

D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowód

ν(s) =N∑j=1

Is(j)

Epν(S) =N∑j=1

Ep(IS(j)) =N∑j=1

∑s3j

p(s) =N∑j=1

πj

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi

D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowód

∑1≤j,k≤N

j 6=k

πjk =∑

1≤j,k≤Nj 6=k

Ep (IS(j)IS(k)) = Ep

∑1≤j,k≤N

j 6=k

IS(j)IS(k)

=

= Ep

N∑j=1

IS(j)

2

−N∑j=1

I2S(j)

= Ep

ν2(S)−N∑j=1

IS(j)

=

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi

D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowód

= Ep(ν2(S)− ν(S)

)= Ep(ν2(S))− Ep(ν(S)) =

= D2p(ν(S)) + [Ep(ν(S))]2 − Ep(ν(S))

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi

D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

DowódDla ν(S) ≡ ν mamy zatem tożsamości:

ν =N∑j=1

πj ,∑

1≤j,k≤Nj 6=k

πjk = ν2 − ν

N∑j=1j 6=k

πjk =N∑

j=1j 6=k

Ep(IS(j)IS(k)) = Ep(IS(k)N∑

j=1j 6=k

IS(j)) =

= Ep(IS(k)[ν(S)− IS(k)]) = (ν − 1)πk

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi

D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowód

1

N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

=

=1

N2

∑1≤j,k≤N

j 6=k

(πkY 2j

πj+ πj

Y 2k

πk− πjk

Y 2j

π2j

− πjkY 2k

π2k

− 2YjYk + 2πjkYjYk

πjπk

)

=2

N2

∑1≤j,k≤N

j 6=k

(πkY 2j

πj− πjk

Y 2k

π2k

− YjYk + πjkYjYk

πjπk

)=?

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi

D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

DowódPonieważ ∑

1≤j,k≤Nj 6=k

πkY 2j

πj=

N∑j=1

Y 2j

πj

N∑k=1k 6=j

πk =N∑j=1

Y 2j

πj(ν − πj) =

= νN∑j=1

Y 2j

πj−

N∑j=1

Y 2j

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi

D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowódoraz ∑

1≤j,k≤Nj 6=k

πjkY 2j

π2j

=N∑j=1

Y 2j

π2j

N∑k=1k 6=j

πjk =N∑j=1

Y 2j

π2j

πj(ν − 1) =

= (ν − 1)N∑j=1

Y 2j

πj

∑1≤j,k≤N

j 6=k

YjYk = Y 2 −N∑j=1

Y 2j

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi

D2(yHT ) =1

2N2

∑1≤j,k≤N

j 6=k

(πjπk − πjk)

(Yj

πj−Yk

πk

)2

Dowódmamy

=?2

N2

ν N∑j=1

Y 2j

πj−

N∑j=1

Y 2j − (ν − 1)

N∑j=1

Y 2j

πj− Y 2 +

N∑j=1

Y 2j +

∑1≤j,k≤N

j 6=k

πjkYjYk

πjπk

=2

N2

N∑j=1

Y 2j

πj+

∑1≤j,k≤N

j 6=k

πjk

πjπkYjYk − Y 2

=2

N2

N∑j=1

Y 2j

πj+

∑1≤j,k≤N

j 6=k

πjk

πjπkYjYk

− 2[Y ]2 = 2D2(yHT )

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

TwierdzenieJeżeli πj > 0 dla j = 1, . . . , N oraz πij > 0 dla i, j = 1, . . . , N, j 6= k, to statystyka

D2(yHT ) =1

N2

∑j∈S′

Y 2j

πj

(1

πj− 1

)+

∑1≤j,k∈S′

j 6=k

(πjk

πjπk− 1

)YjYk

πj,k

jest nieobciążonym estymatorem wariancji D2(yHT ).

Dla ν(S′) ≡ ν ma on postać

D2(yHT ) =1

2N2

∑j,k∈S′j 6=k

πjπk − πjkπjk

(Yj

πj−Yk

πk

)2

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

WniosekDla n−elementowej próby wylosowanej według planu lpbz (losowanie proste bezzwracania)

D2(yHT ) =(

1−n

N

) s2n,

gdzie

s2 =1

n− 1

∑i∈S′

(Yi − YS′ )2, YS′ =1

n

∑i∈S′

Yi

Uwaga. Jeżeli zmienna S′ zrealizuje się jako s′ = j1, . . . , jn, to dla uproszczeniabędziemy oznaczać (Yj1 , . . . , Yjn ) przez (y1, . . . , yn). Wtedy możemy zapisać

s2 =1

n− 1

n∑i=1

(yi − y)2, y =1

n

n∑i=1

yi

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Wartość oczekiwana estymatora Hansena–Hurwitza (plan lppxzz, n(s) ≡ n)

Ze względu na sposób losowania estymator ten można zapisać w postaci

yHH =1

N

n∑i=1

YJinpJi

gdzie J1, J2, . . . , Jn są niezależnymi zmiennymi losowymi o tym samym rozkładzie

p :1 2 · · · Np1 p2 · · · pN

Wtedy Ep(yHH) = 1Nn

n∑i=1

Ep

(YJipJi

)= 1

Nn

n∑i=1

N∑j=1

Yj

pjpj = Y

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Wariancja estymatora Hansena–Hurwitza (plan lppxzz, n(s) ≡ n)

D2(yHH) = Ep(yHH)2 − (Ep(yHH))2 = Ep

(n∑i=1

YJipJi

)2

− (Y )2 =

=1

(Nn)2Ep

n∑i=1

Y 2Ji

p2Ji

+∑

1≤j,k≤nj 6=k

YJiYJkpJipJk

− (y)2 =

=1

(Nn)2

n∑i=1

N∑k=1

pkY 2k

p2k

+∑

1≤j,k≤nj 6=k

E

(YJipJi

)E

(YJkpJk

)− (y)2 =

=1

(Nn)2

(n

N∑k=1

Y 2k

pk+ n(n− 1)N2(Y )2

)− (Y )2 =

=1

n

N∑k=1

pk

(Yk

Npk− Y

)2

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Zauważmy, że dla pk = YkY

= Yk∑k Yk

zachodzi D2(yHH) = 0.

Jeżeli dla k = 1, 2, . . . , N mamy pk = 1/N , to

yHH = y =1

n

n∑i=1

yi

oraz

D2(yHH) = D2(y) =1

1

N

N∑k=1

(Yk − Y )2

Uogólniony estymator różnicy dla średniej

yGD =1

N

∑i∈S′

Yi − Eiπi

+ E

gdzie E1, . . . , EN są dowolnymi stałymi. W szczególności dlaEi = cXi, i = 1, . . . , N , gdzie Xi są wartościami cechy dodatkowej X oraz c jeststałą, estymator ten przyjmuje postać:

yGD =1

N

∑i∈S′

Yi

pi+ c

X − 1

N

∑i∈S′

Xi

πi

= yHT + c(X − xHT )

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Zatem E(yGD) = Y oraz

D2(yGD) = D2(yHT ) + c2D2(xHT )− 2cCov(xHT , yHT ),

która jest minimalizowana dla c =Cov(xHT ,yHT )

D2(xHT ).

Zatem najmniejsza wariancja wynosi:

D(yGD) = D2(yHT )[1− %2(xHT , yHT )]

Estymator Khamisa yK (losowanie zgodnie ze schematem lpzz)

Niech s′ = r(s), gdzie r jest funkcją redukcyjną

yK =1

ν(S′)

∑j∈S′

Yj

Estymator Khamisa jest nieobciążony: E(yK) = E(E(yK |ν(S′))) = E(Y ) = Y

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

Wariancja

D2(yK) = D2

1

ν(S′)

∑j∈S′

Yj

=

= D2

E 1

ν(S′)

∑j∈S′

Yj

∣∣∣∣∣∣ ν(S′)

+ E

D2

1

ν(S′)

∑j∈S′

Yj

∣∣∣∣∣∣ ν(S′)

=

= D2(Y ) + E

[(1

ν(S′)−

1

N

)Nσ2

N − 1

]

gdzie σ2 =1

N

N∑i=1

(Yi − Y )2

D2(yK) =

(E

[1

ν(S′)

]−

1

N

)Nσ2

N − 1>

(1

n−

1

N

)S2 = D2(yHT )

gdzie D2(yHT ) wyznaczone w przypadku: lpbz, ν ≡ n

Metoda reprezentacyjna

Podstawowe pojęcia

Statystyka, estymator

W przypadku lpzz i rozmiaru próby n mamy D2(yHH) = σ2/nZauważmy:

(E

[1

ν(S′)

]−

1

N

)N

N − 1<

1

n⇐⇒

NE[

nν(S′)

]− n

N − 1< 1

ZatemD2(yHH) > D2(yK) > D2(yHT )

Metoda reprezentacyjna

Podstawowe pojęcia

Strategia losowania

Definicja (strategia losowania)

Strategią losowania nazywamy parę (p, t), gdzie p jest planem losowania, natomiast tjest estymatorem funkcji parametrycznej T . Strategię losowania będziemy oznaczaćprzez H(p, t). Jeśli estymator t jest nieobciążony, powiemy o strategii, że jestnieobciążona.

Definicja (porównanie strategii)

Powiemy, że startegia H1(p1, t1) jest co najmniej tak dobra jak strategia H2(p2, t2),jeżeli

MSEp1 (t1) ≤MSEp2 (t2)

dla wszystkich Y ∈ Ω. Jeżeli dodatkowo

MSEp1 (t1) < MSEp2 (t2)

dla pewnego Y ∈ Ω, to mówimy, że strategia H1(p1, t1) jest lpesza od strategiiH2(p2, t2)

Przypomnienie:MSEp(t) =

∑s∈S

(t(Ys)− T (Y))2p(s)

Metoda reprezentacyjna

Podstawowe pojęcia

Strategia losowania

PrzykładRozmiar próby: n

MSElpzz(yHH) > MSElpzz(yK) > MSElpbz(yHT )

Metoda reprezentacyjna

Wybrane zagadnienia

Przedział ufności dla średniej, minimalna liczebność próby

ProblemJak ustalić liczebność próby n, aby błąd szacunku nie przekroczył zadanej wielkości dze z góry ustalonym prawdopodobieństwem 1− α?

P (|tn − T | < d) = 1− α

Definicja (minimalna liczebność próby)

Wielkość d nazywana jest maksymalnym dopuszczalnym błędem szacunku, natomiastδ = d/T maksymalnym dopuszaczalnym względnym błędem szacunku

PrzykładW przypadku szacowania Y na podstawie próby wylosowanej według schematu lpbzmamy

P (|y − Y | < d) = P (y − d < Y < y + d) = 1− α

P (y − u1−α/2D(y) < Y < y + u1−α/2D(y)) ≈ 1− α

gdzie u1−α/2 jest kwantylem rozkładu normalnegorzędu (1− α/2) oraz

D2(y) =

(1

n−

1

N

)S2

Metoda reprezentacyjna

Wybrane zagadnienia

Przedział ufności dla średniej, minimalna liczebność próby

Zatemd = u1−α/2D(y)

δ = u1−α/2D(y)

Y

oraz minimalna liczebność próby n = [n?] + 1

n? =Nu2

1−α/2S2

Nd2 + u21−α/2S

2=

Nu21−α/2V

2

Nδ2 + u21−α/2V

2

gdzie V = S/Y – współczynnik zmiennościPrzy wyznaczaniu minimalnej próby parametry, których nie znamy zastępujemy ichoszacowaniami

Metoda reprezentacyjna

Wybrane zagadnienia

Estymatory złożone

Definicja ( estymator produktowy (iloczynowy))

Statystykę

yp =xy

X, X > 0

nazywamy estymatorem produktowym (iloczynowym) średniej Y

TwierdzenieJeżeli n–elementowa próba wylosowana została według schematu lpbz zN–elementowej populacji, to

E(yp) = Y + (1− n/N)S2xy

nX+O(n−2)

MSE(yp) =(

1−n

N

) S2y + 2RSxy +R2S2

x

n+O(n−2)

gdzie

Sxy =1

N − 1

N∑j=1

(Xj − X)(Yj − Y )

R =Y

X

Metoda reprezentacyjna

Wybrane zagadnienia

Estymatory złożone

Definicja (estymator ilorazowy)

Statystykę

yq =y

xX = rX

gdzie

r =y

x

nazywamy estymatorem ilorazowym średniej Y .

TwierdzenieJeżeli n–elementowa próba wylosowana została według schematu lpbz zN–elementowej populacji, to

E(yq) = Y + (1− n/N)RS2

x − SxynX

+O(n−2)

MSE(yq) =(

1−n

N

) S2y − 2RSxy +R2S2

x

n+O(n−2)

Metoda reprezentacyjna

Wybrane zagadnienia

Estymatory złożone

Definicja (estymator liniowy)

Statystykęylr = y + b(X − x)

gdzie

b =s2xy

s2x=

∑ni=1(xi − x)(yi − y)∑n

i=1(xi − x)2

nazwywamy estymatorem liniowym regresyjnym

TwierdzenieJeżeli n–elementowa próba wylosowana została według schematu lpbz zN–elementowej populacji, to

E(ylr) = Y +(

1−n

N

)C +O(n−2)

gdzie

C =

BN∑j=1

(Yj − Y )3 −N∑j=1

(Xj − X)2(Yj − Y )

(n− 1)(N − 1)S2x

Metoda reprezentacyjna

Wybrane zagadnienia

Estymatory złożone

B =

N∑j=1

(Xj − X)(Yj − Y )

N∑j=1

(Xj − X)2

oraz

MSE(ylr) =(

1−n

N

) S2y(1− ρ2

xy)

n+O(n−2)

gdzie

ρxy =Sxy

SxSy= B

Sx

Sy

Metoda reprezentacyjna

Wybrane zagadnienia

Losowanie warstwowe

Zagadnienie (estymacja wartości średniej w losowaniu warstwowym)

Badamy cechę mierzalną Y. Populacja generalna o liczności N podzielona jest na Lwarstw o licznościach Nh, h = 1, 2, . . . , L, przy czym

L∑h=1

Nh = N.

Frakcja elementów w warstwie h wynosi Wh = Nh/N . Z każdej warstwy oddzielnielosujemy nh elementów do próby. Dla próby n elementowej spełnione jest

nh =Nh

Nn = Whn, h = 1, 2, . . . , L.

Metoda reprezentacyjna

Wybrane zagadnienia

Losowanie warstwowe

Z próby otrzymujemy wyniki

yih, i = 1, 2, . . . , nh, h = 1, 2, . . . , L.

Na podstawie próby szacujemy średnią wartość Y populacji w następujący sposób:

yw =1

N

L∑h=1

Nhyh =L∑h=1

Whyh,

gdzie

yh =1

nh

nh∑i=1

yih

Wariancja tego estymatora wynosi:

D2(yw) =

(1

n−

1

N

) L∑h=1

WhS2h,

gdzie S2h jest wariancją w h–tej warstwie (jeżeli jej nie znamy, to z dużej próby można

ją oszacować za pomocą s2h).

Metoda reprezentacyjna

Wybrane zagadnienia

Losowanie warstwowe

Jeżeli badana cecha w populacji ma rozkład zbliżony do normalnego lub gdy przyinnym rozkładzie próba jest duża, to przybliżony przedział ufności dla średniej mapostać (

yw − u1−α/2D(yw), yw + u1−α/2D(yw))

Minimalna liczebność próby potrzebna do oszacowania średniej z maksymalnymdopuszczalnym błędem szacunku d wynosi

n =

L∑h=1

WhS2h

d2

u21−α/2

+1

N

L∑h=1

WhS2h

Metoda reprezentacyjna

Wybrane zagadnienia

Losowanie warstwowe

Zagadnienie („optymalna” estymacja wartości średniej w losowaniu warstwowym)

Założenia są identyczne, jak w poprzednim zagadnieniu, z tą różnicą, że

• liczba wylosowanych elementów z h-tej warstwy wynosi

nh =WhShL∑h=1

WhSh

n, h = 1, 2, . . . , L

• wariancja estymatora wynosi

D2(yw) =1

n

(L∑h=1

WhSh

)2

−1

N

L∑h=1

WhS2h

Metoda reprezentacyjna

Wybrane zagadnienia

Losowanie warstwowe

• minimalna liczebność próby wynosi

n =

(L∑h=1

WhSh)2

d2

u21−α/2

+1

N

L∑h=1

WhS2h

Losowanie w zagadnieniu pierwszym nazywamy proporcjonalnym (do wielkościwarstwy), a w zagadnieniu drugim optymalnym (zapewnia najmniejszą wariancjęestymatora)