Upload
trantu
View
240
Download
0
Embed Size (px)
Citation preview
Metoda reprezentacyjna
Metoda reprezentacyjna
Stanisław Jaworski
Katedra Ekonometrii i StatystykiZakład Statystyki
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Metoda reprezentacyjnaPrzedmiotem rozważań metody reprezentacyjnej są metody wyboru prób z populacjiskończonych oraz metody szacowania nieznanych charakterystyk populacji.
Definicja (populacja)
Populacją generalną będziemy nazywaćzbiór wszystkich jednostek badania.
Populacja generalna będzie zapisywana wpostaci:
U = u1, u2, . . . , uN lub U = 1, 2, . . . , N.
Liczbę N ∈ N nazywamy liczebnościąpopulacji.
Przykłady
Zbiór studentów, którz zdali egamin
Zbiór gospodarstw domowych wPolsce w dniu 1 stycznia bieżącegoroku
Zbiór wyborców
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Metoda reprezentacyjnaPrzedmiotem rozważań metody reprezentacyjnej są metody wyboru prób z populacjiskończonych oraz metody szacowania nieznanych charakterystyk populacji.
Definicja (populacja)
Populacją generalną będziemy nazywaćzbiór wszystkich jednostek badania.
Populacja generalna będzie zapisywana wpostaci:
U = u1, u2, . . . , uN lub U = 1, 2, . . . , N.
Liczbę N ∈ N nazywamy liczebnościąpopulacji.
Przykłady
Zbiór studentów, którz zdali egamin
Zbiór gospodarstw domowych wPolsce w dniu 1 stycznia bieżącegoroku
Zbiór wyborców
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Metoda reprezentacyjnaPrzedmiotem rozważań metody reprezentacyjnej są metody wyboru prób z populacjiskończonych oraz metody szacowania nieznanych charakterystyk populacji.
Definicja (populacja)
Populacją generalną będziemy nazywaćzbiór wszystkich jednostek badania.
Populacja generalna będzie zapisywana wpostaci:
U = u1, u2, . . . , uN lub U = 1, 2, . . . , N.
Liczbę N ∈ N nazywamy liczebnościąpopulacji.
Przykłady
Zbiór studentów, którz zdali egamin
Zbiór gospodarstw domowych wPolsce w dniu 1 stycznia bieżącegoroku
Zbiór wyborców
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Definicja (cecha statystyczna)
Cechą statystyczną nazywamy funkcję Y:
Y : U → R
Wartość cechy dla j–tej jednostki badania,tzn. Y(uj), oznaczamy przez Yj
Przykłady
ocena z egzaminu:Y(student) = ocena z egzaminu
dochody gospodarstwa domowego:Y(gospodarstwo domowe) = dochód
Definicja (parametr populacji)
Parametrem populacji U nazywamy wektorY = [Y1, Y2, . . . , YN ]
Definicja (przestrzeń parametrów)
Zbiór możliwych parametrów populacji Unazywamy przestrzenią parametrów ioznaczamy przez Ω
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Definicja (cecha statystyczna)
Cechą statystyczną nazywamy funkcję Y:
Y : U → R
Wartość cechy dla j–tej jednostki badania,tzn. Y(uj), oznaczamy przez Yj
Przykłady
ocena z egzaminu:Y(student) = ocena z egzaminu
dochody gospodarstwa domowego:Y(gospodarstwo domowe) = dochód
Definicja (parametr populacji)
Parametrem populacji U nazywamy wektorY = [Y1, Y2, . . . , YN ]
Definicja (przestrzeń parametrów)
Zbiór możliwych parametrów populacji Unazywamy przestrzenią parametrów ioznaczamy przez Ω
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Definicja (cecha statystyczna)
Cechą statystyczną nazywamy funkcję Y:
Y : U → R
Wartość cechy dla j–tej jednostki badania,tzn. Y(uj), oznaczamy przez Yj
Przykłady
ocena z egzaminu:Y(student) = ocena z egzaminu
dochody gospodarstwa domowego:Y(gospodarstwo domowe) = dochód
Definicja (parametr populacji)
Parametrem populacji U nazywamy wektorY = [Y1, Y2, . . . , YN ]
Definicja (przestrzeń parametrów)
Zbiór możliwych parametrów populacji Unazywamy przestrzenią parametrów ioznaczamy przez Ω
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Definicja (cecha statystyczna)
Cechą statystyczną nazywamy funkcję Y:
Y : U → R
Wartość cechy dla j–tej jednostki badania,tzn. Y(uj), oznaczamy przez Yj
Przykłady
ocena z egzaminu:Y(student) = ocena z egzaminu
dochody gospodarstwa domowego:Y(gospodarstwo domowe) = dochód
Definicja (parametr populacji)
Parametrem populacji U nazywamy wektorY = [Y1, Y2, . . . , YN ]
Definicja (przestrzeń parametrów)
Zbiór możliwych parametrów populacji Unazywamy przestrzenią parametrów ioznaczamy przez Ω
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Definicja (Funkcja parametryczna)
Funkcją parametryczną nazywamy funkcję T : Ω→ R
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Definicja (Funkcja parametryczna)
Funkcją parametryczną nazywamy funkcję T : Ω→ R
Przykład (1/2)
Populacja=student1, student2, student3Cecha=ocena z egzaminuParametr=[2, 4, 5]Przestrzeń parametrów
Ω = 1, 2, 3, 4, 5 × 1, 2, 3, 4, 5 × 1, 2, 3, 4, 5
Zauważmy, że[2, 4, 5] ∈ Ω
Przykład funkcji parametrycznej T : Ω→ R:
T (Y1, Y2, Y3) =1
3
3∑i=1
Yi
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Definicja (Funkcja parametryczna)
Funkcją parametryczną nazywamy funkcję T : Ω→ R
Przykład (2/2)
Wartość globalna cechy Y: Y =N∑i=1
Yi
Średnia cechy Y: Y = 1N
N∑i=1
Yi
Wariancja cechy Y: S2 = 1N−1
N∑i=1
(Yi − Y )2
Minimalna wartość cechy Y: Ymin = minY1, . . . , YNMaksymalna wartość cechy Y: Ymax = maxY1, . . . , YN
Iloraz wartości globalnych cech X ,Y: R =Y
X
Kowariancja cech X ,Y: Sxy = 1N−1
N∑j=1
(Xj − X)(Yj − Y )
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Rodzaje prób
Definicja (próba uporządkowana)
Próbą uporządkowaną s o liczebności n z populacji U nazywamy wektor
s = [j1, j2, . . . , jn] ∈ Un
Dla podkreślenia, że liczebność n dotyczy próby s będziemy ją oznaczać przez n(s).Zbiór wszystkich uporządkowanych prób będziemy oznaczać przez S
Definicja (próba nieuporządkowana)
Próbą nieuporządkowaną s′ o liczebności ν z populacji U nazywamy zbiór
s′ ⊂ U
Dla podkreślenia, że liczebność ν dotyczy próby s będziemy ją oznaczać przez ν(s).Zbiór wszystkich nieuporządkowanych prób będziemy oznaczać przez S ′
Metoda reprezentacyjna
Podstawowe pojęcia
Populacja, cecha, parametr, próba
Rodzaje prób
Definicja (próba uporządkowana)
Próbą uporządkowaną s o liczebności n z populacji U nazywamy wektor
s = [j1, j2, . . . , jn] ∈ Un
Dla podkreślenia, że liczebność n dotyczy próby s będziemy ją oznaczać przez n(s).Zbiór wszystkich uporządkowanych prób będziemy oznaczać przez S
Definicja (próba nieuporządkowana)
Próbą nieuporządkowaną s′ o liczebności ν z populacji U nazywamy zbiór
s′ ⊂ U
Dla podkreślenia, że liczebność ν dotyczy próby s będziemy ją oznaczać przez ν(s).Zbiór wszystkich nieuporządkowanych prób będziemy oznaczać przez S ′
Metoda reprezentacyjna
Podstawowe pojęcia
Plan losowania, schemat losowania, operat losowania
Definicja (plan losowania)
Planem losowania nazywamy miarę prawdopodobieństwa p określoną na zbiorze S :
p(s) ≥ 0 (∀s ∈ S )∑s∈S
p(s) = 1
Definicja (pradopodobieństwo k−tego rzędu)
Prawdopodobieństwo pierwszego rzędu: πj =∑s3j
p(s)
Prawdopodobieństwo drugiego rzędu: πj,k =∑s3j,k
p(s)
Prawdopodobieństwo k–tego rzędu: πj1,...,jk =∑
s3j1,...,jkp(s)
Zapis∑s3j,k
oznacza, że sumowanie odbywa się potakich s ∈ S , które zawierają
jednostki j, k.
Metoda reprezentacyjna
Podstawowe pojęcia
Plan losowania, schemat losowania, operat losowania
Definicja (plan losowania)
Planem losowania nazywamy miarę prawdopodobieństwa p określoną na zbiorze S :
p(s) ≥ 0 (∀s ∈ S )∑s∈S
p(s) = 1
Definicja (pradopodobieństwo k−tego rzędu)
Prawdopodobieństwo pierwszego rzędu: πj =∑s3j
p(s)
Prawdopodobieństwo drugiego rzędu: πj,k =∑s3j,k
p(s)
Prawdopodobieństwo k–tego rzędu: πj1,...,jk =∑
s3j1,...,jkp(s)
Zapis∑s3j,k
oznacza, że sumowanie odbywa się potakich s ∈ S , które zawierają
jednostki j, k.
Metoda reprezentacyjna
Podstawowe pojęcia
Plan losowania, schemat losowania, operat losowania
Definicja (parametry efektywnej liczebności próby)
Oczekiwana efektywna liczebność próby: ν = E[ν(S)] =∑s∈S
ν(s)p(s)
Wariancja efektywnej liczebności próby: D2[ν(S)] =∑s∈S
(ν(s)− ν)2p(s)
ν(S) oznacza zmienną losową, która przyjmuje wartość ν(s) z prawdopodobieństwemp(s)
Definicja (schemat losowania)
Schematem losowania próby nazywamy proces wyboru (jedna po drugiej) jednostek zpopulacji U ze zgóry ustalonym prawdopodobieństwem wyboru dla poszczególnychjednostek w każdym ciągnieniu.
Metoda reprezentacyjna
Podstawowe pojęcia
Plan losowania, schemat losowania, operat losowania
Definicja (parametry efektywnej liczebności próby)
Oczekiwana efektywna liczebność próby: ν = E[ν(S)] =∑s∈S
ν(s)p(s)
Wariancja efektywnej liczebności próby: D2[ν(S)] =∑s∈S
(ν(s)− ν)2p(s)
ν(S) oznacza zmienną losową, która przyjmuje wartość ν(s) z prawdopodobieństwemp(s)
Definicja (schemat losowania)
Schematem losowania próby nazywamy proces wyboru (jedna po drugiej) jednostek zpopulacji U ze zgóry ustalonym prawdopodobieństwem wyboru dla poszczególnychjednostek w każdym ciągnieniu.
Metoda reprezentacyjna
Podstawowe pojęcia
Plan losowania, schemat losowania, operat losowania
Definicja (parametry efektywnej liczebności próby)
Oczekiwana efektywna liczebność próby: ν = E[ν(S)] =∑s∈S
ν(s)p(s)
Wariancja efektywnej liczebności próby: D2[ν(S)] =∑s∈S
(ν(s)− ν)2p(s)
ν(S) oznacza zmienną losową, która przyjmuje wartość ν(s) z prawdopodobieństwemp(s)
Definicja (schemat losowania)
Schematem losowania próby nazywamy proces wyboru (jedna po drugiej) jednostek zpopulacji U ze zgóry ustalonym prawdopodobieństwem wyboru dla poszczególnychjednostek w każdym ciągnieniu.
Przykład (1/2): Losowanie proste ze zwracaniem (lpzz)
Niech u, u1, u2, . . . , ui−1 ∈ U oraz U ma rozmiar N
Au–zdarzenie oznaczające, że w i−tym ciągnięciu wylosowaliśmy element u
Au1,...,ui−1–zdarzenie oznaczające, że w poprzednich ciągnięciach (od 1 do i− 1)wyciągnęliśmy elementy u1, . . . , ui−1
W losowaniu ze zwracaniem zachodzi P (Au|Au1,...,ui−1 ) = 1N
dla dowolnychu, oraz u1, . . . , ui−1.
Metoda reprezentacyjna
Podstawowe pojęcia
Plan losowania, schemat losowania, operat losowania
Definicja (parametry efektywnej liczebności próby)
Oczekiwana efektywna liczebność próby: ν = E[ν(S)] =∑s∈S
ν(s)p(s)
Wariancja efektywnej liczebności próby: D2[ν(S)] =∑s∈S
(ν(s)− ν)2p(s)
ν(S) oznacza zmienną losową, która przyjmuje wartość ν(s) z prawdopodobieństwemp(s)
Definicja (schemat losowania)
Schematem losowania próby nazywamy proces wyboru (jedna po drugiej) jednostek zpopulacji U ze zgóry ustalonym prawdopodobieństwem wyboru dla poszczególnychjednostek w każdym ciągnieniu.
Przykład (2/2): Losowanie proste bez zwracania (lpbz)
W losowaniu bez zwracania zachodzi
P (Au|Au1,...,ui−1 ) =1
N − (i− 1)dla u /∈ u1, . . . , ui−1
orazP (Au|Au1,...,ui−1 ) = 0 w przeciwnym przypadku.
Metoda reprezentacyjna
Podstawowe pojęcia
Plan losowania, schemat losowania, operat losowania
Prawdopodobieństwa pierwszego i drugiego rzędu w typowych schematach losowania
Prawdopodobieństwa pierwszego rzędu w losowaniach prostychπj – prawdopodobieństwo wylosowania j–tego elementu w próbie1− πj – prawdopodobieństwo niewylosowania j–tego elementu w próbie
Pobieramy próbę n – elementową. Losujemy ze zwracaniem.
1− πj = (1−1
N)n
Pobieramy próbę n – elementową. Losujemy bez zwracania.
πj =
(N−1n−1
)(Nn
) =n
N
Metoda reprezentacyjna
Podstawowe pojęcia
Plan losowania, schemat losowania, operat losowania
Prawdopodobieństwa pierwszego i drugiego rzędu w typowych schematach losowania
Losowanie z prawdopodobieństwami proporcjonalnymi do wartości cechu X i zezwracaniem (lppxzz)
Niech składowe parametru [X1, . . . , XN ] będą większe od zera. Określamyprawdopodobieństwo pj , j = 1, . . . , N, wylosowania j–tego elementu populacjinastępująco:
pj =Xj
X
Zgodnie z zadanym rozkładem prawdopdobieństwa losujemy próbę n−elementową.Ai−zdarzenie polegające na tym, że i−ty elment nie pojawi się w próbie.Stąd
πij = 1− P (Ai ∪Aj) = 1− P (Ai)− P (Aj) + P (Ai ∩Aj) =
= 1− (1− pi)n − (1− pj)n + (1− pi − pj)n
Zauważmy: Ai ∩Aj− zdarzenie polegające na tym, że i−ty oraz j−ty elment niepojawi się w próbie.
Metoda reprezentacyjna
Podstawowe pojęcia
Plan losowania, schemat losowania, operat losowania
Definicja (operat losowania)
Operatem losowania nazywamy wykaz jednostek badania lub ich zespołów, zwanychjednostkami losowania. Każdej jednostce jest przyporządkowany identyfikator. Jeżelilosujemy jednostki badania, mówimy o losowaniu indywidualnym, jeżeli zespoły, ozespołowym.
Definicja (przestrzeń prób)
Niech U = 1, 2, . . . , N. Możemy wówczas przyjąć, że Ω = Ω1 × . . .ΩN . NiechΩs = Ωj1 × . . .× Ωjn dla s = (j1, . . . , jn) ∈ S . Zbiór
P =⋃s∈S
Ωs
nazywamy przestrzenią prób.
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Definicja (statystyka)
Funkcję t : P → R nazywamy statystyką.
Definicja (estymator)
Niech T : Ω→ R oznacza funkcję parametryczną oraz Θ = T (Ω). Statystykęt : P → Θ nazywamy estymatorem funkcji parametrycznej T . Jeśli Y ∈ P, to t(Y )nazywamy oceną funkcji parametrycznej T .
Estymatory
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Definicja (statystyka)
Funkcję t : P → R nazywamy statystyką.
Definicja (estymator)
Niech T : Ω→ R oznacza funkcję parametryczną oraz Θ = T (Ω). Statystykęt : P → Θ nazywamy estymatorem funkcji parametrycznej T . Jeśli Y ∈ P, to t(Y )nazywamy oceną funkcji parametrycznej T .
EstymatoryEstymator liniowy jednorodny
t(Ys) =s∑i=1
wiYji
dla s = (j1, j2, . . . , jn), Ys = (Yj1 , . . . , Yjn) oraz ustalonych w1, w2, . . . , wn ∈ R
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Definicja (statystyka)
Funkcję t : P → R nazywamy statystyką.
Definicja (estymator)
Niech T : Ω→ R oznacza funkcję parametryczną oraz Θ = T (Ω). Statystykęt : P → Θ nazywamy estymatorem funkcji parametrycznej T . Jeśli Y ∈ P, to t(Y )nazywamy oceną funkcji parametrycznej T .
EstymatoryEstymator Horvitza–Thompsona: yHT (plan lppbz)
t(Ys′ ) =1
N
n∑i=1
Yjiπji
dla s′ = j1, j2, . . . , jn, Ys′ = (Yj1 , . . . , Yjn ).
Oznaczenie: πi =∑s′3i p(s
′)
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Definicja (statystyka)
Funkcję t : P → R nazywamy statystyką.
Definicja (estymator)
Niech T : Ω→ R oznacza funkcję parametryczną oraz Θ = T (Ω). Statystykęt : P → Θ nazywamy estymatorem funkcji parametrycznej T . Jeśli Y ∈ P, to t(Y )nazywamy oceną funkcji parametrycznej T .
EstymatoryEstymator Hansena–Hurwitza: yHH (plan lppxzz)
t(Ys) =1
N
n∑i=1
Yji
npji=X
n
n∑i=1
YjiXji
dla s = (j1, j2, . . . , jn), Ys = (Yj1 , . . . , Yjn)
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Parametry estymatora
Definicja (estymator nieobciążony)
Niech Y oznacza parametr populacji oraz S zmienną losową, która przyjmuje wartośćs ∈ S z prawdopodobieństwem p(s), gdzie p jest planem losowania. Estymator tnazywamy nieobciążonym dla funkcji parametrycznej T , jeżeli
Ep(t(YS)) =∑s∈S
t(Ys)p(s) = T (Y)
Wartość oczekiwaną Ep(t(YS)) będziemy dla uproszczenia oznaczać przez Ep(t) lubprzez E(t).
Jeżeli estymator jest obciążony, to różnica Ep(t(YS))− T (Y) nazywa się obciążeniemestymatora. Różnicę tę będziemy oznaczać przez B(t).
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Parametry estymatora
Definicja (wariancja estymatora)
Niech Y oznacza parametr populacji oraz S zmienną losową, która przyjmuje wartośćs ∈ S z prawdopodobieństwem p(s), gdzie p jest planem losowania. Wariancjąestymatora t nazywamy wyrażenie
D2p(t(YS)) =
∑s∈S
[t(Ys)− Ep(t(YS))]2p(s)
=∑s∈S
t(Ys)2p(s)− [Ep(t(YS))]2
Wariancję D2p(t(YS)) będziemy oznaczać przez D2
p(t) lub D2(t).
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Parametry estymatora
Definicja (błąd średniokwadratowy)
Przy oznaczeniach, jak w powyższych definicjach, średnim błędemśredniokwadratowym estymatora t jest wyrażenie
MSEp(t) =∑s∈S
(t(Ys)− T (Y))2p(s)
= D2p(t(YS)) + [B(t)]2
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Wartość oczekiwana estymatora Horvitza-Thompsona
TwierdzenieEstymator Horvitza Thompsona jest nieobciążony
Pomiń dowód
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Wartość oczekiwana estymatora Horvitza-Thompsona
TwierdzenieEstymator Horvitza Thompsona jest nieobciążony
Dowód
Ep(yHT ) =∑s′∈S ′
1
N
∑j∈s′
Yj
πj
p(s′)
=
N∑j=1
∑s′3j
1
N
Yj
πjp(s′)
=N∑j=1
1
N
Yj
πj
∑s′3j
p(s′) = Y
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieWariancja estymatora Horvitza-Thompsona wynosi
D2p(yHT ) =
1
N2
N∑j=1
Y 2j
(1
πj− 1
)+
∑1≤j,k≤N ; j 6=k
(πjk
πjπk− 1
)YjYk
Pomiń dowód
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieWariancja estymatora Horvitza-Thompsona wynosi
D2p(yHT ) =
1
N2
N∑j=1
Y 2j
(1
πj− 1
)+
∑1≤j,k≤N ; j 6=k
(πjk
πjπk− 1
)YjYk
Dowód
D2p(yHT ) = Ep[(yHT )2]− [Ep(yHT )]2 = Ep
1
N
∑j∈S′
Yj
πj
2
− [Y ]2 =
=1
N2E
∑j∈S′
(Yj
πj
)2
+∑
j,k∈S′j 6=k
YjYk
πjπk
− [Y ]2 =
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieWariancja estymatora Horvitza-Thompsona wynosi
D2p(yHT ) =
1
N2
N∑j=1
Y 2j
(1
πj− 1
)+
∑1≤j,k≤N ; j 6=k
(πjk
πjπk− 1
)YjYk
Dowód
=1
N2
N∑j=1
Y 2j
π2j
∑s′3j
p(s′) +∑
1≤j,k≤Nj 6=k
YjYk
πjπk
∑s′3j,k
p(s′)
− [Y ]2 =
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieWariancja estymatora Horvitza-Thompsona wynosi
D2p(yHT ) =
1
N2
N∑j=1
Y 2j
(1
πj− 1
)+
∑1≤j,k≤N ; j 6=k
(πjk
πjπk− 1
)YjYk
Dowód
=1
N2
N∑j=1
Y 2j
πj+
∑1≤j,k≤N
j 6=k
πjk
πjπkYjYk
− [Y ]2 =
=1
N2
N∑j=1
Y 2j
(1
πj− 1
)+
∑1≤j,k≤N ; j 6=k
(πjk
πjπk− 1
)YjYk
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi
D2(yHT ) =1
2N2
∑1≤j,k≤N
j 6=k
(πjπk − πjk)
(Yj
πj−Yk
πk
)2
Pomiń dowód
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi
D2(yHT ) =1
2N2
∑1≤j,k≤N
j 6=k
(πjπk − πjk)
(Yj
πj−Yk
πk
)2
Dowód
ν(s) =N∑j=1
Is(j)
Epν(S) =N∑j=1
Ep(IS(j)) =N∑j=1
∑s3j
p(s) =N∑j=1
πj
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi
D2(yHT ) =1
2N2
∑1≤j,k≤N
j 6=k
(πjπk − πjk)
(Yj
πj−Yk
πk
)2
Dowód
∑1≤j,k≤N
j 6=k
πjk =∑
1≤j,k≤Nj 6=k
Ep (IS(j)IS(k)) = Ep
∑1≤j,k≤N
j 6=k
IS(j)IS(k)
=
= Ep
N∑j=1
IS(j)
2
−N∑j=1
I2S(j)
= Ep
ν2(S)−N∑j=1
IS(j)
=
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi
D2(yHT ) =1
2N2
∑1≤j,k≤N
j 6=k
(πjπk − πjk)
(Yj
πj−Yk
πk
)2
Dowód
= Ep(ν2(S)− ν(S)
)= Ep(ν2(S))− Ep(ν(S)) =
= D2p(ν(S)) + [Ep(ν(S))]2 − Ep(ν(S))
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi
D2(yHT ) =1
2N2
∑1≤j,k≤N
j 6=k
(πjπk − πjk)
(Yj
πj−Yk
πk
)2
DowódDla ν(S) ≡ ν mamy zatem tożsamości:
ν =N∑j=1
πj ,∑
1≤j,k≤Nj 6=k
πjk = ν2 − ν
N∑j=1j 6=k
πjk =N∑
j=1j 6=k
Ep(IS(j)IS(k)) = Ep(IS(k)N∑
j=1j 6=k
IS(j)) =
= Ep(IS(k)[ν(S)− IS(k)]) = (ν − 1)πk
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi
D2(yHT ) =1
2N2
∑1≤j,k≤N
j 6=k
(πjπk − πjk)
(Yj
πj−Yk
πk
)2
Dowód
1
N2
∑1≤j,k≤N
j 6=k
(πjπk − πjk)
(Yj
πj−Yk
πk
)2
=
=1
N2
∑1≤j,k≤N
j 6=k
(πkY 2j
πj+ πj
Y 2k
πk− πjk
Y 2j
π2j
− πjkY 2k
π2k
− 2YjYk + 2πjkYjYk
πjπk
)
=2
N2
∑1≤j,k≤N
j 6=k
(πkY 2j
πj− πjk
Y 2k
π2k
− YjYk + πjkYjYk
πjπk
)=?
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi
D2(yHT ) =1
2N2
∑1≤j,k≤N
j 6=k
(πjπk − πjk)
(Yj
πj−Yk
πk
)2
DowódPonieważ ∑
1≤j,k≤Nj 6=k
πkY 2j
πj=
N∑j=1
Y 2j
πj
N∑k=1k 6=j
πk =N∑j=1
Y 2j
πj(ν − πj) =
= νN∑j=1
Y 2j
πj−
N∑j=1
Y 2j
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi
D2(yHT ) =1
2N2
∑1≤j,k≤N
j 6=k
(πjπk − πjk)
(Yj
πj−Yk
πk
)2
Dowódoraz ∑
1≤j,k≤Nj 6=k
πjkY 2j
π2j
=N∑j=1
Y 2j
π2j
N∑k=1k 6=j
πjk =N∑j=1
Y 2j
π2j
πj(ν − 1) =
= (ν − 1)N∑j=1
Y 2j
πj
∑1≤j,k≤N
j 6=k
YjYk = Y 2 −N∑j=1
Y 2j
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieDla ν(S) ≡ ν wariancja estymatora Horwitza–Thompsona wynosi
D2(yHT ) =1
2N2
∑1≤j,k≤N
j 6=k
(πjπk − πjk)
(Yj
πj−Yk
πk
)2
Dowódmamy
=?2
N2
ν N∑j=1
Y 2j
πj−
N∑j=1
Y 2j − (ν − 1)
N∑j=1
Y 2j
πj− Y 2 +
N∑j=1
Y 2j +
∑1≤j,k≤N
j 6=k
πjkYjYk
πjπk
=2
N2
N∑j=1
Y 2j
πj+
∑1≤j,k≤N
j 6=k
πjk
πjπkYjYk − Y 2
=2
N2
N∑j=1
Y 2j
πj+
∑1≤j,k≤N
j 6=k
πjk
πjπkYjYk
− 2[Y ]2 = 2D2(yHT )
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
TwierdzenieJeżeli πj > 0 dla j = 1, . . . , N oraz πij > 0 dla i, j = 1, . . . , N, j 6= k, to statystyka
D2(yHT ) =1
N2
∑j∈S′
Y 2j
πj
(1
πj− 1
)+
∑1≤j,k∈S′
j 6=k
(πjk
πjπk− 1
)YjYk
πj,k
jest nieobciążonym estymatorem wariancji D2(yHT ).
Dla ν(S′) ≡ ν ma on postać
D2(yHT ) =1
2N2
∑j,k∈S′j 6=k
πjπk − πjkπjk
(Yj
πj−Yk
πk
)2
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
WniosekDla n−elementowej próby wylosowanej według planu lpbz (losowanie proste bezzwracania)
D2(yHT ) =(
1−n
N
) s2n,
gdzie
s2 =1
n− 1
∑i∈S′
(Yi − YS′ )2, YS′ =1
n
∑i∈S′
Yi
Uwaga. Jeżeli zmienna S′ zrealizuje się jako s′ = j1, . . . , jn, to dla uproszczeniabędziemy oznaczać (Yj1 , . . . , Yjn ) przez (y1, . . . , yn). Wtedy możemy zapisać
s2 =1
n− 1
n∑i=1
(yi − y)2, y =1
n
n∑i=1
yi
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Wartość oczekiwana estymatora Hansena–Hurwitza (plan lppxzz, n(s) ≡ n)
Ze względu na sposób losowania estymator ten można zapisać w postaci
yHH =1
N
n∑i=1
YJinpJi
gdzie J1, J2, . . . , Jn są niezależnymi zmiennymi losowymi o tym samym rozkładzie
p :1 2 · · · Np1 p2 · · · pN
Wtedy Ep(yHH) = 1Nn
n∑i=1
Ep
(YJipJi
)= 1
Nn
n∑i=1
N∑j=1
Yj
pjpj = Y
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Wariancja estymatora Hansena–Hurwitza (plan lppxzz, n(s) ≡ n)
D2(yHH) = Ep(yHH)2 − (Ep(yHH))2 = Ep
(n∑i=1
YJipJi
)2
− (Y )2 =
=1
(Nn)2Ep
n∑i=1
Y 2Ji
p2Ji
+∑
1≤j,k≤nj 6=k
YJiYJkpJipJk
− (y)2 =
=1
(Nn)2
n∑i=1
N∑k=1
pkY 2k
p2k
+∑
1≤j,k≤nj 6=k
E
(YJipJi
)E
(YJkpJk
)− (y)2 =
=1
(Nn)2
(n
N∑k=1
Y 2k
pk+ n(n− 1)N2(Y )2
)− (Y )2 =
=1
n
N∑k=1
pk
(Yk
Npk− Y
)2
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Zauważmy, że dla pk = YkY
= Yk∑k Yk
zachodzi D2(yHH) = 0.
Jeżeli dla k = 1, 2, . . . , N mamy pk = 1/N , to
yHH = y =1
n
n∑i=1
yi
oraz
D2(yHH) = D2(y) =1
n·
1
N
N∑k=1
(Yk − Y )2
Uogólniony estymator różnicy dla średniej
yGD =1
N
∑i∈S′
Yi − Eiπi
+ E
gdzie E1, . . . , EN są dowolnymi stałymi. W szczególności dlaEi = cXi, i = 1, . . . , N , gdzie Xi są wartościami cechy dodatkowej X oraz c jeststałą, estymator ten przyjmuje postać:
yGD =1
N
∑i∈S′
Yi
pi+ c
X − 1
N
∑i∈S′
Xi
πi
= yHT + c(X − xHT )
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Zatem E(yGD) = Y oraz
D2(yGD) = D2(yHT ) + c2D2(xHT )− 2cCov(xHT , yHT ),
która jest minimalizowana dla c =Cov(xHT ,yHT )
D2(xHT ).
Zatem najmniejsza wariancja wynosi:
D(yGD) = D2(yHT )[1− %2(xHT , yHT )]
Estymator Khamisa yK (losowanie zgodnie ze schematem lpzz)
Niech s′ = r(s), gdzie r jest funkcją redukcyjną
yK =1
ν(S′)
∑j∈S′
Yj
Estymator Khamisa jest nieobciążony: E(yK) = E(E(yK |ν(S′))) = E(Y ) = Y
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
Wariancja
D2(yK) = D2
1
ν(S′)
∑j∈S′
Yj
=
= D2
E 1
ν(S′)
∑j∈S′
Yj
∣∣∣∣∣∣ ν(S′)
+ E
D2
1
ν(S′)
∑j∈S′
Yj
∣∣∣∣∣∣ ν(S′)
=
= D2(Y ) + E
[(1
ν(S′)−
1
N
)Nσ2
N − 1
]
gdzie σ2 =1
N
N∑i=1
(Yi − Y )2
D2(yK) =
(E
[1
ν(S′)
]−
1
N
)Nσ2
N − 1>
(1
n−
1
N
)S2 = D2(yHT )
gdzie D2(yHT ) wyznaczone w przypadku: lpbz, ν ≡ n
Metoda reprezentacyjna
Podstawowe pojęcia
Statystyka, estymator
W przypadku lpzz i rozmiaru próby n mamy D2(yHH) = σ2/nZauważmy:
(E
[1
ν(S′)
]−
1
N
)N
N − 1<
1
n⇐⇒
NE[
nν(S′)
]− n
N − 1< 1
ZatemD2(yHH) > D2(yK) > D2(yHT )
Metoda reprezentacyjna
Podstawowe pojęcia
Strategia losowania
Definicja (strategia losowania)
Strategią losowania nazywamy parę (p, t), gdzie p jest planem losowania, natomiast tjest estymatorem funkcji parametrycznej T . Strategię losowania będziemy oznaczaćprzez H(p, t). Jeśli estymator t jest nieobciążony, powiemy o strategii, że jestnieobciążona.
Definicja (porównanie strategii)
Powiemy, że startegia H1(p1, t1) jest co najmniej tak dobra jak strategia H2(p2, t2),jeżeli
MSEp1 (t1) ≤MSEp2 (t2)
dla wszystkich Y ∈ Ω. Jeżeli dodatkowo
MSEp1 (t1) < MSEp2 (t2)
dla pewnego Y ∈ Ω, to mówimy, że strategia H1(p1, t1) jest lpesza od strategiiH2(p2, t2)
Przypomnienie:MSEp(t) =
∑s∈S
(t(Ys)− T (Y))2p(s)
Metoda reprezentacyjna
Podstawowe pojęcia
Strategia losowania
PrzykładRozmiar próby: n
MSElpzz(yHH) > MSElpzz(yK) > MSElpbz(yHT )
Metoda reprezentacyjna
Wybrane zagadnienia
Przedział ufności dla średniej, minimalna liczebność próby
ProblemJak ustalić liczebność próby n, aby błąd szacunku nie przekroczył zadanej wielkości dze z góry ustalonym prawdopodobieństwem 1− α?
P (|tn − T | < d) = 1− α
Definicja (minimalna liczebność próby)
Wielkość d nazywana jest maksymalnym dopuszczalnym błędem szacunku, natomiastδ = d/T maksymalnym dopuszaczalnym względnym błędem szacunku
PrzykładW przypadku szacowania Y na podstawie próby wylosowanej według schematu lpbzmamy
P (|y − Y | < d) = P (y − d < Y < y + d) = 1− α
P (y − u1−α/2D(y) < Y < y + u1−α/2D(y)) ≈ 1− α
gdzie u1−α/2 jest kwantylem rozkładu normalnegorzędu (1− α/2) oraz
D2(y) =
(1
n−
1
N
)S2
Metoda reprezentacyjna
Wybrane zagadnienia
Przedział ufności dla średniej, minimalna liczebność próby
Zatemd = u1−α/2D(y)
δ = u1−α/2D(y)
Y
oraz minimalna liczebność próby n = [n?] + 1
n? =Nu2
1−α/2S2
Nd2 + u21−α/2S
2=
Nu21−α/2V
2
Nδ2 + u21−α/2V
2
gdzie V = S/Y – współczynnik zmiennościPrzy wyznaczaniu minimalnej próby parametry, których nie znamy zastępujemy ichoszacowaniami
Metoda reprezentacyjna
Wybrane zagadnienia
Estymatory złożone
Definicja ( estymator produktowy (iloczynowy))
Statystykę
yp =xy
X, X > 0
nazywamy estymatorem produktowym (iloczynowym) średniej Y
TwierdzenieJeżeli n–elementowa próba wylosowana została według schematu lpbz zN–elementowej populacji, to
E(yp) = Y + (1− n/N)S2xy
nX+O(n−2)
MSE(yp) =(
1−n
N
) S2y + 2RSxy +R2S2
x
n+O(n−2)
gdzie
Sxy =1
N − 1
N∑j=1
(Xj − X)(Yj − Y )
R =Y
X
Metoda reprezentacyjna
Wybrane zagadnienia
Estymatory złożone
Definicja (estymator ilorazowy)
Statystykę
yq =y
xX = rX
gdzie
r =y
x
nazywamy estymatorem ilorazowym średniej Y .
TwierdzenieJeżeli n–elementowa próba wylosowana została według schematu lpbz zN–elementowej populacji, to
E(yq) = Y + (1− n/N)RS2
x − SxynX
+O(n−2)
MSE(yq) =(
1−n
N
) S2y − 2RSxy +R2S2
x
n+O(n−2)
Metoda reprezentacyjna
Wybrane zagadnienia
Estymatory złożone
Definicja (estymator liniowy)
Statystykęylr = y + b(X − x)
gdzie
b =s2xy
s2x=
∑ni=1(xi − x)(yi − y)∑n
i=1(xi − x)2
nazwywamy estymatorem liniowym regresyjnym
TwierdzenieJeżeli n–elementowa próba wylosowana została według schematu lpbz zN–elementowej populacji, to
E(ylr) = Y +(
1−n
N
)C +O(n−2)
gdzie
C =
BN∑j=1
(Yj − Y )3 −N∑j=1
(Xj − X)2(Yj − Y )
(n− 1)(N − 1)S2x
Metoda reprezentacyjna
Wybrane zagadnienia
Estymatory złożone
B =
N∑j=1
(Xj − X)(Yj − Y )
N∑j=1
(Xj − X)2
oraz
MSE(ylr) =(
1−n
N
) S2y(1− ρ2
xy)
n+O(n−2)
gdzie
ρxy =Sxy
SxSy= B
Sx
Sy
Metoda reprezentacyjna
Wybrane zagadnienia
Losowanie warstwowe
Zagadnienie (estymacja wartości średniej w losowaniu warstwowym)
Badamy cechę mierzalną Y. Populacja generalna o liczności N podzielona jest na Lwarstw o licznościach Nh, h = 1, 2, . . . , L, przy czym
L∑h=1
Nh = N.
Frakcja elementów w warstwie h wynosi Wh = Nh/N . Z każdej warstwy oddzielnielosujemy nh elementów do próby. Dla próby n elementowej spełnione jest
nh =Nh
Nn = Whn, h = 1, 2, . . . , L.
Metoda reprezentacyjna
Wybrane zagadnienia
Losowanie warstwowe
Z próby otrzymujemy wyniki
yih, i = 1, 2, . . . , nh, h = 1, 2, . . . , L.
Na podstawie próby szacujemy średnią wartość Y populacji w następujący sposób:
yw =1
N
L∑h=1
Nhyh =L∑h=1
Whyh,
gdzie
yh =1
nh
nh∑i=1
yih
Wariancja tego estymatora wynosi:
D2(yw) =
(1
n−
1
N
) L∑h=1
WhS2h,
gdzie S2h jest wariancją w h–tej warstwie (jeżeli jej nie znamy, to z dużej próby można
ją oszacować za pomocą s2h).
Metoda reprezentacyjna
Wybrane zagadnienia
Losowanie warstwowe
Jeżeli badana cecha w populacji ma rozkład zbliżony do normalnego lub gdy przyinnym rozkładzie próba jest duża, to przybliżony przedział ufności dla średniej mapostać (
yw − u1−α/2D(yw), yw + u1−α/2D(yw))
Minimalna liczebność próby potrzebna do oszacowania średniej z maksymalnymdopuszczalnym błędem szacunku d wynosi
n =
L∑h=1
WhS2h
d2
u21−α/2
+1
N
L∑h=1
WhS2h
Metoda reprezentacyjna
Wybrane zagadnienia
Losowanie warstwowe
Zagadnienie („optymalna” estymacja wartości średniej w losowaniu warstwowym)
Założenia są identyczne, jak w poprzednim zagadnieniu, z tą różnicą, że
• liczba wylosowanych elementów z h-tej warstwy wynosi
nh =WhShL∑h=1
WhSh
n, h = 1, 2, . . . , L
• wariancja estymatora wynosi
D2(yw) =1
n
(L∑h=1
WhSh
)2
−1
N
L∑h=1
WhS2h
Metoda reprezentacyjna
Wybrane zagadnienia
Losowanie warstwowe
• minimalna liczebność próby wynosi
n =
(L∑h=1
WhSh)2
d2
u21−α/2
+1
N
L∑h=1
WhS2h
Losowanie w zagadnieniu pierwszym nazywamy proporcjonalnym (do wielkościwarstwy), a w zagadnieniu drugim optymalnym (zapewnia najmniejszą wariancjęestymatora)