27
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 1 Λύσεις Ασκήσεων για το μάθημα Στατιστική ΙΙ Έλεγχος Υποθέσεων (2010-11) Πειραιάς, Ιανουάριος 2011, Μ. Κούτρας Μ.Μπούτσικας Λύσεις Ασκήσεων Κεφαλαίου 1 (Παρ. 1.6). Άσκηση 1.1. Έστω X 1 = X ένα τυχαίο δείγμα μεγέθους ν = 1 από μια κατανομή με συνάρτηση πυ- κνότητας 1. 0 , ) (1 ) ; ( < < + = x x x f θ θ θ Για τον έλεγχο της υπόθεσης Η 0 : θ = 1 έναντι της Η 1 : θ = 2 χρησιμοποιούμε την κρίσιμη περιοχή K : X > c, όπου c κατάλληλη σταθερά. (α). Να υπολογισθούν οι πιθανότητες σφάλματος τύπου Ι και τύπου II στην περίπτωση που επιλέγουμε c =1/2. (β). Να βρεθεί η τιμή της σταθεράς c έτσι ώστε η πιθανότητα εμφάνισης σφάλματος τύπου Ι να είναι ίση με 0.19 . Στη συνέχεια να υπολογι- σθεί η πιθανότητα σφάλματος τύπου ΙΙ. (γ). Αν x = 0.8 να κάνετε τον έλεγχο με a = 0.19 μέσω του p-value. Λύση. (α) Ισχύει ότι, ] 1 , 0 [ , 1 ) 1 ( 1 ) ( 1 ) | ( 1 0 = + = = > + c c dx x c F c X P c θ θ θ θ θ , και επομένως, 4 / 3 ) 2 / 1 ( 1 1 ) 1 | ( ] [ 2 2 = = = = > = c c X P I P θ , 8 / 1 ) 2 / 1 ( ) 2 | ( ] [ 3 3 = = = = = c c X P II P θ . (β) Θα είναι 9 . 0 19 . 0 1 19 . 0 ] [ 2 = = = c c I P και 729 . 0 ) 9 . 0 ( ] [ 3 = = II P . (γ) Η H 0 απορρίπτεται όταν Κ: X > c = 0.9. Επειδή εδώ δεν ισχύει η ανισότητα (διότι εδώ η τιμή της Χ από τα δεδομένα είναι x = 0.8) δεν μπορούμε να απορρίψουμε την Η 0 σε ε.σ. a. Ισοδύναμα μπορούμε να πάρουμε απόφαση μέσω του p-value. Θα είναι 36 . 0 8 . 0 1 1 ) 1 | ( 2 2 = = = = > = x x X P p-value θ , το οποίο δεν είναι μικρότερο του a = 0.19 και επομένως, δεν απορρίπτεται η Η 0 σε ε.σ. a = 0.19. Άσκηση 1.2. Έστω X 1 , X 2 ,..., X ν ένα τυχαίο δείγμα από την κανονική κατανομή N(0,σ 2 ). Για τον έλεγχο της υπόθεσης Η 0 : σ 2 = 1 έναντι της Η 1 : σ 2 = 4 χρησιμοποιούμε την κρίσιμη περιοχή = > ν 1 2 . : i i c X Κ (α). Αφού βρεθεί η σταθερά c ώστε ο έλεγχος να έχει πιθανότητα σφάλματος τύπου Ι ίση με a = 5%, να υπολογισθεί η πιθανότητα σφάλματος τύπου ΙΙ. (β). Αν x 1 = 2.3, x 2 = –4.1, x 3 = 1.8, να κά- νετε τον έλεγχο σε ε.σ. a = 5%. Λύση. (α) Αν X i ~ N(0,σ 2 ), η τ.μ. = = ν σ 1 2 ) ( i i X T , ακολουθεί χ 2 κατανομή με ν β.ε. (ως άθροισμα τετραγώνων ν ανεξάρτητων τυπικών κανονικών τ.μ.). Επομένως, για σ = σ 0 = 1,

Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 1

Λύσεις Ασκήσεων για το μάθημα Στατιστική ΙΙ – Έλεγχος Υποθέσεων (2010-11)

Πειραιάς, Ιανουάριος 2011,

Μ. Κούτρας – Μ.Μπούτσικας

Λύσεις Ασκήσεων Κεφαλαίου 1 (Παρ. 1.6). Άσκηση 1.1. Έστω X1 = X ένα τυχαίο δείγμα μεγέθους ν = 1 από μια κατανομή με συνάρτηση πυ-κνότητας

1.0,)(1);( <<+= xxxf θθθ

Για τον έλεγχο της υπόθεσης Η0: θ = 1 έναντι της Η1: θ = 2 χρησιμοποιούμε την κρίσιμη περιοχή K : X > c, όπου c κατάλληλη σταθερά. (α). Να υπολογισθούν οι πιθανότητες σφάλματος τύπου Ι και τύπου II στην περίπτωση που επιλέγουμε c =1/2. (β). Να βρεθεί η τιμή της σταθεράς c έτσι ώστε η πιθανότητα εμφάνισης σφάλματος τύπου Ι να είναι ίση με 0.19 . Στη συνέχεια να υπολογι-σθεί η πιθανότητα σφάλματος τύπου ΙΙ. (γ). Αν x = 0.8 να κάνετε τον έλεγχο με a = 0.19 μέσω του p-value. Λύση. (α) Ισχύει ότι,

]1,0[,1)1(1)(1)|( 1

0∈−=+−=−=> +∫ ccdxxcFcXP

c

θθθθθ ,

και επομένως,

4/3)2/1(11)1|(][ 22 =−=−==>= ccXPIP θ ,

8/1)2/1()2|(][ 33 ====≤= ccXPIIP θ .

(β) Θα είναι 9.019.0119.0][ 2 =⇔=−⇔= ccIP και 729.0)9.0(][ 3 ==IIP .

(γ) Η H0 απορρίπτεται όταν Κ: X > c = 0.9. Επειδή εδώ δεν ισχύει η ανισότητα (διότι εδώ η τιμή της Χ από τα δεδομένα είναι x = 0.8) δεν μπορούμε να απορρίψουμε την Η0 σε ε.σ. a. Ισοδύναμα μπορούμε να πάρουμε απόφαση μέσω του p-value. Θα είναι

36.08.011)1|( 22 =−=−==>= xxXPp-value θ ,

το οποίο δεν είναι μικρότερο του a = 0.19 και επομένως, δεν απορρίπτεται η Η0 σε ε.σ. a = 0.19.

Άσκηση 1.2. Έστω X1, X2,..., Xν ένα τυχαίο δείγμα από την κανονική κατανομή N(0,σ2). Για τον έλεγχο της υπόθεσης Η0: σ2 = 1 έναντι της Η1: σ2 = 4 χρησιμοποιούμε την κρίσιμη περιοχή

∑=

1

2 .:i

i cXΚ

(α). Αφού βρεθεί η σταθερά c ώστε ο έλεγχος να έχει πιθανότητα σφάλματος τύπου Ι ίση με a = 5%, να υπολογισθεί η πιθανότητα σφάλματος τύπου ΙΙ. (β). Αν x1 = 2.3, x2 = –4.1, x3 = 1.8, να κά-νετε τον έλεγχο σε ε.σ. a = 5%.

Λύση. (α) Αν Xi ~ N(0,σ2), η τ.μ.

∑=

σ1

2)(i

iXT ,

ακολουθεί χ2 κατανομή με ν β.ε. (ως άθροισμα τετραγώνων ν ανεξάρτητων τυπικών κανονικών τ.μ.). Επομένως, για σ = σ0 = 1,

Page 2: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 2

)(1)~|()|)(()|(][ 20

220

0201

2

00

1

22 σ

χσσσ νχν

νν cFTcTPHcXPHcXPIPi

i

ii −=>=>=>= ∑∑

==

.

Για να είναι P[I] = a, θα πρέπει

),()( 220

220

acacνν χσχ

σ=⇒=

όπου )(2 aνχ είναι το άνω α-σημείο της χ2 κατανομής με ν β.ε. Συνεπώς (σ12 = 4),

))(():|)(()|(][ 221

20

111

221

20

21

2

11

22 aFHaXPHcXPIIP

i

i

ii νχ

ν

ν

ν

χσσσσχ

σσ

σ ν==≤=≤= ∑∑

==

.

(β). Έχουμε δείγμα μεγέθους ν = 3 με

34.258.1)1.4(3.2 2223

1

2 =+−+=∑=i

ix ,

και .81.7)05.0(1)( 23

220 =⋅== χχσ ν ac Επομένως 23

1 ii x=∑ > c, και απορρίπτουμε την Η0: σ = 1, σε ε.σ. a. Ισοδύναμα, χρησιμοποιώντας το p-value θα έχουμε

000013.0)34.25(1)|34.25( 201

2 ≈−=>= ∑=

νχ

ν

FHXPp-valuei

i .

Μπορούμε να πούμε ότι, μόλις στο 0013.0 % των περιπτώσεων που ισχύει η Η0: σ = 1 λαμβάνου-με ένα τέτοιο δείγμα (και ακόμη πιο ακραίο από αυτό). Με άλλα λόγια, το συγκεκριμένο δείγμα θεωρείται απίθανο να προέρχεται υπό την Η0 και συνεπώς απορρίπτουμε την συγκεκριμένη Η0 (τυπικά, εξετάζουμε αν p-value < a).

Άσκηση 1.5. Έστω X1, X2,..., Xν ένα τυχαίο δείγμα από την κατανομή Ν(μ,1). Για τον έλεγχο της υπόθεσης Η0: μ = μ0 έναντι της Η1: μ = μ0+1 χρησιμοποιείται η επόμενη κρίσιμη περιοχή

Κ: X > c,

όπου c κατάλληλη σταθερά. Να δειχθεί ότι το ελάχιστο μέγεθος ν του δείγματος που απαιτείται ώστε οι πιθανότητες σφαλμάτων τύπου Ι και II του ελέγχου να είναι το πολύ ίσες με α και β αντί-στοιχα, δίνεται από τον τύπο

1])[( 210 +−= −βα zzν

όπου το σύμβολο [x] παριστάνει το ακέραιο μέρος του x.

Λύση. Θα είναι,

acHcXPHcXPIP ≤−

Φ−=−

>−

=>= )/

(1)|//

()|(][ 00

000 νσ

μνσμ

νσμ ,

βνσ

μνσ

μνσ

μ≤

−−Φ=

−−>

−−=≤= )

/1()|

/1

/1()|(][ 0

100

1cHcXPHcXPIIP .

Επομένως,

⎪⎪⎩

⎪⎪⎨

++≤

+≥⇒

⎪⎪⎩

⎪⎪⎨

≤−−

≥−

−− ββ νσμ

νσμ

νσμνσμ

10

0

10

0

1/

1/

zc

zc

zc

zcaa

Page 3: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 3

Παρατηρούμε ότι για να υπάρχει το παραπάνω c θα πρέπει,

1]))([(1 211100 +−≥⇒≤−⇒++≤≤+ −−− βββ σννσσ

νσμ

νσμ zzzzzcz aaa .

όπου σύμφωνα με την εκφώνηση σ = 1.

Λύσεις Ασκήσεων Κεφαλαίου 2 (Παρ. 2.3). Άσκηση 2.1 Έστω τυχαίο δείγμα Χ1, Χ2, …, Χν ~ Ν(μ,σ2), όπου ν = 16, σ = 6 και μ είναι άγνωστη παράμετρος. (α). Να βρεθεί η περιοχή απόρριψης Κ για τον έλεγχο της υπόθεσης

Η0: μ = μ0 έναντι της Η0: μ = μ1

για μ0 = 50, μ1 = 55 σε ε.σ. a = 0.05. (β) Να βρείτε την πιθανότητα σφάλματος τύπου ΙΙ και την ισχύ π(μ1) του παραπάνω ελέγχου. Αν μ0 = 0, μ1 = 1, a = 0.01, σ = 1, να βρεθεί το μέγεθος του δείγματος ν ώστε η ισχύς να είναι τουλάχιστον 1 − β = 0.95. (γ) Να διαπιστώσετε ότι ο έλεγχος που προκύπτει από το ερώτημα (α) είναι ομοιόμορφα ισχυρότατος (ΟΙΕ) για την υπόθεση Η0: μ = μ0 έναντι της Η1: μ > μ0 καθώς και για την υπόθεση Η0: μ ≤ μ0 έναντι της Η1: μ > μ0.

Λύση. (α) Γνωρίζουμε ότι, σύμφωνα με το Λήμμα N-P, ο καλύτερος έλεγχος σε επίπεδο σημα-ντικότητας α για την υπόθεση Η0: μ = μ0 έναντι της Η1: μ = μ1, μ1>μ0, θα έχει περιοχή απόρριψης:

Κ: 47.52645.1166/50

σ/μ 0 >⇔=>

−=

−= XzX

vX

T a .

(β) Θα είναι

=)(IIP )μ=μ|+/σμμ

/σμ()μ=μ|z

/σμ( 12

102

112

0aa z

vvXP

vX −

≤−

=≤− )+

/σμμ(Φ

210

azv

−= .

και

π(μ1)= )/σμμ(Φ)+

/σμμ(Φ1)(1

201

210

aa zv

zv

IIP −−

=−

−=− .

Επίσης

8.15)33.2645.1()μ(μ

)()μ(μ

)(+

σ/μμ

1)+σ/

μμ(Φ1)(

22

01

22

201

21

2

110

101

≈+≈−+

=−−

≥⇔≤−

−≥−

−=

−−

βββ

σσ

βμπ

zzzzvzz

v

zv

aaa

a

(γ) Παρατηρούμε ότι η κρίσιμη περιοχή δεν εξαρτάται από την τιμή μ1 και επομένως η ίδια κρίσι-μη περιοχή μπορεί να χρησιμοποιηθεί και για τον έλεγχο της υπόθεσης

H0: μ = μ0 έναντι της Η1: μ > μ0

(απλή έναντι μονόπλευρης) οδηγώντας και πάλι σε βέλτιστο έλεγχο. Η τιμή της μ1 ωστόσο επη-ρεάζει την P[ΙΙ] καθώς και την ισχύ του ελέγχου. Όταν η μ1 αυξάνεται τότε η P[II] μειώνεται και η ισχύς π(μ1) του ελέγχου αυξάνεται. Επίσης οποιοδήποτε και αν είναι το μ0 παραπάνω, προκύπτει η ίδια κρίσιμη περιοχή Κ: cX > . Επομένως, η ίδια Κ μπορεί να χρησιμοποιηθεί και για τον έλεγ-χο της υπόθεσης

H0: μ ≤ μ0 έναντι της Η1: μ > μ0

(μονόπλευρη έναντι μονόπλευρης) οδηγώντας και πάλι σε βέλτιστο έλεγχο. Το c καθορίζεται :

Page 4: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 4

av

c

v

c

vc zaaHcXPIP =⇔=Φ−=Φ−⇔=>=

−−−

≤≤/

0/

0/0 )(1))(1(sup)|(sup)(sup

00σ

μ

σ

μ

σμ

μμμμ

(Όμοια κατασκ. Έλεγχο H0: μ = μ0 έναντι της Η1: μ < μ0, και H0: μ ≥ μ0 έναντι της Η1: μ < μ0)

Άσκηση 2.2. Επιθυμούμε να εξετάσουμε αν ο μέσος μ ενός κανονικού πληθυσμού N(μ,σ2) είναι μ = 100 (Η0) ή μ > 100 (Η1). Λαμβάνουμε τ.δ. μεγέθους ν = 10, στο οποίο βρίσκουμε μέσο 102=x . (α) Αν σ = 5 να κάνετε τον συγκεκριμένο έλεγχο σε ε.σ. α = 5% (υπόδ. χρησιμοποιήστε το αποτέ-λεσμα της Άσκ.1). (β) Να υπολογίσετε το p-value του παραπάνω δείγματος και μέσω αυτού να επανελέγξετε την Η0 έναντι της Η1. (γ) Αν ο ίδιος δειγματικός μέσος 102=x προέκυπτε από δείγ-μα ν = 50, τι απόφαση θα παίρναμε; Να βρείτε το αντίστοιχο p-value. (δ) Πόσο πρέπει να είναι το ν ώστε π(101) = 1 − β ≈ 0.95;

Λύση (α) Σύμφωνα με το Λήμμα N-P, ο καλύτερος έλεγχος σε ε.σ. a έχει περιοχή απόρριψης:

Κ: azv

XT >−

=σ/

μ0 .

Ισχύει ότι

6451264911051001020 .z.

/vσ/μxt a =<≈

−=

−=

Επομένως δεν απορρίπτουμε την Η0.

(β) Το p-value είναι

%3.10)26491(1)|( 0 ≈Φ−=>=− .HtTPvaluep

(γ) Τώρα θα είναι 64518282 .z.t a =>= : απορρίπτεται η Η0, με αντίστοιχο p-value:

=− valuep )828.2(1 Φ− %234.0≈

Επίσης, η συνάρτηση ισχύος

π(μ) = )z/σμμ(Φ

20

av−

− ,

για ν = 10 και ν = 50 θα έχει τη μορφή:

102 104 106 108

0.2

0.4

0.6

0.8

1.0

μ

Παρατηρούμε ότι αυξάνεται όσο απομακρύνεται το μ από το μ0.

(δ) Θα πρέπει,

270)μμ(

)(

μμ)

μμ(Φ1][ 2

0

22

2

0

2

0 ≈−

+=⇔=−

−⇔=−

−−= β

β

σβ

zzvzz

vz

vIIP a

aa

Page 5: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 5

Άσκηση 2.3. Η μέση γεωργική παραγωγή ανά στρέμμα ενός συγκεκριμένου προϊόντος σε μια α-γροτική περιοχή είναι 35 τόνοι με τυπική απόκλιση 3 τόνους. Μετά την χρησιμοποίηση ενός νέου λιπάσματος, η μέση παραγωγή σε 100 τυχαία επιλεγμένα στρέμματα ανήλθε στους 35.6 τόνους. Να ελέγξετε σε ε.σ. 5% αν η συγκεκριμένη αύξηση είναι στατιστικά σημαντική, δηλαδή αν το συ-γκεκριμένο λίπασμα ευνοεί την αύξηση της μέσης παραγωγής (θεωρείστε ότι η διασπορά της πα-ραγωγής έχει παραμείνει η ίδια). Να βρείτε το αντίστοιχο p-value του δείγματος.

Λύση. Για μεγάλο δείγμα, η Y = X ακολουθεί προσεγγιστικά κανονική κατανομή Ν(μ,σ2/ν). Θέ-λουμε να ελέγξουμε την Η0: μ = μ0 = 35, έναντι της Η1: μ > μ0 = 35. Η κρίσιμη περιοχή του ελέγ-χου (περιοχή απόρριψης τα Η0) θα έχει τη μορφή Y > c (από λήμμα N-P) και επομένως τελικά

Κ: 645.12100/3

356.35/

0 =>=−

=−

= azv

xtσ

μ

από όπου απορρίπτεται η Η0 σε ε.σ. a. Επίσης,

%.275.22)(1)|( 0 =Φ−=>=− HtTPvaluep

Άσκηση 2.4. Με βάση ένα τ.δ. Χ1, Χ2, …, Χν ~ Ν(μ,82) θέλουμε να ελέγξουμε σε ε.σ. α = 5% την Η0: μ = 80 έναντι της Η1: μ = 76. Να δειχθεί ότι η κρίσιμη περιοχή του IE είναι της μορφής K:

acx < . Να βρεθεί το ελάχιστο ν και το ca έτσι ώστε P[I] ≤ 0.05, P[II] ≤ 0.10.

Λύση Όμοια με την Άσκ. 1 βρίσκουμε ότι η περιοχή απόρριψης είναι acX < . Θα είναι

aHv

cv

XPHcXPIP a

a ≤−

<−

=<= )|/μ

σ/μ

()/(][ 000

και επειδή, κάτω από την Η0, )/σ,μ(~ 20 vNX , συμπεραίνουμε τελικά ότι

aaaaa z

vczz

vc σμ

010 −≤⇒−=≤

−−σ

.

Η πιθανότητα σφάλματος τύπου ΙΙ θα είναι ίση με

=][IIP β≤−

≥−

=≥ )μ=μ|σ/

μσ/

μ()μ=μ|( 1

111 v

cv

XPcXP a

a .

Και άρα,

.σμσ/

μ1

1ββ z

vcz

vc

aa +≥⇔≥−

Τελικά,

352225.34)7680645.128.1(46)

μμ(σσμσμ 22

10

201 =⇒=

−+

=−+

≥⇒−≤≤+ vzz

vzv

czv

aaa

ββ

και

.775.77645.13588028.1

35876731.77 =−≤≤+= ac

Αν θέλουμε ελάχιστο P[I] λαμβάνουμε το μικρότερο δυνατό ca.

Page 6: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 6

Άσκηση 2.5. Έστω ένα τ.δ. Χ1, Χ2, …, Χν ~ Ν(0,σ2). (α) Αν ν = 10, να δοθεί η κρίσιμη περιοχή του ελέγχου σε ε.σ. a=5% της υπόθεσης Η0: σ = 1 έναντι της Η0: σ = 2. Στη συνέχεια να βρεθεί η πιθανότητα σφάλματος τύπου ΙΙ και η ισχύς του παραπάνω ελέγχου. (β) Να βρεθεί το ελάχιστο μέγεθος του δείγματος ν ώστε η ισχύς να ελέγχου σε ε.σ. a=5% της υπόθεσης Η0: σ = 1 έναντι της Η0: σ = 2 να είναι τουλάχιστον 0.95.

Λύση (α) Είναι γνωστό ότι η περιοχή απόρριψης της Η0 έχει γενικά τη μορφή

Κ: )()(1 2

1

220

aXv

ii νχμ

σ>−∑

=

και εδώ,

Κ: .31.18)05.0(1)( 210

220

1

2 ≈⋅=>∑=

χχσ aX v

v

ii

Επίσης,

⎟⎟⎠

⎞⎜⎜⎝

⎛=≤

−=≤−= ∑∑

==

)()|)()(()|)()((][ 221

20

12

21

20

1

2

11

220

1

22 aFHa

XPHaXPIIP vv

v

i

iv

v

ii

σσ

χσσ

σμ

χσμχ

και άρα

( ) 91756.0082.015775.41)05.0(411)(1)4( 2

10210

2210

221

20 =−=−=⎟

⎠⎞

⎜⎝⎛−=⎟⎟

⎞⎜⎜⎝

⎛−=

χχχχχ

σσπ FFaF v

v

(β) Θα είναι

)95.0(2)05.0()1()(1)(1)( 222221

202

21

202

1 2 vvvvv aaFv

χχβχχσσβχ

σσσπ

χ≤⇔−≤⇔−≥⎟⎟

⎞⎜⎜⎝

⎛−=

και κατασκευάζοντας τον πίνακα ν )05.0(2

vχ )95.0(2 2vχ

45 61.6562 61.2245 46 62.8296 62.878 47 64.0011 64.5352 48 65.1708 66.1962 49 66.3386 67.8606 50 67.5048 69.5285

βλέπουμε ότι θα πρέπει ν = 46, και τότε,

95033.0)(1)( 2462

1

202

1 246

=⎟⎟⎠

⎞⎜⎜⎝

⎛−= aF χ

σσσπ

χ

και

83.62)( : 220

1

2 =>∑=

aXK v

v

ii χσ .

Άσκηση 2.6. Επιθυμούμε να ελέγξουμε αν η τιμή πώλησης ενός αγαθού έχει διασπορά ίση με 9 ή μεγαλύτερη από 9. Λαμβάνοντας τ.δ. μεγέθους ν = 30 βρίσκουμε σε αυτό (δειγματική) διασπορά 12 και (δειγματικό) μέσο 101. Να ελέγξετε την παραπάνω υπόθεση σε ε.σ. 1% (μέσω κατάλληλης κρίσιμης περιοχής K και μέσω του αντίστοιχου p-value) θεωρώντας ότι η τιμή του αγαθού ακο-λουθεί κανονική κατανομή με μέσο 100.

Page 7: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 7

Λύση. Θα είναι H0 : σ = σ0 = 3, Η1: σ > σ0 = 3. Η περιοχή απόρριψης της Η0 έχει τη μορφή

Κ: 89.50)()( 2

1

2

0

=>−

=∑=

aXT v

v

i

i χσ

μ

Έχουμε ότι

3063781229101301210130291

11 2

1

2

1

22

1

222 =⋅+⋅=⇒=⎟⎠

⎞⎜⎝

⎛⋅−=⎟

⎞⎜⎝

⎛−

−= ∑∑∑

===

v

ii

v

ii

v

ii XXXvX

vs

Άρα

( ) 4210130100210030306378912

91)( 22

1

2

1

2

0

=⋅⋅⋅−⋅+=⎟⎠

⎞⎜⎝

⎛−+=

− ∑∑==

XvvXX v

ii

v

i

i μμσ

μ

από όπου δεν μπορούμε να απορρίψουμε την Η0 σε ε.σ. 1% (42 < 50.89). Εξάλλου,

%15.7)42(1)|42( 230

0 ≈−=>=−χ

FHTPvaluep > a

Άσκηση 2.7. Έστω τ.δ. Χ1, Χ2, …, Χν όπου οι τ.μ. Χi ακολουθούν την κατανομή Poisson με παρά-μετρο λ. (α) Να δείξετε ότι η περιοχή απόρριψης του ισχυρότατου ελέγχου της Η0 : λ = λ0 έναντι της Η1 : λ = λ1 με λ1 > λ0 είναι της μορφής

ai

i cX >∑=

ν

1

.

(β) Να βρείτε ΟΙΕ για την Η0 : λ ≤ λ0 έναντι της Η1 : λ > λ1 (μέσω της ΕΟΚ). (γ) Αν λ0 = 0.3, λ1 = 0.4, α = 0.05, ν = 20, να βρεθεί ο μικρότερος ακέραιος ca που οδηγεί σε P[I] ≤ a (συντηρητικός έλεγχος με P[I] όσο το δυνατό πιο κοντά στο a). Να βρείτε την αντίστοιχη ισχύ. (δ) Αν λ0 = 0.3, λ1 = 0.4, α = 0.05, ν = 20, να κατασκευάσετε έναν τυχαιοποιημένο έλεγχο (ca,γ) ώστε P[I] = α, και να βρείτε την ισχύ του. (ε) Σε ένα σημείο της εθνικής οδού ο μέσος αριθμός ατυχημάτων που συμβαίνουν την περίοδο Μάιο - Σεπτέμβριο είναι λ0 = 0.3 ανά εβδομάδα. Μετά από κάποια έργα που έγιναν στο σημείο αυτό (τα οποία ολοκληρώθηκαν αρχές Μαΐου) καταγράφηκαν τα ακόλου-θα ατυχήματα τις επόμενες 20 εβδομάδες:

1, 1, 1, 2, 0, 0, 1, 0, 0, 0, 0, 1, 2, 0, 0, 0, 1, 0, 1, 2.

Αυξήθηκε η επικινδυνότητα του συγκεκριμένου σημείου; Να δώσετε το p-value του παραπάνω δείγματος.

Λύση. (α) Από το λήμμα Ν-P η περιοχή απόρριψης της H0 θα είναι

ce

xe

xe

xfxfK

v

ii

i

i

xv

i

xvi

i

xvi

ivi

ivi <

⎟⎟⎠

⎞⎜⎜⎝

⎛=

∏=

∏∏ =−−

−=

−=

=

= 101

1

0

1

0)(

11

01

11

01

!

!)λ;()λ;(=)λ(:

λλ

λ

λλλ

λ

λ

x

cxvv

ii lnln)()λ(ln

1

0

101 <⎟⎟

⎞⎜⎜⎝

⎛∑+−−=⇔= λ

λλλx a

v

ii cx >⇔∑

=1

(β) Η κατανομή Poisson ανήκει στην EOK. Πράγματι,

)()(!

1=);( )()(ln xheβx

eexf xTηxλ λλ λλ =−

όπου η συνάρτηση η(λ) = lnλ είναι αύξουσα και επομένως από το Θεώρημα 2 (ΟΙΕ στην ΕΟΚ) η κρίσιμη περιοχή

Page 8: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 8

Κ: a

v

ii

v

ii cXXT >= ∑∑

== 11

)(

ορίζει OIE.

(γ) Ισχύει ότι )(~| 001

λvPoHXv

ii∑

=

και

)(1)|(][ )λ(01

0 avPoa

v

ii cFHcXPIP −=>= ∑

= από όπου κατασκευάζουμε τον πίνακα

ca P[I] 6 0.393697 7 0.256020 8 0.152763 9 0.083924

10 0.042621 11 0.020092 12 0.008827

Επιλέγουμε ca = 10 με P[Ι] = 0.042621 και

1841.0)(1)|(][1 )(11

1≈−=>=−= ∑

=avPoa

v

ii cFHcXPIIP λπ

(δ) Θα έχουμε

⎪⎩

⎪⎨

<∑=∑>∑

=10,010,10,1

)(

i

i

i

xxx

γφ x

με γ = 0.1787 διότι

P[I] = 05.00.0413 04262.0)|10()|10()|)(( 000 =+==∑+>∑= γγφ HXPHXPHE iiX

και

2018.00.09926 1841.0)|10()|10()|)(( 111 =+==∑+>∑== γγφπ HXPHXPHE iiX

(ε) Από το δείγμα βρέθηκε ότι 131

=∑=

v

iix και άρα

008827.0)12(1)|13( )λ(01

0≈−=≥=− ∑

=vPo

v

ii FHXPvaluep

Άσκηση 2.8. Έστω τ.δ. μεγέθους ν από την κατανομή με σ.π.π.

.1],1,0[,)1();( −>∈+= θθθ θ xxxf

Να βρεθεί ΟΙΕ σε ε.σ. a για την υπόθεση Η0: θ = θ0 έναντι της Η1: θ > θ0 και να δοθεί η αντίστοι-χη συνάρτηση ισχύος π(θ).

Λύση. Θα είναι

cxxx

xfxfK i

vi

v

ivi

ivi

ivi

ivi <∏⎟⎟

⎞⎜⎜⎝

⎛++

=+∏+∏

=∏∏ −

==

=

=

= )(1

1

0

11

01

11

01 10

1

0

11

)1()1(

)θ;()θ;(=)λ(: θθ

θ

θ

θθ

θθx

Page 9: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 9

a

v

ii

v

ii cxcxv >⇔<−+⎟⎟

⎞⎜⎜⎝

⎛++

⇔ ∑∑== 11

101

0 lnln)(11ln θθ

θθ

Αν Υ = −lnX, τότε ισχύει ότι 1)(1)(1)()ln()()( +−−− −=−=≥=≤−=≤= θyy

Xy

Y eeFeXPyXPyYPyF και άρα

)1,(~ln11

+=− ∑∑==

θvGammaYXv

ii

v

ii

Επομένως 22

1~)1(2 v

v

iiY χθ ∑

=

+ , από όπου προκύπτει ότι

aHcYPHcXPIP a

v

iia

v

ii =+−<+=−<−= ∑∑

==

)|)1(2)1(2()|ln(][ 001

001

θθ

)1(2)1(

)1()1(20

222

20 +−

−=⇔−=+−⇔θ

χχθ

acac v

ava

Επίσης,

))1(11(

)|)1(11)1(2()|

)1(2)1(ln(

22

0

1

122

0

1

111

0

22

1

22

aF

HaYPHaXP

v

v

v

ii

vv

ii

v−

++

=

−++

<+=+−

<−= ∑∑==

χθθ

χθθθ

θχπ

χ

Άσκηση 2.9. Έστω Χ1, Χ2, …, Χν τ.δ. από την εκθετική κατανομή με σ.π.π.

.0,0,1);( >>=−

θθ

θ θ xexfx

(α) Να βρεθεί ομοιόμορφα ισχυρότατος έλεγχος σε ε.σ. a της

Η0 : θ ≤ θ0 έναντι της Η1 : θ > θ0.

(β) Να βρεθεί η συνάρτηση ισχύος π(θ). (γ) Ο μέσος χρόνος διάρκειας μιας τηλεφωνικής κλήσης σε ένα δίκτυο είναι 2 λεπτά. Μετά από μια μείωση της χρονοχρέωσης των κλήσεων στο δίκτυο αυτό, καταγράφηκε η διάρκεια 300 κλήσεων η οποία ήταν συνολικά 660 λεπτά (δηλ. δειγματική μέση διάρκεια κλήσης 2.2 λεπτά). Υποθέτοντας ότι η διάρκεια μιας κλήσης ακολουθεί εκθετική κατανομή, να ελέγξετε σε ε.σ. α = 0.01 αν η αύξηση αυτή είναι στατιστικά σημαντική (δηλαδή αν επήλθε πραγματική αύξηση της μέσης διάρκειας μιας κλήσης μετά την μείωση της χρέωσης). Να βρεθεί το αντίστοιχο p-value του δείγματος. (δ) Να βρείτε προσεγγιστικά τα ca, P[II], p-value για μεγάλο ν, χρησιμοποιώντας το Κεντρικό Οριακό Θεώρημα.

Λύση. (α) Η συγκεκριμένη κατανομή ανήκει στην EOK. Πράγματι,

)()(1);( )()()/1( xheβexf xTηx θθ θθ

θ == ⋅−

όπου η συνάρτηση η(θ) = –1/θ είναι αύξουσα και επομένως από το Θεώρημα 2 (ΟΙΕ στην ΕΟΚ) η κρίσιμη περιοχή

Page 10: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 10

Κ: a

v

ii

v

ii cXXT >= ∑∑

== 11

)(

ορίζει OIE. Ισχύει ότι

22

11

~2)1(~ v

v

ii

v

ii X

θv,GammaX χ

θ ∑∑==

(διότι αν Y ~ Gamma(a,λ) τότε η τ.μ. 2λΥ~ χ2 με 2a β.ε.) και άρα

)(2

)(2)|22()|(][ 22

022

00

0100

1acacaHcXPHcXPIP vavaa

v

iia

v

ii χ

θχ

θθθ=⇔=⇔=>=>= ∑∑

==

(β) Η ισχύς θα είναι ίση με π(θ) = 1 − P[II] όπου

))(()|22()|(][ 22

01

11

122

aFHcXPHcXPIIP va

v

iia

v

ii

θθ

θθ χ=≤=≤= ∑∑

==

.

(γ) Από τα δεδομένα θα είναι

Κ: 516.683)(2660 22

10

=>= ∑=

ax v

v

ii χ

θ : δεν ισχύει και άρα δεν απορ. Η0

με

.04489.0)660(1)660(1)|660( 220 )/1,(0

1

aFFHXPvaluepv

vG

v

ii >=−=−=>=− ∑

=χθ

(δ) Από ΚΟΘ, για μεγάλο ν (π.χ. >30 ή >100) ισχύει προσεγγιστικά,

),(~ 2

1θθ vvNX

v

ii∑

=

και επομένως,

aaa

v

i ia

v

ii z

vvcaH

vvc

v

vXPHcXPIP ≈

−⇔≈

−>

−≈>= ∑∑ =

=20

002

0

020

010

1)|()|(][

θθ

θθ

θ

θ

δηλαδή, )(0 aa zvvc +≈θ . Επειδή )(2

22

0 ac va χθ= , παρεμπιπτόντως βρίσκουμε ότι, για μεγάλο ν,

)(2)()()(2

220

22

0avav zvvazvva +≈⇔+≈ χθχθ

Τέλος,

..)()|()|(][2122

111

1=

−Φ=

−≤

−≈≤= ∑∑ =

= θ

θ

θ

θ

θ

θ

v

vcH

v

vc

v

vXPHcXPIIP aa

v

i ia

v

ii

και

.04163.0)732.1(1)|660(1)|660( 020

00

1

≈Φ−≈−

Φ−≈>=− ∑=

Hv

vHXPvaluepv

ii

θθ

Άσκηση 2.10. Έστω Χ1, Χ2, …, Χν, τ.δ. από την κατανομή Weibull με σ.π.π.

0,0,1);( /1 >>= −− θθ

βθ θβ xexxfβx , και β > 0 γνωστό.

Page 11: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 11

(α) Να βρεθεί ομοιόμορφα ισχυρότατος έλεγχος σε ε.σ. a της

Η0 : θ ≤ θ0 έναντι της Η1 : θ > θ0.

(β) Να βρεθεί η συνάρτηση ισχύος π(θ).

Λύση. Παρατηρούμε ότι η συγκεκριμένη κατανομή ανήκει στην EOK. Πράγματι,

)()();( )()(1)/1( xheβxexf xTηx β θβθ θθβθ == −⋅−

όπου η συνάρτηση η(θ) = –1/θ είναι αύξουσα και επομένως από το Θεώρημα 2 (ΟΙΕ στην ΕΟΚ) η κρίσιμη περιοχή

Κ: a

v

ii

v

ii cXXT >=∑∑

== 11

)( β

ορίζει OIE. Αν Χ ~ Weibull (β,1/θ), τότε η τ.μ. Υ = Χβ ~ εκθετική(1/θ). Πράγματι, η σ.π.π. της τ.μ. Y θα είναι

)()()()()()()( /1/1/1/1 βββββ ydydyfyF

dydyXP

dydyXP

dydyF

dydyf XXYY ==≤=≤==

.0,1)(1)( /1/1

/)(1/11/1

/1 /1

>=== −−

−−−

yeyeyyyf yyX

β θβ

θβββ

β

θβθβ

ββ

Επομένως,

)1(~11 θ

v,GammaYXWv

ii

v

ii ∑∑

==

== β

και μπορεί να δειχθεί ότι 22~2

vW χθ

. Άρα τελικά,

)(2

)(2)|22()|(][ 22

022

00

0100

1acacaHcXPHcXPIP vavaa

v

iia

v

ii χθχ

θθθββ =⇔=⇔=>=>= ∑∑

==

και

))((1)2(1)|22()|()(π 22

01

11

122

22

aFcFHcXPHcXP vaa

v

iia

v

ii χ

θθ

θθθθ

νν χχββ −=−=>=>= ∑∑

==

Άσκηση 2.11. Το τυχαίο δείγμα: 0, 0, 0, 1, 2, 0, 1, 0, 2, 1, προέρχεται από την γεωμετρική κατα-νομή με σ.π.

)1,0(,...2,1,0)1();( ∈=−= pxpppxf x

Να ελέγξετε σε ε.σ. a = 5% αν ισχύει η Η0: p ≤ p0 = 1/3 έναντι της Η1: p > p0 = 1/3 μέσω του p-value του δείγματος.

Λύση. Η περιοχή απόρριψης της Η0 είναι της μορφής

cpp

pp

pppp

xfxfK

v

ii

i

ixv

xvi

xvi

ivi

ivi <

⎟⎟⎠

⎞⎜⎜⎝

⎛−−

⎟⎟⎠

⎞⎜⎜⎝

⎛=

−∏−∏

=∏∏ =

=

=

=

= 1

1

0

1

0

111

001

11

01

11

)1()1(

)θ;()θ;(=)λ(: x a

v

ii cx <∑⇔

=1

η οποία προκύπτει και μέσω της ΕΟΚ (Θεώρημα 2). Ισχύει ότι

Page 12: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 12

027284.0)7(1

=≤=− ∑=

v

iiXPvaluep

το οποίο είναι μικρότερο του a και επομένως απορρίπτουμε την Η0.

Λύσεις Ασκήσεων Κεφαλαίου 3 (Παρ. 3.6). Άσκηση 3.1. Έστω Χ1,Χ2, …, Χν τυχαίο δείγμα από την κανονική κατανομή Ν(μ,σ2) με σ2 γνω-στό. (α). Χρησιμοποιώντας την κρίσιμη περιοχή του ελέγχου της Η0: μ = μ0 έναντι της H1: μ ≠ μ0 να προσδιορίσετε το σύνολο των τιμών του μ0 για τις οποίες η υπόθεση Η0: μ = μ0 δεν απορρίπτε-ται (σε ε.σ. a, έναντι της H1). Να συγκρίνετε το σύνολο αυτό με το γνωστό διάστημα εμπιστοσύ-νης για το μ, συντελεστού 1 – a. Πως μπορούμε να χρησιμοποιήσουμε το δ.ε. για να ελέγξουμε τις παραπάνω υποθέσεις; (β). Να εκφράσετε το p-value ενός δείγματος x1,x2,…,xν για τον έλεγχο της Η0: μ = μ0 έναντι της H1: μ ≠ μ0. (γ) Να βρείτε την συνάρτηση ισχύος του ελέγχου του ελέγχου της Η0: μ = μ0 έναντι της H1: μ ≠ μ0 αν ν = 100, μ0 = 10, σ = 10, α = 5%. Αν ισχύει μ = 12, με τι πιθα-νότητα θα πάρουμε σωστή απόφαση;

Λύση (α) Το σύνολο των τιμών του μ0 για τις οποίες η υπόθεση Η0: μ = μ0 δεν απορρίπτεται είναι

20

0 /: a/z

X≤

νσμ

μ

ή ισοδύναμα,

],[ 220 a/a/ zXzXνσ

νσμ +−∈

Το παραπάνω ταυτίζεται με το γνωστό δ.ε. για το μ συντελεστού 1 – a. Επομένως, απορρίπτουμε την H0 μέσω της παραπάνω κρίσιμης περιοχής ⇔ το μ0 δεν ανήκει στο παραπάνω δ.ε. (β) Το p-value δείγματος το οποίο είχε δειγματικό μέσο x είναι

)|||()|||()||||(| 000 HtTPHtTPHtTPvaluep −<+>=>=−

))/

||(1(2|))(|1(2 0

νσμ−

Φ−=Φ−=xt

(γ) Θα είναι

)|()|/

()( 12020120 HzXzPHz

XPIIP a/a/a/ ν

σμνσμ

νσμ

+≤≤−=≤−

=

)νσ/

()νσ/

()|νσ/νσ/νσ/

( 20

20

120

20

a/a/a/a/ zzHzXzP −−

Φ−+−

Φ=+−

≤−

≤−−

=μμμμμμμμμ

και άρα

)10010/1210()96.1

10010/1210()

νσ/()

νσ/()( 22

02

0a/a/a/ zzz −

−Φ+−

−−Φ≈−

−Φ+−

−−Φ=

μμμμμπ

515991.000003.0515953.0)96.12()96.12( ≈+≈−−Φ+−Φ≈ .

Άσκηση 3.2. Ο δειγματικός μέσος από δείγμα μεγέθους ν = 100 από την κανονική κατανομή Ν(μ,σ2) βρέθηκε ίσος με 11, ενώ γνωρίζουμε ότι σ = 4. Να ελέγξετε αν ισχύει η Η0: μ = 10 έναντι της Η1: μ ≠ 10 σε ε.σ. a = 5%: (α) μέσω της κρίσιμης περιοχής Κ, (β) μέσω κατάλληλου δ.ε. για το μ, και (γ) μέσω του p-value (z0.05/2

≈ 1.96).

Λύση (α) Η περιοχή απόρριψης της Η0 είναι

Page 13: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 13

20

/||: a/z

XTK >

−=

νσμ

⇔ 96.15.2100/41011

: >=−

=TK : ισχύει, απορρίπτεται η Η0

(β) Ισχύει ότι

],z[ 2/20 a/a zXXνσ

νσμ +−∈ ⇔

11.784][10.216, ]1.96100411,1.96

100411[0 =+−∈μ : δεν ανήκει, απορρίπτεται η Η0

(γ) Θα είναι

0.012419 ))5.2(1(2|))(|1(2)||||(| 0 =Φ−=Φ−=>=− tHtTPvaluep < 5% ,

από όπου απορρίπτεται η Η0.

Άσκηση 3.3. Από τυχαίο δείγμα 150 εμπορικών καταστημάτων της πόλεως Α προέκυψε ότι το μέσο ετήσιο ενοίκιο τους είναι 13632 ευρώ, ενώ από απογραφή που έγινε στην πόλη Β προέκυψε ότι το μέσο ετήσιο ενοίκιο όλων των εμπορικών καταστημάτων της είναι 13452 ευρώ με τυπική απόκλιση 1864 ευρώ. (α) Να εξεταστεί αν μπορούμε να δεχθούμε, σε επίπεδο σημαντικότητας 0.10 ότι τα ενοίκια των εμπορικών καταστημάτων της πόλεως Α δε διαφέρουν από εκείνα της πό-λεως Β, όταν είναι γνωστό ότι οι δύο κατανομές έχουν την ίδια διακύμανση. (β) Υπό τις ίδιες πα-ραδοχές και δεδομένα, να εξεταστεί αν τα ενοίκια των εμπορικών καταστημάτων της Α είναι υ-ψηλότερα από εκείνα της Β, σε ε.σ. 0.10 (z0.05 ≈ 1.645, z0.05 ≈ 1.281)

Λύση (α) Η περιοχή απόρριψης της Η0 είναι

20

/||: a/z

XTK >

−=

νσμ

⇔ 645.11827.1150/1864

1345213632||: >=

−=TK

: δεν ισχύει, δεν απορρίπτεται η Η0 έναντι αμφίπλευρης Η1

(β) Η περιοχή απόρριψης της Η0 τώρα είναι

azXTK >−

=νσμ

/: 0 ⇔ 281.11827.1

150/18641345213632: >=

−=TK

: δεν ισχύει, δεν απορρίπτεται η Η0 έναντι μονόπλευρης Η1

Τα παραπάνω γίνονται και μέσω των p-values

(α) 0.2369 ))1827.1(1(2|))(|1(2)||||(| 0 =Φ−=Φ−=>=− tHtTPvaluep > a

(β) 0.1184 )1827.1(1)(1)|( 0 =Φ−=Φ−=>=− tHtTPvaluep > a

Άσκηση 3.4. Να κάνετε και πάλι τα ερωτήματα (α), (β) της Άσκησης 1, αυτή τη φορά θεωρώντας ότι το σ δεν είναι γνωστό.

Λύση (α) Το σύνολο των τιμών του μ0 για τις οποίες η υπόθεση Η0: μ = μ0 δεν απορρίπτεται είναι

)2(/

: 10

0 a/tSX

−≤−

νν

μμ

ή ισοδύναμα,

Page 14: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 14

)]2

(),2

([ 110atSXatSX −− +−∈ νν νν

μ .

Ταυτίζεται με το γνωστό δ.ε. για το μ συντελεστού 1 – a. Επομένως, απορρίπτουμε την H0 μέσω της παραπάνω κρίσιμης περιοχής ⇔ το μ0 δεν ανήκει στο παραπάνω δ.ε.

(β) Το p-value δείγματος το οποίο είχε Τ = t είναι

|))|(1(2)||||(|10 tFHtTPvaluep t −

−=>=−ν

Άσκηση 3.5. Ο δειγματικός μέσος και η δειγματική διασπορά από δείγμα μεγέθους ν = 20 που προέρχεται από την κανονική κατανομή βρέθηκαν ίσα με 12 και 22.8 αντίστοιχα. Να ελέγξετε αν ισχύει η Η0: μ = 10 έναντι της Η1: μ ≠ 10 σε ε.σ. a = 5%: (α) μέσω της κρίσιμης περιοχής K, (β) μέσω κατάλληλου δ.ε. για το μ, και (γ) μέσω του p-value. (t19(0.05/2)≈ 2.09302)

Λύση (α) Η περιοχή απόρριψης της Η0 είναι

∑=

− −−

=−

=>ν

1

2201 )(

11,

/),2(||:

ii XXS

SXTa/tTK

ννμ

ν

και επειδή,

,093.2)2(873.1|20/8.22

1012|: 1 =>=−

− a/tK ν δεν ισχύει, δεν απορρίπτεται η Η0

(β)

)]2

(),2

([ 110atSXatSX −− +−∈ νν νν

μ = [9.765, 14.234] : ανήκει, δεν απορρίπτεται η Η0

(γ)

0765.0))873.1(1(2|))|(1(2)||||(|1910 ≈−≈−=>=−

− tt FtFHtTPvaluepν

> a

από όπου δεν απορρίπτεται η Η0.

Άσκηση 3.6. Έστω ότι ο αριθμός μηνιαίων πωλήσεων ενός προϊόντος από τους αντιπροσώπους μιας εταιρείας αυτοκινήτων ακολουθεί την Ν(40, 100). Το προσωπικό των αντιπροσώπων της ε-ταιρείας παρακολουθεί κάποια σεμινάρια και έστω Χ1, Χ2,…, Χν οι πωλήσεις των αντιπροσώπων τον επόμενο μήνα. Πως θα ελέγχατε σε ε.σ. a αν μεταβλήθηκαν οι μέσες πωλήσεις ή όχι. Ποια θα ήταν η απάντησή σας στο παραπάνω ερώτημα αν για ν = 5 αντιπροσώπους είχαμε xi = 35, 45, 38, 40, 43. (a = 5%). Να δώσετε το αντίστοιχο p-value.

Λύση. Επιθυμούμε να ελέγξουμε αν Η0: μ = μ0 = 40, Η1: μ ≠ μ0 με σ2 άγνωστο. Απορρίπτουμε την Η0 όταν

νμ

ν /),2(||: 0

1 SXTa/tTK −

=> −

Υπολογίζουμε από τα δεδομένα:

3.96232 ,7.15)(1

1,112867.05/7.15

402.40/

ν

1

220 ==−−

==−

=−

= ∑=

sxxssxt

iiνν

μ

και επομένως,

Page 15: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 15

7764.2)2/05.0()2/(112867.0 41- ==<= tatt ν

από όπου δεν μπορούμε να απορρίψουμε την Η0. Το p-value θα είναι

915574.0))112867.0(1(2|))|(1(2)||||(|410 ≈−≈−=>=−

− tt FtFHtTPvaluepν

Άσκηση 3.7. Κατά το έτος 2008 η μέση μηνιαία καταναλωτική δαπάνη των οικογενειών μιας πό-λης ήταν μ0 =14.4 εκατοντάδες ευρώ. Κατά το επόμενο έτος συγκεντρώθηκαν στοιχεία μέσης μη-νιαίας καταναλωτικής δαπάνης (Χ, σε εκατοντάδες ευρώ) από τυχαίο δείγμα 10 οικογενειών της πόλεως αυτής, τα οποία έδωσαν τα ακόλουθα αθροίσματα:

2.1531

=∑ =

ν

i ix και 6.24481

2 =∑ =

ν

i ix .

Θεωρώντας ότι μηνιαία καταναλωτική δαπάνη των οικογενειών μια πόλης ακολουθεί N(μ,σ2), μπορούμε να δεχθούμε, σε επίπεδο σημαντικότητας 0.05, ότι κατά το έτος 2009 η μέση μηνιαία καταναλωτική δαπάνη μ όλων των οικογενειών της πόλεως έμεινε, στην πραγματικότητα, αμετά-βλητη σε σχέση με το προηγούμενο έτος; Να θεωρήσετε ως εναλλακτική υπόθεση (α) την μ ≠ μ0, (β) την μ < μ0, και (γ) την μ > μ0.

Λύση Ισχύει ότι

32.1510/2.1531 ν

1=== ∑

=iixx

ν,

( )22ν

1

1

22 32.15106.244891

11)(

11

⋅−=⎟⎠

⎞⎜⎝

⎛−

−=−

−= ∑∑

==

xxxxsi

ii

i ννν

=11.2862

και

0.866 10/2862.114.1432.15

/0 ≈

−=

−=

νμ

sxt

(α) Ελέγχουμε αν Η0: μ = μ0 = 14.4, Η1: μ ≠ μ0 με σ2 άγνωστο. ( )2(||: 1 a/ttK −> ν ) Θα είναι

26216.2)2/05.0()2/(866.0 91- ==>= tatt ν : δεν ισχύει

από όπου δεν μπορούμε να απορρίψουμε την Η0 έναντι της Η1. Το p-value θα είναι

409.0))866.0(1(2|))|(1(2)||||(|910 ≈−≈−=>=−

− tt FtFHtTPvaluepν

> a

(β) Ελέγχουμε αν Η0: μ = μ0 = 14.4, Η1: μ < μ0 με σ2 άγνωστο ( )(: 1 attK −−< ν ). Θα είναι

83311.1)05.0()(866.0 91- −=−=−<= tatt ν : δεν ισχύει

από όπου δεν μπορούμε να απορρίψουμε την Η0 έναντι της Η1. Το p-value θα είναι

7955.0)866.0()()|(910 ≈≈=<=−

− tt FtFHtTPvaluepν

> a

(γ) Ελέγχουμε αν Η0: μ = μ0 = 14.4, Η1: μ > μ0 με σ2 άγνωστο ( )(: 1 attK −> ν ). Θα είναι

83311.1)05.0()(866.0 91- ==>= tatt ν : δεν ισχύει

από όπου δεν μπορούμε να απορρίψουμε την Η0 έναντι της Η1. Το p-value θα είναι

Page 16: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 16

2044.0)866.0(1)(1)|(910 ≈−≈−=>=−

− tt FtFHtTPvaluepν

> a

Άσκηση 3.8. Έστω τ.δ. Χ1, Χ2, …, Χν από την Ν(μ,σ2) με σ2 άγνωστο και έστω ότι θέλουμε να ε-λέγξουμε την Η0: μ = μ0. Αν συμβολίσουμε με

>pvalue , <pvalue , και ≠pvalue ,

τα p-values που αντιστοιχούν στον έλεγχο της Η0: μ = μ0 με εναλλακτικές τις Η1: μ > μ0, Η1: μ < μ0, H1: μ ≠ μ0 αντίστοιχα, να δείξετε ότι

⎩⎨⎧

<−≥

=≠

≠> 0,2/1

0,2/tpvalue

tpvaluepvalue και

⎩⎨⎧

≥−<

=≠

≠< 0,2/1

0,2/tpvalue

tpvaluepvalue

όπου sxvt /)( 0μ−= .

Λύση. Σχηματικά:

0

p-value ≠

t

p-value>

H1: μ > μ0 και t ≥ 0

0

p-value ≠

t

p-value>

H1: μ > μ0 και t < 0

Αυστηρά:

)(1)|( 0 tFHtTPpvalue −=>=> , )()|( 0 tFHtTPpvalue =<=<

))(1(2)|( 0 tFHtTPpvalue −=>=≠

και επομένως, αν t > 0,

)1(2))(1(2,2))(1(2 <≠>≠ −=−==−= pvaluetFpvaluepvaluetFpvalue

ενώ αν t < 0,

<≠>≠ ==−==−−= pvaluetFpvaluepvaluetFtFpvalue 2)(2),1(2)(2))(1(2

Άσκηση 3.9. Θεωρώντας ότι η τιμή πώλησης ενός προϊόντος σε μια περιοχή ακολουθεί N(μ,σ2), και προκειμένου να ελεγχθεί η Η0: μ = 1000 ευρώ έναντι της Η1 : μ ≠ 1000 ευρώ, καταγράφηκε η τιμή πώλησης του προϊόντος αυτού σε ένα τ.δ. ν καταστημάτων. Από αυτό το τ.δ. βρέθηκε μέση τιμή πώλησης 1030 ευρώ με p-value = 8%. Αν αντί της εναλλακτικής Η1 : μ ≠ 1000 θέλαμε να ελέγξουμε την Η1 : μ > 1000 ποιο θα ήταν το αντίστοιχο p-value; Ποιο θα ήταν το αντίστοιχο p-value όταν Η1 : μ < 1000;

Λύση Εδώ 0/)10001030(/)( 0 >−=−= svsxvt μ , και

%42/ == ≠> pvaluepvalue και %962/1 =−= ≠< pvaluepvalue

Page 17: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 17

Άσκηση 3.10. Σε ν = 20 καπνιστές που αποφάσισαν να διακόψουν το κάπνισμα μετρήθηκε το σωματικό τους βάρος λίγο πριν και τρείς μήνες μετά τη διακοπή του καπνίσματος. Βρέθηκε ότι

8.1=x και 8.0=xs όπου xi είναι η διαφορά του σωματικού βάρους (σε κιλά) του i ατόμου μετά – πρίν τη διακοπή του καπνίσματος. Να ελέγξετε αν, με βάση το δείγμα αυτό, μπορούμε να πούμε ότι η διακοπή του καπνίσματος συνδέεται με την μεταβολή του σωματικού βάρους. Να κάνετε τον αμφίπλευρο και τους δύο μονόπλευρους ελέγχους μέσω των p-values.

Λύση Ισχύει ότι 8.1=x , 8.0=s και

10.0623 20/8.008.1

/0 ≈

−=

−=

νμ

sxt

Ελέγχουμε αν Η0: μ = μ0 = 0, Η1: μ ≠ μ0 με σ2 άγνωστο ( )2(||: 1 a/ttK −> ν ). Θα είναι

09.2)2/05.0()2/(0623.10 191- ==>= tatt ν : ισχύει

απορρίπτουμε την Η0 έναντι της Η1. Το p-value θα είναι

00.0))0623.10(1(2|))|(1(2)||||(|910 ≈−≈−=>=−

−≠ tt FtFHtTPvaluepν

00.02/ ≈= ≠> pvaluepvalue και %1002/1 ≈−= ≠< pvaluepvalue

Άσκηση 3.11. Έστω τυχαίο δείγμα Χ1, Χ2, ..., Χν ~ N(μ,σ2) με μ γνωστό. α. Χρησιμοποιώντας το αποτέλεσμα που βρέθηκε για τον έλεγχο της υπόθεσης Η0: σ = σ0 έναντι της Η1: σ ≠ σ0 (σε ε.σ. α) με το κριτήριο του γενικευμένου λόγου πιθανοφανειών, να προσδιορίσε-τε το σύνολο των τιμών του σ0 για τις οποίες δεν απορρίπτεται η Η0 και να το συγκρίνετε με το γνωστό διάστημα εμπιστοσύνης για το σ, συντελεστού 1 – a (όταν μ γνωστό). Λύση. Το σύνολο των τιμών του σ0 για τις οποίες δεν απορρίπτεται η Η0 είναι

)

2(χ)(,)()

21(χ)

2(χ)

21(χ 22

01

2

1

2220

22 axxaaTai

ii

i ν

νν

ννν σμμσ ≤∑ −∑ −≤−⇔≤≤−==

)2/1(χ

)(

)2/(χ

)(21

2

202

1

2

a

x

a

xi

ii

i

∑ −≤≤

∑ −⇔ ==

ν

ν

ν

νμ

σμ

το οποίο είναι το γνωστό δ.ε. συντ. 1 – a για το σ2 όταν το μ είναι γνωστό. Επομένως δεν απορρί-πτουμε την Η0 έναντι της αμφίπλευρης Η1 σε ε.σ. a όταν το μ0 ανήκει στο δ.ε. για το μ συντ. 1 – a. Άσκηση 3.12. Να επαναλάβετε την Άσκηση 11, αυτή την φορά θεωρώντας ότι το μ είναι άγνω-στο. Λύση. Το σύνολο των τιμών του σ0 για τις οποίες δεν απορρίπτεται η Η0 είναι

)2

(χ)2

1(χ 21

21

aTa−− ≤≤− νν

)2/1(χ

)(

)2/(χ

)(2

1

1

2

202

1

1

2

a

xx

a

xxi

ii

i

∑ −≤≤

∑ −⇔

=

=

ν

ν

ν

ν

σ

το οποίο συμπίπτει με το γνωστό δ.ε. συντ. 1 – a για το σ2 όταν το μ είναι γνωστό. Επομένως δεν απορρίπτουμε την Η0 έναντι της αμφίπλευρης Η1 σε ε.σ. a όταν το μ0 ανήκει στο δ.ε. για το μ συντ. 1 – a.

Page 18: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 18

Άσκηση 3.13. Έστω ότι ο χρόνος ζωής ενός τύπου μπαταριών ακολουθεί κανονική κατανομή N(μ,σ2). Ο κατασκευαστής ισχυρίζεται ότι σ2 = 100. Μπορούμε να απορρίψουμε τον ισχυρισμό αυτό έναντι της Η1: σ2 > 100 σε επίπεδο σημαντικότητας 5% αν έχουμε την πληροφορία ότι η δειγματική διασπορά S2 των χρόνων ζωής ενός τυχαίου δείγματος 20 μπαταριών βρέθηκε ίση με 130. Να βρεθεί το p-value του ελέγχου.

Λύση. Πρόκειται για τον έλεγχο της υπόθεσης

Η0: σ σ202= έναντι της Η1: σ σ2

02>

Όπως και στην προηγούμενη άσκηση θα χρησιμοποιήσουμε την σ.σ.

)(χ~σ

)1( 21H2

0

2

0aST −

−= νν

ενώ όταν ισχύει η Η1 η Τ θα λαμβάνει μεγάλες τιμές. Συνεπώς η περιοχή απόρριψης αυτού του ελέγχου θα είναι της μορφής T > c. Για να έχουμε P[I] = a θα πρέπει

Κ: )(χσ

)1( 212

0

2

aS−>

−ν

ν

Αντικαθιστώντας βρίσκουμε ότι

)05.0(χ14.307.24100

13019σ

)1( 2192

0

2

=≤=⋅

=− sν

και επομένως δεν μπορούμε να απορρίψουμε την υπόθεση Η0: σ σ202= =100 σε επίπεδο σημαντι-

κότητας 0.05. Tο p-value του ελέγχου θα είναι η πιθανότητα

17.0)7.24(1)/7.24( 219χ0 ≈−=>=− FHTPvaluep

Παρατηρούμε ότι το p-value είναι αρκετά μεγάλο, μεγαλύτερο του α = 0.05 (και άρα σωστά δε-χτήκαμε την Η0).

Λύσεις Ασκήσεων Κεφαλαίου 4 (Παρ. 4.4). Άσκηση 4.1. Oι χρόνοι συναρμολόγησης ενός προϊόντος από δύο συγκεκριμένους εργάτες, ακο-λουθούν κανονική κατανομή με μέση τιμή μ1 και μ2 αντίστοιχα. Αν

234, 99, 234, 174, 188, 107, 173, 172 και 105, 194, 77, 33, 159, 150, 167, 127, 169, 166

είναι δειγματοληπτικά κάποιοι χρόνοι (σε min) συναρμολόγησης των δύο αυτών εργατών αντί-στοιχα, μπορούμε σε επίπεδο σημαντικότητας α=0.05 να πούμε ότι α) οι δύο εργάτες έχουν δια-φορετική απόδοση; β) ο πρώτος εργάτης έχει χειρότερη απόδοση από το δεύτερο; γ) ο πρώτος ερ-γάτης συναρμολογεί το προϊόν 10 λεπτά αργότερα από το δεύτερο; Θεωρείστε ότι οι τυπικές απο-κλίσεις σ1, σ2 των χρόνων συναρμολόγησης του προϊόντος από τους εργάτες είναι γνωστές και ίσες με σ1 = 50, σ2 = 50.

Λύση. Υπολογίζουμε από τα δύο δείγματα ότι 625.172=x και 7.134=y .

(α) Ζητείται ο έλεγχος της μορφής Η0: μ1 = μ2, H1:μ1 ≠ μ2 όταν σ1,σ2 είναι γνωστά σε ε.σ. α = 0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι

Κ: |Τ | > zα/2 όπου Τ= ( )

2

22

1

21 σσ

vv

YX

+

− .

Page 19: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 19

Αντικαθιστώντας θα έχουμε ότι

|t| = 6.1225.050

925.37

101

8150

7.134625.172

σσ

2

22

1

21

≈=+

−=

+

vv

yx

Ενώ za/2 = z0.025 = 1.96 > 1.6 και άρα δεν απορρίπτουμε την Η0. Επίσης,

11.0))6.1(1(2|))(|1(2)||||(| 0 ≈Φ−≈Φ−=>=− tHtTPvaluep > a.

(β) Ζητείται ο έλεγχος της μορφής Η0: μ1=μ2, H1:μ1>μ2 όταν σ1,σ2 είναι γνωστά σε ε.σ. α=0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι

Τ > zα όπου Τ = ( )

2

22

1

21 σσ

vv

YX

+

− .

Αντικαθιστώντας θα έχουμε ότι

t = 6.1σσ

2

22

1

21

+

vv

yx

Ενώ za = z0.05 = 1.645 > 1.6 και άρα δεν απορρίπτουμε και πάλι την Η0. Επίσης,

055.0)6.1(1)(1)|( 0 ≈Φ−≈Φ−=>=− tHtTPvaluep > a.

(γ) Ζητείται ο έλεγχος της μορφής Η0: μ1 − μ2 = 10, H1: μ1 − μ2 > 10 όταν σ1,σ2 είναι γνωστά σε ε.σ. α = 0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι

Κ: |Τ | > zα/2 όπου Τ= ( )

2

22

1

21 σσ

10

vv

YX

+

−− .

Αντικαθιστώντας θα έχουμε ότι

T = 177.1225.050

925.27

101

8150

107.134625.172≈=

+

−− <za = z0.05 = 1.645

οπότε δεν απορρίπτουμε την Η0.

Άσκηση 4.2. Από τυχαίο δείγμα 50 οικογενειών της πόλεως Α προέκυψε ότι το μέσο ετήσιο εισό-δημά τους ήταν 15562 ευρώ. Επίσης από τυχαίο δείγμα 100 οικογενειών της πόλεως Β προέκυψε ότι το μέσο ετήσιο εισόδημά τους ήταν 15126 ευρώ. Μπορούμε να δεχθούμε, σε επίπεδο σημα-ντικότητας 0.01, ότι οι οικογένειες των δύο πόλεων από τις οποίες προέρχονται τα δείγματα έχουν το ίδιο μέσο εισόδημα, αν είναι γνωστό ότι στους δύο αυτούς πληθυσμούς η τυπική απόκλιση εί-ναι ίση με 830;

Λύση. Ελέγχουμε τις υποθέσεις Η0 : μ1 = μ2, Η1 μ1 ≠ μ2. Έχουμε

100,50,15126,15562 21 ==== ννyx και θεωρείται ότι η διακύμανση είναι γνωστή και ίση με σ2 = 688900 και για τους δύο πληθυ-σμούς. Επομένως 22

221 σσσ == και

0329.3

1001

501830

1512615562

2

22

1

21

≈+

−=

+

−=

νσ

νσ

yxT

Page 20: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 20

Αφού |T| = 3.0329 > z0.01/2 = z0.005 = 2.58, απορρίπτουμε την Η0. Τέλος,

0.0024(3.03))1(2))1,0(~|0329.3|(|)||0329.3||(| 0 ≈Φ−≈>=>=− NTTPHTPvaluep .

Άσκηση 4.3. Μια εταιρεία κατασκευής σκελετών σκαφών βρίσκει ότι τα δένδρα τύπου Α που προμηθεύεται από ένα δάσος αποδίδουν κατά μέσο όρο 64 kgr ξύλα περισσότερο από τα δένδρα τύπου Β. Η διακύμανση της απόδοσης ξύλου βρέθηκε ίση με 115 kgr2. Ένα άλλο δάσος περιέχει και τους δύο τύπους ξύλων. Παίρνοντας δείγμα 100 δένδρων για κάθε τύπο (από το δεύτερο δά-σος) οι αποδόσεις σε ξύλο βρέθηκαν 1390 kgr και 1332 kgr αντίστοιχα ενώ οι διακυμάνσεις έμε-ναν αμετάβλητες. Μπορούμε να δεχθούμε σε ε.σ. 1% ότι η διαφορά των μέσων αποδόσεων ξύλου παραμένει στο ίδιο επίπεδο δηλ. 64 kgr;

Λύση. Θέτουμε

X : απόδοση ξύλου ανά δέντρο τύπου Α στο δεύτερο δάσος Υ : απόδοση ξύλου ανά δέντρο τύπου Β στο δεύτερο δάσος

Υποθέτουμε ότι Χ ~ ),( 211 σμN , Υ ~ ),( 2

22 σμN με 11522

21 ==σσ και ζητάμε να γίνει ο έλεγχος

Η0: μ1 – μ2 = 64 έναντι της Η1: μ1 – μ2 ≠ 64

σε ε.σ. 1%, με βάση δύο δείγματα Χ1, Χ2, … 1νX και Υ1, Υ2, … 2ν

Y (ν1 = ν2 = 100) από τα οποία προέκυψε ότι 1332,1390 == yx . Έχουμε

4

1001152

641332139064

2

22

1

21

−≈−−

=

+

−−=

νσ

νσ

yxt

Αφού |T| = 4 > z0.01/2 = 2.58, απορρίπτουμε την Η0. Επίσης,

0.00006(4))1(2))1,0(~|4|(|)||4||(| 0 ≈Φ−≈>=−>=− NTTPHTPvaluep .

Άσκηση 4.4. Έστω μ1 η μέση τιμή πώλησης ενός προϊόντος σε μία περιοχή Α και μ2 η μέση τιμή πώλησης του ίδιου προϊόντος σε μία περιοχή Β. Επιλέγουμε τυχαία 4 τιμές από την περιοχή Α και 4 τιμές από την περιοχή Β. Αν οι τιμές αυτές είναι

1.12, 1.06, 1.21, 1.1 (περιοχή Α) και 1.07, 0.93, 0.97, 0.99 (περιοχή Β),

μπορούμε, σε επίπεδο σημαντικότητας 5%, να πούμε ότι η μέση τιμή πώλησης στην περιοχή Α είναι υψηλότερη από την αντίστοιχη στην περιοχή Β; (Η0: μ1 = μ2, H1: μ1 > μ2) (υποθέτουμε ότι οι τιμές κατανέμονται κανονικά και με ίση διασπορά στις δύο περιοχές).

Λύση. Υπολογίζουμε ότι 003466.0,004025.0,99.0,1225.1 22

21 ==== ssyx και η κρίσιμη περιοχή

του ελέγχου θα είναι

Κ: Τ > )2/(221at vv −+ και t =

( ) ( )0618.3

244003466.03004025.03

99.01225.144

4

2)1()1(

2

21

222

211

21

21

−+⋅+⋅

−+=

−+−+−

−+

vvsvsv

yxvv

vv

.

ενώ )2/(221at vv −+ = )2/05.0(6t = 2.45 < 3.0618, και άρα απορρίπτουμε την Η0 σε ε.σ. 5%. Επίσης,

01108.0)0618.3(1)|(60 ≈−≈>=− tFHtTPvaluep

Άσκηση 4.5. Από τυχαίο δείγμα 12 εμπορικών καταστημάτων ειδών ενδυμασίας προέκυψε ότι η μέση ημερήσια δαπάνη τους για διαφήμιση είναι 51 ευρώ με δειγματική τυπική απόκλιση 3.6 ευ-ρώ. Επίσης από τυχαίο δείγμα 12 εμπορικών καταστημάτων ειδών υποδήσεως προέκυψε ότι η μέ-

Page 21: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 21

ση ημερήσια δαπάνη τους για διαφήμιση είναι 48 ευρώ με δειγματική τυπική απόκλιση 4 ευρώ. Μπορούμε να δεχθούμε, σε ε.σ. 1%, ότι οι δύο κατηγορίες καταστημάτων δαπανούν, κατά μέσο όρο το ίδιο ποσόν για διαφήμιση; Υποθέτουμε ότι οι δαπάνες για κάθε κατάστημα κατανέμονται κανονικά και με ίση διασπορά.

Λύση. Zητείται να γίνει ο έλεγχος της Η0: μ1 – μ2 = 0 έναντι της Η1: μ1 – μ2 ≠ 0. Έχουμε

12,12,4,6.3,48,51 2121 ====== ννssyx και

93.1

212124)112(6.3)112(

121

121

4851

2)1()1(11 22

21

222

211

21

−+−+−

+

−=

−+−+−

+

−=

νννν

ννss

yxt

και αφού 819.2)2/01.0(93.1|| 21212 ≈<= −+tt δεν μπορούμε να απορρίψουμε την Η0. Επίσης,

066.0))93.1(1(2)||||(|220 ≈−≈>=− tFHtTPvaluep .

Άσκηση 4.6. (α) Έστω μ1 η μέση τιμή πώλησης ενός προϊόντος σε μία περιοχή Α και μ2 η μέση τιμή πώλησης του ίδιου προϊόντος σε μία περιοχή Β. Η μέση τιμή και η διασπορά ενός τ.δ. 10 τι-μών πώλησης από την περιοχή Α βρέθηκε 100.9 και 8.76667 αντίστοιχα. Επίσης, η μέση τιμή και η διασπορά ενός τ.δ. 20 τιμών πώλησης από την περιοχή Β βρέθηκε 104.45 και 12.9974 αντίστοι-χα. Αν υποθέσουμε ότι οι τιμές κατανέμονται κανονικά και με ίση (αλλά άγνωστη) διασπορά και στις δύο περιοχές, να ελέγξετε σε επίπεδο σημαντικότητας 5% i) Αν η μέση τιμή πώλησης στην Α είναι διαφορετική από την αντίστοιχη στην Β. ii) Αν η μέση τιμή πώλησης στην Α είναι χαμηλότερη από την αντίστοιχη στην Β. (β) Στο (α) υποθέσαμε ότι οι διασπορές 2

1σ και 22σ των τιμών στις περιοχές αυτές είναι ίσες.

Να ελέγξετε σε επίπεδο σημαντικότητας 5% αν όντως οι δύο αυτές διασπορές μπορούν να θεωρη-θούν ίσες.

Λύση. (α)i) Ζητείται ο έλεγχος της μορφής Η0: μ1=μ2, H1:μ1≠μ2 όταν σ1,σ2 είναι άγνωστά αλλά ίσα, σε ε.σ. α = 0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι

Κ: |Τ | > )2/(221at vv −+ όπου Τ =

( )

2)1()1(

21

222

211

21

21

−+−+−

−+

vvSvSv

YXvv

vv.

Αντικαθιστώντας θα έχουμε ότι

|t| = 68.2

2201099.1219766.89

45.1049.10020102010

−=

−+⋅+⋅

−+⋅

Ενώ )2/(221at vv −+ = )025.0(28t = 2.048 < 2.68 και άρα απορρίπτουμε την Η0. Επίσης,

01219.0))68.2(1(2)||||(|280 ≈−≈>=− ≠ tFHtTPvaluep .

ii) Ζητείται ο έλεγχος της μορφής Η0: μ1=μ2, H1:μ1<μ2 όταν σ1,σ2 είναι άγνωστά αλλά ίσα σε ε.σ. α = 0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι

Κ: Τ < − )(221at nn −+ όπου Τ= 68.2− .

Επειδή )(221at nn −+− = )05.0(28t− = −1.701 > −2.68 απορρίπτουμε την Η0. Επίσης,

)2/(0061.0)68.2()|(280 ≠< −=≈−≈<=− valuepFHtTPvaluep t

Page 22: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 22

(β) Ζητείται ο έλεγχος της μορφής Η0: σ1=σ2, H1:σ1≠σ2 όταν τα μ1, μ2 είναι άγνωστα σε ε.σ. α=0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι

Κ: Τ < )2/1(1,1 21aF vv −−− ή Τ > )2/(1,1 21

aF vv −− όπου Τ= 22

21

1

2

1

2

1

22

1

)(

)(

11

SS

YY

XX

vv

v

jj

v

ii

=−

−−

=

= .

Αντικαθιστώντας θα έχουμε ότι t 6748.099.12

766.8== ενώ

273.0)975.0()1( 19,921,1 21==−−− FF a

vv , 84.2)025.0()( 19,921,1 21==−− FF a

vv ,

και επειδή 0.273 < 0.6748 < 2.84 μπορούμε να δεχτούμε την Η0 (δηλ. οι πληθυσμοί είναι ομοσκε-δαστικοί) σε ε.σ. 0.05. Επίσης,

556.00.722}0.278,min{2

))6748.0(1),6748.0(min{2)}|(),|(min{219,919,900

=≈

−=><=− FF FFHtTPHtTPvaluep

Άσκηση 4.7. Έστω ότι οι χρόνοι ζωής δύο τύπων εξαρτημάτων A, B ακολουθούν κανονική κατα-νομή N(μ1, σ1

2) και N(μ2, σ22) αντίστοιχα. Αν σε ένα τ.δ. από εξαρτήματα τύπου Α βρέθηκε ότι S1

= 100 (ν1 = 50) και σε ένα τ.δ. από εξαρτήματα τύπου Β βρέθηκε ότι S2 = 120 (ν2 = 50), μπορούμε σε ε.σ. 5% να ισχυριστούμε ότι οι χρόνοι ζωής των εξαρτημάτων Α παρουσιάζουν μικρότερη με-ταβλητότητα από τους χρόνους του Β; Δίνεται ότι 605.1)05.0(49,49 =F

Λύση. Είναι

Κ: Τ < 6221.0)95.0()1( 49,491,1 21==−−− FaF vv

όπου t = 6944.0120100

2

2

22

21 ==

ss και επομένως δεν μπορούμε να απορρίψουμε την Η0. Επίσης

1026.0)6944.0()|(49,490 ≈=<=− FFHtTPvaluep .

Άσκηση 4.8. Από δύο δείγματα άγαμων και έγγαμων εργατριών συγκεντρώθηκαν τα ακόλουθα στοιχεία που αφορούν ώρες απουσίας από την εργασίας τους λόγω ασθένειας σε ένα έτος:

Άγαμοι: 88, 68, 77, 82, 63, 80, 78, 71, 68, Έγγαμοι : 73, 77, 67, 70, 74, 64, 71, 71, 72

Να ελεγχθεί σε ε.σ. 5% η υπόθεση ότι η διακύμανση των ωρών απουσίας των άγαμων (α) είναι ίση με τη διακύμανση των ωρών απουσίας των έγγαμων εργατριών, έναντι της εναλλακτικής υπο-θέσεως ότι η διασπορά των ωρών απουσίας των άγαμων είναι μεγαλύτερος από εκείνο των έγγα-μων. (β) είναι τετραπλάσια της διακύμανσης των ωρών απουσίας των έγγαμων εργατριών. Δίνεται ότι 44.3)05.0(8,8 =F , 43.4)025.0(8,8 =F .

Λύση. (α). Θέλουμε να ελέγξουμε τις υποθέσεις Η0: σ1 = σ2, Η1 : σ1 > σ2. Έχουμε

9,9,5.14,25.64,719

639,759

67521

22

21 ======== ννssyx

οπότε

43.45.1425.64

22

21 ===

sst

Αφού, 44.3)(43.4 1,1 21

=>= −− aFt νν δεν απορρίπτουμε την Η0. Επίσης

Page 23: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 23

025.0)43.4(1)|(8,80 ≈−=>=− FFHtTPvaluep

(β). Τώρα έχουμε

1075.122

2

21 ==s

stδ

και επειδή 43326.4)2/()2/1(225568.0 1,11,1 2121=≤≤−= −−−− aFtaF vvvv δεν μπορούμε να απορρί-

ψουμε την Η0. (γενικά, )(/1)1( ,, aFaF nmmn =− ) . Επίσης,

888.00.444}0.555,min{2

))1075.1(1),1075.1(min{2)}|(),|(min{28,88,800

=≈

−=><=− FF FFHtTPHtTPvaluep

Άσκηση 4.9. Από δύο ανεξάρτητους πληθυσμούς παίρνουμε τα τυχαία δείγματα 7, 6, 4, 8, 5, 3, 5 και 6, 5, 3, 7, 8, 3, 6, 3, 4 αντίστοιχα. Να ελεγχθεί σε ε.σ. 5% η υπόθεση ότι οι πληθυσμοί έχουν ίσες διακυμάνσεις έναντι της εναλλακτικής ότι η διακύμανση του πρώτου πληθυσμού είναι μεγα-λύτερη της διακύμανσης του δεύτερου. Δίνεται ότι 28.0)95.0(6,8 =F .

Λύση. Θέλουμε να ελέγξουμε τις υποθέσεις Η0: σ1 = σ2, Η1 : σ1 > σ2. Έχουμε

9,7,5.3,67.4,5,6 2122

21 ====== ννssyx

οπότε

33.122

21 ==

sst

Αφού, 58.3)(33.1 8,6 =<= aFt δεν απορρίπτουμε την Η0 ( )1(/1)( 6,88,6 aFaF −= ). Επίσης

345.0)33.1(1)|33.1(8,60 ≈−=>=− FFHTPvaluep .

Άσκηση 4.10. Για τον έλεγχο της αποτελεσματικότητας ενός σκευάσματος που καταπολεμά την παχυσαρκία, χορηγήθηκε συγκεκριμένη ποσότητά του σε 20 κατάλληλα πειραματόζωα. Σε καθέ-να από αυτά καταγράφηκε το βάρος του αμέσως πριν και μια εβδομάδα μετά την χορήγηση του σκευάσματος. Καταγράφηκαν τα παρακάτω σωματικά βάρη (σε kgr):

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Πριν 81.3 81.7 89.6 85.1 83.3 81.5 80.6 81.9 69.5 80.2 77.3 80.8 71.5 84.7 75.4 81.9 79.8 82 94.3 77 Μετά 81.8 80.1 84.2 82.1 75.8 81.6 76.1 79.9 70.9 81.2 81 83.3 70 75.5 72.4 79.9 79 80.7 91.9 76.3

Υπάρχει θετική μέση επίδραση του συγκεκριμένου σκευάσματος (σε ε.σ. 5%) στο βάρος των πει-ραματόζωων;

Λύση: Πρόκειται για ζευγαρωτές παρατηρήσεις (Χ1,Υ1), (Χ2,Υ2), …, (Χν,Yν) (ν ανεξάρτητα τυχαία διανύσματα). Θεωρούμε ότι το (Χi,Υi) ακολουθεί διδιάστατη κανονική με Ε(Χi) = μi, Ε(Yi) = μi + δ, V(Xi) = σ1

2, V(Υi) = σ22, Corr(Xi,Yi) = ρ, i = 1, 2, …,v. Επιθυμούμε να ελέγξουμε αν η διαφορά δ =

E(Yi) − E(Xi) μεταξύ των μέσων των Xi και των Υi είναι μηδενική (θεωρώντας άγνωστες τις παρα-μέτρους σ1, σ2, ρ). Κάτω από τις παραπάνω υποθέσεις, οι διαφορές

Ζi = Υi − Xi

είναι ανεξάρτητες και ακολουθούν την κανονική κατανομή με μέση τιμή δ και (άγνωστη) διασπο-ρά )2( 21

22

21

2 σρσσσσ −+= . Επομένως, ισοδύναμα μπορούμε να ελέγξουμε αν η μέση τιμή δ των Zi είναι ίση με μ0 = 0 (Η0: δ = 0, Η1: δ ≠ 0). Χρησιμοποιούμε την στατιστική συνάρτηση

2

1

22

1155.3)(

11,785.11,53.2

/0

=−−

====−

= ∑∑==

v

iiZ

v

ii

Z

ZZv

SZv

ZvS

ZT

Απορρίπτουμε την Η0 σε ε.σ. a =5% διότι

Page 24: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 24

093.2)2/(53.2|| 1 =>= − atT v

ενώ το p-value των τιμών του δείγματος είναι

( ) 02.0)53.2(12)||||(|10 =−=>=−−vt

FHtTPvaluep

Εάν είχαμε ως εναλλακτική υπόθεση την Η1: δ > 0 ⇔ Ε(Χ) > Ε(Υ) θα έπρεπε να πάρουμε

01.02/02.02/ ===− ≠> pvaluevaluep (διότι t > 0).

Άσκηση 4.11. (παράδειγμα του Student) Η επίδραση δύο φαρμάκων Α και Β στο χρόνο ύπνου δοκιμάστηκε σε 10 ασθενείς που έπασχαν από αϋπνία. Και έστω xi, yi η παράταση του ύπνου του ασθενούς (σε ώρες) που οφείλεται στην επίδραση του φαρμάκου Α, Β αντίστοιχα.

xi 1.9 0.8 1.1 0.1 –0.1 4.4 5.5 1.6 4.6 3.4 yi 0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0

zi = xi – yi 1.2 2.4 1.3 1.3 0.0 1.0 1.8 0.8 4.6 1.4

Είναι λογικό να δεχτούμε ότι (α) η επίδραση του φαρμάκου Α είναι διαφορετική από την επίδρα-ση του φαρμάκου Β σε ε.σ 1%, (β) η παράταση του ύπνου που προκαλεί το φάρμακο Α είναι κατά 1 ώρα μεγαλύτερη της παράτασης που προκαλεί το φάρμακο Β;

Λύση: (α) Όμοια την προηγούμενη άσκηση, πρόκειται για ζευγαρωτές παρατηρήσεις (Χ1,Υ1), (Χ2,Υ2), …, (Χν,Yν) όπου (Χi,Υi) ~ διδιάστατη κανονική με Ε(Χi) = μi, Ε(Yi) = μi + δ, V(Xi) = σ1

2, V(Υi) = σ2

2, Corr(Xi,Yi) = ρ, i = 1, 2, …,v. Επιθυμούμε να ελέγξουμε αν η διαφορά δ = E(Yi) − E(Xi) = 0. Οι τ.μ. Ζi = Υi − Xi είναι ανεξάρτητες και ακολουθούν Ν(δ, )2σ . Επομένως, για το (α) πρέπει να ελέγξουμε τις υποθέσεις Η0: δ = 0, Η1: δ ≠ 0 με βάση το δείγμα των διαφορών Z1, Z2, …,Zν. Χρησιμοποιούμε την στατιστική συνάρτηση

,06.410/52.1058.1

/0

≈−

=−

=vs

ztZ

Επειδή, t9(0.01/2) = 3.25, απορρίπτουμε την Η0 σε ε.σ. a =1%. Για το (β) πρέπει να ελέγξουμε τις υποθέσεις Η0: δ = 1, Η1: δ ≠ 1. Τώρα έχουμε

,48.110/52.1158.1

/1

≈−

=−

=vs

ztZ

και άρα δεν απορρίπτουμε την Η0 σε ε.σ. a =1%.

Λύσεις Ασκήσεων Κεφαλαίου 5 (Παρ. 5.3). Άσκηση 5.1. Ένας υποψήφιος δήμαρχος μιας μεγάλης πόλης ισχυρίζεται ότι στις εκλογές που έ-γιναν σήμερα θα λάβει ποσοστό μεγαλύτερο του 50%. Έχουμε αρκετά στοιχεία για να απορρί-ψουμε τον παραπάνω ισχυρισμό, αν σε ένα τ.δ. ν = 300 ψηφοφόρων (που ελήφθη με exit poll, δηλαδή οι ψηφοφόροι ρωτήθηκαν αμέσως μετά την έξοδό τους από τυχαία επιλεγμένα εκλογικά τμήματα) μόνο το 44% δήλωσαν ότι ψήφισαν τον συγκεκριμένο υποψήφιο (a = 0.01, Η1: p < p0). Αν βρεθεί ότι δεν έχουμε αρκετά στοιχεία, πόσο θα έπρεπε να είναι το ελάχιστο μέγεθος του δείγ-ματος ώστε, με το ίδιο δειγματικό ποσοστό, να απορρίπταμε τον παραπάνω ισχυρισμό;

Λύση. Στη συγκεκριμένη περίπτωση ζητείται ο έλεγχος της υπόθεσης

H0: p ≥ p0 έναντι της Η1: p < p0

όπου p0 = 50%. Γνωρίζουμε ότι η κρίσιμη περιοχή θα είναι

Κ: azvpp

pX−<

−−

/)1( 00

0 .

Page 25: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 25

Αντικαθιστώντας βρίσκουμε ότι

33.207.2300/)5.01(5.0

5.044.0/)1( 01.0

00

0 −=−>−=−−

=−− z

vpppx .

Επομένως δεν έχουμε αρκετά στοιχεία για να απορρίψουμε τον παραπάνω ισχυρισμό σε ε.σ. 1%. Εξάλλου,

01922.0)07.2()|( 0 ≈−Φ=<=− HtTPvaluep .

Παρατηρούμε ότι για να απορρίπταμε την Η0: p = 0.5 λαμβάνοντας ένα μεγαλύτερο δείγμα ν΄ θα έπρεπε να ισχύει ότι

azvpp

pX−<

′−−′

/)1( 00

0 δηλαδή 22

0

00

)()1(

azpXppv

−′−

>′

όπου X ′ είναι το αντίστοιχο δειγματικό ποσοστό που θα βρίσκαμε. Βρίσκοντας, σύμφωνα με την εκφώνηση, και πάλι X ′ = 0.44 θα έπρεπε

37733.2)5.044.0()5.01(5.0

)()1( 2

22

20

00 ≈−−

=−′−

>′ azpXppv

Άσκηση 5.2. Σε τ.δ. 400 τηλεθεατών οι 100 δήλωσαν ότι παρακολουθούν μια ορισμένη τηλεοπτι-κή σειρά. Μπορούμε να δεχθούμε σε ε.σ 5% ότι εκείνοι που παρακολουθούν τη σειρά από το σύ-νολο των τηλεθεατών είναι λιγότεροι του 30% (Η1; p < p0);

Λύση. Ζητείται ο έλεγχος της υπόθεσης

H0: p = p0 έναντι της Η1: p < p0

όπου p0 = 30%. Η κρίσιμη περιοχή θα είναι

Κ: azvpp

pXT −<−−

=/)1( 00

0 .

Αντικαθιστώντας βρίσκουμε ότι

645.1183.2/)1( 05.0

00

0 −=−<−=−− z

vpppx .

Επομένως απορρίπτουμε τον παραπάνω ισχυρισμό σε ε.σ. 5%. Εξάλλου,

01451.0)183.2()|( 0 ≈−Φ=<=− HtTPvaluep < a

Άσκηση 5.3. Έστω τ.δ. Χ1,X2,...,Xν με P(Xi = 1) = p, P(Xi = 0) = 1−p. Ποιο θα πρέπει να είναι το μέγεθος του δείγματος ν ώστε για τον έλεγχο της υπόθεσης

Η0: p = p0, Η1: p = p1, p1 > p0

οι πιθανότητες σφάλματος τύπου Ι και ΙΙ να είναι αντίστοιχα α και β (χρησιμοποιήστε προσέγγιση μέσω κανονικής κατανομής).

Λύση. Για τον έλεγχο της συγκεκριμένης υπόθεσης θα έχουμε από τα παραπάνω την κρίσιμη πε-ριοχή

Κ: azvpp

pX>

−−

/)1( 00

0 .

για την οποία ως γνωστό ισχύει ότι P[I] = a. Θα πρέπει και P[II] = β. Δηλαδή

Page 26: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 26

)=|)1(()|/)1(

()( 100

0100

0 ppzv

pppXPHzvpp

pXPIIP aa−

+≤=≤−−

=

β=−

−+

−−

≤−−

= )|)1()1(

/)1(/)1(( 1

11

00

11

10

11

1 p=pzpppp

vpppp

vpppXP a

και επομένως,

βzzpppp

vpppp

a −=−

−+

−−

)1()1(

/)1( 11

00

11

10

ή ισοδύναμα 2

01

1100 )1()1(⎟⎟⎠

⎞⎜⎜⎝

−−+−

=pp

zppzppv a β

Άσκηση 5.4. Επιλέγοντας τυχαία 400 προϊόντα από μία μηχανή που τα κατασκευάζει, τα 16 βρέ-θηκαν ελαττωματικά, ενώ επιλέγοντας τυχαία 300 προϊόντα από μία άλλη μηχανή, τα 24 βρέθη-καν ελαττωματικά. Να ελέγξετε σε επίπεδο σημαντικότητας 1% (α) αν υπάρχει διαφορά στην πα-ραγωγή ελαττωματικών μεταξύ των δύο μηχανών και (β) αν η δεύτερη μηχανή είναι «χειρότερη» από την πρώτη. Λύση. (α) Ζητείται ο έλεγχος των υποθέσεων της μορφής Η0: p1 = p2, H1: p1 ≠ p2 σε ε.σ. α = 0.01. Η κρίσιμη περιοχή του ελέγχου θα είναι (ν1, ν2 > 30)

Κ: |Τ | > za/2 όπου ( )21 /1/1)1( vvPP

YXT+−

−= ,

21

21

vvYvXvP

++

=

Αντικαθιστώντας θα έχουμε ότι

0571.0700

2416400300300400 300

2440016

=+

=++

=P και ( )

257.2)0571.01(0571.0 400

13001

30024

40016

−=+−

−=t

Ενώ zα/2 = z0.005 = 2.58 και επειδή 2.257 < 2.58 δεχόμαστε (ή καλύτερα, λέμε ότι δεν έχουμε αρκε-τά στοιχεία ώστε να απορρίψουμε) την Η0. Εξάλλου,

024.0))257.2(1(2)||||(| 0 ≈Φ−=>=− HtTPvaluep (β) Ζητείται ο έλεγχος των υποθέσεων της μορφής Η0: p1 = p2, H1:p1 < p2 σε ε.σ. α = 0.01. Η κρί-σιμη περιοχή του ελέγχου σύμφωνα με τα παραπάνω θα είναι (ν1,ν2 >30)

Κ: Τ < −za όπου από τα δεδομένα, 257.2−=t

ενώ zα = z0.01 = 2.33 και επειδή 33.2257.2 −>−=t δεχόμαστε (ή καλύτερα, λέμε ότι δεν έχουμε αρκετά στοιχεία ώστε να απορρίψουμε) την Η0. Εξάλλου,

012.0)257.2()|( 0 ≈−Φ=<=− HtTPvaluep

(μισό από το p-value του αμφίπλευρου ελέγχου)

Άσκηση 5.5. Ένας δημοσιογράφος σε μία τηλεοπτική συζήτηση ισχυρίζεται ότι συμβαίνει κάτι ύποπτο στην εταιρία μέτρησης τηλεθέασης GBA. Η εταιρία έχει διαθέσει 1150 μηχανάκια σε ισά-ριθμους τηλεθεατές, 150 από τα οποία έχουν δοθεί σε νέους συνεργάτες (τηλεθεατές που έχουν ξεκινήσει τη συνεργασία τους με την GBA το τελευταίο εξάμηνο). Ο δημοσιογράφος διαπιστώνει ότι, σύμφωνα με την GBA, το κανάλι VEGA παρουσιάζει τηλεθέαση 30% στο σύνολο (στους 1000+150 τηλεθεατές) ενώ έχει μόνο 22% στους νέους (στους 150) τηλεθεατές. Ο δημοσιογράφος το θεωρεί αυτό πολύ ύποπτο και μάλιστα κάποιος πολιτικός που βρίσκεται στην συζήτηση δηλώ-νει ότι «οι δύο αυτές τιμές δεν συμφωνούν καθόλου» (πρόκειται για πραγματικό περιστατικό).

Page 27: Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ... σ2 = 4 χρησιμοποιούμε την κρίσιμη ... λεσμα της

Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 27

Είναι πράγματι αυτό «πολύ ύποπτο»; Θα μπορούσε δηλαδή η διαφορά αυτή να είναι τυχαία; Συ-γκεκριμένα, αν p1, p2 είναι τα ποσοστά της τηλεθέασης του VEGA στους πληθυσμούς από τους οποίους προέρχονται οι δύο ομάδες τηλεθεατών («νέοι» και «παλαιοί» συνεργάτες), ελέγξτε σε ε.σ. α = 0.01 την υπόθεση H0: p1 = p2 έναντι της H1: p1 > p2 (αν απορρίψουμε την Η0 μπορούμε πράγματι να μιλήσουμε για κάτι «ύποπτο», διότι αναμένουμε να ισχύει p1 = p2 αφού και οι δύο ομά-δες συνεργατών προέρχονται από τον ίδιο πληθυσμό).

Λύση. Πρόκειται για δύο ανεξάρτητα δείγματα Χ1,Χ2,..., 1ν

X ~ Β(1,p1) και Υ1,Υ2,..., 2ν

Y ~ Β(1,p2) με ν1 = 1000, ν2 = 150. Θέλουμε να πραγματοποιήσουμε το έλεγχο H0: p1 = p2, H1: p1 > p2 έχοντας δειγματικά ποσοστά 22.0,312.0 == yx διότι

⎪⎩

⎪⎨

=⋅−⋅

=−+

=

=⇒

⎪⎩

⎪⎨

=++

=

312.01000

22.015030.01150)(30.022.0

30.0

22.0

1

221

21

21

vyvvvx

y

vvyvxv

y

Η κρίσιμη περιοχή του ελέγχου θα είναι (ν1, ν2 > 30)

Κ: Τ > za όπου ( )21 /1/1)1( vvPP

YXT+−

−= ,

21

21

vvYvXvP

++

=

Αντικαθιστώντας θα έχουμε ότι

3.01150

22.0150312.01000=

⋅+⋅=P και

( )292.2

7.03.022.0312.0

1501

10001

=+⋅

−=t

ενώ zα = z0.01 = 2.33 και επειδή 33.2292.2 <=t δεχόμαστε (ή καλύτερα, λέμε ότι δεν έχουμε αρ-κετά στοιχεία ώστε να απορρίψουμε) την Η0 σε ε.σ. 1%. Εξάλλου,

011.0)292.2(1)|( 0 ≈Φ−=>=− HtTPvaluep .

Άσκηση 5.6. Τον μήνα Ιανουάριο επιλέχθηκαν τυχαία 400 ψηφοφόροι από μία περιοχή και ανά-μεσά τους βρέθηκαν 100 οι οποίοι προτίθενται να ψηφίσουν το κόμμα Α. Τον μήνα Φεβρουάριο, επιλέχθηκαν τυχαία 500 ψηφοφόροι από την ίδια περιοχή και ανάμεσά τους βρέθηκαν τώρα 150 οι οποίοι προτίθενται να ψηφίσουν το κόμμα Α. Να ελέγξετε σε ε.σ. 5% αν το ποσοστό των ψη-φοφόρων του κόμματος Α στην περιοχή αυτή αυξήθηκε κατά τον μήνα Φεβρουάριο. (Η0 : p1 = p2 έναντι της Η1 : p1< p2)

Λύση. Τα δειγματικά ποσοστά των ψηφοφόρων του κόμματος τους δύο μήνες είναι,

25.0=x και 3.0=y

Η κρίσιμη περιοχή θα είναι

Κ: ( )

664.1500/1400/1)2777.01(2777.0

3.025.0−=

+−−

=t < − zα = −1.645

Όπου

=+

⋅+⋅=

5004003.050025.0400P 0.2777

και επομένως απορρίπτουμε την Η0. Υπήρξε στατιστικά σημαντική αύξηση (ε.σ. 5%). Εξάλλου,

048.0)664.1()|( 0 ≈−Φ=<=− HtTPvaluep .