84
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΙΙ ΚΙΟΣΕΟΓΛΟΥ ΓΡΗΓΟΡΗΣ ΘΕΣΣΑΛΟΝΙΚΗ 2012

ΣΤΑΤΙΣΤΙΚΗ 2

  • Upload
    -

  • View
    151

  • Download
    2

Embed Size (px)

DESCRIPTION

///////////////////

Citation preview

Page 1: ΣΤΑΤΙΣΤΙΚΗ 2

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΙΙ

ΚΙΟΣΕΟΓΛΟΥ ΓΡΗΓΟΡΗΣ

ΘΕΣΣΑΛΟΝΙΚΗ 2012

Page 2: ΣΤΑΤΙΣΤΙΚΗ 2

2

ΠΕΡΙΕΧΟΜΕΝΑ

ΚΕΦΑΛΑΙΟ 1

ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΙΑΣΠΟΡΑΣ

1.1. Εισαγωγή ………………………………………………………..….. 4

1.2. Ανάλυση διασποράς με έναν παράγοντα …………..…. .……..... 5

1.2.1. Προϋποθέσεις εφαρμογής της μεθόδου …………………………….. 5

1.2.2. Υπολογιστικοί τύποι ………………………………………………. 9

1.2.3. Δείκτης η2 ……………..……………………………………............. 9

1.2.4. Σχολιασμός των προϋποθέσεων εφαρμογής της μεθόδου ........... 13

1.2.5. Έλεγχοι πολλαπλών συγκρίσεων……………………...…….……. 14

1.2.5.1. Έλεγχος Tukey …………………………………………………… 14

1.2.6. Αντιθέσεις ………………………………………………………….. 16

1.2.6.1. Έλεγχος Scheffe …………………………………………………… 17

1.3. Ανάλυση διασποράς με δύο παράγοντες ………………………. 22

1.3.1. Προϋποθέσεις εφαρμογής της μεθόδου …………………………….. 22

1.3.2. Υπολογιστικοί τύποι ……………………………………………… 25

1.3.3. Δείκτης 2pη ……………………………………………………………… 26

1.3.4. Μελέτη της αλληλεπίδρασης…………………………..………..… 32

1.4. Ανάλυση διασποράς με επαναλαμβανόμενες μετρήσεις

σε έναν παράγοντα ……………………………………………….. 35

1.4.1. Υπολογιστικοί τύποι ………………………………………………. 39

1.4.2. Δείκτης 2pη ………………………………………………………………. 39

1.4.3. Έλεγχοι πολλαπλών συγκρίσεων…………………………............. 40

1.4.4. Προϋποθέσεις εφαρμογής της μεθόδου………………………...… 44

Page 3: ΣΤΑΤΙΣΤΙΚΗ 2

3

ΚΕΦΑΛΑΙΟ 2

ΑΠΑΡΑΜΕΤΡΙΚΕΣ ΜΕΘΟΔΟΙ

2.1. Εισαγωγή ………………………………………………….………... 46

2.2. Προσημικός έλεγχος …………………………………….……….... 48

2.3. Έλεγχος Wilcoxon σε συζευγμένα δείγματα …………….…….... 52

2.4. Έλεγχος Mann-Whitney σε ανεξάρτητα δείγματα ...…………... 56

2.5. Έλεγχος ισότητας δύο αναλογιών σε συσχετισμένα δείγματα…. 60

2.6. Συντελεστής συσχέτισης Spearman ……………………………… 63

2.6.1. Έλεγχος για το συντελεστή συσχέτισης Spearman …………….. 64

2.7. Συντελεστές συνάφειας Cramer και φ ………………………….. 66

ΒΙΒΛΙΟΓΡΑΦΙΑ ………………………………………………………….. 69

ΠΑΡΑΡΤΗΜΑ

ΑΣΚΗΣΕΙΣ ΕΠΑΝΑΛΗΨΗΣ …………………………………………… 70

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ ……………………………………............…. 75

Page 4: ΣΤΑΤΙΣΤΙΚΗ 2

4

ΚΕΦΑΛΑΙΟ 1

ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΔΙΑΣΠΟΡΑΣ

1.1. Εισαγωγή

Η ανάλυση διασποράς (ανάλυση διακύμανσης), (analysis of variance – ANOVA) περιλαμβάνει ένα μεγάλο σύνολο από στατιστικές μεθόδους που είναι από τις πλέον χρησιμοποιούμενες για τη στατιστική ανάλυση εμπειρικών δεδομένων που προέρχονται από πειραματικά σχέδια. Η ονομασία όπως και μέρος των μεθόδων της οφείλονται στον Άγγλο στατιστικό R.A. Fisher (1890-1962). Αν και η μεθοδολογία της ανάλυσης διασποράς χρησιμοποιείται, όπως είπαμε, σε πειραματικά σχέδια, συχνές είναι οι περιπτώσεις εφαρμογής της σε μη πειραματικές έρευνες. Στις περιπτώσεις όμως αυτές δεν είναι, ως γνωστό, δυνατή η εξαγωγή συμπερασμάτων αιτιακής μορφής αλλά συσχετιστικής.

Στη μέθοδο της ανάλυσης διασποράς, θεωρούμε ότι η εξαρτημένη μεταβλητή είναι ποσοτική ενώ οι ανεξάρτητες μεταβλητές πρέπει να είναι κατηγορικές ή να χρησιμοποιούνται ως τέτοιες δηλαδή να αποτελούνται από κατηγορίες έστω και αν από τη φύση τους είναι ποσοτικές. Έτσι, ενώ πειραματικές συνθήκες όπως «πειραματική ομάδα – ομάδα ελέγχου», το χρώμα, το φύλο, το κοινωνικό επίπεδο αποτελούν κατηγορικές μεταβλητές, η επίδοση σε κάποια δοκιμασία, οι δόσεις χορήγησης μιας φαρμακευτικής ουσίας ή η ηλικία σε χρόνια αποτελούν ποσοτικές μεταβλητές. Παρόλα αυτά, ορισμένες μικρές συνήθως σε πλήθος μεμονωμένες τιμές ή διαστήματα τιμών από ποσοτικές μεταβλητές όπως η δοσολογία 2mg, 4mg, 6 mg κάποιας χορηγούμενης ουσίας ή οι τάξεις ηλικίας 10-20, 21-30, 31-40, 41-50 χρόνια, μπορούμε να τις θεωρήσουμε ως κατηγορίες και συνεπώς να χρησιμοποιήσουμε τις αντίστοιχες μεταβλητές ως κατηγορικές μεταβλητές. Στην ορολογία της ανάλυσης διασποράς οι ανεξάρτητες μεταβλητές ονομάζονται παράγοντες (factors) ενώ οι διάφορες κατηγορίες από τις οποίες αποτελείται ένας παράγοντας ονομάζονται επίπεδα ή στάθμες (levels) του παράγοντα.

Page 5: ΣΤΑΤΙΣΤΙΚΗ 2

5

1.2. Ανάλυση Διασποράς με Έναν Παράγοντα

Η μέθοδος της ανάλυσης διασποράς με έναν παράγοντα (one-way ANOVA) περιλαμβάνει έναν παράγοντα ο οποίος αποτελείται από k επίπεδα. Τα διάφορα δείγματα (ομάδες ατόμων) που αντιστοιχούν στα επίπεδα του παράγοντα αποτελούνται από διαφορετικά άτομα και συνεπώς είναι ανεξάρτητα μεταξύ τους. Ένας τέτοιος παράγοντας ονομάζεται και διϋποκειμενικός παράγοντας (between-subjects factor).

Έστω k ανεξάρτητοι πληθυσμοί που αντιστοιχούν στα επίπεδα του παράγοντα που μελετούμε. Μέσα από κάθε έναν πληθυσμό επιλέγουμε ένα τυχαίο (αντιπροσωπευτικό) δείγμα και έστω n1, n2, .... ,nk είναι τα μεγέθη αυτών των δειγμάτων. Ο σκοπός της ανάλυσης διασποράς είναι ο έλεγχος της υπόθεσης της ισότητας των μέσων όρων των k πληθυσμών που θα συμβολίζουμε αντίστοιχα μ1, μ2, ....,μk. Συνεπώς η μηδενική υπόθεση διατυπώνεται ως εξής:

k210 μ...μμ:H

ενώ η εναλλακτική υπόθεση

Η1 : οι k μέσοι όροι δεν είναι όλοι ίσοι

Επίσης, η εναλλακτική υπόθεση μπορεί να διατυπωθεί ως εξής

Η1 : τουλάχιστον δύο από τους k μέσους όρους διαφέρουν

1.2.1. Προϋποθέσεις εφαρμογής της μεθόδου

Οι προϋποθέσεις εφαρμογής της ανάλυσης διασποράς με έναν παράγοντα είναι οι ακόλουθες:

1) Τα k δείγματα επιλέγονται μέσα από τους πληθυσμούς με τυχαίο τρόπο και ανεξάρτητα το ένα από το άλλο.

2) Μέσα σε κάθε έναν από τους k πληθυσμούς η εξαρτημένη μεταβλητή ακολουθεί κανονική κατανομή.

3) Οι k κανονικές κατανομές έχουν ίσες διακυμάνσεις. Συνεπώς, αν 2k

22

21 σ,σ,σ ...., είναι οι k διακυμάνσεις θα πρέπει να ισχύει η σχέση

12

22 2 2 .......= k

Page 6: ΣΤΑΤΙΣΤΙΚΗ 2

6

όπου με σ2 συμβολίζεται η κοινή διακύμανση των k κανονικών κατανομών.

Από όλα όσα αναφέρθηκαν μπορούμε να συμπεράνουμε ότι η ανάλυση διασποράς με έναν παράγοντα αποτελεί επέκταση του ελέγχου της ισότητας δύο μέσων τιμών σε ανεξάρτητα δείγματα (t-test, βλέπε Σημειώσεις Στατιστικής Ι), ενώ ανάλογες είναι και οι προϋποθέσεις εφαρμογής των δύο μεθόδων. Συγκεκριμένα, στο t-test η ανεξάρτητη μεταβλητή αποτελείται από δύο ομάδες (επίπεδα) ενώ στην ανάλυση διασποράς με έναν παράγοντα αποτελείται συνήθως από περισσότερα των δύο επιπέδων. Σημειώνεται, ότι αν η μέθοδος της ανάλυσης διασποράς εφαρμοστεί στην περίπτωση που έχουμε μια ανεξάρτητη μεταβλητή με δύο επίπεδα τα αποτελέσματα της είναι ταυτόσημα με αυτά του t-test.

Ας εξετάσουμε τώρα την αρχή πάνω στην οποία στηρίζεται η μέθοδος της ανάλυσης διασποράς με έναν παράγοντα η οποία δικαιολογεί επίσης την ονομασία της. Με βάση τις μετρήσεις που συλλέγουμε, μπορούμε να ορίσουμε τριών ειδών διακυμάνσεις που στην ορολογία της ανάλυσης διασποράς ονομάζονται μέσα τετράγωνα (mean squares). Τα μέσα τετράγωνα αποκτούνται αν τα αντίστοιχα αθροίσματα τετραγώνων (sum of squares) διαιρεθούν με τους κατάλληλους βαθμούς ελευθερίας (degrees of freedom).

1) Η πρώτη πηγή διακύμανσης είναι η συνολική διακύμανση (συνολικό μέσο τετράγωνο). Εκφράζει τη διασπορά όλων των τιμών γύρω από το μέσο όρο τους και δίνεται από τον τύπο:

1NSSMS tot

tot

όπου ο αριθμητής του κλάσματος ονομάζεται συνολικό άθροισμα τετραγώνων και ισούται με

k

1i

n

1j

2ijtot

i

XXSS

Στον τύπο αυτό καθώς και σε αυτούς που θα ακολουθήσουν, μία οποιαδήποτε τιμή συμβολίζεται Xij όπου ο πρώτος δείκτης i δείχνει την ομάδα (επίπεδο) στην οποία βρίσκεται η μέτρηση, ενώ ο δεύτερος δείκτης j τη θέση της τιμής μέσα στην ομάδα. Ακόμη με X συμβολίζεται ο μέσος όρος όλων των τιμών που ονομάζεται γενικός μέσος όρος (grand mean), και Ν είναι το πλήθος όλων των τιμών δηλαδή

Page 7: ΣΤΑΤΙΣΤΙΚΗ 2

7

k21 n...nnN

2) Η δεύτερη πηγή διακύμανσης αφορά τη διακύμανση στο εσωτερικό των k ομάδων. Αν X X Xk1 2, ,..., είναι οι μέσοι όροι των τιμών στις k ομάδες, η εντός των ομάδων διακύμανση (εντός των ομάδων μέσο τετράγωνο) ισούται με

kNSSMS w

w

όπου η ποσότητα SSw ονομάζεται εντός των ομάδων άθροισμα τετραγώνων και δίνεται από τον τύπο

k

1i

n

1j

2iijw

i

XXSS

3) Η τρίτη τέλος πηγή διακύμανσης είναι αυτή που υπάρχει ανάμεσα στις k ομάδες και δείχνει πως διασπείρονται οι μέσοι όροι τους X X Xk1 2, ,..., γύρω από το γενικό μέσο όρο X . Η διακύμανση αυτή ονομάζεται μεταξύ των ομάδων διακύμανση (μεταξύ των ομάδων μέσο τετράγωνο) και δίνεται από τη σχέση

1kSSMS b

b

όπου ο αριθμητής του κλάσματος εκφράζει το μεταξύ των ομάδων άθροισμα τετραγώνων

SS n X Xb i ii

k

2

1

Η διακύμανση bMS δείχνει πόσο διαφοροποιούνται οι μέσοι όροι των k

ομάδων από το γενικό μέσο όρο X και συνεπώς πόσο διαφέρουν τελικά μεταξύ τους.

Ας θεωρήσουμε τώρα την εξής ταυτότητα

iijiij XXXXXX

η οποία δείχνει ότι η απόκλιση μίας οποιασδήποτε τιμής ijX της εξαρτημένης

μεταβλητής από το γενικό μέσο όρο X , αναλύεται στην απόκλιση του μέσου όρου της ομάδας iX στην οποία ανήκει η τιμή από το γενικό μέσο όρο συν την απόκλιση της τιμής από το μέσο όρο της ομάδας στην οποία ανήκει. Υψώνοντας στο τετράγωνο τα δύο μέρη της παραπάνω ταυτότητας και αθροίζοντας για όλες τις τιμές αποδεικνύεται ότι

Page 8: ΣΤΑΤΙΣΤΙΚΗ 2

8

k

1i

n

1j

2ij

i

XX = n X Xi ii

k

2

1+

k

1i

n

1j

2iij

i

XX

δηλαδή

SStot = bSS + wSS

Η σχέση αυτή αποτελεί την εξίσωση της ανάλυσης διασποράς με έναν παράγοντα. Σύμφωνα με αυτήν, η συνολική διασπορά των τιμών που εκφράζεται από το συνολικό άθροισμα τετραγώνων αναλύεται στη διασπορά μεταξύ των ομάδων και στη διασπορά μέσα στις ομάδες που εκφράζονται αντίστοιχα από τα «μεταξύ των ομάδων» και «εντός των ομάδων» αθροίσματα τετραγώνων.

Μια αντίστοιχη με την παραπάνω σχέση, που ισχύει όπως είδαμε για τα αθροίσματα τετραγώνων, είναι και η σχέση

(N - 1) = (N - k) + (k - 1)

που ισχύει για τους αντίστοιχους βαθμούς ελευθερίας.

Θεωρούμε, ότι η εντός των ομάδων διακύμανση wMS οφείλεται στην

επίδραση του πειραματικού σφάλματος που είναι αποτέλεσμα όλων των ανεξέλεγκτων τυχαίων επιδράσεων καθώς και των ατομικών διαφορών. Αντίθετα, η μεταξύ των ομάδων διακύμανση bMS οφείλεται στην επίδραση

του παράγοντα και είναι ανεξάρτητη από αυτήν του πειραματικού σφάλματος.

Αποδεικνύεται, ότι ανεξάρτητα του αν αληθεύει ή όχι η μηδενική υπόθεση (μ1 = μ2 =...= μk), η εντός των ομάδων διακύμανση wMS αποτελεί αμερόληπτη

εκτίμηση της άγνωστης κοινής διακύμανσης σ2 των k πληθυσμών. Αντίθετα, για την μεταξύ των ομάδων διακύμανση ισχύει ότι και αυτή αποτελεί αμερόληπτη εκτίμηση της άγνωστης κοινής διακύμανσης σ2 (ανεξάρτητη μάλιστα της wMS ) αλλά μόνο στην περίπτωση που η μηδενική υπόθεση

ισχύει. Όταν η μηδενική υπόθεση δεν ισχύει τότε η μεταξύ των ομάδων διακύμανση bMS υπερεκτιμά τη σ2 δίνει δηλαδή μια τιμή εκτίμησης

μεγαλύτερη της σ2.

Επομένως, ο λόγος

w

b

MSMSF

Page 9: ΣΤΑΤΙΣΤΙΚΗ 2

9

της μεταξύ των ομάδων διακύμανσης προς την εντός των ομάδων διακύμανσης θα είναι κοντά στη μονάδα όταν η μηδενική υπόθεση αληθεύει. Αντίθετα, θα είναι μεγαλύτερος της μονάδας όταν η μηδενική υπόθεση απορρίπτεται. Με την προϋπόθεση ότι η μηδενική υπόθεση ισχύει, το παραπάνω στατιστικό F ακολουθεί προσεγγιστικά την κατανομή F με (k - 1) και (Ν - k) βαθμούς ελευθερίας. Συγκρίνοντας συνεπώς την τιμή του στατιστικού με την κατάλληλη κρίσιμη τιμή της κατανομής F (Πίνακας 1 του παραρτήματος) οδηγούμαστε ή στο να αποδεχθούμε τη μηδενική υπόθεση ως έγκυρη, ή αντίθετα στο να την απορρίψουμε και να δεχθούμε την αλήθεια της εναλλακτικής υπόθεσης.

1.2.2. Υπολογιστικοί τύποι

Για την ευχερέστερη διεξαγωγή των αριθμητικών υπολογισμών χρησιμοποιούνται συνήθως αλγεβρικά ισοδύναμες μορφές των τριών διαφορετικών διακυμάνσεων. Συγκεκριμένα, υπολογίζονται αρχικά οι εξής βοηθητικές ποσότητες Α, Β και Γ:

k

1i

n

1j

2ij

i

X ,

k

1i i

2n

1jij

n

Xi

και 2

k

1i

n

1jij

i

XN1

Χρησιμοποιώντας τις ποσότητες αυτές, τα τρία μέσα τετράγωνα (διακυμάνσεις) υπολογίζονται ως εξής

Συνολικό μέσο τετράγωνο

A1N

1MS tot

Μεταξύ των ομάδων μέσο τετράγωνο

B1k

1MSb

Εντός των ομάδων μέσο τετράγωνο BAkN

1MSw

1.2.3. Δείκτης η2

Ο δείκτης η2 (eta-squared) αποτελεί ένα μέτρο για το μέγεθος της επίδρασης (effect size) και ορίζεται ως ο λόγος του μεταξύ των ομάδων αθροίσματος τετραγώνων προς το συνολικό άθροισμα τετραγώνων

wb

b

tot

b2

SSSSSS

SSSSη

Page 10: ΣΤΑΤΙΣΤΙΚΗ 2

10

Εκφράζει το τμήμα (ποσοστό) της συνολικής διασποράς που εξηγείται από την επίδραση του παράγοντα. Η τιμή η2 συνοδεύει συνήθως τα αποτελέσματα από την εφαρμογή της ANOVA επειδή μας δίνει το μέγεθος της επίδρασης της ανεξάρτητης μεταβλητής στην εξαρτημένη δηλαδή το βαθμό διαφοροποίησης των μέσων όρων των k ομάδων της ανεξάρτητης μεταβλητής. Ορισμένες φορές χρησιμοποιείται ως μέτρο του βαθμού της σύνδεσης μεταξύ δύο μεταβλητών στην περίπτωση που η μία από τις δύο είναι ποσοτική ενώ η άλλη είναι κατηγορική. Οι τιμές του δείκτη η2 βρίσκονται στο διάστημα [0, 1] και το μέγεθος της επίδρασης είναι πιο έντονο όσο η τιμή του πλησιάζει την τιμή 1.

Παράδειγμα 1.1

Ένας ερευνητής επιθυμεί να μελετήσει την επίδραση τεσσάρων συνδυασμών από οπτικοακουστικά ερεθίσματα κλιμακούμενης έντασης στο χρόνο αντίδρασης. Τα διαφορετικά αυτά ερεθίσματα συμβολίζονται Ε1, Ε2, Ε3 και Ε4 από το ερέθισμα με τη μικρότερη ένταση έως αυτό με τη μεγαλύτερη. Στο πείραμα συμμετείχαν συνολικά 18 άτομα τα οποία κατανεμήθηκαν με τυχαία διαδικασία σε τέσσερις πειραματικές ομάδες. Στην ομάδα που δέχτηκε το ερέθισμα Ε1 βρέθηκαν 4 άτομα, στην ομάδα που δέχτηκε το ερέθισμα Ε2 5 άτομα, στην ομάδα με το ερέθισμα Ε3 4 άτομα και τέλος στην ομάδα που δέχτηκε το ερέθισμα Ε4 βρέθηκαν 5 άτομα. Κατόπιν μετρήθηκε ο χρόνος αντίδρασης και συγκεντρώθηκαν οι εξής τιμές (σε εκατοστά του δευτερολέπτου) :

Ερέθισμα

E1 E2 E3 E4

37 32 30 27

34 33 29 26

36 34 33 28

40 37 32 30

33 34

Επειδή η κατανομή των ατόμων στις 4 ομάδες έγινε με τυχαίο τρόπο έχουμε ένα πλήρως τυχαιοποιημένο πειραματικό σχέδιο (completely randomized

Page 11: ΣΤΑΤΙΣΤΙΚΗ 2

11

experimental design). Ο παράγοντας του οποίου μελετούμε την επίδραση στο χρόνο αντίδρασης είναι η κατηγορική μεταβλητή «ερέθισμα» με 4 επίπεδα Ε1, Ε2, Ε3 και Ε4. Θεωρούμε ότι οι 4 μετρήσεις του χρόνου αντίδρασης στο ερέθισμα Ε1 αποτελούν τυχαίο δείγμα παρμένο μέσα από έναν υποθετικό και θεωρητικά άπειρο πληθυσμό μετρήσεων του χρόνου αντίδρασης στο ερέθισμα Ε1. Η ίδια παραδοχή ισχύει και για τις μετρήσεις στα τρία υπόλοιπα ερεθίσματα Ε2, Ε3 και Ε4. Θεωρούμε ακόμη ότι οι 4 αυτοί πληθυσμοί ακολουθούν κανονικές κατανομές με ίσες διακυμάνσεις ( 1

222

42 2 =3

2 ). Έστω μ1, μ2, μ3, μ4 είναι οι άγνωστοι μέσοι όροι των 4 κανονικά κατανεμημένων πληθυσμών. Η μηδενική υπόθεση διατυπώνεται:

43210 μμμμ:H

Αν η Η0 αληθεύει, τότε ο παράγοντας «ερέθισμα» δεν επιδρά στο χρόνο αντίδρασης των ατόμων. Στο αντίθετο συμπέρασμα καταλήγουμε όταν τουλάχιστον δύο από τους τέσσερις μέσους όρους διαφέρουν μεταξύ τους. Αυτή η τελευταία περίπτωση εκφράζει την εναλλακτική υπόθεση

Η1 : οι τέσσερις μέσοι όροι δεν είναι όλοι ίσοι

Για την επίλυση του παραδείγματος απαιτείται πρώτα ο υπολογισμός των βοηθητικών ποσοτήτων Α, Β, και Γ (βλέπε παραπάνω):

k

1i

n

1j

2ij

i

X = 372 + 342 + 362 + .... 302 + 342 = 19247

k

1i i

2n

1jij

n

Xi

= 5

1454

1245

1694

147 2222

= 19163.45

2k

1i

n

1jij

i

XN1

= 18

5852

= 19012.5

Επομένως, για τα τρία αθροίσματα τετραγώνων έχουμε

Συνολικό άθροισμα τετραγώνων

SStot = [A - Γ] = [19247 – 19012.5] = 234.5

Μεταξύ των ομάδων άθροισμα τετραγώνων

SSb = [B - Γ] = [19163.45 – 19012.5] = 150.95

Page 12: ΣΤΑΤΙΣΤΙΚΗ 2

12

Εντός των ομάδων άθροισμα τετραγώνων

SSw = [A - Β] = [19247 - 19163.45] = 83.55

Παρατηρούμε ότι η σχέση

SStot = bSS + wSS

Επαληθεύεται επειδή

234.5 = 150.95 + 83.55

Το μεταξύ των ομάδων μέσο τετράγωνο έχει τιμή

1kSSMS b

b =

1495.150

= 50.317

και το εντός των ομάδων μέσο τετράγωνο την τιμή

kNSSMS w

w =

41855.83

= 5.968

Επομένως, ο λόγος F θα ισούται με

w

b

MSMSF =

968.5317.50 = 8.431

Για (k - 1) = (4 - 1) = 3 και (N - k) = (18 - 4) = 14 βαθμούς ελευθερίας, στο επίπεδο σημαντικότητας α = 0.05, η κρίσιμη τιμή από τον πίνακα της κατανομής F (Πίνακας 1 του παραρτήματος) είναι 3.34. Επειδή η τιμή 8.431 είναι μεγαλύτερη της κρίσιμης τιμής απορρίπτουμε τη μηδενική υπόθεση. Καταλήγουμε λοιπόν στο συμπέρασμα ότι ο παράγοντας «ερέθισμα» επιδρά στο χρόνο αντίδρασης δηλαδή δύο τουλάχιστον από τους τέσσερις μέσους όρους του χρόνου αντίδρασης διαφέρουν μεταξύ τους.

Τα αποτελέσματα της ανάλυσης διασποράς με έναν παράγοντα παρουσιάζονται συνοπτικά με τη μορφή ενός πίνακα που ονομάζεται «πίνακας ανάλυσης διασποράς». Στον πίνακα αυτόν εμφανίζονται, όπως παρατηρούμε, οι τρεις πηγές διασποράς με τη μορφή αθροισμάτων τετραγώνων και μέσων τετραγώνων (διακυμάνσεων), οι αντίστοιχοι βαθμοί ελευθερίας και τελικά η τιμή του λόγου F.

Page 13: ΣΤΑΤΙΣΤΙΚΗ 2

13

Πίνακας ανάλυσης διασποράς

Πηγή διασποράς Βαθμοί ελευθερίας

Άθροισμα τετραγώνων

Μέσο τετράγωνο

F

Μεταξύ των ομάδων 3 150.95 50.317 8.431

Εντός των ομάδων 14 83.55 5.968

Συνολική 17 234.50

Ας υπολογίσουμε επίσης την τιμή του δείκτη η2 για το μέγεθος της επίδρασης

tot

b2

SSSS

= 5.234

95.150 = 0.644

Παρατηρούμε ότι το 64.4% της συνολικής διασποράς αποδίδεται στην επίδραση της ανεξάρτητης μεταβλητής. Αυτό μας δείχνει μία σημαντικού βαθμού διαφοροποίηση των 4 δειγματικών μέσων όρων. Οι μέσοι αυτοί όροι για τις 4 ομάδες είναι X1 = 36.75, X2 = 33.80, X3 = 31 και X4 = 29 αντίστοιχα. Υποδηλώνει επίσης μια σημαντικού βαθμού σύνδεση μεταξύ της εξαρτημένης μεταβλητής που είναι ο χρόνος αντίδρασης και της ανεξάρτητης που είναι τα ερεθίσματα διαφορετικής έντασης.

1.2.4. Σχολιασμός των προϋποθέσεων εφαρμογής της μεθόδου

Έχουμε ήδη αναφέρει ότι η έγκυρη εφαρμογή της ανάλυσης διασποράς απαιτεί κανονικότητα των πληθυσμών και ισότητα των διακυμάνσεων τους. Επειδή στην πράξη είναι συνήθως δύσκολο να ικανοποιηθούν αυτές οι θεωρητικές προϋποθέσεις, παρουσιάζει ενδιαφέρον να δούμε κατά πόσο η μέθοδος συνεχίζει να δίνει έγκυρα αποτελέσματα όταν υπάρχει απόκλιση από αυτές. Διάφορες έρευνες έχουν δείξει ότι η ανάλυση διασποράς εμφανίζει αντοχή ως προς τη μη ικανοποίηση των προϋποθέσεων όταν τα δείγματα είναι ισομεγέθη και μεγάλα. Συγκεκριμένα, δικαιολογείται η μη ύπαρξη ομοιογένειας των διακυμάνσεων στην περίπτωση που τα δείγματα έχουν ίσα ή περίπου ίσα μεγέθη. Όσον αφορά στην προϋπόθεση της κανονικότητας των μετρήσεων, έχει βρεθεί ότι όταν τα μεγέθη των δειγμάτων είναι μεγάλα τότε αυτή είναι δευτερεύουσας σημασίας αρκεί βέβαια οι κατανομές να μην είναι ιδιαίτερα ασύμμετρες.

Page 14: ΣΤΑΤΙΣΤΙΚΗ 2

14

1.2.5. Έλεγχοι πολλαπλών συγκρίσεων

Από τη στιγμή που η μηδενική υπόθεση της ανάλυσης διασποράς απορριφθεί είναι ενδιαφέρον, από ερευνητικής άποψης, να εντοπιστούν τα ζεύγη των ομάδων που οι μέσοι όροι τους διαφέρουν στατιστικώς σημαντικά. Για το λόγο αυτό χρησιμοποιούνται οι έλεγχοι πολλαπλών ή ζευγαρωτών συγκρίσεων. Ο στόχος τους είναι να συγκρίνουν στατιστικώς τα διάφορα ζεύγη μέσων όρων με ταυτόχρονη όμως συγκράτηση του κινδύνου σφάλματος Ι (της πιθανότητας λανθασμένης απόρριψης της μηδενικής υπόθεσης) σε χαμηλά επίπεδα. Στις περισσότερες περιπτώσεις, οι έλεγχοι πολλαπλών συγκρίσεων είναι post hoc, δηλαδή χρησιμοποιούνται αφού έχει προηγηθεί η εφαρμογή της ανάλυσης διασποράς που οδήγησε στην απόρριψη της μηδενικής υπόθεσης. Παρακάτω, θα αναφερθούμε σε έναν από τους πλέον χρησιμοποιούμενους ελέγχους πολλαπλών συγκρίσεων, τον έλεγχο Tukey .

1.2.5.1. Έλεγχος Tukey

Ο έλεγχος Tukey ελέγχει όλα τα ζεύγη των μέσων όρων των ομάδων δηλαδή συνολικά k(k-1)/2 ζεύγη. Η εφαρμογή του απαιτεί την ικανοποίηση των προϋποθέσεων της ανάλυσης διασποράς (1.2.1.). Οι μηδενικές υποθέσεις αφορούν στην ισότητα των μέσων όρων όλων των ζευγών

H0 : ii μμ για όλα τα ζεύγη i,i

Η μέθοδος χρησιμοποιείται για ισομεγέθεις ομάδες (n1 = n2 = .... = nk = n). Αν iX και iX είναι αντίστοιχα οι μέσοι όροι δύο ομάδων, το στατιστικό q με το

οποίο ελέγχεται η υπόθεση Η0 : i = i δίνεται από τον τύπο

nMS

XXqw

iiii

όπου στον αριθμητή ο πρώτος μέσος όρος είναι πάντοτε μεγαλύτερος του δεύτερου.

Όταν τα μεγέθη των δειγμάτων διαφέρουν ελαφρά, ο παρονομαστής του λόγου q αντικαθίσταται από την ποσότητα

ii

w

n1

n1

2MS

Page 15: ΣΤΑΤΙΣΤΙΚΗ 2

15

όπου in και in είναι τα μεγέθη των δειγμάτων των οποίων οι μέσοι όροι είναι iX και iX αντίστοιχα. Με αυτήν την τροποποίηση η μέθοδος εξακολουθεί να δίνει έγκυρα αποτελέσματα ακόμα και όταν έχουμε ελαφρώς άνισα δείγματα.

Παράδειγμα 1.2

Για την εφαρμογή της μεθόδου Tukey, υπολογίζουμε, με βάση τα δεδομένα του παραδείγματος 1, την τιμή των 4 δειγματικών μέσων όρων: X1 = 36.75, X2 = 33.80, X3 = 31, και X4 = 29. Τα μεγέθη των δειγμάτων είναι αντίστοιχα n1 = 4, n2 = 5, n3 = 4 και n4 = 5. Επειδή k = 4 το πλήθος των ζευγών είναι k(k-1)/2 = 4(4-1)/2 = 6.

Αρχίζουμε ελέγχοντας την υπόθεση Η0 : μ1 = μ2

41

w

412,1

n1

n1

2MS

XXq =

51

41

2968.5

80.3375.36 = 2.55

Η τιμή αυτή συγκρίνεται με την κρίσιμη τιμή qα, Ν-k, k που δίνεται από τον Πίνακα 2 του παραρτήματος. Οι κρίσιμες αυτές τιμές εξαρτώνται από το επίπεδο σημαντικότητας του ελέγχου α, τους βαθμούς ελευθερίας N-k της εντός των ομάδων διακύμανσης, και το πλήθος των k ομάδων. Συνεπώς για α = 0.05, N-k = 14 βαθμούς ελευθερίας και k = 4, η κρίσιμη τιμή q0.05,14,4 = 4.11. Επειδή q1,2 < q0.05,14,4 (2.55 < 4.11) η μηδενική υπόθεση δε μπορεί να απορριφθεί.

Στο επόμενο βήμα, ελέγχεται η υπόθεση Η0 : μ1 = μ3

3,1q

41

41

2968.5

00.3175.36 = 4.71, η οποία απορρίπτεται επειδή 4.71 > 4.11.

Με τον ίδιο τρόπο βρίσκουμε ότι q1,4 = 6.69, q2,3 = 2.42, q2,4 = 6.22, q3,4 = 1.73

Συνολικά, οι τιμές q1,4, q2,4, και q1,3 είναι μεγαλύτερες από την κρίσιμη τιμή οπότε ισχύουν οι εξής εναλλακτικές υποθέσεις:

Η1 : μ1 μ4

Η1 : μ2 μ4

Page 16: ΣΤΑΤΙΣΤΙΚΗ 2

16

Η1 : μ1 μ3

Παρατηρώντας και πάλι τις τιμές των δειγματικών μέσων όρων καταλήγουμε στο συμπέρασμα ότι κάτω από το ερέθισμα Ε4 ο μέσος χρόνος αντίδρασης είναι στατιστικώς σημαντικά μικρότερος από αυτούς των ερεθισμάτων Ε1 και Ε2, όπως επίσης και κάτω από το ερέθισμα Ε3 ο μέσος χρόνος αντίδρασης είναι σημαντικά μικρότερος από αυτόν του ερεθίσματος Ε1. Συνεπώς, οπτικοακουστικά ερεθίσματα με μεγαλύτερη ένταση αντιστοιχούν σε σημαντικά μικρότερους χρόνους αντίδρασης συγκρινόμενα με ερεθίσματα μικρότερης έντασης. Για τις υπόλοιπες τρεις ζευγαρωτές συγκρίσεις ισχύουν οι μηδενικές υποθέσεις συνεπώς δεν παρατηρούνται στατιστικώς σημαντικές διαφορές μεταξύ των αντίστοιχων ομάδων – ερεθισμάτων.

1.2.6. Αντιθέσεις

Ονομάζεται αντίθεση (contrast) μεταξύ των μέσων όρων μ1, μ2, ..., μk k πληθυσμών ο γραμμικός συνδυασμός

kk2211 μW...μWμWψ

όπου για τους συντελεστές W1, W2, ..., Wk ισχύει ο εξής περιορισμός

W W Wk1 2 0 ...

Με άλλα λόγια, οι συντελεστές W είναι πάντοτε θετικοί και αρνητικοί αριθμοί (ή 0) με άθροισμα πάντοτε 0.

Μία εκτίμηση της αντίθεσης βασίζεται στους δειγματικούς μέσους όρους και η τιμή της μπορεί να υπολογιστεί από τη σχέση

kk2211 XW...XWXW

Μία αντίθεση ονομάζεται απλή όταν είναι μεταξύ δύο μόνο μέσων όρων. Έτσι, η αντίθεση ψ = (+1)μ1 + (-1)μ4 δηλαδή τελικά ψ= μ1- μ4 είναι απλή γιατί αφορά δύο μόνο μέσους όρους. Παρατηρούμε ότι W1 = 1 και W2 = -1 και W1 +

W2 = 1 + (-1) = 1 – 1 = 0.

Αν μία αντίθεση αναφέρεται σε περισσότερους των δύο μέσων όρων τότε ονομάζεται σύνθετη. Έτσι, η αντίθεση ψ = (1)μ1 + (-1)μ2 + (1)μ3 + (-1)μ4 δηλαδή ψ = μ1 – μ2 + μ3 – μ4 όπως και η ψ = (1/2)μ1 + (1/2)μ2 + (-1)μ3 δηλαδή η ψ = (1/2)μ1 + (1/2)μ2 – μ3 είναι σύνθετες αντιθέσεις γιατί η πρώτη είναι

Page 17: ΣΤΑΤΙΣΤΙΚΗ 2

17

μεταξύ τεσσάρων μέσων όρων ενώ η δεύτερη μεταξύ τριών. Παρατηρούμε ότι σε όλες τις περιπτώσεις το άθροισμα των συντελεστών W είναι μηδέν.

H στατιστική σημαντικότητα μίας αντίθεσης, δηλαδή ο έλεγχος της υπόθεσης

Η0: ψ = 0

ελέγχεται με τη βοήθεια του στατιστικού

wk

2k

2

22

1

21

ˆ

MSnW...

nW

nW

ˆt

Στον τύπο αυτό, wMS είναι το εντός των ομάδων μέσο τετράγωνο της

ανάλυσης διασποράς.

Ο παραπάνω τύπος απλοποιείται στην περίπτωση απλών αντιθέσεων δηλαδή όταν συγκρίνουμε δύο μέσους όρους μεταξύ τους. Έτσι, αν έχουμε τους μέσους όρους μ1 και μ2 ο έλεγχος της υπόθεσης

Η0: ψ = 0 δηλαδή Η0: μ1 – μ2 = 0 και τελικά Η0: μ1 = μ2

πραγματοποιείται μέσω του τύπου

w21

212,1

MSn1

n1

XXt

Η κρίσιμη τιμή όμως με την οποία συγκρίνεται η τιμή του στατιστικού t

ποικίλει από μέθοδο σε μέθοδο. Προϋπόθεση για την διεξαγωγή του ελέγχου είναι η ισότητα των διακυμάνσεων των k πληθυσμών 1

222 2 2 .......= k

που είναι απαραίτητη για την εκτίμηση της κοινής διακύμανσης σ2 από το εντός των ομάδων μέσο τετράγωνο wMS της ανάλυσης διασποράς.

1.2.6.1. Έλεγχος Scheffe

Η μέθοδος αυτή επιτρέπει τον έλεγχο σημαντικότητας αντιθέσεων οποιασδήποτε μορφής αφού προηγουμένως η μηδενική υπόθεση της ανάλυσης διασποράς απορριφθεί. Με τον τρόπο αυτό ο ερευνητής έχει τη δυνατότητα να ελέγξει συγκεκριμένες ερευνητικές υποθέσεις. Μπορεί επίσης να εφαρμοστεί και ως μέθοδος ζευγαρωτών συγκρίσεων για όλα τα ζεύγη των μέσων όρων (όπως η μέθοδος Tukey) αφού προηγουμένως η ανάλυση

Page 18: ΣΤΑΤΙΣΤΙΚΗ 2

18

διασποράς αποβεί στατιστικώς σημαντική. Για την εφαρμογή της μεθόδου υπολογίζονται πρώτα οι τιμές των αντιθέσεων και η στατιστική σημαντικότητα τους (Η0 : = 0) ελέγχεται βάσει του στατιστικού της παραγράφου 1.2.6.

wk

2k

2

22

1

21

ˆ

MSnW...

nW

nW

ˆt

Η κρίσιμη τιμή S ως προς την οποία συγκρίνονται οι τιμές του παραπάνω στατιστικού δίνεται από τον τύπο

S k Fc 1

όπου k είναι ο αριθμός των ομάδων και Fc είναι η κρίσιμη τιμή της κατανομής F για (k-1) και (Ν-k) βαθμούς ελευθερίας δηλαδή η κρίσιμη τιμή βάσει της οποίας ελέγχεται η σημαντικότητα της ανάλυσης διασποράς. Η μηδενική υπόθεση απορρίπτεται όταν

t S

Η μέθοδος Scheffe χρησιμοποιεί την κρίσιμη τιμή S για τον έλεγχο του συνόλου των αντιθέσεων - απλών και σύνθετων - που μπορούν να ορισθούν με βάση τους υπάρχοντες μέσους όρους. Αυτό καθιστά τη μέθοδο «συντηρητική» ως προς την πιθανότητα απόρριψης των διαφόρων μηδενικών υποθέσεων των αντιθέσεων σε σχέση με άλλες μεθόδους πολλαπλών συγκρίσεων όπως αυτή του Tukey (1.2.4.1.). Με άλλα λόγια, στη μέθοδο Scheffe, ο κίνδυνος σφάλματος τύπου Ι εμφανίζεται να είναι μικρότερος σε σχέση με άλλες μεθόδους αλλά αυτό έχει ως συνέπεια την αύξηση του κινδύνου σφάλματος τύπου ΙΙ δηλαδή της πιθανότητας (β) μη απόρριψης μιας λανθασμένης μηδενικής υπόθεσης. Αυτό έχει επίσης ως αποτέλεσμα η μέθοδος να εμφανίζει μικρή ισχύ (1 – β).

Παράδειγμα 1.3

Στη συνέχεια του παραδείγματος 1.1, ας θεωρήσουμε ότι, αφού η μηδενική υπόθεση της ανάλυσης διασποράς απορρίφθηκε, ο ερευνητής επιθυμεί

i) να πραγματοποιήσει post hoc έλεγχο ζευγαρωτών συγκρίσεων μεταξύ των μέσων όρων και των τεσσάρων ομάδων.

Page 19: ΣΤΑΤΙΣΤΙΚΗ 2

19

ii) να ελέγξει τη στατιστική σημαντικότητα των εξής δύο σύνθετων αντιθέσεων:

1) ψ1 : [(1/2)μ1 + (1/2)μ2)] – [(1/2)μ3 + (1/2)μ4)]

2) ψ2 : (1/3)μ1 + (1/3)μ2 + (1/3)μ3 – (1)μ4

i) Οι 4 μέσοι όροι είναι αντίστοιχα:

1X = 147/4 = 36.75, 2X = 169/5 = 33.80, 3X = 124/4 = 31 και 4X = 145/5 = 29.

Με εφαρμογή του απλοποιημένου τύπου για τον έλεγχο απλών αντιθέσεων (ζευγαρωτών συγκρίσεων) (1.2.6.) βρίσκουμε

968.551

41

80.3375.36t 2,1

= 1.80 968.5

41

41

3175.36t 3,1

= 3.33

968.551

41

2975.36t 4,1

= 4.73 968.5

41

51

3180.33t 3,2

= 1.71

968.551

51

2980.33t 4,2

= 3.11 968.5

51

41

2931t 4,3

=1.22

Η κρίσιμη τιμή του ελέγχου Scheffe είναι

cF1kS = )34.3(3 = 3.17

Συνεπώς, οι μόνες στατιστικώς σημαντικές διαφορές είναι μεταξύ (1 και 4) και (1 και 3). Από τους δειγματικούς μέσους όρους φαίνεται ότι κάτω από το ερέθισμα Ε1 ο χρόνος αντίδρασης των ατόμων είναι σημαντικά μεγαλύτερος σε σύγκριση με τα ερεθίσματα Ε3 και Ε4. Ας σημειωθεί ότι με τη μέθοδο Tukey (1.2.5.1.) είχε βρεθεί ακόμα μια διαφορά μεταξύ των ερεθισμάτων Ε2 και Ε4.

ii) Η πρώτη αντίθεση εκφράζει τη σύγκριση του μέσου όρου των δύο πρώτων πειραματικών ομάδων με το μέσο όρο των δύο τελευταίων. Με τη δεύτερη αντίθεση συγκρίνονται ο μέσος όρος των τριών πρώτων ομάδων με την τελευταία ομάδα. Με βάση τα πειραματικά δεδομένα, οι μέσοι όροι του χρόνου αντίδρασης στις τέσσερις ομάδες είναι X1 = 36.75, X2 = 33.80, X3 = 31, X4 = 29. Επίσης n1 = n3 = 4 και n2 = n4 = 5.

Page 20: ΣΤΑΤΙΣΤΙΚΗ 2

20

Ας θεωρήσουμε την πρώτη αντίθεση. Η τιμή της θα είναι

]292/1312/1[]80.332/175.362/1[

275.5292/1312/180.332/175.362/1

Αν συμβολίσουμε SE τον παρονομαστή του στατιστικού

wk

2k

2

22

1

21

ˆ

MSnW...

nW

nW

ˆt

η τιμή του, για την πρώτη αντίθεση θα είναι

SE 1588.1968.55

2/14

2/152/1

42/1 2222

και τελικά

t = 552.41588.1275.5

Με την ίδια λογική υπολογίζουμε τα αποτελέσματα για τη δεύτερη αντίθεση.

Συνοπτικά, θα έχουμε για τις δύο αντιθέσεις τα εξής αποτελέσματα

Αντιθέσεις SE t

1) 5.275 1.1588 4.552

2) 4.850 1.2875 3.767

Για α = 0.05 και επειδή Fc = 3.34 για (3, 14 ) βαθμούς ελευθερίας, η κρίσιμη τιμή του Scheffe είναι S k Fc 1 = 4 1 334 . = 3.17. Η τιμή αυτή είναι μικρότερη από τις δύο παραπάνω τιμές t .

Συνεπώς, οι δύο αντιθέσεις είναι στατιστικώς σημαντικές και ισχύουν τελικά οι ακόλουθες δύο εναλλακτικές υποθέσεις:

Η1 : (1/2)μ1 + (1/2)μ2 (1/2)μ3 + (1/2)μ4 δηλαδή 2

μμ2

μμ 4321

Δηλαδή, ο μέσος όρος του χρόνου αντίδρασης στα δύο πρώτα ερεθίσματα διαφέρει στατιστικώς από το μέσο όρο των δύο τελευταίων. Από τις τιμές των δειγματικών μέσων όρων συμπεραίνουμε ότι κατά μέσο όρο, κάτω από τα δύο πρώτα ερεθίσματα μικρότερης έντασης ο χρόνος αντίδρασης είναι

Page 21: ΣΤΑΤΙΣΤΙΚΗ 2

21

σημαντικά μεγαλύτερος σε σχέση με τα δύο τελευταία (μεγαλύτερης έντασης) ερεθίσματα.

1H : (1/3)μ1 + (1/3)μ2 + (1/3)μ3 μ4 δηλαδή 4321 μ

3μμμ

Δηλαδή, ο μέσος όρος του χρόνου αντίδρασης στα τρία πρώτα ερεθίσματα διαφέρει στατιστικώς από το μέσο όρο του τελευταίου ερεθίσματος Με βάση τις τιμές των δειγματικών μέσων όρων συμπεραίνουμε ότι για τα τρία πρώτα ερεθίσματα ο χρόνος αντίδρασης είναι, κατά μέσο όρο, σημαντικά μεγαλύτερος από αυτόν του τελευταίου ερεθίσματος.

Page 22: ΣΤΑΤΙΣΤΙΚΗ 2

22

1.3. Ανάλυση Διασποράς με Δύο Παράγοντες

Η μέθοδος της ανάλυσης διασποράς με δύο παράγοντες (two-way analysis of variance – ANOVA) αποτελεί επέκταση της ανάλυσης διασποράς με έναν παράγοντα (1.2.) με την έννοια ότι επιτρέπει τον έλεγχο της ταυτόχρονης επίδρασης δύο παραγόντων πάνω στην εξαρτημένη μεταβλητή. Έστω Α είναι ο πρώτος παράγοντας και Β ο δεύτερος παράγοντας. Με k θα συμβολίζουμε το πλήθος των επιπέδων (ομάδων) του παράγοντα Α και με l το πλήθος των επιπέδων (ομάδων) του B. Θεωρούμε ότι οι δύο παράγοντες είναι διασταυρούμενοι δηλαδή κάθε επίπεδο του ενός παράγοντα μπορεί να συνδυαστεί με όλα τα επίπεδα του άλλου παράγοντα. Το πειραματικό αυτό σχέδιο ονομάζεται k x l παραγοντικό (factorial) και η συγκεκριμένη μέθοδος της ανάλυσης διασποράς ονομάζεται k x l παραγοντική ανάλυση διασποράς. Για παράδειγμα, αν ο παράγοντας Α αποτελείται από 3 επίπεδα και ο Β από 4 επίπεδα θα λέμε ότι έχουμε μία 3 x 4 παραγοντική ανάλυση διασποράς. Η διασταύρωση των k επιπέδων του παράγοντα Α με τα l επίπεδα του Β δημιουργεί kl συνδυασμούς που ονομάζονται κελιά (cells). Έτσι π.χ. σε μια 2 x 3 παραγοντική ανάλυση διασποράς ορίζονται 6 κελιά, ενώ σε μια 3 x 3 παραγοντική ανάλυση διασποράς ορίζονται 9 κελιά. Η μέθοδος της ανάλυσης διασποράς με δύο παράγοντες απαιτεί την ύπαρξη ίσου αριθμού τιμών n (n > 1) μέσα σε κάθε ένα από τα kl κελιά και θεωρεί ότι οι n τιμές στο κάθε κελί αποτελούν τυχαίο δείγμα παρμένο μέσα από ένα θεωρητικά άπειρο πληθυσμό τιμών της εξαρτημένης μεταβλητής. Συνεπώς, στα kl κελιά που προκύπτουν από τη διασταύρωση των επιπέδων των δύο παραγόντων αντιστοιχούν kl ανεξάρτητοι μεταξύ τους πληθυσμοί. Επειδή, όπως είδαμε, σε κάθε κελί περιέχονται n τιμές, το συνολικό πλήθος των τιμών Ν, δηλαδή το συνολικό μέγεθος του δείγματος, θα είναι Ν = nkl.

1.3.1. Προϋποθέσεις εφαρμογής της μεθόδου

Οι προϋποθέσεις εφαρμογής της ανάλυσης διασποράς με δύο παράγοντες είναι παρόμοιες με αυτές της ανάλυσης διασποράς με έναν παράγοντα.

1) Τα kl δείγματα επιλέγονται μέσα από τους αντίστοιχους πληθυσμούς με τυχαίο τρόπο και ανεξάρτητα το ένα από το άλλο.

2) Μέσα σε κάθε έναν από τους kl πληθυσμούς η εξαρτημένη μεταβλητή ακολουθεί κανονική κατανομή.

3) Οι kl κανονικές κατανομές έχουν την ίδια (κοινή) διακύμανση σ2.

Page 23: ΣΤΑΤΙΣΤΙΚΗ 2

23

Με την εφαρμογή της ανάλυσης διασποράς με δύο παράγοντες στοχεύουμε στην διερεύνηση τριών αρχικών (μηδενικών) υποθέσεων. Οι δύο υποθέσεις αφορούν την επίδραση ή όχι των δύο παραγόντων στην εξαρτημένη μεταβλητή και ονομάζονται κύριες επιδράσεις (main effects) ενώ η τρίτη υπόθεση αφορά την ύπαρξη ή όχι αλληλεπίδρασης (interaction) μεταξύ των δύο παραγόντων. Κατά έναν γενικό τρόπο θα λέμε ότι η μη ύπαρξη αλληλεπίδρασης μεταξύ δύο παραγόντων σημαίνει ότι η επίδραση του ενός παράγοντα είναι ανεξάρτητη της επίδρασης του άλλου παράγοντα. Αντίθετα, η ύπαρξη αλληλεπίδρασης υποδηλώνει ότι η επίδραση του ενός παράγοντα, στην εξαρτημένη μεταβλητή, εξαρτάται από συγκεκριμένα επίπεδα του άλλου παράγοντα.

Ας συμβολίζουμε με Xi. το μέσο όρο των τιμών που αντιστοιχούν στο επίπεδο i του παράγοντα Α, και με X j. το μέσο όρο των τιμών που αντιστοιχούν στο επίπεδο j του παράγοντα B. Αν .iμ και j.μ είναι οι άγνωστοι μέσοι όροι των πληθυσμών οι αντίστοιχοι των X i. και X j. , οι τρεις μηδενικές υποθέσεις

διατυπώνοντας ως εξής

H k0 1 2 ... : . . .

H l0 1 2'

. . .: ...

''0H : δεν υπάρχει αλληλεπίδραση μεταξύ των δύο παραγόντων

Στην ανάλυση διασποράς με δύο παράγοντες ορίζονται πέντε διαφορετικές πηγές διασποράς: το συνολικό άθροισμα τετραγώνων totSS , το μεταξύ των ομάδων του παράγοντα Α άθροισμα τετραγώνων ASS , το μεταξύ των ομάδων του παράγοντα B άθροισμα τετραγώνων BSS , το άθροισμα τετραγώνων της αλληλεπίδρασης ABSS και τέλος το εντός των κελιών άθροισμα τετραγώνων WSS .

Αποδεικνύεται ότι για τα αθροίσματα τετραγώνων ισχύει η ακόλουθη σχέση:

SS SS SS SS SStot A B AB W

Η σχέση αυτή εκφράζει την εξίσωση της ανάλυσης διασποράς με δύο παράγοντες. Σύμφωνα με αυτήν, το συνολικό άθροισμα τετραγώνων αναλύεται σε τέσσερις συνιστώσες που είναι το μεταξύ των ομάδων του παράγοντα Α άθροισμα τετραγώνων, το μεταξύ των ομάδων του παράγοντα Β άθροισμα τετραγώνων, το άθροισμα τετραγώνων της αλληλεπίδρασης και το εντός των κελιών άθροισμα τετραγώνων.

Page 24: ΣΤΑΤΙΣΤΙΚΗ 2

24

Μια σχέση ανάλογη της παραπάνω ισχύει και για τους αντίστοιχους βαθμούς ελευθερίας

N k l k l N kl 1 1 1 1 1

Αποκτούμε τις αντίστοιχες διακυμάνσεις (ή αλλιώς μέσα τετράγωνα MS) διαιρώντας τα παραπάνω αθροίσματα τετραγώνων με τους κατάλληλους βαθμούς ελευθερίας:

1NSSMS tot

tot ,

1kSSMS A

A ,

1lSSMS B

B , 1l1k

SSMS ABAB

,

klNSSMS W

w

Κατά αντιστοιχία της ανάλυσης διασποράς με έναν παράγοντα, θεωρούμε ότι η εντός των κελιών διακύμανση αφορά στο πειραματικό σφάλμα (τυχαίοι και ανεξέλεγκτοι παράγοντες και ατομικές διαφορές) ενώ οι άλλες τρεις πηγές διακύμανσης οφείλονται στις κύριες επιδράσεις των δύο παραγόντων καθώς και στην αλληλεπίδραση τους.

Αποδεικνύεται, ότι η εντός των κελιών διακύμανση αποτελεί πάντοτε αμερόληπτη εκτίμηση της άγνωστης κοινής διακύμανσης σ2 των kl πληθυσμών ενώ όταν ισχύουν οι αντίστοιχες μηδενικές υποθέσεις οι τρεις άλλες διακυμάνσεις αποτελούν και αυτές αμερόληπτες εκτιμήσεις της άγνωστης κοινής διακύμανσης σ2.

Επομένως η αλήθεια των τριών μηδενικών υποθέσεων ελέγχεται σχηματίζοντας

για τον παράγοντα Α, το λόγο

w

AA MS

MSF

και συγκρίνοντας τον με τις κρίσιμες τιμές της κατανομής F για (k - 1) και (Ν - kl) βαθμούς ελευθερίας.

για τον παράγοντα B, το λόγο

w

BB MS

MSF

Page 25: ΣΤΑΤΙΣΤΙΚΗ 2

25

και συγκρίνοντας τον με τις κρίσιμες τιμές της κατανομής F για (l - 1) και (Ν - kl) βαθμούς ελευθερίας.

για την αλληλεπίδραση ΑΒ το λόγο

w

ABAB MS

MSF

και συγκρίνοντας τον με τις κρίσιμες τιμές της κατανομής F για (k - 1)(l - 1) και (Ν - kl) βαθμούς ελευθερίας.

1.3.2. Υπολογιστικοί τύποι

Οι τύποι που ακολουθούν επιτρέπουν τον υπολογισμό των διαφόρων αθροισμάτων τετραγώνων. Θεωρούμε καταρχήν τη βοηθητική ποσότητα

CN

Xijmm

n

j

l

i

k

1

111

2

που είναι το τετράγωνο του αθροίσματος όλων των τιμών διαιρεμένο με το πλήθος τους Ν. Οπότε, τα διάφορα αθροίσματα τετραγώνων SS υπολογίζονται ως εξής

Συνολικό άθροισμα τετραγώνων

SS X Ctot ijmm

n

j

l

i

k

2

111

Μεταξύ των κελιών άθροισμα τετραγώνων

SSn

X Cijmm

n

j

l

i

k

1

1

2

11

Εντός των κελιών άθροισμα τετραγώνων

SS SS SSw tot

Μεταξύ των επιπέδων του παράγοντα Α άθροισμα τετραγώνων

SS X CA ijmm

n

j

l

i

k

1

11

2

1ln

Μεταξύ των επιπέδων του παράγοντα B άθροισμα τετραγώνων

Page 26: ΣΤΑΤΙΣΤΙΚΗ 2

26

SSkn

X CB ijmm

n

i

k

j

l

1

11

2

1

Άθροισμα τετραγώνων της αλληλεπίδρασης

SS SS SS SSAB A B

1.3.3. Δείκτης 2pη

Ο δείκτης 2pη (partial eta-squared) αποτελεί ένα μέτρο για το μέγεθος της

επίδρασης (effect size) των κύριων επιδράσεων και της αλληλεπίδρασης στην εξαρτημένη μεταβλητή. Ορίζεται ως ο λόγος του αθροίσματος τετραγώνων της «επίδρασης» προς το άθροισμα τετραγώνων της «επίδρασης» με το εντός των κελιών άθροισμα τετραγώνων

weffect

effect2p SSSS

SSη

Στον παραπάνω τύπο συμβολίσαμε ως «επίδραση» (effect) αυτήν του παράγοντα Α, ή του παράγοντα Β ή τέλος της αλληλεπίδρασης ΑΒ. Οπότε, η ποσότητα effectSS συμβολίζει αντίστοιχα τις ποσότητες ASS , BSS και ABSS .

Οι τιμές του δείκτη 2pη κινούνται στο διάστημα [0, 1] και όσο η τιμή του

πλησιάζει το 1 τόσο μεγαλώνει και το μέγεθος της επίδρασης.

Παράδειγμα 1.4

Σε μία έρευνα που αποσκοπούσε στη διερεύνηση του εξωτερικού ελέγχου για την κατάσταση της υγείας των ατόμων, χρησιμοποιήθηκε τυχαίο δείγμα 80 ασθενών που νοσηλεύονταν για συγκεκριμένη ασθένεια. Μελετήθηκαν δύο παράγοντες που ήταν το μορφωτικό επίπεδο των ασθενών και η σοβαρότητα της κατάστασης τους. Από τα 80 άτομα του δείγματος τα 40 ήταν χαμηλού μορφωτικού επιπέδου (ομάδα Ι) ενώ τα άλλα 40 μέσου/υψηλού (ομάδα ΙΙ). Τα 40 της ομάδας Ι με χαμηλό μορφωτικό επίπεδο χωρίστηκαν σε τέσσερις υποομάδες 1, 2, 3, 4 των δέκα ατόμων ανάλογα με το βαθμό σοβαρότητας της ασθένειας από την ελαφρότερη μορφή έως την πιο σοβαρή. Το ίδιο συνέβη με τα 40 άτομα της ομάδας ΙΙ. Η επιλογή των παραγόντων έγινε για να διαπιστωθεί σε ποιο βαθμό το μορφωτικό επίπεδο επιδρά στον εξωτερικό έλεγχο και με ποιόν τρόπο ο βαθμός σοβαρότητας της ασθένειας εμπλέκεται

Page 27: ΣΤΑΤΙΣΤΙΚΗ 2

27

σε αυτήν την επίδραση. Τα αποτελέσματα που ακολουθούν συγκεντρώθηκαν μέσω ερωτηματολογίου για την μέτρηση των στάσεων των ατόμων απέναντι στην υγεία και στην ασθένεια (βλέπε πίνακα που ακολουθεί).

Στο παράδειγμα αυτό ορίζονται δύο παράγοντες που είναι το μορφωτικό επίπεδο των ατόμων και ο βαθμός σοβαρότητας της ασθένειας από την οποία πάσχουν. Ο πρώτος παράγοντας περιλαμβάνει δύο επίπεδα («χαμηλό», «μεσαίο/υψηλό») που θα συμβολίζουμε αντίστοιχα I και ΙΙ ενώ ο δεύτερος παράγοντας αποτελείται από τέσσερα επίπεδα που αντιστοιχούν στις διαφορετικές διαβαθμίσεις της σοβαρότητας της ασθένειας και θα συμβολίζουμε 1, 2, 3, 4. Πρόκειται συνεπώς για μία 2 x 4 παραγοντική ανάλυση διασποράς. Η εξαρτημένη μεταβλητή είναι φυσικά η βαθμολογία στον εξωτερικό έλεγχο όπως αυτός εκτιμάται μέσω του ερωτηματολογίου. Οι τρεις μηδενικές υποθέσεις που αντιστοιχούν στις δύο κύριες επιδράσεις των παραγόντων καθώς και στην αλληλεπίδραση τους μπορούν να διατυπωθούν ως εξής

Βαθμός Σοβαρότητας

Μορφωτικό Επίπεδο

1 2 3 4

54 53 51 46 48 53 51 45

49 55 55 54 57 46 52 46

Ι 51 51 43 45 45 47 47 49

45 47 49 46 48 49 48 43

47 45 43 53 50 44 52 46

47 41 43 39 43 45 47 51

35 38 42 44 56 39 51 45

ΙΙ 43 44 44 49 44 47 49 48

44 35 43 48 48 56 51 43

43 37 46 41 46 40 47 44

Page 28: ΣΤΑΤΙΣΤΙΚΗ 2

28

Δεν υπάρχει διαφορά στον εξωτερικό έλεγχο μεταξύ των δύο μορφωτικών επιπέδων, οπότε για τους μέσους όρους των αντίστοιχων πληθυσμών θα ισχύει

H II0: I

Αν η Η0 αληθεύει τότε ο παράγοντας «μορφωτικό επίπεδο» δε συνδέεται με τον εξωτερικό έλεγχο των ατόμων.

Δεν υπάρχει διαφορά στον εξωτερικό έλεγχο μεταξύ των ομάδων που αντιστοιχούν σε αυξανόμενο βαθμό σοβαρότητας της ασθένειας. Συνεπώς για τους μέσους όρους των τεσσάρων πληθυσμών θα ισχύει

H0 2 3 4: 1

Αν η 0H αληθεύει τότε ο παράγοντας «βαθμός σοβαρότητας της ασθένειας»

δε συνδέεται με τον εξωτερικό έλεγχο των ατόμων.

Δεν υπάρχει αλληλεπίδραση μεταξύ μορφωτικού επιπέδου και βαθμού σοβαρότητας. Αυτό σημαίνει ότι η όποια επίδραση του μορφωτικού επιπέδου στον εξωτερικό έλεγχο δε συνδέεται με κανέναν τρόπο με το βαθμό σοβαρότητας της ασθένειας. Αντίστοιχα, η επίδραση του βαθμού σοβαρότητας στον εξωτερικό έλεγχο δεν εξαρτάται από το μορφωτικό επίπεδο των ατόμων.

Για να επιλυθεί το παράδειγμα είναι χρήσιμη η κατασκευή πίνακα που να περιέχει τα αθροίσματα των τιμών που βρίσκονται στα οκτώ κελιά.

Βαθμός Σοβαρότητας

Μορφωτικό Επίπεδο 1 2 3 4 Σύνολο

I 497 485 487 479 1948

II 407 439 464 476 1786

Σύνολο 904 924 951 955 3734

Page 29: ΣΤΑΤΙΣΤΙΚΗ 2

29

Στο παράδειγμα είναι k = 2, l = 4, n = 10, N = 80. Συνεπώς

C Xijmmji

1

80 1

10

1

4

1

2 2

= 3734

80

2

= 174284.45

Συνολικό άθροισμα τετραγώνων

SS X Ctot ijmmji

2

1

10

1

4

1

2

= (542 + 492 + 512 + ... + 432 + 442) - 174284.45 =

1773.55

Μεταξύ των κελιών άθροισμα τετραγώνων

SS X Cijmmji

1

10 1

10 2

1

4

1

2

= 1

10(4972 + 4852 + 4872 + 4792 + 4072 + 4392 +

4642 + 4762) - 174284.45 = 624.15

Εντός των κελιών άθροισμα τετραγώνων

SS SS SSw tot = 1773.55 - 624.15 = 1149.4

Μεταξύ των επιπέδων του παράγοντα Α (Μορφωτικό επίπεδο) άθροισμα τετραγώνων

SS X CA ijmmji

1

4 10 1

10

1

4 2

1

2

= 140

(19482 + 17862) - 174284.45 = 328.05

Μεταξύ των επιπέδων του παράγοντα B (Βαθμός σοβαρότητας) άθροισμα τετραγώνων

SS X CB ijmmij

1

2 10 1

10

1

2 2

1

4

= 120

(9042 + 9242 + 9512 + 9552) - 174284.45 =

86.45

Άθροισμα τετραγώνων της αλληλεπίδρασης

SS SS SS SSAB A B = 624.15 - 328.05 - 86.45 = 209.65

Page 30: ΣΤΑΤΙΣΤΙΚΗ 2

30

Συνεπώς, οι αντίστοιχες διακυμάνσεις (μέσα τετράγωνα) έχουν τις τιμές

1k

SSMS AA =

1205.328

= 328.05

1l

SSMS BB =

1445.86

= 28.817

1l1kSSMS AB

AB =

209 651 3

. = 69.883

klN

SSMS Ww =

1149 480 2 4

.

= 15.964

Μπορούμε τώρα να κατασκευάσουμε τους τρεις λόγους F

Η στατιστική σημαντικότητα του παράγοντα «Μορφωτικό επίπεδο» ελέγχεται σχηματίζοντας το λόγο

w

AA MS

MSF = 328 0515 964

..

= 20.55

Για (2 - 1) και (80 - 8) δηλαδή 1 και 72 βαθμούς ελευθερίας αντίστοιχα η κρίσιμη τιμή από τον Πίνακα της κατανομής F (για α = 0.05) είναι περίπου 3.98 (Πίνακας 1 του παραρτήματος). Επειδή 20.55 > 3.98 η μηδενική υπόθεση απορρίπτεται. Το μορφωτικό επίπεδο έχει στατιστικώς σημαντική επίδραση στον εξωτερικό έλεγχο. Άτομα διαφορετικού μορφωτικού επιπέδου έχουν διαφορετικό βαθμό εξωτερικού ελέγχου.

Για τον παράγοντα «Βαθμός σοβαρότητας» είναι

w

BB MS

MSF 2881715 964

..

= 1.805

Για (4 - 1) και (80 - 8) δηλαδή 3 και 72 βαθμούς ελευθερίας αντίστοιχα η κρίσιμη τιμή από τον Πίνακα της κατανομής F είναι περίπου 2.74. Επειδή 1.805 < 2.74 δεν υπάρχει λόγος να απορρίψουμε την αντίστοιχη μηδενική υπόθεση. Φαίνεται ότι ο βαθμός σοβαρότητας της ασθένειας δεν επιδρά στον εξωτερικό έλεγχο. Με άλλα λόγια ο βαθμός εξωτερικού ελέγχου δε συνδέεται με το βαθμό σοβαρότητας της ασθένειας.

Τέλος, για την αλληλεπίδραση ΑΒ ισχύει

Page 31: ΣΤΑΤΙΣΤΙΚΗ 2

31

w

ABAB MS

MSF = 69 88315 964

..

= 4.378

Για (2 - 1)(4 - 1) και (80 - 8) δηλαδή 3 και 72 βαθμούς ελευθερίας αντίστοιχα η κρίσιμη τιμή από τον Πίνακα της κατανομής F είναι περίπου 2.74. Επειδή 4.378 > 2.74 η αλληλεπίδραση μεταξύ των δύο παραγόντων είναι στατιστικώς σημαντική άρα η επίδραση του ενός συνδέεται με την επίδραση του άλλου.

Τα αποτελέσματα από την εφαρμογή της μεθόδου συνοψίζονται στον πίνακα που ονομάζεται «Πίνακας ανάλυσης διασποράς»

Πίνακας ανάλυσης διασποράς

Πηγή διασποράς Βαθμοί ελευθερίας

Άθροισμα τετραγώνων

Μέσο τετράγωνο

F

Παράγοντας Α 1 328.05 328.050 20.550+

Παράγοντας Β 3 86.45 28.817 1.805

Αλληλεπίδραση 3 209.65 69.883 4.378++

Εντός των κελιών 72 1149.40 15.964

Συνολική 79 1773.55

Σημείωση. + στατιστικώς σημαντική επίδραση, ++ στατιστικώς σημαντική αλληλεπίδραση.

Α = μορφωτικό επίπεδο, Β = βαθμός σοβαρότητας της ασθένειας.

Ας υπολογίσουμε επίσης την τιμή του δείκτη 2pη για την κύρια επίδραση του

παράγοντα Α (μορφωτικό επίπεδο).

wA

A2p SSSS

SSη

= 40.114905.328

05.328

= 0.222. Η τιμή αυτή υποδηλώνει μια

σχετικά χαμηλού μεγέθους επίδραση της ανεξάρτητης μεταβλητής Α στην εξαρτημένη.

Όσον αφορά στο μέγεθος της επίδρασης της αλληλεπίδρασης ΑΒ είναι

wAB

AB2p SSSS

SSη

= 40.114965.209

65.209

= 0.154. Η τιμή αυτή υποδηλώνει επίσης

μια χαμηλού μεγέθους επίδραση της αλληλεπίδρασης ΑΒ, μεταξύ των δύο παραγόντων, στην εξαρτημένη μεταβλητή.

Page 32: ΣΤΑΤΙΣΤΙΚΗ 2

32

1.3.4. Μελέτη της αλληλεπίδρασης

Πρέπει να τονιστεί ότι λόγω της ύπαρξης στατιστικώς σημαντικής αλληλεπίδρασης μεταξύ των δύο παραγόντων, μικρή σημασία έχει η μελέτη των κύριων επιδράσεων του καθενός παράγοντα χωριστά. Επομένως από το σημείο αυτό, το ενδιαφέρον στρέφεται στη μελέτη και ερμηνεία της αλληλεπίδρασης. Για το σκοπό αυτό συνηθίζεται πρώτα η κατασκευή μιας γραφικής παράστασης που να απεικονίζει δείχνει τη μεταβολή των μέσων όρων που αντιστοιχούν στα επίπεδα των παραγόντων. Ο πίνακας που ακολουθεί εμφανίζει τους μέσους όρους των τιμών στα οκτώ κελιά που προκύπτουν από τη διασταύρωση των επιπέδων των δύο παραγόντων.

Βαθμός Σοβαρότητας

Μορφωτικό Επίπεδο 1 2 3 4

I 49.7 48.5 48.7 47.9

II 40.7 43.9 46.4 47.6

Με βάση τις τιμές αυτού του πίνακα μπορούμε να κατασκευάσουμε την γραφική παράσταση της αλληλεπίδρασης.

Αλληλεπίδραση των δύο παραγόντων

35

40

45

50

55

1 2 3 4

Βαθμός Σοβαρότητας

Μέσ

οι ό

ροι

Μορφωτικό επ ίπεδο Ι Μορφωτικό επ ίπεδο ΙΙ

Page 33: ΣΤΑΤΙΣΤΙΚΗ 2

33

Στον οριζόντιο άξονα είναι τοποθετημένα τα 4 επίπεδα του παράγοντα «βαθμός σοβαρότητας της ασθένειας». Στον κάθετο άξονα έχουμε τις τιμές των μέσων όρων του παραπάνω πίνακα. Οι δύο τεθλασμένες γραμμές δείχνουν τη μεταβολή των μέσων όρων του εξωτερικού ελέγχου που αντιστοιχούν στις 4 διαβαθμίσεις της σοβαρότητας της ασθένειας, για τα δύο μορφωτικά επίπεδα χωριστά. Παρατηρούμε ότι οι δύο τεθλασμένες γραμμές δεν είναι παράλληλες γεγονός που δικαιολογείται από την ύπαρξη στατιστικώς σημαντικής αλληλεπίδρασης.

Στη συνέχεια, πρέπει να ελεγχθούν οι λεγόμενες απλές επιδράσεις (simple effects) δηλαδή οι επιδράσεις του ενός παράγοντα μέσα σε κάθε επίπεδο του άλλου παράγοντα. Μπορούμε έτσι να μελετήσουμε την επίδραση του βαθμού σοβαρότητας της ασθένειας για κάθε μορφωτικό επίπεδο χωριστά. Αυτό απαιτεί τον υπολογισμό του μεταξύ των επιπέδων του παράγοντα «βαθμός σοβαρότητας» αθροίσματος τετραγώνων για τα δύο μορφωτικά επίπεδα Ι και ΙΙ. Τα δύο αυτά αθροίσματα τετραγώνων θα συμβολίσουμε SSB I και SSB II .

Ο υπολογισμός είναι ακριβώς ίδιος με αυτόν που εφαρμόστηκε στην ανάλυση διασποράς με έναν παράγοντα. Σημειώνεται όμως ότι για τη δημιουργία των λόγων F χρησιμοποιείται ως παρονομαστής η εντός των κελιών διακύμανση

wMS .

Απλή επίδραση του παράγοντα «βαθμός σοβαρότητας» στα άτομα του μορφωτικού επιπέδου Ι

Για το μορφωτικό επίπεδο Ι προσέχουμε την 1η γραμμή του πίνακα που περιέχει τα αθροίσματα των τιμών που βρίσκονται στα οκτώ κελιά (βλέπε παραπάνω).

SSB I 49710

48510

48710

47910

194840

2 2 2 2 2

= 16.8 και 3

8.16MS )I(B = 5.6

Οπότε

w

IBIB MS

MSF =

5615964

..

= 0.35. Στο επίπεδο σημαντικότητας α = 0.05 και

για 3 και 72 αντίστοιχα βαθμούς ελευθερίας η κρίσιμη τιμή είναι 2.74. Επειδή 0.35 < 2.74 καταλήγουμε στο συμπέρασμα ότι η επίδραση του βαθμού σοβαρότητας στο μορφωτικό επίπεδο Ι δεν είναι στατιστικώς σημαντική.

Απλή επίδραση του παράγοντα «βαθμός σοβαρότητας» στα άτομα του μορφωτικού επιπέδου ΙΙ

Page 34: ΣΤΑΤΙΣΤΙΚΗ 2

34

Παρατηρούμε τώρα τη 2η γραμμή του πίνακα που περιέχει τα αθροίσματα των τιμών που βρίσκονται στα οκτώ κελιά (βλέπε παραπάνω) και αντιστοιχεί στο μορφωτικό επίπεδο ΙΙ.

SSB II 40710

43910

46410

47610

178640

2 2 2 2 2

= 184.2 και 3

2.184MS )II(B = 61.4

Οπότε

w

IIBIIB MS

MSF =

61415964

..

= 3.846. Η κρίσιμη τιμή είναι πάλι 2.74. Επειδή

3.846 > 2.74 φαίνεται ότι για το μορφωτικό επίπεδο ΙΙ η επίδραση του βαθμού σοβαρότητας της ασθένειας πάνω στον εξωτερικό έλεγχο είναι στατιστικώς σημαντική.

Από τα παραπάνω προκύπτει ότι για τα άτομα του χαμηλού μορφωτικού επιπέδου δεν υπάρχει στατιστικώς σημαντική διαφοροποίηση μεταξύ των μέσων όρων του εξωτερικού ελέγχου που αντιστοιχούν στα τέσσερα επίπεδα σοβαρότητας της ασθένειας. Αντίθετα, για τα άτομα του μέσου/υψηλού μορφωτικού επιπέδου διαπιστώθηκε σημαντική διαφοροποίηση. Από το σχήμα της αλληλεπίδρασης φαίνεται ότι ο εξωτερικός έλεγχος αυξάνει καθώς αυξάνει η σοβαρότητα της κατάστασης της υγείας των ατόμων.

Page 35: ΣΤΑΤΙΣΤΙΚΗ 2

35

1.4. Ανάλυση Διασποράς με Επαναλαμβανόμενες Μετρήσεις σε Έναν Παράγοντα

Στην ενότητα 1.2. περιγράψαμε τη μέθοδο της ανάλυσης διασποράς με έναν παράγοντα στην περίπτωση που τα διάφορα δείγματα (ομάδες) που αντιστοιχούν στα επίπεδα του παράγοντα αποτελούνται από διαφορετικά άτομα και συνεπώς είναι ανεξάρτητα μεταξύ τους. Στην παράγραφο αυτή θα ασχοληθούμε με μια άλλη μορφή της ανάλυσης διασποράς με έναν παράγοντα που εφαρμόζεται σε πειραματικά σχέδια στα οποία τα δείγματα δεν είναι ανεξάρτητα μεταξύ τους αλλά συσχετισμένα. Ειδικότερα θα μελετήσουμε την περίπτωση, που συχνά συναντούμε στις ψυχολογικές έρευνες, που είναι οι επαναλαμβανόμενες μετρήσεις στα ίδια άτομα. Αυτό σημαίνει ότι τα ίδια άτομα «δέχονται» όλες τις δοκιμασίες ή πειραματικές συνθήκες που ορίζει η ανεξάρτητη μεταβλητή δηλαδή τα ίδια άτομα αντιστοιχούν σε όλα τα επίπεδα του παράγοντα που μελετούμε. Ένας τέτοιος παράγοντας ονομάζεται ενδοϋποκειμενικός παράγοντας (within-subjects factor) ή παράγοντας με επαναλαμβανόμενες μετρήσεις (repeated-measures factor).

Κατά την ανάπτυξη του ελέγχου της ισότητας δύο μέσων τιμών σε ανεξάρτητα και συζευγμένα δείγματα (βλέπε Σημειώσεις Στατιστική Ι) επισημάνθηκε ότι με τη μέθοδο των συζευγμένων δειγμάτων είναι δυνατή η μείωση του πειραματικού σφάλματος σε σύγκριση με τη μέθοδο της τυχαιοποίησης (randomization) που δημιουργεί ανεξάρτητα δείγματα. Η ίδια επισήμανση ισχύει για τη σύγκριση μεταξύ της μεθόδου της ανάλυσης διασποράς με ανεξάρτητες ομάδες και αυτής με επαναλαμβανόμενες μετρήσεις. Λόγου του ότι οι μετρήσεις πραγματοποιούνται στα ίδια άτομα, μέρος της συνολικής μεταβλητότητας της εξαρτημένης μεταβλητής που οφείλεται στις ατομικές διαφορές μπορεί να διαχωριστεί από τη μεταβλητότητα που αποδίδεται στην επίδραση της ανεξάρτητης μεταβλητής καθώς και αυτής του πειραματικού σφάλματος με αποτέλεσμα την αύξηση της ισχύος της μεθόδου. Αντίθετα, στην ανάλυση διασποράς με ανεξάρτητες ομάδες, λόγω του ότι οι διάφορες ομάδες αποτελούνται από διαφορετικά άτομα, η μεταβλητότητα που αποδίδεται στις ατομικές διαφορές αποτελεί αναπόσπαστο τμήμα του πειραματικού σφάλματος και δεν μπορεί να διαχωριστεί.

Τα δεδομένα παρουσιάζονται συνήθως σε πίνακα με n γραμμές και k στήλες στον οποίο οι γραμμές αντιστοιχούν στα άτομα του τυχαίου δείγματος ενώ οι στήλες στα επίπεδα του παράγοντα. Επομένως, το συνολικό πλήθος των

Page 36: ΣΤΑΤΙΣΤΙΚΗ 2

36

τιμών ισούται με N = nk. Ο πίνακας που ακολουθεί περιέχει τους απαραίτητους συμβολισμούς για την ανάπτυξη της μεθόδου.

Στον πίνακα αυτόν, με Xij συμβολίζεται η τιμή της εξαρτημένης μεταβλητής που αντιστοιχεί στο άτομο i (i = 1,2,...,n) και αφορά το επίπεδο j (j = 1,2,...,k) της ανεξάρτητης μεταβλητής. Με Si (i = 1,2,...,n) συμβολίζεται το άθροισμα των τιμών Xij στη γραμμή i ενώ με Pj (j = 1,2,...,k) το άθροισμα των τιμών Xij

στη στήλη j.

Προφανώς θα ισχύει

S P Xii

n

jj

k

ijj

k

i

n

1 1 11

Επίπεδα του Παράγοντα

Άτομα 1 2 . . j . . k Άθροισμα

1 X11 X12 X1j X1k S1

2 X21 X22 X2j X2k S2

. . . . .

. . . . .

i Xi1 Xi2 Xij Xik Si

. . . . .

. . . . .

n Xn1 Xn2 Xnj Xnk Sn

Άθροισμα P1 P2 Pj Pk

Η μηδενική υπόθεση της μεθόδου αναφέρεται στην ισότητα των μέσων όρων των k πληθυσμών των μετρήσεων που αντιστοιχούν στα επίπεδα του παράγοντα και διατυπώνεται ως εξής

k210 μ...μμ:H

ενώ η εναλλακτική υπόθεση

Η1 : οι k μέσοι όροι δεν είναι όλοι ίσοι.

Page 37: ΣΤΑΤΙΣΤΙΚΗ 2

37

Στη μέθοδο αυτή, ορίζονται αρχικά τρεις διαφορετικές πηγές διασποράς με τη μορφή αθροίσματος τετραγώνων (SS). Η συνολική διασπορά SStot, η μεταξύ των στηλών διασπορά SScol και η εντός των στηλών διασπορά SSw. Η αναλογία με την ανάλυση διασποράς με ανεξάρτητες ομάδες είναι φανερή αρκεί να αντικαταστήσει κανείς την έννοια της στήλης με την έννοια της ομάδας.

Η συνολική διασπορά εκφράζει τη διασπορά όλων των τιμών γύρω από τον

γενικό μέσο όρο X (όπου X =

n

1i

k

1jij N/X ) και δίνεται με τη μορφή

αθροίσματος τετραγώνων από τον τύπο

n

1i

k

1j

2ijtot XXSS

Αν k21 P...,,P,P είναι οι μέσοι όροι των τιμών στις k στήλες

( όπου n/XPn

1iijj

), η εντός των στηλών διασπορά ισούται με

n

1i

k

1j

2jijw PXSS

Η μεταξύ των στηλών διασπορά είναι αυτή που υπάρχει ανάμεσα στις k στήλες και δείχνει πως διασπείρονται οι μέσοι όροι τους γύρω από το γενικό μέσο όρο X .

k

1j

2jcol XPnSS

Αντίστοιχα με την ανάλυση διασποράς σε ανεξάρτητες ομάδες (1.2.) ισχύει η σχέση

SStot = colSS + wSS

Στην παρούσα όμως μέθοδο και λόγω του ότι υπάρχει ένα μόνο δείγμα ατόμων, η εντός των στηλών διασπορά αναλύεται σε δύο επιμέρους συνιστώσες που είναι η μεταξύ των γραμμών (ατόμων) διασπορά SSrow και η διασπορά των υπολοίπων (residual variance SSres). Η πρώτη αποδίδεται στις συστηματικές διαφοροποιήσεις μεταξύ των ατόμων του δείγματος (ατομικές διαφορές) ενώ η δεύτερη στην επίδραση τυχαίων και ανεξέλεγκτων παραγόντων και συνιστά τη διασπορά του πειραματικού σφάλματος.

Page 38: ΣΤΑΤΙΣΤΙΚΗ 2

38

Συνεπώς ισχύει

SSw = rowSS + resSS

οπότε σε συνδυασμό με την προηγούμενη σχέση καταλήγουμε τελικά στην εξής σχέση

SStot = colSS + rowSS + resSS

που αποτελεί την εξίσωση της ανάλυσης διασποράς με έναν ενδοϋποκειμενικό παράγοντα.

Για τους αντίστοιχους βαθμούς ελευθερίας ισχύει μια ανάλογη σχέση

(N - 1) = (k - 1) + (n - 1) + (k - 1)(n - 1)

Η μεταξύ των γραμμών (ατόμων) διασπορά δίνεται από τον τύπο

n

1i

2irow XSkSS

όπου S S Sn1 2, ... ( k/XSk

1jiji

) είναι οι μέσοι όροι των τιμών που αντιστοιχούν

στις n γραμμές. Οπότε η τιμή του αθροίσματος τετραγώνων των υπολοίπων υπολογίζεται ως εξής

resSS = SStot - colSS - rowSS

Αν 1k

SSMS colcol και 1n1k

SSMS resres είναι αντίστοιχα το μεταξύ των

στηλών (μεταξύ των επιπέδων του παράγοντα) μέσο τετράγωνο (διακύμανση) και το μέσο τετράγωνο (διακύμανση) των υπολοίπων, ο έλεγχος της μηδενικής υπόθεσης πραγματοποιείται συγκρίνοντας, για α=0.05 ή α=0.01, την τιμή του λόγου

res

col

MSMSF

με τις κρίσιμες τιμές της κατανομής F για (k - 1) και (k - 1)(n - 1) αντίστοιχα βαθμούς ελευθερίας (Πίνακας 1 του παραρτήματος).

Page 39: ΣΤΑΤΙΣΤΙΚΗ 2

39

1.4.1. Υπολογιστικοί τύποι

Για τη διεξαγωγή των διαφόρων υπολογισμών είναι προτιμότερη η χρήση των παρακάτω τύπων:

Έστω [Ι] η βοηθητική ποσότητα που ορίζεται ως εξής:

2n

1i

k

1jijX

N1]I[

Με βάση αυτήν, τα διάφορα αθροίσματα τετραγώνων (SS) υπολογίζονται ως εξής:

n

1i

k

1j

2ijtot ]I[XSS

]I[n

PSS

k

1j

2j

col

]I[k

SSS

n

1i

2i

row

Η ποσότητα resSS υπολογίζεται, όπως είδαμε από, τη σχέση

resSS = SStot - colSS - rowSS

Στη συνέχεια, υπολογίζονται (βλέπε παραπάνω) τα μέσα τετράγωνα

1kSSMScol

col και 1n1kSSMS res

res και τελικά, ο λόγος

res

col

MSMSF

1.4.2. Δείκτης 2pη

Ο δείκτης 2pη (partial eta-squared) αποτελεί ένα μέτρο για το μέγεθος της

επίδρασης (effect size) του ενδοϋποκειμενικού παράγοντα στην εξαρτημένη μεταβλητή. Ορίζεται ως ο λόγος του μεταξύ των στηλών αθροίσματος τετραγώνων προς το άθροισμα του μεταξύ των στηλών αθροίσματος τετραγώνων με το άθροισμα τετραγώνων των υπολοίπων

rescol

col2p SSSS

SSη

Page 40: ΣΤΑΤΙΣΤΙΚΗ 2

40

Οι τιμές του δείκτη 2pη κινούνται στο διάστημα [0, 1] και όσο η τιμή του

πλησιάζει το 1 τόσο αυξάνει και το μέγεθος της επίδρασης.

1.4.3. Έλεγχοι πολλαπλών συγκρίσεων

Στην περίπτωση που η εφαρμογή της μεθόδου της ανάλυσης διασποράς με επαναλαμβανόμενες μετρήσεις αποβεί στατιστικώς σημαντική είναι σκόπιμο, όπως και στην περίπτωση εφαρμογής της μεθόδου με ανεξάρτητες ομάδες, να χρησιμοποιηθεί κάποιος post hoc έλεγχος πολλαπλών συγκρίσεων για να διαπιστωθεί ποια επιμέρους ζεύγη μέσων όρων διαφέρουν και ποια όχι. Η εφαρμογή αυτών των μεθόδων όπως της μεθόδου Tukey και Scheffe (1.2.5.1, 1.2.6.1) πραγματοποιείται με τρόπο παρόμοιο με αυτόν της ανάλυσης διασποράς με ανεξάρτητες ομάδες με μόνη διαφορά την αντικατάσταση της ποσότητας wMS από την αντίστοιχη της resMS . Θα πρέπει επίσης να

ικανοποιούνται οι προϋποθέσεις εφαρμογής της ανάλυσης διασποράς με επαναλαμβανόμενες μετρήσεις (βλέπε παρακάτω 1.4.4.).

Για τον έλεγχο Tukey το στατιστικό q με το οποίο ελέγχεται η υπόθεση Η0 : j = j δίνεται από τον τύπο (1.2.5.1.)

nMS

XXq

res

jjjj

όπου στον αριθμητή ο πρώτος μέσος όρος είναι πάντοτε μεγαλύτερος του δεύτερου.

Όταν εφαρμόζεται ο έλεγχος Scheffe, το στατιστικό t με το οποίο ελέγχεται η υπόθεση Η0 : j = j δίνεται από τον τύπο (1.2.6.1.)

nMS2

XXt

res

jjjj

Η κρίσιμη τιμή είναι S k Fc 1 (1.2.6.1.) όπου k είναι ο αριθμός των στηλών και Fc είναι η κρίσιμη τιμή βάσει της οποίας ελέγχεται η σημαντικότητα της ανάλυσης διασποράς. Η μηδενική υπόθεση απορρίπτεται όταν St

'jj .

Page 41: ΣΤΑΤΙΣΤΙΚΗ 2

41

Παράδειγμα 1.5

Τυχαίο δείγμα 7 ηλικιωμένων ατόμων με χαμηλό βαθμό μνημονικής ικανότητας συμμετείχε σε ειδικό πρόγραμμα με στόχο την αύξηση του. Οι μετρήσεις που περιέχονται στον παρακάτω πίνακα προέρχονται από test μέτρησης της μνημονικής ικανότητας και αναφέρονται σε τρεις χρονικές στιγμές: Πριν την εφαρμογή του προγράμματος (Τ1), αμέσως μετά την ολοκλήρωση του προγράμματος (Τ2) και έξι μήνες μετά την ολοκλήρωση του (Τ3).

Η βαθμολογία στο test μέτρησης της μνημονικής ικανότητας είναι προφανώς η εξαρτημένη μεταβλητή ενώ οι 3 χρονικές στιγμές Τ1, Τ2 και Τ3 ορίζουν τα επίπεδα του παράγοντα με επαναλαμβανόμενες μετρήσεις.

Χρονικές στιγμές

Άτομα Τ1 Τ2 Τ3 iS 2iS

1 10 15 12 37 1369

2 15 20 17 52 2704

3 16 18 15 49 2401

4 16 20 17 53 2809

5 18 23 18 59 3481

6 20 21 19 60 3600

7 21 24 22 67 4489

jP 116 141 120 377 20853 2jP 13456 19881 14400 47737

Οι δύο υποθέσεις ορίζονται ως εξής:

Η0 : 321

Η1 : οι τρεις μέσοι όροι δεν είναι όλοι ίσοι.

Σύμφωνα με τους παραπάνω τύπους είναι:

Page 42: ΣΤΑΤΙΣΤΙΚΗ 2

42

2n

1i

k

1jijX

N1]I[

= 21

3772

= 6768.05

n

1i

k

1j

2ijtot ]I[XSS = 102 + 152 + 162 + ... + 192 + 222 - 6768.05 = 244.95

]I[n

PSS

k

1j

2j

col =

747737 - 6768.05 = 51.52

]I[k

SSS

n

1i

2i

row =

320853 - 6768.05 = 182.95

resSS = SStot - colSS - rowSS = 244.95 - 51.52 - 182.95 = 10.48

Οπότε

1kSSMS col

col =

1352.51

= 252.51 = 25.76

1n1kSSMS res

res = 1713

48.10

= 12

48.10 = 0.87

και τελικά

res

col

MSMSF =

87.076.25 = 29.61

Για α = 0.05 και βαθμούς ελευθερίας 2 και 12 αντίστοιχα, η κρίσιμη τιμή από τον Πίνακα 1 του παραρτήματος, είναι 3.89. Επειδή 29.61 > 3.89 απορρίπτουμε τη μηδενική υπόθεση και δεχόμαστε τη διαφοροποίηση των τριών μέσων όρων βαθμολογίας της μνημονικής ικανότητας. Τα αποτελέσματα από την εφαρμογή της μεθόδου συνοψίζονται στον πίνακα ανάλυσης διασποράς που ακολουθεί.

Page 43: ΣΤΑΤΙΣΤΙΚΗ 2

43

Πίνακας ανάλυσης διασποράς

Διασπορά Βαθμοί ελευθερίας

Άθροισμα τετραγώνων

Μέσο τετράγωνο

F

Μεταξύ των στηλών 2 51.52 25.76 29.61

Των υπολοίπων 12 10.48 0.87

Μεταξύ των ατόμων 6 182.95

Συνολική 20 244.95

Ας υπολογίσουμε τώρα την τιμή του δείκτη 2pη

rescol

col2p SSSS

SSη

= 48.1052.51

52.51

= 0.831. Η τιμή αυτή υποδηλώνει μιας

μεγάλου μεγέθους επίδραση της ανεξάρτητης μεταβλητής στην εξαρτημένη.

Στη συνέχεια, και επειδή η μηδενική υπόθεση απορρίφθηκε, είναι σκόπιμο να εφαρμοστεί κάποια post hoc μέθοδος πολλαπλών συγκρίσεων για να εξακριβώσουμε ποια επιμέρους ζεύγη μέσων όρων διαφέρουν. Στο παράδειγμα αυτό θα εφαρμόσουμε τη μέθοδο Scheffe όπως αυτή αναπτύχθηκε προηγουμένως. Με τα δεδομένα του παραδείγματος, οι μέσοι όροι βαθμολογίας στις τρεις χρονικές στιγμές είναι X1 = 16.57, X2 = 20.14, και X3 = 17.14 αντίστοιχα. Επίσης, βρέθηκε ότι resMS = 0.87.

Σχηματίζοντας τους λόγους t για τα τρία ζεύγη των μέσων όρων βρίσκουμε

16.7

787.02

14.2057.16

nMS2

XXt

res

2112

02.6

787.02

14.1714.20

nMS2

XXt

res

3223

14.1

787.02

14.1757.16

nMS2

XXt

res

3113

Για α = 0.05 και επειδή Fc = 3.89, η κρίσιμη τιμή του Scheffe είναι

Page 44: ΣΤΑΤΙΣΤΙΚΗ 2

44

S k Fc 1 = 89.313 = 2.79

Επειδή 7.16 > 2.79 και 6.01 > 2.79 ενώ 1.14 < 2.79 συμπεραίνουμε ότι στατιστικώς σημαντικές διαφορές αντιστοιχούν στα ζεύγη (1, 2) και (2, 3) δηλαδή μ1 μ2 και μ2 μ3. Παρατηρώντας και πάλι τις τιμές των δειγματικών μέσων όρων καταλήγουμε στο συμπέρασμα ότι μετά την ολοκλήρωση της θεραπευτικής παρέμβασης παρατηρήθηκε σημαντική αύξηση, κατά μέσο όρο, της μνημονικής ικανότητας των ατόμων, στη συνέχεια όμως είχαμε σημαντική μείωση της κατά την τρίτη μέτρηση έτσι ώστε τελικά αυτή να μη διαφέρει στατιστικώς από την πρώτη μέτρηση (βρέθηκε ότι μ1 = μ3). Αυτό σημαίνει ότι η θεραπευτική παρέμβαση είχε θετικό αποτέλεσμα αυξάνοντας σημαντικά το βαθμό μνημονικής ικανότητας των ατόμων. Αυτή όμως η βελτίωση δεν είχε διάρκεια επειδή έξι μήνες μετά η μνημονική ικανότητα μειώθηκε στα προ της παρέμβασης επίπεδα.

1.4.4. Προϋποθέσεις εφαρμογής της μεθόδου

Οι προϋποθέσεις εφαρμογής της μεθόδου της ανάλυσης διακύμανσης με επαναλαμβανόμενες μετρήσεις σε έναν παράγοντα, εκτείνονται πέραν αυτών της ανάλυσης διακύμανσης με ανεξάρτητες ομάδες (1.2.). Συγκεκριμένα, στις προϋποθέσεις της ανεξαρτησίας μεταξύ των μετρήσεων των ατόμων και της κανονικότητας των μετρήσεων, προστίθεται και η προϋπόθεση της σφαιρικότητας (sphericity). Η τελευταία αυτή προϋπόθεση αφορά την ισότητα των διακυμάνσεων όλων των διαφορών που προκύπτουν θεωρώντας ανά δύο τις στήλες του πίνακα. Έτσι, με βάση τα δεδομένα του παραδείγματος, αν κατασκευάσουμε τις μεταβλητές Τ1 – Τ2, Τ1 – Τ3 και Τ2 – Τ3 και υπολογίσουμε τις διακυμάνσεις τους, θα πρέπει αυτές οι διακυμάνσεις να είναι κατά το δυνατόν ίσες μεταξύ τους. Τότε η προϋπόθεση της σφαιρικότητας θα ισχύει.

Σημειώνεται, ότι η προϋπόθεση της σφαιρικότητας αποτελεί μια λιγότερο περιοριστική προϋπόθεση από αυτήν της σύνθετης συμμετρίας (compound symmetry) που αναφέρεται ορισμένες φορές ως προϋπόθεση για την έγκυρη εφαρμογή της μεθόδου. Η προϋπόθεση της σύνθετης συμμετρίας αναφέρεται στην ισότητα, ή αλλιώς ομοιογένεια, των διακυμάνσεων αλλά και των συνδιακυμάνσεων μεταξύ όλων των στηλών. Θυμίζουμε (Σημειώσεις Στατιστική Ι), ότι για δύο μεταβλητές Χ και Υ, η συνδιακύμανση cov(X, Y) ορίζεται ως το γινόμενο

YXXY ssr)Y,Xcov(

Page 45: ΣΤΑΤΙΣΤΙΚΗ 2

45

όπου XYr είναι ο συντελεστής συσχέτισης Pearson μεταξύ των δύο μεταβλητών, ενώ Xs και Ys είναι αντίστοιχα οι τυπικές αποκλίσεις των δύο μεταβλητών. Όταν η προϋπόθεση της σύνθετης συμμετρίας ισχύει, μπορούμε να εφαρμόσουμε κατά τρόπο έγκυρο τη μέθοδο της ανάλυσης διακύμανσης με επαναλαμβανόμενες μετρήσεις. Δυστυχώς, στην πράξη, η προϋπόθεση αυτή δύσκολα επαληθεύεται. Έχει όμως βρεθεί ότι η προϋπόθεση της σύνθετης συμμετρίας αποτελεί ικανή αλλά όχι αναγκαία συνθήκη για την έγκυρη εφαρμογή της ανάλυσης διακύμανσης. Συνεπώς, αρκεί να ελέγξουμε αν ισχύει η προϋπόθεση της σφαιρικότητας για να εφαρμόσουμε κατά έγκυρο τρόπο κατόπιν την ανάλυση διακύμανσης με επαναλαμβανόμενες μετρήσεις.

Πρέπει να τονιστεί ότι η προϋπόθεση της σφαιρικότητας στην παρούσα μέθοδο της ανάλυση διακύμανσης έχει ιδιαίτερη βαρύτητα. Όταν η προϋπόθεση αυτή δεν ικανοποιείται, οι τιμές του λόγου F δεν ακολουθούν με την απαιτούμενη πιστότητα τη θεωρητική κατανομή F. Ο κίνδυνος αυτός αυξάνει ανάλογα με το πλήθος των επιπέδων του παράγοντα. Στην περίπτωση που το πλήθος των επιπέδων δεν είναι μεγάλο και η τιμή του λόγου F διαφέρει αρκετά από την κρίσιμη τιμή που δίνει ο πίνακας των κρίσιμων τιμών της κατανομής F, η μη ικανοποίηση της προϋπόθεσης της σφαιρικότητας έχει μάλλον ανεπαίσθητες επιπτώσεις. Αν όμως το πλήθος των επιπέδων είναι μεγάλο και η τιμή F διαφέρει λίγο από την κρίσιμη τιμή, είναι αναγκαίο να γίνει κάποιας μορφής διόρθωση. Έχουν προταθεί διαφόρων μορφών διορθώσεις που πραγματοποιούνται από τα σύγχρονα πακέτα στατιστικής ανάλυσης όπως το SPSS και οι οποίες εξαρτώνται από το βαθμό στον οποίο τα δεδομένα μας αποκλίνουν από την προϋπόθεσης της σφαιρικότητας στις οποίες όμως δε θα αναφερθούμε επειδή ξεφεύγουν από τα πλαίσια του συγκεκριμένου μαθήματος.

Page 46: ΣΤΑΤΙΣΤΙΚΗ 2

46

ΚΕΦΑΛΑΙΟ 2

ΑΠΑΡΑΜΕΤΡΙΚΕΣ ΜΕΘΟΔΟΙ

2.1. Εισαγωγή

Πολλές στατιστικές μέθοδοι κυρίως από την περιοχή των στατιστικών ελέγχων, απαιτούν την παραδοχή ορισμένων προϋποθέσεων που αφορούν στις κατανομές των πληθυσμών μέσα από τους οποίους λαμβάνονται τα προς εξέταση δείγματα.

Μια τέτοια βασική προϋπόθεση είναι ότι οι κατανομές των πληθυσμών πρέπει να είναι κανονικές. Η προϋπόθεση αυτή συναντάται σε πολλές στατιστικές μεθόδους όπως στον έλεγχο συμφωνίας της μέσης τιμής, στον έλεγχο ισότητας δύο μέσων τιμών, στις μεθόδους της ανάλυσης διακύμανσης, στη γραμμική παλινδρόμηση και αλλού. Μια δεύτερη συχνά απαιτούμενη προϋπόθεση είναι η ισότητα των διακυμάνσεων των διαφόρων πληθυσμών. Αυτή η προϋπόθεση συναντάται λόγου χάρη στον έλεγχο ισότητας δύο μέσων τιμών σε ανεξάρτητα δείγματα και σε όλες τις μεθόδους της ανάλυσης διακύμανσης. Ας σημειωθεί ότι γενικά δεν είναι εύκολο να υπολογιστεί με ακρίβεια το ποσοστό κατά το οποίο μειώνεται η εγκυρότητα ενός στατιστικού ελέγχου σε σχέση με την απόκλιση από τις απαιτούμενες προϋποθέσεις εφαρμογής του.

Στατιστικές μέθοδοι που απαιτούν την τήρηση ορισμένων προϋποθέσεων που αναφέρονται στις κατανομές των υπό μελέτη πληθυσμών ονομάζονται παραμετρικές μέθοδοι. Υπάρχει όμως και ένα μεγάλο σύνολο από στατιστικές μεθόδους που ανακαλύφθηκαν αργότερα από τις παραμετρικές μεθόδους και οι οποίες δεν απαιτούν κατά την εφαρμογή τους την τήρηση προϋποθέσεων όμοιες με αυτές που αναφέρθηκαν πιο πάνω. Οι μέθοδοι αυτοί που αποτελούν εναλλακτικές τεχνικές γιατί μπορούν να χρησιμοποιηθούν με ικανοποιητικό τρόπο στην περίπτωση που οι προϋποθέσεις των παραμετρικών ελέγχων δεν μπορούν να ικανοποιηθούν, ονομάζονται απαραμετρικές ή μη παραμετρικές στατιστικές μέθοδοι (nonparametric statistical methods). Επισημαίνουμε ότι οι απαραμετρικές μέθοδοι δεν είναι τελείως ελεύθερες προϋποθέσεων αλλά οπωσδήποτε αυτές είναι πολύ πιο λιγοστές.

Ένας άλλος ουσιαστικός λόγος που καθιστά απαραίτητη την εφαρμογή απαραμετρικών μεθόδων είναι το είδος της κλίμακας μέτρησης των χρησιμοποιούμενων μεταβλητών. Είναι γνωστό ότι για την ορθή εξαγωγή και

Page 47: ΣΤΑΤΙΣΤΙΚΗ 2

47

ερμηνεία αποτελεσμάτων που προκύπτουν από τις παραμετρικές μεθόδους συχνά είναι απαραίτητο οι μεταβλητές να είναι ποσοτικές. Υπάρχουν όμως κατάλληλες απαραμετρικές μέθοδοι που μπορούν να χρησιμοποιηθούν με επιτυχία για να αντιμετωπίσουν περιπτώσεις στις οποίες οι κλίμακες μέτρησης των μεταβλητών είναι η τακτική ή και η ονομαστική κάτι που συχνά συναντάμε στο χώρο των επιστημών συμπεριφοράς. Ας σημειωθεί τέλος ότι η εφαρμογή ορισμένων απαραμετρικών μεθόδων κρίνεται απαραίτητη όταν τα διαθέσιμα δείγματα είναι μικρού μεγέθους καθιστώντας δυσχερή την έγκυρη χρήση των παραμετρικών μεθόδων κάτι επίσης που συχνά συναντάται στο χώρο των επιστημών συμπεριφοράς κατά τη μελέτη ειδικών πληθυσμών.

Οι παραμετρικοί έλεγχοι υποθέσεων – όταν πληρούνται οι προϋποθέσεις εφαρμογής τους – έχουν μεγαλύτερη ισχύ από τους αντίστοιχους απαραμετρικούς για το λόγο αυτό και προτιμούνται. Θυμίζουμε ότι ισχύς ενός στατιστικού ελέγχου είναι η πιθανότητα να απορρίψουμε τη μηδενική υπόθεση ενώ είναι πράγματι λανθασμένη και ισούται με 1-β όπου β είναι ο κίνδυνος σφάλματος τύπου ΙΙ δηλαδή η πιθανότητα αποδοχής της μηδενικής υπόθεσης ενώ αυτή είναι λανθασμένη. Αποδεικνύεται όμως ότι αυτή η απώλεια είναι μικρή και μάλιστα μπορεί να καλυφθεί από μια κατάλληλη αύξηση του μεγέθους των δειγμάτων - όταν αυτό είναι δυνατό να γίνει - οπότε οι δύο μέθοδοι αποκτούν παρόμοια ισχύ. Σαν γενικό σχόλιο μπορούμε να πούμε ότι αν έχουμε αποδείξεις για την ικανοποίηση των απαιτούμενων από τις παραμετρικές μεθόδους προϋποθέσεων, μπορούμε να εφαρμόσουμε ως πρώτη επιλογή αυτές τις μεθόδους που είναι επίσης πολύ περισσότερες σε αριθμό συγκριτικά με τις απαραμετρικές καλύπτοντας το μεγαλύτερο φάσμα της στατιστικής μεθοδολογίας. Αν αντίθετα διαπιστώσουμε σοβαρές αποκλίσεις από τις προϋποθέσεις αυτές, μπορούμε να καταφύγουμε στη χρησιμοποίηση των κατάλληλων απαραμετρικών μεθόδων εξασφαλίζοντας με αυτόν τον τρόπο την εγκυρότητα των συμπερασμάτων μας.

Page 48: ΣΤΑΤΙΣΤΙΚΗ 2

48

2.2. Προσημικός Έλεγχος

Ο προσημικός έλεγχος (sign test) εφαρμόζεται όταν έχουμε μετρήσεις σε συζευγμένα δείγματα δηλαδή μετρήσεις σε δείγματα εξισωμένα κατά ζεύγη ή επαναλαμβανόμενες μετρήσεις στα ίδια άτομα.

Παράδειγμα 2.1

Ένας ερευνητής επιθυμώντας να καταγράψει την επίδραση τηλεοπτικής εκπομπής που είχε στόχο την ενημέρωση του κοινού για το θέμα του περιορισμού του καπνίσματος σε δημόσιους χώρους, ζήτησε από τυχαίο δείγμα 12 καπνιστών να εκφράσουν το βαθμό της συμφωνίας τους σχετικά με αυτό το θέμα πριν την παρακολούθηση της εκπομπής και αμέσως μετά από αυτήν. Καθένα από τα 12 άτομα εξέφρασαν την άποψη τους σε μια κλίμακα πέντε σημείων στην οποία το 1 σήμαινε «συμφωνώ απόλυτα με τον περιορισμό» έως το 5 που σήμαινε «διαφωνώ απόλυτα». Με την έρευνα αυτή ο ερευνητής ήθελε να ελέγξει αν μετά την παρακολούθηση της εκπομπής υπήρξε μείωση της αρνητικής στάσης των καπνιστών αναφορικά με το θέμα του περιορισμού του καπνίσματος. Τα αποτελέσματα ήταν τα εξής:

Άτομα Πριν (Χ) Μετά (Υ) Πρόσημο

διαφοράς d 1 5 3 + 2 5 5 3 1 2 - 4 3 2 + 5 4 1 + 6 5 1 + 7 1 2 - 8 4 2 + 9 5 4 + 10 2 1 + 11 4 1 + 12 2 3 -

Είναι γνωστό ότι σε περιπτώσεις που επιθυμούμε να ελέγξουμε την υπόθεση της ισότητας των μέσων τιμών σε συζευγμένα δείγματα μπορούμε να εφαρμόσουμε την αντίστοιχη παραμετρική μέθοδο αν φυσικά η εξαρτημένη μεταβλητή μας είναι ποσοτική κάτι που στην περίπτωση του παραπάνω

Page 49: ΣΤΑΤΙΣΤΙΚΗ 2

49

παραδείγματος δεν φαίνεται να ισχύει. Συγκεκριμένα, τα ερωτώμενα άτομα καλούνται να απαντήσουν με τέτοιο τρόπο ώστε τελικά να είναι δύσκολο να ισχυριστούμε ότι π.χ. η απόσταση μεταξύ των απαντήσεων 1 «συμφωνώ απόλυτα» και 2 «συμφωνώ αρκετά» είναι ίση με την απόσταση μεταξύ 4 «διαφωνώ αρκετά» και 5 «διαφωνώ απόλυτα». Συνεπώς η κλίμακα μέτρησης δε μπορεί να χαρακτηριστεί ως κλίμακα διαστημάτων αλλά μάλλον τακτική. Οπότε η χρήση ενός μη παραμετρικού ελέγχου όπως ο προσημικός έλεγχος θα ήταν προτιμότερη.

Ο προσημικός έλεγχος βασίζεται στα πρόσημα και μόνο (+) ή (-) των διαφορών di

iii YXd

i =1, 2, ..., N όπου N είναι το μέγεθος του δείγματος.

Στο παράδειγμα μας, Χ είναι οι μετρήσεις πριν την εκπομπή και Υ οι μετρήσεις μετά την παρακολούθηση της εκπομπής. Η μέθοδος, σε αντίθετη με τον αντίστοιχο παραμετρικό έλεγχο, δεν προϋποθέτει την κανονικότητα της κατανομής των διαφορών. Κατά ένα γενικό τρόπο, ο προσημικός έλεγχος εφαρμόζεται σε όλες τις περιπτώσεις στις οποίες έχουμε τη δυνατότητα να ορίσουμε για κάθε ζεύγος (Χ, Υ) μια σχέση διάταξης μεταξύ του Χ και του Υ έτσι ώστε να είναι δυνατό να αντιστοιχίσουμε στις διαφορές d τα πρόσημα (+) ή (-). Η μόνη προϋπόθεση για την έγκυρη εφαρμογή του προσημικού ελέγχου είναι η ανεξαρτησία των μετρήσεων μεταξύ των ζευγών δηλαδή οι μετρήσεις κάποιου ζεύγους να μην επηρεάζουν με κανέναν τρόπο αυτές ενός άλλου ζεύγους.

Στον προσημικό έλεγχο η μηδενική υπόθεση μπορεί να διατυπωθεί ως εξής:

Η0 : P(X > Y) = P(X < Y) = 0.5

δηλαδή η πιθανότητα να παρατηρήσουμε θετικές διαφορές (Χ-Υ > 0 δηλαδή Χ > Υ) ισούται με την πιθανότητα να παρατηρήσουμε αρνητικές διαφορές (Χ-Υ < 0 δηλαδή Χ < Υ). Μια άλλη διατύπωση της μηδενικής υπόθεσης είναι ότι η διάμεσος του πληθυσμού των διαφορών d θα ισούται με 0.

Αν συνεπώς η μηδενική υπόθεση ισχύει, αναμένεται το πλήθος των θετικών πρόσημων (+) να ισούται με το πλήθος των αρνητικών πρόσημων (-). Αν αντίθετα το πλήθος των θετικών πρόσημων διαφέρει από το πλήθος των αρνητικών, τότε η μηδενική υπόθεση δε θα ισχύει.

Page 50: ΣΤΑΤΙΣΤΙΚΗ 2

50

Συνεπώς, στο δίπλευρο έλεγχο η εναλλακτική υπόθεση είναι:

Η1 : P(X > Y) ≠ P(X < Y)

Στο μονόπλευρο έλεγχο

Η1 : P(X > Y) > P(X < Y)

ή αντίθετα

Η1 : P(X > Y) < P(X < Y)

Ας συμβολίσουμε S(+) το πλήθος των θετικών πρόσημων και N τον αριθμό των ζευγών για τα οποία Χ ≠ Υ.

Ο Πίνακας 3 του παραρτήματος δίνει τις κρίσιμες τιμές Β για τον προσημικό έλεγχο για επίπεδο σημαντικότητας α=0.05. Οι κρίσιμες τιμές είναι οι εξής:

για δίπλευρο έλεγχο είναι Β0.025 και Β0.975

για μονόπλευρο έλεγχο είναι Β0.050 και Β0.950

Οι τιμές αυτές ορίζουν τις περιοχές αποδοχής και απόρριψης της μηδενικής υπόθεσης. Η περιοχή απόρριψης ορίζεται από τις τιμές που είναι μεγαλύτερες ή ίσες από τη μεγαλύτερη κρίσιμη τιμή και από αυτές που είναι μικρότερες ή ίσες από τη μικρότερη κρίσιμη τιμή. Αν π.χ. σε κάποιο έρευνα Ν=13 τότε στο μονόπλευρο έλεγχο οι κρίσιμες τιμές είναι αντίστοιχα 3 και 10. Συνεπώς η περιοχή απόρριψης της μηδενικής υπόθεσης αποτελείται από τις τιμές των διαστημάτων [0 έως 3] και [10 έως 13] ενώ η περιοχή αποδοχής από τις τιμές του διαστήματος [4 έως 9].

Αν η τιμή S(+) βρίσκεται μέσα στην περιοχή αποδοχής τότε δεχόμαστε τη μηδενική υπόθεση ως έγκυρη ενώ αντίθετα αν βρίσκεται μέσα στην περιοχή απόρριψης τότε την απορρίπτουμε και δεχόμαστε την αλήθεια της εναλλακτικής υπόθεσης. Σημειώνεται ότι αντί της τιμής S(+) μπορούμε ισοδύναμα να χρησιμοποιήσουμε την τιμή S(-) που συμβολίζει το πλήθος των αρνητικών πρόσημων ακολουθώντας κατόπιν το ίδιο ακριβώς σκεπτικό.

Ας δούμε πως εφαρμόζονται όλα τα ανωτέρω στο παράδειγμα μας. Από τον πίνακα των δεδομένων παρατηρούμε ότι έχουμε συνολικά 12 άτομα αλλά για το δεύτερο άτομο οι τιμές είναι ίδιες πριν και μετά την εκπομπή οπότε τελικά Ν=11. Είναι S(+) = 8 και S(-) = 3. Στο επίπεδο σημαντικότητας α=0.05 και

Page 51: ΣΤΑΤΙΣΤΙΚΗ 2

51

επειδή έχουμε μονόπλευρο έλεγχο, λόγω του ότι ο ερευνητής αποκλείει την αύξηση της αρνητικής στάσης μετά την παρακολούθηση της εκπομπής και προσδοκά τη μείωση της (που σημαίνει περισσότερα θετικά πρόσημα από ότι αρνητικά) η εναλλακτική υπόθεση διατυπώνεται ως εξής:

Η1 : P(X > Y) > P(X < Y)

Από τον Πίνακα 3 παρατηρούμε ότι οι κρίσιμες τιμές είναι 2 και 9. Η τιμή S(+)=8 ανήκει στην περιοχή αποδοχής οπότε δεχόμαστε τη μηδενική υπόθεση ως έγκυρη. Στο ίδιο συμπέρασμα θα καταλήγαμε αν θεωρούσαμε την τιμή S(-)=3. Φαίνεται λοιπόν ότι μετά την εκπομπή δεν είχαμε στατιστικώς σημαντική μείωση της αρνητικής στάσης των καπνιστών σχετικά με τον περιορισμό του καπνίσματος.

Page 52: ΣΤΑΤΙΣΤΙΚΗ 2

52

2.3. Έλεγχος Wilcoxon σε Συζευγμένα Δείγματα

Ο απαραμετρικός έλεγχος Wilcoxon χρησιμοποιείται ως εναλλακτική λύση στον παραμετρικό έλεγχο της ισότητας δύο μέσων τιμών σε συζευγμένα δείγματα και εφαρμόζεται όταν οι διάφορες τιμές μετριούνται στην τακτική τουλάχιστον κλίμακα. Αυτό του δίνει τη δυνατότητα (αντίθετα με τον προσημικό έλεγχο) όχι μόνο να πάρει υπόψη του τα πρόσημα των διαφορών d = Χ-Υ αλλά και το μέγεθος των διαφορών. Φαίνεται συνεπώς ότι η πληροφορία που παίρνουμε από τις μετρήσεις μας μέσω του ελέγχου Wilcoxon είναι σαφώς μεγαλύτερη από αυτήν του προσημικού ελέγχου και η ισχύς του ελέγχου Wilcoxon είναι μεγαλύτερη από αυτήν του προσημικού ελέγχου.

Για τη διεξαγωγή του ελέγχου ενεργούμε ως εξής: Αν Xi και Υi (i =1, 2,..., N) είναι οι μετρήσεις στα δύο συζευγμένα δείγματα μεγέθους Ν, δημιουργούμε τις διαφορές

iii YXd

και παίρνουμε τις απόλυτες τιμές τους (δηλαδή αγνοούμε το πρόσημο τους) απομακρύνοντας επίσης τις διαφορές που έχουν τιμή 0. Κατόπιν, αποδίδουμε σε κάθε απόλυτη τιμή id την τάξη μεγέθους της. Έτσι, στη μικρότερη τιμή

αποδίδουμε την τάξη μεγέθους 1, στην αμέσως μεγαλύτερη το 2, κοκ. Αν υπάρχουν διαφορές που είναι ίσες μεταξύ τους αποδίδουμε στις διαφορές αυτές το μέσο όρο των τάξεων μεγέθους τις οποίες θα είχαν κανονικά αν δεν ήταν ίσες. Ας θεωρήσουμε για παράδειγμα τις εξής διαφορές d:

2 -6 -3 9 -11 2 -3 5 1 -3

Οι απόλυτες τιμές των διαφορών είναι:

2 6 3 9 11 2 3 5 1 3

Οι τακτικές τιμές θα είναι τελικά:

2.5 8 5 9 10 2.5 5 7 1 5

Page 53: ΣΤΑΤΙΣΤΙΚΗ 2

53

Πράγματι, στη μικρότερη τιμή που είναι το 1 αντιστοιχούμε το 1. Η επόμενη μεγαλύτερη τιμή είναι η τιμή 2 που όμως εμφανίζεται δύο φορές. Αν στο πρώτο δυάρι αποδώσουμε την τάξη 2 και στο δεύτερο τη τάξη 3 και στα δύο τελικά θα αντιστοιχίσουμε το μέσο όρο (2+3)/2 τους δηλαδή την τακτική τιμή 2.5. Ακολουθεί η τιμή 3 που εμφανίζεται τρεις φορές. Στο πρώτο τριάρι αποδίδουμε την τάξη 4, στο δεύτερο τριάρι την τάξη 5 και στο τρίτο την τάξη 6. Τελικά στο καθένα τριάρι αντιστοιχίζουμε την τακτική τιμή (4+5+6)/3=5. Συνεχίζοντας στην επόμενη τιμή 5 αντιστοιχίζουμε το 7, στην τιμή 6 το 8, στην τιμή 9 την τακτική τιμή 9 και τέλος στην τελευταία τιμή 11 αντιστοιχίζουμε την τακτική τιμή 10.

Αφού έχουμε μετατρέψει σε τακτικές τιμές τις απόλυτες τιμές των διαφορών d, αθροίζουμε τις τακτικές τιμές που αντιστοιχούν σε διαφορές με θετικό πρόσημο δημιουργώντας το άθροισμα Τ(+). Παρόμοια, αθροίζουμε τις τακτικές τιμές που αντιστοιχούν σε διαφορές με αρνητικό πρόσημο δημιουργώντας το άθροισμα Τ(-). Έστω Τ το μικρότερο από τα Τ(+) και Τ(-) δηλαδή

Τ = min{Τ(+), Τ(-)}

Στο παράδειγμα μας θα είναι

Τ(+) = 22, Τ(-) = 33 άρα Τ = 22

Η μηδενική υπόθεση του ελέγχου Wilcoxon αναφέρεται στην ταύτιση των κατανομών των πληθυσμών μέσα από τους οποίους προέρχονται οι μετρήσεις μας. Αν η μηδενική υπόθεση αληθεύει, αναμένουμε τα αθροίσματα Τ(+) και Τ(-) να μη διαφέρουν. Αν αντίθετα δεν αληθεύει, αναμένουμε το ένα να είναι σημαντικά μεγαλύτερο του άλλου. Ο Πίνακας 4 του παραρτήματος δίνει τις κρίσιμες τιμές στο επίπεδο σημαντικότητας 0.05 και 0.01 για δίπλευρο και μονόπλευρο έλεγχο. Αν η τιμή Τ είναι μικρότερη ή ίση από την κατάλληλη κρίσιμη τιμή απορρίπτουμε τη μηδενική υπόθεση ενώ αν είναι μεγαλύτερη τη δεχόμαστε ως έγκυρη.

Παράδειγμα 2.2

Ας θεωρήσουμε και πάλι τα δεδομένα του παραδείγματος της παραγράφου 2.2 βάσει των οποίων εφαρμόσαμε τον προσημικό έλεγχο και ας εφαρμόσουμε αυτήν τη φορά τον έλεγχο Wilcoxon αφού η εξαρτημένη μεταβλητή εκφράζεται σε τακτική κλίμακα.

Page 54: ΣΤΑΤΙΣΤΙΚΗ 2

54

Μπορούμε να κατασκευάσουμε τον παρακάτω πίνακα με τις διαφορές d, τις απόλυτες τιμές τους, τα πρόσημα των διαφορών και τις αντίστοιχες τακτικές τιμές:

Άτομα Πριν (Χ) Μετά (Υ) Πρόσημο d |d| Τακτικές τιμές

1 5 3 + 2 7.5 2 5 5 0 3 1 2 - 1 3.5 4 3 2 + 1 3.5 5 4 1 + 3 9.5 6 5 1 + 4 11.0 7 1 2 - 1 3.5 8 4 2 + 2 7.5 9 5 4 + 1 3.5 10 2 1 + 1 3.5 11 4 1 + 3 9.5 12 2 3 - 1 3.5

Είναι Τ(+) = 55.5 και Τ(-) = 10.5, συνεπώς Τ = 10.5

Από τον Πίνακα 4 του παραρτήματος, για α=0.05 στο δίπλευρο έλεγχο η κρίσιμη τιμή για Ν=11 (επειδή για το δεύτερο ζεύγος d=0) είναι 10 ενώ στο μονόπλευρο έλεγχο είναι 13. Κατά συνέπεια στο μονόπλευρο έλεγχο η μηδενική υπόθεση απορρίπτεται λόγω του ότι 10.5 < 13. Φαίνεται λοιπόν ότι μετά την τηλεοπτική εκπομπή παρατηρήθηκε στατιστικώς σημαντική μείωση της αρνητικής στάσης των καπνιστών αναφορικά με τον περιορισμό του καπνίσματος σε δημόσιους χώρους. Ας σημειωθεί ότι στο παράδειγμα αυτό είχαμε πολλές ίδιες τακτικές τιμές γεγονός που μειώνει την ακρίβεια του ελέγχου Wilcoxon.

Με τον προσημικό έλεγχο είχαμε καταλήξει στη μη απόρριψη της μηδενικής υπόθεσης. Αυτή η αντίθεση είναι συνέπεια του γεγονότος ότι ο προσημικός έλεγχος έχει μικρότερη ισχύ από τον έλεγχο Wilcoxon άρα με τον προσημικό έλεγχο έχουμε μικρότερη πιθανότητα να απορρίψουμε τη μηδενική υπόθεση όταν αυτή είναι πράγματι λανθασμένη.

Page 55: ΣΤΑΤΙΣΤΙΚΗ 2

55

Παρατήρηση

Για Ν>20 ο έλεγχος Wilcoxon είναι δυνατό να πραγματοποιηθεί χρησιμοποιώντας προσεγγιστικά την τυπική κανονική κατανομή Ν(0, 1). (βλέπε Σημειώσεις Στατιστική Ι). Αποδεικνύεται, ότι για μεγάλα δείγματα το άθροισμα Τ(+) ακολουθεί προσεγγιστικά κανονική κατανομή με

μέσο όρο μ = 4

1NN

και με την προϋπόθεση ότι δεν υπάρχουν πολλές ίδιες διαφορές d με

τυπική απόκλιση σ = 24

1N21NN

Συνεπώς η μεταβλητή Ζ

Ζ=

T

ακολουθεί την κατανομή Ν(0, 1). Γνωρίζοντας τις κρίσιμες τιμές ελέγχουμε την αλήθεια της μηδενικής υπόθεσης συγκρίνοντας τις τιμές αυτές με την απόλυτη τιμή του Ζ. Σημειώνουμε ότι μπορούμε εναλλακτικά αντί του αθροίσματος Τ(+) να χρησιμοποιήσουμε το άθροισμα Τ(-).

Page 56: ΣΤΑΤΙΣΤΙΚΗ 2

56

2.4. Έλεγχος Mann-Whitney σε Ανεξάρτητα Δείγματα

Ο έλεγχος Mann-Whitney είναι από τους πλέον χρησιμοποιούμενους απαραμετρικούς ελέγχους επειδή αποτελεί ικανοποιητική εναλλακτική πρόταση του ελέγχου της ισότητας δύο μέσων τιμών σε ανεξάρτητα δείγματα (t-test, βλέπε Στατιστική Ι) όταν οι προϋποθέσεις της κανονικότητας και της ισότητας των διακυμάνσεων δεν ισχύουν.

Οι προϋποθέσεις εφαρμογής του ελέγχου Mann-Whitney είναι η εξαρτημένη μεταβλητή να μετριέται τουλάχιστον σε τακτική κλίμακα, καθώς και η ανεξαρτησία μεταξύ των μετρήσεων μέσα σε κάθε δείγμα όπως και μεταξύ των μετρήσεων των δύο δειγμάτων. Μια επιπλέον προϋπόθεση είναι ότι η υποκείμενη μορφή της εξαρτημένης μεταβλητής πρέπει να είναι συνεχής.

Η μηδενική υπόθεση είναι ότι οι πληθυσμοί μέσα από τους οποίους πάρθηκαν με τυχαίο τρόπο τα δύο δείγματα ακολουθούν τις ίδιες κατανομές πιθανοτήτων. Η εναλλακτική υπόθεση είναι ότι οι κατανομές είναι διαφορετικές. Όταν η μηδενική υπόθεση απορριφθεί δεν σημαίνει ότι οι δύο πληθυσμοί διαφέρουν ως προς τους μέσους όρους. Αυτό μπορεί να υποστηριχτεί μόνο αν ως προς τα άλλα χαρακτηριστικά οι πληθυσμοί αυτοί είναι ίδιοι.

Έστω Μ είναι το μέγεθος του πρώτου δείγματος και Ν του δευτέρου. Θεωρούμε μαζί τις Μ+Ν τιμές και αποδίδουμε σε κάθε τιμή την τάξη μεγέθους της. Έτσι στη μικρότερη τιμή αντιστοιχούμε την τιμή 1 στην αμέσως μεγαλύτερη την τιμή 2 κοκ μέχρι τη μεγαλύτερη τιμή που υπάρχει και στα δύο δείγματα. Στις τιμές που είναι ίσες αποδίδουμε το μέσο όρο των τάξεων μεγέθους τους. Με τον τρόπο αυτό μετατρέπουμε όλες τις τιμές σε τακτικές. Περισσότερες πληροφορίες πάνω σε αυτήν την τεχνική έχουν δοθεί κατά την ανάπτυξη του ελέγχου Wilcoxon (2.3.).

Δημιουργούμε κατόπιν δύο αθροίσματα: το άθροισμα R1 των τακτικών τιμών του πρώτου δείγματος και το άθροισμα R2των τακτικών τιμών του δευτέρου δείγματος. Αν έχουμε υπολογίσει σωστά τα δύο αυτά αθροίσματα θα πρέπει να ισχύει:

R1+ R2 = 2

1NMNM

Υπολογίζουμε κατόπιν τις εξής δύο ποσότητες:

Page 57: ΣΤΑΤΙΣΤΙΚΗ 2

57

U1 = MN + 1R

21MM

U2 = MN + 2R

21NN

Αποδεικνύεται ότι για τα U1 και U2 ισχύει η εξής σχέση:

U1 + U2 = ΜΝ

Ας συμβολίσουμε με U τη μικρότερη τιμή από τις U1 και U2 . Ο Πίνακας 5 του παραρτήματος δίνει τις κρίσιμες τιμές της κατανομής του στατιστικού U για δείγματα μεγέθους έως και δέκα (Μ=Ν=10) στα επίπεδα σημαντικότητας α=0.05 και α=0.01 στο δίπλευρο και μονόπλευρο έλεγχο. Αν η τιμή U είναι μεγαλύτερη από την κατάλληλη κρίσιμη τιμή δεχόμαστε τη μηδενική υπόθεση ως έγκυρη. Αν αντίθετα είναι μικρότερη ή ίση από την κρίσιμη τιμή τότε την απορρίπτουμε δεχόμενοι την αλήθεια της εναλλακτικής. Ας σημειωθεί ότι όπως στον έλεγχο Wilcoxon έτσι και στον Mann-Whitney η ύπαρξη πολλών ίσων τακτικών τιμών μειώνει την ακρίβεια του ελέγχου.

Παράδειγμα 2.3

Ένας ερευνητής θέλοντας να ελέγξει την επίδραση του stress στην απομνημόνευση λέξεων δημιούργησε δύο τυχαίες ομάδες, η πρώτη μεγέθους Μ=5 και η δεύτερη μεγέθους Ν=7 παιδιών ίδιας ηλικίας. Στα άτομα και των δύο ομάδων δόθηκε ο ίδιος αριθμός λέξεων προς απομνημόνευση και κατόπιν τους ζητήθηκε να αναπαράγουν τις λέξεις η πρώτη ομάδα βρισκόμενη κάτω από τεχνητώς προκληθείσα κατάσταση stress (πειραματική ομάδα), ενώ η δεύτερη κάτω από κανονικές συνθήκες (ομάδα ελέγχου). Οι μετρήσεις αφορούσαν τον αριθμό των σφαλμάτων κατά την αναπαραγωγή των λέξεων. Με το πείραμα αυτό ο ερευνητής ήθελε να ελέγξει αν ο αριθμός των σφαλμάτων στις ομάδες θα διαφέρει με τα περισσότερα να εντοπίζονται στην πειραματική ομάδα . Τα αποτελέσματα των μετρήσεων ήταν τα εξής:

Πειραματική Ομάδα (Π) 7 4 6 6 8

Ομάδα Ελέγχου (Ε) 3 2 5 4 2 1 4

Η μηδενική υπόθεση ισχυρίζεται ότι οι κατανομές των σφαλμάτων στις δύο ομάδες ταυτίζονται. Αντίθετα, η εναλλακτική υπόθεση υποστηρίζει ότι οι

Page 58: ΣΤΑΤΙΣΤΙΚΗ 2

58

κατανομές διαφέρουν και συγκεκριμένα τα σφάλματα στην πειραματική ομάδα είναι περισσότερα από τα σφάλματα στην ομάδα ελέγχου.

Ταξινομούμε τις 12 τιμές κατά αύξουσα σειρά και αντιστοιχούμε σε κάθε αρχική τιμή την τακτική τιμή της σημειώνοντας επίσης σε ποια από τις δύο ομάδες (Π) ή (Ε) ανήκει. Παρατηρούμε όμως ότι ορισμένες από τις αρχικές τιμές εμφανίζονται περισσότερο από μία φορά. Στις τιμές αυτές αποδίδουμε τον μέσο όρο των τακτικών τιμών. Έτσι στην μικρότερη τιμή 1 αποδίδουμε την τακτική τιμή 1, στην τιμή 2 που εμφανίζεται δύο φορές αντιστοιχούμε τον μέσο όρο των τακτικών τους τιμών (2+3)/2 = 2.5, στην τιμή 3 την τακτική τιμή 4, στην τιμή 4 που εμφανίζεται 3 φορές τον μέσο όρο των τακτικών τιμών τους (5+6+7)/3 = 6, στην τιμή 5 την τακτική τιμή 8, στην τιμή 6 που εμφανίζεται 2 φορές τον μέσο όρο των τακτικών τιμών (9+10)/2 = 9.5, στην τιμή 7 την τακτική τιμή 11 και τέλος στην τιμή 8 την τακτική τιμή 12.

Αρχικές τιμές 1 2 2 3 4 4 4 5 6 6 7 8

Τακτικές τιμές 1 2.5 2.5 4 6 6 6 8 9.5 9.5 11 12

Ομάδα E E E E E E Π Ε Π Π Π Π

Συνεπώς, οι τακτικές τιμές των δύο ομάδων θα είναι οι εξής

Πειραματική Ομάδα (Π) 11 6 9.5 9.5 12

Ομάδα Ελέγχου (Ε) 4 2.5 8 6 2.5 1 6

Συνεπώς, για την πειραματική ομάδα είναι R1=48, ενώ την ομάδα ελέγχου R2=30.

R1 + R2= 78 και 2

1NMNM = 2

)13(12 78, οπότε τα δύο αθροίσματα

υπολογίστηκαν σωστά.

U1 = MN + 1R

21MM

= 35 + 482

)6(5 2

U2 = MN + 2R

21NN

= 35 + 30287 = 33

Page 59: ΣΤΑΤΙΣΤΙΚΗ 2

59

Παρατηρούμε ότι U1 + U2 = ΜΝ =35 οπότε τα U1 και U2 υπολογίστηκαν επίσης σωστά.

Τελικά U = min{2, 33} = 2. Για α=0.05 και δίπλευρο έλεγχο με Μ=5 και Ν=7 η κρίσιμη τιμή από τον Πίνακα 5 του παραρτήματος είναι η τιμή 5. Επειδή 2 < 5 απορρίπτουμε τη μηδενική υπόθεση δεχόμενοι ότι ο αριθμός των σφαλμάτων διαφέρει στις δύο ομάδες. Μετά από κατόπτευση των δειγματικών δεδομένων παρατηρούμε ότι ο αριθμός των σφαλμάτων που έγιναν κάτω από κατάσταση stress είναι γενικά μεγαλύτερος.

Παρατήρηση

Αν Μ και Ν είναι μεγαλύτερα του 10 αποδεικνύεται ότι το στατιστικό U ακολουθεί προσεγγιστικά κανονική κατανομή με

μέσο όρο μ = 2

MN

και με την προϋπόθεση ότι δεν υπάρχουν πολλές επαναλήψεις τιμών με

τυπική απόκλιση σ = 12

1NMMN

Συνεπώς η μεταβλητή Ζ ακολουθεί όπως είναι γνωστό την κατανομή Ν(0,1)

Ζ=U

Συγκρίνοντας την απόλυτη τιμή Ζ με τις κατάλληλες κρίσιμες τιμές της Ν(0,1) μπορούμε να αποφασίσουμε για την αποδοχή ή την απόρριψη της μηδενικής υπόθεσης.

Page 60: ΣΤΑΤΙΣΤΙΚΗ 2

60

2.5. Έλεγχος Ισότητας δύο Αναλογιών σε Συσχετισμένα Δείγματα

Ο έλεγχος αυτός που είναι γνωστός με την ονομασία «έλεγχος McNemar» εφαρμόζεται στην περίπτωση που τα ίδια άτομα κατατάσσονται σε δύο κατηγορίες, βάσει ενός ποιοτικού χαρακτηριστικού, δύο διαφορετικές χρονικές στιγμές. Συνεπώς στην περίπτωση αυτού του ελέγχου θεωρούμε μόνο ένα δείγμα το οποίο μελετούμε δύο φορές ως προς μία διχοτομική μεταβλητή. Για να γίνει σαφής ο σκοπός και ο τρόπος εφαρμογής αυτού του ελέγχου ας δούμε το εξής παράδειγμα.

Παράδειγμα 2.4

Έστω ότι 50 ασθενείς σε ένα ψυχιατρικό νοσοκομείο κατατάχθηκαν από τα πρόσωπα αναφοράς σε δύο κατηγορίες ανάλογα με την ποιότητα των σχέσεων τους με το προσωπικό του ιδρύματος. Στην κατηγορία Α περιελήφθησαν οι ασθενείς που είχαν γενικά καλές σχέσεις ενώ στην κατηγορία Β αυτοί που δεν είχαν καλές σχέσεις με το προσωπικό. Μετά πάροδο ενός χρόνου οι ίδιοι 50 ασθενείς κατατάχθηκαν και πάλι από τα πρόσωπα αναφοράς στις δύο παραπάνω κατηγορίες. Τα αποτελέσματα που προέκυψαν συγκεντρώνονται σε έναν 2 x 2 πίνακα συχνοτήτων

Μετά Α Β Σύνολο

Α 13 6 19

Πρι

ν

Β 17 14 31 Σύνολο 30 20 50

Στον έλεγχο McNemar δεν ενδιαφερόμαστε παρά για τα άτομα που παρουσίασαν «αλλαγή» μεταξύ των δύο χρονικών στιγμών. Στο παράδειγμα μας αυτά τα άτομα είναι οι 17 ασθενείς που ενώ στην αρχή δεν είχαν καλές σχέσεις με το προσωπικό (Πριν Β), μετά από παρέλευση ενός χρόνου βελτίωσαν τις σχέσεις τους (Μετά Α), καθώς και οι 6 ασθενείς που παρουσίασαν την αντίστροφη τάση δηλαδή καλές σχέσεις πριν (Πριν Α) και όχι καλές μετά ένα χρόνο (Μετά Β).

Page 61: ΣΤΑΤΙΣΤΙΚΗ 2

61

Τα δεδομένα που αναλύονται με τον έλεγχο McNemar εμφανίζονται κατά ένα γενικό τρόπο με την μορφή ενός δισδιάστατου πίνακα

Μετά Α Β Σύνολο

Α f11 f12 f11+f12

Πρι

ν

Β f21 f22 f21+f22 Σύνολο f11+f21 f12+f22 n

Οι ποσότητες f11, f12, f21, και f22 είναι οι παρατηρούμενες (εμπειρικές) συχνότητες ενώ με «πριν» και «μετά» θα αποκαλούμε κατά σύμβαση τις δύο χρονικές στιγμές.

Η μηδενική υπόθεση στον έλεγχο αυτό είναι ότι η πιθανότητα της κατηγορίας A (αντίστοιχα της B) είναι η ίδια «πριν» και «μετά». Δηλαδή

Η0 : PA(Πριν) = PA(Μετά)

Η εκτίμηση της πρώτης πιθανότητα δίνεται από την παρατηρούμενη στο δείγμα αναλογία (f11+f12)/n ενώ η εκτίμηση της δεύτερης πιθανότητας από (f11+f21)/n. Φαίνεται συνεπώς ότι αν αληθεύει η μηδενική υπόθεση θα πρέπει f12 = f21 δηλαδή θα υπάρχει ο ίδιος αριθμός ατόμων στα κελιά (1, 2) και (2, 1). Αφού όμως ο συνολικός αριθμός ατόμων που εμφάνισαν «αλλαγή» είναι f12 + f21 θα πρέπει θεωρητικά σε καθεμία από τα δύο αυτά κελιά να υπάρχουν (f12 + f21)/2 άτομα. Αυτές θα είναι και οι αντίστοιχες θεωρητικές συχνότητες.

Ας θεωρήσουμε τώρα τον τύπο για την πραγματοποίηση του ελέγχου ανεξαρτησίας χ2 (βλέπε Σημειώσεις Στατιστικής Ι)

2

2

1

2

1

2

fij ij

ijji

Στον παραπάνω τύπο fij συμβολίζονται οι εμπειρικές (παρατηρούμενες) συχνότητες και θij οι θεωρητικές (αναμενόμενες).

Page 62: ΣΤΑΤΙΣΤΙΚΗ 2

62

Αν εφαρμόσουμε τον τύπο αυτό μόνο στα κελιά (1, 2) (1η γραμμή, 2η στήλη) και (2, 1) (2η γραμμή, 1η στήλη) στα οποία ανήκουν τα άτομα που παρουσίασαν «αλλαγή», η τελική μορφή του θα είναι η εξής

2 12 21

2

12 21

1

f ff f

Στον παραπάνω τύπο συμπεριλήφθηκε η λεγόμενη «διόρθωση Yates» για 2 x 2 πίνακες, για την αύξηση της ακρίβειας του στατιστικού ελέγχου και η οποία αφορά στην αφαίρεση της μονάδας στον αριθμητή του κλάσματος.

Με την προϋπόθεση ότι η μηδενική υπόθεση αληθεύει, το παραπάνω στατιστικό ακολουθεί κατανομή χ2 με 1 βαθμό ελευθερίας. Αν συνεπώς η τιμή του είναι μεγαλύτερη από την κρίσιμη τιμή

2 απορρίπτουμε τη μηδενική υπόθεση της ισότητας των δύο αναλογιών, διαφορετικά την δεχόμαστε. Όπως κάθε έλεγχος χ2 σε πίνακες συχνοτήτων, έτσι και ο έλεγχος McNemar είναι έγκυρος όταν οι θεωρητικές συχνότητες είναι μεγαλύτερες ή ίσες του 5 δηλαδή όταν (f12 + f21)/2 5

Εφαρμόζοντας το παραπάνω σκεπτικό στο παράδειγμα μας, οι δύο υποθέσεις μπορούν να διατυπωθούν ως εξής

Η0 : Pκαλών σχέσεων(Πριν) = Pκαλών σχέσεων(Μετά)

δηλαδή η πιθανότητα καλών σχέσεων «πριν» και «μετά» είναι ίσες.

Η1 : Η μηδενική υπόθεση δεν αληθεύει

Με τα δεδομένα του παραδείγματος είναι

2 12 21

2

12 21

1

f ff f

= 6 17 1

6 17

2

= 4.35

Επειδή η κρίσιμη τιμή 2 για 1 βαθμό ελευθερίας είναι 3.84, (Πίνακας 7,

παράρτημα) απορρίπτουμε την μηδενική υπόθεση της ισότητας των δύο αναλογιών. Από τα εμπειρικά δεδομένα μπορεί κανείς να συμπεράνει ότι παρατηρήθηκε βελτίωση των σχέσεων των ασθενών με το προσωπικό μετά από την παρέλευση του ενός χρόνου. Σημειώνουμε ότι η εφαρμογή του ελέγχου είναι έγκυρη γιατί οι θεωρητικές συχνότητες (f12 + f21)/2 = (6+17)/2 = 11.5 είναι μεγαλύτερες της τιμής 5.

Page 63: ΣΤΑΤΙΣΤΙΚΗ 2

63

2.6. Συντελεστής Συχέτισης Spearman

Ο συντελεστής συσχέτισης Spearman εφαρμόζεται στην περίπτωση που ζητείται να υπολογιστεί ο βαθμός συσχέτισης μεταξύ δύο μεταβλητών όταν οι τιμές τους εκφράζονται τουλάχιστον στην τακτική κλίμακα. Σε αντίθεση με το συντελεστή συσχέτισης Pearson (βλέπε Σημειώσεις Στατιστικής Ι) που προϋποθέτει την ύπαρξη γραμμικής σχέσης μεταξύ των δύο μεταβλητών, ο συντελεστής συσχέτισης Spearman χρησιμοποιείται και όταν η σχέση αυτή δεν είναι γραμμική.

Για να υπολογιστεί η τιμή του συντελεστή συσχέτισης Spearman αποδίδουμε στις τιμές της πρώτης μεταβλητής τις τακτικές τους τιμές, αντιστοιχώντας - όπως συνηθίζεται - στις τιμές που είναι ίσες το μέσο όρο των τακτικών τιμών. Το ίδιο κάνουμε και για τις τιμές της δεύτερης μεταβλητής. Έστω Χ και Υ είναι οι δύο μεταβλητές ενώ Χ’ και Υ’ οι νέες μεταβλητές που περιέχουν τις τακτικές τιμές. Αν στις μεταβλητές Χ’ και Υ’ εφαρμόσουμε τον τύπο του συντελεστή συσχέτισης Pearson η τιμή που θα προκύψει θα είναι αυτή του συντελεστή συσχέτισης Spearman.

Το παραπάνω σκεπτικό είναι σκόπιμο να εφαρμόζεται όταν έχουμε πολλές επαναλήψεις ίδιων τιμών όταν δηλαδή έχουμε πολλές αρχικές τιμές των μεταβλητών Χ ή Υ που είναι ίσες. Στην περίπτωση όμως που δεν έχουμε επαναλήψεις - ή έχουμε πολύ λίγες - χρησιμοποιείται ο απλουστευμένος τύπος

rd

n ns

ii

n

16

1

2

12

όπου di είναι οι διαφορές μεταξύ των τακτικών τιμών των μεταβλητών Χ και Υ δηλαδή d X Yi i i ' ' και n είναι το μέγεθος του δείγματος. Όπως ο συντελεστής συσχέτισης Pearson έτσι και ο συντελεστής συσχέτισης Spearman έχει σαν διάστημα δυνατών τιμών το διάστημα [-1, 1].

Παράδειγμα 2.5

Σε μία μελέτη των γνώσεων και στάσεων μαθητών Λυκείου για το AIDS κατασκευάστηκαν δύο δείκτες, ο πρώτος (Χ) για τη μέτρηση του βαθμού γνώσης των μαθητών για τους τρόπους μετάδοσης του ιού και ο δεύτερος (Υ) για τη διερεύνηση του βαθμού των αρνητικών στάσεων τους απέναντι σε πιθανούς φορείς ή ασθενείς από το ιό. Ο βαθμός της συσχέτισης μεταξύ των

Page 64: ΣΤΑΤΙΣΤΙΚΗ 2

64

δύο δεικτών θα υπολογιστεί με εφαρμογή του συντελεστή συσχέτισης Spearman. Στον πίνακα που ακολουθεί δίνονται οι τιμές των δύο αυτών δεικτών σε τυχαίο δείγμα 8 μαθητών, οι τακτικές τους τιμές καθώς και οι διαφορές μεταξύ των τακτικών τιμών.

Χ Y X’ Y’ d d2 18 30 7 4 3 9 15 28 5 3 2 4 16 32 6 5 1 1 12 33 3 6 -3 9 14 25 4 2 2 4 10 34 1 7 -6 36 11 35 2 8 -6 36 19 24 8 1 7 49

Σύνολο 148

Επειδή δεν υπάρχουν επαναλήψεις μπορεί να εφαρμοστεί ο απλουστευμένος τύπος

1nn

d61r 2

n

1i

2i

s =

164814861

= 1 - 1.76 = - 0.76

Διαπιστώνεται συνεπώς αρνητική συσχέτιση μεταξύ βαθμού γνώσης και βαθμού αρνητικών στάσεων απέναντι σε πιθανούς φορείς. Οι λιγότερο ενημερωμένοι φαίνεται να υιοθετούν σε μεγαλύτερο βαθμό αρνητικές στάσεις και το αντίθετο.

2.6.1. Έλεγχος για το συντελεστή συσχέτισης Spearman

Αν ρs είναι ο συντελεστής συσχέτισης Spearman σε όλον τον πληθυσμό, ένας πολύ χρήσιμος στατιστικός έλεγχος αφορά έχει ως μηδενική υπόθεση τη μη ύπαρξη συσχέτισης μεταξύ των δύο μεταβλητών δηλαδή

Η0 : ρs = 0

Ο έλεγχος αυτός μπορεί να πραγματοποιηθεί με τη βοήθεια του Πίνακα 6 του παραρτήματος που δίνει για n < 30 τις κρίσιμες τιμές στο δίπλευρο και μονόπλευρο έλεγχο για α=0.05 και α=0.01. Αν η τιμή του συντελεστή συσχέτισης Spearman rs στο δείγμα είναι κατά απόλυτη τιμή μεγαλύτερη ή

Page 65: ΣΤΑΤΙΣΤΙΚΗ 2

65

ίση από την κατάλληλη κρίσιμη τιμή απορρίπτουμε την μηδενική υπόθεση, διαφορετικά την αποδεχόμαστε. Για μεγάλα δείγματα και συγκεκριμένα όταν n > 30 ο έλεγχος πραγματοποιείται με χρήση του στατιστικού

2s

s r12nrt

που ακολουθεί προσεγγιστικά κατανομή t με n - 2 βαθμούς ελευθερίας.

Με τα δεδομένα του παραδείγματος μας, για n = 8 στον δίπλευρο έλεγχο και για επίπεδο σημαντικότητας α = 0.05 ο Πίνακας 6 δίνει ως κρίσιμη τιμή την 0.738. Επειδή η απόλυτη τιμή του rs βρέθηκε να είναι 0.760 απορρίπτουμε τη μηδενική υπόθεση αποδεχόμενοι ότι η συσχέτιση μεταξύ βαθμού γνώσης και βαθμού αρνητικών στάσεων είναι στατιστικώς σημαντική.

Page 66: ΣΤΑΤΙΣΤΙΚΗ 2

66

2.7. Συντελεστές Συνάφειας Cramer και φ

Όταν ο έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών αποβεί στατιστικώς σημαντικός είναι χρήσιμο να προσδιοριστεί ο βαθμός της υπάρχουσας σύνδεσης. Για το σκοπό αυτό χρησιμοποιείται ο συντελεστής συνάφειας Cramer. Η χρήση αυτού του συντελεστή συνάφειας απαιτεί η μία τουλάχιστον από τις δύο μεταβλητές να εκφράζεται στην ονομαστική κλίμακα δηλαδή οι κατηγορίες της να μη βρίσκονται σε σειρά διάταξης. Η τιμή του συντελεστή Cramer δίνεται από τον τύπο

Cnm

2

Στον τύπο αυτό, η τιμή χ2 προκύπτει από την εφαρμογή του ελέγχου ανεξαρτησίας μεταξύ των δύο κατηγορικών μεταβλητών (βλέπε Σημειώσεις Στατιστική Ι), n είναι το μέγεθος του δείγματος και m η μικρότερη από τις τιμές r-1 και c-1 όπου r και c είναι αντίστοιχα το πλήθος των γραμμών και των στηλών του πίνακα συνάφειας, δηλαδή το πλήθος των κατηγοριών των δύο μεταβλητών.

Οι δυνατές τιμές που μπορεί να πάρει ο συντελεστής Cramer κυμαίνονται από 0 έως 1. Για C=0 οι δύο μεταβλητές είναι ανεξάρτητες ενώ για C=1 είναι απόλυτα συνδεδεμένες. Στην περίπτωση που r = c και C=1 όλα τα κελιά του πίνακα συνάφειας θα είναι κενά εκτός από τα διαγώνια.

Παράδειγμα 2.6

Τυχαίο δείγμα 400 μαθητών της Γ’ τάξης Λυκείου ταξινομήθηκε ως προς δύο χαρακτηριστικά α) το κοινωνικοοικονομικό τους επίπεδο (ΚΟΕ) και β) την πανεπιστημιακή σχολή στην οποία επιθυμούσαν να εισαχθούν. Το κοινωνικοοικονομικό επίπεδο περιλάμβανε τρεις κατηγορίες ΚΟΕ1 (χαμηλό), ΚΟΕ2 (μέσο), ΚΟΕ3 (υψηλό), ενώ θεωρήθηκαν τρεις επίσης κατηγορίες πανεπιστημιακών σχολών Σ1 , Σ2 , Σ3. Τα δεδομένα παρουσιάζονται υπό τη μορφή ενός πίνακα συνάφειας.

Page 67: ΣΤΑΤΙΣΤΙΚΗ 2

67

Σ1 Σ2 Σ3 Σύνολο

ΚΟΕ1 23 (36.8) 34 (33.8) 52 (38.4) 109

ΚΟΕ2 29 (29.7) 28 (27.3) 31 (31.0) 88

ΚΟΕ3 83 (68.5) 62 (62.9) 58 (71.6) 203

Σύνολο 135 124 141 400

Οι αριθμοί μέσα στις παρενθέσεις είναι οι θεωρητικές συχνότητες που ο υπολογισμός τους θα παρουσιαστεί παρακάτω.

Οι υποθέσεις που αφορούν τον έλεγχο αυτό μπορούν να διατυπωθούν ως εξής:

Η0 : Το κοινωνικοοικονομικό επίπεδο είναι ανεξάρτητο του τύπου

σχολής

Η1 : Το κοινωνικοοικονομικό επίπεδο δεν είναι ανεξάρτητο του τύπου

σχολής

Για την εφαρμογή του ελέγχου απαιτείται ο υπολογισμός των θεωρητικών συχνοτήτων θij (βλέπε Σημειώσεις Στατιστικής Ι)

11

109 135400

368 x

. , 12

109 124400

338 x

. , 13

109 141400

38 4 x

. ,

21

88 135400

29 7 x

. , 22

88 124400

27 3 x

. , 23

88 141400

310 x

. ,

31

203 135400

685 x

. , 32

203 124400

62 9 x

. , 33

203 141400

716 x

. ,

Θα υπολογίζουμε τώρα την τιμή χ2 με βάση τον τύπο

r

1i

c

1j ij

2ijij2

θθf

χ

Στον παραπάνω τύπο fij συμβολίζονται οι εμπειρικές (παρατηρούμενες) συχνότητες και θij οι θεωρητικές (αναμενόμενες).

Page 68: ΣΤΑΤΙΣΤΙΚΗ 2

68

2

2

1

3

1

3

fij ij

ijji=

23 368368

34 338338

52 38 438 4

2 2 2..

..

..

29 29 729 7

28 27 327 3

2 2

..

..

31 310310

83 685685

62 62 962 9

58 716716

2 2 2 2..

..

..

..

= 5.175 + 0.001 + 4.817 +

+ 0.016 + 0.018 + 0.000 + 3.069 + 0.013 + 2.583 = 15.6.

Στο επίπεδο σημαντικότητας α = 0.05 και για (r-1)(c-1) = (3-1)(3-1) = 4 βαθμούς ελευθερίας η κρίσιμη τιμή χ2 από τον Πίνακα 7 του παραρτήματος είναι 9.488. Επειδή η τιμή χ2 είναι μεγαλύτερη από την κρίσιμη τιμή απορρίπτουμε τη μηδενική υπόθεση και δεχόμαστε ότι υπάρχει εξάρτηση μεταξύ των δύο κατηγορικών μεταβλητών. Σημειώνουμε ο έλεγχος χ2 είναι έγκυρος γιατί όλες οι θεωρητικές συχνότητες είναι μεγαλύτερες της τιμής 5.

Εφαρμόζοντας τον τύπο του συντελεστή συνάφειας Cramer στα δεδομένα του παραδείγματος προκύπτει

Cnm

2

= 2x400

6.15 = 0.14

Η τιμή αυτή δηλώνει μία μικρού μεγέθους συνάφεια μεταξύ κοινωνικοοικονομικού επιπέδου και τύπου Σχολής στην οποία επιθυμούν να εισαχθούν οι μαθητές.

Στην περίπτωση που οι δύο ποιοτικές μεταβλητές έχουν η κάθε μία τους από δύο κατηγορίες δηλαδή είναι διχοτομικές, ο τύπος του συντελεστή συνάφειας Cramer λόγω του ότι m = 1 απλοποιείται ως εξής

2

n

και ονομάζεται συντελεστής φ.

Page 69: ΣΤΑΤΙΣΤΙΚΗ 2

69

ΒΙΒΛΙΟΓΡΑΦΙΑ

Howell, D. (2008). Fundamental Statistics for the Behavioral Sciences (6th edition), Belmont, CA: Thomson Wadsworth. Howitt, D. and Cramer, D. (2003). An Introduction to Statistics in Psychology (Revised 2nd edition), Essex: Pearson.

Siegel, S. and Castellan, N.J. (1988). Nonparametric Statistics for the Behavioral Sciences (2nd edition), New York: McGraw-Hill.

Page 70: ΣΤΑΤΙΣΤΙΚΗ 2

70

ΠΑΡΑΡΤΗΜΑ

ΑΣΚΗΣΕΙΣ ΕΠΑΝΑΛΗΨΗΣ

Page 71: ΣΤΑΤΙΣΤΙΚΗ 2

71

1) Παρακάτω δίνεται ο βαθμός επαγγελματικής εξουθένωσης 12 τυχαία επιλεγμένων ατόμων από τρεις διαφορετικές επαγγελματικές ομάδες Α, Β και Γ. Υψηλές τιμές υποδηλώνουν αυξημένο βαθμό εξουθένωσης.

Α Β Γ 5 3 2 7 5 4 8 4 3 9 5 3

Να ελεγχθεί (για α=0.05) αν το είδος της επαγγελματικής απασχόλησης επηρεάζει σημαντικά το βαθμό επαγγελματικής εξουθένωσης των ατόμων. Αν ναι, τότε να βρεθεί ποιες επί μέρους επαγγελματικές ομάδες διαφέρουν. Να υπολογιστεί επίσης το μέγεθος της επίδρασης 2η .

2) Με βάση τα δεδομένα της άσκησης 1), να ελεγχθεί με εφαρμογή του κατάλληλου μη παραμετρικού ελέγχου (για α=0.05) αν διαφέρουν οι ομάδες Α και Γ ως προς το βαθμό επαγγελματικής εξουθένωσης.

3) Δείγμα 12 ατόμων που πάσχουν από μια ψυχική ασθένεια μοιράστηκε με τυχαία διαδικασία σε δύο ομάδες των 6 ατόμων όπου η ομάδα (Π) ήταν η ομάδα παρέμβασης ενώ η (Ε) η ομάδα ελέγχου. Τα 6 άτομα της κάθε ομάδας χωρίστηκαν περαιτέρω σε δύο ομάδες των 3 ατόμων, η πρώτη των οποίων (Α) είχε άτομα μεγάλης ηλικίας, ενώ η άλλη (Β) νεαρά άτομα. Τα αποτελέσματα δίνονται παρακάτω. Υψηλές τιμές υποδηλώνουν υψηλό βαθμό σε κλίμακα μέτρησης της σοβαρότητας της ασθένειας.

Π Ε 5 7

Α 6 6 7 8 4 7

Β 3 7 2 5

Να αξιολογηθούν (για α=0.05) τα αποτελέσματα της θεραπευτικής παρέμβασης.

4) Σε δείγμα 7 ατόμων μετρήθηκε ο χρόνος (σε λεπτά) που έκαναν για να λύσουν τρία αριθμητικά προβλήματα Χ, Υ και Ζ.

Page 72: ΣΤΑΤΙΣΤΙΚΗ 2

72

Χ Υ Ζ 3 6 4 2 7 2 3 8 3 4 5 2 1 9 5 2 7 3 3 8 4

Να ελεγχθεί (για α=0.05) αν υπάρχει διαφορά στους χρόνους επίλυσης μεταξύ των τριών προβλημάτων. Αν ναι, τότε να βρεθεί ποια επί μέρους προβλήματα διαφέρουν.

5) Με βάση τα δεδομένα της άσκησης 4), να ελεγχθεί με εφαρμογή του μη παραμετρικού ελέγχου Wilcoxon, αν (για α=0.05) διαφέρουν τα προβλήματα Χ και Υ ως προς τον χρόνο επίλυσης τους.

6) Για καθέναν από 8 μαθητές καταγράφηκε η βαθμολογία του σε δύο δοκιμασίες (Χ) και (Υ). Τα αποτελέσματα ήταν:

Χ : 7 9 12 5 6 8 10 13 Υ : 10 7 13 4 9 8 11 16

Να υπολογιστεί ο βαθμός της συσχέτισης μεταξύ των μεταβλητών Χ και Υ χρησιμοποιώντας μη παραμετρικό συντελεστή συσχέτισης.

7) Με βάση τα δεδομένα της άσκησης 6), να ελεγχθεί με εφαρμογή του προσημικού ελέγχου, αν (για α=0.05) διαφέρουν οι δυο δοκιμασίες Χ και Υ ως προς τη βαθμολογία που είχαν οι μαθητές σε αυτές.

8) Δείγμα 200 ατόμων ρωτήθηκε αν συμφωνεί με την ελεγχόμενη εφαρμογή της τεχνικής της κλωνοποίησης πριν και αμέσως μετά την παρακολούθηση σχετικής ενημερωτικής εκπομπής. Υπάρχει σημαντική αλλαγή στην άποψη των ατόμων;

Μετά Διαφωνούν Συμφωνούν Διαφωνούν 60 80 Πριν Συμφωνούν 40 20

Page 73: ΣΤΑΤΙΣΤΙΚΗ 2

73

ΑΠΑΝΤΗΣΕΙΣ ΤΩΝ ΑΣΚΗΣΕΩΝ

1) Ανάλυση διασποράς με έναν παράγοντα που είναι οι επαγγελματικές ομάδες. Εξαρτημένη μεταβλητή είναι η βαθμολογία στην κλίμακα επαγγελματικής εξουθένωσης. bSS = 35.717, wSS = 15.950, totSS =51.667.

bMS = 17.858, wMS = 1.772, F = 10.077, βαθμοί ελευθερίας β. ε. = (2, 9). Κρίσιμη τιμή = 4.2. Επειδή 10.077 > 4.2 το είδος επαγγελματικής απασχόλησης επηρεάζει στατιστικώς σημαντικά το βαθμό επαγγελματικής εξουθένωσης. Μέγεθος επίδρασης 2η = 0.691. Έλεγχος πολλαπλών συγκρίσεων Scheffe: AX = 7.25, BX = 4, ΓX = 3.4. Η επαγγελματική ομάδα Α διαφέρει στατιστικώς σημαντικά από τις Β και Γ. Ο βαθμός επαγγελματικής εξουθένωσης είναι, κατά μέσο όρο, σημαντικά μεγαλύτερος. Οι δύο τελευταίες ομάδες δεν διαφέρουν μεταξύ τους.

2) Μη παραμετρικός έλεγχος Mann-Whitney. AR = 29.50, ΓR = 15.50. U = 0.5. Είναι Μ=4 και Ν=5. Κρίσιμη τιμή = 1. Επειδή 0.5 < 1 οι ομάδες Α και Γ διαφέρουν στατιστικώς ως προς το βαθμό επαγγελματικής εξουθένωσης και μάλιστα η διαφορά είναι υπέρ της Α.

3) Πρόκειται για 2x2 ανάλυση διασποράς.

Κύρια επίδραση του παράγοντα «παρέμβαση» με 2 επίπεδα (ομάδα παρέμβασης – ομάδα ελέγχου): F(1, 8) = 13. Κρίσιμη τιμή 5.3. Επειδή 13 > 5.3 η κύρια επίδραση είναι στατιστικώς σημαντική. Είναι ΠX =4.50, και ΕX = 6.67. Άρα ο βαθμός σοβαρότητας της ασθένειας είναι σημαντικά μικρότερος στην ομάδα παρέμβασης σε σχέση με την ομάδα ελέγχου.

Κύρια επίδραση του παράγοντα «ηλικία» με 2 επίπεδα (ηλικιωμένα άτομα – νεαρά άτομα): F(1, 8) = 9.31. Κρίσιμη τιμή 5.3. Επειδή 9.31 > 5.3 η κύρια επίδραση είναι στατιστικώς σημαντική. Είναι ΗX =6.50, και ΝX = 4.67. Άρα ο βαθμός σοβαρότητας της ασθένειας είναι σημαντικά μικρότερος στην ομάδα των νεαρών ατόμων (Ν) παρά των ηλικιωμένων (Η).

Αλληλεπίδραση μεταξύ των δύο παραγόντων: F(1, 8) = 3.77. Κρίσιμη τιμή 5.3. Επειδή 3.77 < 5.3 δεν υπάρχει στατιστικώς σημαντική αλληλεπίδραση.

4) Ανάλυση διασποράς με έναν ενδοϋποκειμενικό παράγοντα που είναι ο παράγοντας «αριθμητικό πρόβλημα» με τρία επίπεδα Χ, Υ, Ζ. Εξαρτημένη μεταβλητή ο χρόνος (σε mn). colSS = 84.667, resSS = 18, colMS = 42.333,

resMS = 1.5, F = 28.22, βαθμοί ελευθερίας β. ε. = (2, 12). Κρίσιμη τιμή = 3.8. Επειδή 28.222 > 3.8 υπάρχει στατιστικώς σημαντική διαφορά μεταξύ των

Page 74: ΣΤΑΤΙΣΤΙΚΗ 2

74

τριών προβλημάτων ως προς τους μέσους χρόνους επίλυσης τους. Έλεγχος πολλαπλών συγκρίσεων Scheffe: XX = 2.57, YX = 7.14, ZX = 3.29. Το αριθμητικό πρόβλημα Υ διαφέρει στατιστικώς σε σχέση με τα Χ και Ζ. Ο χρόνος που απαιτείται είναι, κατά μέσο όρο, σημαντικά μεγαλύτερος. Αντίθετα, τα προβλήματα Χ και Ζ δεν διαφέρουν ως προς το χρόνο επίλυσης τους.

5) Έλεγχος Wilcoxon. Είναι Τ(+) = 0 και Τ(-) = 28, συνεπώς Τ = 0. Για Ν=7, η κρίσιμη τιμή = 2. Επειδή 0 < 2 τα προβλήματα Χ και Υ διαφέρουν στατιστικώς ως προς τον χρόνο επίλυσης τους και μάλιστα για το Υ απαιτείται περισσότερος χρόνος για την επίλυση του.

6) Συντελεστής συσχέτισης Spearman sr = 0.786.

7) Προσημικός έλεγχος. S(+) = 2, S(-) = 5. Μια διαφορά = 0. Άρα Ν=7. Κρίσιμη τιμή = 0. Η τιμή 2 (και η 5) βρίσκονται στο διάστημα (0, 7). Συνεπώς η μηδενική υπόθεση ισχύει και άρα δεν διαφέρουν οι δυο δοκιμασίες ως προς τη βαθμολογία τους.

8) Έλεγχος McNemar. 2χ = 12.675. Κρίσιμη τιμή = 3.841. Επειδή 12.675 > 3.841 υπάρχει σημαντική αλλαγή στην άποψη των ατόμων και μάλιστα υπέρ της ελεγχόμενης εφαρμογής της τεχνικής της κλωνοποίησης. Ο έλεγχος είναι έγκυρος επειδή (f12 + f21)/2 = 60 > 5.

Page 75: ΣΤΑΤΙΣΤΙΚΗ 2

75

ΠΑΡΑΡΤΗΜΑ

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ

Page 76: ΣΤΑΤΙΣΤΙΚΗ 2

76

Πίνακας 1. Κρίσιμες τιμές της κατανομής F (α = 0.05) Γραμμή περιθωρίου: βαθμοί ελευθερίας του αριθμητή (κ1). Στήλη περιθωρίου: βαθμοί ελευθερίας του παρονομαστή (κ2).

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 1 161 200 216 225 230 234 237 239 241 242 244 246 248 249 250 251 252 253 254 2 18. 19. 19. 19. 19. 19. 19. 19. 19. 19. 19. 19. 19. 19. 19. 19. 19. 19. 19.3 10. 9.5 9.2 9.1 9.0 8.9 8.8 8.8 8.8 8.7 8.7 8.7 8.6 8.6 8.6 8.5 8.5 8.5 8.54 7.7 6.9 6.5 6.3 6.2 6.1 6.0 6.0 6.0 5.9 5.9 5.8 5.8 5.7 5.7 5.7 5.6 5.6 5.65 6.6 5.7 5.4 5.1 5.0 4.9 4.8 4.8 4.7 4.7 4.6 4.6 4.5 4.5 4.5 4.4 4.4 4.4 4.36 5.9 5.1 4.7 4.5 4.3 4.2 4.2 4.1 4.1 4.0 4.0 3.9 3.8 3.8 3.8 3.7 3.7 3.7 3.67 5.5 4.7 4.3 4.1 3.9 3.8 3.7 3.7 3.6 3.6 3.5 3.5 3.4 3.4 3.3 3.3 3.3 3.2 3.28 5.3 4.4 4.0 3.8 3.6 3.5 3.5 3.4 3.3 3.3 3.2 3.2 3.1 3.1 3.0 3.0 3.0 2.9 2.99 5.1 4.2 3.8 3.6 3.4 3.3 3.2 3.2 3.1 3.1 3.0 3.0 2.9 2.9 2.8 2.8 2.7 2.7 2.7

10 4.9 4.1 3.7 3.4 3.3 3.2 3.1 3.0 3.0 2.9 2.9 2.8 2.7 2.7 2.7 2.6 2.6 2.5 2.511 4.8 3.9 3.5 3.3 3.2 3.0 3.0 2.9 2.9 2.8 2.7 2.7 2.6 2.6 2.5 2.5 2.4 2.4 2.412 4.7 3.8 3.4 3.2 3.1 3.0 2.9 2.8 2.8 2.7 2.6 2.6 2.5 2.5 2.4 2.4 2.3 2.3 2.313 4.6 3.8 3.4 3.1 3.0 2.9 2.8 2.7 2.7 2.6 2.6 2.5 2.4 2.4 2.3 2.3 2.3 2.2 2.214 4.6 3.7 3.3 3.1 2.9 2.8 2.7 2.7 2.6 2.6 2.5 2.4 2.3 2.3 2.3 2 2.2 2.1 2.115 4.5 3.6 3.2 3.0 2.9 2.7 2.7 2.6 2.5 2.5 2.4 2.4 2.3 2.2 2.2 2.2 2.1 2.1 2.016 4.4 3.6 3.2 3.0 2.8 2.7 2.6 2.5 2.5 2.4 2.4 2.3 2.2 2.2 2.1 2.1 2.1 2.0 2.017 4.4 3.5 3.2 2.9 2.8 2.7 2.6 2.5 2.4 2.4 2.3 2.3 2.2 2.1 2.1 2.1 2.0 2.0 1.918 4.4 3.5 3.1 2.9 2.7 2.6 2.5 2.5 2.4 2.4 2.3 2.2 2.1 2.1 2.1 2.0 2.0 1.9 1.919 4.3 3.5 3.1 2.9 2.7 2.6 2.5 2.4 2.4 2.3 2.3 2.2 2.1 2.1 2.0 2.0 1.9 1.9 1.820 4.3 3.4 3.1 2.8 2.7 2.6 2.5 2.4 2.3 2.3 2.2 2.2 2.1 2.0 2.0 1.9 1.9 1.9 1.821 4.3 3.4 3.0 2.8 2.6 2.5 2.4 2.4 2.3 2.3 2.2 2.1 2.1 2.0 2.0 1.9 1.9 1.8 1.822 4.3 3.4 3.0 2.8 2.6 2.5 2.4 2.4 2.3 2.3 2.2 2.1 2.0 2.0 1.9 l.94 1.8 1.8 1.723 4.2 3.4 3.0 2.8 2.6 2.5 2.4 2.3 2.3 2.2 2.2 2.1 2.0 2.0 1.9 1.9 1.8 1.8 1.724 4.2 3.4 3.0 2.7 2.6 2.5 2.4 2.3 2.3 2.2 2.1 2.1 2.0 1.9 1.9 1.8 1.8 1.7 1.725 4.2 3.3 2.9 2.7 2.6 2.4 2.4 2.3 2.2 2.2 2.1 2.0 2.0 1.9 1.9 1.8 1.8 1.7 1.726 4.2 3.3 2.9 2.7 2.5 2.4 2.3 2.3 2.2 2.2 2.1 2.0 1.9 1.9 1.9 1.8 1.8 1.7 1.627 4.2 3.3 2.9 2.7 2.5 2.4 2.3 2.3 2.2 2.2 2.1 2.0 1.9 1.9 1.8 1.8 1.7 1.7 1.628 4.2 3.3 2.9 2.7 2.5 2.4 2.3 2.2 2.2 2.1 2.1 2.0 1.9 1.9 1.8 1.8 1.7 1.7 1.629 4.1 3.3 2.9 2.7 2.5 2.4 2.3 2.2 2.2 2.1 2.1 2.0 1.9 1.9 1.8 1.8 1.7 1.7 1.630 4.1 3.3 2.9 2.6 2.5 2.4 2.3 2.2 2.2 2.1 2.0 2.0 1.9 1.8 1.8 1.7 1.7 1.6 1.640 4.0 3.2 2.8 2.6 2.4 2.3 2.2 2.1 2.1 2.0 2.0 1.9 1.8 1.7 1.7 1.6 1.6 1.5 1.560 4.0 3.1 2.7 2.5 2.3 2.2 2.1 2.1 2.0 1.9 1.9 1.8 1.7 1.7 1.6 1.5 1.5 1.4 1.3120 3.9 3.0 2.6 2.4 2.2 2.1 2.0 2.0 1.9 1.9 1.8 1.7 1.6 1.6 1.5 1.5 1.4 1.3 1.2 3.8 3.0 2.6 2.3 2.2 2.1 2.0 1.9 1.8 1.8 1.7 1.6 1.5 1.5 1.4 1.3 1.3 1.2 1.0

Page 77: ΣΤΑΤΙΣΤΙΚΗ 2

77

Πίνακας 1. (συνέχεια). Κρίσιμες τιμές της κατανομής F (α = 0.01) Γραμμή περιθωρίου: βαθμοί ελευθερίας του αριθμητή (κ1). Στήλη περιθωρίου: βαθμοί ελευθερίας του παρονομαστή (κ2).

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 1 405 500 540 562 576 585 592 598 602 605 610 615 620 623 626 628 631 633 6362 98.5 99.0 99.2 99.2 99.3 99.3 99.4 99.4 99.4 99.4 99.4 99.4 99.4 99.5 99.5 99.5 99.5 99.5 99.5 3 34.1 30.8 29.5 28.7 28.2 27.9 27.7 27.5 27.3 27.2 27.1 26.9 26.7 26.6 26.5 26.4 26.3 26.2 26.1 4 21.2 18.0 16.7 16.0 15.5 15.2 15.0 14.8 14.7 14.5 14.4 14.2 14.0 13.9 13.8 13.7 13.7 13.6 13.5 5 16.3 13.3 12.1 11.4 11.0 10.7 10.5 10.3 10.2 10.1 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02 6 13.7 10.9 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88 7 12.2 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65 8 11.3 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86 9 10.6 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31

10 10.0 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91 11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60 12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36 13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17 14 8.86 6.51 5.56 5.04 4.70 4.46 4.28 4.14 4.03 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00 15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87 16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75 17 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65 18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57 19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49 20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42 21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36 22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31 23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26 24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21 25 7.77 5.57 4.68 4.18 3.86 3.63 3.46 3.32 3.22 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17 26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 2.82 2.66 2.58 2.50 2.42 2.33 2.23 2.13 27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10 28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06 29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03 30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01 40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80 60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60 120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00

Page 78: ΣΤΑΤΙΣΤΙΚΗ 2

78

Πίνακας 2. Κρίσιμες τιμές για τον έλεγχο πολλαπλών συγκρίσεων Tukey

Πλήθος μέσων όρων k Βαθμοί ελευθερίας α 2 3 4 5 6 7 8 9 10 11

5 0.05 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 0.01 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24 10.48 6 0.05 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49 6.65 0.01 5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 9.30 7 0.05 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16 6.30 0.01 4.95 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8.37 8.55 8 0.05 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 0.01 4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68 7.86 8.03 9 0.05 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 5.87 0.01 4.60 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49 7.65

10 0.05 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 5.72 0.01 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 7.21 7.36

11 0.05 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61 0.01 4.39 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99 7.13

12 0.05 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.39 5.51 0.01 4.32 5.05 5.50 5.84 6.10 6.32 6.51 6.67 6.81 6.94

13 0.05 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32 5.43 0.01 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53 6.67 6.79

14 0.05 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 0.01 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6.41 6.54 6.66

15 0.05 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20 5.31 0.01 4.17 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44 6.55

16 0.05 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 5.26 0.01 4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22 6.35 6.46

17 0.05 2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 5.21 0.01 4.10 4.74 5.14 5.43 5.66 5.85 6.01 6.15 6.27 6.38

18 0.05 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07 5.17 0.01 4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20 6.31

19 0.05 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 5.14 0.01 4.05 4.67 5.05 5.33 5.55 5.73 5.89 6.02 6.14 6.25

Page 79: ΣΤΑΤΙΣΤΙΚΗ 2

79

Πίνακας 2. (συνέχεια). Κρίσιμες τιμές για τον έλεγχο πολλαπλών συγκρίσεων Tukey

Πλήθος μέσων όρων k Βαθμοί ελευθερίας α 2 3 4 5 6 7 8 9 10 11

20 0.05 2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 5.11 0.01 4.02 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09 6.19

24 0.05 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 0.01 3.96 4.55 4.91 5.17 5.37 5.54 5.69 5.81 5.92 6.02

30 0.05 2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 4.92 0.01 3.89 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76 5.85

40 0.05 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 4.82 0.01 3.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60 5.69

60 0.05 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 0.01 3.76 4.28 4.59 4.82 4.99 5.13 5.25 5.36 5.45 5.53

120 0.05 2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56 4.64 0.01 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30 5.37 0.05 2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55 0.01 3.64 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16 5.23

Page 80: ΣΤΑΤΙΣΤΙΚΗ 2

80

Πίνακας 3. Κρίσιμες τιμές για τον προσημικό έλεγχο (α=0.05)

N 0.025 0.050 0.950 0.975 5 0 5 6 0 0 6 6 7 0 0 7 7 8 0 1 7 8 9 1 1 8 8

10 1 1 9 9 11 1 2 9 10 12 2 2 10 10 13 2 3 10 11 14 2 3 11 12 15 3 3 12 12 16 3 4 12 13 17 4 4 13 13 18 4 5 13 14 19 4 5 14 15 20 5 5 15 15 21 5 6 15 16 22 5 6 16 17 23 6 7 16 17 24 6 7 17 18 25 7 7 18 18

Page 81: ΣΤΑΤΙΣΤΙΚΗ 2

81

Πίνακας 4. Κρίσιμες τιμές για τον έλεγχο Wilcoxon σε συσχετισμένα δείγματα

Ν 0.05 0.025 0.01 0.005

5 0

6 2 0

7 3 2 0

8 5 3 1 0

9 8 5 3 1

10 10 8 5 3

11 13 10 7 5

12 17 13 9 7

13 21 17 12 9

14 25 21 15 12

15 30 25 19 15

16 35 29 23 19

17 41 34 27 23

18 47 40 32 27

19 53 46 37 32

20 60 52 43 37

Page 82: ΣΤΑΤΙΣΤΙΚΗ 2

82

Πίνακας 5. Κρίσιμες τιμές για τον έλεγχο Mann-Whitney

Μ Ν 0.05 0.025 0.01 0.005 2 5 0 2 6 0 2 7 0 2 8 1 0 2 9 1 0 2 10 1 0 3 3 0 3 4 0 3 5 1 0 3 6 2 1 3 7 2 1 0 3 8 3 2 0 3 9 4 2 1 0 3 10 4 3 1 0 4 4 1 0 4 5 2 1 0 4 6 3 2 1 0 4 7 4 3 1 0 4 8 5 4 2 1 4 9 6 4 3 1 4 10 7 5 3 2 5 5 4 2 1 0 5 6 5 3 2 1 5 7 6 5 3 1 5 8 8 6 4 2 5 9 9 7 5 3 5 10 11 8 6 4 6 6 7 5 3 2 6 7 8 6 4 3 6 8 10 8 6 4 6 9 12 10 7 5 6 10 14 11 8 6 7 7 11 8 6 4 7 8 13 10 7 6 7 9 15 12 9 7 7 10 17 14 11 9 8 8 15 13 9 7 8 9 18 15 11 9 8 10 20 17 13 11 9 9 21 17 14 11 9 10 24 20 16 13

10 10 27 23 19 16

Page 83: ΣΤΑΤΙΣΤΙΚΗ 2

83

Πίνακας 6. Κρίσιμες τιμές για τον έλεγχο του συντελεστή συσχέτισης Spearman

n 0.05 0.025 0.01 0.005

4 1.000

5 0.900 1.000 1.000

6 0.829 0.886 0.943 1.000

7 0.714 0.786 0.893 0.929

8 0.643 0.738 0.833 0.881

9 0.600 0.700 0.783 0.833

10 0.564 0.648 0.745 0.794

11 0.536 0.618 0.709 0.755

12 0.503 0.587 0.671 0.727

13 0.484 0.560 0.648 0.703

14 0.464 0.538 0.622 0.675

15 0.443 0.521 0.604 0.654

16 0.429 0.503 0.582 0.635

17 0.414 0.485 0.566 0.615

18 0.401 0.472 0.550 0.600

19 0.391 0.460 0.535 0.584

20 0.380 0.447 0.520 0.570

21 0.370 0.435 0.508 0.556

22 0.361 0.425 0.496 0.544

23 0.353 0.415 0.486 0.532

24 0.344 0.406 0.476 0.521

25 0.337 0.398 0.466 0.511

26 0.331 0.390 0.457 0.501

27 0.324 0.382 0.448 0.491

28 0.317 0.375 0.440 0.483

29 0.312 0.368 0.433 0.475

30 0.306 0.362 0.425 0.467

Page 84: ΣΤΑΤΙΣΤΙΚΗ 2

84

Πίνακας 7. Κρίσιμες τιμές της κατανομής χ2

Βαθμοί ελευθερίας

0.10 0.05 0.025 0.01 0.005 0.001

1 2.706 3.841 5.024 6.635 7.879 10.828 2 4.605 5.991 7.378 9.210 10.597 13.816 3 6.251 7.815 9.348 11.345 12.838 16.266 4 7.779 9.488 11.143 13.277 14.860 18.467 5 9.236 11.070 12.833 15.086 16.750 20.515 6 10.645 12.592 14.449 16.812 18.548 22.458 7 12.017 14.067 16.013 18.475 20.278 24.322 8 13.362 15.507 17.535 20.090 21.955 26.124 9 14.684 16.919 19.023 21.666 23.589 27.877 10 15.987 18.307 20.483 23.209 25.188 29.588 11 17.275 19.675 21.920 24.725 26.757 31.264 12 18.549 21.026 23.337 26.217 28.300 32.909 13 19.812 22.362 24.736 27.688 29.819 34.528 14 21.064 23.685 26.119 29.141 31.319 36.123 15 22.307 24.996 27.488 30.578 32.801 37.697 16 23.542 26.296 28.845 32.000 34.267 39.252 17 24.769 27.587 30.191 33.409 35.718 40.790 18 25.989 28.869 31.526 34.805 37.156 42.312 19 27.204 30.144 32.852 36.191 38.582 43.820 20 28.412 31.410 34.170 37.566 39.997 45.315 21 29.615 32.671 35.479 38.932 41.401 46.797 22 30.813 33.924 36.781 40.289 42.796 48.268 23 32.007 35.172 38.076 41.638 44.181 49.728 24 33.196 36.415 39.364 42.980 45.559 51.179 25 34.382 37.652 40.646 44.314 46.928 52.620 26 35.563 38.885 41.923 45.642 48.290 54.052 27 36.741 40.113 43.195 46.963 49.645 55.476 28 37.916 41.337 44.461 48.278 50.993 56.892 29 39.087 42.557 45.722 49.588 52.336 58.301 30 40.256 43.773 46.979 50.892 53.672 59.703 40 51.805 55.758 59.342 63.691 66.766 73.402 60 74.397 79.082 83.298 88.379 91.952 99.607 80 96.578 101.879 106.629 112.329 116.321 124.839

100 118.498 124.342 129.561 135.807 140.169 149.449