20
1 ο ΜΑΘΗΜΑ Κεφάλαιο 1, Παράγραφοι 1.1, 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 Α΄ΜΕΡΟΣ ΤΟ ΒΑΣΙΚΟ ΜΑΣ ΛΕΞΙΛΟΓΙΟ Στατιστική είναι ο κλάδος των μαθηματικών που ασχολείται με τη συλλογή, την οργάνωση, την παρουσίαση και την ανάλυση αριθμητικών δεδομένων ή ποιοτικών χαρακτηριστικών, που λαμβάνονται από ένα σύνολο αντικειμένων τα οποία συνθέτουν τον υπό μελέτη πληθυσμό. Κύριος στόχος της Στατιστικής είναι η εξαγωγή συμπερασμάτων για τον πληθυσμό με τη χρήση και την επεξεργασία ενός μοναδικού δείγματος, δηλαδή ενός μικρού μέρους (υποσυνόλου) του πληθυσμού. Η Περιγραφική Στατιστική (Descriptive Statistics) είναι το σύνολο των μεθόδων που χρησιμοποιούνται για την οργάνωση και την παρουσίαση των δεδομένων. Εδώ θα συναντήσουμε τους στατιστικούς πίνακες (οργάνωση των δεδομένων) και διάφορους τύπους γραφημάτων (παρουσίαση των δεδομένων). Ακόμα, στην Περιγραφική Στατιστική συμπεριλαμβάνονται ο υπολογισμός και η ερμηνεία αριθμητικών μέτρων (δεικτών), όπως ο αριθμητικός μέσος, η διάμεσος, κ.α. Η Επαγωγική Στατιστική (Inferential Statistics) είναι το σύνολο των μεθόδων που χρησιμοποιούνται για την εξαγωγή των συμπερασμάτων και τη λήψη αποφάσεων. 1.1 Πληθυσμός – Δείγμα Πληθυσμός (population) μιας στατιστικής έρευνας είναι το σύνολο των οντοτήτων που πρόκειται να μελετήσουμε, ως προς ένα ή περισσότερα χαρακτηριστικά του. Ο πληθυσμός μπορεί να είναι ένα σύνολο ανθρώπων (για παράδειγμα το σύνολο των κατοίκων της Ελλάδας, το σύνολο των μεταναστών στην Ελλάδα, το σύνολο των τουριστών που επισκέφτηκαν τη χώρα μια συγκεκριμένη χρονιά, κ.λπ.) Μπορεί να είναι ένα σύνολο αντικειμένων (για παράδειγμα, το σύνολο των ταξί μιας πόλης, το σύνολο των κινητών τηλεφώνων που παράγει μια εταιρεία, το σύνολο των ενοικιαζόμενων για διακοπές δωματίων που διαθέτει η χώρα ή το σύνολο των μεγάλων ξενοδοχειακών μονάδων κ.λπ.) Μπορεί να είναι το σύνολο των μετρήσεων ενός φυσικού μεγέθους (τιμές θερμοκρασίας τον μήνα Ιούλιο), ενός οικονομικού μεγέθους (το Α.Ε.Π. μιας χώρας), κ.α. Τις περισσότερες φορές ο πληθυσμός που πρόκειται να μελετήσουμε είναι πολύ μεγάλος. Χρονικοί αλλά και οικονομικοί λόγοι καθιστούν την απογραφή ολόκληρου του πληθυσμού σχεδόν αδύνατη. Έτσι, η συλλογή των δεδομένων περιορίζεται στην καταγραφή ενός μικρού σχετικά υποσυνόλου που επιλέγεται κατάλληλα από τον πληθυσμό. Το υποσύνολο αυτό ονομάζεται δείγμα (sample) της στατιστικής έρευνας.

1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

1ο ΜΑΘΗΜΑ

Κεφάλαιο 1, Παράγραφοι 1.1, 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2

Α΄ΜΕΡΟΣ

ΤΟ ΒΑΣΙΚΟ ΜΑΣ ΛΕΞΙΛΟΓΙΟ

Στατιστική είναι ο κλάδος των μαθηματικών που ασχολείται με τη συλλογή, την οργάνωση, την

παρουσίαση και την ανάλυση αριθμητικών δεδομένων ή ποιοτικών χαρακτηριστικών, που

λαμβάνονται από ένα σύνολο αντικειμένων τα οποία συνθέτουν τον υπό μελέτη πληθυσμό.

Κύριος στόχος της Στατιστικής είναι η εξαγωγή συμπερασμάτων για τον πληθυσμό με τη

χρήση και την επεξεργασία ενός μοναδικού δείγματος, δηλαδή ενός μικρού μέρους

(υποσυνόλου) του πληθυσμού.

Η Περιγραφική Στατιστική (Descriptive Statistics) είναι το σύνολο των μεθόδων που

χρησιμοποιούνται για την οργάνωση και την παρουσίαση των δεδομένων.

Εδώ θα συναντήσουμε τους στατιστικούς πίνακες (οργάνωση των δεδομένων) και διάφορους

τύπους γραφημάτων (παρουσίαση των δεδομένων).

Ακόμα, στην Περιγραφική Στατιστική συμπεριλαμβάνονται ο υπολογισμός και η ερμηνεία

αριθμητικών μέτρων (δεικτών), όπως ο αριθμητικός μέσος, η διάμεσος, κ.α.

Η Επαγωγική Στατιστική (Inferential Statistics) είναι το σύνολο των μεθόδων που

χρησιμοποιούνται για την εξαγωγή των συμπερασμάτων και τη λήψη αποφάσεων.

1.1 Πληθυσμός – Δείγμα

Πληθυσμός (population) μιας στατιστικής έρευνας είναι το σύνολο των οντοτήτων που

πρόκειται να μελετήσουμε, ως προς ένα ή περισσότερα χαρακτηριστικά του.

Ο πληθυσμός μπορεί να είναι ένα σύνολο ανθρώπων (για παράδειγμα το σύνολο των κατοίκων

της Ελλάδας, το σύνολο των μεταναστών στην Ελλάδα, το σύνολο των τουριστών που

επισκέφτηκαν τη χώρα μια συγκεκριμένη χρονιά, κ.λπ.)

Μπορεί να είναι ένα σύνολο αντικειμένων (για παράδειγμα, το σύνολο των ταξί μιας πόλης, το

σύνολο των κινητών τηλεφώνων που παράγει μια εταιρεία, το σύνολο των ενοικιαζόμενων για

διακοπές δωματίων που διαθέτει η χώρα ή το σύνολο των μεγάλων ξενοδοχειακών μονάδων

κ.λπ.)

Μπορεί να είναι το σύνολο των μετρήσεων ενός φυσικού μεγέθους (τιμές θερμοκρασίας τον

μήνα Ιούλιο), ενός οικονομικού μεγέθους (το Α.Ε.Π. μιας χώρας), κ.α.

Τις περισσότερες φορές ο πληθυσμός που πρόκειται να μελετήσουμε είναι πολύ μεγάλος.

Χρονικοί αλλά και οικονομικοί λόγοι καθιστούν την απογραφή ολόκληρου του πληθυσμού

σχεδόν αδύνατη. Έτσι, η συλλογή των δεδομένων περιορίζεται στην καταγραφή ενός μικρού

σχετικά υποσυνόλου που επιλέγεται κατάλληλα από τον πληθυσμό. Το υποσύνολο αυτό

ονομάζεται δείγμα (sample) της στατιστικής έρευνας.

Page 2: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

2 1ο Μάθημα

Μαρίνα Σύρπη

Θα πρέπει εδώ να αναφέρουμε ότι η επιλογή του κατάλληλου δείγματος (δειγματοληψία -

sampling), αποτελεί το πρώτο και, φυσικά, καθοριστικό βήμα για μια ορθή και αξιόπιστη

στατιστική έρευνα. Σε μια δειγματοληψία, οφείλουμε να ακολουθούμε τους κανόνες που

ορίζονται από την Στατιστική και να χρησιμοποιούμε τις ενδεδειγμένες μεθόδους (τεχνικές

δειγματοληψίας) (βλ. παράγραφος 1.2 – συγκέντρωση στατιστικών στοιχείων)

1.2 Μεταβλητές – Είδη Μεταβλητών – Δεδομένα

Μεταβλητή (variable) είναι κάθε χαρακτηριστικό του πληθυσμού το οποίο διαφοροποιείται

από αντικείμενο σε αντικείμενο, από περιοχή σε περιοχή ή αλλάζει με το πέρασμα του χρόνου.

Το ύψος, το βάρος, το χρώμα των ματιών ενός εφήβου είναι μεταβλητές του πληθυσμού των

εφήβων στην Ελλάδα. Ο αριθμός των εργαζομένων, τα έσοδα, τα έξοδα είναι μεταβλητές του

πληθυσμού των επιχειρήσεων. Συνηθίζουμε να συμβολίζουμε τις μεταβλητές με κεφαλαία

γράμματα, όπως , ,X Y Z .

Ποσοτική (quantitative) είναι κάθε μεταβλητή που μπορεί να μετρηθεί, με την κοινή έννοια του

όρου. Ο χρόνος (σε min) που ξοδεύει καθημερινά στο Internet ο φοιτητής, η αξία (σε €) μιας

μετοχής, ο αριθμός των μελών της οικογένειας είναι ποσοτικές μεταβλητές.

Ποιοτική (qualitative) είναι η μεταβλητή που καταγράφει κάποιο ποιοτικό (μη μετρήσιμο)

χαρακτηριστικό. Για παράδειγμα, το χρώμα των ματιών ενός ατόμου, το επίπεδο μόρφωσης, η

οικογενειακή κατάσταση, ο τόπος καταγωγής είναι ποιοτικές μεταβλητές.

Τιμή μιας μεταβλητής είναι το αποτέλεσμα που προκύπτει από τη μέτρηση ή την καταγραφή

της.

Οι ποσοτικές μεταβλητές παίρνουν σαν τιμές πραγματικούς αριθμούς και χωρίζονται σε

διακριτές (discrete) και συνεχείς (continuous).

Διακριτή, είναι η ποσοτική μεταβλητή που παίρνει τις τιμές της από ένα αριθμήσιμο σύνολο,

δηλαδή ένα σύνολο αριθμών που μπορούμε να το απαριθμήσουμε στοιχείο προς στοιχείο.

Για παράδειγμα, το πλήθος των μαθημάτων που μπορεί να δηλώσει ο φοιτητής σε ένα εξάμηνο

είναι διακριτή μεταβλητή που παίρνει τιμές από το σύνολο {1, 2, 3, 4, 5, 6, 7, 8}.

Το πλήθος των πελατών που καταφθάνουν σε ένα ΑΤΜ σε ένα χρόνο είναι μία διακριτή

μεταβλητή που παίρνει τιμές από το σύνολο {0, 1, 2, 3, 4, … . }.

Ο βαθμός ενός φοιτητή στο μάθημα της Στατιστικής είναι διακριτή μεταβλητή που παίρνει τιμές

από το σύνολο {0, 0.5, 1, 1.5, 2, 2.5, … , 9, 9.5, 10}

Συνεχής είναι η ποσοτική μεταβλητή που παίρνει τιμές σε ένα διάστημα πραγματικών αριθμών.

Για παράδειγμα, ο χρόνος σε min που ξοδεύει καθημερινά στο Internet ένας φοιτητής είναι

συνεχής μεταβλητή, που παίρνει τιμές στο διάστημα 15 min – 300 min.

Θα πρέπει εδώ να επισημάνουμε ότι η τιμή που καταγράφουμε όταν μετράμε μία συνεχή

μεταβλητή είναι, τις περισσότερες φορές, μία προσέγγιση της πραγματικής τιμής η οποία

εξαρτάται από την ακρίβεια του οργάνου μέτρησης.

Οι ποιοτικές μεταβλητές παίρνουν σαν τιμές τους λέξεις («χαρακτηρισμούς» ή «ετικέτες») και

διακρίνονται σε ονομαστικές (nominal) και διατακτικές (ordinal).

Page 3: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

Εισαγωγή στη Στατιστική 3

Σημειώσεις Στατιστικής

Μια ποιοτική μεταβλητή είναι ονομαστική όταν μεταξύ των τιμών της δεν υπάρχει σχέση

ιεραρχίας.

Για παράδειγμα, το χρώμα των μαλλιών είναι μία ποιοτική μεταβλητή που παίρνει τιμές από το

σύνολο {𝜉𝛼𝜈𝜃ό, 𝜅𝛼𝜎𝜏𝛼𝜈ό, 𝜇𝛼ύ𝜌𝜊} και είναι ονομαστική, καθώς μεταξύ των χρωμάτων δεν

έχει νόημα να θεωρήσουμε κάποια ιεραρχία.

Ο χαρακτηρισμός που ακολουθεί τον βαθμό του πτυχίου είναι μία ποιοτική μεταβλητή που

παίρνει τιμές από το σύνολο {𝛫𝛼𝜆ώ𝜍, 𝛬ί𝛼𝜈 𝛫𝛼𝜆ώ𝜍, Ά𝜌𝜄𝜎𝜏𝛼} και είναι διατακτική, καθώς

ανάμεσα στις κατηγορίες υπάρχει ιεραρχία.

Δεδομένα (data) είναι το σύνολο των καταγεγραμμένων τιμών μιας μεταβλητής, που

λαμβάνονται από τη δειγματοληψία. Για τις ποσοτικές μεταβλητές, τα δεδομένα είναι

πραγματικοί αριθμοί. Για τις ποιοτικές μεταβλητές τα δεδομένα είναι «ετικέτες». Έτσι μιλάμε

για ποσοτικά ή αριθμητικά δεδομένα και για ονομαστικά ή κατηγορικά δεδομένα.

Πολλές φορές για την αποθήκευση των ονομαστικών δεδομένων χρησιμοποιούμε αριθμούς,

για παράδειγμα {𝛫𝛼𝜆ώ𝜍 = 1, 𝛬ί𝛼𝜈 𝛫𝛼𝜆ώ𝜍 = 2, Ά𝜌𝜄𝜎𝜏𝛼 = 3}, χωρίς αυτό να σημαίνει ότι

είναι δυνατή η εκτέλεση αριθμητικών πράξεων μεταξύ των δεδομένων.

1.3 Παράμετρος – Στατιστικό

Παράμετρος ενός πληθυσμού (parameter) είναι κάθε αριθμός που συνοψίζει κάποιο

χαρακτηριστικό του πληθυσμού. Ο υπολογισμός μιας παραμέτρου μπορεί να γίνει με τη χρήση

του κατάλληλου μαθηματικού τύπου που υποδεικνύει η Στατιστική.

Για παράδειγμα, το μέσο ύψος των εφήβων στην Ελλάδα είναι μία παράμετρος του πληθυσμού

των Ελλήνων εφήβων.

Η τιμή μιας παραμέτρου στον πληθυσμό είναι μοναδική. Και για να υπολογιστεί αυτή η τιμή,

θα πρέπει να γίνει απογραφή ολόκληρου του πληθυσμού. Καθώς αυτό είναι τις περισσότερες

φορές αδύνατο, η τιμή της παραμέτρου στον πληθυσμό παραμένει άγνωστη.

Στατιστικό ή στατιστική ενός δείγματος (statistic) είναι κάθε αριθμός που συνοψίζει κάποιο

χαρακτηριστικό του δείγματος.

Για παράδειγμα, ο αριθμητικός μέσος του ύψους 500 εφήβων που επιλέγονται τυχαία από τον

πληθυσμό των εφήβων στην Ελλάδα, είναι ένα στατιστικό του δείγματος.

Η τιμή ενός στατιστικού υπολογίζεται, όπως και στην περίπτωση της παραμέτρου, από κάποιον

τύπο και χρησιμοποιείται για την εκτίμηση της αντίστοιχης παραμέτρου του πληθυσμού.

Η τιμή ενός στατιστικού μεταβάλλεται από δείγμα σε δείγμα. Δηλαδή, διαφορετικά δείγματα

εφήβων παρμένα τυχαία από τον πληθυσμό θα δώσουν διαφορετικούς αριθμητικούς μέσους.

Ωστόσο, η Στατιστική μας εγγυάται ότι καμία από αυτές τις τιμές δεν θα είναι απομακρυσμένη

από την αντίστοιχη τιμή της παραμέτρου στον πληθυσμό.

Με άλλα λόγια, η τιμή της στατιστικής ενός δείγματος είναι πάντα μια βέλτιστη εκτίμηση της

πραγματικής αλλά άγνωστης τιμής της αντίστοιχης παραμέτρου στον πληθυσμό.

Page 4: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

4 1ο Μάθημα

Μαρίνα Σύρπη

Παράδειγμα 1

Σε μία έρευνα για το είδος εξοχικής κατοικίας των κατοίκων της Θεσσαλονίκης, ο πληθυσμός

μας είναι οι κάτοικοι της Θεσσαλονίκης που κατέχουν εξοχική κατοικία.

Μεταβλητές που μπορούμε να χρησιμοποιήσουμε στην έρευνα είναι οι παρακάτω:

Το μέγεθος της κατοικίας σε m2 , που είναι μία ποσοτική συνεχής μεταβλητή.

Οι ημέρες διαμονής ανά έτος στην εξοχική κατοικία, που είναι μία ποσοτική διακριτή

μεταβλητή.

Το είδος της κατοικίας (συγκρότημα ή μονοκατοικία), που είναι μία ποιοτική ονομαστική

μεταβλητή.

Η ποιότητα διαμονής στην εξοχική κατοικία (Άριστη, Πολύ Καλή, Μέτρια) που είναι μία

ονομαστική διατακτική μεταβλητή.

Κατονομάστε και χαρακτηρίστε και άλλες μεταβλητές που θα σας ενδιέφεραν σε μια τέτοια

έρευνα. Αναφέρετε τους λόγους για τις οποίους τις επιλέξατε.

Παράδειγμα 2

Το τμήμα Λογιστικής διεξάγει έρευνα για την επαγγελματική αποκατάσταση των πτυχιούχων

του, κατά την τελευταία πενταετία.

Ο πληθυσμός είναι το σύνολο των φοιτητών που αποφοίτησαν από το τμήμα τα τελευταία

πέντε χρόνια.

Μεταβλητές που μπορούμε να χρησιμοποιήσουμε στην έρευνα είναι οι παρακάτω:

Εργασία (Ναι ή Όχι) που είναι μία ποιοτική ονομαστική μεταβλητή.

Φύλο (Άνδρας – Γυναίκα) που είναι μια ποιοτική ονομαστική μεταβλητή.

Εισόδημα από την εργασία, που είναι μία ποσοτική συνεχής μεταβλητή.

Συνθήκες εργασίας (Άριστες, Καλές, Μέτριες, Κακές), που είναι μία ποσοτική διατακτική

μεταβλητή.

Κατονομάστε και χαρακτηρίστε και άλλες μεταβλητές που θα σας ενδιέφεραν σε μια τέτοια

έρευνα. Αναφέρετε τους λόγους για τις οποίους τις επιλέξατε.

Page 5: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

Εισαγωγή στη Στατιστική 5

Σημειώσεις Στατιστικής

Β΄ΜΕΡΟΣ

ΟΡΓΑΝΩΣΗ ΚΑΙ ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΔΕΔΟΜΕΩΝ – Η ΧΡΗΣΗ ΤΩΝ ΙΣΤΟΓΡΑΜΜΑΤΩΝ

Για την οργάνωση των δεδομένων χρησιμοποιούμε κυρίως τους πίνακες, τόσο για τα ποιοτικά

όσο και για τα ποσοτικά δεδομένα. Η παρουσίαση των αποτελεσμάτων που προκύπτουν από

τους υπολογισμούς γίνεται με τη χρήση διαφόρων διαγραμμάτων, δημοφιλέστερα εκ των

οποίων εξακολουθούν να είναι τα ραβδογράμματα (bar charts) και τα κυκλικά διαγράμματα

(pie charts) για τα ποιοτικά δεδομένα, τα ιστογράμματα (histograms) για τα ποσοτικά και

γραμμικά διαγράμματα (line charts) για αριθμητικά δεδομένα που συλλέγονται στο χρόνο.

1.4 Οργάνωση και Παρουσίαση Ποιοτικών Δεδομένων

Στην περίπτωση των ποιοτικών δεδομένων έχουμε κατηγορίες. Η μόνη αριθμητική πράξη που

μπορούμε να εκτελέσουμε είναι ο υπολογισμός της συχνότητας κάθε κατηγορίας.

Συχνότητα μιας κατηγορίας είναι το πλήθος των παρατηρήσεων του δείγματος που ανήκουν

στην κατηγορία αυτή. Ο υπολογισμός της συχνότητας γίνεται από τη διαλογή του δείγματος.

Παράδειγμα

Ρωτήσαμε 50 φοιτητές που δεν μένουν με τις οικογένειές τους στη Θεσσαλονίκη, για τον τρόπο

που επιλέγουν το καθημερινό τους γεύμα, με τις απαντήσεις να έχουν κωδικοποιηθεί ως εξής:

Δωρεάν από το ΤΕΙ (1), Fast Food (2), Μαγειρεύω στο σπίτι (3).

Οι απαντήσεις που πήραμε εμφανίζονται στον παρακάτω πίνακα

Επιλογή Καθημερινού Γεύματος

1 1 2 3 2 1 1 2 1 2

3 1 1 1 2 2 3 1 1 1

1 1 2 1 3 2 2 1 3 1

1 2 1 1 1 1 2 2 2 2

1 3 2 1 2 1 2 2 1 1

Η κατανομή των συχνοτήτων δίνεται στον παρακάτω πίνακα

α/α Γεύμα Συχνότητα

1 Δωρεάν Σίτιση 26

2 Fast Food 18

3 Στο σπίτι 6

ΣΥΝΟΛΟ 50

Τις περισσότερες φορές ο παραπάνω πίνακας συμπληρώνεται από τον υπολογισμό των

σχετικών συχνοτήτων των κατηγοριών.

𝛴𝜒𝜀𝜏𝜄𝜅ή 𝛴𝜐𝜒𝜈ό𝜏𝜂𝜏𝛼 = 𝛴𝜐𝜒𝜈ό𝜏𝜂𝜏𝛼

𝛴ύ𝜈𝜊𝜆𝜊

Page 6: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

6 1ο Μάθημα

Μαρίνα Σύρπη

Έτσι παίρνουμε το παρακάτω πίνακα της κατανομής των συχνοτήτων και σχετικών

συχνοτήτων:

α/α Γεύμα Συχνότητα Σχετική Συχνότητα Ποσοστό

1 Δωρεάν Σίτιση 26 26

50= 0.52 52 %

2 Fast Food 18 18

50= 𝟎. 𝟑𝟔 36 %

3 Στο σπίτι 6 6

50= 𝟎. 𝟏𝟐 12 %

ΣΥΝΟΛΟ 50 1 100 %

Από τον παραπάνω πίνακα βλέπουμε ότι το 52 % των φοιτητών επιλέγουν την Δωρεάν σίτιση,

36% Fast Food και μόλις 12% μαγειρεύουν στο σπίτι τους.

Για την οπτική παρουσίαση των συχνοτήτων στην περίπτωση ποιοτικών δεδομένων

χρησιμοποιούμε κυρίως τα ραβδογράμματα (bar charts) και τα κυκλικά διαγράμματα (pie

charts)

Ραβδόγραμμα Συχνοτήτων Ραβδόγραμμα Σχετικών Συχνοτήτων

Κυκλικό Διάγραμμα Σχετικών Συχνοτήτων

26

18

6

0

5

10

15

20

25

30

Δωρεάν Σίτιση Fast Food Σπίτι

52%

36%

12%

0%

10%

20%

30%

40%

50%

60%

Δωρεάν Σίτιση Fast Food Σπίτι

Δωρεάν Σίτιση 52% Fast Food

36%

Σπίτι 12%

Page 7: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

Εισαγωγή στη Στατιστική 7

Σημειώσεις Στατιστικής

1.5 Οργάνωση και Παρουσίαση Ποσοτικών Δεδομένων - Ομαδοποίηση

Όταν τα αριθμητικά δεδομένα που συλλέγουμε είναι συνεχή ή όταν είναι πολλά τότε

καταφεύγουμε σε ομαδοποίηση, χωρίζοντας το εύρος των τιμών σε μια σειρά ξεχωριστών μή

επικαλυπτόμενων διαστημάτων. Τα διαστήματα αυτά ονομάζονται συνήθως κλάσεις ή

διαστήματα κλάσεων.

Το πλήθος των κλάσεων

Το πλήθος των κλάσεων καθορίζεται από εμπειρικούς τύπους, πίνακες ή προϋπάρχουσα

βιβλιογραφική αναφορά. Πολλές φορές χρησιμοποιούμε τον τύπο του Sturges, σύμφωνα με τον

οποίο

. logA n 1 3 3

όπου,

A είναι ο αριθμός των διαστημάτων και n το πλήθος των παρατηρήσεων.

Το πλάτος ή εύρος των κλάσεων υπολογίζεται από τη σχέση

max minr

A A

Εύρος δείγματος

Πλήθος κλάσεων

Στο παραπάνω αποτέλεσμα γίνεται πάντοτε στρογγυλοποίηση στον μεγαλύτερο ακέραιο

Τα κέντρα των κλάσεων im δίνονται από τον τύπο

2

Άνω άκρο Κάτω άκροix

Συχνότητες

Ονομάζουμε συχνότητα (ή απόλυτη συχνότητα) κλάσης, το πλήθος των παρατηρήσεων του

δείγματος που ανήκουν στην κλάση αυτή . Η συχνότητα βρίσκεται με τη διαλογή του δείγματος

και θα τη συμβολίζουμε με if

Ονομάζουμε σχετική συχνότητα κλάσης την αναλογία (πηλίκο) που προκύπτει αν διαιρέσουμε

τη συχνότητα της κλάσης με το πλήθος των παρατηρήσεων (μέγεθος του δείγματος). Θα

συμβολίζουμε την σχετική συχνότητα με ip .

Σχετική Συχνότητα Συχνότητα

Πλήθος Παρατηρήσεων

ή

ii

fp

n

όπου, if η συχνότητα της κλάσης, και n το μέγεθος του δείγματος.

Page 8: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

8 1ο Μάθημα

Μαρίνα Σύρπη

Η Αθροιστική Συχνότητα μιας κλάσης είναι το άθροισμα των συχνοτήτων της κλάσης αυτής και

όλων των προηγούμενών της κλάσεων.

Η Σχετική Αθροιστική Συχνότητα μιας κλάσης είναι το άθροισμα των σχετικών συχνοτήτων της

κλάσης αυτής και όλων των προηγούμενών της κλάσεων. Θα συμβολίζουμε την Σχετική

Αθροιστική Συχνότητα μιας κλάσης με iF .

Συχνά, τόσο η σχετική όσο και η σχετική αθροιστική συχνότητα πολλαπλασιάζονται με το 100,

ώστε να παίρνουμε τα ποσοστιαία αποτελέσματα.

Παράδειγμα – Ομαδοποίηση Δεδομένων

Ύψος ατομικής δαπάνης (έξοδα μετακίνησης, καφέδες, τσιγάρα, κ.λπ.) των εργαζομένων :

3,7 6,7 4,4 6,2 4,1 6,0 5,1 5,3 2,8

5,3 5,3 1,4 5,4 7,5 3,0 6,6 1,1 4,7

1,6 1,7 4,4 5,5 3,0 9,4 6,5 1,4 5,5

5,4 5,8 6,8 4,2 6,0 2,4 6,1 5,6 6,8

5,6 5,8 6,0 7,4 2,5 6,2 3,9 4,7 3,1

1 3.3 log 1 3.33 log50 6.6 7A n

Το εύρος του δείγματος είναι: max – min = 9.4 – 1.1 = 8.3.

Συνεπώς, το πλάτος των κλάσεων θα είναι .

. . 8 3

1 186 1 27

Εύρος δείγματος

Πλήθος κλάσεων

Έτσι παίρνουμε το παρακάτω πίνακα της κατανομής των συχνοτήτων και σχετικών

συχνοτήτων:

Ατομική Δαπάνη

€ / ημέρα

Κέντρο

ix

Συχνότητα

if

Αθροιστική

Συχνότητα

Σχετική

Συχνότητα

pi

Σχετική

Αθροιστική

Συχνότητα Fi

Σχετική

Συχνότητα

%

Σχετική Αθροιστική

Συχνότητα

%

1.1 – 2.3 1.7 5 5 0.11 0.11 11 11

2.3 – 3.5 2.9 6 11 0.13 0.24 13 24

3.5 – 4.7 4.1 6 17 0.13 0.37 13 37

4.7 – 5.9 5.3 14 31 0.31 0.68 31 68

5.9 – 7.1 6.5 11 42 0.25 0.93 25 93

7.1 – 8.3 7.7 2 44 0.05 0.98 5 98

8.3 – 9.5 8.9 1 45 0.02 1 2 100

ΣΥΝΟΛΑ 45 1 100

Page 9: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

Εισαγωγή στη Στατιστική 9

Σημειώσεις Στατιστικής

Η διαδικασία που περιγράφηκε παραπάνω για την ομαδοποίηση των δεδομένων δεν είναι

απόλυτη, με την έννοια ότι απλώς μας δίνει τις κατευθυντήριες γραμμές για την ομαδοποίηση

των δεδομένων, επιτρέποντάς μας στη συνέχεια να κάνουμε μικρές διορθωτικές παρεμβάσεις

ώστε να είναι η παρουσίαση των δεδομένων περισσότερο «ευανάγνωστη».

Έτσι, στο παραπάνω παράδειγμα μπορούμε αντί για 1.2 να επιλέξουμε ως πλάτος των κλάσεων

1.5 και να ορίσουμε ως πρώτη κλάση την [ 1, 2.5 ) αντί της [ 1.2, 2.3 ). Αυτή η επιλογή μας

οδηγεί τελικά σε μια ομαδοποίηση με 6 κλάσεις αντί των 7 που πρόκυψε από τον τύπο του

Sturges. Ο πίνακας κατανομής συχνοτήτων και σχετικών συχνοτήτων θα είναι ο παρακάτω:

Ατομική Δαπάνη

€ / ημέρα

Κέντρο

ix

Συχνότητα

if Αθροιστική Συχνότητα

% Σχετική

Συχνότητα

% Σχετική Αθροιστική

Συχνότητα Fi

1.0 – 2.5 1.75 6 6 13,33 13,33

2.5 – 4.0 3.25 7 13 15,56 28,89

4.0 – 5.5 4.75 12 25 26,67 55,56

5.5 – 7.0 6.25 17 42 37,78 93,33

7.0 – 8.5 7.75 2 44 4,44 97,78

8.5 – 10 9.25 1 45 2,22 100,00

ΣΥΝΟΛΑ 45 100,00

Τα γραφήματα που χρησιμοποιούμε κυρίως για την παρουσίαση των ομαδοποιημένων

δεδομένων είναι τα ιστογράμματα. Ενώνοντας τα κέντρα των κλάσεων στα ιστογράμματα των

σχετικών συχνοτήτων σχηματίζουμε μια πολυγωνική γραμμή που ονομάζεται πολύγωνο

σχετικών συχνοτήτων. Αντίστοιχα, ενώνοντας τα άκρα των κλάσεων σε ένα ιστόγραμμα

σχετικών αθροιστικών συχνοτήτων σχηματίζουμε το πολύγωνο των σχετικών αθροιστικών

συχνοτήτων.

Ιστόγραμμα και Πολύγωνο Σχετικών Συχνοτήτων ( % ) Ιστόγραμμα και Πολύγωνο Σχετικών Αθροιστικών

Συχνοτήτων ( % )

13,33 15,56

26,67

37,78

4,44 2,22

0,00

5,00

10,00

15,00

20,00

25,00

30,00

35,00

40,00

1.0 – 2.5 2.5 – 4.0 4.0 – 5.5 5.5 – 7.0 7.0 – 8.5 8.5 – 10

13,33

28,89

55,56

93,33 97,78 100,00

0,00

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

90,00

100,00

1.0 – 2.5 2.5 – 4.0 4.0 – 5.5 5.5 – 7.0 7.0 – 8.5 8.5 – 10

Page 10: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

10 1ο Μάθημα

Μαρίνα Σύρπη

1.6 Παρουσίαση Χρονολογικών Σειρών

Δεδομένα που καταγράφονται σε μια ακολουθία σημείων στο χρόνο, ονομάζονται

χρονολογικές σειρές (time series). Για παράδειγμα το ετήσιο Α.Ε.Π. μιας χώρας, από το 2000

έως το 2011, οι μηνιαίες πωλήσεις μιας επιχείρησης από το 1990 έως το 2010, κ.λπ.

Τα δεδομένα που δεν συλλέγονται με τον παραπάνω τρόπο, αλλά παίρνονται με μετρήσεις που

γίνονται στην ίδια χρονική περίοδο, ονομάζονται διαστρωματικά (cross – sectional data). Για

παράδειγμα το Α.Ε.Π. των χωρών της Ευρωπαϊκής Ένωσης το έτος 2011.

Για τη γραφική παράσταση των χρονολογικών τιμών χρησιμοποιούμε κυρίως τα γραμμικά

διαγράμματα, που είναι σημεία (οι μετρήσεις στον κατακόρυφο άξονα ) και ενώνονται με

ευθύγραμμα τμήματα δημιουργώντας μία τεθλασμένη γραμμή που παρουσιάζει την πορεία της

μεταβλητής στο χρόνο (οριζόντιος άξονας).

Παρακάτω εμφανίζονται τρεις χρονολογικές σειρές

log NNIy , όπου NNI το Καθαρό Εθνικό Εισόδημα σε σταθερές (1970) τιμές αγοράς.

log PCcp , όπου PC η Ιδιωτική Κατανάλωση σε σταθερές (1970) τιμές αγοράς .

log GIi ,όπου GI οι Ακαθάριστες Επενδύσεις σε σταθερές (1970) τιμές αγοράς .

ΠΗΓΗ: ΕΣΥΕ, Εθνικοί Λογαριασμοί, 1961-1991.

y

cp

i

10

11

12

13

14

1961 1966 1971 1976 1981 1986 19911991

Παραδείγματα

1. Παράδειγμα 2.2, στη σελίδα 50 του βιβλίου.

2. Παράδειγμα 2.3, στη σελίδα 52 του βιβλίου.

3. Παράδειγμα 2.5, στη σελίδα 56 του βιβλίου.

Page 11: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

Εισαγωγή στη Στατιστική 11

Σημειώσεις Στατιστικής

1.7 Η Χρήση των Ιστογραμμάτων στη Στατιστική

1.7.1 Χαρακτηριστικά των Ιστογραμμάτων Σχετικών Συχνοτήτων

Τα ιστογράμματα των σχετικών συχνοτήτων συνθέτουν την πρώτη εικόνα για την κατανομή των

τιμών μιας μεταβλητής στον πληθυσμό. Δεν μπορούμε, βέβαια, να τα χρησιμοποιήσουμε για

την εξαγωγή συμπερασμάτων, μπορούμε όμως να αποσπάσουμε χρήσιμες πληροφορίες, να

«προσανατολιστούμε» κατά κάποιον τρόπο μέσα στον όγκο των δεδομένων. Μας παρέχουν

ισχυρές ενδείξεις και δίνουν ένα πρώτο περίγραμμα του φαινομένου που πρόκειται να

ερευνήσουμε. Η εικόνα αυτή θα συμπληρωθεί αργότερα από τον υπολογισμό των

ονομαζόμενων αριθμητικών μέτρων, προτού περάσουμε στο τελικό στάδιο που είναι ο έλεγχος

υποθέσεων και η εξαγωγή συμπερασμάτων.

Συμμετρία

Ένα ιστόγραμμα που εμφανίζει συμμετρία ως προς έναν κατακόρυφο άξονα ονομάζεται

συμμετρικό ιστόγραμμα.

Συμμετρικά Ιστογράμματα

Θετική Ασυμμετρία

Λέμε ότι μια κατανομή τιμών παρουσιάζει θετική ασυμμετρία όταν το ιστόγραμμα των

σχετικών συχνοτήτων εμφανίζεται εκτεταμένο στο δεξιό του σκέλος.

Ο λόγος που εμφανίζεται θετική

ασυμμετρία σε μία κατανομή, είναι

ότι υπάρχουν κάποιες πολύ

μεγάλες τιμές της μεταβλητής.

Θετική Ασυμμετρία

Page 12: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

12 1ο Μάθημα

Μαρίνα Σύρπη

Αρνητική Ασυμμετρία

Λέμε ότι μια κατανομή τιμών παρουσιάζει αρνητική ασυμμετρία όταν το ιστόγραμμα των

σχετικών συχνοτήτων εμφανίζεται εκτεταμένο στο αριστερό του σκέλος.

Ο λόγος που εμφανίζεται αρνητική

ασυμμετρία σε μία κατανομή,

είναι ότι υπάρχουν κάποιες πολύ

μικρές τιμές της μεταβλητής.

Αρνητική Ασυμμετρία

Κορυφές

Όταν στο ιστόγραμμα συχνοτήτων εμφανίζεται μία επικρατούσα, όπως ονομάζεται κλάση,

δηλαδή μια κλάση με μεγαλύτερη από όλες τις άλλες κλάσεις συχνότητα, τότε λέμε ότι έχουμε

μία μονοκόρυφη (unimodal) κατανομή.

Μονοκόρυφη Κατανομή

Σε κάποιες περιπτώσεις εμφανίζονται δύο κυρίαρχες κλάσεις, με την έννοια ότι και η δεύτερη

κλάση ξεχωρίζει από τις γειτονικές της, δίνοντας την εικόνα του σχηματισμού δύο ομάδων στο

ιστόγραμμα των συχνοτήτων. Μια τέτοια κατανομή ονομάζεται δικόρυφη (bimodal).

Δικόρυφη Κατανομή

Page 13: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

Εισαγωγή στη Στατιστική 13

Σημειώσεις Στατιστικής

1.7.2 Τί παρατηρούμε όταν κοιτάζουμε ένα ιστόγραμμα σχετικών συχνοτήτων;

Σε μία έρευνα, ρωτήσαμε 1214 εργαζόμενους «πόσες ώρες κοιμηθήκατε χθες το βράδυ;». Τα

δεδομένα ομαδοποιήθηκαν σε οκτώ κλάσεις και παρακάτω παρουσιάζεται το ιστόγραμμα των

σχετικών συχνοτήτων.

Κατανομή ωρών ύπνου των εργαζομένων

Το ιστόγραμμα μας δίνει την εικόνα της κατανομής των ωρών ύπνου για τους εργαζόμενους.

Είναι σχεδόν συμμετρικό και μονοκόρυφο ιστόγραμμα, φαίνεται να έχουμε μια «κανονικότητα»

στην κατανομή των τιμών γύρω από την κυρίαρχη κλάση (7.0, 7.5) και δεν υπάρχει

σχηματισμός ομάδων μέσα στον πληθυσμό. Στην κλάση αυτή και γύρω από αυτήν

παρατηρούμε να συγκεντρώνεται το μεγαλύτερο ποσοστό των τιμών (18.95 + 29.08 +21.17 =

69.19). Δηλαδή το 69.19% των εργαζομένων φαίνεται ότι κοιμούνται από 6.5 έως 8.00 ώρες.

Η ίδια ερώτηση έγινε και σε 1234 φοιτητές, και η ομαδοποίηση των δεδομένων μας έδωσε το

παρακάτω ιστόγραμμα.

Κατανομή ωρών ύπνου των φοιτητών

0,41

4,37

10,30

18,95

29,08

21,17

11,29

4,45

0,00

5,00

10,00

15,00

20,00

25,00

30,00

35,00

5.0 - 5.5 5.5 - 6.0 6.0 - 6.5 6.5 - 7.0 7.0 - 7.5 7.5 - 8.0 8.5 - 9.0 9.0 - 9.5

7,54

14,42

19,45

25,93

15,64

8,91

5,27

2,84

0,00

5,00

10,00

15,00

20,00

25,00

30,00

5.0 - 5.5 5.5 - 6.0 6.0 - 6.5 6.5 - 7.0 7.0 - 7.5 7.5 - 8.0 8.5 - 9.0 9.0 - 9.5

Ώρες ύπνου

Σχετ

ική

Συ

χνό

τητα

%

Ώρες ύπνου

Σχετ

ική

Συ

χνό

τητα

%

Page 14: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

14 1ο Μάθημα

Μαρίνα Σύρπη

Το ιστόγραμμα είναι και πάλι μονοκόρυφο, δεν είναι όμως συμμετρικό και εμφανίζει μια θετική

ασυμμετρία. Η επικρατούσα κλάση εδώ είναι η (6.5 , 7.0). Στην κλάση αυτή και γύρω από αυτήν

παρατηρούμε να συγκεντρώνεται το μεγαλύτερο ποσοστό των τιμών (1.45 + 25.93 +15.64 =

61.02). Δηλαδή το 61.02 % των φοιτητών φαίνεται ότι κοιμούνται από 6.00 έως 7 ώρες. Η

παρουσία ασυμμετρίας υποδεικνύει ότι οι ώρες που κοιμούνται οι φοιτητές δεν κατανέμονται

κανονικά γύρω από την επικρατούσα κλάση. Για την ακρίβεια, εξαιτίας της θετικής

ασυμμετρίας μπορούμε να πούμε ότι ένα μικρό μόνον ποσοστό των φοιτητών φαίνεται να

κοιμάται αρκετές ώρες.

1.7.3 Σύγκριση δύο Ιστογραμμάτων Σχετικών Συχνοτήτων

Η διαφορετική μορφή των δύο ιστογραμμάτων μας φανερώνει, κατ’ αρχήν, ότι οι δύο

πληθυσμοί (εργαζόμενοι και φοιτητές) διαφέρουν ως προς τον τρόπο που κοιμούνται, με τους

φοιτητές να είναι κάπως περισσότερο «ακατάστατοι» στο θέμα του ύπνου.

Παρατηρούμε επίσης ότι οι κορυφές των δύο ιστογραμμάτων δεν βρίσκονται στην ίδια κλάση.

Για τους εργαζόμενους η κορυφή είναι στην κλάση (7.0 – 7.5) ενώ για τους φοιτητές είναι στην

κλάση (6.5, 7.0). Αυτό είναι μία ένδειξη ότι οι φοιτητές κοιμούνται λιγότερο από τους

εργαζόμενους.

Εργαζόμενοι – Ιστόγραμμα Σχετικών Συχνοτήτων ( % ) Φοιτητές – Ιστόγραμμα Σχετικών Συχνοτήτων ( % )

Τα ιστογράμματα των σχετικών συχνοτήτων μας δείχνουν πώς κατανέμονται οι τιμές της

μεταβλητής μέσα σε έναν πληθυσμό. Η εικόνα αυτή ολοκληρώνεται αργότερα με των

υπολογισμό κάποιων αριθμητικών μέτρων.

Όπως είδαμε, από τη σύγκριση δύο ιστογραμμάτων σχετικών συχνοτήτων φαίνεται οι φοιτητές

να κοιμούνται λιγότερο από τους εργαζόμενους. Τα ιστογράμματα των σχετικών αθροιστικών

συχνοτήτων θα μας φανερώσουν περισσότερα πράγματα σε σχέση με το ερώτημα αυτό.

0,41

4,37

10,30

18,95

29,08

21,17

11,29

4,45

0,00

5,00

10,00

15,00

20,00

25,00

30,00

35,00

5.0 - 5.5 5.5 - 6.0 6.0 - 6.5 6.5 - 7.0 7.0 - 7.5 7.5 - 8.0 8.5 - 9.0 9.0 - 9.5

7,54

14,42

19,45

25,93

15,64

8,91

5,27 2,84

0,00

5,00

10,00

15,00

20,00

25,00

30,00

5.0 - 5.5 5.5 - 6.0 6.0 - 6.5 6.5 - 7.0 7.0 - 7.5 7.5 - 8.0 8.5 - 9.0 9.0 - 9.5

Page 15: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

Εισαγωγή στη Στατιστική 15

Σημειώσεις Στατιστικής

1.8 Ιστογράμματα σχετικών αθροιστικών συχνοτήτων

1.8.1 Τί παρατηρούμε όταν κοιτάζουμε ένα ιστόγραμμα σχετικών αθροιστικών

συχνοτήτων;

Τα ιστογράμματα των σχετικών αθροιστικών συχνοτήτων μας δείχνουν την «ταχύτητα» με την

οποία συγκεντρώνονται στις κλάσεις οι τιμές μίας μεταβλητής.

Έτσι, στο παρακάτω ιστόγραμμα σχετικών αθροιστικών συχνοτήτων, βλέπουμε ότι το 52.5% των

μετρήσεων της μεταβλητής συγκεντρώνεται μέχρι τη δεύτερη κλάση, και το 80.9% μέχρι και

την τέταρτη κλάση. Παρατηρούμε επομένως μια «ταχεία» συγκέντρωση των τιμών της

μεταβλητής ή, διαφορετικά, μια μεγάλη συσσώρευση των τιμών της στις χαμηλές κλάσεις.

Αντίθετα, στο παρακάτω διάγραμμα βλέπουμε ότι μόλις 23,6% των τιμών της μεταβλητής

συγκεντρώνονται μέχρι και τη δεύτερη κλάση, και το 52,9% μέχρι και την τέταρτη. Θα

μπορούσαμε ακόμα να πούμε ότι οι τιμές κατανέμονται ομαλά στις κλάσεις, καθώς δεν

υπάρχουν απότομες μεταβολές στα ύψη των κλάσεων.

Συγκρίνοντας τα δύο ιστογράμματα, μπορούμε να πούμε ότι η μεταβλητή που παρουσιάζεται

από το πρώτο διάγραμμα (επάνω) τείνει να έχει χαμηλότερες τιμές.

37,8

52,5

65,6

80,9

91,4 98,2 99,6 100

0

10

20

30

40

50

60

70

80

90

100

11,5

23,6

37,5

52,9

69,4

82,2

90,6

100

0

10

20

30

40

50

60

70

80

90

100

Page 16: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

16 1ο Μάθημα

Μαρίνα Σύρπη

1.8.2 Σύγκριση δύο Ιστογραμμάτων Σχετικών Συχνοτήτων

Ας συγκρίνουμε τώρα τα ιστογράμματα των σχετικών αθροιστικών συχνοτήτων, για τις ώρες

που κοιμούνται οι εργαζόμενοι και οι φοιτητές.

Ιστόγραμμα Σχετικών Αθροιστικών Συχνοτήτων - Εργαζόμενοι

Ιστόγραμμα Σχετικών Αθροιστικών Συχνοτήτων - Φοιτητές

Από τα ιστογράμματα των σχετικών αθροιστικών συχνοτήτων παρατηρούμε ότι:

34,02 % των εργαζομένων δήλωσαν ότι το προηγούμενο βράδυ κοιμήθηκαν λιγότερο από 7

ώρες, ενώ για τους φοιτητές το ποσοστό φτάνει στο 67,34 %, σχεδόν διπλάσιο από αυτό των

εργαζομένων. Η σύγκριση των ιστογραμμάτων μας δείχνει ότι οι φοιτητές φαίνεται να

κοιμούνται λιγότερο από τους εργαζόμενους.

0,41 4,78

15,07

34,02

63,10

84,27

95,55 100,00

0,00

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

90,00

100,00

5.0 - 5.5 5.5 - 6.0 6.0 - 6.5 6.5 - 7.0 7.0 - 7.5 7.5 - 8.0 8.5 - 9.0 9.0 - 9.5

7,54

21,96

41,41

67,34

82,98

91,90 97,16 100,00

0,00

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

90,00

100,00

5.0 - 5.5 5.5 - 6.0 6.0 - 6.5 6.5 - 7.0 7.0 - 7.5 7.5 - 8.0 8.5 - 9.0 9.0 - 9.5

Ώρες ύπνου

Σχετ

ική

Αθ

ρο

ιστι

κή Σ

υχν

ότη

τα %

Ώρες ύπνου

Σχετ

ική

Αθ

ρο

ιστι

κή Σ

υχν

ότη

τα %

Page 17: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

Εισαγωγή στη Στατιστική 17

Σημειώσεις Στατιστικής

Ασκήσεις

1. Από τα δεδομένα μιας σωματομετρικής και ιατρικής έρευνας σε κορίτσια ηλικίας 7 χρόνων

της Ελληνικής υπαίθρου, προέκυψαν ο παρακάτω πίνακας συχνοτήτων και τα αντίστοιχα

διαγράμματα.

Πεδινά χωριά Ορεινά χωριά

Βάρος

(Kgr)

Συχνότητα

if

Αθροιστική

Συχνότητα

Σχετική

Συχνότητα

%

Σχετική

Αθροιστική

%

Συχνότητα

if

Αθροιστική

Συχνότητα

Σχετική

Συχνότητα

%

Σχετική

Αθροιστική

%

16 - 18 4 4 13,33 13,33 4 20 20

18 - 20 8 12 26,67 40,00 9 13 45 65

20 - 22 7 23,33 63,33 4 17 20 85

22 - 24 4 23 13,33 76,67 2 19 10 95

24 - 26 4 27 13,33 0

26 - 28 2 29 6,67 96,67 1 20 5 100

28 - 30 1 30 3,33 100,00 0

ΣΥΝΟΛΑ 100 20 100

Πεδινά Χωριά – Ιστόγραμμα Σχετικών Συχνοτήτων ( % ) Ορεινά Χωριά – Ιστόγραμμα Σχετικών Συχνοτήτων ( % )

Πεδινά Χωριά – Ιστόγραμμα Σχετικών Αθροιστικών Συχνοτήτων ( % )

Ορεινά Χωριά – Ιστόγραμμα Σχετικών Αθροιστικών Συχνοτήτων ( % )

( α ) Να συμπληρώσετε τον πίνακα των συχνοτήτων εκτελώντας τις κατάλληλες πράξεις.

( β ) Περιγράψτε τα ιστογράμματα των σχετικών συχνοτήτων για τις δύο ομάδες και εντοπίστε

ομοιότητες και διαφορές.

( γ ) Σε ποιά από τις δύο ομάδες τείνει το βάρος των παιδιών να είναι μικρότερο;

13,33

26,67

23,33

13,33 13,33

6,67

3,33

0

5

10

15

20

25

30

16 - 18 18 - 20 20 - 22 22 - 24 24 - 26 26 - 28 28 - 30

20

45

20

10

0

5

0 0

5

10

15

20

25

30

35

40

45

50

16 - 18 18 - 20 20 - 22 22 - 24 24 - 26 26 - 28 28 - 30

13,33

40,00

63,33

76,67

90,00 96,67 100,00

0

10

20

30

40

50

60

70

80

90

100

16 - 18 18 - 20 20 - 22 22 - 24 24 - 26 26 - 28 28 - 30

20

65

85

95 95 100 100

0

10

20

30

40

50

60

70

80

90

100

16 - 18 18 - 20 20 - 22 22 - 24 24 - 26 26 - 28 28 - 30

Page 18: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

18 1ο Μάθημα

Μαρίνα Σύρπη

2. Στον παρακάτω πίνακα δίνονται οι κατανομές των συγκεντρώσεων μολύβδου στο αίμα για

δύο ομάδες εργαζομένων στον Καναδά, από τις οποίες η μία εξετάστηκε το 1979 και η

άλλη το 1987 και τα αντίστοιχα διαγράμματα.

1979 1987

Μόλυβδος στο

αίμα

(mg/dl)

Σχετική

Συχνότητα

(%)

Σχετική

Αθροιστική

(%)

Σχετική

Συχνότητα

( % )

Σχετική

Αθροιστική

(%)

<20 11.5 37.8 37.8

20 – 30 12.1 23.6 14.7 52.5

30 – 40 13.9 37.5 13.1

40 – 50 15.4 15.3

50 – 60 16.5 69.4 10.5 91.4

60 – 70 12.8 82.2 6.8

70 – 80 8.4 90.6 1.4 99.6

>= 80 9.4 0.4 100

ΣΥΝΟΛΑ 100 100

1979 – Ιστόγραμμα Σχετικών Συχνοτήτων ( % ) 1987 – Ιστόγραμμα Σχετικών Συχνοτήτων ( % )

1979 – Ιστόγραμμα Σχετικών Αθροιστικών Συχνοτήτων ( % ) 1987 – Ιστόγραμμα Σχετικών Αθροιστικών Συχνοτήτων

( α ) Να συμπληρώσετε τον πίνακα των συχνοτήτων εκτελώντας τις κατάλληλες πράξεις.

( β ) Περιγράψτε τα ιστογράμματα των σχετικών συχνοτήτων για τις δύο χρονιές και εντοπίστε

ομοιότητες και διαφορές.

( γ ) Σε ποιά από τις δύο χρονιές η συγκέντρωση μολύβδου τείνει να είναι μεγαλύτερη;

11,5 12,1

13,9 15,4

16,5

12,8

8,4 9,4

0

2

4

6

8

10

12

14

16

18

<20 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70 70 – 80 >= 80

37,8

14,7 13,1

15,3

10,5

6,8

1,4 0,4

0

5

10

15

20

25

30

35

40

<20 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70 70 – 80 >= 80

11,5

23,6

37,5

52,9

69,4

82,2

90,6 100

0

10

20

30

40

50

60

70

80

90

100

<20 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70 70 – 80 >= 80

37,8

52,5

65,6

80,9

91,4 98,2 99,6 100

0

10

20

30

40

50

60

70

80

90

100

<20 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70 70 – 80 >= 80

Page 19: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

Εισαγωγή στη Στατιστική 19

Σημειώσεις Στατιστικής

3. Παρακάτω βλέπετε τους πίνακες συχνοτήτων, και τα αντίστοιχα διαγράμματα για τις

αμοιβές των εργαζομένων σε δύο επιχειρήσεις Α και Β.

ΕΠΙΧΕΙΡΗΣΗ Α ΕΠΙΧΕΙΡΗΣΗ Β

Αμοιβές σε € Συχνότητα

𝒇𝒊

Σχετική

Συχνότητα

Σχετική

Αθροιστική

Συχνότητα

Συχνότητα

𝒇𝒊

Σχετική

Συχνότητα

Σχετική

Αθροιστική

Συχνότητα

600 - 700 7 23,33 23,33

5 16,67 16,67

700 - 800 14 46,67 70,00

7 23,33 40,00

800 - 900 5 16,67 86,67

11 36,67 76,67

900 - 1000 3 10,00 96,67

4 13,33 90,00

1000 - 1100 1 3,33 100,00

3 10 100,00

30 100

30 100

Επιχείρηση Β – Ιστόγραμμα Σχετικών Συχνοτήτων Επιχείρηση Β – Ιστόγραμμα Σχετικών Αθροιστικών

Συχνοτήτων

( α ) Να συμπληρώσετε τον πίνακα των συχνοτήτων εκτελώντας τις κατάλληλες πράξεις.

( β ) Περιγράψτε τα ιστογράμματα των σχετικών συχνοτήτων για τις δύο επιχειρήσεις και

εντοπίστε ομοιότητες και διαφορές.

( γ ) Σε ποιά από τις δύο επιχειρήσεις οι μισθοί τείνουν να είναι μικρότεροι;

16,67

23,33

36,67

13,33

10,00

0,00

5,00

10,00

15,00

20,00

25,00

30,00

35,00

40,00

600 - 700 700 - 800 800 - 900 900 - 1000 1000 - 1100

16,67

40,00

76,67

90,00 100,00

0,00

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

90,00

100,00

600 - 700 700 - 800 800 - 900 900 - 1000 1000 - 1100

Επιχείρηση Α – Ιστόγραμμα Σχετικών Συχνοτήτων Επιχείρηση Α – Ιστόγραμμα Σχετικών Αθροιστικών

Συχνοτήτων

23,33

46,67

16,67

10,00

3,33

0,00

5,00

10,00

15,00

20,00

25,00

30,00

35,00

40,00

45,00

50,00

600 - 700 700 - 800 800 - 900 900 - 1000 1000 - 1100

23,33

70,00

86,67

96,67 100,00

0,00

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

90,00

100,00

600 - 700 700 - 800 800 - 900 900 - 1000 1000 - 1100

Page 20: 1.5 & Κεφάλαιο 2, 2.1, 2 - msyrpi.weebly.com · 1ο ΜΑΘΗΜΑ Κεφάλαιο 1͖ Παράγραφοι 1.1͖ 1.5 & Κεφάλαιο 2, παράγραφοι 2.1, 2.2 ΑʛΜΕΡΟΣ

20 1ο Μάθημα

Μαρίνα Σύρπη

4. Παρακάτω βλέπετε τους πίνακες συχνοτήτων και τα αντίστοιχα ιστογράμματα, για τις

ηλικίες των εργαζομένων σε δύο επιχειρήσεις Α και Β.

ΕΠΙΧΕΙΡΗΣΗ Α ΕΠΙΧΕΙΡΗΣΗ Β

Ηλικία σε

έτη

Συχνότητα

Σχετική

Συχνότητα

Σχετική

Αθροιστική

Συχνότητα

𝑭𝒊 (%)

Συχνότητα

𝒇𝒊

Σχετική

Συχνότητα 𝒑𝒊

(%)

Σχετική

Αθροιστική

Συχνότητα

𝑭𝒊 (%)

20 – 28 4 10,00 10,00

5 12,50 12,50

28 – 36 6 15,00 25,00

8 20,00 32,50

36 – 44 8 20,00 45,00

10 25,00 57,50

44 – 52 12 30,00 75,00

9 22,50 80,00

52 – 60 10 25,00 100,00

8 20,00 100,00

40 100

40 100

Επιχείρηση Α – Ιστόγραμμα Σχετικών Συχνοτήτων Επιχείρηση Α – Ιστόγραμμα Σχετικών Αθροιστικών

Συχνοτήτων

Επιχείρηση Β – Ιστόγραμμα Σχετικών Συχνοτήτων Επιχείρηση Β – Ιστόγραμμα Σχετικών Αθροιστικών Συχνοτήτων

( α ) Να συμπληρώσετε τον πίνακα των συχνοτήτων εκτελώντας τις κατάλληλες πράξεις.

( β ) Περιγράψτε τα ιστογράμματα των σχετικών συχνοτήτων για τις δύο επιχειρήσεις και

εντοπίστε ομοιότητες και διαφορές.

( γ ) Σε ποιάαπό τις δύο επιχειρήσεις η ηλικία των εργαζομένων τείνει να είναι μικρότερη;

10,00

15,00

20,00

30,00

25,00

0,00

5,00

10,00

15,00

20,00

25,00

30,00

35,00

20 - 28 28 - 36 36 - 44 44 - 52 52 - 60

10,00

25,00

45,00

75,00

100,00

0,00

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

90,00

100,00

20 - 28 28 - 36 36 - 44 44 - 52 52 - 60

12,50

20,00

25,00

22,50

20,00

0,00

5,00

10,00

15,00

20,00

25,00

30,00

20 - 28 28 - 36 36 - 44 44 - 52 52 - 60

12,50

32,50

57,50

80,00

100,00

0,00

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

90,00

100,00

20 - 28 28 - 36 36 - 44 44 - 52 52 - 60