ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΙΝΑΚΕΣ ΚΑΙ ΔΙΑΓΡΑΜΜΑΤΑ Πηγή: Βιοστατιστική [Σταυρινός / Παναγιωτάκος] Βιοστατιστική [Τριχόπουλος / Τζώνου / Κατσουγιάννη]
Περιγραφική Στατιστική Με τις στατιστικές μεθόδους επιδιώκεται αφενός η συνοπτική αλλά εμπεριστατωμένη παρουσίαση των ευρημάτων μιας μελέτης (περιγραφική στατιστική) και αφετέρου η συναγωγή συμπερασμάτων που βασίζονται στα ευρήματα αυτά (συμπερασματολογική στατιστική / επαγωγική στατιστική)
Μεταβλητές Ως μεταβλητή θεωρούμε κάθε χαρακτηριστικό το οποίο μπορεί να μεταβληθεί ή να διαφοροποιηθεί κατά μήκος του χρόνου, από τόπο σε τόπο, από άτομο σε άτομο ή από ομάδα σε ομάδα (πχ ηλικία, ύψος, εισόδημα, συγκέντρωση χοληστερόλης, αρτηριακή πίεση, ρυθμό γεννητικότητας κτλ)
Μεταβλητές Ποιοτική ονομάζεται η μεταβλητή που περιγράφει κάποιο ποιοτικό χαρακτηριστικό ενός ατόμου ή μιας ομάδας {παράδειγμα} Ποιοτική ονομάζεται η μεταβλητή που περιγράφει κάποιο ποιοτικό χαρακτηριστικό ενός ατόμου ή μιας ομάδας {παράδειγμα}παράδειγμα Ποσοτική ονομάζεται η μεταβλητή που μπορεί να μετρηθεί με τη συνήθη έννοια του όρου Ποσοτική ονομάζεται η μεταβλητή που μπορεί να μετρηθεί με τη συνήθη έννοια του όρου Συνεχής Συνεχής Ασυνεχής Ασυνεχής Ως ανεξάρτητη χαρακτηρίζεται μια μεταβλητή όταν επηρεάζει μια άλλη μεταβλητή. Ως ανεξάρτητη χαρακτηρίζεται μια μεταβλητή όταν επηρεάζει μια άλλη μεταβλητή. Ως εξαρτημένη χαρακτηρίζεται μια μεταβλητή όταν επηρεάζεται από μια άλλη μεταβλητή. Ως εξαρτημένη χαρακτηρίζεται μια μεταβλητή όταν επηρεάζεται από μια άλλη μεταβλητή.
Διάταξη Παρατηρήσεων Μια πρώτη χρήσιμη μορφή οργάνωσης είναι η διάταξη των παρατηρήσεων κατά τάξη αύξοντος ή φθίνοντος μεγέθους
Κατανομή Συχνοτήτων για Ποσοτικές Μεταβλητές Κατανομή Συχνοτήτων: Υπολογισμός του πλήθους των παρατηρήσεων
Κατανομή Συχνοτήτων για Ποσοτικές Μεταβλητές Διάταξη παρατηρήσεων σε ομάδες (στην κατανομή συχνοτήτων): Κατάλληλος αριθμός ομάδων [6 -20 ομάδες] {παράδειγμα} Κατάλληλος αριθμός ομάδων [6 -20 ομάδες] {παράδειγμα}παράδειγμα Υπολογισμός μέσου όρου ανά ομάδα [Συνεχής / Ασυνεχής] Υπολογισμός μέσου όρου ανά ομάδα [Συνεχής / Ασυνεχής] Σταθερό εύρος όλων των ομάδων μέσα στην ίδια κατανομή συχνοτήτων {παράδειγμα} Σταθερό εύρος όλων των ομάδων μέσα στην ίδια κατανομή συχνοτήτων {παράδειγμα}παράδειγμα
Ιστόγραμμα και Πολύγωνο Συχνοτήτων
Το εμβαδόν κάθε ορθογωνίου στα συγκριτικά ιστογράμματα ισούται με τη σχετική συχνότητα, ενώ το συνολικό εμβαδόν κάτω από κάθε ιστόγραμμα ισούται με 100%
Ιστόγραμμα και Πολύγωνο Συχνοτήτων ΙστογράμματαΙστογράμματα (πυκνότητα διαστημάτων) Ιστογράμματα
Μορφές και Χαρακτηριστικά Κατανομών Συχνοτήτων Ποσοτικών Μεταβλητών
Ιστόγραμμα σε Ποιοτικές Μεταβλητές
Διάγραμμα Αθροιστικών Σχετικών Συχνοτήτων Η Αθροιστική Σχετική Συχνότητα ενός διαστήματος ορίζεται ως το ποσοστό των παρατηρήσεων των οποίων η τιμή είναι μικρότερη ή ίση από το άνω όριο του διαστήματος αυτού Η Αθροιστική Σχετική Συχνότητα ενός διαστήματος ορίζεται ως το ποσοστό των παρατηρήσεων των οποίων η τιμή είναι μικρότερη ή ίση από το άνω όριο του διαστήματος αυτού Η πολυγωνική γραμμή που προκύπτει ονομάζεται διάγραμμα των αθροιστικών συχνοτήτων Η πολυγωνική γραμμή που προκύπτει ονομάζεται διάγραμμα των αθροιστικών συχνοτήτων
Διάγραμμα Αθροιστικών Σχετικών Συχνοτήτων
Το διάγραμμα των αθροιστικών συχνοτήτων είναι ιδιαίτερα χρήσιμο για: σύγκριση αντιστοίχων διαγραμμάτων σύγκριση αντιστοίχων διαγραμμάτων παρατήρηση ποσοστώσεων παρατήρηση ποσοστώσεων Κατασκευή χαρτών φυσιολογικής εξέλιξης Κατασκευή χαρτών φυσιολογικής εξέλιξης
Σύγκριση Διαγραμμάτων - Ποσοστώσεις
Χάρτες Φυσιολογικής Εξέλιξης
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΡΙΘΜΗΤΙΚΑ ΠΕΡΙΓΡΑΦΙΚΑ ΜΕΤΡΑ
Αριθμητικά Περιγραφικά Μέτρα Κάθε Αριθμητικό Περιγραφικό Μέτρο που υπολογίζεται από το δείγμα, ονομάζεται στατιστική. Μια στατιστική μεταβάλλεται από δείγμα σε δείγμα Κάθε Αριθμητικό Περιγραφικό Μέτρο που υπολογίζεται από το δείγμα, ονομάζεται στατιστική. Μια στατιστική μεταβάλλεται από δείγμα σε δείγμα Κάθε Αριθμητικό Περιγραφικό Μέτρο που υπολογίζεται από το σύνολο του πληθυσμού, ονομάζεται παράμετρος του πληθυσμού αυτού. Κάθε παράμετρος είναι μια σταθερά, δηλ έχει μια μοναδική τιμή στον πληθυσμό. Κάθε Αριθμητικό Περιγραφικό Μέτρο που υπολογίζεται από το σύνολο του πληθυσμού, ονομάζεται παράμετρος του πληθυσμού αυτού. Κάθε παράμετρος είναι μια σταθερά, δηλ έχει μια μοναδική τιμή στον πληθυσμό.
Αριθμητικά Περιγραφικά Μέτρα Μέτρα Κεντρικής Τάσεως Μέτρα Κεντρικής Τάσεως Μέτρα Διασποράς Μέτρα Διασποράς Μέτρα Μεταβλητότητας Μέτρα Μεταβλητότητας Μέτρα Ισοκατανομής Μέτρα Ισοκατανομής
Μέτρα Κεντρικής Τάσεως i. Αριθμητικός Μέσος ii. Διάμεσος iii. Επικρατούσα Τιμή
Αριθμητικός Μέσος
Περιγραφικά Μέτρα
Αριθμητικός Μέσος Βασικά χαρακτηριστικά: Ορίζεται μονοσήμαντα Ορίζεται μονοσήμαντα Έχει απλή ερμηνεία, ως ο μέσος όλων των παρατηρήσεων Έχει απλή ερμηνεία, ως ο μέσος όλων των παρατηρήσεων Υπολογίζεται εύκολα Υπολογίζεται εύκολα Είναι αντιπροσωπευτικός του συνόλου των παρατηρήσεων Είναι αντιπροσωπευτικός του συνόλου των παρατηρήσεων Αποτελεί βάση πολλών στατιστικών ελέγχων Αποτελεί βάση πολλών στατιστικών ελέγχων Επηρεάζεται πολύ από τις ακραίες παρατηρήσεις Επηρεάζεται πολύ από τις ακραίες παρατηρήσεις Είναι η καλύτερη εκτιμήτρια του μέσου μ της Χ στον πληθυσμό, όταν η κατανομή των τιμών της Χ στον πληθυσμό είναι κανονική. Είναι η καλύτερη εκτιμήτρια του μέσου μ της Χ στον πληθυσμό, όταν η κατανομή των τιμών της Χ στον πληθυσμό είναι κανονική. Είναι ακατάλληλος ως μέτρο κεντρικής τάσεως όταν η κατανομή των τιμών της Χ στον πληθυσμό απέχει πολύ από την κανονική. Είναι ακατάλληλος ως μέτρο κεντρικής τάσεως όταν η κατανομή των τιμών της Χ στον πληθυσμό απέχει πολύ από την κανονική.
Διάμεσος Βασικά χαρακτηριστικά: Ορίζεται μονοσήμαντα Ορίζεται μονοσήμαντα Έχει απλή ερμηνεία Έχει απλή ερμηνεία Υπολογίζεται εύκολα Υπολογίζεται εύκολα Δεν επηρεάζεται από ακραίες τιμές Δεν επηρεάζεται από ακραίες τιμές Είναι η καλύτερη εκτιμήτρια της διαμέσου στον πληθυσμό. Σε συμμετρική κατανομή η διάμεσος τυχαίου δείγματος είναι και αμερόληπτη εκτιμήτρια του μέσου μ, αλλά όχι τόσο αποτελεσματική όσο ο αριθμητικός μέσος Είναι η καλύτερη εκτιμήτρια της διαμέσου στον πληθυσμό. Σε συμμετρική κατανομή η διάμεσος τυχαίου δείγματος είναι και αμερόληπτη εκτιμήτρια του μέσου μ, αλλά όχι τόσο αποτελεσματική όσο ο αριθμητικός μέσος Οι περισσότεροι στατιστικοί έλεγχοι βασίζονται στον αριθμητικό μέσο και δε χρησιμοποιούν τη διάμεσο Οι περισσότεροι στατιστικοί έλεγχοι βασίζονται στον αριθμητικό μέσο και δε χρησιμοποιούν τη διάμεσο
Επικρατούσα Τιμή Βασικά χαρακτηριστικά: Δεν ορίζεται μονοσήμαντα Δεν ορίζεται μονοσήμαντα Η επικρατούσα τιμή σε ένα τυχαίο δείγμα είναι η καλύτερη εκτιμήτρια της επικρατούσας τιμής στον πληθυσμό Η επικρατούσα τιμή σε ένα τυχαίο δείγμα είναι η καλύτερη εκτιμήτρια της επικρατούσας τιμής στον πληθυσμό Όταν το τυχαίο δείγμα λαμβάνεται από ένα συμμετρικό πληθυσμό με μια κορυφή, τότε η επικρατούσα τιμή είναι αμερόληπτη εκτιμήτρια του μέσου και της διαμέσου του πληθυσμού αλλά όχι τόσο αποτελεσματική Όταν το τυχαίο δείγμα λαμβάνεται από ένα συμμετρικό πληθυσμό με μια κορυφή, τότε η επικρατούσα τιμή είναι αμερόληπτη εκτιμήτρια του μέσου και της διαμέσου του πληθυσμού αλλά όχι τόσο αποτελεσματική Ως μέτρο κεντρικής τάσεως, η επικρατούσα τιμή επηρεάζεται από την ασυμμετρία λιγότερο από τον μέσο και τη διάμεσο Ως μέτρο κεντρικής τάσεως, η επικρατούσα τιμή επηρεάζεται από την ασυμμετρία λιγότερο από τον μέσο και τη διάμεσο Επηρεάζεται από τον τρόπο δειγματοληψίας και από τον τρόπο ομαδοποίησης των στοιχείων Επηρεάζεται από τον τρόπο δειγματοληψίας και από τον τρόπο ομαδοποίησης των στοιχείων Σε μια συμμετρική κατανομή με μια κορυφή, η διάμεσος βρίσκεται ανάμεσα στο μέσο και στην επικρατούσα τιμή και χωρίζει την απόστασή τους σε δύο τμήματα που έχουν λόγο 1:2 Σε μια συμμετρική κατανομή με μια κορυφή, η διάμεσος βρίσκεται ανάμεσα στο μέσο και στην επικρατούσα τιμή και χωρίζει την απόστασή τους σε δύο τμήματα που έχουν λόγο 1:2
Σχετικές Θέσεις ΜΚΤ
Μέτρα Διασποράς και Μεταβλητότητας
i. Εύρος Μεταβολής ii. Τεταρτημοριακή Απόκλιση iii. Διακύμανση / Τυπική Απόκλιση iv. Συντελεστής Μεταβλητότητας
Εύρος Μεταβολής Το εύρος μεταβολής των τιμών μιας μεταβλητής Χ ισούται με τη διαφορά της μικρότερης τιμής της Χ από τη μεγαλύτερη τιμή της
Τεταρτημοριακή Απόκλιση Η Τεταρτημοριακή Απόκλιση ορίζει ένα μέτρο διασποράς γύρω από τη διάμεσο Boxplot
Διακύμανση
Τυπική Απόκλιση
Διακύμανση – Τεταρτημοριακή Απόκλιση Η διακύμανση καθώς και η τυπική απόκλιση ενός συνόλου τιμών ή ενός δείγματος είναι μέτρα διασποράς γύρω από τον μέσο των τιμών αυτών, ενώ η τεταρτημοριακή απόκλιση είναι μέτρο διασποράς γύρω από τη διάμεσο
Διακύμανση και Τυπική Απόκλιση Σε περίπτωση που οι τιμές της Χ προέρχονται από έναν πληθυσμό του οποίου οι συχνότητες ακολουθούν την κανονική κατανομή αποδεικνύεται ότι: Στο διάστημα [μ-σ, μ+σ] περιλαμβάνεται το 68% των τιμών της Χ Στο διάστημα [μ-σ, μ+σ] περιλαμβάνεται το 68% των τιμών της Χ Στο διάστημα [μ-2σ, μ+2σ] περιλαμβάνεται το 95% των τιμών της Χ Στο διάστημα [μ-2σ, μ+2σ] περιλαμβάνεται το 95% των τιμών της Χ Στο διάστημα [μ-3σ, μ+3σ] περιλαμβάνεται το 99% των τιμών της Χ Στο διάστημα [μ-3σ, μ+3σ] περιλαμβάνεται το 99% των τιμών της Χ
Διακύμανση και Τυπική Απόκλιση
Συντελεστής Μεταβλητότητας Ο Συντελεστής Μεταβλητότητας αποτελεί πηλίκο δύο μεγεθών που εκφράζονται με τις ίδιες μονάδες (τυπική απόκλιση, μέση τιμή) είναι καθαρός αριθμός χωρίς φυσικές διαστάσεις και μονάδες.
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΕΩΣ & ΔΙΑΣΠΟΡΑΣ ΣΕ ΟΜΑΔΟΠΟΙΗΜΕΝΑ ΣΤΟΙΧΕΙΑ
Υπολογισμός Μέτρων Κεντρικής Τάσεως και Διασποράς σε Ομαδοποιημένα Στοιχεία Υπολογισμό Μέσου από Ομαδοποιημένα Στοιχεία Υπολογισμό Μέσου από Ομαδοποιημένα Στοιχεία Υπολογισμός Διαμέσου από Ομαδοποιημένα Στοιχεία Υπολογισμός Διαμέσου από Ομαδοποιημένα Στοιχεία Υπολογισμός Επικρατούσας Τιμής από Ομαδοποιημένα Στοιχεία Υπολογισμός Επικρατούσας Τιμής από Ομαδοποιημένα Στοιχεία Υπολογισμός Διακύμανσης από Ομαδοποιημένα Στοιχεία Υπολογισμός Διακύμανσης από Ομαδοποιημένα Στοιχεία
Υπολογισμός Μέτρων Κεντρικής Τάσεως και Διασποράς σε Ομαδοποιημένα Στοιχεία
Υπολογισμός του Μέσου από Ομαδοποιημένα Στοιχεία m i : Μέσος διαστήματος i f i : Συχνότητα διαστήματος i
Υπολογισμός της διαμέσου από Ομαδοποιημένα Στοιχεία L i : κάτω όριο του διαστήματος που περιέχει τη διάμεσο U i : άνω όριο του ίδιου διαστήματος J: αριθμός παρατηρήσεων
Υπολογισμός της διαμέσου από Ομαδοποιημένα Στοιχεία
Υπολογισμός της επικρατούσας τιμής από Ομαδοποιημένα Στοιχεία Η επικρατούσα τιμή σε ομαδοποιημένα στοιχεία αναφέρεται στο διάστημα με τη μεγαλύτερη συχνότητα, καθώς οι επιμέρους παρατηρήσεις σε ομαδοποιημένα στοιχεία δεν αναγνωρίζονται
Υπολογισμός της Διακύμανσης και της Τυπικής Απόκλισης από Ομαδοποιημένα Στοιχεία
Κατανομή Συχνοτήτων Ποιοτικών Μεταβλητών Το πλήθος των παρατηρήσεων (άξονας y) αναφέρεται ως συχνότητα
Εύρος Τιμών των Ομάδων
Ομαδοποίηση Παρατηρήσεων k: αριθμός διαστημάτων n: αριθμός παρατηρήσεων w: εύρος του διαστήματος R: Συνολικό εύρος διακύμανσης παρατηρήσεων
Πίνακας Κατανομής Συχνοτήτων
Boxplots