Χαρακτηριστικά μιας Κατανομής
συμμετρικές και μη συμμετρικές κατανομές Πολλές τιμές στη μέση, λίγες μεγάλες τιμές και λίγες μικρές τιμές Πολλές μικρές τιμές, κάποιες τιμές στη μέση και λίγες μεγάλες τιμές Πολλές μεγάλες τιμές, κάποιες τιμές στη μέση και λίγες μικρές τιμές
Μέτρα θέσης (μέτρα κεντρικής τάσης) Μέτρα θέσης (μέτρα κεντρικής τάσης) Μέση Τιμή (Mean Value / Average) Διάμεσος (Median) Κορυφή ή επικρατούσα τιμή (Mode) Εκατοστημόρια – Τεταρτημόρια (percentiles, quartiles)
1) Μέση τιμή Δειγματική μέση τιμή Άθροισμα τιμών ΔΙΑ το πλήθος των τιμών Πρόβλημα: η μέση τιμή επηρεάζεται ιδαιίτερα από τις ακραίες τιμές (μεγάλες ή μικρές). Αυτό δημιουργεί προβλήματα σε μη συμμετρικές κατανομές.
Παραδείγματα Αν έχουμε τις βαθμολογίες Βγάζουμε μέση βαθμολογία 16,7 Αν όμως είχαμε την πρώτη βαθμολογία στο 6 αντί στο 13, δηλ Τότε θα βγάζαμε μέση βαθμολογία 15,9 (η ακραία τιμή άλλαξε αρκετά τη μέση βαθμολογία)
2) Διάμεσος Χωρίζει το εμβαδόν κάτω από την καμπύλη της κατανομής σε δύο ίσα μέρη (50% - 50%) 50% 50% Δ Χωρίζει τις τιμές μας σε δύο ίσα μέρη Το 50% των μετρήσεων είναι κάτω από την τιμή αυτή Και το άλλο 50% των μετρήσεων είναι πάνω από την τιμή αυτή
Πως βρίσκουμε τη διάμεσο; Βάζουμε τους αριθμούς σε αύξουσα σειρά (από το πιο μικρό στο πιο μεγάλο) Διαγράφουμε έναν αριθμό από το τέλος της λίστας κι έναν από την αρχή Ο αριθμός που περισσεύει στη μέση είναι η διάμεσος Αν περισσεύουν 2 αριθμοί, η διάμεσος είναι ο μέσος όρος τους.
Τελικά αν έχουμε n αριθμούς:
Παραδείγματα Αν έχουμε τις βαθμολογίες (μονός αριθμός) Η διάμεση βαθμολογία είναι 16,5 Αν όμως είχαμε την πρώτη βαθμολογία στο 6 αντί στο 13, δηλ Πάλι η διάμεση βαθμολογία είναι 16,5 (δεν επηρεάστηκε από την υπερβολικά μικρή τιμή 6)
Παράδειγμα Αν έχουμε τις τιμές (ζυγός αριθμός) Τότε η διάμεσος είναι ο μέσος όρος του 16,5 και του 18, δηλαδή (16,5+18)/2 = 17,25
3) Κορυφή (επικρατούσα τιμή) Μ0 Είναι ο αριθμός x, που εμφανίζεται με τη μεγαλύτερη συχνότητα
Τα μέτρα θέσης σε συμμετρικές και μη συμμετρικές κατανομές μ<Δ<M0 μ=Δ=M0 M0< Δ<μ Θετική ασυμμετρία (μέση τιμή ΠΙΟ ΜΕΓΑΛΗ Από τη διάμεσο) Αρνητική ασυμμετρία (μέση τιμή ΠΙΟ ΜΙΚΡΗ από τη διάμεσο)
Εκατοστημόρια Κ% Το κ% εκατοστημόριο
Εκατοστημόρια Για να βρούμε ένα εκατοστημόριο k% σε n μετρήσεις: βάζουμε τις μετρήσεις σε αύξουσα σειρά βρίσκουμε τον αριθμό nk/100 Αν ο αριθμός ΔΕΝ είναι ακέραιος, πάμε στη θέση του επόμενου ακεραίου και αυτός ο αριθμός είναι το k% εκατοστημόριο Αν ο αριθμός είναι ακέραιος, τότε το k% εκατοστημόριο είναι ο μέσος όρος του αριθμού αυτού και του επομένου του
Εκατοστημόρια – Παράδειγμα 1 Έστω ότι έχουμε 60 μετρήσεις και ζητάμε το 80% εκατοστημόριο. Τις βάζουμε σε αύξουσα σειρά Βρίσκουμε το 60*80/100 = 48 Είναι ακέραιος, άρα βρίσκουμε τη 48η τιμή και την επόμενη (49η) και βρίσκουμε το μέσο όρο τους.
Εκατοστημόρια – Παράδειγμα 2 Έστω ότι έχουμε 70 μετρήσεις και ζητάμε το 25% εκατοστημόριο. Τις βάζουμε σε αύξουσα σειρά Βρίσκουμε το 70*25/100 = 17,5 Δεν είναι ακέραιος, άρα πάμε στον επόμενο ακέραιο (18), οπότε το 25% εκατοστημόριο είναι η 18η παρατήρηση στη σειρά
Τεταρτημόρια (Quartiles) 25% 25% 25% 25% Q1 Q2 Q3
Τεταρτημόρια σε διάφορες κατανομές Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3 Συμμετρική κατανομή: το Q1 απέχει από το Q2, όσο απέχει και το Q3 από το Q2 Kατανομή θετικά ασύμμετρη: Το Q1 είναι κοντά στο Q2, ενώ το Q3 είναι μακριά από το Q2 Kατανομή αρνητικά ασύμμετρη: Το Q1 είναι μακριά από το Q2, ενώ το Q3 είναι κοντα στο Q2
Θηκόγραμμα (Box Plot) Q3 Τιμές του χαρακτηριστικού Διάμεσος (Q2) Q1
Θηκόγραμμα (Box Plot) Παράτυπη τιμή (Outlier)