Μέτρα κεντρικής τάσης και διασποράς Δεύτερο μάθημα
Αριθμητικός μέσος όρος 7, 13, 22, 9, 11, 4. άθροισμα 66, διά 6 ίσον 11. Γενικά, όταν έχουμε Ν προσθετέους Τότε ο αριθμητικός μέσος όρος είναι:
Υπολογισμός του αριθμητικού μέσου όρου από την κατανομή συχνότητας Χi fi fXi 18 1 17 2 34 16 32 15 3 45 14 28 13 5 65 12 36 11 22 Σύνολο 20 280 Δεδομένα: 11, 11, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 15, 15, 15, 16, 16, 17, 17, 18
Υπολογισμός του αριθμητικού μέσου όρου από την κατανομή συχνότητας ομαδοποιημένων δεδομένων Χi fi fXi 18 1 17 2 34 16 32 15 3 45 14 28 13 5 65 12 36 11 22 Σύνολ. 20 280 Παρατηρήστε ότι:
Διάστημα επί συχνό-τητα Χifi Ομαδοποιημένα δεδομένα Διά-στημα Μέσο διαστήματος Χi Συχνότητα fi Διάστημα επί συχνό-τητα Χifi 45-49 47 1 40-44 42 2 84 35-39 37 3 111 30-34 32 6 192 25-29 27 8 216 20-24 22 17 374 15-19 26 442 10-14 12 11 132 5-9 7 0-4 Σύνολο 76 1.612
Ιδιότητες του αριθμητικού μέσου όρου Αποκλίσεις (deviations) από τον μέσο όρο Αρχικά ή ακατέργαστα (raw) δεδομένα
Ιδιότητες του αριθμητικού μέσου όρου Πρώτη ιδιότητα: Το άθροισμα των αποκλίσεων από τον μέσο όρο ισούται με το μηδέν Παράδειγμα: Ο αριθμητικός μέσος των τιμών 7, 13, 22, 9, 11, 4 είναι το 11 Οι αποκλίσεις από τον μέσο όρο είναι -4, 2, 11, -2, 0, -7. Το άθροισμά τους είναι 0.
Ιδιότητες του αριθμητικού μέσου όρου Δεύτερη ιδιότητα: Το άθροισμα των τετραγώνων των αποκλίσεων από τον αριθμητικό μέσο όρο είναι μικρότερο από το άθροισμα των τετραγώνων των αποκλίσεων από κάθε άλλη τιμή
Ιδιότητες του αριθμητικού μέσου όρου Παράδειγμα: Ο αριθμητικός μέσος των τιμών 7, 13, 22, 9, 11, 4 είναι το 11 Οι αποκλίσεις από τον μέσο όρο είναι -4, 2, 11, -2, 0, -7 (μηδέν) Τα τετράγωνα των αποκλίσεων είναι 16, 4, 121, 4, 0, 49. Το άθροισμά τους είναι το 194. Αν είχαμε διαλέξει π.χ. το 13 αντί του 11, το άθροισμα των αποκλίσεων θα ήταν -6, 0, 9, 4, 2, -9 Στο τετράγωνο είναι 36, 0, 81, 16, 4, 81 (σύνολο 218).
Ιδιότητες του αριθμητικού μέσου όρου Απόδειξη Αυτό κάνει μηδέν Πάντα θετική ποσότητα. Άρα η απόκλιση από μια τιμή διαφορετική από τον μέσο όρο είναι πάντα μεγαλύτερη
Ιδιότητες του αριθμητικού μέσου όρου Τρίτη ιδιότητα: Ο μέσος όρος ενός δείγματος ως αποτελεί επαρκή και ακριβή δείκτη για τον μέσο όρο του πληθυσμού.
Η διάμεσος Δεδομένα 2 7 16 19 20 25 27 Σειρά 1 3 4 5 6 Δεδομένα 7 8 9 31 8 Δεδομένα 2 7 16 19 20 25 27 Σειρά 1 3 4 5 6 Δεδομένα 7 8 9 10 Σειρά 1 2 3 4 5 6
Η διάμεσος όταν έχουμε συνεχείς τιμές Δεδομένα 7 8 9 10 Σειρά 1 2 3 4 5 6 Διάμεσος 7,5+0,67=8,17
Η διάμεσος όταν έχουμε ομαδοποιημένες τιμές Πρώτον Βρίσκουμε τις αθροιστικές συχνότητες (εδώ 76) και διαιρούμε με το 2 για να βρούμε το Ν/2, δηλαδή τη μεσαία (εδώ το Ν/2 είναι το 38) Δεύτερον Εντοπίζουμε το διάστημα που περιέχει το Ν/2 (δηλ. το 38). Εδώ είναι το διάστημα το 15-19 (ή σε πραγματικές τιμές, το διάστημα 14,5-19,5). Διά-στημα Μέσο διαστήματος Συχνότητα Αθροιστική συχνότητα 45-49 47 1 76 40-44 42 2 75 35-39 37 3 73 30-34 32 6 70 25-29 27 8 64 20-24 22 17 56 15-19 26 39 10-14 12 11 13 5-9 7 0-4 Σύνολο
Η διάμεσος όταν έχουμε ομαδοποιημένες τιμές Τρίτον Πού πέφτει η 38η περίπτωση στο διάστημα 15-19; Από τις 26 περιπτώσεις του διαστήματος 15-19, η διάμεσος είναι μετά από την 25η, γιατί 2+11+25=38. Άρα, χρειαζόμαστε τα 25/26 του διαστήματος. Διά-στημα Μέσο διαστήματος Συχνότητα Αθροιστική συχνότητα 45-49 47 1 76 40-44 42 2 75 35-39 37 3 73 30-34 32 6 70 25-29 27 8 64 20-24 22 17 56 15-19 26 39 10-14 12 11 13 5-9 7 0-4 Σύνολο
Η διάμεσος όταν έχουμε ομαδοποιημένες τιμές Και επειδή το διάστημα έχει εύρος 5 έχουμε: Τέταρτο Προσθέτουμε το απαιτούμενο εύρος στο πραγματικό όριο του διαστήματος 15-19. 14,5+4,81=19,31 Η διάμεσος είναι 19,31 Διά-στημα Μέσο διαστήματος Συχνότητα Αθροιστική συχνότητα 45-49 47 1 76 40-44 42 2 75 35-39 37 3 73 30-34 32 6 70 25-29 27 8 64 20-24 22 17 56 15-19 26 39 10-14 12 11 13 5-9 7 0-4 Σύνολο
Η διάμεσος όταν έχουμε ομαδοποιημένες τιμές Όπου: L=το ακριβές κατώτερο όριο του διαστήματος που περιέχει τη διάμεσο F= το άθροισμα όλων των συχνοτήτων κάτω από το L fm= η συχνότητα του διαστήματος που περιέχει τη διάμεσο Ν =το πλήθος των παρατηρήσεων h= Το εύρος του διαστήματος που περιέχει τη διάμεσο
Ιδιότητες της διαμέσου Για τον μέσο όρο είχαμε ότι Για τη διάμεσο έχουμε αντιστοίχως ότι το άθροισμα των απολύτων τιμών (χωρίς το πρόσημο) των αποκλίσεων από τη διάμεσο είναι το ελάχιστο
Η δεσπόζουσα τιμή 11, 11, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 15, 15, 15, 16, 16, 17, 17, 18 Η δεσπόζουσα τιμή είναι το 13 2, 7, 16, 19, 20, 25, 27 2, 2, 2, 7, 7, 7, 16, 16, 16, 19, 19, 19, 20, 20, 20, 25, 25, 25, 27, 27, 27 Δεν υπάρχει δεσπόζουσα τιμή 11, 11, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 15, 15, 15, 16, 16, 17, 17, Η δεσπόζουσα τιμή είναι το 13+14/2=13,2 11, 11, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 15, 15, 15, 15, 16, 16, 17, 17, 18 Δύο δεσπόζουσες τιμές
Ο γεωμετρικός μέσος όρος Για παράδειγμα, για τις τιμές: 2, 3, 8, 10
Ασκήσεις για το σπίτι Για τις τιμές 1, 5, 10, 15, 19 βρείτε: (α) το άθροισμα των τετραγώνων των διαφορών από τον μέσο όρο και (β) το άθροισμα των τετραγώνων των διαφορών για από την τιμή 8. Αν υποθέσουμε ότι οι παρακάτω τιμές είναι διακριτές υπολογίστε τη διάμεσο: 1,2,2,2,2,3,3, 1,1,2,2,2,3,4,4, 1,2,2,2,3,3,3,4 16,17,18,19,19,19,19 Κάντε το ίδιο υποθέτοντας ότι οι τιμές είναι συνεχείς
Μέτρα διασποράς Τρίτο Μάθημα
Λύσεις των ασκήσεων του προηγούμενου μαθήματος Για τις τιμές 1, 5, 10, 15, 19 βρείτε: (α) το άθροισμα των τετραγώνων των διαφορών από τον μέσο όρο και (β) το άθροισμα των τετραγώνων των διαφορών για από την τιμή 8. Αν υποθέσουμε ότι οι παρακάτω τιμές είναι διακριτές υπολογίστε τη διάμεσο: 1,2,2,2,2,3,3, 1,1,2,2,2,3,4,4, 1,2,2,2,3,3,3,4 16,17,18,19,19,19,19 Κάντε το ίδιο υποθέτοντας ότι οι τιμές είναι συνεχείς
Χi Χi-10 (Χi-10)2 Χi-8 (Χi-8)2 Σύνολο 212 233 Για τις τιμές 1, 5, 10, 15, 19 βρείτε: (α) το άθροισμα των τετραγώνων των διαφορών από τον μέσο όρο και (β) το άθροισμα των τετραγώνων των διαφορών για από την τιμή 8. Χi Χi-10 (Χi-10)2 Χi-8 (Χi-8)2 1 -9 81 -7 49 5 -5 25 -3 9 10 +2 4 15 +9 +7 19 +5 +11 121 Σύνολο 212 233 (1-10)2=92=81
Αν υποθέσουμε ότι οι παρακάτω τιμές είναι διακριτές υπολογίστε τη διάμεσο: 1, 2, 2, 2, 2, 3, 3 Διάμεσος=2 1,1, 2, 2, 2, 3, 4, 4 Διάμεσος=2 1,2,2,2,3,3,3,4 Διάμεσος=2,5 16, 17, 18, 19, 19, 19, 19 Διάμεσος=19
Αν υποθέσουμε ότι οι παρακάτω τιμές είναι συνεχείς υπολογίστε τη διάμεσο: 1, 2, 2, 2, 2, 3, 3 Διάμεσος=2 1,1, 2, 2, 2, 3, 4, 4 Διάμεσος=1,5+2/3=2,167 1, 2, 2, 2, 3, 3, 3, 4 Διάμεσος=2,5 16, 17, 18, 19, 19, 19, 19 Διάμεσος=19
Εύρος και μέση απόκλιση 1. Το εύρος 2. Η μέση απόκλιση (Mean Deviation) Δείγμα Α 8, 8, 8, 8, 8 Δείγμα Β 1, 4, 7, 10, 13 Δείγμα Γ 1, 5, 20, 25, 29 Δείγμα Α 0, 0, 0, 0, 0 Δείγμα Β -6, -3, 0, +3, +6 και (6+3+ 0+3+6)/5=3,6 Δείγμα Γ -15, -11, +4, +9, +13, ενώ (15+11+4+9+13)/5=10,4
Η διακύμανση O μέσος όρος των τιμών 1, 4, 7, 10, 13 είναι το 7. Όπως είδαμε, οι αποκλίσεις από τον μέσο όρο είναι -6, -3, 0, +3, +6. Στο τετράγωνο οι αποκλίσεις αυτές είναι 36, 9, 0, 9, 36. Το άθροισμα των τετραγώνων των αποκλίσεων είναι 90. Με τι θα διαιρέσουμε; Για τον πληθυσμό, η διακύμανση είναι στην ουσία ο μέσος όρος των τετραγώνων των αποκλίσεων από τον μέσο όρο του πληθυσμού.
Η Διακύμανση Αν και η ποσότητα Ν δεν διαφέρει πολύ από την ποσότητα Ν-1, όταν υπολογίζουμε τη διακύμανση του πληθυσμού διαιρώντας με Ν, κάνουμε συστηματικό σφάλμα. Υπολογίζουμε μια διακύμανση μικρότερη κατά (Ν-1)/Ν. Όταν, όμως, διαιρούμε δια Ν-1, το πρόβλημα λύνεται. Ας υποθέσουμε ότι έχουμε έναν πληθυσμό που αποτελείται από τους αριθμούς 1, 2, 3. Έχουμε τότε ότι μ=2 και σ2=0,667. Παίρνουμε τώρα όλα τα πιθανά δείγματα μεγέθους Ν=2 (μόνο 9 τέτοια μπορούμε να πάρουμε).
Η διακύμανση Έστω ότι έχουμε τον πληθυσμό {1, 2, 3} Ο μέσος όρος είναι το 2 Η διακύμανση είναι το 0,667
Έστω ότι έχουμε το δείγμα {1, 2} Ο μέσος όρος είναι το 1,5 Η διακύμανση είναι το 0,25
Δείγματα s2 με Ν-1 s2 με Ν 1,1 1,0 0,00 1,2 1,5 0,50 0,25 1,3 2,0 2,00 1,00 2,1 2,2 2,3 2,5 3,1 3,2 3,3 3,0 0,667 0,333
Θα έπρεπε δηλαδή να διαιρέσουμε όχι με το Ν αλλά με το Ν-1
Η Διακύμανση Για τον πληθυσμό, η διακύμανση είναι στην ουσία ο μέσος όρος των τετραγώνων των αποκλίσεων από τον μέσο όρο του πληθυσμού. Για το δείγμα, διαιρούμε όχι με το μέγεθος του δείγματος Ν, αλλά με Ν-1 Και αυτό γιατί αν και η ποσότητα Ν δεν διαφέρει πολύ από την ποσότητα Ν-1, όταν υπολογίζουμε τη διακύμανση του πληθυσμού διαιρώντας με Ν, κάνουμε συστηματικό σφάλμα. Υπολογίζουμε μια διακύμανση μικρότερη κατά (Ν-1)/Ν. Όταν, όμως, διαιρούμε δια Ν-1, το πρόβλημα λύνεται.
Η Διακύμανση και η Τυπική Απόκλιση Η διακύμανση είναι ένας δείκτης υψωμένος στο τετράγωνο. Για παράδειγμα, αν μετράμε το μήκος σε μέτρα, η διακύμανση μετράει τετραγωνικά μέτρα. Για να απαλαγούμε από τα τετράγωνα, χρησιμοποιούμε την τετραγωνική ρίζα της Διακύμανσης, την οποία ονομάζουμε «Τυπική Απόκλιση»
Είδαμε τη διακύμανση ως μέτρο της απόστασης των τιμών από το μέσο όρο. Εναλλακτικά, μπορούμε να δούμε την απόσταση όλων των τιμών μεταξύ τους. Για παράδειγμα, για τρεις τιμές Χ1, Χ2, και Χ3, έχουμε τις διαφορές Χ1-Χ2, Χ1-Χ3, καθώς και Χ2-Χ3 (Γενικά, για Ν τιμές έχουμε Ν(Ν-1)/2 διαφορές). Για παράδειγμα, για τις τιμές 1, 4, 7, 10, 13, οι διαφορές ανά δύο ανάμεσα στις 5(5-1)/2= 10 διαφορές είναι μεταξύ τους -3, -6, -9, -12, -3, -6, -9, -3, -6 και -3. Αν προσθέσουμε τις διαφορές και τις διαιρέσουμε για τον αριθμό τους (10), βρίσκουμε μια τιμή πολύ κοντά προς τη διακύμανση. Στην ουσία, είναι το διπλάσιο της διακύμανσης. Δηλαδή:
Παράδειγμα Πειραματική ομάδα 5, 7, 17, 31, 45, 47, 68, 85, 96, 99 Ομάδα ελέγχου 29, 36, 37, 42, 49, 58, 62, 63, 69, 70 Πειραματική ομάδα Μέσος όρος: 50,0 Τυπική απόκλιση: 35,63 Ομάδα ελέγχου Μέσος όρος: 51,5 Τυπική απόκλιση 14,86
Εναλλακτικός υπολογισμός διακύμανσης Ι Το άθροισμα όρων Ν φορές είναι απλώς . Επίσης, το είναι αφού
Παράδειγμα Αθροίζουμε τα τετράγωνα των αρχικών τιμών, αφαιρούμε Ν φορές το τετράγωνο του μέσου όρου και διαιρούμε δια Ν. Για παράδειγμα, οι τιμές 1, 4, 7, 10, 13 έχουν μέσο όρο 7. Τα τετράγωνα των τιμών είναι 1, 16, 49, 100, και 169. Το άθροισμα των τετραγώνων είναι 335. Η διακύμανση είναι
Ιδιότητες της διακύμανσης Όταν στις αρχικές τιμές προσθέτουμε έναν αριθμό, η διακύμανση δεν αλλάζει. Για παράδειγμα, αν στις τιμές 1, 4, 7, 10, 13 προσθέσουμε το π.χ. 5, οι τιμές θα γίνουν 6, 9, 12, 15, και 18. Ο αρχικός μέσος όρος είναι 7 και ο νέος μέσος όρος είναι 7+5=12. Η διακύμανση είναι πάντα η ίδια, αφού οι αποστάσεις από τον νέο μέσο όρο παραμένουν -6, -3, 0, +3 και +6.
Εναλλακτικός υπολογισμός διακύμανσης ΙΙ Ο πιο πάνω τρόπος αποφεύγει τον υπολογισμό του μέσου όρου της κατανομής και είναι κάποιες φορές χρήσιμος
Ιδιότητες της διακύμανσης Όταν οι αρχικές τιμές πολλαπλασιάζονται με έναν αριθμό, η διακύμανση πολλαπλασιάζεται με τον ίδιο αριθμό. Αν μια κατανομή έχει μέσο όρο
Ασκήσεις Για τις τιμές 2, 5, 9, 10, 15, 19 υπολογίστε το εύρος, την μέση απόκλιση, τη διακύμανση του δείγματος, την τυπική απόκλιση του δείγματος Η διακύμανση σε ένα δείγμα Ν είναι 20. Ποια θα είναι η διακύμανση αν όλες οι τιμές πολλαπλασιαστούν με το 5 και αν διαιρεθούν με το 5;
Τυπικές τιμές Περιπτώσεις Χ x z Α 3 -7 -1,11 Β 6 -4 -0,63 Γ 7 -3 -0,47 Δ 9 -1 -0,16 Ε 15 5 0,79 Ζ 20 10 1,58 Άθροισμα 60 0,00 Μέσος όρος Τυπική απόκλιση (s) 6,32 1
Βαθμός s Ιστορία 65 8 Μαθηματικά 52 12 Τυπικές τιμές z Έστω ότι κάποιος πήρε 57 στην Ιστορία και 58 στα Μαθηματικά. Ο τυπικός βαθμός για την Ιστορία είναι 57-65)/8= -1,0 ενώ στα Μαθηματικά είναι (58-52)/12= 0,5.
Skewness and Kurtosis (Λοξότητα και Κύρτωση) 6 8 10 12 14 -4 -2 +2 +4 11 15 +1 +5
Ροπές
Skewness (Λοξότητα) -4 -2 +2 +4 -64 -8 +8 +64 +1 +5 +125
Ασκήσεις Δείξτε ότι Εκφράστε τις τιμές 2,4,5,6,8 σε τυπικές τιμές z. Πόσο είναι το άθροισμα των τετραγώνων των τυπικών τιμών; Ο μέσος όρος και η τυπική απόκλιση στη βαθμολογία στο μάθημα της Ιστορίας είναι 62 και 10 αντιστοίχως. Τρεις μαθητές βαθμολογήθηκαν με 50, 75 και 90 αντιστοίχως. Ποιες είναι οι τυπικές τιμές τους; Υπολογίστε την λοξότητα των δύο κατανομών: Ομάδα Α 2 3 5 10 20 Ομάδα Β 4 8 12 14