ΚΕΦΑΛΑΙΟ 3 Περιγραφική Στατιστική © 2002 Thomson / South-Western
Στόχοι του Μαθήματος Διάκριση μεταξύ μέτρων κεντρικής τάσης, μέτρων διασποράς και μέτρων σχήματος κατανομής. Κατανόηση της σημασίας του μέσου, της διαμέσου και της επικρατούσας τιμής, του τεταρτημορίου, του εκατοστημορίου και του εύρους. Υπολογισμός μέσου, διαμέσου, επικρατούσας τιμής, τεταρτημορίου, εκατοστημορίου, εύρους, διακύμανσης, τυπικής απόκλισης και μέσης απόλυτης απόκλισης. © 2002 Thomson / South-Western
Στόχοι του Μαθήματος-Συνέχεια Διάκριση μεταξύ δειγματικής και πληθυσμιακής διακύμανσης και τυπικής απόκλισης. Κατανόηση της σημασίας της τυπικής απόκλισης όπως αυτή εφαρμόζεται χρησιμοποιώντας τον εμπειρικό κανόνα. Κατανόηση του θηκογράμματος, της ασυμμετρίας και της κύρτωσης. © 2002 Thomson / South-Western
Μέτρα Κεντρικής Τάσης Τα Μέτρα Κεντρικής Τάσης παρέχουν πληροφορίες για ‘συγκεκριμένες θέσεις ή τοποθεσίες ενός συνόλου αριθμών’. Κοινά μέτρα θέσης της κατανομής Επικρατούσα Τιμή Διάμεσος Μέσος Εκατοστημόρια Τεταρτημόρια © 2002 Thomson / South-Western
Επικρατούσα Τιμή Η πιο συχνά εμφανιζόμενη τιμή σε ένα σύνολο δεδομένων. Εφαρμόζεται σε όλα τα επίπεδα μέτρησης δεδομένων (ονομαστικά, διατάξιμα, διαστηματικής κλίμακας και κλίμακας λόγου). Bimodal – Δεδομένα που εμφανίζουν 2 επικρατούσας τιμές. Multimodal – Δεδομένα που περιλαμβάνουν περισσότερες από 2 επικρατούσας τιμές. © 2002 Thomson / South-Western
Επικρατούσα Τιμή- Παράδειγμα Η επικρατούσα τιμή είναι 44. Η τιμή 44 εμφανίζεται περισσότερες φορές από οποιαδήποτε άλλη τιμή. 35 37 39 40 41 43 44 45 46 48 © 2002 Thomson / South-Western
Διάμεσος Είναι η ενδιάμεση τιμή σε ένα διατεταγμένο σύνολο αριθμών. Εφαρμόζεται στα διατάξιμα δεδομένα, στα δεδομένα διαστηματικής κλίμακας και κλίμακας λόγου. Δεν εφαρμόζεται στα ονομαστικά δεδομένα. Δεν επηρεάζεται από τις υπερβολικά υψηλές και από τις υπερβολικά χαμηλές τιμές. © 2002 Thomson / South-Western
Διάμεσος: Υπολογιστική Λειτουργία Πρώτη Λειτουργία Τοποθέτηση των παρατηρήσεων σε ένα διατεταγμένο σύνολο. Αν ο αριθμών των στοιχείων είναι μονός, η διάμεσος είναι το μέσο στοιχείο του διατεταγμένου συνόλου. Αν ο αριθμών των στοιχείων είναι ζυγός, η διάμεσος είναι ο μέσος όρος των δυο μέσων στοιχείων. Δεύτερη Λειτουργία Η θέση της διαμέσου σε ένα διατεταγμένο σύνολο δίνεται από (n+1)/2. © 2002 Thomson / South-Western
Διάμεσος: Παράδειγμα με μονό αριθμό στοιχείων Διάμεσος: Παράδειγμα με μονό αριθμό στοιχείων Το διατεταγμένο σύνολο περιλαμβάνει: 3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21 22 Υπάρχουν 17 στοιχεία στο διατεταγμένο σύνολο. Θέση της Διαμέσου = (n+1)/2 = (17+1)/2 = 9 Η διάμεσος είναι το 9ο στοιχείο, δηλ. το15. Αν το 22 αντικατασταθεί από το 100, η διάμεσος παραμένει το 15. Αν το 3 αντικατασταθεί από το -103, η διάμεσος παραμένει το 15. © 2002 Thomson / South-Western
Μέσος Είναι ο μέσος όρος μιας ομάδας αριθμών. Εφαρμόζεται στα δεδομένα διαστηματικής κλίμακας και κλίμακας λόγου, δεν εφαρμόζεται στα ονομαστικά ή διατάξιμα δεδομένα. Επηρεάζεται από κάθε παρατήρηση, περιλαμβανομένων και των υπερβολικών τιμών. Υπολογίζεται αθροίζοντας όλες τις παρατηρήσεις και διαιρώντας με τον αριθμό τους. © 2002 Thomson / South-Western
Πληθυσμιακός Μέσος © 2002 Thomson / South-Western
Δειγματικός Μέσος © 2002 Thomson / South-Western
Τεταρτημόρια Q1: 25% των δεδομένων ανήκει στο πρώτο τεταρτημόριο. Είναι Μέτρα Κεντρικής Τάσης που χωρίζουν το σύνολο των δεδομένων σε 4 υποσύνολα. Q1: 25% των δεδομένων ανήκει στο πρώτο τεταρτημόριο. Q2: 50% των δεδομένων ανήκει στο δεύτερο τεταρτημόριο Q3: 75% των δεδομένων ανήκει στο τρίτο τεταρτημόριο © 2002 Thomson / South-Western
Τεταρτημόρια-Συνέχεια Το Q1 είναι ίσο με το 25ο εκατοστημόριο Το Q2 τοποθετείται στο 50ο εκατοστημόριο και είναι ίσο με τη διάμεσο Το Q3 είναι ίσο με το 75ο εκατοστημόριο Οι τιμές των τεταρτημορίων δεν είναι αναγκαστικά κομμάτι των δεδομένων. © 2002 Thomson / South-Western
Τεταρτημόρια 25% Q3 Q2 Q1 © 2002 Thomson / South-Western
Τεταρτημόρια: Παράδειγμα Τεταρτημόρια: Παράδειγμα Διατεταγμένο σύνολο: 106, 109, 114, 116, 121, 122, 125, 129 Q1: Q2: Q3: © 2002 Thomson / South-Western
Μέτρα Διασποράς Τα Μέτρα Διασποράς περιγράφουν την απόκλιση ή την διασπορά ενός συνόλου δεδομένων. Κοινά Μέτρα Διασποράς Εύρος Ενδοτεταρτημοριακό Εύρος Μέση Απόλυτη Απόκλιση Διακύμανση Τυπική Απόκλιση Z scores Συντελεστής Μεταβλητότητας © 2002 Thomson / South-Western
Μεταβλητότητα Μη Μεταβλητότητα των Χρηματορροών Μέσος Μέσος Mean Mean © 2002 Thomson / South-Western
Μεταβλητότητα Μεταβλητότητα Μη Μεταβλητότητα © 2002 Thomson / South-Western
Εύρος Η διαφορά μεταξύ της υψηλότερης και της χαμηλότερης τιμής σε ένα σύνολο δεδομένων. Εύκολο να υπολογιστεί. Αγνοεί όλα τα στοιχεία των δεδομένων εκτός από τις τιμές που βρίσκονται στα 2 άκρα. Παράδειγμα: Εύρος = = Υψηλότερη-Χαμηλότερη τιμή = 48 - 35 = 13 35 37 39 40 41 43 44 45 46 48 © 2002 Thomson / South-Western
Ενδοτεταρτημοριακό Εύρος Εύρος τιμών μεταξύ του πρώτου και του τρίτου τεταρτημορίου. Εύρος του “middle half”. Λιγότερο επηρεασμένο από τις ακραίες τιμές. © 2002 Thomson / South-Western
Απόκλιση από το μέσο Παρατηρήσεις: 5, 9, 16, 17, 18 Μέσος: Παρατηρήσεις: 5, 9, 16, 17, 18 Μέσος: Αποκλίσεις από το μέσο: -8, -4, 3, 4, 5 -8 -4 +3 +4 +5 © 2002 Thomson / South-Western
Μέση Απόλυτη Απόκλιση Μέσος όρος των απόλυτων αποκλίσεων από τον μέσο. 5 9 16 17 18 -8 -4 +3 +4 +5 +8 24 © 2002 Thomson / South-Western
Πληθυσμιακή Διακύμανση Μέσος όρος τετραγωνικών αποκλίσεων από τον αριθμητικό μέσο. 5 9 16 17 18 -8 -4 +3 +4 +5 64 25 130 © 2002 Thomson / South-Western
Πληθυσμιακή Τυπική Απόκλιση Τετραγωνική ρίζα της διακύμανσης 5 9 16 17 18 -8 -4 +3 +4 +5 64 25 130 © 2002 Thomson / South-Western
Εμπειρικός Κανόνας Τα δεδομένα ακολουθούν την κανονική κατανομή (ή κατά προσέγγιση κανονική) 95 99.7 68 Απόσταση από το μέσο Ποσοστό των τιμών που βρίσκεται πλησίον του μέσου © 2002 Thomson / South-Western
Δειγματική Διακύμανση Μέσος όρος των τετραγωνικών αποκλίσεων από τον αριθμητικό μέσο. 2,398 1,844 1,539 1,311 7,092 625 71 -234 -462 390,625 5,041 54,756 213,444 663,866 © 2002 Thomson / South-Western
Δειγματική Τυπική Απόκλιση Τετραγωνική ρίζα της δειγματικής διακύμανσης 2,398 1,844 1,539 1,311 7,092 625 71 -234 -462 390,625 5,041 54,756 213,444 663,866 © 2002 Thomson / South-Western
Συντελεστής Μεταβλητότητας Εύρος της τυπικής απόκλισης από το μέσο, εκφρασμένο ως ποσοστό. Μέτρο της σχετικής διασποράς. © 2002 Thomson / South-Western
Συντελεστής Μεταβλητότητας © 2002 Thomson / South-Western
Μέτρα Σχήματος Ασυμμετρία Απουσία συμμετρίας Ακραίες τιμές στη μια πλευρά της κατανομής Κύρτωση Κορυφή μιας κατανομής Θηκόγραμμα Γραφική απεικόνιση μιας κατανομής Αποκαλύπτει ασυμμετρία © 2002 Thomson / South-Western
Ασυμμετρία Αρνητική Ασυμμετρία Θετική Ασυμμετρία Συμμετρία © 2002 Thomson / South-Western
Ασυμμετρία Αρνητική Συμμετρία Θετική Ασυμμετρία Μέσος Επικρατούσα Τιμή Διάμεσος Μέσος Συμμετρία Επικρατούσα Τιμή Θετική © 2002 Thomson / South-Western
Συντελεστής Ασυμμετρίας Συνοπτικό μέτρο ασυμμετρίας Αν S < 0, η κατανομή είναι αρνητικά ασύμμετρη (ασύμμετρη στα αριστερά). Αν S = 0, η κατανομή είναι συμμετρική (όχι ασύμμετρη). Αν S > 0, η κατανομή είναι θετικά ασύμμετρη (ασύμμετρη στα δεξιά). © 2002 Thomson / South-Western
Συντελεστής Ασυμμετρίας © 2002 Thomson / South-Western
Κύρτωση Κορυφή μιας κατανομής Λεπτόκυρτη: ψηλή και λεπτή Λεπτόκυρτη: ψηλή και λεπτή Μεσόκυρτη κανονική στο σχήμα Πλατύκυρτη: επίπεδη και εξαπλωμένη προς τα έξω Λεπτόκυρτη Μεσόκυρτη Πλατόκυρτη © 2002 Thomson / South-Western
Θηκόγραμμα Χρησιμοποιούνται 5 συγκεκριμένες τιμές: Διάμεσος, Q2 Ελάχιστη τιμή στο σύνολο δεδομένων Μέγιστη τιμή στο σύνολο δεδομένων © 2002 Thomson / South-Western
Θηκόγραμμα-Συνέχεια Εσωτερικά Όρια IQR = Q3 - Q1 Χαμηλότερο εσωτερικό όριο = Q1 - 1.5 IQR Υψηλότερο εσωτερικό όριο = Q3 + 1.5 IQR Εξωτερικά Όρια Χαμηλότερο εξωτερικό όριο = Q1 - 3.0 IQR Υψηλότερο εξωτερικό όριο = Q3 + 3.0 IQR © 2002 Thomson / South-Western
Θηκόγραμμα Q1 Q3 Q2 Ελάχιστη τιμή Μέγιστη τιμή © 2002 Thomson / South-Western
Ασυμμετρία: Θηκογράμματα και Συντελεστής Ασυμμετρίας Ασυμμετρία: Θηκογράμματα και Συντελεστής Ασυμμετρίας Αρνητική Ασυμμετρία Θετική Συμμετρία S < 0 S = 0 S > 0 © 2002 Thomson / South-Western