Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

1 1 Slide Περιγραφική Στατιστική: Μετρήσεις Κεντρικής Τάσης, Διασποράς και Συσχέτισης.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "1 1 Slide Περιγραφική Στατιστική: Μετρήσεις Κεντρικής Τάσης, Διασποράς και Συσχέτισης."— Μεταγράφημα παρουσίασης:

1 1 1 Slide Περιγραφική Στατιστική: Μετρήσεις Κεντρικής Τάσης, Διασποράς και Συσχέτισης

2 2 2 Slide Μετρήσεις Κεντρικής Τάσης n Μέσος n Διάμεσος n Επικρατούσα Τιμή n Εκατοστημόρια n Τερταρτημόρια

3 3 3 Slide Παράδειγμα: Ενοίκια Διαμερισμάτων Ο πίνακας περιέχει ένα δείγμα μηνιαίων ενοικίων για δυάρια. Το δείγμα αποτελείται από 70 διαμερίσματα σε μία συγκεκριμένη πόλη. Τα στοιχεία έχουν ταξινομηθεί σε αύξουσα σειρά

4 4 4 Slide Μέσος n Ο μέσος είναι απλά ο μέσος όρος όλων των παρατηρήσεων. n Αν τα στοιχεία προέρχονται από δείγμα, ο μέσος ισούται με: n Αν τα στοιχεία προέρχονται από τον πληθυσμό, ο μέσος υποδηλώνεται με μ και ισούται με:

5 5 5 Slide

6 6 6 Διάμεσος n Η διάμεσος ενός συνόλου στοιχείων είναι η τιμή στο μέσον αυτού του συνόλου αφού τα δεδομένα ταξινομηθούν με αύξουσα σειρά n Αν ο αριθμός των παρατηρήσεων είναι περιττός, η διάμεσος είναι η τιμή της παρατήρησης που βρίσκεται ακριβώς στη μέση n Αν ο αριθμός των παρατηρήσεων είναι άρτιος, η διάμεσος είναι ο μέσος όρος των δύο μεσαίων παρατηρήσεων

7 7 7 Slide Βρίσκουμε το μέσο όρο της 35 ης και της 36 ης παρατήρησης Βρίσκουμε το μέσο όρο της 35 ης και της 36 ης παρατήρησης Διάμεσος = ( )/2 = 475

8 8 8 Slide n Η Επικρατούσα Τιμή ενός συνόλου παρατηρήσεων είναι η τιμή που εμφανίζεται με τη μεγαλύτερη συχνότητα Η τιμή 450 εμφανίζεται πιο συχνά (7 φορές) Η τιμή 450 εμφανίζεται πιο συχνά (7 φορές) Επικρατούσα Τιμή = 450 Επικρατούσα Τιμή

9 9 9 Slide Εκατοστημόρια n Το p th εκατοστημόριο ενός συνόλου στοιχείων είναι μία τιμή τέτοια ώστε τουλάχιστον το p% των παρατηρήσεων είναι ίσα ή μικρότερα με την τιμή αυτή και τουλάχιστον (100-p)% είναι ίσα ή μεγαλύτερα. •Ταξινομούμε τα στοιχεία σε αύξουσα σειρά. •Υπολογίζουμε τη θέση i που είναι η θέση του p th εκατοστημορίου i = (p/100)n i = (p/100)n •Αν το i δεν είναι ακέραιος, στρογγυλοποιούμε προς τα πάνω. Το p th εκατοστημόριο είναι η τιμή στη θέση i. •Αν το ι είναι ακέραιος το p th εκατοστημόριο είναι ο μέσος όρος των θέσεων i και i+1.

10 10 Slide n Ενενηκοστό εκατοστημόριο: i = (p/100)n = (90/100)70 = 63 Παίρνουμε το μέσο όρο της 63 ης και της 64 ης θέσης: 90ο εκατοστημόριο = ( )/2 = 585

11 11 Slide Τεταρτημόρια n Τα τεταρτημόρια είναι συγκεκριμένα εκατοστημόρια n 1ο Τεταρτημόριο = 25ο Εκατοστημόριο n 2ο Τεταρτημόριο = 50ο Εκατοστημόριο = Διάμεσος n 3ο Τεταρτημόριο = 75ο Εκατοστημόριο

12 12 Slide n Τρίτο Τεταρτημόριο Τρίτο Τεταρτημόριο = 75ο εκατοστημόριο i = (p/100)n = (75/100)70 = 52.5 = 53 Τρίτο τεταρτημόριο = 525

13 13 Slide Μετρήσεις Διασποράς n Εύρος n Ενδοτεταρτημοριακή Απόκλιση n Διακύμανση n Τυπική Απόκλιση n Συντελεστής Μεταβλητότητας

14 14 Slide Εύρος n Το Εύρος ενός συνόλου παρατηρήσεων είναι η διαφορά μεταξύ της μεγαλύτερης και της μικρότερης τιμής n Το εύρος είναι το πιο απλό μέσο διασποράς n Το εύρος όμως είναι και πολύ ευαίσθητο σε πολύ μικρές και πολύ μεγάλες τιμές

15 15 Slide Εύρος = Μεγαλύτερη Τιμή – Μικρότερη Τιμή Εύρος = = 190

16 16 Slide Ενδοτεταρτημοριακή Απόκλιση n Η Ενδοτεταρτημοριακή Απόκλιση είναι η διαφορά μεταξύ του 3ου και του πρώτου τεταρτημορίου n Περιέχει το μεσαίο 50% των στοιχείων n Λύνει το πρόβλημα της ευαισθησίας σε ακραίες τιμές

17 17 Slide 3ο Τεταρτημόριο (Q3) = 525 1ο Τεταρτημόριο (Q1) = 445 Ενδοτεταρτημοριακή Απόκλιση = Q3 - Q1 = = 80

18 18 Slide Διακύμανση n Η διακύμανση είναι ο μέσος όρος των τετραγωνικών αποκλίσεων από το μέσο n Αν οι παρατηρήσεις προέρχονται από δείγμα η διακύμανση δηλώνεται με s 2. n Αν οι παρατηρήσεις προέρχονται από τον πληθυσμό η διακύμανση δηλώνεται με σ 2.

19 19 Slide Τυπική Απόκλιση n Η Τυπική Απόκλιση είναι η τετραγωνική ρίζα της Διακύμανσης. n Η Τυπική Απόκλιση μετριέται στις ίδιες μονάδες που μετριούνται και οι παρατηρήσεις και επομένως είναι πιο εύκολα συγκρίσιμη με το μέσο από ότι η διακύμανση n Αν οι παρατηρήσεις προέρχονται από δείγμα, η Τυπική Απόκλιση δηλώνεται με s. n Αν οι παρατηρήσεις προέρχονται από τον πληθυσμό η Τυποκή Απόκλιση δηλώνεται με σ.

20 20 Slide Συντελεστής Μεταβλητότητας n Ο συντελεστής μεταβλητότητας δείχνει πόσο μεγάλη είναι η Τυπική Απόκλιση σε σχέση με το Μέσο n Αν τα στοιχεία προέρχονται από δείγμα, ο Συντελεστής Μεταβλητότητας υπολογίζεται ως εξής: n Αν τα στοιχεία προέρχονται από τον πληθυσμό, ο Συντελεστής Μεταβλητότητας υπολογίζεται ως εξής:

21 21 Slide n Διακύμανση n Τυπική Απόκλιση n Συντελεστής Μεταβλητότητας

22 22 Slide Μετρήσεις Σχετικής Θέσης και Εντοπισμός Ακραίων Τιμών n Τιμή z n Θεώρημα Chebyshev n Ο εμπειρικός Κανόνας n Εντοπισμός Ακραίων ΤΙμών

23 23 Slide Τιμές z n Η τιμή z ονομάζεται και κανονικοποιημένη. n Δηλώνει την απόσταση μιας τιμής από το μέσο σε όρους τυπικής απόκλισης n Μία τιμή μικρότερη από το μέσο έχει τιμή z αρνητική n Μία τιμή μεγαλύτερη από το μέσο έχει τιμή z θετική n Μία τιμή που ισούται με το μέσο έχει τιμή z μηδέν

24 24 Slide n Τιμή z για τη μικρότερη τιμή του δείγματος (425) Κανονικοποιημένες Τιμές για τα Ενοίκια

25 25 Slide Ο Εμπειρικός Κανόνας Για ομάδες δεδομένων που είναι κατανεμημένες κανονικά: •Περίπου το 68% των παρατηρήσεων βρίσκονται σε απόσταση μίας τυπικής απόκλισης από το μέσο •Περίπου το 95% των παρατηρήσεων βρίσκονται σε απόσταση δύο τυπικών αποκλίσεων από το μέσο •Σχεδόν όλες οι παρατηρήσεις βρίσκονται σε απόσταση τριών τυπικών αποκλίσεων από το μέσο

26 26 Slide % παρατηρήσεων % παρατηρήσεων Διάστημαστο διάστημα +/- 1s to /70 = 69% +/- 1s to /70 = 69% +/- 2s to /70 = 97% +/- 2s to /70 = 97% +/- 3s to /70 = 100% +/- 3s to /70 = 100%

27 27 Slide Εντοπισμός Ακραίων Τιμών n Ακραία Τιμή θεωρείται μία εξαιρετικά μικρή ή εξαιρετικά μεγάλη παρατήρηση n Μία παρατήρηση με τιμή z μεγαλύτερη του 3 ή μικρότερη του -3 μπορεί να θεωρηθεί ακραία n Μπορεί η παρατήρηση να καταγράφηκε λάθος n Μπορεί η παρατήρηση να εισήχθη κατά λάθος στο συγκεκριμένο σύνολο δεδομένων n Μπορεί απλά να είναι σωστή αλλά όντως ακραία

28 28 Slide Οι πιο ακραίες τιμές z στο παράδειγμα είναι και 2.27 Χρησιμοποιώντας το κριτήριο |z|≥3, καταλήγουμε στο συμπέρασμα πως δεν υπάρχουν ακραίες τιμές στο δείγμα των ενοικιαζόμενων δωματίων Κανονικοποιημένες Τιμές για τα Ενοίκια

29 29 Slide Θεώρημα Chebyshev Τουλάχιστον (1-1/κ 2 ) παρατηρήσεις σ’ ένα σύνολο δεδομένων θα βρίσκεται σε απόσταση κ τυπικών αποκλίσεων από το μέσο, όπου κ οποιοσδήποτε αριθμός μεγαλύτερος του 1. Τουλάχιστον (1-1/κ 2 ) παρατηρήσεις σ’ ένα σύνολο δεδομένων θα βρίσκεται σε απόσταση κ τυπικών αποκλίσεων από το μέσο, όπου κ οποιοσδήποτε αριθμός μεγαλύτερος του 1. •Τουλάχιστον το 75% των παρατηρήσεων πρέπει να βρίσκονται σε απόσταση κ=2 τυπικών αποκλίσεων από το μέσο •Τουλάχιστον το 89% των παρατηρήσεων πρέπει να βρίσκονται σε απόσταση κ=3 τυπικών αποκλίσεων από το μέσο •Τουλάχιστον το 94% των παρατηρήσεων πρέπει να βρίσκονται σε απόσταση κ=4 τυπικών αποκλίσεων από το μέσο Τουλάχιστον (1-1/κ 2 ) παρατηρήσεις σ’ ένα σύνολο δεδομένων θα βρίσκεται σε απόσταση κ τυπικών αποκλίσεων από το μέσο, όπου κ οποιοσδήποτε αριθμός μεγαλύτερος του 1. Τουλάχιστον (1-1/κ 2 ) παρατηρήσεις σ’ ένα σύνολο δεδομένων θα βρίσκεται σε απόσταση κ τυπικών αποκλίσεων από το μέσο, όπου κ οποιοσδήποτε αριθμός μεγαλύτερος του 1. •Τουλάχιστον το 75% των παρατηρήσεων πρέπει να βρίσκονται σε απόσταση κ=2 τυπικών αποκλίσεων από το μέσο •Τουλάχιστον το 89% των παρατηρήσεων πρέπει να βρίσκονται σε απόσταση κ=3 τυπικών αποκλίσεων από το μέσο •Τουλάχιστον το 94% των παρατηρήσεων πρέπει να βρίσκονται σε απόσταση κ=4 τυπικών αποκλίσεων από το μέσο

30 30 Slide Μετρήσεις Συσχέτισης Μεταξύ Δύο Μεταβλητών n Συντελεστής Συσχέτισης

31 31 Slide Τρεις περιπτώσεις συσχέτισης r < 0r > 0 r = 0

32 32 Slide n Ο Συντελεστής Συσχέτισης παίρνει τιμές μεταξύ -1 και 1. n Ο Συντελεστής Συσχέτισης δεν δείχνει αιτιότητα n Τιμές κοντά στο -1 δείχνουν ισχυρή αρνητική συσχέτιση n Τιμές κοντά στο 1 δείχνουν ισχυρή θετική συσχέτιση n Αν τα δεδομένα προέρχονται από δείγμα ο συντελεστής είναι r xy. n Αν τα δεδομένα προέρχονται από τον πληθυσμό ο συντελεστής είναι ρ xy

33 33 Slide Συντελεστής Συσχέτiσης Pearson

34 34 Slide Σταθμικός Μέσος και Περιγραφική Στατιστική για Ομαδοποιημένα Στοιχεία n Σταθμικός Μέσος n Μέσος για ομαδοποιημένα Δεδομένα n Διακύμανση για ομαδοποιημένα Δεδομένα n Τυπική Απόκλιση για Ομαδοποιημένα Δεδομένα

35 35 Slide Σταθμικός Μέσος n Όταν ο μέσος υπολογίζεται αφού έχει δοθεί στην κάθε παρατήρηση βάρος ανάλογος της σημαντικότητάς της, ονομάζεται Σταθμικός Μέσος n Όταν οι παρατηρήσεις ενός δείγματος ή ενός πληθυσμού διαφέρουν όσον αφορά τη σημαντικότητά τους, ο αναλυτής πρέπει να διαλέξει προσεκτικά και τον ανάλογο συντελεστή στάθμισης (μπορούμε να φανταστούμε το συντελεστή στάθμισης σαν το ειδικό βάρος της κάθε παρατήρησης)

36 36 Slide x wt =  w i x i x wt =  w i x i  w i  w i όπου: x i = η τιμή της παρατήρησης i x i = η τιμή της παρατήρησης i w i = ο συντελεστής στάθμισης της παρατήρησης i.

37 37 Slide Ομαδοποιημένα Δεδομένα n Ο Σταθμικός Μέσος μπορεί να χρησιμοποιηθεί για να προσεγγίσουμε το Μέσο, τη Διακύμανση και την Τυπική Απόκλιση ομαδοποιημένων δεδομένων n Για τον υπολογισμό του Σταθμικού Μέσου χρησιμοποιούμε τον Κεντρικό Όρο του κάθε διαστήματος ως το μέσο όλου του διαστήματος n Υπολογίζουμε το Σταθμικό Μέσο των Κεντρικών Όρων χρησιμοποιώντας τη συχνότητα του κάθε διαστήματος ως συντελεστή στάθμισης n Παρομοίως, υπολογίζουμε τη Διακύμανση και την Τυπική Απόκλιση χρησιμοποιώντας τη συχνότητα του κάθε διαστήματος ως συντελεστή στάθμισης

38 38 Slide Μέσος για Ομαδοποιημένα Στοιχεία n Δείγμα n Πληθυσμός όπου: f i = η συχνότητα του διαστήματος i f i = η συχνότητα του διαστήματος i M i = ο Κεντρικός Όρος του Διαστήματος i

39 39 Slide Ο πίνακας περιλαμβάνει τα ενοίκια του προηγούμενου παραδείγματος ομαδοποιημένα σε κατανομή συχνοτήτων

40 40 Slide n Μέσος Η διαφορά του Σταθμικού από τον απλό Μέσο είναι μόλις 2.41 Ευρώ

41 41 Slide Διακύμανση για Ομαδοποιημένα Δεδομένα n Δείγμα n Πληθυσμός

42 42 Slide n Διακύμανση n Τυπική Απόκλιση Η προσέγγιση διαφέρει από την απλή Τυπική Απόκλιση μόνον κατά 0.20 Ευρώ


Κατέβασμα ppt "1 1 Slide Περιγραφική Στατιστική: Μετρήσεις Κεντρικής Τάσης, Διασποράς και Συσχέτισης."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google