Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ"— Μεταγράφημα παρουσίασης:

1 ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Διασπορά – (διακύμανση, εύρος μεταβολής κλπ) μας πληροφορεί για τη διασπορά των δεδομένων συνήθως γύρω από τη μέση τιμή Ασυμμετρία μετράει το βαθμό της συμμετρίας των δεδομένων ως προς τη συχνότητά – κατανομή τους γύρω από τη μέση τιμή. Κύρτωση μετράει το βαθμό συγκέντρωσης των δεδομένων γύρω από τη μέση τιμή. Η κύρτωση δείχνει την αιχμηρότητα ή την πλάτυνση της κατανομής

2 Τα μέτρα διασποράς που θα εξετάσουμε είναι τα εξής:
α) Το εύρος μεταβολής, β) το ενδοτεταρτημοριακό εύρος, γ) η μέση απόκλιση, δ) η μέση απόκλιση τετραγώνου, ε) ο συντελεστής μεταβλητικότητας

3 Εύρος Μεταβολής Το Εύρος μεταβολής είναι
το απλούστερο μέτρο διασποράς υπολογίζεται ως η διαφορά μεταξύ της μεγαλύτερης και της μικρότερης τιμής Το Εύρος μεταβολής δεν θεωρείται αξιόπιστο γιατί εξαρτάται μόνο από τις δύο ακραίες τιμές των δεδομένων. αν διαφορά των ακραίων τιμών είναι πολύ μεγάλη, τότε και το εύρος θα είναι ανάλογο Χρήση. Π.χ. ΧΑΑ

4 Έστω οι παρακάτω παρατηρήσεις. Να βρεθεί το εύρος μεταβολής
52, 21, 31, 41, 23, 42, 44, 54, 55, 56, 57, 60, 61, 62, 64, 65, 66, 67, 68, 75, 74, 59, 85, 85, 84, 86, 90, 95 78, 87, 92, 93, 45, 89, 90

5 Ενδοτεταρτημοριακό Εύρος
Η απόσταση μεταξύ πρώτου και τρίτου τεταρτημόριου μας δίνει το ενδοτεταρτημοριακό εύρος, το οποίο συμβολίζεται με IQR.

6 Χ Εισόδημα Q1 13.928 Q2 18.549 Q3 23.918 Το 50% των τιμών των δεδομένων βρίσκεται σε ένα εύρος ευρώ. Με άλλα λόγια, οι μισοί από τους ανθρώπους που έχουμε στο δείγμα μας έχουν εισόδημα από ευρώ έως ευρώ.

7

8 Να βρεθεί το ενδοτεταρτημοριακό εύρος στα παρακάτω ταξινομημένα δεδομένα
Κλάσεις 1 – 3 1 3 – 5 4 5 – 7 5 7 – 9 6 9 – 11 Σύνολο 20

9

10 Κλάσεις 1 – 3 1 3 – 5 4 5 5 – 7 10 7 – 9 6 16 9 – 11 20 Σύνολο

11 Κλάσεις 1 – 3 1 3 – 5 4 5 5 – 7 10 7 – 9 6 16 9 – 11 20 Σύνολο

12 Κλάσεις 1 – 3 1 3 – 5 4 5 5 – 7 10 7 – 9 6 16 9 – 11 20 Σύνολο

13 Μέση Απόκλιση Η Μέση Απόκλιση (Μ. Α.) ορίζεται ως ο μέσος αριθμητικός των απόλυτων αποκλίσεων (διαφορών) των τιμών μιας μεταβλητής Χ από το μέσο αριθμητικό τους. Το άθροισμα των αποκλίσεων είναι ίσο με μηδέν, γι αυτό υπολογίζουμε το άθροισμα των απόλυτων αποκλίσεων

14 Μέση Απόκλιση Παράδειγμα: Έστω ότι έχουμε το εισόδημα 5 υπαλλήλων.
Παράδειγμα: Έστω ότι έχουμε το εισόδημα 5 υπαλλήλων. Χ: 1000, 900, 1300, 700, 800 Η μέση τιμή είναι 940 Υπολογίζουμε τις αποκλίσεις κάθε τιμής από τη μέση τιμή. Για παράδειγμα η πρώτη απόκλιση είναι ίση με: Αθροίζουμε τις αποκλίσεις, και υπολογίζουμε τη Μέση Απόκλιση ως εξής:

15 Μέση Απόκλιση Μ. Α. = 37 δρχ. Η τιμή Μ. Α. =37 σημαίνει ότι το ημερομίσθιο κάθε εργάτη αποκλίνει (διαφέρει), κατά μέσο όρο, από το μέσο ημερομίσθιο κατά 37 Η Μέση Απόκλιση πλεονεκτεί από τα δύο προηγούμενα μέτρα διασποράς (R και Q), γιατί λαμβάνει υπόψη όλες τις τιμές της μεταβλητής. Μειονεκτεί όμως, διότι δεν επιδέχεται αλγεβρικό χειρισμό,

16 Τυπική Απόκλιση και Διακύμανση
Το σημαντικότερο στατιστικό μέτρο διασποράς των τιμών μιας μεταβλητής Χ γύρω από το μέσο αριθμητικό τους είναι η Τυπική Απόκλιση Υπολογίζεται με την τετραγωνική ρίζα του μέσου αριθμητικού των τετραγώνων των αποκλίσεων των τιμών μιας μεταβλητής Χ από το μέσο αριθμητικό τους. Η τυπική απόκλιση συμβολίζεται με το σ στην περίπτωση του πληθυσμού και S στην περίπτωση του δείγματος

17 Τυπική απόκλιση και Διακύμανση
Το τετράγωνο της τυπικής απόκλισης, ονομάζεται διακύμανση και συμβολίζεται με σ2 για δεδομένα πληθυσμού S2 για δεδομένα δείγματος. Η τυπική απόκλιση εκφράζεται στις μονάδες που εκφράζεται και η υπό μελέτη μεταβλητή Χ, ενώ η διακύμανση εκφράζεται στο τετράγωνο της μεταβλητής Χ.

18 Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως
Όταν τα δεδομένα αφορούν πληθυσμό μ είναι ο μέσος του πληθυσμού και Ν το πλήθος των δεδομένων του πληθυσμού. Όταν τα δεδομένα αποτελούν ένα δείγμα

19 Από τις n αυτές αποκλίσεις μόνο οι n-1 είναι ανεξάρτητες,
Mε τον όρο "βαθμοί ελευθερίας" εννοούμε το πλήθος των στατιστικών δεδομένων, τα οποία διαμορφώνονται ελεύθερα χωρίς κανένα περιορισμό. Για τον υπολογισμό όμως της διακυμάνσεως ενός δείγματος προκύπτουν n αποκλίσεις Από τις n αυτές αποκλίσεις μόνο οι n-1 είναι ανεξάρτητες, γιατί η n-στή απόκλιση από το χ είναι καθορισμένη (περιορισμένη), διότι ο υπολογισμός του μέσου αριθμητικού αποτελεί ένα περιορισμό ότι άρα μόνο οι n - 1 αποκλίσεις είναι ανεξάρτητες (αδέσμευτες) επομένως, για τον υπολογισμό της διακυμάνσεως παραμένουν n-1 βαθμοί ελευθερίας.

20 Για τον πληθυσμό: Για το δείγμα:

21

22 Να βρεθεί η διακύμανση στο παρακάτω δείγμα:
1, 3, 5, 4

23

24 Παραδείγματα Για τον πληθυσμό:

25 Παραδείγματα

26 Να βρεθεί η διακύμανση 1 2 3 5 4

27 1 2 1*2=3 3 6 5 15 4 12 10

28 1 2 3 -1 5 4 8

29 Κλάσεις Συχνότητα f 0 – 10 2 10 – 20 3 20 – 30 5 30 – 40 40 – 50
Να βρεθεί η διακύμανση Κλάσεις Συχνότητα f 0 – 10 2 10 – 20 3 20 – 30 5 30 – 40 40 – 50 Σύνολο 15

30 Συντελεστής Μεταβλητότητας
H τυπική απόκλιση δεν δίνει τη δυνατότητα να αποφανθούμε για το εάν η διασπορά είναι μικρή ή μεγάλη. να συγκρίνουμε τη διασπορά κατανομών που μετριούνται σε διαφορετική κλίμακα να συγκρίνουμε τη διασπορά κατανομών τα οποία εκφράζονται σε διαφορετικές μονάδες. Λύση στο πρόβλημα αποτελεί η χρήση του συντελεστής μεταβλητότητας συμβολίζεται με CV Ο συντελεστής μεταβλητικότητας είναι καθαρός αριθμός (χωρίς μονάδες μετρήσεως)

31 Συντελεστής Μεταβλητικότητας
Για τον πληθυσμό έχουμε: Για το δείγμα: Ο συντελεστής μεταβλητότητας είναι η τυπική απόκλιση ως ποσοστό του μέσου. Είναι δυνατό να εκφράσουμε το συντελεστή μεταβλητότητας σε αριθμό και όχι σε ποσοστό.

32 Διαιρούμε την τυπική απόκλιση με το μέσο
μέτρα που είναι εκφρασμένα στις ίδιες φυσικές μονάδες. Για παράδειγμα, διαιρούμε κιλά με κιλά, ευρώ με ευρώ, κλπ. Επομένως, οι μονάδες εξαφανίζονται και ο συντελεστής μεταβλητότητας μένει ένα καθαρό ποσοστό (ή ένας καθαρός αριθμός). Π.χ. ζητούμε τη σύγκριση της τυπικής απόκλισης μιας κατανομής βαρών με μια αναστημάτων Πρόβλημα: Διαφορετικές μονάδες μέτρησης Λύση: Συντελεστής μεταβλητικότητας

33 Στο τέλος της χρονιάς οι φοιτητές έχουν
Σε ένα Τμήμα οι φοιτητές παρακολουθούν στατιστική και οικονομικά και υποβάλλονται σε εβδομαδιαία τεστ. Στο τέλος της χρονιάς οι φοιτητές έχουν μέσο όρο βαθμολογίας στη στατιστική 5,5 με τυπική απόκλιση 0,9 ενώ στα οικονομικά έχουν μέσο όρο 7,5 και τυπική απόκλιση 1,1. Σε ποιο μάθημα οι φοιτητές αποδίδουν με τη μικρότερη διασπορά (με μεγαλύτερη συνέπεια);

34 Απάντηση: Θα υπολογίσουμε τους συντελεστές μεταβλητότητας για τα δύο μαθήματα αντίστοιχα:
Στα οικονομικά υπάρχει μεγαλύτερη τυπική απόκλιση. Ωστόσο, προσέξτε ότι ο μέσος όρος στα οικονομικά είναι μεγαλύτερος από το μέσο όρο στη στατιστική.

35 Ο συντελεστής μεταβλητότητας στα οικονομικά είναι χαμηλότερος από ότι στην στατιστική,
γεγονός που σημαίνει ότι οι φοιτητές είναι περισσότερο συνεπείς στην απόδοσή τους στα οικονομικά σε σχέση με τη στατιστική. Η σχετική διασπορά στη στατιστική είναι μεγαλύτερη.

36 Να βρεθεί ποιο από τα δυο παρακάτω δείγματα προέρχεται από τον πληθυσμό που έχει τη μεγαλύτερη διασπορά με βάση το συντελεστή μεταβλητότητας. Υ: 1, 6, 9, 4 X: 101 , 104, 102, 103

37 1 6 9 4 16 -1

38 101 104 1,5 2,25 102 -0,5 0,25 103 0,5

39 Παρατηρούμε ότι η εκτίμηση του δείκτη μεταβλητότητας για τον πρώτο πληθυσμό (με βάση το πρώτο δείγμα) είναι πολύ υψηλότερη, γεγονός που οφείλεται όχι μόνο στη διασπορά των δεδομένων (αποκλίσεις από τη μέση τιμή είναι μεγαλύτερες στο πρώτο δείγμα), αλλά και στο μικρό κατ’ απόλυτη τιμή μέγεθος της μέσης τιμής (είναι 5 ενώ στο δεύτερο δείγμα 102,5).

40 ΜΕΤΡΑ ΑΣΥΜΜΕΤΡΙΑΣ Για να περιγραφεί ικανοποιητικά μια κατανομή συχνοτήτων απαιτείται ο προσδιορισμός τεσσάρων βασικών στατιστικών παραμέτρων: i) Κεντρική Τάση ii) Διασπορά, iii) Ασυμμετρία και iv) Κύρτωση Η ασυμμετρία (skewness) δείχνει πόσο συμμετρικά γύρω από το μέσο κατανέμονται οι παρατηρήσεις, τα δεδομένα μας.

41 ΣΥΝΤΕΛΕΣΤΗΣ ΑΣΥΜΜΕΤΡΙΑΣ
Απλά δεδομένα - Ασυμμετρία πληθυσμού Απλά δεδομένα - Ασυμμετρία δείγματος

42

43

44

45

46

47 Να βρεθεί η ασυμμετρία στο παρακάτω δείγμα
Χ 1 2 12  15

48 Χ 1 -4 16 -64 2 -3 9 -27 12 7 49 343  15 74 252

49 Στη διεθνή βιβλιογραφία χρησιμοποιούνται διάφορες παραλλαγές του προηγούμενου τύπου με σκοπό την κατά το δυνατό καλύτερη προσέγγιση της πραγματικής ασυμμετρίας του πληθυσμού. Μο είναι η επικρατούσα τιμή και Μd είναι η διάμεσος

50 G=0 ή μ3=0 Συμμετρική

51 G>0 ή μ3>0 Θετική Ασυμμετρία

52 G<0 ή μ3<0 Αρνητική Ασυμμετρία

53 Να βρεθεί ο συντελεστής Pearson

54

55 Να βρεθεί η ασυμμετρία 1 2 3 5 4

56 1 2 1*2=3 3 6 5 15 4 12 10

57 1 2 3 -1 5 4 8

58 1 2 3 -1 -3 5 4 8 16

59 ΚΥΡΤΩΣΗ Δύο ή περισσότερες κατανομές συχνοτήτων να έχουν
τον ίδιο μέσο αριθμητικό, την ίδια τυπική απόκλιση και να είναι συμμετρικές, αλλά να διαφέρουν ως προς την κύρτωση, δηλαδή ως προς την συγκέντρωση των παρατηρήσεων γύρω από το μέσο – αιχμηρότητα της κορυφής Η κύρτωση (kurtosis) δείχνει κατά πόσο τα δεδομένα της κατανομής σχηματίζουν έντονη κορυφή στο μέσο τους.

60 ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ Απλά δεδομένα - Κύρτωση πληθυσμού
Απλά δεδομένα - Κύρτωση δείγματος

61 ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ Ομαδοποιημένα - Κύρτωση πληθυσμού
Ομαδοποιημένα – Κύρτωση δείγματος

62 Κατανομές συχνοτήτων που οι τιμές τους διασπείρονται πάρα πολύ αριστερά και δεξιά του μέσου αριθμητικού χαρακτηρίζονται ως πλατύκυρτες και έχουν συντελεστή K< (Excel K<0)

63

64 Οι "Κανονικές Κατανομές" που οι τιμές μιας μεταβλητής ισοκατανέμονται αριστερά και δεξιά του μέσου αριθμητικού χαρακτηρίζονται ως Μεσόκυρτες K= (Excel K=0)

65

66 Τέλος, κατανομές συχνοτήτων που παρουσιάζουν μεγάλη συγκέντρωση τιμών στην περιοχή του μέσου αριθμητικού χαρακτηρίζονται ως Λεπτόκυρτες και έχουν K>3 (Excel K>0)

67

68

69 Να βρεθεί η κύρτωση στον πληθυσμό:
Χ: 5, 0, 1, 2, 1, 4, 1

70 5 3 9 81 -2 4 16 1 -1 2

71 5 3 9 81 -2 4 16 1 -1 2

72 5 3 9 81 -2 4 16 1 -1 2

73 5 3 9 81 -2 4 16 1 -1 2

74 5 3 9 81 -2 4 16 1 -1 2

75 Να υπολογιστεί η διακύμανση στο παρακάτω δείγμα: Χ: 1, 2, 3

76 1 -1 2 3

77 1 -1 2 3

78 1 -1 2 3

79 Να βρεθεί η κύρτωση

80 Να βρεθεί η κύρτωση

81 Πλατύκυρτη


Κατέβασμα ppt "ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google