ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Περιγραφική Στατιστική
Advertisements

Άλλες Στατιστικές Παλινδρόμησης
Μετρήσεις Κεντρικής Τάσης
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
Στατιστική Ι Παράδοση 6 Η Κανονική Κατανομή
ΚΕΦΑΛΑΙΟ 3 Περιγραφική Στατιστική
Στατιστική I Χειμερινό Γ. Παπαγεωργίου
ΚΕΦΑΛΑΙΟ 6 ΓΕΩΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ: ΣΗΜΕΙΑ
Ανάλυση Ποσοτικών Δεδομένων Στατιστική
ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ ΔΙΑΚΡΙΤΩΝ ΚΑΙ ΣΥΝΕΧΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ
Πηγή: Βιοστατιστική [Β.Γ. Σταυρινός, Δ.Β. Παναγιωτάκος]
ΣΤΑΤΙΣΤΙΚΗ Η επιστήμη που ασχολείται με την συλλογή δεδομένων,ανάλυση και ερμηνεία αυτών Η επιστήμη με τη χρήση της οποίας λαμβάνουμε αποφάσεις κάτω από.
Εισαγωγή Στατιστική είναι η επιστήμη που με τη βοήθεια επιστημινκών μεθόδων ασχολείται με τη συλλογή, οργάνωση, παρουσίαση και ανάλυση αριθμητικών στοιχείων.
ΣΤΑΤΙΣΤΙΚΗ ΕΠΑΓΩΓΗ: ΣΗΜΕΙΑΚΕΣ ΕΚΤΙΜΗΣΕΙΣ & ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ
Τι είναι η Κατανομή (Distribution)
Διάλεξη  Μέτρηση: Είναι μια διαδικασία κατά την οποία προσδίδουμε αριθμητικά δεδομένα σε κάποιο αντικείμενο, σύμφωνα με κάποια προκαθορισμένα.
Στατιστική – Πειραματικός Σχεδιασμός Βασικά. Πληθυσμός – ένα μεγάλο σετ από Ν παρατηρήσεις (πιθανά δεδομένα) από το οποίο το δείγμα λαμβάνεται. Δείγμα.
Στατιστικά περιγραφικά μέτρα Παναγιώταρου Αλίκη Τμήμα Νοσηλευτικής 5η Διάλεξη.
ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 1: Περιγραφική Στατιστική Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και.
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή β) για ένα ποσοστό.
Εισαγωγή στην Στατιστική Χαράλαμπος Γναρδέλλης Τμήμα ΥΔΑΔ ΤΕΙ Μεσολογγίου.
ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ - ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Δρ. Κουνετάς Η Κωνσταντίνος.
Εισαγωγή στη διαχείριση χαρτοφυλακίου Ως επενδυτικό χαρτοφυλάκιο ορίζουμε Μ ια περιουσία που αποτελείται από μία ή περισσότερες κατηγορίες επενδυτικών.
ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ Γ. Σιδερίδης. ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ- ΜΕΘΟΔΟΛΟΓΙΑΣ Η στατιστική ως επιστήμη.....γιατί ακριβώς τη χρειαζόμαστε; Η στατιστική ως επιστήμη.....γιατί.
Αρχές επαγωγικής στατιστικής Τμήμα :Νοσηλευτικής Πατρών Διδάσκουσα: Παναγιώταρου Αλίκη Διάλεξη 9.
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. –Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας.
Έλεγχος Υποθέσεων Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης, Κατά την εκτέλεση ενός στατιστικού ελέγχου,
Διάστημα εμπιστοσύνης για τη διακύμανση. Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως Όταν τα δεδομένα αφορούν πληθυσμό – μ είναι ο μέσος του πληθυσμού.
Δεδομένα Συχνότητα-Μέτρα Θέσης Μέτρα Διασποράς. Δεδομένα ΠοσοτικάΣυνεχή Διακριτά Ποιοτικά Δεδομένα ΠρωτογενήΔευτερογενή.
Σήματα και Συστήματα 11 10η διάλεξη. Σήματα και Συστήματα 12 Εισαγωγικά (1) Έστω γραμμικό σύστημα που περιγράφεται από τη σχέση: Αν η είσοδος είναι γραμμικός.
Δραματική Τέχνη στην εκπαίδευση: Ερευνητικό Σχέδιο Ι Στις ανθρωπιστικές επιστήμες επικράτησαν δύο ερευνητικές κατευθύνσεις: Η στατιστική ανάλυση (συνυπολογίζει.
ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ για επεξεργασία δεδομένων έρευνας Εμμανουήλ Κακάρογλου Σχολικός Σύμβουλος ΠΕ12.
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΙΝΑΚΕΣ ΚΑΙ ΔΙΑΓΡΑΜΜΑΤΑ Πηγή: Βιοστατιστική [Σταυρινός / Παναγιωτάκος] Βιοστατιστική [Τριχόπουλος / Τζώνου / Κατσουγιάννη]
ΔΙΑΛΕΞΗ 11η Ποσοτική έρευνα υγείας
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Στατιστική Στατιστική είναι η συλλογή, οργάνωση, ανάλυση,
Επικρατούσα τιμή. Σε περιπτώσεις, που διαφορετικές τιμές μιας μεταβλητής επαναλαμβάνονται περισσότερο από μια φορά, η επικρατούσα τιμή είναι η συχνότερη.
Στατιστική Επαγωγή Ένα τεράστιο μέρος της έρευνας διενεργείται μέσω της ανάλυσης δειγμάτων προκειμένου να εξάγουμε συμπεράσματα για τον πληθυσμό. Αυτό.
Ανάλυση- Επεξεργασία των Δεδομένων
Μέτρα Διασποράς Η μεταβλητότητα, ή αλλιώς η ποικιλομορφία, στις τιμές μιας μεταβλητής θα πρέπει πάντοτε να λαμβάνεται υπόψη σε οποιαδήποτε στατιστική ανάλυση!
Τι μπορούμε να δούμε σε αυτό το ιστόγραμμα?
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Μεθοδολογία έρευνας και στατιστική – Δείγμα –Κατανομές
Δειγματοληψία Στην Επαγωγική στατιστική οδηγούμαστε σε συμπεράσματα και αποφάσεις για τις παραμέτρους ενός πληθυσμού με τη βοήθεια ενός τυχαίου δείγματος.
Μέτρα μεταβλητότητας ή διασποράς
Επαγωγική Στατιστική Εκτίμηση και Έλεγχος μέσων τιμών Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Έλεγχος της διακύμανσης
Ερμηνεία Σχετικού λόγου ( Odds ratio ) -1
Έλεγχος για τη διαφορά μέσων τιμών μ1 και μ2 δύο πληθυσμών
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
Άσκηση 2-Περιγραφικής Στατιστικής
Η ανάγκη χρήσης μεταβλητών
ΙΕΚ Γαλατσίου Στατιστική ΙΙ Μάθημα 6
Εισαγωγή στην Στατιστική
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Μορφές κατανομών Αθανάσιος Βέρδης.
Ομαδοποιημένη Κατανομή Συχνοτήτων
Ποσοτικές μέθοδοι περιγραφής δεδομένων
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
Επαγωγική Στατιστική Συσχέτιση – Συντελεστής συσχέτισης Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Στατιστικά Περιγραφικά Μέτρα
Παναγιώταρου Αλίκη Τμήμα Νοσηλευτικής
Βαςικα Στατιςτικα Μετρα
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Βιοστατιστική (Θ) ΤΕΙ Αθήνας Ενότητα 3: Περιγραφική στατιστική
Επαγωγική Στατιστική Συσχέτιση – Συντελεστές συσχέτισης Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Μεταγράφημα παρουσίασης:

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ Διασπορά – (διακύμανση, εύρος μεταβολής κλπ) μας πληροφορεί για τη διασπορά των δεδομένων συνήθως γύρω από τη μέση τιμή Ασυμμετρία μετράει το βαθμό της συμμετρίας των δεδομένων ως προς τη συχνότητά – κατανομή τους γύρω από τη μέση τιμή. Κύρτωση μετράει το βαθμό συγκέντρωσης των δεδομένων γύρω από τη μέση τιμή. Η κύρτωση δείχνει την αιχμηρότητα ή την πλάτυνση της κατανομής

Τα μέτρα διασποράς που θα εξετάσουμε είναι τα εξής: α) Το εύρος μεταβολής, β) το ενδοτεταρτημοριακό εύρος, γ) η μέση απόκλιση, δ) η μέση απόκλιση τετραγώνου, ε) ο συντελεστής μεταβλητικότητας

Εύρος Μεταβολής Το Εύρος μεταβολής είναι το απλούστερο μέτρο διασποράς υπολογίζεται ως η διαφορά μεταξύ της μεγαλύτερης και της μικρότερης τιμής Το Εύρος μεταβολής δεν θεωρείται αξιόπιστο γιατί εξαρτάται μόνο από τις δύο ακραίες τιμές των δεδομένων. αν διαφορά των ακραίων τιμών είναι πολύ μεγάλη, τότε και το εύρος θα είναι ανάλογο Χρήση. Π.χ. ΧΑΑ

Έστω οι παρακάτω παρατηρήσεις. Να βρεθεί το εύρος μεταβολής 52, 21, 31, 41, 23, 42, 44, 54, 55, 56, 57, 60, 61, 62, 64, 65, 66, 67, 68, 75, 74, 59, 85, 85, 84, 86, 90, 95 78, 87, 92, 93, 45, 89, 90

Ενδοτεταρτημοριακό Εύρος Η απόσταση μεταξύ πρώτου και τρίτου τεταρτημόριου μας δίνει το ενδοτεταρτημοριακό εύρος, το οποίο συμβολίζεται με IQR.

Χ Εισόδημα Q1 13.928 Q2 18.549 Q3 23.918 Το 50% των τιμών των δεδομένων βρίσκεται σε ένα εύρος 9.990 ευρώ. Με άλλα λόγια, οι μισοί από τους ανθρώπους που έχουμε στο δείγμα μας έχουν εισόδημα από 13.928 ευρώ έως 23.918 ευρώ.

Να βρεθεί το ενδοτεταρτημοριακό εύρος στα παρακάτω ταξινομημένα δεδομένα Κλάσεις 1 – 3 1 3 – 5 4 5 – 7 5 7 – 9 6 9 – 11 Σύνολο 20

 

Κλάσεις 1 – 3 1 3 – 5 4 5 5 – 7 10 7 – 9 6 16 9 – 11 20 Σύνολο    

Κλάσεις 1 – 3 1 3 – 5 4 5 5 – 7 10 7 – 9 6 16 9 – 11 20 Σύνολο    

Κλάσεις 1 – 3 1 3 – 5 4 5 5 – 7 10 7 – 9 6 16 9 – 11 20 Σύνολο    

Μέση Απόκλιση Η Μέση Απόκλιση (Μ. Α.) ορίζεται ως ο μέσος αριθμητικός των απόλυτων αποκλίσεων (διαφορών) των τιμών μιας μεταβλητής Χ από το μέσο αριθμητικό τους.   Το άθροισμα των αποκλίσεων είναι ίσο με μηδέν, γι αυτό υπολογίζουμε το άθροισμα των απόλυτων αποκλίσεων

Μέση Απόκλιση Παράδειγμα: Έστω ότι έχουμε το εισόδημα 5 υπαλλήλων. Παράδειγμα: Έστω ότι έχουμε το εισόδημα 5 υπαλλήλων. Χ: 1000, 900, 1300, 700, 800 Η μέση τιμή είναι 940 Υπολογίζουμε τις αποκλίσεις κάθε τιμής από τη μέση τιμή. Για παράδειγμα η πρώτη απόκλιση είναι ίση με: . Αθροίζουμε τις αποκλίσεις, και υπολογίζουμε τη Μέση Απόκλιση ως εξής:

Μέση Απόκλιση Μ. Α. = 37 δρχ. Η τιμή Μ. Α. =37 σημαίνει ότι το ημερομίσθιο κάθε εργάτη αποκλίνει (διαφέρει), κατά μέσο όρο, από το μέσο ημερομίσθιο κατά 37 Η Μέση Απόκλιση πλεονεκτεί από τα δύο προηγούμενα μέτρα διασποράς (R και Q), γιατί λαμβάνει υπόψη όλες τις τιμές της μεταβλητής. Μειονεκτεί όμως, διότι δεν επιδέχεται αλγεβρικό χειρισμό,

Τυπική Απόκλιση και Διακύμανση Το σημαντικότερο στατιστικό μέτρο διασποράς των τιμών μιας μεταβλητής Χ γύρω από το μέσο αριθμητικό τους είναι η Τυπική Απόκλιση Υπολογίζεται με την τετραγωνική ρίζα του μέσου αριθμητικού των τετραγώνων των αποκλίσεων των τιμών μιας μεταβλητής Χ από το μέσο αριθμητικό τους. Η τυπική απόκλιση συμβολίζεται με το σ στην περίπτωση του πληθυσμού και S στην περίπτωση του δείγματος

Τυπική απόκλιση και Διακύμανση Το τετράγωνο της τυπικής απόκλισης, ονομάζεται διακύμανση και συμβολίζεται με σ2 για δεδομένα πληθυσμού S2 για δεδομένα δείγματος. Η τυπική απόκλιση εκφράζεται στις μονάδες που εκφράζεται και η υπό μελέτη μεταβλητή Χ, ενώ η διακύμανση εκφράζεται στο τετράγωνο της μεταβλητής Χ.

Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως Όταν τα δεδομένα αφορούν πληθυσμό μ είναι ο μέσος του πληθυσμού και Ν το πλήθος των δεδομένων του πληθυσμού. Όταν τα δεδομένα αποτελούν ένα δείγμα

Από τις n αυτές αποκλίσεις μόνο οι n-1 είναι ανεξάρτητες, Mε τον όρο "βαθμοί ελευθερίας" εννοούμε το πλήθος των στατιστικών δεδομένων, τα οποία διαμορφώνονται ελεύθερα χωρίς κανένα περιορισμό. Για τον υπολογισμό όμως της διακυμάνσεως ενός δείγματος προκύπτουν n αποκλίσεις . Από τις n αυτές αποκλίσεις μόνο οι n-1 είναι ανεξάρτητες, γιατί η n-στή απόκλιση από το χ είναι καθορισμένη (περιορισμένη), διότι ο υπολογισμός του μέσου αριθμητικού αποτελεί ένα περιορισμό ότι άρα μόνο οι n - 1 αποκλίσεις είναι ανεξάρτητες (αδέσμευτες) επομένως, για τον υπολογισμό της διακυμάνσεως παραμένουν n-1 βαθμοί ελευθερίας.

Για τον πληθυσμό: Για το δείγμα:

Να βρεθεί η διακύμανση στο παρακάτω δείγμα: 1, 3, 5, 4

 

Παραδείγματα Για τον πληθυσμό:

Παραδείγματα

Να βρεθεί η διακύμανση 1 2 3 5 4

1 2 1*2=3 3 6 5 15 4 12 10    

1 2 3 -1 5 4 8      

Κλάσεις Συχνότητα f 0 – 10 2 10 – 20 3 20 – 30 5 30 – 40 40 – 50 Να βρεθεί η διακύμανση Κλάσεις Συχνότητα f 0 – 10 2 10 – 20 3 20 – 30 5 30 – 40 40 – 50 Σύνολο 15

Συντελεστής Μεταβλητότητας H τυπική απόκλιση δεν δίνει τη δυνατότητα να αποφανθούμε για το εάν η διασπορά είναι μικρή ή μεγάλη. να συγκρίνουμε τη διασπορά κατανομών που μετριούνται σε διαφορετική κλίμακα να συγκρίνουμε τη διασπορά κατανομών τα οποία εκφράζονται σε διαφορετικές μονάδες. Λύση στο πρόβλημα αποτελεί η χρήση του συντελεστής μεταβλητότητας συμβολίζεται με CV Ο συντελεστής μεταβλητικότητας είναι καθαρός αριθμός (χωρίς μονάδες μετρήσεως)

Συντελεστής Μεταβλητικότητας Για τον πληθυσμό έχουμε: Για το δείγμα: Ο συντελεστής μεταβλητότητας είναι η τυπική απόκλιση ως ποσοστό του μέσου. Είναι δυνατό να εκφράσουμε το συντελεστή μεταβλητότητας σε αριθμό και όχι σε ποσοστό.

Διαιρούμε την τυπική απόκλιση με το μέσο μέτρα που είναι εκφρασμένα στις ίδιες φυσικές μονάδες. Για παράδειγμα, διαιρούμε κιλά με κιλά, ευρώ με ευρώ, κλπ. Επομένως, οι μονάδες εξαφανίζονται και ο συντελεστής μεταβλητότητας μένει ένα καθαρό ποσοστό (ή ένας καθαρός αριθμός). Π.χ. ζητούμε τη σύγκριση της τυπικής απόκλισης μιας κατανομής βαρών με μια αναστημάτων Πρόβλημα: Διαφορετικές μονάδες μέτρησης Λύση: Συντελεστής μεταβλητικότητας

Στο τέλος της χρονιάς οι φοιτητές έχουν Σε ένα Τμήμα οι φοιτητές παρακολουθούν στατιστική και οικονομικά και υποβάλλονται σε εβδομαδιαία τεστ. Στο τέλος της χρονιάς οι φοιτητές έχουν μέσο όρο βαθμολογίας στη στατιστική 5,5 με τυπική απόκλιση 0,9 ενώ στα οικονομικά έχουν μέσο όρο 7,5 και τυπική απόκλιση 1,1. Σε ποιο μάθημα οι φοιτητές αποδίδουν με τη μικρότερη διασπορά (με μεγαλύτερη συνέπεια);

Απάντηση: Θα υπολογίσουμε τους συντελεστές μεταβλητότητας για τα δύο μαθήματα αντίστοιχα: Στα οικονομικά υπάρχει μεγαλύτερη τυπική απόκλιση. Ωστόσο, προσέξτε ότι ο μέσος όρος στα οικονομικά είναι μεγαλύτερος από το μέσο όρο στη στατιστική.

Ο συντελεστής μεταβλητότητας στα οικονομικά είναι χαμηλότερος από ότι στην στατιστική, γεγονός που σημαίνει ότι οι φοιτητές είναι περισσότερο συνεπείς στην απόδοσή τους στα οικονομικά σε σχέση με τη στατιστική. Η σχετική διασπορά στη στατιστική είναι μεγαλύτερη.

Να βρεθεί ποιο από τα δυο παρακάτω δείγματα προέρχεται από τον πληθυσμό που έχει τη μεγαλύτερη διασπορά με βάση το συντελεστή μεταβλητότητας. Υ: 1, 6, 9, 4 X: 101 , 104, 102, 103

1 6 9 4 16 -1      

101 104 1,5 2,25 102 -0,5 0,25 103 0,5      

    Παρατηρούμε ότι η εκτίμηση του δείκτη μεταβλητότητας για τον πρώτο πληθυσμό (με βάση το πρώτο δείγμα) είναι πολύ υψηλότερη, γεγονός που οφείλεται όχι μόνο στη διασπορά των δεδομένων (αποκλίσεις από τη μέση τιμή είναι μεγαλύτερες στο πρώτο δείγμα), αλλά και στο μικρό κατ’ απόλυτη τιμή μέγεθος της μέσης τιμής (είναι 5 ενώ στο δεύτερο δείγμα 102,5).

ΜΕΤΡΑ ΑΣΥΜΜΕΤΡΙΑΣ Για να περιγραφεί ικανοποιητικά μια κατανομή συχνοτήτων απαιτείται ο προσδιορισμός τεσσάρων βασικών στατιστικών παραμέτρων: i) Κεντρική Τάση ii) Διασπορά, iii) Ασυμμετρία και iv) Κύρτωση Η ασυμμετρία (skewness) δείχνει πόσο συμμετρικά γύρω από το μέσο κατανέμονται οι παρατηρήσεις, τα δεδομένα μας.

ΣΥΝΤΕΛΕΣΤΗΣ ΑΣΥΜΜΕΤΡΙΑΣ Απλά δεδομένα - Ασυμμετρία πληθυσμού Απλά δεδομένα - Ασυμμετρία δείγματος

 

 

Να βρεθεί η ασυμμετρία στο παρακάτω δείγμα Χ 1 2 12  15

Χ 1 -4 16 -64 2 -3 9 -27 12 7 49 343  15   74 252  

Στη διεθνή βιβλιογραφία χρησιμοποιούνται διάφορες παραλλαγές του προηγούμενου τύπου με σκοπό την κατά το δυνατό καλύτερη προσέγγιση της πραγματικής ασυμμετρίας του πληθυσμού. Μο είναι η επικρατούσα τιμή και Μd είναι η διάμεσος

G=0 ή μ3=0 Συμμετρική

G>0 ή μ3>0 Θετική Ασυμμετρία

G<0 ή μ3<0 Αρνητική Ασυμμετρία

Να βρεθεί ο συντελεστής Pearson

Να βρεθεί η ασυμμετρία 1 2 3 5 4

1 2 1*2=3 3 6 5 15 4 12 10    

1 2 3 -1 5 4 8      

1 2 3 -1 -3 5 4 8 16    

ΚΥΡΤΩΣΗ Δύο ή περισσότερες κατανομές συχνοτήτων να έχουν τον ίδιο μέσο αριθμητικό, την ίδια τυπική απόκλιση και να είναι συμμετρικές, αλλά να διαφέρουν ως προς την κύρτωση, δηλαδή ως προς την συγκέντρωση των παρατηρήσεων γύρω από το μέσο – αιχμηρότητα της κορυφής Η κύρτωση (kurtosis) δείχνει κατά πόσο τα δεδομένα της κατανομής σχηματίζουν έντονη κορυφή στο μέσο τους.

ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ Απλά δεδομένα - Κύρτωση πληθυσμού Απλά δεδομένα - Κύρτωση δείγματος

ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ Ομαδοποιημένα - Κύρτωση πληθυσμού Ομαδοποιημένα – Κύρτωση δείγματος

Κατανομές συχνοτήτων που οι τιμές τους διασπείρονται πάρα πολύ αριστερά και δεξιά του μέσου αριθμητικού χαρακτηρίζονται ως πλατύκυρτες και έχουν συντελεστή K<3 (Excel K<0)

Οι "Κανονικές Κατανομές" που οι τιμές μιας μεταβλητής ισοκατανέμονται αριστερά και δεξιά του μέσου αριθμητικού χαρακτηρίζονται ως Μεσόκυρτες K=3 (Excel K=0)

Τέλος, κατανομές συχνοτήτων που παρουσιάζουν μεγάλη συγκέντρωση τιμών στην περιοχή του μέσου αριθμητικού χαρακτηρίζονται ως Λεπτόκυρτες και έχουν K>3 (Excel K>0)

Να βρεθεί η κύρτωση στον πληθυσμό: Χ: 5, 0, 1, 2, 1, 4, 1

5 3 9 81 -2 4 16 1 -1 2  

5 3 9 81 -2 4 16 1 -1 2  

5 3 9 81 -2 4 16 1 -1 2  

5 3 9 81 -2 4 16 1 -1 2  

5 3 9 81 -2 4 16 1 -1 2  

Να υπολογιστεί η διακύμανση στο παρακάτω δείγμα: Χ: 1, 2, 3  

  1 -1 2 3

  1 -1 2 3

  1 -1 2 3

Να βρεθεί η κύρτωση

Να βρεθεί η κύρτωση

Πλατύκυρτη