Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Περιγραφική Στατιστική
Advertisements

Άλλες Στατιστικές Παλινδρόμησης
Ανάλυση Πολλαπλής Παλινδρόμησης
Κεφάλαιο 1 Για Ποιο Λόγο; ΔΟΣΑ Δημοκρίτειο Πανεπιστήμιο Θράκης
Μοντέλα μέτρησης απόδοσης συστήματος (KLM) και εισαγωγή στη στατιστική
Μετρήσεις Κεντρικής Τάσης
1 4 Square Questions B A D C Κοιτάξτε προσεκτικά το διάγραμμα. Θα σας κάνω 4 ερωτήσεις γι’ αυτό το τετράγωνο. ΕΤΟΙΜΟΙ;
Εβδομάδα 3 Παρουσίαση Δεδομένων
Στατιστική Ι Παράδοση 6 Η Κανονική Κατανομή
Εισαγωγή στην Κοινωνιογλωσσολογία
Γραφήματα & Επίπεδα Γραφήματα
© 2002 Thomson / South-Western Slide 1-1 Κεφάλαιο 1 Εισαγωγή στη Στατιστική με τη χρήση του Excel.
ΚΕΦΑΛΑΙΟ 3 Περιγραφική Στατιστική
Αριθμητική Ανάλυση Μεταπτυχιακού 6η Ε Β Δ Ο Μ Α Δ Α Ακαδημαϊκό Έτος Τετάρτη 26, Νοεμβρίου 2008 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΥΠΟΛΟΓΙΣΤΙΚΩΝ.
Είδη δειγμάτων Τυχαίο/ μη τυχαίο
ΚΕΦΑΛΑΙΟ 5 ΧΩΡΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ
ΧΡΗΜΑΤΟΔΟΤΗΣΗ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΕΠΕΝΔΥΣΕΩΝ ΣΤΗ ΓΕΩΡΓΙΑ
Στατιστική Ι Παράδοση 9 Ο Δείκτης Συσχέτισης.
Βασικές Αρχές Μέτρησης
Στατιστική I Χειμερινό Γ. Παπαγεωργίου
Γραφικές Μέθοδοι Περιγραφής Δεδομένων
Ανάλυση Ποσοτικών Δεδομένων Στατιστική
ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ ΔΙΑΚΡΙΤΩΝ ΚΑΙ ΣΥΝΕΧΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ
Πηγή: Βιοστατιστική [Β.Γ. Σταυρινός, Δ.Β. Παναγιωτάκος]
ΣΤΑΤΙΣΤΙΚΗ Η επιστήμη που ασχολείται με την συλλογή δεδομένων,ανάλυση και ερμηνεία αυτών Η επιστήμη με τη χρήση της οποίας λαμβάνουμε αποφάσεις κάτω από.
Εισαγωγή Στατιστική είναι η επιστήμη που με τη βοήθεια επιστημινκών μεθόδων ασχολείται με τη συλλογή, οργάνωση, παρουσίαση και ανάλυση αριθμητικών στοιχείων.
ΣΤΑΤΙΣΤΙΚΗ ΕΠΑΓΩΓΗ: ΣΗΜΕΙΑΚΕΣ ΕΚΤΙΜΗΣΕΙΣ & ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
Τι είναι η Κατανομή (Distribution)
Το φυλλόγραμμα (stem and leaf plot) Αποτελεί ένα συνδυασμό πίνακα και ιστογράμματος. Κάθε παρατήρηση χωρίζεται Σε δύο μέρη: 1.
Στατιστικά περιγραφικά μέτρα Παναγιώταρου Αλίκη Τμήμα Νοσηλευτικής 5η Διάλεξη.
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 1: Περιγραφική Στατιστική Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και.
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 1: Περιγραφική Στατιστική Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και.
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή β) για ένα ποσοστό.
ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ Γ. Σιδερίδης. ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ- ΜΕΘΟΔΟΛΟΓΙΑΣ Η στατιστική ως επιστήμη.....γιατί ακριβώς τη χρειαζόμαστε; Η στατιστική ως επιστήμη.....γιατί.
Αρχές επαγωγικής στατιστικής Τμήμα :Νοσηλευτικής Πατρών Διδάσκουσα: Παναγιώταρου Αλίκη Διάλεξη 9.
ΗΛΕΚΤΡΙΚΕΣ ΜΕΤΡΗΣΕΙΣ ΣΦΑΛΜΑΤΑ ΜΕΤΡΗΣΗΣ.
Δεδομένα Συχνότητα-Μέτρα Θέσης Μέτρα Διασποράς. Δεδομένα ΠοσοτικάΣυνεχή Διακριτά Ποιοτικά Δεδομένα ΠρωτογενήΔευτερογενή.
Δραματική Τέχνη στην εκπαίδευση: Ερευνητικό Σχέδιο Ι Στις ανθρωπιστικές επιστήμες επικράτησαν δύο ερευνητικές κατευθύνσεις: Η στατιστική ανάλυση (συνυπολογίζει.
ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ για επεξεργασία δεδομένων έρευνας Εμμανουήλ Κακάρογλου Σχολικός Σύμβουλος ΠΕ12.
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΙΝΑΚΕΣ ΚΑΙ ΔΙΑΓΡΑΜΜΑΤΑ Πηγή: Βιοστατιστική [Σταυρινός / Παναγιωτάκος] Βιοστατιστική [Τριχόπουλος / Τζώνου / Κατσουγιάννη]
ΔΙΑΛΕΞΗ 11η Ποσοτική έρευνα υγείας
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Στατιστική Στατιστική είναι η συλλογή, οργάνωση, ανάλυση,
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Επικρατούσα τιμή. Σε περιπτώσεις, που διαφορετικές τιμές μιας μεταβλητής επαναλαμβάνονται περισσότερο από μια φορά, η επικρατούσα τιμή είναι η συχνότερη.
Ανάλυση- Επεξεργασία των Δεδομένων
Μέτρα Διασποράς Η μεταβλητότητα, ή αλλιώς η ποικιλομορφία, στις τιμές μιας μεταβλητής θα πρέπει πάντοτε να λαμβάνεται υπόψη σε οποιαδήποτε στατιστική ανάλυση!
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Δειγματοληψία Στην Επαγωγική στατιστική οδηγούμαστε σε συμπεράσματα και αποφάσεις για τις παραμέτρους ενός πληθυσμού με τη βοήθεια ενός τυχαίου δείγματος.
Μέτρα μεταβλητότητας ή διασποράς
Ερμηνεία Σχετικού λόγου ( Odds ratio ) -1
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
Άσκηση 2-Περιγραφικής Στατιστικής
Η ανάγκη χρήσης μεταβλητών
ΙΕΚ Γαλατσίου Στατιστική ΙΙ Μάθημα 6
Εισαγωγή στην Στατιστική
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Μορφές κατανομών Αθανάσιος Βέρδης.
Ομαδοποιημένη Κατανομή Συχνοτήτων
Ποσοτικές μέθοδοι περιγραφής δεδομένων
Κατανομές πιθανοτήτων
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
Στατιστικά Περιγραφικά Μέτρα
Παναγιώταρου Αλίκη Τμήμα Νοσηλευτικής
Βαςικα Στατιςτικα Μετρα
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Βιοστατιστική (Θ) ΤΕΙ Αθήνας Ενότητα 3: Περιγραφική στατιστική
Μεταγράφημα παρουσίασης:

Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός

Ένα παράδειγμα εργασίας Ένας καθηγητής μαθηματικών έδωσε σε δύο τμήματα μιας τάξης του σχολείου του το ίδιο τεστ. Η επίδοση των μαθητών του κάθε τμήματος (όπως μετρήθηκε με τη χρήση μιας εικοσαβάθμιας κλίμακας) παρουσιάζεται στον Πίνακα: Ποιο από τα δύο τμήματα είχε καλύτερη επίδοση;

Οι επιδόσεις των μαθητών των δύο τμημάτων δεν είναι οι ίδιες… Ωστόσο, οι τιμές και των τριών δεικτών κεντρικής τάσης είναι ακριβώς οι ίδιες μεταξύ των δύο ομάδων! Η δεσπόζουσα τιμή και για τα δύο τμήματα είναι η τιμή 17 (η συχνότητά της είναι 6 και στα δύο τμήματα) Η διάμεσος και στις δύο ομάδες είναι 16,75 Τέλος, ο αριθμητικός μέσος όρος και των δύο ομάδων είναι επίσης ο ίδιος: 16,24 Άρα;…

Διάγραμμα μίσχου και φύλλων Το τμήμα Β έχει περισσότερες ακραίες τιμές από το Α, είναι δηλαδή περισσότερο διασπαρμένες. Τη διαφορά αυτή δεν μπορούν να την περιγράψουν οι δείκτες κεντρικής τάσης. Το Β τμήμα έχει περισσότερες ακραίες τιμές, αλλά και υψηλότερες (ή χαμηλότερες). Είχαμε αναφέρει ότι οι ακραίες τιμές (αυτές που αποκλίνουν από τον μέσο όρο) είναι πολύ σημαντικές. Όταν γνωρίζουμε ποιά είναι η διασπορά των τιμών (dispersion or variability) έχουμε μία περισσότερο ξεκάθαρη εικόνα του συνολικού δείγματος τιμών, σε σχέση με το αν είχαμε μόνο ένα δείκτη κεντρικής τάσης.

Διασπορά ή σκεδασμός Γενικός στατιστικός όρος για κάθε μέτρηση που αναφέρεται στη διακύμανση των τιμών μιας ομάδας τιμών: εύρος (range), ενδοτεταρτημοριακό εύρος (interquartile range), μέση αριθμητική απόκλιση (mean deviation) Διακύμανση (variance),και τυπική απόκλιση (standard deviation).

Εύρος Η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής της κατανομής Πλεονεκτήματα: Είναι πολύ εύκολο στον υπολογισμό του Περιλαμβάνει και τις ακραίες τιμές της κατανομής Μειονεκτήματα: Αλλοιώνεται από τις ακραίες τιμές με αποτέλεσμα, σε πολλές περιπτώσεις, να μην παρουσιάζει μια αντιπροσωπευτική εικόνα της διασποράς της κατανομής Δεν παρέχει καμιά πληροφορία σχετικά με τη διασπορά των τιμών μεταξύ των άκρων της κατανομής. Για παράδειγμα, δεν μας λέει τίποτα για τη διασπορά των τιμών της κατανομής γύρω από το μέσο όρο Ομαδοποιημένη κατανομή: το εύρος υπολογίζεται από τη διαφορά μεταξύ του κατώτερου πραγματικού ορίου τουθ μικρότερου διαστήματος και του ανώτερου πραγματικού ορίου του μεγαλύτερου διαστήματος. Πχ αν τα διαστήηματα είναι τα 16-20 και 96-100 το εύρος είναι: 100.5 – 15.5= 85

Ενδοτεταρτημοριακό εύρος Ενδοτεταρτημοριακό εύρος: Το εύρος του κεντρικού 50% των τιμών μιας κατανομής Τεταρτημόρια: Τα σημεία που χωρίζουν την κατανομή σε τέσσερα ίσα μέρη: 1ο τεταρτημόριο ή 25ο 2ο τεταρτημόριο ή 50ο ή διάμεσος 3ο τεταρτημόριο ή 75ο Ο τύπος υπολογισμού των τεταρτημορίων: Όπου, L = το ακριβές ανώτερο πραγματικό όριο της προηγούμενης τιμής, P = το ποσοστό των τιμών της κατανομής που βρίσκονται κάτω από το συγκεκριμένο τεταρτημόριο, F = η αθροιστική σχετική συχνότητα της προηγούμενης τιμής, και fm = η επιμέρους σχετική συχνότητα της επόμενης τιμής. Τιμή τεταρτημορίου

Ενδοτεταρτημοριακό εύρος Το ενδοτεταρτημοριακό εύρος ισούται με τη διαφορά μεταξύ του 1ου και του 3ου τεταρτημορίου. Εφαρμόζουμε τον τύπο που είδαμε στην προηγούμενη διαφάνεια και υπολογίζουμε την τιμή των δύο τεταρτημορίων: 1ο τεταρτημόριο = 14,26 3ο τεταρτημόριο = 17,75 Επομένως: 1ο τεταρτημόριο – 3ο τεταρτημόριο = 14,26 – 17,75 = -3,49

Ενδοτεταρτημοριακό εύρος Πλεονεκτήματα: Δεν επηρεάζεται από τις ακραίες τιμές Είναι σχετικά εύκολο στον υπολογισμό του Είναι αντιπροσωπευτικό των κεντρικών τιμών της κατανομής Μειονεκτήματα: Δεν λαμβάνει υπόψη τις ακραίες τιμές της κατανομής Όπως και το εύρος, δεν επιτρέπει την ακριβή ερμηνεία μιας συγκεκριμένης τιμής της κατανομής Δεν είναι ακριβές όταν τα δεδομένα είναι ομαδοποιημένα κατά μεγάλα διαστήματα τιμών Όπως και η διάμεσος, δεν περιγράφει καμιά από τις παραμέτρους, οι οποίες είναι βασικές για την επαγωγική στατιστική

Μέση αριθμητική απόκλιση Απόκλιση: Η αριθμητική διαφορά ανάμεσα σε μια τιμή και στο μέσο όρο της κατανομής στην οποία ανήκει η συγκεκριμένη τιμή Ο τύπος υπολογισμού της απόκλισης:

Μέση αριθμητική απόκλιση

Μέση αριθμητική απόκλιση Ο τύπος υπολογισμού της μέσης αριθμητικής απόκλισης:

Τυπική απόκλιση Διακύμανση: Ο μέσος όρος των τετραγώνων των αποκλίσεων όλων των τιμών μιας κατανομής Τυπική απόκλιση: Δείκτης διασποράς αντιπροσωπευτικός των αποκλίσεων μιας ομάδας τιμών από το μέσο όρο Ο τύπος υπολογισμού της τυπικής απόκλισης:

Τυπική απόκλιση Πλεονεκτήματα: Μπορεί να χρησιμοποιηθεί για τον υπολογισμό των παραμέτρων του πληθυσμού Λαμβάνει υπόψη όλες τις τιμές της κατανομής Είναι ο πιο ευαίσθητος από τους δείκτες διασποράς Μειονεκτήματα: Ο υπολογισμός της είναι σχετικά πιο περίπλοκος σε σχέση με τους υπόλοιπους δείκτες διασποράς Είναι πολύ ευαίσθητη στις ακραίες τιμές της κατανομής

Επιλέγοντας τον κατάλληλο δείκτη διασποράς Μεγάλη σημασία έχουν οι ακραίες τιμές στην επιλογή του κατάλληλου δείκτη. Ωστόσο, πρέπει να εξετάσουμε και το επίπεδο μέτρησης που έχουμε επιτύχει. Έτσι, στην ιεραρχική κλίμακα μέτρησης, μεγαλύτεροι αριθμοί δείχνουν μεγαλύτερη ποσότητα από οτιδήποτε μετριέται, αλλά μεγαλύτερες και μικρότερες διαφορές μεταξύ των αριθμών μπορεί να μη δείχνουν μεγαλύτερες και μικρότερες διαφορές ανάμεσα στα πράγματα που μετρώνται. Σε μια τέτοια περίπτωση αρκεί ο υπολογισμός του εύρους. Σε κλίμακα ίσων διαστημάτων ή αναλογική κλίμακα, μεγάλες διαφορές στις μετρήσεις αντιστοιχούν πράγματι σε μεγάλες διαφορές στα πράγματα που μετρώνται. Σε αυτή την περίπτωση, και εφόσον δεν αναμένεται να υπάρχουν ακραίες τιμές, επιλέγουμε το μέσο όρο και την τυπική απόκλιση.

Επιλέγοντας τον κατάλληλο δείκτη διασποράς Αν είναι πιθανό να υπάρχουν ακραίες τιμές ή αν η μέτρηση είναι σε ιεραρχική κλίμακα, τότε πρέπει να χρησιμοποιούνται η διάμεσος και το ενδοτεταρτημοριακό εύρος. Η δεσπόζουσα τιμή και το εύρος μπορούν να χρησιμοποιηθούν αν επαρκεί μία κατά προσέγγιση εικόνα των τιμών του δείγματος. Ο συνηθέστερος τρόπος περιγραφής της διασποράς των τιμών μιας μεταβλητής είναι μέσω της τυπικής απόκλισης. Ο σημαντικότερος λόγος για τον οποίο προτιμάται η τυπική απόκλιση από τους υπόλοιπους δείκτες διασποράς είναι η δυνατότητα που προσφέρει να υπολογίσουμε παραμέτρους του πληθυσμού.

Διάγραμμα κουτιού Διάγραμμα που χρησιμοποιείται για τη γραφική παράσταση της διασποράς ενός δείγματος

Διαγράμματα κουτιού του παραδείγματος Διαγράμματα κουτιού για τις τιμές των δύο τμημάτων του παραδείγματός μας