Μέτρα Διασποράς Η μεταβλητότητα, ή αλλιώς η ποικιλομορφία, στις τιμές μιας μεταβλητής θα πρέπει πάντοτε να λαμβάνεται υπόψη σε οποιαδήποτε στατιστική ανάλυση!

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Περιγραφική Στατιστική
Advertisements

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ
Ανάλυση Πολλαπλής Παλινδρόμησης
Κεφάλαιο 1 Για Ποιο Λόγο; ΔΟΣΑ Δημοκρίτειο Πανεπιστήμιο Θράκης
Μετρήσεις Κεντρικής Τάσης
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
Στατιστική Ι Παράδοση 6 Η Κανονική Κατανομή
ΚΕΦΑΛΑΙΟ 3 Περιγραφική Στατιστική
Στατιστική I Χειμερινό Γ. Παπαγεωργίου
Γραφικές Μέθοδοι Περιγραφής Δεδομένων
Ανάλυση Ποσοτικών Δεδομένων Στατιστική
ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ ΔΙΑΚΡΙΤΩΝ ΚΑΙ ΣΥΝΕΧΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ
ΣΤΑΤΙΣΤΙΚΗ Η επιστήμη που ασχολείται με την συλλογή δεδομένων,ανάλυση και ερμηνεία αυτών Η επιστήμη με τη χρήση της οποίας λαμβάνουμε αποφάσεις κάτω από.
Εισαγωγή Στατιστική είναι η επιστήμη που με τη βοήθεια επιστημινκών μεθόδων ασχολείται με τη συλλογή, οργάνωση, παρουσίαση και ανάλυση αριθμητικών στοιχείων.
ΣΤΑΤΙΣΤΙΚΗ ΕΠΑΓΩΓΗ: ΣΗΜΕΙΑΚΕΣ ΕΚΤΙΜΗΣΕΙΣ & ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ
Τι είναι η Κατανομή (Distribution)
Στατιστική – Πειραματικός Σχεδιασμός Βασικά. Πληθυσμός – ένα μεγάλο σετ από Ν παρατηρήσεις (πιθανά δεδομένα) από το οποίο το δείγμα λαμβάνεται. Δείγμα.
Πειραματικές Μονάδες Ένα φυτό Ένα πειραματικό τεμάχιο (plot)
Στατιστικά περιγραφικά μέτρα Παναγιώταρου Αλίκη Τμήμα Νοσηλευτικής 5η Διάλεξη.
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 1: Περιγραφική Στατιστική Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και.
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή β) για ένα ποσοστό.
Χαρακτηριστικά μιας Κατανομής. συμμετρικές και μη συμμετρικές κατανομές.
 Ο Νόμος των Μεγάλων Αριθμών είναι το θεώρημα που περιγράφει τον τρόπο με τον οποίο συμπεριφέρεται ένα συγκεκριμένο πείραμα, όταν ο αριθμός των επαναλήψεων.
Ήπιες Μορφές Ενέργειας Ε306 Από τον άνεμο στην οικονομική βιωσιμότητα (εισαγωγικές έννοιες)
ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ Γ. Σιδερίδης. ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ- ΜΕΘΟΔΟΛΟΓΙΑΣ Η στατιστική ως επιστήμη.....γιατί ακριβώς τη χρειαζόμαστε; Η στατιστική ως επιστήμη.....γιατί.
Αρχές επαγωγικής στατιστικής Τμήμα :Νοσηλευτικής Πατρών Διδάσκουσα: Παναγιώταρου Αλίκη Διάλεξη 9.
Έλεγχος υποθέσεων για αναλογίες. Εάν έχουμε αναλογίες σχετικά με ένα συγκεκριμένο χαρακτηριστικό σε έναν πληθυσμό τότε κάνουμε ελέγχους υποθέσεων για.
Έλεγχος Υποθέσεων Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης, Κατά την εκτέλεση ενός στατιστικού ελέγχου,
Διάστημα εμπιστοσύνης για τη διακύμανση. Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως Όταν τα δεδομένα αφορούν πληθυσμό – μ είναι ο μέσος του πληθυσμού.
ΗΛΕΚΤΡΙΚΕΣ ΜΕΤΡΗΣΕΙΣ ΣΦΑΛΜΑΤΑ ΜΕΤΡΗΣΗΣ.
Δεδομένα Συχνότητα-Μέτρα Θέσης Μέτρα Διασποράς. Δεδομένα ΠοσοτικάΣυνεχή Διακριτά Ποιοτικά Δεδομένα ΠρωτογενήΔευτερογενή.
ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ για επεξεργασία δεδομένων έρευνας Εμμανουήλ Κακάρογλου Σχολικός Σύμβουλος ΠΕ12.
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΙΝΑΚΕΣ ΚΑΙ ΔΙΑΓΡΑΜΜΑΤΑ Πηγή: Βιοστατιστική [Σταυρινός / Παναγιωτάκος] Βιοστατιστική [Τριχόπουλος / Τζώνου / Κατσουγιάννη]
ΔΙΑΛΕΞΗ 11η Ποσοτική έρευνα υγείας
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Στατιστική Στατιστική είναι η συλλογή, οργάνωση, ανάλυση,
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Επικρατούσα τιμή. Σε περιπτώσεις, που διαφορετικές τιμές μιας μεταβλητής επαναλαμβάνονται περισσότερο από μια φορά, η επικρατούσα τιμή είναι η συχνότερη.
Στατιστική Επαγωγή Ένα τεράστιο μέρος της έρευνας διενεργείται μέσω της ανάλυσης δειγμάτων προκειμένου να εξάγουμε συμπεράσματα για τον πληθυσμό. Αυτό.
Ανάλυση- Επεξεργασία των Δεδομένων
Τι μπορούμε να δούμε σε αυτό το ιστόγραμμα?
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Μεθοδολογία έρευνας και στατιστική – Δείγμα –Κατανομές
Μέτρα μεταβλητότητας ή διασποράς
Χαρακτηριστικά μιας Κατανομής
Εκτιμητική: σημειακές εκτιμήσεις παραμέτρων
Έλεγχος Υπόθεσης για το μέσο ενός πληθυσμού
Έλεγχος της διακύμανσης
Ερμηνεία Σχετικού λόγου ( Odds ratio ) -1
Διαλέξεις στη Βιοστατιστική
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
Άσκηση 2-Περιγραφικής Στατιστικής
Η ανάγκη χρήσης μεταβλητών
ΙΕΚ Γαλατσίου Στατιστική ΙΙ Μάθημα 6
Εισαγωγή στην Στατιστική
Πειραματικές Μονάδες Ένα φυτό Ένα πειραματικό τεμάχιο (plot)
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
ΙΕΚ Γαλατσίου Στατιστική Ι Μάθημα 3
Ποσοτικές μέθοδοι περιγραφής δεδομένων
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
Στατιστικά Περιγραφικά Μέτρα
Παναγιώταρου Αλίκη Τμήμα Νοσηλευτικής
Βαςικα Στατιςτικα Μετρα
Ορισμός Με τον όρο Χρονοσειρές εννοούμε μια σειρά από παρατηρήσεις που παίρνονται σε ορισμένες χρονικές στιγμές ή περιόδους που ισαπέχουν μεταξύ τους.
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Βιοστατιστική (Θ) ΤΕΙ Αθήνας Ενότητα 3: Περιγραφική στατιστική
Α1(2,2), Α2(2,1), Α3(1,2), Α4(2,3), Α5(3,2) & Α6(1,5) Β1(6,2), Β2(5,3), Β3(6,4), Β4(4,4), Β5(5,5), Β6(7,5), Β7(8,4) & Β8(8,1) C1(2,2) & C2(6,4)
Μεταγράφημα παρουσίασης:

Μέτρα Διασποράς Η μεταβλητότητα, ή αλλιώς η ποικιλομορφία, στις τιμές μιας μεταβλητής θα πρέπει πάντοτε να λαμβάνεται υπόψη σε οποιαδήποτε στατιστική ανάλυση!

1. Εύρος: η διαφορά μεταξύ της μεγαλύτερης και της μικρότερης παρατήρησης. Προβλήματα: Βασίζεται μόνο σε δύο παρατηρήσεις, τη μεγαλύτερη και τη μικρότερη- και έτσι δεν λαμβάνει υπόψη την πληροφορία που περιλαμβάνουν οι υπόλοιπες παρατηρήσεις Το εύρος μιας κατανομής τείνει να αυξάνεται όσο αυξάνεται ο αριθμός των παρατηρήσεων.

2. Ενδοτεταρτημοριακό εύρος Πριν από όλα: Σε μια κατανομή μπορούν να εντοπιστούν 3 τεταρτημόρια, δηλαδή τιμές που χωρίζουν μια κατανομή σε τέταρτα: Q1 : το 25% των τιμών είναι μικρότερα από την τιμή αυτή και το 75% μεγαλύτερα Q2 : το σημείο αυτό αντιστοιχεί στη διάμεσο, όπου το 50% των τιμών είναι μεγαλύτερο από αυτή και το 50% μικρότερο Q3 : το 75% των τιμών είναι μικρότερα από την τιμή αυτή και το 25% μεγαλύτερα Το ενδοτεταρτημορικό εύρος περιλαμβάνει το 50% των παρατηρήσεων που βρίσκονται γύρω από τη διάμεσο και υπολογίζεται ως: IR=Q3-Q1

Υπολογισμός ενδοτεταρτημοριακού εύρους: Βάλτε τις παρατηρήσεις από τη μικρότερη προς τη μεγαλύτερη Προσθέστε μια μονάδα στον αριθμό των παρατηρήσεων και διαιρέστε με το 4. Αν ο αριθμός δεν είναι ακέραιος στρογγυλοποιείστε στον πιο κοντινό ακέραιο Ξεκινώντας από τη μεγαλύτερη παρατήρηση βρείτε την τιμή που αντιστοιχεί στον αριθμό που υπολογίσατε στο προηγούμενο στάδιο. Αυτό είναι το Q3 τεταρτημόριο. Επαναλάβατε την ίδια διαδικασία ξεκινώντας από την μικρότερη τιμή. Αυτό είναι το Q1 τεταρτημόριο. Αφαιρέστε το Q1 από το Q3. Παράδειγμα: 8 9 9 10 11 12 (6+1)/4=1.7=2 Q3=11 Q1=9 IR=11-9=2 Το ενδοτεταρτημοριακό εύρος δεν επηρεάζεται από τις ακραίες παρατηρήσεις

Άσκηση 10. Να βρεθεί το εύρος και το ενδοτεταρτημοριακό εύρος στις παρακάτω κατανομές: 60 63 45 63 65 70 55 63 60 65 63 20,3 22,7 21,4 20,6 21,4 20,9 1 3 4 1 0 2 5 8 0 2 3 4 7 11 0 2 3 4 2 17 5 3 28 7 5 8 5 6 2 12 10 4 3

Άσκηση 10. Να βρεθεί το εύρος και το ενδοτεταρτημοριακό εύρος στις παρακάτω κατανομές: 60 63 45 63 65 70 55 63 60 65 63 Εύρος=25 IQR=65-60=5 20,3 22,7 21,4 20,6 21,4 20,9 Εύρος=2.4 IQR=21.4-20.6=0.8 1 3 4 1 0 2 5 8 0 2 3 4 7 11 0 2 3 4 Εύρος=11 IQR=4-1=3 2 17 5 3 28 7 5 8 5 6 2 12 10 4 3 Εύρος=26 IQR=10-3=7

Η διακύμανση είναι ένα μέτρο της διασποράς των τιμών του δείγματος. Διακύμανση δείγματος: Διακύμανση πληθυσμού:

Τετράγωνο της διαφοράς 12 2 4 10 11 1 8 -2 9 -1 Χ Διαφορά από μέση τιμή Τετράγωνο της διαφοράς 12 2 4 10 11 1 8 -2 9 -1 Βρίσκουμε τη μέση τιμή: 12+10+11+8+9+11+9=70 . Πλήθος παρατηρήσεων: 7 οπότε μέσος όρος 70/7=10 Βρίσκουμε τις διαφορές από το μέσο όρο κάθε τιμής Βρίσκουμε το τετράγωνο των διαφορών Αθροίζουμε: 4+0+1+4+1+1+1=12 και διαιρούμε με το πλήθος των τιμών, Οπότε η διακύμανση είναι 12/7=1,71

Όμως όταν χρησιμοποιούμε τον τύπο: Προκειμένου να βρούμε τη δειγματική διακύμανση s2, έχει αποδειχτεί ότι συστηματικά υποεκτιμούμε την πραγματική διακύμανση του πληθυσμού σ2 . Γι’ αυτό το λόγο χρησιμοποιούμε τον παρακάτω τύπο: Για μεγάλα δείγματα η διόρθωση αυτή δεν παίζει σημαντικό ρόλο!

Τετράγωνο της διαφοράς 12 2 4 10 11 1 8 -2 9 -1 Χ Διαφορά από μέση τιμή Τετράγωνο της διαφοράς 12 2 4 10 11 1 8 -2 9 -1 Βρίσκουμε τη μέση τιμή: 12+10+11+8+9+11+9=70 . Πλήθος παρατηρήσεων: 7 οπότε μέσος όρος 70/7=10 Βρίσκουμε τις διαφορές από το μέσο όρο κάθε τιμής Βρίσκουμε το τετράγωνο των διαφορών Αθροίζουμε: 4+0+1+4+1+1+1=12 και διαιρούμε με το πλήθος των τιμών, Οπότε η διακύμανση είναι 12/6=2

Ωστόσο η φυσική σημασίας της διακύμανσης είναι δύσκολο να γίνει αντιληπτή. Σε μια έρευνα για το βάρος των φοιτητών και σε ένα δείγμα 100 ατόμων βρήκαμε ότι η μέση τιμή βάρους ήταν 75 κιλά και η διακύμανση 400 (κιλά στο τετράγωνο!!). Για να λύσουμε το πρόβλημα βρίσκουμε την τετραγωνική ρίζα της διακύμανσης, την οποία καλούμε τυπική απόκλιση, οπότε στο παραπάνω παράδειγμα η μέση τιμή του βάρους των φοιτητών ήταν 75 κιλά και η διακύμανση 20 κιλά!

Ουσιαστικά δηλαδή η τυπική απόκλιση θα μπορούσε να ιδωθεί ως μια αδρή μέτρηση για το πόσο κατά μέσο όρο αποκλίνουν οι τιμές εκατέρωθεν μιας μέσης τιμής. Δειγματική τυπική απόκλιση Και για πληθυσμό:

Άσκηση 11 Σε ένα δείγμα πήραμε τα παρακάτω αποτελέσματα: Α. 1 3 7 2 0 4 7 3 Β. 2 10 6 4 3 4 5 7 Γ. 10 8 5 0 1 1 7 9 2 Δ. 1 3 6 8 2 1 7 2 Να βρεθεί η τυπική απόκλιση!

Μερικές ενδιαφέρουσες γενικεύσεις: Στις περισσότερες κατανομές συχνοτήτων, οι περισσότερες τιμές (συχνά μέχρι και το 68%) βρίσκονται σε απόσταση το πολύ μιας τυπικής απόκλισης εκατέρωθεν της μέσης τιμής. Στις περισσότερες κατανομές συχνοτήτων ένας ελάχιστος αριθμός τιμών (συχνά το 5%) βρίσκεται σε απόσταση μεγαλύτερη των δύο τυπικών αποκλίσεων από τη μέση τιμή

Δεν θα πρέπει να ξεχνάμε ότι η μέση τιμή είναι μια μέτρηση κεντρικής τάσης, θέσης δηλαδή, ενώ η τυπική απόκλιση είναι μια μέτρηση της απόστασης εκατέρωθεν της μέσης τιμής μιας κατανομής.

Η διακύμανση είναι: Κάποιου είδους μέση τιμή? Ένας καλός δείκτης της ποικιλομορφίας? Ένα ενδιάμεσο στάδιο για τον υπολογισμό της τυπικής απόκλισης?

Η μέση διάρκεια της εγκυμοσύνης είναι 270 ημέρες με μια τυπική απόκλιση 15 ημερών. Πότε θα γεννηθούν τα περισσότερα μωρά? Ένας μικρός αριθμός μωρών θα γεννηθούν νωρίτερα από________ Ένας μικρός αριθμός μωρών θα γεννηθούν αργότερα από ________ Σε μια διαμάχη για την πατρότητα ενός παιδιού, ο σύζυγος υποστηρίζει ότι δεν μπορεί να είναι ο πατέρα γιατί ταξίδευε τους 10 τελευταίους μήνες πριν τη γέννηση του παιδιού. Σχόλια?

In descriptive statistics, a box plot or boxplot (also known as a box-and-whisker diagram or plot) is a convenient way of graphically depicting groups of numerical data through their five-number summaries: the smallest observation (sample minimum), lower quartile (Q1), median (Q2), upper quartile (Q3), and largest observation (sample maximum). A boxplot may also indicate which observations, if any, might be considered outliers. Boxplots display differences between populations without making any assumptions of the underlying statistical distribution: they are non-parametric. The spacings between the different parts of the box help indicate the degree of dispersion (spread) and skewness in the data, and identify outliers. Boxplots can be drawn either horizontally or vertically.