Τι είναι η Κατανομή (Distribution)

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Περιγραφική Στατιστική
Advertisements

Άλλες Στατιστικές Παλινδρόμησης
Μετρήσεις Κεντρικής Τάσης
Εβδομάδα 3 Παρουσίαση Δεδομένων
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
Στατιστική Ι Παράδοση 6 Η Κανονική Κατανομή
Εισαγωγή στην Κοινωνιογλωσσολογία
ΕΙΔΗ ΣΦΑΛΜΑΤΩΝ ΣΤΗ ΓΕΩΔΑΙΣΙΑ
ΚΕΦΑΛΑΙΟ 3 Περιγραφική Στατιστική
Ε λληνικό Ι νστιτούτο Μ ετρολογίας Σύγκριση μεταξύ αναλυτικών και αριθμητικών μεθόδων υπολογισμού της αβεβαιότητας μέτρησης Χρήστος Μπαντής, Ph. D. Νοέμβριος,
ΧΡΗΜΑΤΟΔΟΤΗΣΗ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΕΠΕΝΔΥΣΕΩΝ ΣΤΗ ΓΕΩΡΓΙΑ
Στατιστική I Χειμερινό Γ. Παπαγεωργίου
Γραφικές Μέθοδοι Περιγραφής Δεδομένων
Ανάλυση Ποσοτικών Δεδομένων Στατιστική
Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Διάλεξη 5 Σύγκριση μέσω όρων
ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ ΔΙΑΚΡΙΤΩΝ ΚΑΙ ΣΥΝΕΧΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ
Πηγή: Βιοστατιστική [Β.Γ. Σταυρινός, Δ.Β. Παναγιωτάκος]
ΣΤΑΤΙΣΤΙΚΗ Η επιστήμη που ασχολείται με την συλλογή δεδομένων,ανάλυση και ερμηνεία αυτών Η επιστήμη με τη χρήση της οποίας λαμβάνουμε αποφάσεις κάτω από.
Εισαγωγή Στατιστική είναι η επιστήμη που με τη βοήθεια επιστημινκών μεθόδων ασχολείται με τη συλλογή, οργάνωση, παρουσίαση και ανάλυση αριθμητικών στοιχείων.
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
Στατιστική – Πειραματικός Σχεδιασμός Βασικά. Πληθυσμός – ένα μεγάλο σετ από Ν παρατηρήσεις (πιθανά δεδομένα) από το οποίο το δείγμα λαμβάνεται. Δείγμα.
Στατιστικά περιγραφικά μέτρα Παναγιώταρου Αλίκη Τμήμα Νοσηλευτικής 5η Διάλεξη.
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 1: Περιγραφική Στατιστική Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και.
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 1: Περιγραφική Στατιστική Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και.
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή β) για ένα ποσοστό.
Σε ένας τεστ ένας φοιτητής βαθμολογήθηκε με 640. Να βρεθεί το ποσοστό των φοιτητών που είχαν χειρότερες επιδόσεις από αυτόν δεδομένου ότι η κατανομή της.
Εισαγωγή στη διαχείριση χαρτοφυλακίου Ως επενδυτικό χαρτοφυλάκιο ορίζουμε Μ ια περιουσία που αποτελείται από μία ή περισσότερες κατηγορίες επενδυτικών.
ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ Γ. Σιδερίδης. ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ- ΜΕΘΟΔΟΛΟΓΙΑΣ Η στατιστική ως επιστήμη.....γιατί ακριβώς τη χρειαζόμαστε; Η στατιστική ως επιστήμη.....γιατί.
Αρχές επαγωγικής στατιστικής Τμήμα :Νοσηλευτικής Πατρών Διδάσκουσα: Παναγιώταρου Αλίκη Διάλεξη 9.
ΗΛΕΚΤΡΙΚΕΣ ΜΕΤΡΗΣΕΙΣ ΣΦΑΛΜΑΤΑ ΜΕΤΡΗΣΗΣ.
Δεδομένα Συχνότητα-Μέτρα Θέσης Μέτρα Διασποράς. Δεδομένα ΠοσοτικάΣυνεχή Διακριτά Ποιοτικά Δεδομένα ΠρωτογενήΔευτερογενή.
Δραματική Τέχνη στην εκπαίδευση: Ερευνητικό Σχέδιο Ι Στις ανθρωπιστικές επιστήμες επικράτησαν δύο ερευνητικές κατευθύνσεις: Η στατιστική ανάλυση (συνυπολογίζει.
ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ για επεξεργασία δεδομένων έρευνας Εμμανουήλ Κακάρογλου Σχολικός Σύμβουλος ΠΕ12.
ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ II Καθ. Πέτρος Π. Γρουμπός Διάλεξη 8η Στοχαστικά Σήματα - 1.
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΙΝΑΚΕΣ ΚΑΙ ΔΙΑΓΡΑΜΜΑΤΑ Πηγή: Βιοστατιστική [Σταυρινός / Παναγιωτάκος] Βιοστατιστική [Τριχόπουλος / Τζώνου / Κατσουγιάννη]
ΔΙΑΛΕΞΗ 11η Ποσοτική έρευνα υγείας
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Στατιστική Στατιστική είναι η συλλογή, οργάνωση, ανάλυση,
Τι είναι η Κατανομή (Distribution)
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Επικρατούσα τιμή. Σε περιπτώσεις, που διαφορετικές τιμές μιας μεταβλητής επαναλαμβάνονται περισσότερο από μια φορά, η επικρατούσα τιμή είναι η συχνότερη.
Στατιστική Επαγωγή Ένα τεράστιο μέρος της έρευνας διενεργείται μέσω της ανάλυσης δειγμάτων προκειμένου να εξάγουμε συμπεράσματα για τον πληθυσμό. Αυτό.
Ανάλυση- Επεξεργασία των Δεδομένων
Μέτρα Διασποράς Η μεταβλητότητα, ή αλλιώς η ποικιλομορφία, στις τιμές μιας μεταβλητής θα πρέπει πάντοτε να λαμβάνεται υπόψη σε οποιαδήποτε στατιστική ανάλυση!
Στατιστικές Υποθέσεις
Τι μπορούμε να δούμε σε αυτό το ιστόγραμμα?
Δειγματοληψία στην εκπαιδευτική έρευνα
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Μεθοδολογία έρευνας και στατιστική – Δείγμα –Κατανομές
Δειγματοληψία Στην Επαγωγική στατιστική οδηγούμαστε σε συμπεράσματα και αποφάσεις για τις παραμέτρους ενός πληθυσμού με τη βοήθεια ενός τυχαίου δείγματος.
Μέτρα μεταβλητότητας ή διασποράς
Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης
Άσκηση 2-Περιγραφικής Στατιστικής
ΙΕΚ Γαλατσίου Στατιστική ΙΙ Μάθημα 6
Κανονική Κατανομή.
Δρ. Γιώργος Μαρκάκης Καθηγητής Βιομετρίας Τ.Ε.Ι. Κρήτης
Εισαγωγή στην Στατιστική
Μορφές κατανομών Αθανάσιος Βέρδης.
Ομαδοποιημένη Κατανομή Συχνοτήτων
ΙΕΚ Γαλατσίου Στατιστική Ι Μάθημα 3
Κατανομές πιθανοτήτων
Εισαγωγή στην Βιοστατιστική
ΚΑΤΑΝΟΜΕΣ Δ. Τσιπλακίδης
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
Στατιστικές Υποθέσεις
Στατιστικά Περιγραφικά Μέτρα
Παναγιώταρου Αλίκη Τμήμα Νοσηλευτικής
Βαςικα Στατιςτικα Μετρα
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Μεταγράφημα παρουσίασης:

Τι είναι η Κατανομή (Distribution) Η στατιστική μέθοδος για την περιγραφή/συστηματοποίηση μιας ομάδας δεδομένων. Η πιο συνήθης μορφή κατανομής για αυτό τον σκοπό και την παρουσίαση δεδομένων είναι η κατανομή συχνότητας: Δείχνει πόσο συχνά (πόσες φορές) απαντάται η κάθε τιμή της κατανομής. Αυτό μπορεί να φανεί είτε από τη συγκεντρωτική παρουσίαση των δεδομένων σε ένα πίνακα, είτε από τη γραφική παράσταση των δεδομένων όπου έχω συχνότητα στον άξονα των y και τις τιμές στον άξονα των x.

Συνήθεις Γραφικές παραστάσεις των Κατανομών Συχνότητας α) Ακιδωτό διάγραμμα (Bar Chart) β) Ιστόγραμμα (Histogram) γ) Κυκλικό διάγραμμα (Pie chart)

Ο παρακάτω πίνακας δείχνει τους αριθμούς λαθών σε κάθε συνθήκη Παράδειγμα Κατανομής Ο παρακάτω πίνακας δείχνει τους αριθμούς λαθών σε κάθε συνθήκη Subject Two Beers Five Beers No Beer 1 5 8 2 4 9 3 7 6 12 15 10

Ιστογράμματα Συχνότητας για κάθε ένα από τα επίπεδα της μεταβλητής «ποσότητα αλκοόλ»

…Λίγη Περιγραφική Στατιστική Από κάθε μια από τις παραπάνω κατανομές, μπορούμε να εξάγουμε πολύ χρήσιμες περιγραφικές στατιστικές πληροφορίες. Για τους σκοπούς του μαθήματος Πειραματικής Ψυχολογίας θα περιοριστούμε: στο Μέσο Όρο – Mean - (είναι ένας από τους δείκτες «κεντρικής τάσης») και στην Τυπική Απόκλιση - Standard Deviation - (είναι ένας από τους δείκτες «διασποράς»). Για περισσότερες πληροφορίες σχετικά με τους δείκτες κεντρικής τάσης και διασποράς καλό θα είναι να θυμηθούμε ένα εγχειρίδιο στατιστικής…

…Λίγη Περιγραφική Στατιστική Έτσι, για κάθε ομάδα που ελέγχουμε στο πείραμά μας (πέντε μπύρες, δύο μπύρες, καμία μπύρα) μπορούμε να υπολογίσουμε το Μέσο Όρο (Μ.Ο.) λαθών στην οδήγηση. Ο Μ.Ο. υπολογίζεται αν αθροίσουμε όλες τις τιμές και διαιρέσουμε δια το συνολικό αριθμό τιμών που είχαμε στην κατανομή. Ο Μ.Ο. στην ομάδα «2 μπύρες» είναι 3.4 λάθη Ο Μ.Ο. στην ομάδα «5 μπύρες» είναι 9.5 λάθη Ο Μ.Ο. στην ομάδα «0 μπύρες» είναι 1.7 λάθη

…Λίγη Περιγραφική Στατιστική Ας πάρουμε σαν παράδειγμα την ομάδα «5 μπύρες» με Μ.Ο. = 9.5. Κάθε τιμή της ομάδας απέχει από το Μ.Ο. ορισμένη απόσταση. Η τιμή 15 απέχει από το Μ.Ο. 15 - 9.5 = 5.5 μονάδες. Η τιμή 7 απέχει από το Μ.Ο. -2.5 μονάδες…κ.ο.κ. Η απόσταση κάθε τιμής από τον Μ.Ο. λέγεται απόκλιση (deviation) (x - M.O.). Επειδή όμως οι αποκλίσεις είναι και θετικές και αρνητικές, το άθροισμα τους είναι μηδέν και άρα δεν μπορούμε να τις προσθέσουμε και να βγάλουμε το Μ.Ο., τους ως ένα αντιπροσωπευτικό δείκτη διασποράς. Για αυτό το λόγο, αθροίζουμε τα τετράγωνά τους (ώστε να απαλειφθούν τα πρόσημα) και υπολογίζουμε ύστερα το Μ.Ο. τους. Αυτός ο Μ.Ο. των τετραγώνων λέγεται διακύμανση – variance - (ή μέσο τετράγωνο των αποκλίσεων). H τετραγωνική ρίζα της διακύμανσης λέγεται τυπική απόκλιση (standard deviation). Μια σημαντική χρησιμότητα της τυπικής απόκλισης είναι ότι μας δείχνει το ποσοστό των τιμών της ομάδας που συγκεντρώνονται γύρω από το Μ.Ο. δηλ. το πόσο αντιπροσωπευτικός είναι ο Μ.Ο. για τα δεδομένα που παρατηρήσαμε.

Κανονική Κατανομή (Normal or Gaussian distribution) Κανονική κατανομή υπάρχει όταν σε μια κατανομή συχνότητας η πλειοψηφία των τιμών συγκεντρώνεται γύρω από το κέντρο (Μ.Ο.) της κατανομής. Μια τέτοια κατανομή είναι συμμετρική γύρω από το Μ.Ο: Το 50% των τιμών είναι πάνω, και το 50% των τιμών είναι κάτω από το Μ.Ο. Ο μαθηματικός Gauss έδειξε, με το αντίστοιχο θεώρημά του, ότι σε μια κανονική κατανομή, περίπου το 68.3% των (μετρηθέντων) τιμών περιέχεται στο διάστημα μεταξύ μιας τυπικής απόκλισης πάνω και μιας τυπικής απόκλισης κάτω από το Μ.Ο. Το περίπου 95.4% των τιμών περιέχεται στο διάστημα μεταξύ δύο τυπικών αποκλίσεων πάνω και δύο τυπικών αποκλίσεων κάτω από το Μ.Ο. και Το περίπου 99.7% των τιμών περιέχεται στο διάστημα μεταξύ τριών τυπικών αποκλίσεων πάνω και τριών τυπικών αποκλίσεων κάτω από το Μ.Ο.

Κανονική Κατανομή Δηλαδή, αν για παράδειγμα ο Μ.Ο. σε μια κατανομή είναι 30 και η τυπική απόκλιση είναι 8, τότε… Το σημείο που αντιστοιχεί σε μια τυπική απόκλιση πάνω από το Μ.Ο. είναι 30+8=38. Το σημείο που αντιστοιχεί σε μια τυπική απόκλιση κάτω από το Μ.Ο. είναι 30-8=22. Συνεπώς το 68% των τιμών αυτής της κατανομής θα βρίσκεται μεταξύ των τιμών 22 και 38.

Κανονική Κατανομή

Τυπικές Τιμές (z Scores) σε μία κανονική κατανομή η πιθανότητα να πάρουμε μια συγκεκριμένη τιμή είναι 0 (αλλά τι θα πει ακριβώς «συγκεκριμένη τιμή»; Πάντα έχω εύρος τιμών..). η πιθανότητα να πάρουμε μια μέτρηση μεγαλύτερη (ή μικρότερη) από μια συγκεκριμένη τιμή εξαρτάται από την τυπική τιμή της τιμής αυτής η τυπική τιμή δείχνει πόσες τυπικές αποκλίσεις απέχει μια αρχική τιμή από το ΜΟ της κατανομής. …δηλ. δείχνει τη θέση που κατέχει μια τιμή μέσα στην κατανομή, σε σχέση με το ΜΟ z = (χ - MO) / ΤΑ (ΜΟ: μέσος όρος ΤΑ: τυπική απόκλιση) Έτσι, κάποιος συμμετέχων που, στην υπό μελέτη μεταβλητή, έχει αρχική τιμή ίση με τον ΜΟ, έχει τυπική τιμή = 0. Κάποιος που έχει αρχική τιμή ίση με μια τυπική απόκλιση πάνω από το ΜΟ έχει τυπική τιμή +1. Κάποιος που έχει αρχική τιμή ίση με μια τυπική απόκλιση κάτω από το ΜΟ έχει τυπική τιμή -1. κλπ.

Τυπικές Τιμές (z Scores) Αν υπολογίσουμε την ακριβή τυπική τιμή στην οποία αντιστοιχεί η εκάστοτε τιμή που μετρήσαμε (αρχική τιμή), τότε, μέσω των κατάλληλων πινάκων πιθανότητας, μπορούμε να πληροφορηθούμε το ακριβές ποσοστό των τιμών της κατανομής που είναι ψηλότερες (ή χαμηλότερες) από την τιμή αυτή. Πληροφορούμαστε δηλαδή για τη πιθανότητα που υπάρχει να βρεθεί η συγκεκριμένη, ή μικρότερη τιμή στην κατανομή. Η πιθανότητα αυτή (ποσοστό), –έστω το 0.841 που αντιστοιχεί στην τυπική τιμή 1-, ουσιαστικά δείχνει ότι αν από τη συγκεκριμένη κατανομή διαλέξουμε μια τιμή στην τύχη, τότε στο 84.1 % των περιπτώσεων η τιμή αυτή θα είναι κάτω από 1. (ή πάνω από 1 για το 15.9 % των περιπτώσεων). Οι πίνακες αυτοί χρησιμεύουν τόσο για να μετατρέπουμε τις τυπικές τιμές (z-scores) σε πιθανότητες (p-values) όσο και το αντίστροφο Έτσι μπορούμε και να δούμε την πιθανότητα να πάρουμε μια τιμή τόσο μεγάλη (η μικρή) σαν αυτή που μετρήσαμε (μετατρέποντας τη τιμή μας σε τυπική τιμή με βάση τη φόρμουλα και μετά σε πιθανότητα με βάση τους πίνακες)… …ή αντίστροφα να δούμε ποια είναι η συγκεκριμένη τιμή που αντιστοιχεί σε μια συγκεκριμένη πιθανότητα (π.χ. top 10% σε ύψος), μετατρέποντας την πιθανότητα αυτή πρώτα σε τυπική τιμή (μέσω πίνακα) και μετά την τυπική τιμή σε κανονική τιμή (μέσω φόρμουλας)

Ένα παράδειγμα εκφρασμένο σε Z Scores Οι τιμές του δείκτη νοημοσύνης (IQ) παρουσιάζουν κανονική κατανομή και θεωρείται ότι έχουν Μ.Ο. = 100 και Τ.Α. = 15. Έστω ότι θέλουμε να δούμε το ποσοστό των ατόμων που έχουν IQ μεγαλύτερο από 127. Πρώτα μετατρέπουμε την αρχική τιμή που μας ενδιαφέρει (την τιμή 127) σε z τιμή: z = (127-100) / 15 = 1.8. Αυτό σημαίνει ότι η IQ (αρχική) τιμή 127 είναι 1.8 μονάδες (δηλαδή 1.8 τυπικές αποκλίσεις) πάνω από το Μ.Ο. Όπως φαίνεται από τον παρακάτω πίνακα αθροιστικών πιθανοτήτων κανονικής κατανομής, η αθροιστική πιθανότητα που αντιστοιχεί σε z = 1.8 είναι 0.964 δηλαδή το 96.4% των ατόμων του πληθυσμού έχει IQ μικρότερο ή ίσο με 127 και άρα το ποσοστό που ψάχνουμε είναι 3.6% Αν, αντίστροφα, θέλαμε να δούμε ποιο είναι το IQ που σε κάνει να ανήκεις στο κορυφαίο 3.6% του πληθυσμού, μετατρέπουμε (με τη βοήθεια του πίνακα) το 3.6% σε z = 1.8 και υπολογίζουμε (με βάση τη φόρμουλα για το z-score) 100+1.8*15=127 που είναι η τιμή που ψάχνουμε!

Πίνακας αθροιστικών πιθανοτήτων κανονικής κατανομής

Κανονική Κατανομή