Μέτρα κεντρικής τάσης και διασποράς

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Εισαγωγή στην Επιστήμη των Η/Υ ΙΙ Μάθημα 7
Advertisements

Rata-Rata Hitung dari data Tersusun Hamba Allah.
Μάρτιος 2011 Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σπύρος Βερονίκης Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Σχετικές πληροφορίες:
ΣΤΑΤΙΣΤΙΚΗ Η επιστήμη που ασχολείται με την συλλογή δεδομένων,ανάλυση και ερμηνεία αυτών Η επιστήμη με τη χρήση της οποίας λαμβάνουμε αποφάσεις κάτω από.
Περιγραφικά μέτρα κεντρικής τάσης και διασποράς μιας Ποσοτικής μεταβλητής σε σχέση με μία Ποιοτική μεταβλητή (εντολή By variable) π.χ. Να συγκριθούν οι.
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΑΣ ΓΕΩΠΟΝΙΑΣ ΤΜΗΜΑ ΥΔΑΤΟΚΑΛΛΙΕΡΓΕΙΩΝ ΚΑΙ ΑΛΙΕΥΤΙΚΗΣ ΔΙΑΧΕΙΡΙΣΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΜΕΤΡΗΣΗ ΚΑΙ.
1 ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ ΠΑΡΑΔΟΣΗ 1Οη (Θ) Στοιχεία Επαγωγικής Στατιστικής.
Προπόνηση ταχύτητας στις αναπτυξιακές ηλικίες Βελτιώνεται?... Προπονείται?...Αν ΝΑΙ…ΠΩΣ?
ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΤΕΡΙΝΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΣΥΣΤΗΜΑΤΩΝ ΕΦΟΔΙΑΣΜΟΥ (LOGISTICS) ΕΠΙΒΛΕΠΟΥΣΑ ΚΑΘΗΓΗΤΡΙΑ: ΣΤΑΦΥΛΑ ΑΜΑΛΙΑ ΤΡΥΦΩΝΟΠΟΥΛΟΥ ΙΩΑΝΝΑ.
ΚΑΤΑΤΟΠΙΣΤΙΚΕΣ ΔΟΚΙΜΑΣΙΕΣ ΣΤΗΝ ΠΗΞΗ (screening tests) ΑΞΙΟΛΟΓΗΣΗ ΕΞΕΤΑΣΕΩΝ ΒΑΣΕΙ ΚΛΙΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ ΙΣΤΟΡΙΚΟΥ Θεόδωρος Θεοδωρίδης Διευθυντής Αιματολογικού.
Η ποιότητα στις ξενοδοχειακές επιχειρήσεις Γεώργιος Απλαδάς 3 ο μάθημα
ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΗΤΡΙΑ: ΜΠΟΥΓΟΥΛΙΑ ΣΤΕΡΓΙΑΝΝΩ ΕΡΓΑΣΤΗΡΙΑΚΟΣ ΣΥΝΕΡΓΑΤΗΣ: ΖΙΑΝΗΣ ΔΗΜΗΤΡΗΣ ΔΑΣΙΚΗ ΒΙΟΜΕΤΡΙΑ.
Ιστορία του Ραδιοφώνου και της Ελληνικής Ραδιοφωνίας.
Τύποι κινδύνων Οι βασικοί τύποι κινδύνων είναι δύο:
Φυσική Α Λυκείου.
ΠΕΡΙΓΡΑΦΙΚΗ ΒΙΟΣΤΑΤΙΣΤΙΚΗ – Ποσοτικές μεταβλητές
Τι είναι η Κατανομή (Distribution)
Στατιστική ανάλυση των πειραματικών μετρήσεων
Εκπαιδευτικό παιχνίδι Επιχειρηματικότητας
Εισαγωγή στην Στατιστική
Μεθοδολογία έρευνας και στατιστική – Δείγμα –Κατανομές
ΠΟΣΟΤΙΚΑ ΔΕΔΟΜΕΝΑ.
Μέτρα μεταβλητότητας ή διασποράς
ΕΘΙΣΜΟΣ ΣΤΟ ΔΙΑΔΙΚΤΥΟ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ ΑΠΟΤΕΛΕΣΜΑΤΑ
ΕΛΛΗΝΟΓΑΛΛΙΚΗ ΣΧΟΛΗ ΠΕΙΡΑΙΑ «ΑΓΙΟΣ ΠΑΥΛΟΣ»
Στατιστικές Υποθέσεις
Εκτιμητική: σημειακές εκτιμήσεις παραμέτρων
Κάποιες βασικές έννοιες στη μεθοδολογία της ψυχολογίας
ΑΝΙΧΝΕΥΣΗ ΠΑΡΑΠΟΙΗΜΕΝΩΝ ΕΙΚΟΝΩΝ
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧ/ΣΕΩΝ ΕΡΓΑΣΤΗΡΙΟ 3 ΔΔΕ
Σχεδιασμός των Μεταφορών
Φυσική A’ Λυκείου ΔΥΝΑΜΙΚΗ ΣΤΟ ΕΠΙΠΕΔΟ
Η Επίδραση της Προπόνησης στη Μεταβολή του Λιπεδιμικού Προφίλ των Αθλητών Καλαθοσφαίρισης Ν. Αποστολίδης.
Κεκλιμένο Επίπεδο Και Τριβή
ΕΛΛΗΝΟΓΑΛΛΙΚΗ ΣΧΟΛΗ ΠΕΙΡΑΙΑ ΑΓΙΟΣ ΠΑΥΛΟΣ
ΘΕΜΑ ΕΡΓΑΣΙΑΣ: ΡΑΔΙΟΦΩΝΟ
Εισαγωγή στην Βιοστατιστική
ΛΕΥΚΟ ΦΩΣ ΓΥΑΛΙΝΟ ΠΡΙΣΜΑ.
Επιμέλεια Τσάμης Δ. Ιωάννης Μαθηματικός
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
ΕΙΣΑΓΩΓΗ - ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ
Χαρακτηριστικά μιας Κατανομής
Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική
Κάποιες βασικές έννοιες στη μεθοδολογία της ψυχολογίας
Η ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ Η ΚΙΝΗΤΗ ΕΠΙΚΟΙΝΩΝΙΑ
Μέτρα μεταβλητότητας ή διασποράς
Ταξινόμηση και Γραφικές παραστάσεις ποιοτικών δεδομένων
ΣΤΑΤΙΣΤΙΚΗ Partalidou Xanthi, PhD Candidate, MSc, BSc.
Αρχές επαγωγικής στατιστικής
Βαςικα Στατιςτικα Μετρα
Ηλεκτρομαγνητικό Φάσμα
Συνενώνοντας Αστροφωτογραφίες
Bài giảng tin ứng dụng Gv: Trần Trung Hiếu Bộ môn CNPM – Khoa CNTT
Ευρυζωνικές εφαρμογές (Broadband applications)
ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΙΟΣΤΑΤΙΣΤΙΚΗ
מדדי מרכזיות שכיח Mo – (Mode) חציון (Median) Md –
الإحصاء الحيوي Biostatistics
Импульстің сақталу заңы. Реактивті қозғалыс.
Импульстің сақталу заңы. Реактивті қозғалыс.
Στατιστικές Υποθέσεις
ΑΣΚΗΣΗ 4: Θεμελιώδης Νόμος της Μηχανικής
Ενεργειακή κατανάλωση στη θέση αναμονής των συσκευών
Financial Market Theory
Η ποιότητα στις ξενοδοχειακές επιχειρήσεις
ΑΣΚΗΣΗ 11: Υπολογισμός των συντελεστών κινητικής και στατικής τριβής .
Κεφάλαιο 3 Αριθμητικά Περιγραφικά Μέτρα.
ΠΡΟΣΑΡΜΟΓΗ ΠΕΙΡΑΜΑΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΣΕ ΘΕΩΡΗΤΙΚΕΣ ΚΑΤΑΝΟΜΕΣ
1ος νΟμος του ΝεΥτωνα Αν η συνισταμένη των δυνάμεων που ασκούνται σε ένα σώμα είναι ίση με μηδέν (ΣF=0N) τότε το σώμα ή θα ηρεμεί (υ=0) ΣF= 0 F υ=0 B.
Δρ Μαρία Καμηλάκη, Διδάσκουσα Π.Δ. 407/80 Φιλοσοφική Σχολή
Στατιστική Επαγωγή Ένα τεράστιο μέρος της έρευνας διενεργείται μέσω της ανάλυσης δειγμάτων προκειμένου να εξάγουμε συμπεράσματα για τον πληθυσμό. Αυτό.
Μεταγράφημα παρουσίασης:

Μέτρα κεντρικής τάσης και διασποράς Δεύτερο μάθημα

Αριθμητικός μέσος όρος 7, 13, 22, 9, 11, 4. άθροισμα 66, διά 6 ίσον 11. Γενικά, όταν έχουμε Ν προσθετέους Τότε ο αριθμητικός μέσος όρος είναι:

Υπολογισμός του αριθμητικού μέσου όρου από την κατανομή συχνότητας Χi fi fXi 18 1 17 2 34 16 32 15 3 45 14 28 13 5 65 12 36 11 22 Σύνολο 20 280 Δεδομένα: 11, 11, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 15, 15, 15, 16, 16, 17, 17, 18

Υπολογισμός του αριθμητικού μέσου όρου από την κατανομή συχνότητας ομαδοποιημένων δεδομένων Χi fi fXi 18 1 17 2 34 16 32 15 3 45 14 28 13 5 65 12 36 11 22 Σύνολ. 20 280 Παρατηρήστε ότι:

Διάστημα επί συχνό-τητα Χifi Ομαδοποιημένα δεδομένα Διά-στημα Μέσο διαστήματος Χi Συχνότητα fi Διάστημα επί συχνό-τητα Χifi 45-49 47 1 40-44 42 2 84 35-39 37 3 111 30-34 32 6 192 25-29 27 8 216 20-24 22 17 374 15-19 26 442 10-14 12 11 132 5-9 7 0-4 Σύνολο 76 1.612

Ιδιότητες του αριθμητικού μέσου όρου Αποκλίσεις (deviations) από τον μέσο όρο Αρχικά ή ακατέργαστα (raw) δεδομένα

Ιδιότητες του αριθμητικού μέσου όρου Πρώτη ιδιότητα: Το άθροισμα των αποκλίσεων από τον μέσο όρο ισούται με το μηδέν Παράδειγμα: Ο αριθμητικός μέσος των τιμών 7, 13, 22, 9, 11, 4 είναι το 11 Οι αποκλίσεις από τον μέσο όρο είναι -4, 2, 11, -2, 0, -7. Το άθροισμά τους είναι 0.

Ιδιότητες του αριθμητικού μέσου όρου Δεύτερη ιδιότητα: Το άθροισμα των τετραγώνων των αποκλίσεων από τον αριθμητικό μέσο όρο είναι μικρότερο από το άθροισμα των τετραγώνων των αποκλίσεων από κάθε άλλη τιμή

Ιδιότητες του αριθμητικού μέσου όρου Παράδειγμα: Ο αριθμητικός μέσος των τιμών 7, 13, 22, 9, 11, 4 είναι το 11 Οι αποκλίσεις από τον μέσο όρο είναι -4, 2, 11, -2, 0, -7 (μηδέν) Τα τετράγωνα των αποκλίσεων είναι 16, 4, 121, 4, 0, 49. Το άθροισμά τους είναι το 194. Αν είχαμε διαλέξει π.χ. το 13 αντί του 11, το άθροισμα των αποκλίσεων θα ήταν -6, 0, 9, 4, 2, -9 Στο τετράγωνο είναι 36, 0, 81, 16, 4, 81 (σύνολο 218).

Ιδιότητες του αριθμητικού μέσου όρου Απόδειξη Αυτό κάνει μηδέν Πάντα θετική ποσότητα. Άρα η απόκλιση από μια τιμή διαφορετική από τον μέσο όρο είναι πάντα μεγαλύτερη

Ιδιότητες του αριθμητικού μέσου όρου Τρίτη ιδιότητα: Ο μέσος όρος ενός δείγματος ως αποτελεί επαρκή και ακριβή δείκτη για τον μέσο όρο του πληθυσμού.

Η διάμεσος Δεδομένα 2 7 16 19 20 25 27 Σειρά 1 3 4 5 6 Δεδομένα 7 8 9 31 8 Δεδομένα 2 7 16 19 20 25 27 Σειρά 1 3 4 5 6 Δεδομένα 7 8 9 10 Σειρά 1 2 3 4 5 6

Η διάμεσος όταν έχουμε συνεχείς τιμές Δεδομένα 7 8 9 10 Σειρά 1 2 3 4 5 6 Διάμεσος 7,5+0,67=8,17

Η διάμεσος όταν έχουμε ομαδοποιημένες τιμές Πρώτον Βρίσκουμε τις αθροιστικές συχνότητες (εδώ 76) και διαιρούμε με το 2 για να βρούμε το Ν/2, δηλαδή τη μεσαία (εδώ το Ν/2 είναι το 38) Δεύτερον Εντοπίζουμε το διάστημα που περιέχει το Ν/2 (δηλ. το 38). Εδώ είναι το διάστημα το 15-19 (ή σε πραγματικές τιμές, το διάστημα 14,5-19,5). Διά-στημα Μέσο διαστήματος Συχνότητα Αθροιστική συχνότητα 45-49 47 1 76 40-44 42 2 75 35-39 37 3 73 30-34 32 6 70 25-29 27 8 64 20-24 22 17 56 15-19 26 39 10-14 12 11 13 5-9 7 0-4 Σύνολο

Η διάμεσος όταν έχουμε ομαδοποιημένες τιμές Τρίτον Πού πέφτει η 38η περίπτωση στο διάστημα 15-19; Από τις 26 περιπτώσεις του διαστήματος 15-19, η διάμεσος είναι μετά από την 25η, γιατί 2+11+25=38. Άρα, χρειαζόμαστε τα 25/26 του διαστήματος. Διά-στημα Μέσο διαστήματος Συχνότητα Αθροιστική συχνότητα 45-49 47 1 76 40-44 42 2 75 35-39 37 3 73 30-34 32 6 70 25-29 27 8 64 20-24 22 17 56 15-19 26 39 10-14 12 11 13 5-9 7 0-4 Σύνολο

Η διάμεσος όταν έχουμε ομαδοποιημένες τιμές Και επειδή το διάστημα έχει εύρος 5 έχουμε: Τέταρτο Προσθέτουμε το απαιτούμενο εύρος στο πραγματικό όριο του διαστήματος 15-19. 14,5+4,81=19,31 Η διάμεσος είναι 19,31 Διά-στημα Μέσο διαστήματος Συχνότητα Αθροιστική συχνότητα 45-49 47 1 76 40-44 42 2 75 35-39 37 3 73 30-34 32 6 70 25-29 27 8 64 20-24 22 17 56 15-19 26 39 10-14 12 11 13 5-9 7 0-4 Σύνολο

Η διάμεσος όταν έχουμε ομαδοποιημένες τιμές Όπου: L=το ακριβές κατώτερο όριο του διαστήματος που περιέχει τη διάμεσο F= το άθροισμα όλων των συχνοτήτων κάτω από το L fm= η συχνότητα του διαστήματος που περιέχει τη διάμεσο Ν =το πλήθος των παρατηρήσεων h= Το εύρος του διαστήματος που περιέχει τη διάμεσο

Ιδιότητες της διαμέσου Για τον μέσο όρο είχαμε ότι Για τη διάμεσο έχουμε αντιστοίχως ότι το άθροισμα των απολύτων τιμών (χωρίς το πρόσημο) των αποκλίσεων από τη διάμεσο είναι το ελάχιστο

Η δεσπόζουσα τιμή 11, 11, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 15, 15, 15, 16, 16, 17, 17, 18 Η δεσπόζουσα τιμή είναι το 13 2, 7, 16, 19, 20, 25, 27 2, 2, 2, 7, 7, 7, 16, 16, 16, 19, 19, 19, 20, 20, 20, 25, 25, 25, 27, 27, 27 Δεν υπάρχει δεσπόζουσα τιμή 11, 11, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 15, 15, 15, 16, 16, 17, 17, Η δεσπόζουσα τιμή είναι το 13+14/2=13,2 11, 11, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 15, 15, 15, 15, 16, 16, 17, 17, 18 Δύο δεσπόζουσες τιμές

Ο γεωμετρικός μέσος όρος Για παράδειγμα, για τις τιμές: 2, 3, 8, 10

Ασκήσεις για το σπίτι Για τις τιμές 1, 5, 10, 15, 19 βρείτε: (α) το άθροισμα των τετραγώνων των διαφορών από τον μέσο όρο και (β) το άθροισμα των τετραγώνων των διαφορών για από την τιμή 8. Αν υποθέσουμε ότι οι παρακάτω τιμές είναι διακριτές υπολογίστε τη διάμεσο: 1,2,2,2,2,3,3, 1,1,2,2,2,3,4,4, 1,2,2,2,3,3,3,4 16,17,18,19,19,19,19 Κάντε το ίδιο υποθέτοντας ότι οι τιμές είναι συνεχείς

Μέτρα διασποράς Τρίτο Μάθημα

Λύσεις των ασκήσεων του προηγούμενου μαθήματος Για τις τιμές 1, 5, 10, 15, 19 βρείτε: (α) το άθροισμα των τετραγώνων των διαφορών από τον μέσο όρο και (β) το άθροισμα των τετραγώνων των διαφορών για από την τιμή 8. Αν υποθέσουμε ότι οι παρακάτω τιμές είναι διακριτές υπολογίστε τη διάμεσο: 1,2,2,2,2,3,3, 1,1,2,2,2,3,4,4, 1,2,2,2,3,3,3,4 16,17,18,19,19,19,19 Κάντε το ίδιο υποθέτοντας ότι οι τιμές είναι συνεχείς

Χi Χi-10 (Χi-10)2 Χi-8 (Χi-8)2 Σύνολο 212 233 Για τις τιμές 1, 5, 10, 15, 19 βρείτε: (α) το άθροισμα των τετραγώνων των διαφορών από τον μέσο όρο και (β) το άθροισμα των τετραγώνων των διαφορών για από την τιμή 8. Χi Χi-10 (Χi-10)2 Χi-8 (Χi-8)2 1 -9 81 -7 49 5 -5 25 -3 9 10 +2 4 15 +9 +7 19 +5 +11 121 Σύνολο 212 233 (1-10)2=92=81

Αν υποθέσουμε ότι οι παρακάτω τιμές είναι διακριτές υπολογίστε τη διάμεσο: 1, 2, 2, 2, 2, 3, 3 Διάμεσος=2 1,1, 2, 2, 2, 3, 4, 4 Διάμεσος=2 1,2,2,2,3,3,3,4 Διάμεσος=2,5 16, 17, 18, 19, 19, 19, 19 Διάμεσος=19

Αν υποθέσουμε ότι οι παρακάτω τιμές είναι συνεχείς υπολογίστε τη διάμεσο: 1, 2, 2, 2, 2, 3, 3 Διάμεσος=2 1,1, 2, 2, 2, 3, 4, 4 Διάμεσος=1,5+2/3=2,167 1, 2, 2, 2, 3, 3, 3, 4 Διάμεσος=2,5 16, 17, 18, 19, 19, 19, 19 Διάμεσος=19

Εύρος και μέση απόκλιση 1. Το εύρος 2. Η μέση απόκλιση (Mean Deviation) Δείγμα Α 8, 8, 8, 8, 8 Δείγμα Β 1, 4, 7, 10, 13 Δείγμα Γ 1, 5, 20, 25, 29 Δείγμα Α 0, 0, 0, 0, 0 Δείγμα Β -6, -3, 0, +3, +6 και (6+3+ 0+3+6)/5=3,6 Δείγμα Γ -15, -11, +4, +9, +13, ενώ (15+11+4+9+13)/5=10,4

Η διακύμανση O μέσος όρος των τιμών 1, 4, 7, 10, 13 είναι το 7. Όπως είδαμε, οι αποκλίσεις από τον μέσο όρο είναι -6, -3, 0, +3, +6. Στο τετράγωνο οι αποκλίσεις αυτές είναι 36, 9, 0, 9, 36. Το άθροισμα των τετραγώνων των αποκλίσεων είναι 90. Με τι θα διαιρέσουμε; Για τον πληθυσμό, η διακύμανση είναι στην ουσία ο μέσος όρος των τετραγώνων των αποκλίσεων από τον μέσο όρο του πληθυσμού.

Η Διακύμανση Αν και η ποσότητα Ν δεν διαφέρει πολύ από την ποσότητα Ν-1, όταν υπολογίζουμε τη διακύμανση του πληθυσμού διαιρώντας με Ν, κάνουμε συστηματικό σφάλμα. Υπολογίζουμε μια διακύμανση μικρότερη κατά (Ν-1)/Ν. Όταν, όμως, διαιρούμε δια Ν-1, το πρόβλημα λύνεται. Ας υποθέσουμε ότι έχουμε έναν πληθυσμό που αποτελείται από τους αριθμούς 1, 2, 3. Έχουμε τότε ότι μ=2 και σ2=0,667. Παίρνουμε τώρα όλα τα πιθανά δείγματα μεγέθους Ν=2 (μόνο 9 τέτοια μπορούμε να πάρουμε).

Η διακύμανση Έστω ότι έχουμε τον πληθυσμό {1, 2, 3} Ο μέσος όρος είναι το 2 Η διακύμανση είναι το 0,667

Έστω ότι έχουμε το δείγμα {1, 2} Ο μέσος όρος είναι το 1,5 Η διακύμανση είναι το 0,25

Δείγματα s2 με Ν-1 s2 με Ν 1,1 1,0 0,00 1,2 1,5 0,50 0,25 1,3 2,0 2,00 1,00 2,1 2,2 2,3 2,5 3,1 3,2 3,3 3,0 0,667 0,333

Θα έπρεπε δηλαδή να διαιρέσουμε όχι με το Ν αλλά με το Ν-1

Η Διακύμανση Για τον πληθυσμό, η διακύμανση είναι στην ουσία ο μέσος όρος των τετραγώνων των αποκλίσεων από τον μέσο όρο του πληθυσμού. Για το δείγμα, διαιρούμε όχι με το μέγεθος του δείγματος Ν, αλλά με Ν-1 Και αυτό γιατί αν και η ποσότητα Ν δεν διαφέρει πολύ από την ποσότητα Ν-1, όταν υπολογίζουμε τη διακύμανση του πληθυσμού διαιρώντας με Ν, κάνουμε συστηματικό σφάλμα. Υπολογίζουμε μια διακύμανση μικρότερη κατά (Ν-1)/Ν. Όταν, όμως, διαιρούμε δια Ν-1, το πρόβλημα λύνεται.

Η Διακύμανση και η Τυπική Απόκλιση Η διακύμανση είναι ένας δείκτης υψωμένος στο τετράγωνο. Για παράδειγμα, αν μετράμε το μήκος σε μέτρα, η διακύμανση μετράει τετραγωνικά μέτρα. Για να απαλαγούμε από τα τετράγωνα, χρησιμοποιούμε την τετραγωνική ρίζα της Διακύμανσης, την οποία ονομάζουμε «Τυπική Απόκλιση»

Είδαμε τη διακύμανση ως μέτρο της απόστασης των τιμών από το μέσο όρο. Εναλλακτικά, μπορούμε να δούμε την απόσταση όλων των τιμών μεταξύ τους. Για παράδειγμα, για τρεις τιμές Χ1, Χ2, και Χ3, έχουμε τις διαφορές Χ1-Χ2, Χ1-Χ3, καθώς και Χ2-Χ3 (Γενικά, για Ν τιμές έχουμε Ν(Ν-1)/2 διαφορές). Για παράδειγμα, για τις τιμές 1, 4, 7, 10, 13, οι διαφορές ανά δύο ανάμεσα στις 5(5-1)/2= 10 διαφορές είναι μεταξύ τους -3, -6, -9, -12, -3, -6, -9, -3, -6 και -3. Αν προσθέσουμε τις διαφορές και τις διαιρέσουμε για τον αριθμό τους (10), βρίσκουμε μια τιμή πολύ κοντά προς τη διακύμανση. Στην ουσία, είναι το διπλάσιο της διακύμανσης. Δηλαδή:

Παράδειγμα Πειραματική ομάδα 5, 7, 17, 31, 45, 47, 68, 85, 96, 99 Ομάδα ελέγχου 29, 36, 37, 42, 49, 58, 62, 63, 69, 70 Πειραματική ομάδα Μέσος όρος: 50,0 Τυπική απόκλιση: 35,63 Ομάδα ελέγχου Μέσος όρος: 51,5 Τυπική απόκλιση 14,86

Εναλλακτικός υπολογισμός διακύμανσης Ι Το άθροισμα όρων Ν φορές είναι απλώς . Επίσης, το είναι αφού

Παράδειγμα Αθροίζουμε τα τετράγωνα των αρχικών τιμών, αφαιρούμε Ν φορές το τετράγωνο του μέσου όρου και διαιρούμε δια Ν. Για παράδειγμα, οι τιμές 1, 4, 7, 10, 13 έχουν μέσο όρο 7. Τα τετράγωνα των τιμών είναι 1, 16, 49, 100, και 169. Το άθροισμα των τετραγώνων είναι 335. Η διακύμανση είναι

Ιδιότητες της διακύμανσης Όταν στις αρχικές τιμές προσθέτουμε έναν αριθμό, η διακύμανση δεν αλλάζει. Για παράδειγμα, αν στις τιμές 1, 4, 7, 10, 13 προσθέσουμε το π.χ. 5, οι τιμές θα γίνουν 6, 9, 12, 15, και 18. Ο αρχικός μέσος όρος είναι 7 και ο νέος μέσος όρος είναι 7+5=12. Η διακύμανση είναι πάντα η ίδια, αφού οι αποστάσεις από τον νέο μέσο όρο παραμένουν -6, -3, 0, +3 και +6.

Εναλλακτικός υπολογισμός διακύμανσης ΙΙ Ο πιο πάνω τρόπος αποφεύγει τον υπολογισμό του μέσου όρου της κατανομής και είναι κάποιες φορές χρήσιμος

Ιδιότητες της διακύμανσης Όταν οι αρχικές τιμές πολλαπλασιάζονται με έναν αριθμό, η διακύμανση πολλαπλασιάζεται με τον ίδιο αριθμό. Αν μια κατανομή έχει μέσο όρο

Ασκήσεις Για τις τιμές 2, 5, 9, 10, 15, 19 υπολογίστε το εύρος, την μέση απόκλιση, τη διακύμανση του δείγματος, την τυπική απόκλιση του δείγματος Η διακύμανση σε ένα δείγμα Ν είναι 20. Ποια θα είναι η διακύμανση αν όλες οι τιμές πολλαπλασιαστούν με το 5 και αν διαιρεθούν με το 5;

Τυπικές τιμές Περιπτώσεις Χ x z Α 3 -7 -1,11 Β 6 -4 -0,63 Γ 7 -3 -0,47 Δ 9 -1 -0,16 Ε 15 5 0,79 Ζ 20 10 1,58 Άθροισμα 60 0,00 Μέσος όρος Τυπική απόκλιση (s) 6,32 1

Βαθμός s Ιστορία 65 8 Μαθηματικά 52 12 Τυπικές τιμές z Έστω ότι κάποιος πήρε 57 στην Ιστορία και 58 στα Μαθηματικά. Ο τυπικός βαθμός για την Ιστορία είναι 57-65)/8= -1,0 ενώ στα Μαθηματικά είναι (58-52)/12= 0,5.

Skewness and Kurtosis (Λοξότητα και Κύρτωση) 6 8 10 12 14 -4 -2 +2 +4 11 15 +1 +5

Ροπές

Skewness (Λοξότητα) -4 -2 +2 +4 -64 -8 +8 +64 +1 +5 +125

Ασκήσεις Δείξτε ότι Εκφράστε τις τιμές 2,4,5,6,8 σε τυπικές τιμές z. Πόσο είναι το άθροισμα των τετραγώνων των τυπικών τιμών; Ο μέσος όρος και η τυπική απόκλιση στη βαθμολογία στο μάθημα της Ιστορίας είναι 62 και 10 αντιστοίχως. Τρεις μαθητές βαθμολογήθηκαν με 50, 75 και 90 αντιστοίχως. Ποιες είναι οι τυπικές τιμές τους; Υπολογίστε την λοξότητα των δύο κατανομών: Ομάδα Α 2 3 5 10 20 Ομάδα Β 4 8 12 14