Περιγραφικά μέτρα κεντρικής τάσης και διασποράς μιας Ποσοτικής μεταβλητής σε σχέση με μία Ποιοτική μεταβλητή (εντολή By variable) π.χ. Να συγκριθούν οι καπνιστές και οι μη καπνιστές(Ποιοτική μεταβλητή Smokes) ως προς τον σφυγμό τους (Ποσοτική μεταβλητή Pulse 2) α) με βάση τα περιγραφικά μέτρα και β) με γραφικές παραστάσεις – Να εξεταστεί η ύπαρξη ακραίων τιμών (box-plot και Steam-and-leaf) α)Stat Basic statistics Display Descriptive Statistics Επιλέγω ποσοτική μεταβλητή: Pulse 2 (Variables) και στο ίδιο παράθυρο διαλόγου επιλέγω : By variable ποιοτική μεταβλητή: Smokes Graphs Graphical Summary 2 φορές οκ
Στο παράθυρο Session εμφανίζονται τα παρακάτω: Descriptive Statistics Variable Smokes N Mean Median TrMean StDev Pulse ,18 77,00 80,92 15, ,48 76,00 78,22 17,88 Variable Smokes SE Mean Minimum Maximum Q1 Q3 Pulse2 1 2,91 54,00 115,00 70,50 93,50 2 2,23 50,00 140,00 68,00 84,00 Όπου 1= καπνιστής 2= μη καπνιστής
Α) Μέτρα θέσης ή Κεντρικής τάσης : 1) Καπνιστές(Group1) 1)Ο μέσος αριθμητικός ή μέση τιμή (Mean Value, ) = 81,18 2)Διάμεσος (Μ,Median) = 77 3)Τεταρτημόρια (Quartiles) : α) 1ο τεταρτημόριο Q1 = 70,50 β) 2ο τεταρτημόριο (Διάμεσος Μ) Q2 = 77 γ) 3ο τεταρτημόριο Q3 = 93,50 4)Επικρατούσα τιμή ( Μο, Μode) Μο = 3 * Μ – 2 * Χ = = 3*77-2*81,18 = 68,64 Β) Μέτρα Διασποράς ή Μεταβλητότητας : 1) Καπνιστές 1)Εύρος μεταβολής ή εύρος (Range) : R = Xmax – Xmin = =61 2)Ενδοτεταρτημοριακό Εύρος (Interquartile Range, Q) : Q = Q3 – Q1 = 93,50 – 70,50 = 23
3) Διακύμανση (variance, s 2 ) = 236,967 4) Τυπική απόκλιση (Standard deviation, s) StDev = 15,39 ή επειδή η τυπική απόκλιση ορίζεται ως η τετραγωνική ρίζα της διακύμανσης δηλ. μπορούμε και να την υπολογίσουμε από το μενού Calk Calculator και στο Expression: επιλέγω συνάρτηση square root SQRT(number) SQRT(236,967) s = StDev = 15,39 5) Ο συντελεστής μεταβλητότητας (coefficient of variation, CV) * 100 = 15,39 / 81,18 * 100 = 18,96 ≈ 19 % > 10% Άρα το δείγμα είναι ανομοιογενές
Γ) Μέτρα Ασυμμετρίας: 1) Καπνιστές 1ος τρόπος έλεγχος ασυμμετρίας : Mo < M < ή Mode < Median < Mean 68,64 < 77 < 81,18 Θετική ασυμμετρία Xmin Xmax Mo < M < 2ος τρόπος έλεγχος ασυμμετρίας : Skewness = 0, >0 Θετική ασυμμετρία το πλήθος των παρατηρήσεων βρίσκεται δεξιά της κορυφής
Α) Μέτρα θέσης ή Κεντρικής τάσης : 2) Μη Καπνιστές(Group2) 1)Ο μέσος αριθμητικός ή μέση τιμή (Mean Value, ) = 79,48 2)Διάμεσος (Μ,Median) = 76 3)Τεταρτημόρια (Quartiles) : α) 1ο τεταρτημόριο Q1 = 68 β) 2ο τεταρτημόριο (Διάμεσος Μ) Q2 = 76 γ) 3ο τεταρτημόριο Q3 = 84 4)Επικρατούσα τιμή ( Μο, Μode) Μο = 3 * Μ – 2 * Χ = = 3 * 76 – 2 * 79,48 = 69,04 Β) Μέτρα Διασποράς ή Μεταβλητότητας : 2) Μη Καπνιστές 1)Εύρος μεταβολής ή εύρος (Range) : R = Xmax – Xmin = =90 2)Ενδοτεταρτημοριακό Εύρος (Interquartile Range, Q) : Q = Q3 – Q1 = 84 – 68 = 16
3) Διακύμανση (variance, s 2 ) = 319,619 4) Τυπική απόκλιση (Standard deviation, s) StDev = 17,88 ή επειδή η τυπική απόκλιση ορίζεται ως η τετραγωνική ρίζα της διακύμανσης δηλ. μπορούμε και να την υπολογίσουμε από το μενού Calk Calculator και στο Expression: επιλέγω συνάρτηση square root SQRT(number) SQRT(319,619) s = StDev = 17,88 5) Ο συντελεστής μεταβλητότητας (coefficient of variation, CV) * 100 = 17,88 / 79,48 * 100 = 22,50 ≈ 22 % > 10% Άρα το δείγμα είναι ανομοιογενές
Γ) Μέτρα Ασυμμετρίας: 2) Μη Καπνιστές 1ος τρόπος έλεγχος ασυμμετρίας : Mo < M < ή Mode < Median < Mean 69,04 < 76 < 79,48 Θετική ασυμμετρία Xmin Xmax Mo < M < 2ος τρόπος έλεγχος ασυμμετρίας : Skewness = 1,36980 >0 Θετική ασυμμετρία το πλήθος των παρατηρήσεων βρίσκεται δεξιά της κορυφής
Δ)ΕΦΑΡΜΟΓΗ ΕΜΠΕΙΡΙΚΟΥ ΚΑΝΟΝΑ: Καπνιστές 1)(X – S, X + S ) ≈ 68 % (81, ,39, 81, ,39) = (65,79, 96,57) ΆΡΑ οι σφυγμοί για το 68% των καπνιστών κυμαίνονται από 65,79 έως 95,57 2) (X – 2S, X + 2S ) ≈ 95 % (81,18 - 2* 15,39, 81,18 + 2* 15,39) = (50,40, 111,96) ΆΡΑ οι σφυγμοί για το 95% των καπνιστών κυμαίνονται από 50,40 έως 111,96 3) (X – 3S, X + 3S ) ≈ 99 % (81,18 - 3* 15,39, 81,18 + 3* 15,39) (35,01, 127,35) ΆΡΑ οι σφυγμοί για το 99% των καπνιστών κυμαίνονται από 35,01 έως 127,35
Δ)ΕΦΑΡΜΟΓΗ ΕΜΠΕΙΡΙΚΟΥ ΚΑΝΟΝΑ: Μη Καπνιστές 1)(X – S, X + S ) ≈ 68 % (79, ,88, 79, ,88) = (61,60, 97,36) ΆΡΑ οι σφυγμοί για το 68% των μη καπνιστών κυμαίνονται από 61,60 έως 97,36 2) (X – 2S, X + 2S ) ≈ 95 % (79,48 - 2* 17,88, 79,48 + 2* 17,88) = (43,72, 115,24) ΆΡΑ οι σφυγμοί για το 95% των μη καπνιστών κυμαίνονται από 43,72 έως 115,24 3) (X – 3S, X + 3S ) ≈ 99 % (79,48 - 3* 17,88, 79,48 + 3* 17,88) (25,84, 133,12) ΆΡΑ οι σφυγμοί για το 99% των μη καπνιστών κυμαίνονται από 25,84 έως 133,12
β) Θηκόγραμμα : Box plot (Ανίχνευση ακραίων τιμών) Graphs Boxplot Επιλέγω ποσοτική μεταβλητή: Pulse 2 στο Y (measurement) και ποιοτική μεταβλητή: Smokes στο Χ (category) Annotation: επιλέγω Outlier labels… και επιλέγω Show Outlier labels και μία φορά οκ
Ομοίως Median Labels, Mean Labels
Διάγραμμα μίσχου-φύλλου (Steam and Leaf) Μενού Graphs Steam and Leaf Επιλέγω ποσοτική μεταβλητή: Pulse 2 (Variables) και στο ίδιο παράθυρο διαλόγου επιλέγω : By variable ποιοτική μεταβλητή: Smokes ΟΚ
Stem-and-leaf of Pulse2 Smokes = 1 N = 28 Leaf Unit = 1, (9)
Stem-and-leaf of Pulse2 Smokes = 2 N =64 Leaf Unit = 1, (21)
Κοινή Κατανομή Δύο Ποιοτικών Μεταβλητών. Πίνακες Συνάφειας: Ταξινομούνται τα δεδομένα σε πίνακα ως προς δύο ποιοτικές μεταβλητές καθώς και η μέση τιμή, διάμεσος, τυπική απόκλιση κλπ. μιας ποσοτικής μεταβλητής για κάθε κατηγορία των ποιοτικών μεταβλητών. Δηλ. εξετάζουμε την συνάφεια μεταξύ μιας ΠΟΣΟΤΙΚΗΣ μεταβλητής με δύο ΠΟΙΟΤΙΚΕΣ μεταβλητές. 1)STAT TABLES CROSS TABULATION CLASSIFICATION VARIABLES : 2 ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ( Smokes Activity) DISPLAY: ΕΠΙΛΕΓΩ COUNTS, ROW PERCENTS, COLUMN PERCENTS, TOTAL PERCENTS και οκ
Rows: Smokes Columns: Activity ΚΑΘΟΛΟΥ 0 ΜΙΚΡΗ 1 ΜΕΤΡΙΑ 2 ΕΝΤΟΝΗ 3 All ΚΑΠΝΙΣΤΕΣ 1 1 3,57 100,00 1, ,71 33,33 3, ,86 31,15 20, ,86 23,81 5, ,00 30,43 ΜΗ ΚΑΠΝΙΣΤΕΣ ,37 66,67 6, ,62 68,85 45, ,00 76,19 17, ,00 69,57 All 1 1,09 100,00 1,09 9 9,78 100,00 9, ,30 100,00 66, ,83 100,00 22, ,00 Cell Contents Count Συχνότητες % of Row Ποσοστά γραμμών % of Col Ποσοστά στηλών % of Tbl Ποσοστά Ολικά
2)STAT TABLES CROSS TABULATION CLASSIFICATION VARIABLES : 2 ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ SUMMARIES ASSOCIATED VARIABLES : 1 ΠΟΣΟΤΙΚΗ ΜΕΤΑΒΛΗΤΗ ΚΑΙ 2 ΦΟΡΕΣ ΟΚ ΠΡΟΣΟΧΗ: ΔΕΝ ΕΠΙΛΕΓΩ COUNTS, ROW PERCENTS, COLUMN PERCENTS, TOTAL PERCENTS
Rows: Smokes Columns: Activity ΚΑΘΟΛΟΥ 0 ΜΙΚΡΗ 1 ΜΕΤΡΙΑ 2 ΕΝΤΟΝΗ 3 All ΚΑΠΝΙΣΤΕΣ 1 150,00158,33152,26149,20152,29 ΜΗ ΚΑΠΝΙΣΤΕΣ ,50139,90146,69142,03 All 150,00149,11143,75147,29145,15 Cell Contents Weight: Mean
Ραβδόγραμμα (Chart): με δύο ποιοτικές μεταβλητές Graph Chart Μεταβλητή Activity (ποιοτική) 1) Data display, όπου for each βάζω Group και Group variables: Smokes 2) Options a) cluster (οι ράβδοι και των 2 μεταβλ. η μία δίπλα στην άλλη β) stack (οι ράβδοι και των 2 μεταβλ. η μία πάνω στην άλλη
α) cluster
β) stack