Βασική Στατιστική Επεξεργασία. Ερμηνεία Δεδομένων - 2. © 2010 Demetrios Halazonetis. Δημήτρης Χαλαζωνίτης
Περιεχόμενα ANOVA Μη παραμετρικές μέθοδοι Χ2 Αντίστοιχα του t-test Συσχετίσεις, παλινδρόμηση Μέγεθος δείγματος
Είδη δεδομένων Ποιοτικά (categorical - qualitative) Μη διατάξιμα (nominal) Διατάξιμα (ordinal) Ποσοτικά (numerical - quantitative) Διακριτά (discrete) Συνεχή (continuous - interval)
Central Limit Theorem Κανονική κατανομή
ANOVA
ANOVA
ANOVA Total Sum of Squares Within Group SS Between Group SS
Total Sum of Squares Within Group SS Between Group SS DF SS Mean S F SST / df MST / MSE Within Groups n - g SSE / df Total n - 1 Total Sum of Squares Within Group SS Between Group SS
Μη παραμετρικές μέθοδοι Καμία προϋπόθεση όσον αφορά: Κατανομή Μεταβλητότητα Ποιοτικά διατάξιμα στοιχεία Μικρότερη ισχύ
Μη παραμετρικές μέθοδοι t-test Paired t-test ANOVA Two way ANOVA Pearson’s correlation Mann Whitney U-test Wilcoxon’s signed ranks test Kruskal-Wallis Friedman Spearman’s rank correlation
Chi-square X2 Σχιστία ΚΦ Σύνολο Κάπνισμα 25 1230 1255 Όχι κάπνισμα 6 1045 1051 31 2275 2306 (οι τιμές είναι αυθαίρετες) Προϋποθέσεις: Κάθε παρατήρηση ανήκει σε ένα μόνο κελί του πίνακα. Δεν πρέπει να υπάρχει τιμή μηδέν, και οι περισσότερες τιμές πρέπει να είναι > 5.
Chi-square X2 Σχιστία ΚΦ Σύνολο Κάπνισμα 25 (17) 1230 (1238) 1255 Όχι κάπνισμα 6 (14) 1045 (1037) 1051 31 2275 2306 X2 = ∑ [(O – E)2 / E] = 8.7 P = 0.0032
Correlation - Regression Συσχέτιση – Παλινδρόμηση
Δύναμη 78 107 21 18 96 89 93 32 77 102 56 80 54 61 111 97 14 39 83 68 131 40 78 117 118 121 83 108 115 152 107 134 75 88 119 139 25 56 85 Μετακίνηση Τυχαία στοιχεία
Δύναμη Μετακίνηση Αύξουσα ταξινόμηση 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Τυχαία στοιχεία
Δύναμη Μετακίνηση Αύξουσα ταξινόμηση Normal plot 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot 30 60 90 120 -2 -1 1 2 X Τυχαία στοιχεία
Δύναμη Μετακίνηση Αύξουσα ταξινόμηση Normal plot 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot 10 60 110 160 -2 -1 1 2 Y Τυχαία στοιχεία
Δύναμη Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Mean 70.7 97.9 Variance 1015.14 1155.94 Std. Deviation 31.86 33.99 Minimum 14 25 Maximum 111 152 Median 79.0 107.5 Τυχαία στοιχεία
Δύναμη Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Μηδενική υπόθεση Mean 70.7 97.9 Variance 1015.14 1155.94 Std. Deviation 31.86 33.99 Minimum 14 25 Maximum 111 152 Median 79.0 107.5 Τυχαία στοιχεία
Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Δύναμη 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Μηδενική υπόθεση Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Τυχαία στοιχεία
Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Δύναμη 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Μηδενική υπόθεση Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Δεν υπάρχει συν-μεταβλητότητα (covariation). Τυχαία στοιχεία
Covariation
Covariation
Covariation (x - mx) (y - my)
Covariation covariance = ∑(x - mx)(y - my)/(n-1) variance = ∑(x - mx)2/(n-1)
√(∑(x - mx)2∑(y - my)2) ∑(x - mx)(y - my) Covariation correlation =
Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Δύναμη 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Μηδενική υπόθεση Συσχέτιση Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Δεν υπάρχει συν-μεταβλητότητα (covariation). Τυχαία στοιχεία r = 0.833, P<0.05
Correlation coefficient (Pearson’s): r = 0.833, P<0.05 Δύναμη 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Μηδενική υπόθεση Συσχέτιση Correlation coefficient (Pearson’s): r = 0.833, P<0.05 Τυχαία στοιχεία Coefficient of determination: r2 = 0.694 = 69.4%
dependent independent 160 140 120 100 80 60 40 20 20 40 60 80 100 120 Τυχαία στοιχεία 80 60 40 20 20 40 60 80 100 120 independent
dependent independent 160 140 120 100 80 60 40 20 20 40 60 80 100 120 Τυχαία στοιχεία 80 60 40 20 20 40 60 80 100 120 independent
dependent residual independent 160 140 120 100 80 60 40 20 20 40 60 80 Τυχαία στοιχεία 80 60 40 20 20 40 60 80 100 120 independent
dependent independent 160 140 120 100 80 60 40 20 20 40 60 80 100 120 Τυχαία στοιχεία 80 60 40 20 20 40 60 80 100 120 independent
y = ax + b dependent slope (κλίση) intercept independent 160 140 120 100 Τυχαία στοιχεία 80 slope (κλίση) intercept 60 40 20 20 40 60 80 100 120 independent
dependent independent 160 140 120 100 80 60 40 20 20 40 60 80 100 120 Τυχαία στοιχεία 80 60 40 20 20 40 60 80 100 120 independent
80 y = 1x + 0 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80
80 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80
80 y = 0.8421x + 6.3158 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80
160 95% prediction interval 140 122 120 100 80 Τυχαία στοιχεία 80 60 40 38 20 20 40 60 80 100 120
Correlation - Regression Γραμμική συσχέτιση Κανονική κατανομή (μεταβλητών ή residuals)
450 400 350 y = 0.7378x + 29.576 R 2 = 0.4642 300 250 200 150 100 50 50 100 150 200 250 300 350 400
Correlation - Regression Γραμμική συσχέτιση Κανονική κατανομή (μεταβλητών ή residuals) Μην χρησιμοποιήσετε για έλεγχο σφάλματος ή σύγκριση μεθόδων! μέθοδος Bland – Altman: http://www-users.york.ac.uk/~mb55/meas/ba.htm
Γραμμή ισότητας y = 1.4893x + 50.654 R = 0.9945 50 100 150 200 250 20 50 100 150 200 250 20 40 60 80 120 Γραμμή ισότητας
Correlation - Regression Γραμμική συσχέτιση Κανονική κατανομή (μεταβλητών ή residuals) Μην χρησιμοποιήσετε για έλεγχο σφάλματος ή σύγκριση μεθόδων! Συσχέτιση δεν δείχνει σχέση αιτίου-αιτιατού!
Correlation - Regression Γραμμική συσχέτιση Κανονική κατανομή (μεταβλητών ή residuals) Μην χρησιμοποιήσετε για έλεγχο σφάλματος ή σύγκριση μεθόδων! Συσχέτιση δεν δείχνει σχέση αιτίου-αιτιατού! Προσοχή στις αυτόματες συσχετίσεις!
Χ Υ Χ - Υ y = 0.9088x - 76.281 R 2 = 0.4142 -80 -60 -40 -20 20 40 60 80 100 120 140 160 Το γράφημα δείχνει τη συσχέτιση του Χ με το Χ-Υ, όπου Χ και Υ δύο τυχαίες μεταβλητές με μηδενική μεταξύ τους συσχέτιση. Η αναμενόμενη συσχέτιση του Χ με το Χ-Υ είναι στατιστικώς σημαντική.
d1 d2
Πηγές και στατιστικά πακέτα Γενικές σελίδες http://statpages.org/ http://www.freestatistics.info/index.php Λογισμικό SPSS, SAS, … www.socr.ucla.edu Java λογισμικό (online), ελεύθερο http://folk.uio.no/ohammer/past/ www.statsdirect.com Απλό, με καλό αρχείο βοήθειας (£99) Υπολογισμός μεγέθους δείγματος http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/PowerSampleSize http://www.stat.uiowa.edu/~rlenth/Power/index.html
Ασκήσεις Angle Orthod 2010;80:435-439 Angle Orthod 2010;80:254–261