Βασική Στατιστική Επεξεργασία. Ερμηνεία Δεδομένων - 2.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Προβλέψεις με τη χρήση προτύπων γραμμικής παλινδρόμησης και συσχέτισης
Advertisements

Πιθανότητες & Τυχαία Σήματα
Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Στατιστική Ανάλυση στην Εκπαιδευτική Έρευνα (Έκανα το πείραμα και πήρα τα δεδομένα…και τώρα τι κάνω; Χρήσιμες συμβουλές για αρχάριους) Δρ. Παντελής Μ.
Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Μη παραμετρικά κριτήρια
Μπουντζιούκα Βασιλική, MSc Βιοστατιστικός Εξωτ. Συνεργάτης ΕΣΔΥ
Εισαγωγή στην Κοινωνιογλωσσολογία
© 2002 Thomson / South-Western Slide 1-1 Κεφάλαιο 1 Εισαγωγή στη Στατιστική με τη χρήση του Excel.
Factorial Analysis of Variance – Παραγοντική Ανάλυση Διακύμανσης
Ανάλυση Πολλαπλής Παλινδρόμησης
Eλέγχουμε αν η διαφορά μεταξύ δύο μέσων τιμών (Τ και P) είναι σημαντική (δηλ. αν διαφέρει από το 0 ή ότι δεν είναι τυχαία) χρησιμοποιώντας το t-test: Recall.
Διπλωματική Εργασία με θέμα: «ΠΡΟΣΤΙΘΕΜΕΝΗ ΑΞΙΑ ΕΣΩΤΕΡΙΚΟΥ ΕΛΕΓΧΟΥ
Σχέση μεταξύ ποιοτικών μεταβλητών Μπεττίνα Χάιδιτς Λέκτορας Υγιεινής-Ιατρικής Στατιστικής
Στατιστική I Χειμερινό Γ. Παπαγεωργίου
Στατιστική I Γ. Παπαγεωργίου XEIM Επιλογή μεθόδου Εξαρτάται από τον ερευνητή/τρια Ποιοτικά/ ποσοτικά όταν τα data αριθμοποιούνται. εδώ – Έμφαση.
Υποθέσεις: Ένα Δείγμα. ΤΥΠΙΚΕΣ ΤΙΜΕΣ Τιμές Ζ X = 50, μ = 100, σ = 30, Ζ =
Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Διάλεξη 5 Σύγκριση μέσω όρων
Μάρτιος 2011 Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σπύρος Βερονίκης Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Σχετικές πληροφορίες:
Πηγή: Βιοστατιστική [Β.Γ. Σταυρινός, Δ.Β. Παναγιωτάκος]
Ποσοτική Ανάλυση Κειμένου
Πειραματικές Μονάδες Ένα φυτό Ένα πειραματικό τεμάχιο (plot)
1 ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ ΠΑΡΑΔΟΣΗ 1Οη (Θ) Στοιχεία Επαγωγικής Στατιστικής.
Εργαστήριο Στατιστικής (7 ο Εργαστήριο) Συσχετίσεις μεταξύ μεταβλητών (ερωτήσεων)
Στατιστικές Υποθέσεις (Ερευνητικά Ερωτήματα / Υποθέσεις προς επιβεβαίωση)
Σχεδιασμός, Ανάλυση και Αξιολόγηση Συστημάτων Μεταφορών Ενότητα #9: Στατιστική ανάλυση αποτελεσμάτων. Χρήση SPSS. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή.
Γραμμική Συσχέτιση, Απλή και Πολλαπλή Γραμμική Παλινδρόμηση (Εργαστήριο Σχολής Κοινωνικών Επιστημών)
Σχεδιασμός Γεωργικών Πειραμάτων. Πειραματικές Μονάδες Ένα Φυτό Ένα Τεμάχιο (Plot) του χωραφιού.
Στατιστική Ανάλυση. Ποιοτικές και ποσοτικές μέθοδοι Ποιες είναι οι διαφορές; Πότε χρησιμοποιούνται; Πότε κάνω στατιστική ανάλυση;
Απλή Γραμμική Παλινδρόμηση & Συσχέτιση
Έλεγχος υποθέσεων με την χ2 «χι -τετράγωνο» κατανομή
ΠΕΡΙΓΡΑΦΙΚΗ ΒΙΟΣΤΑΤΙΣΤΙΚΗ – Ποσοτικές μεταβλητές
Ανάλυση- Επεξεργασία των Δεδομένων
Στατιστικές Υποθέσεις
Βασική Στατιστική Επεξεργασία. Ερμηνεία Δεδομένων.
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική
Επαγωγική Στατιστική Εκτίμηση και Έλεγχος μέσων τιμών Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Στατιστικές Υποθέσεις
Συντελεστής συσχέτισης
Διαχείριση και ανάλυση δεδομένων
Εκτιμητική: σημειακές εκτιμήσεις παραμέτρων
Εκτιμητική: σημειακές εκτιμήσεις παραμέτρων
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
Εισαγωγή στην Στατιστική
Εισαγωγή στην Ανάλυση Γλωσσικών Δεδομένων
Στατιστικές Υποθέσεις II
Ανάλυση Διακύμανσης κατά ένα παράγοντα
Διαλέξεις στη Βιοστατιστική
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
Κανονικότητα Μια από τις υποθέσεις του υποδείγματος της γραμμικής παλινδρόμησης είναι ότι ο διαταρακτικός όρος κατανέμεται κανονικά με μέσο μηδέν και σταθερή.
Στατιστικές δοκιμασίες που χρησιμοποιούνται συχνά Παραμετρική δοκιμασία Αντίστοιχη μη-παραμετρική δοκιμασία Λόγος εφαρμογής Παράδειγμα t test για.
Σχεδιασμός Γεωργικών Πειραμάτων
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Πειραματικές Μονάδες Ένα φυτό Ένα πειραματικό τεμάχιο (plot)
Σχεδιασμός των Μεταφορών
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ
Σχέση μεταξύ δυο ποσοτικών μεταβλητών & Μονοπαραγοντική γραμμική εξάρτηση 2017.
Στατιστικές Υποθέσεις
ΜΗ ΠΑΡΑΜΕΤΡΙΚΟΙ ΕΛΕΓΧΟI ΥΠΟΘΕΣΕΩΝ
Μέθοδοι Έρευνας Στις Επιχειρήσεις και την Οικονομία
Τ. Ε. Ι. Αθήνας Τμήμα Ιατρικών Εργαστηρίων ΒΙΟΣΤΑΤΙΣΤΙΚΗ
Μεθοδολογία Έρευνας Διάλεξη 9η: Ανάλυση Ποσοτικών Δεδομένων
Στατιστικές Υποθέσεις
Βιοστατιστική (Θ) ΤΕΙ Αθήνας Ενότητα 3: Περιγραφική στατιστική
Κεφάλαιο 12 Απλή Γραμμική Παλινδρόμηση.
Ανάλυση Διασποράς (ANOVA) Κατά Έναν Παράγοντα
ΕΛΕΓΧΟΣ ΑΝΕΞΑΡΤΗΣΙΑΣ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ
Επαγωγική Στατιστική Γραμμική παλινδρόμηση-Linear Regression Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Ανάλυση διακύμανσης Τι είναι η ανάλυση διακύμανσης
Μεταγράφημα παρουσίασης:

Βασική Στατιστική Επεξεργασία. Ερμηνεία Δεδομένων - 2. © 2010 Demetrios Halazonetis. Δημήτρης Χαλαζωνίτης

Περιεχόμενα ANOVA Μη παραμετρικές μέθοδοι Χ2 Αντίστοιχα του t-test Συσχετίσεις, παλινδρόμηση Μέγεθος δείγματος

Είδη δεδομένων Ποιοτικά (categorical - qualitative) Μη διατάξιμα (nominal) Διατάξιμα (ordinal) Ποσοτικά (numerical - quantitative) Διακριτά (discrete) Συνεχή (continuous - interval)

Central Limit Theorem Κανονική κατανομή

ANOVA

ANOVA

ANOVA Total Sum of Squares Within Group SS Between Group SS

Total Sum of Squares Within Group SS Between Group SS DF SS Mean S F SST / df MST / MSE Within Groups n - g SSE / df Total n - 1 Total Sum of Squares Within Group SS Between Group SS

Μη παραμετρικές μέθοδοι Καμία προϋπόθεση όσον αφορά: Κατανομή Μεταβλητότητα Ποιοτικά διατάξιμα στοιχεία Μικρότερη ισχύ

Μη παραμετρικές μέθοδοι t-test Paired t-test ANOVA Two way ANOVA Pearson’s correlation Mann Whitney U-test Wilcoxon’s signed ranks test Kruskal-Wallis Friedman Spearman’s rank correlation

Chi-square X2 Σχιστία ΚΦ Σύνολο Κάπνισμα 25 1230 1255 Όχι κάπνισμα 6 1045 1051 31 2275 2306 (οι τιμές είναι αυθαίρετες) Προϋποθέσεις: Κάθε παρατήρηση ανήκει σε ένα μόνο κελί του πίνακα. Δεν πρέπει να υπάρχει τιμή μηδέν, και οι περισσότερες τιμές πρέπει να είναι > 5.

Chi-square X2 Σχιστία ΚΦ Σύνολο Κάπνισμα 25 (17) 1230 (1238) 1255 Όχι κάπνισμα 6 (14) 1045 (1037) 1051 31 2275 2306 X2 = ∑ [(O – E)2 / E] = 8.7 P = 0.0032

Correlation - Regression Συσχέτιση – Παλινδρόμηση

Δύναμη 78 107 21 18 96 89 93 32 77 102 56 80 54 61 111 97 14 39 83 68 131 40 78 117 118 121 83 108 115 152 107 134 75 88 119 139 25 56 85 Μετακίνηση Τυχαία στοιχεία

Δύναμη Μετακίνηση Αύξουσα ταξινόμηση 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Τυχαία στοιχεία

Δύναμη Μετακίνηση Αύξουσα ταξινόμηση Normal plot 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot 30 60 90 120 -2 -1 1 2 X Τυχαία στοιχεία

Δύναμη Μετακίνηση Αύξουσα ταξινόμηση Normal plot 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot 10 60 110 160 -2 -1 1 2 Y Τυχαία στοιχεία

Δύναμη Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Mean 70.7 97.9 Variance 1015.14 1155.94 Std. Deviation 31.86 33.99 Minimum 14 25 Maximum 111 152 Median 79.0 107.5 Τυχαία στοιχεία

Δύναμη Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Μηδενική υπόθεση Mean 70.7 97.9 Variance 1015.14 1155.94 Std. Deviation 31.86 33.99 Minimum 14 25 Maximum 111 152 Median 79.0 107.5 Τυχαία στοιχεία

Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Δύναμη 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Μηδενική υπόθεση Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Τυχαία στοιχεία

Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Δύναμη 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Μηδενική υπόθεση Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Δεν υπάρχει συν-μεταβλητότητα (covariation). Τυχαία στοιχεία

Covariation

Covariation

Covariation (x - mx) (y - my)

Covariation covariance = ∑(x - mx)(y - my)/(n-1) variance = ∑(x - mx)2/(n-1)

√(∑(x - mx)2∑(y - my)2) ∑(x - mx)(y - my) Covariation correlation =

Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Δύναμη 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Μηδενική υπόθεση Συσχέτιση Δεν υπάρχει συσχέτιση μεταξύ δύναμης και μετακίνησης. Δεν υπάρχει συν-μεταβλητότητα (covariation). Τυχαία στοιχεία r = 0.833, P<0.05

Correlation coefficient (Pearson’s): r = 0.833, P<0.05 Δύναμη 14 18 21 32 39 54 56 61 77 78 80 83 89 93 96 97 102 107 111 25 78 40 83 56 75 107 88 108 68 134 85 118 121 117 139 152 115 131 119 Μετακίνηση Αύξουσα ταξινόμηση Normal plot Περιγραφικά στοιχεία Μηδενική υπόθεση Συσχέτιση Correlation coefficient (Pearson’s): r = 0.833, P<0.05 Τυχαία στοιχεία Coefficient of determination: r2 = 0.694 = 69.4%

dependent independent 160 140 120 100 80 60 40 20 20 40 60 80 100 120 Τυχαία στοιχεία 80 60 40 20 20 40 60 80 100 120 independent

dependent independent 160 140 120 100 80 60 40 20 20 40 60 80 100 120 Τυχαία στοιχεία 80 60 40 20 20 40 60 80 100 120 independent

dependent residual independent 160 140 120 100 80 60 40 20 20 40 60 80 Τυχαία στοιχεία 80 60 40 20 20 40 60 80 100 120 independent

dependent independent 160 140 120 100 80 60 40 20 20 40 60 80 100 120 Τυχαία στοιχεία 80 60 40 20 20 40 60 80 100 120 independent

y = ax + b dependent slope (κλίση) intercept independent 160 140 120 100 Τυχαία στοιχεία 80 slope (κλίση) intercept 60 40 20 20 40 60 80 100 120 independent

dependent independent 160 140 120 100 80 60 40 20 20 40 60 80 100 120 Τυχαία στοιχεία 80 60 40 20 20 40 60 80 100 120 independent

80 y = 1x + 0 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80

80 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80

80 y = 0.8421x + 6.3158 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80

160 95% prediction interval 140 122 120 100 80 Τυχαία στοιχεία 80 60 40 38 20 20 40 60 80 100 120

Correlation - Regression Γραμμική συσχέτιση Κανονική κατανομή (μεταβλητών ή residuals)

450 400 350 y = 0.7378x + 29.576 R 2 = 0.4642 300 250 200 150 100 50 50 100 150 200 250 300 350 400

Correlation - Regression Γραμμική συσχέτιση Κανονική κατανομή (μεταβλητών ή residuals) Μην χρησιμοποιήσετε για έλεγχο σφάλματος ή σύγκριση μεθόδων! μέθοδος Bland – Altman: http://www-users.york.ac.uk/~mb55/meas/ba.htm

Γραμμή ισότητας y = 1.4893x + 50.654 R = 0.9945 50 100 150 200 250 20 50 100 150 200 250 20 40 60 80 120 Γραμμή ισότητας

Correlation - Regression Γραμμική συσχέτιση Κανονική κατανομή (μεταβλητών ή residuals) Μην χρησιμοποιήσετε για έλεγχο σφάλματος ή σύγκριση μεθόδων! Συσχέτιση δεν δείχνει σχέση αιτίου-αιτιατού!

Correlation - Regression Γραμμική συσχέτιση Κανονική κατανομή (μεταβλητών ή residuals) Μην χρησιμοποιήσετε για έλεγχο σφάλματος ή σύγκριση μεθόδων! Συσχέτιση δεν δείχνει σχέση αιτίου-αιτιατού! Προσοχή στις αυτόματες συσχετίσεις!

Χ Υ Χ - Υ y = 0.9088x - 76.281 R 2 = 0.4142 -80 -60 -40 -20 20 40 60 80 100 120 140 160 Το γράφημα δείχνει τη συσχέτιση του Χ με το Χ-Υ, όπου Χ και Υ δύο τυχαίες μεταβλητές με μηδενική μεταξύ τους συσχέτιση. Η αναμενόμενη συσχέτιση του Χ με το Χ-Υ είναι στατιστικώς σημαντική.

d1 d2

Πηγές και στατιστικά πακέτα Γενικές σελίδες http://statpages.org/ http://www.freestatistics.info/index.php Λογισμικό SPSS, SAS, … www.socr.ucla.edu Java λογισμικό (online), ελεύθερο http://folk.uio.no/ohammer/past/ www.statsdirect.com Απλό, με καλό αρχείο βοήθειας (£99) Υπολογισμός μεγέθους δείγματος http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/PowerSampleSize http://www.stat.uiowa.edu/~rlenth/Power/index.html

Ασκήσεις Angle Orthod 2010;80:435-439 Angle Orthod 2010;80:254–261