Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος Στατιστική Ανάλυση στην Εκπαιδευτική Έρευνα (Έκανα το πείραμα και πήρα τα δεδομένα…και τώρα τι κάνω; Χρήσιμες.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος Στατιστική Ανάλυση στην Εκπαιδευτική Έρευνα (Έκανα το πείραμα και πήρα τα δεδομένα…και τώρα τι κάνω; Χρήσιμες."— Μεταγράφημα παρουσίασης:

1 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος Στατιστική Ανάλυση στην Εκπαιδευτική Έρευνα (Έκανα το πείραμα και πήρα τα δεδομένα…και τώρα τι κάνω; Χρήσιμες συμβουλές για αρχάριους) Δρ. Παντελής Μ. Παπαδόπουλος Τμήμα Πληροφορικής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

2 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 2 / 48 Περιεχόμενα Σχεδίαση έρευνας Βασικά στοιχεία στατιστικής Test assumptions Κανονική κατανομή και outliers Σύγκριση ομάδων με παραμετρικά και μη παραμετρικά τεστ T-test, ANOVA, ANCOVA, Mann-Whitney, Kruskal-Wallis Effect size Συσχέτιση μεταβλητών Αξιοπιστία Παράρτημα Α: Τα τεστ στο SPSS Παράρτημα Β: Αγγλο-ελληνικό λεξικό στατιστικών όρων Πηγές

3 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 3 / 48 Σχεδίαση Έρευνας (1/5) Εξαιρετική προσοχή στη σχεδίαση της έρευνας!!! Η σχεδίαση της έρευνας προηγείται όλων των άλλων φάσεων ενός πειράματος – αν γίνει λάθος, δύσκολα διορθώνεται Σχεδίαση έρευνας, εκτέλεση έρευνας, συγκομιδή αποτελεσμάτων, ανάλυση αποτελεσμάτων, παρουσίαση συμπερασμάτων, eternal glory Σαφής καθορισμός συνθηκών / ομάδων Έλεγχος των μεταβλητών που επηρεάζουν το πείραμα Για τον έλεγχο μίας μεταβλητής Χ με Ν διαβαθμίσεις, χρειαζόμαστε Ν ομάδες οι οποίες να διαφέρουν μόνο στη μεταβλητή Χ Control group: συνθήκη που προσομοιάζει περισσότερο σε συνθήκες τυπικής δραστηριότητας (μπορεί να μην υπάρχει) Treatment group: συνθήκη στην οποία εφαρμόζουμε τη μέθοδο που θέλουμε να ελέγξουμε (μπορούμε να έχουμε πολλά)

4 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 4 / 48 Σχεδίαση Έρευνας (2/5) Παράδειγμα 1 Μεταβλητή: Επίδραση γραφημάτων σε κείμενο Control group: μελέτη με κείμενο χωρίς γραφήματα Treatment group: μελέτη με κείμενο που περιέχει γραφήματα Ισοδύναμος πληθυσμός: (χαρακτηριστικά που σχετίζονται με την έρευνα, π.χ. μορφωτικό επίπεδο, ηλικία, φύλο, ζώδιο) Ισοδύναμο υλικό: η πληροφορία που δίνεται στις δύο ομάδες πρέπει να είναι η ίδια (τα γραφήματα αναδιατυπώνουν τα όσα εμφανίζονται στο κείμενο, δεν προσθέτουν νέα πληροφορία) Εργαλεία: επιλογή κατάλληλων εργαλείων (ερωτηματολογίων, τεστ, κτλ) για την καταγραφή των δεδομένων που μας ενδιαφέρουν Έλεγχος: μέθοδος για την παρακολούθηση του πειράματος κατά την εκτέλεσή του

5 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 5 / 48 Σχεδίαση Έρευνας (3/5) Παράδειγμα 2 Μεταβλητή: Επίδραση χρώματος κειμένου Treatment group 1: μελέτη με μαύρο κείμενο Treatment group 2: μελέτη με μπλε κείμενο Treatment group 3: μελέτη με κόκκινο κείμενο Treatment…κτλ για όσα χρώματα μας ενδιαφέρει Ισοδύναμος πληθυσμός και ίδιες συνθήκες για όλες τις ομάδες

6 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 6 / 48 Σχεδίαση Έρευνας (4/5) Παράδειγμα 3 Μεταβλητή 1: Επίδραση γραφημάτων σε κείμενο Μεταβλητή 2: Επίδραση μικρών-κεφαλαίων Για περισσότερες από μία παραμέτρους χρειαζόμαστε ΝxΜxΚx… ομάδες, όπου Ν, Μ, Κ, κτλ οι διαβαθμίσεις των μεταβλητών Factorial design 2x2 Γραφήματα ΝαιΌχι Μέγεθος γραμμάτων ΜικράΓραΜιΚειΜι ΚεφαλαίαΓραΚεΚειΚε

7 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 7 / 48 Σχεδίαση Έρευνας (5/5) Ανεξάρτητες και εξαρτημένες μεταβλητές Ανεξάρτητη μεταβλητή: Μεταβλητή που προκαλεί ένα αποτέλεσμα Π.χ. Η ύπαρξη ή μη γραφημάτων σε κείμενο Οι ανεξάρτητες μεταβλητές χρησιμοποιούνται για τον καθορισμό ομάδων σε μία έρευνα Εξαρτημένη μεταβλητή: Μεταβλητές των οποίων η τιμή αλλάζει με βάση τις ανεξάρτητες μεταβλητές Π.χ. Οι επιδόσεις των φοιτητών σε ένα τεστ Οι επιδόσεις στο τεστ καθορίζονται από την ύπαρξη ή μη γραφημάτων σε κείμενο

8 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 8 / 48 Βασικά Στοιχεία Στατιστικής (1/3) Όροι στατιστικής Group size (N): το μέγεθος του δείγματος Mean (M): μέσος όρος τιμών του δείγματος Standard Deviation (SD): τυπική απόκλιση δείγματος Πόσο διάσπαρτες είναι οι τιμές μέσα στο δείγμα Μικρή τιμή δηλώνει ότι το δείγμα συμπεριφέρθηκε με έναν κοινό τρόπο Μεγάλη τιμή δηλώνει σημαντικές διαφορές στη συμπεριφορά/επιδόσεις/προτιμήσεις ατόμων του ίδιου δείγματος Probability (p): η πιθανότητα να ισχύει μία υπόθεση Confidence level (α): η ανεκτή πιθανότητα στατιστικού σφάλματος Συνηθισμένη τιμή στην εκπαιδευτική έρευνα: στα 20 τεστ θα παρουσιάσει εσφαλμένο αποτέλεσμα Confidence interval: 1 – α

9 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 9 / 48 Βασικά Στοιχεία Στατιστικής (2/3) Διατύπωση υποθέσεων Null hypothesis (H 0 ): μηδενική υπόθεση Υπόθεση που κάνετε εσείς ή το τεστ που εκτελείτε Ισχύει αν p > α Alternative hypothesis (Ha): εναλλακτική υπόθεση Διατυπώνεται εφόσον δεν ισχύει η μηδενική Παράδειγμα H 0α : "Οι φοιτητές της Ομάδας Α θα έχουν τις ίδιες επιδόσεις με τους φοιτητές της Ομάδας Β σε ένα τεστ για την προσληφθείσα γνώση πεδίου" Αποτελέσματα Α: (M=7.87, SD=1.24)B: (M=6.54, SD=1.27)p=0.06 (α=0.05) Η 0α : Δεκτή γιατί p > α

10 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 10 / 48 Βασικά Στοιχεία Στατιστικής (3/3) Είδη σφαλμάτων (ψιλά γράμματα, αλλά μπορεί να σας τύχει) Type I Error (α error): Απορρίπτεται λανθασμένα η μηδενική υπόθεση Type II Error (β error): Γίνεται λανθασμένα δεκτή η μηδενική υπόθεση Κλασικό παράδειγμα: Ερωτηματολόγιο με πολλές ερωτήσεις και ξεχωριστή εκτέλεση στατιστικού ελέγχου σε κάθε ερώτηση …θυμάστε το "1 στα 20 τεστ θα παρουσιάσει σφάλμα"; Διόρθωση του α Bonferroni correction: α/ν, όπου ν ο αριθμός των τεστ συνολικά στο πείραμα Καλή τύχη στην απόρριψη μηδενικών υποθέσεων! Benjamini-Hochberg: σταδιακή μείωση του α και καλύτερα αποτελέσματα στην αποδοχή/απόρριψη μηδενικών υποθέσεων Google

11 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 11 / 48 Test Assumptions "Αν η Γιαγιά μου είχε καρούλια…θα ήταν πατίνι" Κάθε στατιστικό τεστ βασίζεται σε ένα σύνολο υποθέσεων (κριτηρίων) Αν οι υποθέσεις δεν ισχύουν, το αποτέλεσμα του ελέγχου μπορεί να είναι λανθασμένο Δυστυχώς, πολύ συχνά δεν γίνεται έλεγχος των υποθέσεων Ο κυριότερος έλεγχος που μας ενδιαφέρει είναι αν μπορούμε να χρησιμοποιήσουμε στη στατιστική μας ανάλυση παραμετρικά τεστ Τα παραμετρικά τεστ εμφανίζονται περισσότερο στη βιβλιογραφία Είναι πιο ισχυρά και έχουν καλύτερη αντιμετώπιση από τους reviewers Τα μη παραμετρικά τεστ είναι η εναλλακτική που έχουμε

12 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 12 / 48 Test Assumptions Υποθέσεις παραμετρικών τεστ 1.Independence Δεν βασίζεται σε κάποιο στατιστικό τεστ, αλλά στη λογική της έρευνας Μία μέτρηση, π.χ. ο βαθμός ενός φοιτητή σε ένα τεστ, θα πρέπει να μην επηρεάζεται από τους βαθμούς άλλων φοιτητών Ανάλογα με το σχεδίαση της έρευνας, μπορεί να δοθεί διαφορετικό νόημα στην ανεξαρτησία Σε έρευνες συνεργατικής μάθησης, η ομάδα των φοιτητών θεωρείται μία οντότητα, οπότε η ανεξαρτησία αφορά στην ανεξαρτησία συνεργατικών ομάδων 2.Interval data Συνεχείς τιμές σε κλίμακα τιμών (π.χ. 1-10) Αν η βαθμολογία δύο φοιτητών σε ένα τεστ γνώσης είναι 7 και 10 αντίστοιχα, η διαφορά στην κλίμακα θα πρέπει να αντιπροσωπεύει αντίστοιχη πραγματική διαφορά στη γνώση Δεν υπάρχει στατιστικό τεστ για τον έλεγχο – βασίζεται στη λογική

13 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 13 / 48 Test Assumptions Υποθέσεις παραμετρικών τεστ 3.Homogeneity of variance Η διασπορά των δεδομένων θα πρέπει να είναι ίδια σε όλο το σύνολο δεδομένων που εξετάζουμε Ελέγχεται με το Levene's test 4.Normally distributed data Τα δεδομένα θα πρέπει να ακολουθούν κανονική κατανομή Ελέγχεται με το Kolmogorov-Smirov ή το Shapiro-Wilk test Αν θέλετε να χρησιμοποιήσετε παραμετρικά τεστ σε διαφορετικές ομάδες, θα πρέπει να κάνετε έλεγχο των παραπάνω υποθέσεων για κάθε ομάδα ξεχωριστά

14 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 14 / 48 Κανονική Κατανομή και Outliers (1/2) Όταν ένα δείγμα με μέσο όρο Μ και τυπική απόκλιση SD είναι σε κανονική κατανομή, τότε το διάγραμμα συχνοτήτων-τιμών σχηματίζει μία "καμπάνα" με το Μ στην κορυφή Στο διάστημα (Μ-SD, M+SD) υπάρχει το 68% των δεδομένων Λανθασμένη σχεδίαση της έρευνας και παρουσία outliers μπορεί να "γείρει" την καμπάνα δεξιά ή αριστερά Τότε παραβιάζεται το κριτήριο της κανονικής κατανομής Αυτός είναι ο πιο συχνός λόγος για απόρριψη των παραμετρικών τεστ

15 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 15 / 48 Κανονική Κατανομή και Outliers (2/2) Outliers σε ένα δείγμα είναι ακραίες τιμές που επηρεάζουν κατά πολύ τις τιμές Μ, SD του δείγματος Τυπικά βρίσκονται σε απόσταση ± 3 SD από το M Π.χ. Αν σε ένα δείγμα φοιτητών Μ=8.5, SD=1.00, τότε ένας φοιτητής με βαθμό 4.00 είναι outlier Ειδικά στην εκπαιδευτική έρευνα ο όρος του outlier μπορεί να περιλαμβάνει και φοιτητές που βρίσκονται πιο κοντά στο M Π.χ. Αν Μ=7.00, SD=2.00, τυπικά μόνο οι φοιτητές με βαθμό 1.00 θα είναι outliers. Ωστόσο μπορούν να χαρακτηριστούν έτσι και φοιτητές οι οποίοι εμφανώς δεν ασχολήθηκαν με τη δραστηριότητα και είχα βαθμό μικρότερο π.χ. του 4. Προσοχή! Χρειάζεται έλεγχος και για τυχόν outliers με πολύ υψηλότερη βαθμολογία από το υπόλοιπο δείγμα Η αφαίρεση των outliers από ένα δείγμα μπορεί να διορθώσει το σχήμα της καμπάνας!

16 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 16 / 48 Σύγκριση Δύο Ομάδων: T-test Σημ.: Σε όλα τα τεστ, το μέγεθος των δειγμάτων μπορεί να διαφέρει, αν και είναι καλό αυτή η διαφορά να είναι όσο το δυνατό μικρότερη T-test (ή Student's t-test) Παραμετρικό τεστ Fun fact: Δημιουργήθηκε από τον William Sealy Gosset, χημικός που εργαζόταν στο εργοστάσιο παρασκευής της μπύρας Guinness. Χρησιμοποίησε το όνομα "Student" κατά τη δημοσίευση του τεστ για λόγους εμπορικού απορρήτου. H 0 : Οι Μ των δύο δειγμάτων είναι ισοδύναμοι Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται H α : Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο δειγμάτων

17 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 17 / 48 Σύγκριση Δύο Ομάδων: Mann-Whitney Mann-Whitney Μη παραμετρικό τεστ Είναι το αντίστοιχο του t-test H 0 : Οι Μ των δύο δειγμάτων είναι ισοδύναμοι Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται H α : Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο δειγμάτων

18 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 18 / 48 Σύγκριση Περισσότερων Ομάδων: ANOVA Analysis of variance (ANOVA) Παραμετρικό τεστ Είναι το αντίστοιχο του t-test για περισσότερες από δύο ομάδες Για δύο ομάδες θα δώσει το ίδιο αποτέλεσμα με ένα t-test Εξετάζει αν υπάρχει στατιστικά σημαντική διαφορά μεταξύ όλων των ομάδων, αλλά και κατά ζεύγη H 0 : Οι Μ των δύο δειγμάτων είναι ισοδύναμοι Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται H α : Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δειγμάτων Post hoc tests: επιπλέον έλεγχοι για συγκρίσεις ανά ζεύγη Συνηθέστεροι: Fisher's LSD (ισοδύναμο του t-test), Bonferroni, Tukey LSD: Least Significant Difference (καμία σχέση με το διαιθυλαμίδιο του λυσεργικού οξέος!)

19 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 19 / 48 Σύγκριση Περισσότερων Ομάδων: ANCOVA Analysis of covariance (ANCOVA) Παραμετρικό τεστ Παρόμοιο της ANOVA: εκτός από τη μεταβλητή που μας ενδιαφέρει, λαμβάνει υπόψη και συμμεταβλητές (covariates) οι οποίες μπορεί να επηρεάζουν το αποτέλεσμα Π.χ. Ανεξάρτητη μεταβλητή: χρόνος δρομέα, Εξαρτημένη μεταβλητή: φύλο δρομέα, Συμμεταβλητή: ηλικία δρομέα Συνηθέστερη εμφάνιση σε έρευνες με pre-test, post-test Το αποτέλεσμα του post-test είναι η εξαρτημένη μεταβλητή Η πρότερη γνώση του φοιτητή (pre-test) είναι η συμμεταβλητή

20 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 20 / 48 Σύγκριση Περισσότερων Ομάδων: ANCOVA Analysis of covariance (ANCOVA) (συν.) Δύο επιπλέον προϋποθέσεις 1.Independence of the covariate and the treatment effect Η επίδραση της συμμεταβλητής θα πρέπει να είναι ανεξάρτητη της επίδρασης της ανεξάρτητης μεταβλητής στο τελικό αποτέλεσμα της εξαρτημένης μεταβλητής (!!!) Π.χ. Τόσο το φύλο (ανεξάρτητη) όσο και η ηλικία (συμμεταβλητή) του δρομέα μπορεί να επιδρούν στο χρόνο του (εξαρτημένη). Ωστόσο, η επίδραση πχ του φύλου θα πρέπει να είναι ανεξάρτητη της ηλικίας στον χρόνο. Με άλλα (πολύ πιο απλά) λόγια, η συμμεταβλητή θα πρέπει να κυμαίνεται με τον ίδιο τρόπο στα διάφορα δείγματα. Άρα μπορούμε να κάνουμε ένα t-test (ή ANOVA) παίρνοντας τη συμμεταβλητή ως εξαρτημένη μεταβλητή. Αν δεν υπάρχουν σημαντικά στατιστικές διαφορές, ισχύει το κριτήριο

21 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 21 / 48 Σύγκριση Περισσότερων Ομάδων: ANCOVA Analysis of covariance (ANCOVA) (συν.) Δύο επιπλέον προϋποθέσεις 2.Homogeneity of regression slopes Η σχέση της εξαρτημένης μεταβλητής και της συμμεταβλητής θα πρέπει να είναι ίδια σε όλα τα δείγματα Ο έλεγχος μπορεί να γίνει με εκτέλεση ANCOVA για custom model Αναλυτική περιγραφή των βημάτων στην ενότητα 11.7, σελ. 413 του βιβλίου: Andy Field (2009). Discovering Statistics Using SPSS 3 rd Edition

22 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 22 / 48 Σύγκριση Περισσότερων Ομάδων: Kruskal-Wallis Kruskal-Wallis Μη παραμετρικό τεστ Είναι το αντίστοιχο της ANOVA H 0 : Οι Μ των δύο δειγμάτων είναι ισοδύναμοι Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται H α : Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο δειγμάτων Για ελέγχους κατά ζεύγη, εκτέλεση του Mann-Whitney με όλους τους δυνατούς συνδυασμούς Δεν υπάρχει αντίστοιχο μη παραμετρικό τεστ της ANCOVA

23 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 23 / 48 Effect Size Η στατιστικά σημαντική διαφορά μεταξύ δειγμάτων δεν λέει από μόνη της πολλά Διαφορετικά δείγματα με διαφορετικό μέγεθος ή διαφορετική κλίμακα μπορεί να εμφανίσουν τις ίδιες διαφορές Το effect size είναι ένας τρόπος να συγκρίνουμε διαφορετικά αποτελέσματα μεταξύ τους Αντικειμενικό μέγεθος που μετράει την επίδραση μίας μεταβλητής σε μία άλλη (π.χ. η ανεξάρτητη στην εξαρτημένη) Υπάρχουν πολλοί διαφορετικοί τύποι υπολογισμού του effect size Συνηθέστεροι: T-test: Cohen's d ANOVA, ANCOVA: partial η 2 Το effect size είναι απαραίτητο μόνο όταν υπάρχει στατιστικά σημαντική διαφορά 0.75: large

24 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 24 / 48 Συσχέτιση Μεταβλητών: Pearson's r Pearson's correlation coefficient r Ελέγχει τη σχέση που διέπει δύο μεταβλητές Π.χ. ο χρόνος μελέτης ενός φοιτητή με το βαθμό στο τεστ Αν p < α τότε υπάρχει στατιστικά σημαντική συσχέτιση μεταξύ των δύο μεταβλητών Αν η τιμή του r είναι θετική, οι δύο μεταβλητές μεταβάλλονται με τον ίδιο τρόπο Αύξηση του χρόνου μελέτης σημαίνει και αύξηση του βαθμού στο τεστ Αν η τιμή του r είναι αρνητική, οι δύο μεταβλητές μεταβάλλονται αντίθετα Αύξηση του χρόνου μελέτης σημαίνει μείωση του βαθμού στο τεστ (!!!) Spearman's ρ: το αντίστοιχο μη παραμετρικό τεστ

25 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 25 / 48 Αξιοπιστία: Cronbach's α Cronbach's α Ελέγχει την αξιοπιστία ενός συνόλου μεταβλητών Ιδιαίτερα χρήσιμο για αξιολόγηση ερωτηματολογίων, τεστ, κτλ Κάθε ερώτηση είναι μία μεταβλητή Σε ένα αξιόπιστο ερωτηματολόγιο, ο φοιτητής απαντάει με τον ίδιο τρόπο κάθε απάντηση Σε ένα μη αξιόπιστο ερωτηματολόγιο, οι απαντήσεις παρουσιάζουν αντικρουόμενες απόψεις Όλες οι ερωτήσεις κατά την στατιστική ανάλυση θα πρέπει να έχουν την ίδια κατεύθυνση (π.χ. μία αρνητικά φορτισμένη απάντηση να αντιστραφεί σε θετική με αντίστοιχη αλλαγή τιμής 1  5, 2  4, κτλ) Όσο μεγαλύτερο το Cronbach's α, τόσο πιο αξιόπιστο το ερωτηματολόγιο Ιδανικά, α > 0.8

26 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος Παράρτημα Α Τα τεστ στο SPSS

27 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 27 / 48 T-test (1/3) Analyze>>Compare Means>>Independent-Samples T-test Test Variables: Οι εξαρτημένες μεταβλητές Grouping Variables: η ανεξάρτητη μεταβλητή Απόδοση αριθμητικών τιμών σε όλα τα πεδία π.χ. φύλο: Άνδρας=1, Γυναίκα=2

28 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 28 / 48 T-test (2/3) Levene's Test: αν το Sig. (p) είναι >0.05, τότε το κριτήριο για homogeneity of variance ισχύει Λαμβάνεται υπόψη η πρώτη γραμμή του πίνακα (αλλιώς, η δεύτερη) t: το αποτέλεσμα του t-test Όσο μεγαλύτερο το t, τόσο πιο μεγάλο θα είναι και το effect size Το πρόσημο δεν μας απασχολεί (σχετίζεται με το ποια ομάδα βάλαμε πρώτη) df: βαθμοί ελευθερίας Sig. (2-tailed): αυτό είναι το p

29 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 29 / 48 T-test (3/3) Παράδειγμα αναφοράς αποτελέσματος "Τα αποτελέσματα του t-test έδειξαν ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο ομάδων (t[22]=2.521, p=0.027, d=0.65) με την ομάδα πειράματος να εμφανίζει υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου"

30 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 30 / 48 ANOVA (1/3) Analyze>>Compare Means>>One-way ANOVA Dependent List: Οι εξαρτημένες μεταβλητές Factor: η ανεξάρτητη μεταβλητή Στα post hoc επιλέγετε Tukey, LSD, Bonferroni

31 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 31 / 48 ANOVA (2/3) Στα options υπάρχει το homogeneity of variance τεστ (θα πρέπει να είναι >0.05 για να ισχύει το κριτήριο) df: βαθμοί ελευθερίας ανάμεσα στις ομάδες Ο αριθμός των ομάδων - 1 df: βαθμοί ελευθερίας μέσα στις ομάδες Ο αριθμός όλου του πληθυσμού – αριθμός ομάδων F: το αποτέλεσμα της ANOVA Όσο μεγαλύτερο το F, τόσο πιο μεγάλο θα είναι και το effect size Sig.: αυτό είναι το p

32 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 32 / 48 ANOVA (3/3) Παράδειγμα αναφοράς αποτελέσματος "Τα αποτελέσματα ελέγχου ανάλυσης διακύμανσης (ANOVA) έδειξαν ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των ομάδων (F(2,15)=7.447, p=0.006, η 2 =0.54). Τα αποτελέσματα των Tukey post hoc τεστ έδειξαν ότι η Ομάδα Α είχε στατιστικά σημαντική διαφορά και από την Ομάδα Β (p=0.36) και από την Ομάδα Γ (p=0.25) έχοντας την υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου. Αντιθέτως οι ομάδες Β και Γ δεν παρουσίασαν μεταξύ τους στατιστικά σημαντική διαφορά."

33 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 33 / 48 ANCOVA (1/3) Analyze>>General Linear Model>>Univariate Dependent List: Η εξαρτημένη μεταβλητή Fixed Factor(s): οι ανεξάρτητες μεταβλητές Covariates: οι συμμετα- βλητές Στα options επιλέγεται Homogeneity of variance Estimates of effect size Στο Post Hoc επιλέγετε LSD, Bonferonni, Tukey

34 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 34 / 48 ANCOVA (2/3) Αποτελέσματα ανεξάρτητης μεταβλητής (Group) Αποτελέσματα συμμεταβλητής (Pre) Για τα F, df, Sig. ισχύει ότι και στην ANOVA Η τελευταία στήλη (Partial Eta Squared) είναι το effect size της ANCOVA

35 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 35 / 48 ANCOVA (3/3) Παράδειγμα αναφοράς αποτελέσματος "Τα αποτελέσματα ελέγχου ανάλυσης συνδιακύμανσης (ANCOVA) έδειξαν ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των ομάδων (F(2,50)=9.017, p=0.000, η 2 =0.265). Τα αποτελέσματα των Tukey posthoc τεστ έδειξαν ότι η Ομάδα Α είχε στατιστικά σημαντική διαφορά και από την Ομάδα Β (p=0.36) και από την Ομάδα Γ (p=0.25) έχοντας την υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου. Αντιθέτως οι ομάδες Β και Γ δεν παρουσίασαν μεταξύ τους στατιστικά σημαντική διαφορά."

36 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 36 / 48 Mann-Whitney (1/2) Analyze>>Nonparametric Tests>>2 Independent Samples Test Variable List: οι εξαρτημένες μεταβλητές Grouping Variable: η ανεξάρτητη μεταβλητή Επιλέγετε το Mann-Whitney U

37 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 37 / 48 Mann-Whitney (2/2) Mann-Whitney U: το αποτέλεσμα του τεστ Asymp. Sig. (2-tailed): το p Παράδειγμα αναφοράς αποτελέσματος "Τα αποτελέσματα ελέγχου Mann-Whitney U έδειξαν ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο ομάδων (U(22)=98.500, p=0.029) με την ομάδα πειράματος να εμφανίζει υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου "

38 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 38 / 48 Kruskal-Wallis (1/2) Analyze>>Nonparametric Tests>>K Independent Samples Test Variable List: Οι εξαρτημένες μεταβλητές Grouping Variable: η ανεξάρτητη μεταβλητή Επιλέγετε Kruskal-Wallis H

39 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 39 / 48 Kruskal-Wallis (2/2) Chi-Square (Χ 2 ): το αποτέλεσμα του τεστ Asymp. Sig.: το p Παράδειγμα αναφοράς αποτελέσματος "Τα αποτελέσματα ελέγχου Kruskal-Wallis H έδειξαν ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των ομάδων (Χ 2 (2)=14.763, p=0.001). Τα αποτελέσματα του post hoc ελέγχου Mann-Whitney U για τη σύγκριση των ομάδων κατά ζεύγη έδειξαν ότι…"

40 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 40 / 48 Pearson's r (1/2) Analyze>>Correlate>>Bivariate Variables: οι μεταβλητές που θέλουμε να εξετάσουμε Για παραμετρικό τεστ επιλέγετε Pearson, για μη παραμετρικό, Spearman

41 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 41 / 48 Pearson's r (2/2) Pearson Correlation: το αποτέλεσμα του τεστ Sig. (2-tailed): το p Παράδειγμα αναφοράς αποτελέσματος "Τα αποτελέσματα ελέγχου Pearson's r έδειξαν ότι υπάρχει στατιστικά σημαντική θετική συσχέτιση μεταξύ των μεταβλητών FirstSen και SecondSen (r=0.518, p=0.008)."

42 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 42 / 48 Cronbach's α Analyze>>Scale>>Reliability Analysis Items: οι μεταβλητές που θέλουμε να εξετάσουμε (ενός ερωτηματολογίου Κ) Το τεστ δίνει την τιμή του α Παράδειγμα αναφοράς αποτελέσματος "Η αξιοπιστία του ερωτημα- τολογίου ήταν ικανοποιη- τική (α=0.78)."

43 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 43 / 48 Kolmogorov-Smirov & Shapiro-Wilk (1/2) Analyze>>Descriptive Statistics>>Explore Dependent List: οι εξαρτημένες μεταβλητές Factor List: οι ανεξάρτητες μεταβλητές Επιλέγετε Plots Επιλέγετε Normality plots

44 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 44 / 48 Kolmogorov-Smirov & Shapiro-Wilk (2/2) Για δείγμα μεγέθους >30 λαμβάνετε υπόψη το Kolmogorv-Smirnov Για δείγμα μεγέθους <30 λαμβάνετε υπόψη το Shapiro-Wilk Θα πρέπει p < α, δηλ. p < 0.05 για να ισχύει το κριτήριο Γενικά, δεν αναφέρετε τα αποτελέσματα των ελέγχων που κάνετε για επιλογή παραμετρικών ή μη τεστ Παράδειγμα "Πραγματοποιήθηκαν οι έλεγχοι των υποθέσεων για χρήση παραμετρικών τεστ και τα αποτελέσματα έδειξαν ότι κανένα κριτήριο δεν παραβιάστηκε."

45 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος Παράρτημα Β Αγγλο-Ελληνικό Λεξικό Στατιστικών Όρων

46 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 46 / 48 alternative hypothesis (εναλλακτική υπόθεση) analysis of covariance (ανάλυση συνδιακύμανσης) analysis of variance (ανάλυση διακύμανσης) confidence level (επίπεδο εμπιστοσύνης) control group (ομάδα ελέγχου) correlation (συσχέτιση) covariate (συμμεταβλητή) dependent variable (εξαρτημένη μεταβλητή) effect size (μέγεθος επίδρασης) factorial design (παραγοντική σχεδίαση) homogeneity of variance (ομοιογένεια διακύμανσης) independence (ανεξαρτησία) independent variable (ανεξάρτητη μεταβλητή) mean (μέσος όρος) median (μέσος) null hypothesis (μηδενική υπόθεση) outlier (έκτροπες παρατηρήσεις) Pearson's correlation coefficient (συντελεστής συσχέτισης Pearson) post-test (μετα-έλεγχος) pre-test (προ-έλεγχος) probability (πιθανότητα) reliability (αξιοπιστία) standard deviation (τυπική απόκλιση) treatment group (ομάδα πειράματος) variable (μεταβλητή)

47 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 47 / 48 Πηγές Andy Field (2009). Discovering Statistics Using SPSS (and sex and drugs and rock 'n' roll) 3 rd Edition. SAGE Publications. Ελληνικό Στατιστικό Ινστιτούτο (2009). Λεξικό Στατιστικής Ορολογίας. Εκδόσεις Νέων Τεχνολογιών. Η παρουσίαση: Αρχείο για τον εύκολο υπολογισμό του Cohen's d

48 Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος 48 / 48 Ερωτήσεις;


Κατέβασμα ppt "Στατιστική Ανάλυση Δρ. Παντελής Μ. Παπαδόπουλος Στατιστική Ανάλυση στην Εκπαιδευτική Έρευνα (Έκανα το πείραμα και πήρα τα δεδομένα…και τώρα τι κάνω; Χρήσιμες."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google