5o Μάθημα: Το τεστ χ2 Κέρκυρα
Πρώτα όμως μερικά θέματα εργασιών: Ποιες ερευνητικές μεθόδους χρησιμοποιούν οι παιδαγωγοί και οι ψυχολόγοι στα περιοδικά τους; (ανάλυση περιεχομένου, β.δ. 3). Ποια έντυπα καλούνται να συμπληρώσουν οι εκπαιδευτικοί ώστε να κάνουν έρευνα στα σχολεία (κριτική ανάγνωση, β.δ. 1). Ποια είναι τα κυριότερα φιλοσοφικά ζητήματα σχετικά με την μεθοδολογία εκπαιδευτικής έρευνας (παρουσίαση βιβλίου, β.δ. 2); Ποια είναι η θεματολογία των κυριότερων ξενόγλωσσων περιοδικών σε σχέση με τη μεθοδολογία εκπαιδευτικής έρευνας; (ανάλυση περιεχομένου, β.δ. 3) Παρουσίαση και σχολιασμός άρθρου εκπαιδευτικής έρευνας (κριτική ανάγνωση, β.δ. 1 ή 2 στο ξενόγλωσσο κείμενο).
Από πού θα μελετήσετε Νότα Κυριαζή (2002). Η Κοινωνιολογική Έρευνα: Κριτική Επισκόπηση των Μεθόδων και των Τεχνικών. Αθήνα, Ελληνικά Γράμματα. Σημειώσεις.
Κέρκυρα Έχουμε μιλήσει μέχρι στιγμής για: (α) την δημοσκόπηση, (β) την ανάλυση περιεχομένου, (γ) τις παραπομπές και την παρουσίαση της βιβλιογραφίας, (δ) την συνέντευξη. Σήμερα θα μιλήσουμε σε λίγο πιο μαθηματική γλώσσα.
Το τεστ χι τετράγωνο (chi-Square test) Έλεγχος προσαρμογής μίας μεταβλητής Έλεγχος συσχέτισης δύο μεταβλητών
Σύνθετες ερωτήσεις στην εκπαιδευτική έρευνα: Πρέπει η αστυνομία να επεμβαίνει στους χώρους των πανεπιστημίων;
Το τεστ χ2 Ελέγχει αν οι παρατηρούμενες συχνότητες μιας ποιοτικής μεταβλητής αντιστοιχούν επαρκώς σε κάποιες αναμενόμενες ή θεωρητικές συχνότητες. Ελέγχει αν κάποια ποιοτικά (ή αλλιώς «κατηγορικά») δεδομένα εντάσσονται σε ένα σύνολο παρόμοιων δεδομένων.
Έλεγχος προσαρμογής (Goodness of Fit) χ2«Απλής διαδρομής» (One way) Εξετάζει αν οι συχνότητες που παρατηρούμε στις κατηγορίες μιας απλής κατανομής συχνοτήτων στο δείγμα μας συμφωνούν με τις συχνότητες που υποθέτουμε ότι υπάρχουν στις κατηγορίες αυτές στον πληθυσμό.
Έλεγχος προσαρμογής
Έλεγχος προσαρμογής Παρατηρούμενες συχνότητες Οι συχνότητες που έχουμε σε κάθε κατηγορία.
Έλεγχος προσαρμογής Διατυπώνουμε την ερευνητική υπόθεση: «Η επιλογή διαδρόμου είναι τυχαία». Διατυπώνουμε τις δύο στατιστικές υποθέσεις:
Έλεγχος προσαρμογής 0,25 0,25 0,25 0,25 Τυχαία επιλογή
Έλεγχος προσαρμογής Αναμενόμενη συχνότητα Η υποθετική συχνότητα για κάθε κατανομή με δεδομένο ότι ισχύει η μηδενική υπόθεση. Ο αριθμός των περιπτώσεων επί το ποσοστό της κάθε μιας.
Η κατανομή χ2
Έλεγχος προσαρμογής Υπολογίζουμε: Βαθμοί ελευθερίας Ο αριθμός των κατηγοριών -1 (C) –1
Έλεγχος ανεξαρτησίας Υπολογίζουμε την «κρίσιμη» τιμή:
Έλεγχος ανεξαρτησίας Υπολογίζουμε την τιμή του τεστ. Σε κάθε κελί αφαιρούμε την θεωρητική συχνότητα από την παρατηρούμενη. Υψώνουμε το αποτέλεσμα στο τετράγωνο. Διαιρούμε το αποτέλεσμα δια τη θεωρητική συχνότητα. Προσθέτουμε όλα τα επί μέρους αποτελέσματα.
Έλεγχος προσαρμογής Υπολογίζουμε την τιμή του τεστ.
Έλεγχος προσαρμογής Ελέγχουμε αν το αποτέλεσμα είναι στατιστικώς σημαντικό: Απορρίπτουμε την H0 αφού 9.25>7.81 Ερμηνεύουμε: «Η συμπεριφορά του πειραματόζωου δεν είναι τυχαία».
Έλεγχος προσαρμογής: άλλο παράδειγμα Πολλοί συμβουλεύουν: «όταν γράφετε τεστ πολλαπλής επιλογής η πρώτη σας επιλογή είναι συνήθως και η σωστή». Ο Best (1979) μελέτησε τη συμπεριφορά 261 φοιτητών και φοιτητριών σε σχέση με την αλλαγή από σωστό σε λάθος και την αλλαγή από λάθος σε σωστό. Από τους 261 φοιτητές οι 195 άλλαξαν περισσότερα λάθη προς τη σωστή απάντηση παρά το αντίστροφο, ενώ 27 φοιτητές άλλαξαν περισσότερα σωστά τους προς το λάθος.
Έλεγχος προσαρμογής Διατυπώνουμε την ερευνητική υπόθεση: «Πρέπει να εμμένουμε στη πρώτη επιλογή σε τεστ πολλαπλής επιλογής» Διατυπώνουμε τις στατιστικές υπόθεσεις:
Έλεγχος προσαρμογής Παρατηρούμενες συχνότητες Αυτά που βρήκαμε για κάθε κατηγορία. σωστό προς λάθος λάθος προς σωστό Θεωρητικές 27 195 Αναμενόμενες (θεωρητικές) συχνότητες Οι υποτιθέμενες συχνότητες για κάθε κατανομή, δεδομένου ότι ισχύει η μηδενική υπόθεση. Τα αναμενόμενα ποσοστά επί τον συνολικό αριθμό των παρατηρήσεων. Αναμενόμενες 0,5 x 222 = 111 0,5 x 222 = 111 Σημείωση: Ο συνολικός αριθμός παρατηρήσεων, όχι το 100.
Έλεγχος προσαρμογής Βρίσκουμε στον πίνακα την κρίσιμη τιμή:
Έλεγχος προσαρμογής Υπολογίζουμε την τιμή του τεστ: σωστό προς λάθος λάθος προς σωστό Παρατηρούμενες 27 195 Θεωρητικές 111 111
Έλεγχος προσαρμογής Κρίνουμε αν το αποτέλεσμα είναι στατιστικώς σημαντικό: Απορρίπτουμε την H0 γιατί το 127,14 είναι πολύ μεγαλύτερο από το 3,84. Ερμηνεύουμε: Η αναλογία των αλλαγών από «σωστό προς λάθος» δεν είναι ίδια με την αναλογία των αλλαγών «λάθος προς σωστό».
Το τεστ χ2: Είναι πάντα θετικό γιατί οι τιμές των διαφορών των συχνοτήτων υψώνονται στο τετράγωνο. Είναι μηδέν στην σπάνια περίπτωση που οι θεωρητικές συχνότητες ταυτίζονται με τις παρατηρούμενες συχνότητες. Όσο πιο μεγάλες είναι οι διαφορές των συχνοτήτων, τόσο πιο μεγάλο είναι το χι τετράγωνο (όταν όλα τα άλλα είναι ίδια). Για την αύξηση της τιμής του χι τετράγωνο αυτό που μετράει δεν είναι μόνο το μέγεθος των διαφορών αλλά και το μέγεθος των διαφορών σε σχέση με το μέγεθος των αναμενόμενων συχνοτήτων. Η τιμή του εξαρτάται από το πλήθος των διαφορών που χρησιμοποιούνται στον υπολογισμό.
Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Εξετάζει αν οι παρατηρούμενες συχνότητες σε πίνακες διπλής εισόδου δηλώνουν ανεξαρτησία μεταξύ δύο ποιοτικών (κατηγορικών) μεταβλητών. Συγκρίνει τις παρατηρούμενες τιμές στο δείγμα μας σε σχέση με τις θεωρητικές τιμές που θα αναμέναμε αν δεν υπήρχε συσχέτιση μεταξύ των δύο μεταβλητών μας στον ευρύτερο πληθυσμό. Δύο μεταβλητές είναι ανεξάρτητες στην περίπτωση που η γνώση για την τιμής της πρώτης δεν μας δίνει καμιά πληροφορία σχετικά με την τιμή της δεύτερης.
Έλεγχος ανεξαρτησίας:
Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Έρευνες έχουν δείξει ότι οι έφηβοι γνωρίζουν για τους κινδύνους του AIDS, αλλά παρόλα αυτά συνεχίζουν να μην παίρνουν προφυλάξεις. Οι King & Anderson (1993) έκαναν σε ένα δείγμα εφήβων την εξής ερώτηση: «εάν σου δινόταν η ευκαιρία να κάνεις σεξ με όλους/ες τους/τις παρτενέρ (που θα ήθελες, αλλά στο τέλος μιας περιόδου 2 (ή 10) ετών θα πέθαινες από AIDS θα το ήθελες;» Οι έφηβοι απάντησαν σε μια κλίμακα άνισων διαστημάτων τύπου Likert. Η απάντηση «σίγουρα όχι» απετέλεσε μια κατηγορία. Οι κατηγορίες «μάλλον όχι», «δεν είμαι σίγουρος», «μάλλον ναι» και «σίγουρα ναι» ενώθηκαν στην κατηγορία «άλλο». Σίγουρα όχι Άλλο Άνδρες 451 165 Γυναίκες 509 118
Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Διατυπώνουμε την ερευνητική υπόθεση: Είναι το φύλο ανεξάρτητο από την σεξουαλική συμπεριφορά σε σχέση με την ανάληψη ρίσκου ως προς το AIDS; Διατυπώνουμε τη στατιστική υπόθεση.
Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Για να βρούμε τις αναμενόμενες συχνότητες: Βρίσκουμε τις συνολικές συχνότητες των γραμμών, των στηλών και του συνόλου του πίνακα: Σίγουρα όχι Άλλο Σύνολο Άνδρες 451 165 616 Γυναίκες 509 118 627 Σύνολο 960 283 1.243
Βρίσκουμε τις αναμενόμενες συχνότητες: Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Βρίσκουμε τις αναμενόμενες συχνότητες: Σίγουρα όχι Άλλο Σύνολο Άνδρες 451 (475,75) 165 616 Γυναίκες 509 118 627 Σύνολο 960 283 1243
Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Σίγουρα όχι Άλλο Σύνολο Άνδρες 451 (475,75) 165 616 Γυναίκες 509 (484,25) 118 627 Σύνολο 960 283 1.243
Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Σίγουρα όχι Άλλο Σύνολο Άνδρες 451 (475,75) 165 (140,25) 616 Γυναίκες 509 (484,25) 118 627 Σύνολο 960 283 1.243
Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Σίγουρα όχι Άλλο Σύνολο Άνδρες 451 (475,75) 165 (140,25) 616 Γυναίκες 509 (484,25) 118 (142,75) 627 Σύνολο 960 283 1.243
Βρίσκουμε την κρίσιμη τιμή: Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Βρίσκουμε την κρίσιμη τιμή: Βαθμοί ελευθερίας (αριθμός στηλών - 1) (αριθμός γραμμών -1) (c-1)(r-1) Σίγουρα όχι Άλλο Άνδρες 451 165 Γυναίκες 509 118
Βρίσκουμε την κρίσιμη τιμή. Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Βρίσκουμε την κρίσιμη τιμή.
Υπολογίζουμε την τιμή του τεστ: Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Υπολογίζουμε την τιμή του τεστ: Σίγουρα όχι Άλλο Σύνολο Άνδρες 451 (475,75) 165 (140,25) 616 Γυναίκες 509 (484,25) 118 (142,75) 627 Σύνολο 960 283 1243
Συγκρίνουμε την τιμή του τεστ με την κρίσιμη τιμή: Το χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Συγκρίνουμε την τιμή του τεστ με την κρίσιμη τιμή: Απορρίπτουμε την H0 γιατί 11,21>3,84 Συμπεραίνουμε ότι: «Η επιθυμία για σεξ χωρίς προφύλαξη δεν είναι ανεξάρτητη από το φύλο». Σίγουρα όχι Άλλο Σύνολο Άνδρες 451 (475,75) 165 (140,25) 616 Γυναίκες 509 (484,25) 118 (142,75) 627 Σύνολο 960 283 1.243
Ένα παράδειγμα χρήσης του χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Σε μια μεγάλη ιδιωτική επιχείρηση επελέγησαν 100 εργαζόμενοι που θεωρούνταν «πετυχημένοι» και 100 που θεωρούνταν λιγότερο πετυχημένοι. Οι εργαζόμενοι ρωτήθηκαν: «τι θεωρείτε πιο σημαντικό για εσάς, τα χρήματα που κερδίζετε ή την ικανοποίηση που παίρνετε από τη δουλειά;» Στους «πετυχημένους» το 49% δήλωσε «τα χρήματα», ενώ στο άλλο γκρουπ το αντίστοιχο ποσοστό ήταν 53%. Ελέγξτε την υπόθεση ότι η επίδοση στην εργασία είναι ανεξάρτητη από τα κίνητρα που έχει κάποιος, σε επίπεδο στατιστικής σημαντικότητας 0,01.
Διατυπώνουμε την ερευνητική υπόθεση. Ένα παράδειγμα χρήσης του χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Διατυπώνουμε την ερευνητική υπόθεση. Είναι η επίδοση στην εργασία ανεξάρτητη από τα κίνητρα των εργαζομένων; Διατυπώνουμε τη στατιστική υπόθεση.
Βρίσκουμε την κρίσιμη τιμή. Ένα παράδειγμα χρήσης του χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Βρίσκουμε την κρίσιμη τιμή.
Υπολογίζουμε την τιμή του τεστ: Ένα παράδειγμα χρήσης του χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Υπολογίζουμε την τιμή του τεστ: «Πετυχημένοι» «Λιγότερο πετυχημένοι» Σύνολο Χρήματα 49 (51) 53 (51) 102 Ικανοποίηση 51 (49) 47 (49) 98 Σύνολο 100 100 200
Υπολογίζουμε την τιμή του τεστ: Ένα παράδειγμα χρήσης του χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Υπολογίζουμε την τιμή του τεστ: «Πετυχημένοι» «Λιγότερο πετυχημένοι» Σύνολο Χρήματα 49 (51) 53 (51) 102 Ικανοποίηση 51 (49) 47 (49) 98 Σύνολο 100 100 200
Ένα παράδειγμα χρήσης του χ2 ως τεστ ανεξαρτησίας δύο μεταβλητών Συγκρίνουμε την τιμή του τεστ με την κρίσιμη τιμή: Δεν απορρίπτουμε την H0 γιατί: 0,32<6,64 Συμπεραίνουμε ότι: «Δεν βρέθηκε στατιστικώς σημαντική συσχέτιση μεταξύ της επίδοσης και του τύπου του κινήτρου». «Πετυχημένοι» «Λιγότερο πετυχημένοι» Σύνολο Χρήματα 49 (51) 53 (51) 102 Ικανοποίηση 51 (49) 47 (49) 98 Σύνολο 100 100 200
Η συμβουλή της Δευτέρας: αν θέλετε να αλλάξετε τον κόσμο, μια καλή αρχή είναι ο εαυτός σας.