Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Διάλεξη 5 Σύγκριση μέσω όρων 4/14/2017 Στατιστική IΙ (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: lzabetak@dpem.tuc.gr Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/Psycho/Zampetakis/ Τηλ. 28210 – 37323 Διάλεξη 5 Σύγκριση μέσω όρων Ρέθυμνο, 16-11-2009
Σημαντική Υπενθύμιση: 4/14/2017 Σημαντική Υπενθύμιση: Δεν υπάρχουν χαζές ερωτήσεις και δεν θα με προσβάλετε αν διακόπτετε με ρωτήσεις το μάθημα
4/14/2017 Πολλές φορές στην ψυχολογία δεν μας ενδιαφέρει η απλή συσχέτιση ανάμεσα σε μεταβλητές ή η πρόβλεψη ενός αποτελέσματος. αλλά… Μας ενδιαφέρει να διερευνήσουμε τη επίδραση μιας μεταβλητής (χ) σε μια άλλη (ψ) μεταβάλλοντας κατά συστηματικό τρόπο τις τιμές της (χ)
4/14/2017 Έτσι, αντί να μελετάμε φαινόμενα τα οποία εξελίσσονται φυσικά (νατουραλιστική έρευνα-correlational research) όπως στη συσχέτιση ή την παλινδρόμηση, επεμβαίνουμε σκόπιμα στις συνθήκες υπό τις οποίες εξελίσσονται τα φαινόμενα ( πειραματική έρευνα-experimental research).
4/14/2017 Ένα απλό παράδειγμα: Φανταστείτε ότι θέλουμε να δούμε ποιο είναι το αποτέλεσμα της ενθάρρυνσης στην εκμάθηση της Στατιστικής Για το σκοπό αυτό χωρίζω με τυχαίο τρόπο μερικούς φοιτητές σε δύο διαφορετικές ομάδες: ΟΜΑΔΑ 1. (Θετική ενθάρρυνση)-Στην ομάδα αυτή κατά τη διάρκεια των μαθημάτων συγχαίρω τους φοιτητές για την προσπάθεια τους και την επιτυχία. Ακόμα και σε φοιτητές οι οποίοι δίνουν λάθος απαντήσεις είμαι θετικός και τους υποστηρίζω ΟΜΑΔΑ 2. (Αρνητική ενθάρρυνση)-Σε αυτή την ομάδα ακολουθώ ένα συνηθισμένο στυλ διδασκαλίας και είμαι αδιάφορος ως καυστικός στις απαντήσεις των φοιτητών
μέθοδος διδασκαλίας (θετική - αρνητική ενθάρρυνση). 4/14/2017 Ο παράγοντας που ελέγχω στο προηγούμενο παράδειγμα είναι η…. Αυτή η μεταβλητή είναι η ανεξάρτητη μεταβλητή, η οποία στο παράδειγμα μας έχει δύο επίπεδα γιατί κάναμε παρέμβαση με δύο τρόπους. μέθοδος διδασκαλίας (θετική - αρνητική ενθάρρυνση). Αφού κάνω το πείραμα, μετράω το αποτέλεσμα που με ενδιαφέρει (Επίδοση στη στατιστική), και είναι ο βαθμό στις τελικές εξετάσεις. Το αποτέλεσμα αυτό είναι η εξαρτημένη μεταβλητή επειδή ακριβώς περιμένουμε ότι οι βαθμοί εξαρτώνται από τη μέθοδο διδασκαλίας
Μέθοδοι συλλογής Δεδομένων: 4/14/2017 1η μέθοδος να ελέγξουμε την ανεξάρτητη μεταβλητή χρησιμοποιώντας διαφορετικά άτομα. Δηλ. διαφορετικά άτομα σε κάθε πειραματικό χειρισμό (Between group ή between subjects design) Μέθοδοι συλλογής Δεδομένων: 2η μέθοδος να ελέγξουμε την ανεξάρτητη μεταβλητή χρησιμοποιώντας τα ίδια άτομα. Δηλ. τα ίδια άτομα λαμβάνουν θετική ενθάρρυνση για μερικές εβδομάδες και μετράω την απόδοση τους και στη συνέχεια λαμβάνουν αρνητική ενθάρρυνση για μερικές εβδομάδες και πάλι μετράω την απόδοση τους (within subjects ή repeated measures design) Η μέθοδος συλλογής των δεδομένων καθορίζει και το στατιστικό κριτήριο για την ανάλυση τους
4/14/2017 Το προηγούμενο παράδειγμα είναι πολύ απλό: Στην ουσία έχουμε μια ανεξάρτητη μεταβλητή και μια εξαρτημένη. Δύο μόνο είναι πειραματικές συνθήκες που θα συγκρίνουμε. Για αυτές τις περιπτώσεις χρησιμοποιούμε το στατιστικό κριτήριο με την ονομασία t-test
ΕΠΟΜΕΝΩΣ το στατιστικό τεστ που χρησιμοποιούμε όταν θέλουμε να μελετήσουμε φαινόμενα που περιλαμβάνουν ΣΥΓΚΡΙΣΕΙΣ μεταξύ ΔΥΟ Ομάδων είναι το t-test Ανεξάρτητα δείγματα (independent samples t-test) Εξαρτημένα δείγματα (paired samples t-test)
Ποια είναι η λογική πίσω από τα t-test? 4/14/2017 Ποια είναι η λογική πίσω από τα t-test? 1. Δύο δείγματα συλλέγονται (ένα για κάθε ομάδα) και υπολογίζουμε το μέσο όρο σε κάθε ένα από αυτά. Ο μέσος όρος μπορεί να διαφέρει πολύ ή λίγο. Προκειμένου να βγάλουμε κάποιο συμπέρασμα για μία τιμή της κατανομής (το σκορ κάποιου συμμετέχοντα), θα πρέπει να το συγκρίνουμε με τις άλλες τιμές. Πχ στο παράδειγμα της κατανομής ύψους 500 γυναικών, τι συμπέρασμα θα γβάζαμε για μία γυναίκα με ύψος 1.90μ; Θα πρέπει να υπάρχει ένα σημείο αναφοράς (μέτρο σύγκρισης), το οποίο εξαρτάται από τη θέση της τιμής είτε στην ιεραρχία των τιμών, είτε ως προς ένα δείκτη κεντρικής τάσης (συνήθως το μέσο όρο). Πχ η τιμή 50 σε μία κατανομή με μέσο όρο 54 μπορεί να εκφραστεί ως +4. Επιπλέον, αυτή η απόκλιση μπορεί να εκφραστεί με μονάδες τυπικής απόκλισης. Αν πχ η τυπική απόκλιση της κατανομής είναι 2, τότε η τιμή 54 βρίσκεται 2 τυπικές αποκλίσεις πάνω από τον μέσο όρο (4/2=2sds). Αντίστοιχα, η τιμή 46 είναι δύο τυπικές αποκλίσεις κάτω από τον μέσο όρο (46-50=-4/2=-2sds). Το πηλίκο της απόκλισης μιας τιμής προς την τυπική απόκλιση ονομάζεται μετατροπή σε τυπικές τιμές ή z-τιμές (standardised values or z-scores). Οι τυπικές τιμές συμβολίζονται με το z. Οι τυπικές τιμές εκφράζουν την απόσταση (απόκλιση) μιας τιμής από τον μέσο όρο σε τυπικές αποκλίσεις (και όχι στην αρχική μονάδα μέτρησης). ‘πόσες τυπικές αποκλίσεις απέχει από τον μέσο όρο μία συγκεκριμένη τιμή;’. Όταν οι τυπικές τιμές είναι θετικές, αυτό σημαινει ότι η αρχική τιμή είναι μεγαλύτερη από τον μέσο όρο, ενώ όταν οι z-τιμές έχουν αρνητικό πρόσημο, τότε αυτό σημαίνει ότι η αρχική τιμή είναι μικρότερη από τον μέσο όρο. Κυμαίνονται από το -4 ως το +4. Αυτό που μας προσφέρουν οι z-τιμές είναι η δυνατότητα σύγκρισης (ως προς την απόστασή τους από τον μέσο όρο της κατανομής τους) διάφορων τιμών που δεν προέρχονται από την ίδια κατανομή. Κι αυτό γιατί οι z-τιμές εκφράζονται σε μονάδες τυπικής απόκλισης, και είναι ανεξάρτητες από την αρχική μονάδα μέτρησης. ‘ποιά τιμή απείχε περισσότερο από τον μέσο όρο της κατανομής της;’. Με τις τυπικές τιμές μπορούμε να συγκρίνουμε απευθείας ή να κάνουμε αλγεβρικές πράξεις. Πχ έχουμε ένα αγόρι 14 ετών και ένα κορίτσι 11 ετών με ύψος 163cm και 130cm αντίστοιχα, και θέλουμε να δούμε ποιό είναι ψηλότερο. Πρέπει να τα συγκρίνουμε με τους συνομηλίκους τους του ίδιου φύλου. Αν οι μέσοι όροι και οι τυπικές αποκλίσεις των κατανομών αυτών είναι mean= 155cm, sd= 9cm και mean=128cm, sd= 7cm, θα είχαμε: Αγόρι: (163-155)/9= 0.89τυπικές απικλίσεις (περίπου 9/10 της τυπικής απόκλισης) Κορίτσι: (130-128)/7= 0.29 τυπικές αποκλίσεις (περίπου 3/10 της τυπικής απόκλισης) Συνεπώς το αγόρι θεωρείται ψηλότερο από το κορίτσι, σε σχέση με το μέσο όρο της ηλικίας του. Χαρακτηριστικά τυπικών τιμών: Η κατανομή των τυπικών τυμών έχει ίδιο σχήμα με αυτό της αρχικής κατανομής (η θέση των τιμών είναι ίδια). Ο μέσος όρος της τυπικής κατανομής είναι πάντα 0 και η τυπική απόκλισή της είναι πάντα 1. Οι τυπικές τυμές εκφράζονται σε αριθμούς χωρίς μονάδες (ή σε μονάδες τυπικής απόκλισης). Το μέγεθος της τυπικής τιμής μιας αρχικής τιμής μας δίνει άμεσα μία εικόνα για τη θέση της στην κατανομή (πόσο μακριά είναι από τον μέσο όρο). 2. Αν τα δείγματα προέρχονται από τον ίδιο πληθυσμό τότε περιμένουμε ο μέσος όρος στις 2 ομάδες να είναι περίπου ίσος. Είναι βέβαια δυνατό οι Μ.Ο. να διαφέρουν μεταξύ τους εξαιτίας τυχαίων παραγόντων, αλλά αυτό είναι κάτι που σπάνια περιμένουμε ότι θα συμβεί. Η μηδενική υπόθεση αναφέρει ότι: Ο πειραματικός χειρισμός δεν έχει καμία επίδραση στα άτομα. Επομένως οι Μ.Ο. των ομάδων περιμένουμε ότι είναι ίσοι ή περίπου ίσοι.
4/14/2017 3. Συγκρίνουμε τη διαφορά στους Μ.Ο. των δύο ομάδων με τη διαφορά στους Μ.Ο. που θα περιμέναμε να είχαμε εξαιτίας της τύχης. Χρησιμοποιούμε το τυπικό σφάλμα (standard error-SE) ένα μέτρο της μεταβλητότητας των μέσων όρων στις 2 ομάδες. Αν το SE είναι μικρό τότε τα περισσότερα δείγματα ατόμων που θα μπορούσαμε να επιλέξουμε θα έχουν περίπου τον ίδιο Μ.Ο. Αν όμως το S.E. είναι μεγάλο, τότε περιμένουμε να έχουμε διαφορά στους Μ.Ο. των ομάδων ως αποτέλεσμα της τύχης και μόνο. Αν η διαφορά στους Μ.Ο. των δειγμάτων που έχουμε επιλέξει είναι μεγαλύτερη από τη διαφορά που περιμένουμε με βάση το S.E. τότε μπορούμε να υποθέσουμε:
4/14/2017 3α. Είτε ότι οι μέσοι όροι στο πληθυσμό μας παρουσιάζουν μεγάλες διακυμάνσεις, οπότε εμείς πήραμε τυχαία δύο δείγματα τα οποία δεν είναι τυπικά του πληθυσμού από τον οποίο προήλθαν. 3β. Είτε ότι τα δύο δείγματα μας, προέχονται από διαφορετικούς υπο-πληθυσμούς αλλά είναι χαρακτηριστικά του βασικού πληθυσμού. Στην περίπτωση αυτή η διαφορά ανάμεσα στους Μ.Ο. είναι πραγματική (επομένως η μηδενική υπόθεση απορρίπτεται) 4. Όσο η διαφορά που παρατηρούμε στους Μ.Ο. των 2 ομάδων αυξάνει, αυξάνει παράλληλα και η σιγουριά μας ότι ισχύει η εναλλακτική υπόθεση: Ο πειραματικός χειρισμός είναι υπεύθυνος για τις διαφορές στις δύο ομάδες.
Παράδειγμα: Μελέτη της επίδρασης του φύλου στην επιθετικότητα 4/14/2017 Παράδειγμα: Μελέτη της επίδρασης του φύλου στην επιθετικότητα Ανεξάρτητα ή εξαρτημένα δείγματα?
4/14/2017 Μηδενική Υπόθεση (Η0): Δεν θα υπάρχει στατιστικά σημαντική διαφορά ανάμεσα στους άνδρες και τις γυναίκες ως προς τη στάση τους απέναντι στην επιθετικότητα. Εναλλακτική Υπόθεση (Η1): Θα υπάρχει στατιστικά σημαντική διαφορά ανάμεσα στους άνδρες και τις γυναίκες ως προς τη στάση τους απέναντι στην επιθετικότητα.
Η Κλίμακα να είναι τουλάχιστον ίσων διαστημάτων (interval) 4/14/2017 Θυμηθείτε τις προϋποθέσεις εφαρμογής παραμετρικών ελέγχων και για τα t-test Kανονικότητα (normality), κατά την οποία δεδομένα για κάθε ομάδα προέρχονται από πληθυσμούς με κανονική κατανομή Οι διακυμάνσεις είναι περίπου ίδιες (ομοιογενείς) (homogeneity of variance)>>>η διακύμανση μιας μεταβλητής πρέπει να είναι σταθερή για όλα τα επίπεδα των άλλων μεταβλητών. Η Κλίμακα να είναι τουλάχιστον ίσων διαστημάτων (interval) Ανεξαρτησία των παρατηρήσεων (Independence)>>>το ένα άτομο για παράδειγμα είναι ανεξάρτητο από το άλλο.
Καταχώριση δεδομένων στο SPSS
Independent samples t-test Αποτελέσματα από το SPSS Independent samples t-test S.E.=3,0151/√12 = 3,0151/3,4641=0,8704 Σας υπενθυμίζω ότι το SE είναι η τυπική απόκλιση της δειγματοληπτικής κατανομής Προϋπόθεση: Οι διακυμάνσεις στις δύο ομάδες να είναι ίσες Άνδρες: διακύμανση=(3,0151)2=9,0908 Γυναίκες: Διακύμανση=(2,798)2=7,8288
Προϋπόθεση: Οι διακυμάνσεις στις δύο ομάδες να είναι ίσες Levene’s test >>εξετάζει την υπόθεση (Ηο) ότι οι διακυμάνσεις στις 2 ομάδες είναι δεν ίσες. Αν p>0,05 τότε απορρίπτουμε την Ηο. Στο παράδειγμα μας: p>0.05 (p=0.969) για το Levene’s Test οπότε ισχύει η προϋπόθεση των ίσως διακυμάνσεων και συνεχίζουμε να εξετάζουμε τα αποτελέσματα που βρίσκονται στη γραμμή equal variances assumed , διαφορετικά το SPSS κάνει κάποιες διωρθώσεις και παίρνουμε το αποτέλεσμα που παρουσιάζεται στη γραμμή equal variances not assumed
4/14/2017 Τα αποτελέσματα για το t-test αναφέρουν ότι: η Μέση διαφορά είναι (13-11)=2 και ότι το τυπικό σφάλμα της δειγματοληπτικής κατανομής για τις διαφορές είναι ίσο με 1,1626. H τιμή για το t-test υπολογίζεται: t=2/1,1626=1.720 και δεν είναι στατιστικά σημαντική σε επίπεδο 0,05 Δεχόμαστε την Ηο δηλ. Δεν υπάρχει στατιστικά σημαντική διαφορά ανάμεσα στους άνδρες και τις γυναίκες ως προς τη στάση τους απέναντι στην επιθετικότητα.
4/14/2017 Δεχόμαστε την Ηο δηλ. Δεν υπάρχει στατιστικά σημαντική διαφορά ανάμεσα στους άνδρες και τις γυναίκες ως προς τη στάση τους απέναντι στην επιθετικότητα, t(23)=1,721, ns Προσέξτε στο διπλανό σχεδιάγραμμα που παρουσιάζονται τα διαστήματα εμπιστοσύνης του μέσου όρου για κάθε ομάδα, πώς οι error bars, αλληλεπικαλύπτονται, δηλώνοντας έτσι ότι η διαφορά δεν είναι στατιστικά σημαντική
Παράδειγμα: Μελέτη της επίδρασης του αλκοόλ στην οδήγηση 4/14/2017 Παράδειγμα: Μελέτη της επίδρασης του αλκοόλ στην οδήγηση Ένας ερευνητής δίνει σε 8 τυχαίους οδηγούς να πιούν μια μπύρα και στη συνέχεια σε ένα εξομοιωτή οδήγησης καταγράφει τα λάθη τους. Τα ίδια άτομα μετά από μια εβδομάδα πίνουν μια μπύρα χωρίς αλκοόλ και ο ερευνητής καταγράφει τα λάθη τους στην ίδια διαδρομή του εξομοιωτή. Υπάρχουν στατιστικά σημαντικές διαφορές ανάμεσα στις συνθήκες οδήγησης?
4/14/2017 Μηδενική Υπόθεση (Η0): Οι συμμετέχοντες στην έρευνα δεν θα κάνουν περισσότερα λάθη στην εικονική οδήγηση όταν ποιούν αλκοολούχο ποτό από όσα θα κάνουν όταν πιούν μη αλκοολούχο ποτό. Εναλλακτική Υπόθεση (Η1): Οι συμμετέχοντες στην έρευνα θα κάνουν περισσότερα λάθη στην εικονική οδήγηση όταν ποιούν αλκοολούχο ποτό από όσα θα κάνουν όταν πιούν μη αλκοολούχο ποτό.
Dependent ή Paired samples t-test 4/14/2017 Αποτελέσματα από το SPSS Dependent ή Paired samples t-test
4/14/2017 Αποτέλεσμα: Οι συμμετέχοντες στην έρευνα κάνουν περισσότερα λάθη στην εικονική οδήγηση όταν ποιούν αλκοολούχο ποτό από όσα θα κάνουν όταν πιούν μη αλκοολούχο ποτό, t(7)=2,646, p=0,03
4/14/2017 Τι σημαίνει πρακτικά όμως αυτό το αποτέλεσμα? Μας λέει το βαθμό της επίδρασης που έχει η κατανάλωση αλκόολ στην οδήγηση? Πόσο μεγάλη είναι αυτή διαφορά? Το effect size κάνει ακριβώς αυτό: μας δίνει τη δυνατότητα να προσδιορίσουμε την πρακτική σημασία που έχει ένα αποτέλεσμα.
4/14/2017 Οταν εξετάζουμε διαφορές το πιο συνηθισμένο μέτρο προσδιορισμού του effect size είναι το μέτρο d του Cohen (Cohen’s d). Για το d υπάρχουν διάφορες ερμηνείες. Φανταστείτε τις δύο προηγούμενες ομάδες. Αν το effect size της διαφοράς τους είναι: d = 0.20 (δηλ. μικρό αποτέλεσμα)>>>> αυτό αντιστοιχεί περίπου με τη διαφορά που υπάρχει στο ύψος ανάμεσα σε 15χρονα και 16χρονα κορίτσια, δηλ. δεν είναι πολύ εύκολο να τη δούμε d = 0.30 (δηλ. μέτριο αποτέλεσμα) >>>> αυτό αντιστοιχεί σε διαφορά που είναι «ορατή με γυμνό μάτι» πχ η διαφορά στο ύψος σε 14χρονα και 18χρονα κορίτσια d = 0.50 (δηλ. μεγάλο αποτέλεσμα)>>>> πρόκειται για πολύ μεγάλη διαφορά εύκολη για τον κάθε ένα να τη δει (πχ διαφορά στο ύψος σε 12χρονα και 18χρονα κορίτσια
4/14/2017 Για το παράδειγμα του αλκοόλ, μπορούμε να υπολογίσουμε το d, με βάση τον παρακάτω τύπο: Επομένως η κατανάλωση αλκοόλ έχει πολύ σημαντική επίδραση στην οδήγηση (d=1.4)
Δείτε στο ftp στο φάκελο “Εργαστήριο SPSS” τη διάλεξη (6) 4/14/2017 T-tests με τη βοήθεια του SPSS Υπολογίσιμος effect size με τη βοήθεια του GPower Δείτε στο ftp στο φάκελο “Εργαστήριο SPSS” τη διάλεξη (6)
4/14/2017 Προσεχώς... Δευτέρα 23-11-2009 Ανάλυση Διακύμανσης Ι
4/14/2017 Σας ευχαριστώ...