Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεSophie Collias Τροποποιήθηκε πριν 9 χρόνια
1
Διάλεξη 2 Συσχέτιση- Μέγεθος αποτελέσματος-Έλεγχος κανονικής κατανομής
4/9/2017 Στατιστική IΙ (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/Psycho/Zampetakis/ Τηλ – 37323 Διάλεξη 2 Συσχέτιση- Μέγεθος αποτελέσματος-Έλεγχος κανονικής κατανομής Ρέθυμνο,
2
Σημαντική Υπενθύμιση:
4/9/2017 Σημαντική Υπενθύμιση: Δεν υπάρχουν χαζές ερωτήσεις και δεν θα με προσβάλετε αν διακόπτετε με ρωτήσεις το μάθημα
3
4/9/2017 Στην ψυχολογία 3 είναι οι θεμελιώδεις ερωτήσεις που καλείται ο ερευνητής να απαντήσει 1. Υπάρχει κάποια σχέση? Απαντάται με των έλεγχο υποθέσεων (συσχέτιση, t-tests, ANOVA, x2 κτλ.) 2. Τι είδους σχέση? Απαντάται εξετάζοντας αν η σχέση είναι γραμμική ή μη γραμμική (συνήθως εξετάζονται γραμμικές σχέσεις) 3. Ποιο είναι το μέγεθος αυτής της σχέσης? Απαντάται με το μέγεθος αποτελέσματος (effect size)- ΌΧΙ με τον έλεγχο υποθέσεων.
4
Η παραπάνω διαδικασία ονομάζεται στατιστικός έλεγχος υποθέσεων.
4/9/2017 Για να θυμηθούμε λίγο τις έννοιες του ελέγχου υποθέσεων και της στατιστικής σημαντικότητας (statistical significance): Γενικά όταν διαβάζουμε μια έρευνα, το ΠΡΩΤΟ πράγμα που ρωτάει κάποιος είναι πόσο σημαντικό είναι το αποτέλεσμα που βρέθηκε. Προσέξτε όμως: Όταν διεξάγουμε μια έρευνα, συλλέγουμε δεδομένα, τα οποία τα αναλύουμε στη συνέχεια με κάποιο στατιστικό κριτήριο (συσχέτιση, t-test κτλ). Η ανάλυση αυτή μας δίνει μια τιμή (στατιστική τιμή). Αυτή η τιμή συγκρίνεται στη συνέχεια με μια γνωστή κατανομή τιμών του κριτηρίου και μας δίνει τη δυνατότητα να βρούμε πόσο πιθανό είναι να πάρουμε την τιμή που βρήκαμε, αν ΔΕΝ υπήρχε κάποιο αποτέλεσμα στον πληθυσμό μας (αν δηλαδή η μηδενική υπόθεση ήταν αληθινή). Αν πράγματι είναι πολύ απίθανο να λάβουμε μια τιμή τόσο μεγάλη ή μεγαλύτερη από αυτή που βρήκαμε (συνήθως p<0,05), τότε αποδίδουμε αυτή την απίθανη περίπτωση σε κάποιο αποτέλεσμα στα δεδομένα μας λέγοντας ότι το αποτέλεσμα είναι στατιστικά σημαντικό. Η παραπάνω διαδικασία ονομάζεται στατιστικός έλεγχος υποθέσεων.
5
Τι ακριβώς είναι η p τιμή?
4/9/2017 Τι ακριβώς είναι η p τιμή? (α) p τιμή η πιθανότητα τα αποτελέσματα μας να είναι τυχαία, δηλ. η πιθανότητα η Ηο να είναι αληθινή (β) p τιμή η πιθανότητα τα αποτελέσματα μας να μην είναι τυχαία, δηλ.η πιθανότητα η Ηο να είναι ψευδής (γ) p τιμή η πιθανότητα να παρατηρήσουμε αποτελέσματα τόσο ακραία (ή περισσότερο) αν η Ηο είναι αληθινή (δ) p τιμή η πιθανότητα ότι τα αποτελέσματα μας μπορούν να επαναληφθούν αν ξαναγίνει το πείραμα (ε) Κανένα από τα παραπάνω
6
4/9/2017 Επομένως η στατιστική σημαντικότητα δεν μας λέει τίποτα για το μέγεθος του αποτελέσματος, με άλλα λόγια για την πρακτική σημασία της έρευνας!!!
7
…Τι είναι η συσχέτιση δυο μεταβλητών?
4/9/2017 …Τι είναι η συσχέτιση δυο μεταβλητών? Η αλληλοεξάρτηση τους: δηλ. πως συμμεταβάλλονται δύο μεταβλητές. Ερώτημα: οι αλλαγές στη μια μεταβλητή συνοδεύονται από παρόμοιες αλλαγές στην άλλη μεταβλητή? Ο δείκτης συσχέτισης (r): το στατιστικό κριτήριο που περιγράφει το βαθμό αυτής της αλληλοεξάρτησης
8
Διαγράμματα Σκεδασμού
4/9/2017 Υπάρχουν διάφοροι τρόποι με τους οποίους οι δύο προηγούμενες μεταβλητές μπορεί να συνδέονται (σχετίζονται): Α. Μπορεί να σχετίζονται θετικά Β. Μπορεί να μη σχετίζονται καθόλου Διαγράμματα Σκεδασμού Γ. Μπορεί να σχετίζονται αρνητικά
9
Για το παράδειγμα μας r=0.87
4/9/2017 Ο συντελεστής συσχέτισης (r), λαμβάνει τιμές από το (-1) ως το (+1). Για το παράδειγμα μας r=0.87 Προκειμένου να βγάλουμε κάποιο συμπέρασμα για μία τιμή της κατανομής (το σκορ κάποιου συμμετέχοντα), θα πρέπει να το συγκρίνουμε με τις άλλες τιμές. Πχ στο παράδειγμα της κατανομής ύψους 500 γυναικών, τι συμπέρασμα θα γβάζαμε για μία γυναίκα με ύψος 1.90μ; Θα πρέπει να υπάρχει ένα σημείο αναφοράς (μέτρο σύγκρισης), το οποίο εξαρτάται από τη θέση της τιμής είτε στην ιεραρχία των τιμών, είτε ως προς ένα δείκτη κεντρικής τάσης (συνήθως το μέσο όρο). Πχ η τιμή 50 σε μία κατανομή με μέσο όρο 54 μπορεί να εκφραστεί ως +4. Επιπλέον, αυτή η απόκλιση μπορεί να εκφραστεί με μονάδες τυπικής απόκλισης. Αν πχ η τυπική απόκλιση της κατανομής είναι 2, τότε η τιμή 54 βρίσκεται 2 τυπικές αποκλίσεις πάνω από τον μέσο όρο (4/2=2sds). Αντίστοιχα, η τιμή 46 είναι δύο τυπικές αποκλίσεις κάτω από τον μέσο όρο (46-50=-4/2=-2sds). Το πηλίκο της απόκλισης μιας τιμής προς την τυπική απόκλιση ονομάζεται μετατροπή σε τυπικές τιμές ή z-τιμές (standardised values or z-scores). Οι τυπικές τιμές συμβολίζονται με το z. Οι τυπικές τιμές εκφράζουν την απόσταση (απόκλιση) μιας τιμής από τον μέσο όρο σε τυπικές αποκλίσεις (και όχι στην αρχική μονάδα μέτρησης). ‘πόσες τυπικές αποκλίσεις απέχει από τον μέσο όρο μία συγκεκριμένη τιμή;’. Όταν οι τυπικές τιμές είναι θετικές, αυτό σημαινει ότι η αρχική τιμή είναι μεγαλύτερη από τον μέσο όρο, ενώ όταν οι z-τιμές έχουν αρνητικό πρόσημο, τότε αυτό σημαίνει ότι η αρχική τιμή είναι μικρότερη από τον μέσο όρο. Κυμαίνονται από το -4 ως το +4. Αυτό που μας προσφέρουν οι z-τιμές είναι η δυνατότητα σύγκρισης (ως προς την απόστασή τους από τον μέσο όρο της κατανομής τους) διάφορων τιμών που δεν προέρχονται από την ίδια κατανομή. Κι αυτό γιατί οι z-τιμές εκφράζονται σε μονάδες τυπικής απόκλισης, και είναι ανεξάρτητες από την αρχική μονάδα μέτρησης. ‘ποιά τιμή απείχε περισσότερο από τον μέσο όρο της κατανομής της;’. Με τις τυπικές τιμές μπορούμε να συγκρίνουμε απευθείας ή να κάνουμε αλγεβρικές πράξεις. Πχ έχουμε ένα αγόρι 14 ετών και ένα κορίτσι 11 ετών με ύψος 163cm και 130cm αντίστοιχα, και θέλουμε να δούμε ποιό είναι ψηλότερο. Πρέπει να τα συγκρίνουμε με τους συνομηλίκους τους του ίδιου φύλου. Αν οι μέσοι όροι και οι τυπικές αποκλίσεις των κατανομών αυτών είναι mean= 155cm, sd= 9cm και mean=128cm, sd= 7cm, θα είχαμε: Αγόρι: ( )/9= 0.89τυπικές απικλίσεις (περίπου 9/10 της τυπικής απόκλισης) Κορίτσι: ( )/7= 0.29 τυπικές αποκλίσεις (περίπου 3/10 της τυπικής απόκλισης) Συνεπώς το αγόρι θεωρείται ψηλότερο από το κορίτσι, σε σχέση με το μέσο όρο της ηλικίας του. Χαρακτηριστικά τυπικών τιμών: Η κατανομή των τυπικών τυμών έχει ίδιο σχήμα με αυτό της αρχικής κατανομής (η θέση των τιμών είναι ίδια). Ο μέσος όρος της τυπικής κατανομής είναι πάντα 0 και η τυπική απόκλισή της είναι πάντα 1. Οι τυπικές τυμές εκφράζονται σε αριθμούς χωρίς μονάδες (ή σε μονάδες τυπικής απόκλισης). Το μέγεθος της τυπικής τιμής μιας αρχικής τιμής μας δίνει άμεσα μία εικόνα για τη θέση της στην κατανομή (πόσο μακριά είναι από τον μέσο όρο).
10
4/9/2017 Ο συντελεστής συσχέτισης, αποτελεί ένα πολύ καλό παράδειγμα για την έννοια του Μεγέθους αποτελέσματος –(effect size) Το effect size (EF) αποτελεί ένα αντικειμενικό και απαλλαγμένο από την κλίμακα μέτρησης (standardized), μέτρο για τον προσδιορισμό του μεγέθους ενός αποτελέσματος. Στην ουσία αποτελεί ένα μέτρο για το κατά πόσο ένα στατιστικά σημαντικό αποτέλεσμα έχει πρακτική σημασία ή όχι
11
…και καλά γιατί τώρα μας μπερδεύεις με τα ES, που χρειάζονται?
4/9/2017 Είναι άμεσα κατανοητό για παράδειγμα ότι r=0.26 ανάμεσα σε δύο μεταβλητές, είναι μικρότερο από το r=0.56. Με άλλα λόγια ο βαθμός (το μέγεθος) του αποτελέσματος (συσχέτιση) είναι μεγαλύτερος στη 2η περίπτωση. …και καλά γιατί τώρα μας μπερδεύεις με τα ES, που χρειάζονται?
12
4/9/2017 Σας λέω μόνο αυτό.. Ήδη από το 1994, η APA, συστήνει την αναγραφή των ΕS στα ερευνητικά αποτελέσματα. Αυτό σημαίνει ότι μας δίνει πολύτιμες πληροφορίες που συμβάλουν στην προαγωγή της έρευνας!! WILKINSON, L. AND TASK FORCE ON STATISTICAL INFERENCE, APA BOARD OF SCIENTIFIC AFFAIRS (1999) ‘Statistical Methods in Psychology Journals: Guidelines and Explanations’. American Psychologist, 54, 8,
13
Γιατί χρησιμοποιούμε το effect size?
4/9/2017 Γιατί χρησιμοποιούμε το effect size? Μα… για να κατανοήσουμε το μέγεθος του αποτελέσματος ενός πειράματος. Στην περίπτωση του συντελεστή συσχέτισης, αυτό είναι προφανές. Επίσης προφανές είναι το μέγεθος του αποτελέσματος για παράδειγμα στην περίπτωση δύο ομάδων ατόμων, όπου η μία λαμβάνει μια νέα αγωγή και η άλλη όχι. Αν η ομάδα που λαμβάνει την αγωγή κατά μέσο όρο παρουσιάζει απώλεια βάρους της τάξεως των 15 κιλών, τότε αμέσως έχουμε το μέτρο του μεγέθους του αποτελέσματος γιατί είμαστε εξοικειωμένοι με τα κιλά.
14
4/9/2017 Στην ψυχολογία όμως δεν υπάρχουν κλίμακες μετρήσεις αντίστοιχες με τα κιλά. Για το λόγω αυτό συχνά χρησιμοποιούμε στατιστικούς δείκτες απαλλαγμένους από τις μονάδες μέτρησης. Φανταστείτε την περίπτωση του παρακάτω πειράματος:
15
4/9/2017 Ο Dowson (2000), μελέτησε την επίδραση της ώρας της ημέρας στην μάθηση των παιδιών. Πότε τα παιδιά μαθαίνουν καλύτερα το πρωί ή το απόγευμα; Χρησιμοποίησε 38 παιδιά τα οποία τυχαία χώρισε σε δυο ομάδες. Η πρώτη άκουσε μια ιστορία και απάντησε σε ερωτήσεις στις 9.00 πμ, η άλλη στις 3.00 μμ. Μέτρησε την κατανόηση με βάση τις σωστές απαντήσεις σε σύνολο 20 ερωτήσεων. Η «πρωινή» ομάδα απάντησε κατά μέσο όρο 15,2 σωστές απαντήσεις ενώ η απογευματινή 17,9. Η διαφορά δηλ. είναι 2,7 και είναι στατιστικά σημαντική. Τι σημαίνει πρακτικά όμως αυτό το αποτέλεσμα? Μας λέει το βαθμό της επίδρασης που έχει η ώρα της ημέρας στην κατανόηση των παιδιών? Πόσο μεγάλη είναι αυτή διαφορά? DOWSON V. (2000) “Time of day effects in schoolchildren's immediate and delayed recall of meaningful material”. TERSE Report. Διαθέσιμο στην ιστοσελίδα:
16
4/9/2017 Το effect size κάνει ακριβώς αυτό: μας δίνει τη δυνατότητα να προσδιορίσουμε την πρακτική σημασία που έχει ένα αποτέλεσμα. Έτσι για παράδειγμα στην περίπτωση του συντελεστή συσχέτισης ξέρουμε ότι αν r=0, δεν υπάρχει κανένα αποτέλεσμα (δηλ. συσχέτιση), ενώ r=1 σημαίνει ότι υπάρχει τέλειο αποτέλεσμα. Ο Cohen (1990; 1994) πρότεινε για τις ενδιάμεσες τιμές του r εξής: r = 0.10 (μικρό αποτέλεσμα) r = 0.30 (μέτριο αποτέλεσμα) r = 0.50 (μεγάλο αποτέλεσμα) Cohen, J. (1990). Things I have learned (so far). American Psychologist, 45, 1304–1312. Cohen, J. (1994). The earth is round (p < .05). American Psychologist, 49,
17
4/9/2017 Η συσχέτιση r=0.5 μπορεί να φαίνεται ότι είναι μικρή. Αυτό όμως εξαρτάται από τον τομέα έρευνας και το σφάλμα μέτρησης των μεταβλητών. Στην ψυχολογία, μία συσχέτιση 0.5 μεταξύ δύο μεταβλητών θεωρείται εντυπωσιακή, λόγω του σφάλματος μέτρησης που υπάρχει στη μέτρηση των περισσότερων μεταβλητών. Όταν μάλιστα η συσχέτιση είναι υψηλότερη (πχ 0.8) πολλοί ισχυρίζονται ότι μετρήσαμε το ίδιο πράγμα...
18
4/9/2017 Εκτός όμως από το συντελεστή συσχέτισης που μπορεί να θεωρηθεί ως ένα μέτρο του μεγέθους του αποτελέσματος, για ζεύγη μεταβλητών, το πιο συχνά χρησιμοποιούμενο μέτρο όταν εξετάζουμε διαφορές είναι το μέτρο d του Cohen (Cohen’s d). Για το d υπάρχουν διάφορες ερμηνείες. Φανταστείτε δύο ομάδες, την ομάδα ελέγχου και την πειραματική. Αν το effect size της διαφοράς τους είναι: d = 0.20 (δηλ. μικρό αποτέλεσμα)>>>> αυτό αντιστοιχεί περίπου με τη διαφορά που υπάρχει στο ύψος ανάμεσα σε 15χρονα και 16χρονα κορίτσια, δηλ. δεν είναι πολύ εύκολο να τη δούμε d = 0.30 (δηλ. μέτριο αποτέλεσμα) >>>> αυτό αντιστοιχεί σε διαφορά που είναι «ορατή με γυμνό μάτι» πχ η διαφορά στο ύψος σε 14χρονα και 18χρονα κορίτσια d = 0.50 (δηλ. μεγάλο αποτέλεσμα)>>>> πρόκειται για πολύ μεγάλη διαφορά εύκολη για τον κάθε ένα να τη δει (πχ διαφορά στο ύψος σε 12χρονα και 18χρονα κορίτσια
19
4/9/2017 ΠΡΟΣΟΧΗ! Δεν υπάρχει απόλυτη απάντηση στο πόσο μεγάλο πρέπει να είναι το effect size….. Πρέπει πάντα να λαμβάνουμε υπόψη τη χρησιμότητα, το κόστος, και τα γενικότερα οφέλη των αποτελεσμάτων….
20
Αποτελέσματα = Μέγεθος αποτελέσματος X Μέγεθος δείγματος
4/9/2017 Ποια είναι η σχέση ανάμεσα στη στατιστική σημαντικότητα και effect size? Αποτελέσματα = Μέγεθος αποτελέσματος X Μέγεθος δείγματος (1) Η στατιστική σημαντικότητα εξαρτάται από το μέγεθος αποτελέσματος (2) Και η στατιστική σημαντικότητα εξαρτάται επίσης και από το μέγεθος του δείγματος (3) Η στατιστική σημαντικότητα είναι το αποτέλεσμα του μεγέθους αποτελέσματος και του μεγέθους του δείγματος
21
4/9/2017 Επομένως όταν τα αποτελέσματα είναι στατιστικά σημαντικά χρειαζόμαστε επιπλέον πληροφορία για να καθορίσουμε την πρακτική τους σημασία
22
Πώς χρησιμοποιούμε το effect size:
4/9/2017 Πώς χρησιμοποιούμε το effect size: 1. A priori- Σε συνδυασμό με τη στατιστική ισχύ ενός τεστ για να προσδιορίσουμε το μέγεθος του δείγματος που χρειαζόμαστε. Στην περίπτωση αυτή θα πρέπει να έχουμε μια ένδειξη του μεγέθους του αποτελέσματος που περιμένουμε να βρούμε (πχ από άλλες δημοσιευμένες έρευνες). Ποιο είναι το ελάχιστο μέγεθος δείγματος n ώστε, σε επίπεδο σημαντικότητας α=0,05 & για επίπεδο ισχύος γ (1-β)=0,95, ο στατιστικός έλεγχος που θα εφαρμοστεί (πχ συσχέτιση) να διαγνώσει ως στατιστικά σημαντικό ένα μέγεθος αποτελέσματος (Effect Size-E.S.) d;
23
4/9/2017 2. Post–hoc Απλά για να δούμε το μέγεθος του αποτελέσματος μας. Περισσότερα για αυτό θα αναφέρω στο μάθημα για τα t-tests Δοθέντος του μεγέθους δείγματος n, του επιπέδου σημαντικότητας α και του παρατηρούμενου E.S., ποια είναι ισχύς γ του στατιστικού ελέγχου;
24
4/9/2017 3. Σε έρευνες meta-analysis, κατά τις οποίες συνδυάζονται τα αποτελέσματα διαφορετικών πειραμάτων και εξάγεται ένα αντικειμενικό αποτέλεσμα (φανταστείτε την meta-analysis, σαν βιβλιογραφική διερεύνηση ενός θέματος αλλά απαλλαγμένη από την υποκειμενικότητα του ερευνητή) Robbins, S. B., Lauver, K., Le, H., Davis, D., Langley, R., & Carlstrom, A. (2004). Do psychosocial and study skill factors predict college outcomes? A meta-analysis. Psychological Bulletin, 130, 261–288. Eagly, A.H. & B.T. Johnson (1990) Gender and leadership style: A meta-analysis, Psychological Bulletin 108, Waldman, D. A., & Avolio, B. (1986). A meta-analysis of age differences in job performance. Journal of Applied Psychology, 71,
25
Πρόγραμμα που χρησιμοποιούμε :
4/9/2017 Πρόγραμμα που χρησιμοποιούμε :
26
1. H αντιπροσωπευτικότατα του δείγματος
4/9/2017 Παράγοντες που επηρεάζουν το effect size: 1. H αντιπροσωπευτικότατα του δείγματος 2. H μεταβλητές να ακολουθούν κανονική κατανομή 3. Οι μετρήσεις μας να είναι αξιόπιστες δηλ. αν η έρευνα επαναληφθεί τα αποτελέσματα να είναι περίπου τα ίδια
27
4/9/2017 Προσεχώς... Δευτέρα Απλή γραμμική παλινδρόμηση
28
4/9/2017 Σας ευχαριστώ...
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.