Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ (ΨΥΧ-122) Στατιστική IΙ (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail:

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ (ΨΥΧ-122) Στατιστική IΙ (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail:"— Μεταγράφημα παρουσίασης:

1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ (ΨΥΧ-122) Στατιστική IΙ (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/Psycho/Zampetakis / ftp://ftp.soc.uoc.gr/Psycho/Zampetakis / Τηλ – Ρέθυμνο, Διάλεξη 4 Πολλαπλή γραμμική παλινδρόμηση

2 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 2 Σημαντική Υπενθύμιση: Δεν υπάρχουν χαζές ερωτήσεις Δεν υπάρχουν χαζές ερωτήσεις και δεν θα με προσβάλετε αν διακόπτετε με ρωτήσεις το μάθημα

3 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 3 Στην ουσία τι κάνουμε? Προσπαθούμε να προσαρμόσουμε στα δεδομένα μας ένα υποθετικό προβλεπτικό μοντέλο της σχέσης ανάμεσα στις μεταβλητές Η ανάλυση παλινδρόμησης…είναι ένας τρόπος για να προβλέψουμε την τιμή μιας μεταβλητής από τις τιμές μίας ή πολλών άλλων γνωστών μεταβλητών

4 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 4 Απλή ονομάζεται η γραμμική παλινδρόμηση κατά την οποία χρησιμοποιούμε τις τιμές μίας μόνο μεταβλητής (ονομάζεται ερμηνευτική ή προβλεπτική μεταβλητή) για να προβλέψουμε τη μεταβλητή κριτήριο. Πολλαπλή ονομάζεται η γραμμική παλινδρόμηση κατά την οποία χρησιμοποιούμε τις τιμές πολλών προβλεπτικών μεταβλητών για να προβλέψουμε τη μεταβλητή κριτήριο.

5 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 5 Απλή γραμμική παλινδρόμηση Υ i =β ο +β 1 Χ i +ε i Η ευθεία γραμμή της απλής γραμμικής παλινδρόμησης διατυπωμένη με τη βασική μαθηματική εξίσωση Αποτέλεσμα = (Μοντέλο) + Λάθος

6 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 6 Κάθε ευθεία γραμμή μπορεί να προσδιοριστεί αν γνωρίζουμε: (1) την κλίση της ευθείας και (2) το σημείο που η ευθεία τέμνει τον κάθετο άξονα. ο συντελεστής παλινδρόμησης για την προβλεπτική μεταβλητή β 1 = η κλίση της ευθείας (δηλ. η γωνία που σχηματίζει η ευθεία με τον άξονα ψ) η κατεύθυνση/δύναμη της σχέσης β 0 = ο σταθερός όρος (δηλ. η τιμή του Υ όταν το Χ=0). το σημείο στο οποίο η γραμμή παλινδρόμησης τέμνει τον άξονα Ψ Η ευθεία γραμμή….. Υ i =β ο +β 1 Χ i +ε i ε i = το σφάλμα που αντιστοιχεί τη διαφορά ανάμεσα στην τιμή που προβλέπει η ευθεία γραμμή για το άτομο i και την πραγματική τιμή που έχει το συγκεκριμένο άτομο

7 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 7 Πολλαπλή γραμμική παλινδρόμηση Υ i =(β ο +β 1 Χ i + β 2 Χ 2 + …+ β n Χ n ) +ε i Αποτέλεσμα = (Μοντέλο) + Λάθος β 1, β 2, βn = συντελεστής παλινδρόμησης για τις προβλεπτικές μεταβλητές β 0 = ο σταθερός όρος (δηλ. η τιμή του Υ όταν το Χ=0). ε i = το σφάλμα που αντιστοιχεί τη διαφορά ανάμεσα στην τιμή που προβλέπει η ευθεία γραμμή για το άτομο i και την πραγματική τιμή που έχει το συγκεκριμένο άτομο

8 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 8 Η πολλαπλή γραμμική παλινδρόμηση μπορεί να χρησιμοποιηθεί: 1. Σε περιγραφικό επίπεδο, συνοψίζοντας τη σχέση της εξαρτημένης μεταβλητής με ανεξάρτητες, υπό μορφή μιας γραμμικής εξίσωσης 2. Επαγωγικά, ελέγχοντας αν οι σχέσεις που προσδιοριστήκαν περιγραφικά ισχύουν και σε πληθυσμιακό επίπεδο.

9 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 9 Παράδειγμα -- Tx (0 = Ομάδα ελέγχου, 1 = Πειραματική ομάδα) Κατάθλιψη = 35 + (2.0 * Άγχος) - (1.5 * Υποστήριξη) - (3.0 * Tx) Εφαρμόστε την εξίσωση: για ασθενή με Άγχος =10, Υποστήριξη= 4, ο οποίος ανήκει στην πειραματική ομάδα >>>> Κατάθλιψη =  εξηγήστε το συντελεστή «β» για τη μεταβλητή Άγχος – Για κάθε μία μονάδα αύξηση στο Άγχος, η κατάθλιψη αναμένεται να κατά εφόσον διατηρούνται όλες οι άλλες μεταβλητές σταθερές.  εξηγήστε το συντελεστή «β» για τη μεταβλητή Υποστήριξη -- Για κάθε μία μονάδα αύξηση στην Υποστήριξη, η κατάθλιψη αναμένεται να κατά, εφόσον διατηρούνται όλες οι άλλες μεταβλητές σταθερές εξηγήστε το συντελεστή «β» για τη μεταβλητή Τχ– Τα άτομα στην Τχ ομάδα, αναμένεται να έχουν ένα μέσο σκορ στην κατάθλιψη το οποίο είναι από ότι στην ομάδα ελέγχου, εφόσον διατηρούνται όλες οι άλλες μεταβλητές σταθερές 46 αυξάνει 2 μονάδες μειώνεται 1.5 μονάδα 3.0 φορές μικρότερο

10 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 10 Ας υποθέσουμε ότι διερευνούμε την επίδραση των μεταβλητών Χ1, Χ2, Χ3, στην μεταβλητή Υ. Με τη βοήθεια της πολλαπλής γραμμικής παλινδρόμησης, μπορούμε να ορίσουμε μια εξίσωση, η οποία με γραμμικό τρόπο θα συνδυάζει τις τιμές των 3 μεταβλητών, ώστε να έχουμε την καλύτερη δυνατή εκτίμηση της μεταβλητής Υ. X1 Y X3 X2 Επιπλέον, μπορούμε να απλοποιήσουμε την εξίσωση, απαλείφοντας τις μεταβλητές εκείνες, οι οποίες δεν έχουν καμία προσφορά στην ερμηνεία της Υ. Επίσης, μπορούμε να εκτιμήσουμε την επίδραση της κάθε μίας ανεξάρτητης μεταβλητής στην εξαρτημένη, αφού πρώτα απομακρύνομαι τις «συγχυτικές» επιδράσεις των υπολοίπων μεταβλητών.

11 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 11 Στην περίπτωση της πολλαπλής γραμμικής παλινδρόμησης, η πρόβλεψη των τιμών της εξαρτημένης μεταβλητής γίνεται με βάση τις συσχετίσεις της με τις τιμές δύο ή περισσότερων ανεξάρτητων μεταβλητών. Αυτές οι ανεξάρτητες μεταβλητές είναι (πολύ) πιθανόν να παρουσιάζουν και κάποια συσχέτιση μεταξύ τους. α β α = κοινή διακύμανση Χ1 και Υ β = κοινή διακύμανση Χ2 και Υ γ = κοινή διακύμανση μεταξύ Χ2, Χ2 και Υ γ

12 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 12 Η συσχέτιση μεταξύ δύο μεταβλητών (Χ1 και Υ) μπορεί να επηρεάζεται από τη συσχέτισή τους με μία τρίτη μεταβλητή (Χ2). Προκειμένου να εξετάσουμε τη συσχέτιση των δύο αρχικών μεταβλητών μπορούμε να λάβουμε υπόψη και να εξουδετερώσουμε (partial out) την επίδραση της τρίτης μεταβλητής, με τη διαδικασία της μερικής συσχέτισης (partial και semi-partial correlation).

13 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 13 Η συσχέτιση μεταξύ δύο μεταβλητών πριν αυτόν τον διαμερισμό (partialling out) της επίδρασης της 3ης μεταβλητής ονομάζεται συσχέτιση μηδενικής τάξης (zero-order correlation). Συνήθως, μετά τον διαμερισμό της επίδρασης της 3ης μεταβλητής η συσχέτιση μεταξύ των δύο αρχικών μεταβλητών ελαττώνεται. Αν αγνοήσουμε το -μάλλον συνηθισμένο στην Ψυχολογία- γεγονός ότι οι ανεξάρτητες μεταβλητές μπορεί να μοιράζονται κάποια κοινή διακύμανση μεταξύ τους και με την εξαρτημένη μεταβλητή, θα καταλήξουμε σε μία υπερβολική εκτίμηση του πόση διακύμανση μπορούμε να εξηγήσουμε στην εξαρτημένη μεταβλητή. Αυτό θα συνέβαινε γιατί θα λαμβάναμε υπόψη δύο φορές την κοινή διακύμανση των δύο ανεξάρτητων μεταβλητών και της εξαρτημένης μεταβλητής. Αυτό που μας ενδιαφέρει όμως είναι η μοναδική/ξεχωριστή διακύμανση που μοιράζεται η κάθε ανεξάρτητη μεταβλητή με την εξαρτημένη (unique variance).

14 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 14 y x1x1 x2x2 x3x3 r y,x1 r y,x2 r y,x3

15 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 15 y x1x1 x2x2 x3x3 Ο συντελεστής προσδιορισμού (R 2 ) στην περίπτωση της πολλαπλής γραμμικής παλινδρόμησης, μας δίνει το ποσοστό της συνολικής διακύμανσης που ερμηνεύεται από το σύνολο των προβλεπτικών μεταβλητών R 2 = + + +

16 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 16 y x1x1 x2x2 x3x3 Οι συντελεστές παλινδρόμησης για κάθε προβλεπτική μεταβλητή μας δίνουν τη μοναδική συμβολή της κάθε προβλεπτικής μεταβλητής  x1  x2 x3x3

17 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 17 Μέθοδοι εισαγωγής των προβλεπτικών μεταβλητών στην εξίσωση πολλαπλής παλινδρόμησης Φανταστείτε ότι αν έχουμε 10 ανεξάρτητες μεταβλητές, μπορούμε να έχουμε 1023 διαφορετικές διατυπώσεις (υποδείγματα) της γραμμικής παλινδρόμησης. Γενικά, χρειάζεται πολύ μεγάλη προσοχή, στην επιλογή των κατάλληλων προβλεπτικών μεταβλητών καθώς και στον τρόπο με τον οποίο εισάγονται στην εξίσωση,, γιατί η επιλογές αυτές επηρεάζουν και τους συντελεστές παλινδρόμησης. Το ιδανικό είναι να χρησιμοποιούνται προβλεπτικές μεταβλητές, από την ΘΕΩΡΙΑ και τις προηγούμενες έρευνες.

18 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 18 Στη πολλαπλή γραμμική παλινδρόμηση έχουμε την επιλογή να εισαγάγουμε όλες τις πιθανές προβλεπτικές μεταβλητές μας μαζί, ή μόνο ορισμένες από αυτές σταδιακά. Η απόφαση αυτή θα εξαρτηθεί από διάφορους παράγοντες: 1. ΜΕΘΟΔΟΣ ENTER >>>>>>>εάν έχουμε εκ των προτέρων ένα θεωρητικό μοντέλο το οποίο θέλουμε να τεστάρουμε, τότε θα πρέπει να εισαγάγουμε από την αρχή όλες τις προβλεπτικές μεταβλητές που ορίζει το μοντέλο αυτό. Στη συνέχεια θα εξετάσουμε αν το μοντέλο είναι επαρκές για την πρόβλεψη της Υ, και ποιοι από τους predictors που ορίσαμε είναι σημαντικοί predictors της Υ και πόση διακύμανση εξηγούν. Αυτή είναι η τυπική μορφή της πολλαπλής παλινδρόμησης

19 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / ΜΕΘΟΔΟΣ STEPWISE regression (Βηματική παλινδρόμηση) >>>>>>> STEPWISE μέθοδοι εισαγωγής μεταβλητών παίρνουν την καλύτερη προβλεπτική μεταβλητή και την εισάγει στο μοντέλο (στην εξίσωση). Στη συνέχεια η κοινή διακύμανση μεταξύ αυτού του predictor και της εξαρτημένης μεταβλητής που είναι επίσης κοινή με άλλες μεταβλητές διαμερίζεται (ξεχωρίζεται) από τις συσχετίσεις μεταξύ των άλλων predictors και της εξαρτημένης μεταβλητής. Η διαδικασία αυτή επαναλαμβάνεται για τις υπόλοιπες μεταβλητές, μέχρι να εξαντληθούν όλοι οι σημαντικοί predictors. Με αυτή την προσέγγιση καταλήγουμε με ένα μοντέλο (εξίσωση) που περιλαμβάνει μόνο τις απαραίτητες μεταβλητές (δηλαδή τους σημαντικούς predictors). Στις μεθόδους αυτές η επιλογή γίνεται με καθαρά μαθηματικά κριτήρια, αποκλειστικά μέσω Η/Υ, με αποτέλεσμα να μην έχει ευελιξία στις επιλογές του ο ερευνητής.

20 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / ΙΕΡΑΡΧΙΚΗ ΜΕΘΟΔΟΣ (Blockwise entry) >>>>>>> Στη μέθοδο αυτή, οι predictors επιλέγονται με βάση προηγούμενες έρευνες και ο ερευνητής επιλέγει τη σειρά με την οποία θα εισαχθούν στην εξίσωση. Συνήθως predictors, που είναι σημαντικοί για πρόβλεψη της εξαρτημένης μεταβλητής εισάγονται πρώτοι (ανάλογα με τη σημασία τους). Στη συνέχεια εισάγονται οι άλλοι predictors. Η μέθοδος αυτή συνιστάται γιατί ο ερευνητής έχει ευελιξία στην εισαγωγή των predictors.

21 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 21 Τι προσέχουμε κατά την εφαρμογή της πολλαπλής γραμμικής παλινδρόμησης 1) Πολυμεταβλητή κανονικότητα (multivariate normality), κατά την οποία κάθε μεταβλητή ακολουθεί κανονική κατατομή (αυστηρή προϋπόθεση) και τα υπόλοιπα (residuals) να ακολουθούν κανονική κατανομή 2) Οι διακυμάνσεις είναι περίπου ίδιες (ομοιογενείς) (homogeneity of variance)>>>η διακύμανση μιας μεταβλητής πρέπει να είναι σταθερή για όλα τα επίπεδα των άλλων μεταβλητών. 3) Η Κλίμακα να είναι τουλάχιστον ίσων διαστημάτων (interval) 4) Ανεξαρτησία των παρατηρήσεων (Independence)>>> το ένα άτομο για παράδειγμα είναι ανεξάρτητο από το άλλο.

22 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ 5) Το μέγεθος του δείγματος 6) Την πολυγραμμικότητα (Multicollinearity): δύο ή περισσότερες ανεξάρτητες μεταβλητές παρουσιάζουν υψηλές μεταξύ τους συσχετίσεις. Σε αυτή την περίπτωση είναι δύσκολο να ξεχωρίσει κανείς την ξεχωριστή επίδραση (και αξία) της κάθε μεταβλητής για την πρόβλεψη. Υπολογίζουμε το συντελεστή ανεκτικότητας (tolerance), όπου μεγάλες τιμές είναι το ζητούμενο 7) Ακραίες περιπτώσεις>> πάνω από 3 τυπικές αποκλίσεις ή υπολογίζουμε το δείκτη του Cook distance>1 Τι προσέχουμε κατά την εφαρμογή της πολλαπλής γραμμικής παλινδρόμησης

23 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 23 Μέγεθος δείγματος που απαιτείται στην ανάλυση παλινδρόμησης ανάλογα με τον αριθμό των προβλεπτικών μεταβλητών και το αναμενόμενο effect size. Συνήθως χρειάζονται το λιγότερο 25 άτομα ανά προβλεπτική μεταβλητή

24 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 24 Απλή και πολλαπλή παλινδρόμηση με τη βοήθεια του SPSS Δείτε στο ftp στο φάκελο “Εργαστήριο SPSS” τις διαλέξεις (4) και (5)

25 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 25 Δευτέρα Σύγκριση μέσων-ένα δείγμα

26 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 4 / 26


Κατέβασμα ppt "ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ (ΨΥΧ-122) Στατιστική IΙ (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail:"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google