Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ (ΨΥΧ-122) Στατιστική IΙ (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail:

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ (ΨΥΧ-122) Στατιστική IΙ (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail:"— Μεταγράφημα παρουσίασης:

1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ (ΨΥΧ-122) Στατιστική IΙ (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/Psycho/Zampetakis / ftp://ftp.soc.uoc.gr/Psycho/Zampetakis / Τηλ – Ρέθυμνο, Διάλεξη 3 Απλή γραμμική παλινδρόμηση

2 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 2 Σημαντική Υπενθύμιση: Δεν υπάρχουν χαζές ερωτήσεις Δεν υπάρχουν χαζές ερωτήσεις και δεν θα με προσβάλετε αν διακόπτετε με ρωτήσεις το μάθημα

3 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 3 Τι είναι η ανάλυση παλινδρόμησης?

4 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 4 Στην ουσία τι κάνουμε? Προσπαθούμε να προσαρμόσουμε στα δεδομένα μας ένα υποθετικό προβλεπτικό μοντέλο της σχέσης ανάμεσα στις μεταβλητές Η ανάλυση παλινδρόμησης…είναι ένας τρόπος για να προβλέψουμε την τιμή μιας μεταβλητής από τις τιμές μίας ή πολλών άλλων γνωστών μεταβλητών

5 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 5 Στην περίπτωση της γραμμικής παλινδρόμησης, το μοντέλο που εφαρμόζουμε είναι μια ευθεία γραμμή Επομένως, περιγράφουμε τη σχέση χρησιμοποιώντας την εξίσωση μιας ευθείας γραμμής Γραμμική Παλινδρόμηση Μη- Γραμμική Παλινδρόμηση

6 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 6 Απλή ονομάζεται η γραμμική παλινδρόμηση κατά την οποία χρησιμοποιούμε τις τιμές μίας μόνο μεταβλητής (ονομάζεται ερμηνευτική ή προβλεπτική μεταβλητή) για να προβλέψουμε τη μεταβλητή κριτήριο. Πολλαπλή ονομάζεται η γραμμική παλινδρόμηση κατά την οποία χρησιμοποιούμε τις τιμές πολλών προβλεπτικών μεταβλητών για να προβλέψουμε τη μεταβλητή κριτήριο.

7 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 7 Προσοχή στη χρήση των όρων εξαρτημένη και ανεξάρτητη μεταβλητή Χρησιμοποιούνται κυρίως στις πειραματικές έρευνες (όπου επιτρέπουν την προσέγγιση όχι μόνο του βαθμού της σχέσης αλλά και τη φύση της σχέσης ανάμεσα στις μεταβλητές) Στις λεγόμενες νατουραλιστικές έρευνες (correlational) (η οποίες επιτρέπουν την προσέγγιση μόνο του βαθμού της σχέσης ανάμεσα στις μεταβλητές) είναι προτιμότερο να χρησιμοποιούνται οι όροι, προβλεπτική μεταβλητή και κριτήριο

8 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 8 Η ευθεία γραμμή….. Υ i =β ο +β 1 Χ i +ε i Η ευθεία γραμμή της απλής γραμμικής παλινδρόμησης διατυπωμένη με τη βασική μαθηματική εξίσωση Αποτέλεσμα = (Μοντέλο) + Λάθος

9 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 9 Κάθε ευθεία γραμμή μπορεί να προσδιοριστεί αν γνωρίζουμε: (1) την κλίση της ευθείας και (2) το σημείο που η ευθεία τέμνει τον κάθετο άξονα. ο συντελεστής παλινδρόμησης για την προβλεπτική μεταβλητή β 1 = η κλίση της ευθείας (δηλ. η γωνία που σχηματίζει η ευθεία με τον άξονα ψ) η κατεύθυνση/δύναμη της σχέσης β 0 = ο σταθερός όρος (δηλ. η τιμή του Υ όταν το Χ=0). το σημείο στο οποίο η γραμμή παλινδρόμησης τέμνει τον άξονα Ψ Η ευθεία γραμμή….. Υ i =β ο +β 1 Χ i +ε i ε i = το σφάλμα που αντιστοιχεί τη διαφορά ανάμεσα στην τιμή που προβλέπει η ευθεία γραμμή για το άτομο i και την πραγματική τιμή που έχει το συγκεκριμένο άτομο

10 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 10 Εξισώσεις με ίδιο σταθερό όρο αλλά διαφορετική κλίση

11 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 11 Εξισώσεις με ίδια κλίση αλλά διαφορετικό σταθερό όρο

12 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 12 Πώς υπολογίζουμε το μοντέλο της απλής παλινδρόμησης? Μπορούμε κατά προσέγγιση με το μάτι να δούμε ποια ευθεία περιγράφει καλύτερα τα δεδομένα μας. Η μέθοδος όμως αυτή είναι και υποκειμενική και ανακριβής!

13 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 13 Για να επιλέξουμε την καλύτερη γραμμή που περιγράφει τα δεδομένα μας χρησιμοποιούμε μια μέθοδο γνωστή ως ΜΕΘΟΔΟ των ΕΛΑΧΙΣΤΩΝ ΤΕΤΡΑΓΩΓΩΝ Η μέθοδος των ελάχιστων τετραγώνων, προσδιορίζει τη γραμμή που περνάει όσο το δυνατόν πιο κοντά από όλα τα σημεία που βρίσκονται τα δεδομένα μας. «Βρίσκει» στην ουσία εκείνη τη γραμμή (από το σύνολο των γραμμών που μπορούν να περιγράψουν τα δεδομένα μας), η οποία παρουσιάζει το μικρότερο συνολικό σφάλμα εκτίμησης.

14 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 14 Προσθέτοντας τα τετράγωνα των επιμέρους σφαλμάτων εκτίμησης μπορούμε να έχουμε μια εκτίμηση του πόσο καλά μια γραμμή περιγράφει τα δεδομένα μας. Μικρές τιμές σημαίνουν καλύτερη προσαρμογή (περιγραφή) των δεδομένων μας.

15 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 15 Επειδή όμως είναι αδύνατο να κάνουμε αυτή τη διαδικασία για όλες τις πιθανές γραμμές που μπορούν να περιγράψουν τα δεδομένα μας, υπάρχει ένας μαθηματικός τρόπος (βασισμένος στην άλγεβρα) προκειμένου να προσδιορίζεται η γραμμή που έχει την καλύτερη προσαρμογή δηλ.___________? Τη μικρότερη τιμή στο άθροισμα των τετραγώνων των επιμέρους σφαλμάτων εκτίμησης Όμως ακόμα και αν βρούμε την γραμμή με την καλύτερη προσαρμογή, υπάρχει και άλλη ανακρίβεια που πρέπει να προσδιορίσουμε, όπως η διαφορά ανάμεσα στην τιμή που προβλέπει το μοντέλο και στην πραγματική τιμή

16 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 16 Συνοψίζοντας: Αν έχουμε δύο μεταβλητές και θέλουμε να προβλέψουμε την μία από την άλλη Αρχικά βρίσκουμε τη γραμμή που περνάει πιο κοντά από το σύνολο των δεδομένων μας, και στη συνέχεια προσδιορίζουμε τη διαφορά που υπάρχει ανάμεσα στις τιμές που έχουμε πραγματικά και σε αυτές που υπολογίζει το μοντέλο

17 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 17 …Πόσο καλή όμως είναι η προσαρμογή του μοντέλου μου στα δεδομένα?

18 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 18 Για να έχουμε μια εκτίμηση του πόσο καλή είναι η προσαρμογή του μοντέλου μας, θα πρέπει να το συγκρίνουμε μα κάτι Συνήθως αυτό το «κάτι» είναι το πιο απλό μοντέλο που έχουμε δει μέχρι τώρα, δηλ. ο μέσος όρος. Παράδειγμα: Αν δεν ξέρουμε τη σχέση ανάμεσα στις πωλήσεις δίσκων και τα έξοδα διαφημιστικής δαπάνης, τότε αν κάποιος μας ρωτήσει πόσες πωλήσεις δίσκων θα κάνει η Βανδή αν ξοδέψει € θα απαντήσουμε με βάση το μέσο όρο των δίσκων που πουλάει (για παράδειγμα δίσκους). Την ίδια όμως απάντηση θα δώσουμε και στην ερώτηση «Πόσους δίσκους θα πουλήσει αν ξοδέψει 1000 €. Με άλλα λόγια ανεξάρτητα από το ποσό διαφημιστικής δαπάνης, έχουμε τον ίδιο μέσο όρο πωλήσεων.

19 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 19 Εμείς όμως μπορούμε να χρησιμοποιήοπυμε το μέσο όρο ως τη βάση με την οποία θα συγκρίνουμε τη γραμμή που περιγράφει τα δεδομένα μας Στη συνέχεια υπολογίζουμε το συνολικό άθροισμα των τετραγώνων των αποκλίσεων (δηλ. το συνολικό σφάλμα όταν εφαρμόσουμε στα δεδομένα μας το πιο απλό μοντέλο δηλ. το μέσο όρο του Υ) -Συμβολίζεται με SS T

20 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 20 Το επόμενο βήμα είναι με βάση την ευθεία που έχουμε επιλέξει ως την καλύτερη, να προσδιορίσουμε τη διαφορά ανάμεσα στις τιμές που δίνει η ευθεία και σε αυτές που πραγματικά έχουμε Τα τετράγωνα των αποκλίσεων αυτών συμβολίζονται με SS R

21 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 21 ΣΤΗ ΣΥΝΕΧΕΙΑ ΜΠΟΡΟΥΜΕ ΝΑ ΧΡΗΣΙΜΟΠΟΙΗΣΟΥΜΕ ΤΙΣ ΔΥΟ ΑΥΤΈΣ ΤΙΜΕΣ ΔΗΛ. SS T ΚΑΙ SS R ΠΡΟΚΕΙΜΕΝΟΥ ΝΑ ΠΡΟΣΔΙΟΡΙΣΟΥΜΕ ΠΟΣΟ ΚΑΛΥΤΕΡΗ ΕΙΝΑΙ Η ΓΡΑΜΜΗ ΜΕ ΤΗΝ ΚΑΛΥΤΕΡΗ ΠΡΟΣΑΡΜΟΓΗ ΣΕ ΣΧΕΣΗ ΜΕ ΤΟ ΑΝ ΧΡΗΣΙΜΟΠΟΙΟΥΣΑΜΕ ΤΟ ΜΕΣΟ ΟΡΟ. Η ΔΙΑΦΟΡΑ ΤΟΥΣ ΑΠΟΤΕΛΕΙ ΤΟ ΑΘΡΟΙΣΜΑ ΤΩΝ ΤΕΤΡΑΓΩΓΩΝ ΤΩΝ ΑΠΟΚΛΙΣΕΩΝ ΤΙΣ ΟΠΟΙΕΣ ΕΡΜΗΝΕΥΕΙ ΤΟ ΜΟΝΤΕΛΟ (ΣΥΜΒΟΛΙΖΕΤΑΙ ΜΕ SS Μ )

22 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 22 - SS T SS R SS M

23 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 23 Αν το SS Μ είναι μεγάλο τότε έχουμε σημαντική βελτίωση αναφορικά με το πόσο καλά μπορεί η γραμμή μας να προβλέψει το κριτήριο. Αντίθετα αν είναι μικρό τότε η χρησιμοποίηση της γραμμής μας δεν έχει κάτι περισσότερο να προσθέσει από το αν χρησιμοποιούσαμε απλά το μέσο όρο Το ποσοστό βελτίωσης από τη χρήση της γραμμής παλινδρόμησης δίδεται από τον τύπο:

24 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 24 Το R 2 είναι ο λεγόμενος συντελεστής προσδιορισμού και μας δείχνει το ποσοστό της ολικής μεταβολής της μεταβλητής Υ που εξηγείται από την εξίσωση παλινδρόμησης Η τετραγωνική ρίζα του R 2 είναι ο συντελεστής συσχέτισης (r) ανάμεσα στις δύο μεταβλητές

25 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 25 Τα τετράγωνα των αποκλίσεων, χρησιμοποιούνται επίσης και για το λεγόμενο F-test το οποίο θα το εξετάσουμε στην ανάλυση διακύμανσης (ΑΝΟVA)

26 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Προϋποθέσεις για τη γραμμική παλινδρόμηση (καθώς και γενικά των παραμετρικών στατιστικών τεχνικών) 1) Τα δεδομένα ακολουθούν κανονική κατανομή (normally distributed data) 2) Οι διακυμάνσεις είναι περίπου ίδιες (ομοιογενείς) (homogeneity of variance)>>>η διακύμανση μιας μεταβλητής πρέπει να είναι σταθερή για όλα τα επίπεδα των άλλων μεταβλητών. 3) Η Κλίμακα να είναι τουλάχιστον ίσων διαστημάτων (interval) 4) Ανεξαρτησία των παρατηρήσεων (Independence)>>> το ένα άτομο για παράδειγμα είναι ανεξάρτητο από το άλλο. Για τα (1) και (2), υπάρχουν αντικειμενικά τεστ μέσω SPSS. Για τα (3) και (4) απαιτείται κοινή λογική

27 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 27 Παράδειγμα. Ας υποθέσουμε ότι θέλουμε να διερευνήσουμε τη σχέση που υπάρχει ανάμεσα στην ευσυνειδησία του εργαζομένου και την ικανοποίηση από την εργασία του. Είναι άραγε οι ευσυνείδητοι υπάλληλοι πιο ικανοποιημένοι από την εργασία τους?

28 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 28

29 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 29 Μέσος όρος SS T

30 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 30 Μέσος όρος SS R

31 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 31 Αποτελέσματα από SPSS Συντελεστής συσχέτισης Συντελεστής προσδιορισμού Συντελεστής προσδιορισμού για τον πληθυσμό Τυπικό σφάλμα εκτίμησης

32 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 32 SS T SS Μ SS R

33 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 33 Υ i =β ο +β 1 Χ i +ε i β 1 = ο συντελεστής παλινδρόμησης για την προβλεπτική μεταβλητή- Στο παράδειγμα μας είναι ίσο με 0,872, δηλ. Αύξηση της ευσυνειδησίας κατά μία μονάδα οδηγεί σε αύξηση της ικανοποίησης κατά 0,872 μονάδες. Αν χρησιμοποιήσουμε την τυποποιημένη τιμή (standardized coefficient), τότε η ερμηνεία είναι : αν η ευσυνηδησία αυξηθεί κατά μία τυπική απόκλιση, η ικανοποίηση αυξάνεται κατά 0,231 τυπικές αποκλίσεις β 0 = ο σταθερός όρος (δηλ. η τιμή του Υ όταν το Χ=0) – Στο παράδειγμα μας είναι μηδέν.

34 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Χρησιμοποιώντας το μοντέλο της απλής γραμμικής παλινδρόμησης Ικανοποίηση από εργασία = 0 + 0,872*Ευσυνειδησία Υ i =β ο +β 1 Χ i

35 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 35 Δευτέρα Πολλαπλή γραμμική παλινδρόμηση

36 Στατιστική ΙΙ Ζαμπετάκης Α. Λεωνίδας, 2009 Διάλεξη 1 / 36


Κατέβασμα ppt "ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ (ΨΥΧ-122) Στατιστική IΙ (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail:"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google