EDUC 612 Ανωτερες μορφες στατιστικης αναλυσησ Έλενα Παπαναστασίου
Structural equation modeling (SEM) Δομικα μοντελα εξισωσεων
Εισαγωγικα σημεια Απαραίτητη η εις βάθος γνώση του θεματικού σας αντικειμένου μας καθοδηγεί η θεωρία Τα εργαλεία μέτρησης να έχουν καλές ψυχομετρικές ιδιότητες Λογισμικό: ΑΜΟS 18: (Analysis of Moment Structures) Causal modeling: αλλά ΔΕΝ αποδεικνύουν αιτιώδης σχέσεις
… Εισαγωγικα σημεια Χρειάζεται μεγάλα δείγματα Δεν δίνεται τόση σημασία στη στατιστική σημαντικότητα Το SEM ανήκει στην ίδια οικογένεια αναλύσεων όπως η παλινδρομική ανάλυση και το ANOVA Χρειάζεστε καλή γνώση παλινδρομικής ανάλυσης και συσχετίσεων
Γιατι να τα χρησιμοποιουμε; Περιγράφει τις σχέσεις μεταξύ μεταβλητών διαγραμματικά Οι μεταβλητές μπορούν να λειτουργήσουν ταυτόχρονα και σαν εξαρτημένες και σαν ανεξάρτητες μεταβλητές.
Γιατι να τα χρησιμοποιουμε; Μέθοδοι εργασίας: Καθαρά επιβεβαιωτική ανάλυση μοντέλων (strictly confirmatory) Εναλλακτικά μοντέλα (alternative models) Παραγωγή μοντέλων (model-generating applications) Διάκριση μεταξύ μετρήσιμων μεταβλητών (οbserved variables ) και latent variables Άλλες αναλύσεις δεν κάνουν αυτή τη διάκριση Η παραγοντική ανάλυση δεν μπορεί να προκαθορίσει τους λειτουργικούς ορισμούς Λαμβάνει υπόψη τα βαθμό αξιοπιστίας των δεδομένων και ότι υπάρχει σφάλμα μέτρησης
Επαναληψη στατιστικων εννοιων Κλίμακες μέτρησης Οργάνωση δεδομένων Συσχετίσεις Παλινδρομική ανάλυση
Κλίμακες μέτρησης ΑΛΛΑ ΠΑΡΑΔΕΙΓΜΑΤΑ: ΚΑΤΗΓΟΡΙΑΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ● Φύλο ● Φύλο ● Θρήσκευμα ● Εθνικότητα
ΆΛΛΕΣ ΔΙΑΤΑΚΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ● Σειρά αθλητών στον μαραθώνιο ● Πόσο αγαπάς το μάθημα των μαθηματικών; 1. καθόλου 2. λίγο 3. πολύ 4. πάρα πολύ
ΆΛΛΕΣ ΙΣΟΔΙΑΣΤΗΜΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ● Θερμοκρασία ● Βαθμοί μαθηματικών
ΆΛΛΕΣ ΑΝΑΛΟΓΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ● Μισθός ● Βάρος ● Ύψος
Με ποιες κλιμακεσ μετρησης μπορουν να μετρηθουν οι πιο κατω μεταβλητες; Θερμοκρασία Θέμα σπουδών Είδη κατοικίδιων ζώων Αριθμός κατοικίδιων ζώων Φύλο Τιμή του καφέ Είδος καφέ Άγχος Αισιοδοξία Στάσεις Άγαμος/ έγγαμος
Καταχωρηση δεδομενων στο spss Γράψτε κάτω τα εξής στοιχεία από 5 άτομα που απάντησαν ένα ερωτηματολόγιο
ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ SPSS Καταχώρηση δεδομένων στο SPSS (data view) Περιγραφή δεδομένων στο variable view Έλεγχος δεδομένων Στατιστικές αναλύσεις Τυπική απόκλιση Συσχετίσεις Συνδιασπορά Παλινδρομική ανάλυση
Τυπικη αποκλιση σ (standard deviation, SD)
Συσχετισεις Η συσχέτιση μας δείχνει το μέτρο σχέσης μεταξύ 2 μεταβλητών Περιγράφει ΕΥΘΥΓΡΑΜΜΕΣ ΣΧΕΙΣ Κυμαίνεται από το -1.0 στο 1.0
Συσχετίσεις Pearson product moment correlation (r) Προσπαθούμε να βρούμε σχέσεις μεταξύ μεταβλητών, και ΌΧΙ αιτιώδης σχέσεις. Χρειάζονται τουλάχιστον 2 ποσοτικές μεταβλητές Μέγεθος δείγματος: >30 >150
Συσχετίσεις Pearson product moment correlation (r) Από το συντελεστή συσχέτισης μπορούμε να πάρουμε πληροφορίες για Την κατεύθυνση της σχέσης Τη δύναμη της σχέσης
Κατεύθυνση συσχέτισης Θετικό πρόσημο (r>0 ) θετική συσχέτιση Όσο αυξάνεται η μια μεταβλητή, αυξάνεται η άλλη Π.χ. όσο αυξάνεται η κατανάλωση παγωτού, αυξάνονται και οι πνιγμοί στη θάλασσα Αρνητικό πρόσημο (r<0 ) αρνητική συσχέτιση Όσο αυξάνεται η μια μεταβλητή, μειώνεται η άλλη Π.χ. όσο αυξάνεται η συμμετοχή των φοιτητών στα συνδικαλιστικά κινήματα, τόσο μειώνονται οι ώρες διαβάσματος τους
Κατεύθυνση συσχέτισης Καθορίστε την κατεύθυνση της σχέσης των πιο κάτω μεταβλητών Αθλητική επίδοση, κάπνισμα Απουσίες, βαθμοί Θερμίδες, βάρος Ηλικία σπιτιού, αξία σπιτιού Ώρες διαβάσματος, βαθμοί
Θετική συσχέτιση
Αρνητική συσχέτιση
Δύναμη σχέσης Βαθμοί συσχέτισης κοντά στο +1 ή στο -1 αντιπροσωπεύουν δυνατές σχέσεις Βαθμοί συσχέτισης κοντά στο 0 δείχνουν ότι δεν υπάρχουν ευθύγραμμες σχέσεις μεταξύ των μεταβλητών -.5 .2 .350 .78 -1 0 -.7 -.3
Covage,height=rage,height* SD age*SD height Συνδιασπορα Covage,height=rage,height* SD age*SD height
Παλινδρομική ανάλυση Regression Προσπαθεί να εξηγήσει και να προβλέψει τη σχέση μεταξύ μεταβλητών Πως επηρεάζουν οι ώρες διαβάσματος το βαθμό των μαθητών στην επιστήμη; Ώρες διαβάσματος Βαθμός επιστήμης
Παλινδρομική ανάλυση Regression Πως επηρεάζει το φύλο και το ΚΟΕ τις επιδόσεις των Κυπρίων φοιτητών στο πανεπιστήμιο;
Παλινδρομική ανάλυση Regression Εξαρτημένη μεταβλητή: ποσοτική Ανεξάρτητες μεταβλητές: ποσοτικές, ή ποιοτικές με 2 υποκατηγορίες (π.χ. ναι/όχι, άνδρας/γυναίκα) Ανεξάρτητη μεταβλητή = εξωγενής μεταβλητή Εξαρτημένη μεταβλητή = ενδογενής μεταβλητή
Παλινδρομική ανάλυση Χ Υ Ποια εξίσωση μπορεί να περιγράψει τη σχέση αυτών των αριθμών; 1 2 4 3 6 Υ=
Παλινδρομική ανάλυση Χ Υ Ποια εξίσωση μπορεί να περιγράψει τη σχέση αυτών των αριθμών; 1 3 2 5 7 4 9 Υ=
Παλινδρομική ανάλυση Ποια εξίσωση μπορεί να περιγράψει τη σχέση αυτών των αριθμών; Ώρες διαβάσματος Βαθμός 1 3 2 5 7 4 9
Regression results (Y=Research grade) Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. (Constant) -23.575 19.143 -1.231 .223 Statistics course grade -.076 .932 -.010 -.082 .935 High school GPA 2.324 .793 .319 2.929 .005 Y= βο+β1*Statisticsgrade +β2 *HighschoolGPA +e Y=-23.575-0.76*Statisticsgrade +2.324HighschoolGPA +e Y= -0.010*Statisticsgrade +0.319HighschoolGPA +e
Έννοιες απο γραμμικη παλινδρομηση Απλή: Ŷ = (B0 + B1 X1) , όπου B1 = r SY/SX Standardized regression: b1 = rY1 (beta weight) Πολλαπλή: Ŷ = (B0 + B1 X1 + B2 X2) To Ŷ είναι composite, ένας σταθμικός γραμμικός συνδυασμός των Χ1 και Χ2 Standardized regression: bi ≠ rYi και συνήθως bi < rYi τα bi προσαρμόζονται για ενδοσυσχετίσεις των Χi και Υ R capitalizes on chance, so there are corrected R measures (the linear combination is chosen such that predictive power is maximized in the least squares method). So we need to correct for it. Covariance: Μ. Μιχαηλίδης
Statistics grade -0.10 Research grade High School GPA 0.319