Ε. Νέλλας Ανάλυση Δεδομένων με Χρήση του Στατιστικού Πακέτου SPSS για Windows (Τεύχος Διαφανειών 2) 1.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Υπολογισμός του Δείκτη Συσχέτισης
Advertisements

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Α’ εξάμηνο
Στατιστικές αναλύσεις με τη βοήθεια του SPSS
Σχέση μεταξύ ποιοτικών μεταβλητών Μπεττίνα Χάιδιτς Λέκτορας Υγιεινής-Ιατρικής Στατιστικής
ΕΙΣΑΓΩΓΗ ΣΤΟ ΜΑΡΚΕΤΙΝΓΚ Ενότητα 5 : Έρευνα Αγοράς ΙV: ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ ΙΙ: ΤΥΠΟΙ ΕΡΩΤΗΣΕΩΝ Θεοφανίδης Φαίδων Σχολή Κοινωνικών Επιστημών Τμήμα Διοίκησης Επιχειρήσεων.
ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΚΟΙΝΩΝΙΚΗΣ ΔΙΟΙΚΗΣΗΣ Εργασία στο μάθημα: Συγκριτική Κοινωνική Εργασία. Καθηγήτρια: Κανδυλάκη Αγάπη. Φοιτητής: Καβούκης.
2016. Σύνοψη δράσεων προγράμματος πρόληψης και ευαισθητοποίησης Κεντρική φιλοσοφία του προγράμματος αποτέλεσε ο στόχος μέσω των δράσεων το μήνυμα για.
1 ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ ΠΑΡΑΔΟΣΗ 1Οη (Θ) Στοιχεία Επαγωγικής Στατιστικής.
Παρουσίαση Διπλωματικής Εργασίας Θέμα: « Καταγραφή των Αντιλήψεων και Γνώσεων των Επαγγελματιών Ηλεκτρολόγων Εγκαταστατών του Νομού Ηρακλείου για τις Φωτοβολταϊκές.
1 Δείκτες Χρηματοοικονομικής Μόχλευσης Με τους δείκτες αυτούς αξιολογούνται οι συνθήκες: της μακροκρόπρόθεσμης χρηματοοικονομικής λειτουργίας της επιχείρησης.
Μπεττίνα Χάιδιτς Επίκουρη Καθηγήτρια Υγιεινής-Ιατρικής Στατιστικής
Εργαστήριο Στατιστικής (9 ο Εργαστήριο) Συσχετίσεις μεταξύ μεταβλητών (ερωτήσεων)
ΔΙΕΡΕΥΝΗΣΗ ΤΟΥ ΒΑΘΜΟΥ ΕΘΙΣΜΟΥ ΣΤΟ ΔΙΑΔΙΚΤΥΟ ΤΩΝ ΕΦΗΒΩΝ ΜΕ ΣΑΚΧΑΡΩΔΗ ΔΙΑΒΗΤΗ ΤΥΠΟΥ 1 Δανιηλίδου Αικατερίνη, Τριανταφύλλου Παναγιώτα, Χριστοφορίδης Αθανάσιος.
Test.
Test.
Έλεγχος ανεξαρτησίας (συσχέτισης) 2 κατηγορικών μεταβλητών
Καθαρή Παρούσα Αξία Η διαφορά της τρέχουσας αξίας μιας επένδυσης από το τρέχον κόστος της ονομάζεται Καθαρή Παρούσα Αξία . Με άλλα λόγια, η Κ.Π.Α. μιας.
Γραμμική παλινδρόμηση και Συσχέτιση: έλεγχοι με τον συντελεστή συσχέτισης r Στην ενότητα αυτή μελετάται η σχέση ανάμεσα σε δυο ποσοτικά χαρακτηριστικά.
Στατιστικές Υποθέσεις
Εισαγωγή στην Ανάλυση Γλωσσικών Δεδομένων
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
ΕΠΙΔΗΜΙΟΛΟΓΙΚΗΣ ΜΕΛΕΤΗΣ «Ικανοποίηση των ασθενών με ΡΑ
Παλινδρόμηση – Συσχέτιση
Βασική Στατιστική Επεξεργασία. Ερμηνεία Δεδομένων - 2.
ΜΕΤΑΣΧΗΜΑΤΙΣΤΕΣ.
Στατιστικές δοκιμασίες που χρησιμοποιούνται συχνά Παραμετρική δοκιμασία Αντίστοιχη μη-παραμετρική δοκιμασία Λόγος εφαρμογής Παράδειγμα t test για.
Σχεδιασμός Γεωργικών Πειραμάτων
Στατιστικές Υποθέσεις III
Έλεγχος ανεξαρτησίας (συσχέτισης) 2 κατηγορικών μεταβλητών
Ευαισθησία-Ειδικότητα Παράδειγμα(1)
12/05/2018.
Βιοστατιστική (Θ) Ενότητα 8: Συσχέτιση - Παλινδρόμηση
Εφαρμογές Στατιστικής στην Τεχνολογία Τροφίμων (Θ)
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ
Παράδειγμα 4.12 Πότε λαμβάνουμε υπόψη τα φαινόμενα γραμμής μετάδοσης Όνομα:Τσιμπούκας Κων/νος ΑΜ:6118 Από το βιβλίο: Ψηφιακά Ολοκληρωμένα Κυκλώματα Μία.
Σχεδίαση Μεικτών VLSI Κυκλωμάτων
Πρότυπο Πειραματικό Γυμνάσιο Ευαγγελικής Σχολής Σμύρνης
Η ΑΝΑΚΥΚΛΩΣΗ.
ΜΕΓΑ ΠΑΡΑΣΚΕΥΗ ΜΕΤΑΠΤΥΧΙΑΚΗ ΦΟΙΤΗΤΡΙΑ ΑΘΗΝΑ ΦΕΒΡΟΥΑΡΙΟΣ 2011
Εικόνα 6.1: Η οθόνη της «Βοήθειας» για την εκτύπωση εγγράφου.
Εφευρέσεις που θα κάνουν την ζωή μας πιο όμορφη…
Χειμερινό εξάμηνο 2017 Τρίτη διάλεξη
ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ
Στατιστικές Υποθέσεις
Βασικές αρχές μέτρησης, Μεταβλητές, Βασικές έννοιες στατιστικής
Μεταπτυχιακή Φοιτήτρια Χριστίνα Ψήμμα Χειρ. Οδοντίατρος
Οικιακή Οικονομία Α’ Γυμνασίου Μάθημα 6ο. Διδάσκων καθηγητής
ΚΙΝΗΤΗ ΟΜΑΔΑ ΥΓΕΙΑΣ. Καινοτόμες δράσεις Π.Φ.Υ. στην κοινότητα
Η ΕΡΓΑΣΙΑΚΗ ΙΚΑΝΟΠΟΙΗΣΗ ΤΟΥ ΝΟΣΗΛΕΥΤΙΚΟΥ ΠΡΟΣΩΠΙΚΟΥ ΕΝΟΣ ΚΥΠΡΙΑΚΟΥ ΝΟΣΟΚΟΜΕΙΟΥ Παναγιώτου Νικολέτα1, Πρεζεράκος Παναγιώτης2, Κουράκος Μιχαήλ3, Δρελιώζη.
أثر بعض استراتيجيات حل المشكلات الرياضية وتكوينها
تقدير المتغيرات في دراسات الجدوى
ΦΥΛΕΤΙΚΟΣ ΔΙΜΟΡΦΙΣΜΟΣ ΕΓΚΕΦΑΛΟΥ
Βιοστατιστική (Θ) Ενότητα 7: Μη-Παραμετρικές Δοκιμασίες
به نام خدا فصل پانزدهم خازن در جریان مستقیم.
Εικόνα 6.1: Η οθόνη της «Βοήθειας» για την εκτύπωση εγγράφου.
Μάθημα [GD3021]: ΑΝΑΛΥΣΗ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΩΝ ΚΑΤΑΣΤΑΣΕΩΝ
Ἀλφαβετ.
Στατιστικές Υποθέσεις
Δρ. Γεωργία Κηπουροπούλου
Τ. Ε. Ι. Αθήνας Τμήμα Ιατρικών Εργαστηρίων ΒΙΟΣΤΑΤΙΣΤΙΚΗ
يئΎصحإ΍ ليϠحتل΍ يف ΔصصΨتϤل΍ ΔيΒيέΪتل΍ ΓέϭΪل΍ عϤجتϤل΍ ΔيϠك ΏΎحέ يف ΕΪقع جمΎنήب ϡ΍ΪΨتسΎب (SPSS) ήيمأ΍ ΪϬعم ΎϬϤظن يتل΍ϭ ،ΔعمΎجلΎب سيέΪتل΍ ΔΌيه.
Δ. ΚΙΟΥΚΙΑΣ, «ΦΟΡΜΕΣ ΔΙΑΚΥΒΕΡΝΗΣΗΣ ΣΤΗΝ ΕΠΟΧΗ ΤΗΣ ΠΑΓΚΟΣΜΙΟΠΟΙΗΣΗΣ»
МИФ ғылымына саяхат Интелектуалды шоу.
Κεφάλαιο 12 Απλή Γραμμική Παλινδρόμηση.
ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (ΜΕΡΟΣ Γ’)
Βιοστατιστική (Θ) Ενότητα 5: Μη-Παραμετρικές Δοκιμασίες ΤΕΙ Αθήνας
Αρχές Bιοστατιστικής Γεωργία Βουρλή Τμήμα Βιοστατιστικής και Επιδημιολογίας Ιατρική Σχολή ΕΚΠΑ Μεταπτυχιακό Πρόγραμμα Αγγειοχειρουργική.
Δ. ΚΙΟΥΚΙΑΣ, «ΦΟΡΜΕΣ ΔΙΑΚΥΒΕΡΝΗΣΗΣ ΣΤΗΝ ΕΠΟΧΗ ΤΗΣ ΠΑΓΚΟΣΜΙΟΠΟΙΗΣΗΣ»
Δρ Μαρία Καμηλάκη, Διδάσκουσα Π.Δ. 407/80 Φιλοσοφική Σχολή
Συμφωνία επί της ασφαλιστικής αξίας
Μεταγράφημα παρουσίασης:

Ε. Νέλλας Ανάλυση Δεδομένων με Χρήση του Στατιστικού Πακέτου SPSS για Windows (Τεύχος Διαφανειών 2) 1

Πίνακες Συνάφειας – Τεστ Ανεξαρτησίας Είναι ένας καλός τρόπος παρουσίασης δύο μεταβλητών, ώστε να μπορεί κάποιος να διερευνήσει την ύπαρξη σχέσης ανάμεσά τους. Στην Έρευνα και στη Στατιστική με την έκφραση «σχέση μεταξύ μεταβλητών » εννοεί κάποιος, ότι οι μεταβλητές αυτές μεταβάλλονται (αλλάζουν) μαζί. Σχέσεις μεταξύ τακτικών μεταβλητών ή ισοδιαστημικών/αναλογικών μεταβλητών σημαίνει ότι η σειρά ή η τιμή μιας μεταβλητής τείνει να αλλάξει με τη σειρά ή τη τιμή μιας άλλης μεταβλητής Σχέσεις μεταξύ ονομαστικών μεταβλητών σημαίνει ότι η μία κατηγορία της μιας μεταβλητής τείνει να παρουσιάζεται μαζί με μια κατηγορία μιας άλλης μεταβλητής. 2

Όταν δύο μεταβλητές μεταβάλλονται (αλλάζουν) προς την ίδια κατεύθυνση έχουν θετική σχέση ενώ όταν μεταβάλλονται προς την αντίθετη κατεύθυνση έχουν αρνητική σχέση. Θετικές ή Αρνητικές Σχέσεις (Στην περίπτωση που μία ή και οι δύο είναι ονομαστικές μεταβλητές δεν μπορεί να ισχυριστεί κάποιος ύπαρξη θετικής ή αρνητικής σχέσης διότι λείπει η έννοια της διάταξης) 3

Παρατηρούμενες – Αναμενόμενες Συχνότητες και Υπόλοιπα Παρατηρώντας κάποιος σε πίνακες διασταύρωσης ή και μεγαλύτερους (που κατασκέυασε με τη βοήθεια της εντολής Crosstabs στο SPSS) μέσα στα κελιά τις παρατηρούμενες διμεταβλητές συχνότητες (observed frequencies), τα ποσοστά γραμμών και στηλών, τις θεωρητικά αναμενόμενες συχνότητες (expected frequencies) σε περίπτωση ανεξαρτησίας, καθώς επίσης και τα υπόλοιπα – residuals(δηλ αναμενόμενη τιμή κελιού – πραγματική τιμή) μπορεί να έχει μια πρώτη εικόνα της σχέσης δύο ή περισσότερων μεταβλητών. 4

5 Τυπικό CROSS-TABS (Πίνακας διασταύρωσης ή Πίνακας συνάφειας) KOD_EIS Κωδικ Εισόδημα Total 1 < > (Συνολο Περιθώριας Στήλης) EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 1 Ικανοποι ημένος Count (Παρ/νη Συχν.) Expected Count (Αναμ/νη Συχν.) 48,717,315,381,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 69,1 % 16,0 % 14,8 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 76,1 % 50,0 % 52,2% 66,4 % 2 Δυσαρε στημένος Count (Παρ/νη Συχν.) Expected Count (Αναμ/νη Συχν.) 24,58,77,741,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 41,5 % 31,7 % 26,8 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 23,3 % 50,0 % 47,8% 33,6 % Total Count (Παρ/νη Συχν.) (Σύνολο Περιθώριας Γραμμής) Expected Count (Αναμ/νη Συχν.) 73,026,023,7122,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 59,8 % 21,3 % 18,9 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 100,0 % EPIKAN1 Κωδ Ικαν/σης ως προς το εισόδημα * KOD_EIS Κωδικ Εισόδημα Crosstabulation 5

6 Τυπικό CROSS-TABS (Πίνακας διασταύρωσης ή Πίνακας συνάφειας) KOD_EIS Κωδικ Εισόδημα Total 1 < > (Συνολο Περιθώριας Στήλης) EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 1 Ικανοποιη μένος Count (Παρ/νη Συχν.) Expected Count (Αναμ/νη Συχν.) 48,717,315,381,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 69,1 % 16,0 % 14,8 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 76,1 % 50,0 % 52,2 % 66,4 % 2 Δυσαρε στημένος Count (Παρ/νη Συχν.) Expected Count (Αναμ/νη Συχν.) 24,58,77,741,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 41,5 % 31,7 % 26,8 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 23,3 % 50,0 % 47,8% 33,6 % Total Count (Παρ/νη Συχν.) (Σύνολο Περιθώριας Γραμμής) Expected Count (Αναμ/νη Συχν.) 73,026,023,7122,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 59,8 % 21,3 % 18,9 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 100,0 % EPIKAN1 Κωδ Ικαν/σης ως προς το εισόδημα * KOD_EIS Κωδικ Εισόδημα Crosstabulation Ετικέτα κατηγορίας στήλης Ετικέτα μεταβλητής στηλών Κελί ή Φατνίο Περιθωριακή ή περιθώρια στήλη Περιθωριακή ή περιθώρια γραμμή Ετικέτα μεταβλητής γραμμών Ετικέτα κατηγορίας γραμμής 6

Πως υπολογίζονται οι θεωρητικά αναμενόμενες συχνότητες (οι αριθμοί με το μπλε χρώμα) δηλ. αυτές που αναμένονται όταν ισχύει η πλήρη ανεξαρτησία μεταξύ των δύο μεταβλητών. 7

Οι Πίνακες των Cross-Tabs από μόνοι τους δεν προσφέρουν πληροφορίες για την ισχύ των σχέσεων μεταξύ των μεταβλητών. Μπορεί κάποιος όμως, χρησιμοποιώντας τους πίνακες και βλέποντας τα ποσοστά των κελιών να δεί αν δύο μεταβλητές συγγενεύουν ή αν μία μεταβλητή επηρεάζει μια άλλη. Αυτό επιτυγχάνεται αν κάποιος υπολογίσει με τον σωστό τρόπο τα ποσοστά. Γενικός κανόνας: Αν κάποιος θέλει να συγκρίνει τα φατνία οριζόντια θα πρέπει να υπολογίζει τα ποσοστά κάθετα (ποσοστά στηλών) και τανάπαλιν. Αν κάποιος θέλει να εξετάσει μία μεταβλητή (ανεξάρτητη ) επηρεάζει μία άλλη(εξαρτημένη) θα πρέπει να υπολογίζει τα ποσοστά ως προς τις κατηγορίες της ανεξάρτητης μεταβλητής και να τα συγκρίνει για κάθε κατηγορία της εξαρτημένης μεταβλητής. 8

Στον προηγούμενο Cross-Tabs αν ήθελε κάποιος να δεί αν το εισόδημα του εργαζόμενου τον επηρεάζει στην απάντηση που έδωσε στο ερώτημα σχετικά με την ικανοποίηση από αυτό θα έπρεπε να υπολογίσει τα ποσοστά για κάθε στήλη (αριθμοί με πράσινο χρώμα) και να τα συγκρίνει οριζόντια. Αν έκανε το αντίθετο τα συμπεράσματα, που θα έβγαζε θα ήταν εσφαλμένα. Αν κάποιος συγκρίνει οριζόντια, στο προηγούμενο Cross-Tabs, τα ποσοστά στηλών παρατηρεί, ότι 76,1% από τους εργαζόμενους με χαμηλό εισόδημα ( ) το 52,2%. Όπως φαίνεται υπάρχει κάποια σημαντική διαφορά ανάμεσα σε αυτούς με τα χαμηλά εισοδήματα και σε αυτούς με τα μεσαία και υψηλά. Αυτό οδηγεί κάποιον στο συμπέρασμα ότι μάλλον υπάρχει κάποια σχέση ανάμεσα στις δύο μεταβλητές 9

Πως υπολογίζεται το Τεστ Ανεξαρτησίας χ 2 r=αριθμός γραμμών του πίνακα και c=αριθμός στηλών του πίνακα χ2=χ2=χ2=χ2= 10

Το Τεστ Ανεξαρτησίας χ 2 είναι ένα μη παραμετρικό τεστ(έλεγχος) και για να είναι αξιόπιστο πρέπει να πληρούνται οι προϋποθέσεις των μη παραμετρικών ελέγχων. 4. Το μέγεθος του δείγματος θα πρέπει να κυμαίνεται από 25 μέχρι 250 κατά τον Champion Dean, Τα στοιχεία πρέπει να προέρχονται από τυχαίο δείγμα (δείγμα που προέρχεται από απλή τυχαία δειγματοληψία) 2. Ανεξάρτητες παρατηρήσεις, που σημαίνει ότι κάθε παρατήρηση θα πρέπει να προέρχεται από διαφορετικό υποκείμενο. 3. Θα πρέπει η αναμενόμενη συχνότητα (το θεωρητικό μέγεθος κάθε κατηγορίας) σε κάθε κελί του πίνακα να έχει τιμή ίση με 5 ή παραπάνω. Κάποιοι συγγραφείς δίνουν μια πιο ελαστική προϋπόθεση: το πολύ το 20% των αναμενόμενων συχνοτήτων των κελιών του πίνακα συνάφειας να έχουν τιμή κάτω από το 5. 11

Value= Η τιμή του ελέγχου όπως προκύπτει με αντικατάσταση στον αντίστοιχο τύπο που αναφέρθηκε προηγούμενα df= Οι βαθμοί ελευθερίας του τεστ, οι οποίοι για το συγκεκριμένο δείκτη είναι (r-1)*(c-1), όπου r και c οι διαστάσεις του Πίνακα Asymp. Sign (2-side d)= Η ισχύς του τεστ. Το τεστ χ 2 ονομάζεται και τεστ ανεξαρτησίας, άρα έχει μια μηδενική και μία εναλλακτική υπόθεση Ηο: Οι μεταβλητές είναι ανεξάρτητες, άρα δεν υπάρχει καμμία σχέση μεταξύ τους Ηο: Οι μεταβλητές είναι ανεξάρτητες, άρα δεν υπάρχει καμμία σχέση μεταξύ τους H1: Οι μεταβλητές δεν είναι ανεξάρτητες, άρα υπάρχει σχέση μεταξύ τους H1: Οι μεταβλητές δεν είναι ανεξάρτητες, άρα υπάρχει σχέση μεταξύ τους Ο έλεγχος γίνεται πολύ απλά με τη σύγκριση ενός προκαθορισμένου επιπέδου σημαντικότητας ‘α’ όπου α μια μικρή πιθανότητα(συνήθως 0.05), με την σημαντικότητα-significance p(0,013), που προκύπτει από το τεστ. Έτσι αποφασίζουμε σε επίπεδο σημαντικότητας α (0,05): Εάν p < α απορρίπτεται η Ηο, υπόθεση της ανεξαρτησίας (0,013<0,05) Εάν p > α δεν απορρίπτεται η Ηο υπόθεση της ανεξαρτησίας. ΠΙΝΑΚΑΣ Chi-Square Test από το Spss για Windows 12

Σχόλιο 1. Γενικά το Pearson Chi-Square είναι ένας δείκτης που εξασφαλίζει λίγες πληροφορίες σχετικά με το πώς συσχετίζονται οι μεταβλητές ή πόσο ισχυρή είναι η σχέση. Επίσης το μέγεθος του χ2 δεν εξαρτάται μόνο από την διαφορά των εμπειρικών και θεωρητικών τιμών αλλά και από το μέγεθος του δείγματος. Σχόλιο 2. Ο δείκτης Likelihoud Ratio (λόγος πιθανοφάνειας) είναι μία στατιστική παρόμοια με το χ2 του Pearson. Για μεγάλα μεγέθη δειγμάτων οι δύο στατιστικές έχουν παραπλήσια τιμή. Σχόλιο 3. Ο τρίτος δείκτης Linear by Linear είναι ένα μέτρο της γραμμικής σχέσης μεταξύ των μεταβλητών γραμμής και στήλης. Χρησιμοποιείται όταν και οι δύο μεταβλητές είναι ποσοτικές ή τακτικές και είναι ταξινομημένες από την μικρότερη προς την μεγαλύτερη. Στην πράξη είναι ο συντελεστής συσχέτισης του Pearson υψωμένος στο τετράγωνο, πολλαπλασιασμένος με το μέγεθος του δείγματος ελαττωμένος κατά μία μονάδα. Διάφορα σχόλια για το χ 2 (Chi-Square) 13

Η μέτρηση της ισχύς των σχέσεων μεταξύ δύο ή περισσότερων μεταβλητών γίνεται με στατιστικούς δείκτες, που είναι γνωστοί ως Μέτρα ή Συντελεστές Συνάφειας. Τα Μέτρα Συνάφειας παίρνουν τιμές μεταξύ –1 και Η τιμή μηδέν (0) δείχνει παντελή έλλειψη σχέσης. 2.Η τιμή +1 δείχνει τέλεια θετική σχέση και 3.Η τιμή –1 δείχνει τέλεια αρνητική σχέση Πως μετριούνται οι σχέσεις μεταξύ δύο ή περισσότερων μεταβλητών 14

Η επιλογή εξαρτάται από διάφορους παράγοντες εκ των οποίων δύο είναι οι πιο σημαντικοί : 1.Το Επίπεδο Μέτρησης των μεταβλητών. Άλλα μέτρα συνάφειας ισχύουν για τις ονομαστικές μεταβλητές, άλλα για τις τακτικές και άλλα για τις ισοδιαστημικές/αναλογικές(ποσοτικές μεταβλητές).Στην περίπτωση, που κάποιος έχει διαφορετική κλίμακα μέτρησης για τις μεταβλητές του τότε επιλέγει τα μέτρα συνάφειας, που είναι κατάλληλα για τις χαμηλότερες κλίμακες μέτρησης 2.Το αν η σχέση είναι Συμμετρική ή Ασύμμετρη, δηλαδή στην πράξη αν δεν γίνεται ή γίνεται διάκριση μεταξύ εξαρτημένης και ανεξάρτητης μεταβλητής). Με άλλα λόγια αν η ερώτηση, που θέτει κάποιος είναι «υπάρχει σχέση μεταξύ δύο μεταβλητών» τότε πρόκειται για συμμετρική σχέση, ενώ αν η ερώτηση είναι «αν μια μεταβλητή επηρεάζει μια άλλη» η σχέση είναι ασύμμετρη. Πως γίνεται η επιλογή του κατάλληλου Μέτρου ή Συντελεστού Συνάφειας 15

Κλίμακα Μέτρησης Κλίμακα ΜέτρησηςΣυμμετρικήΑσσύμετρη ΟΝΟΜΑΣΤΙΚΕΣ Phi(φ) (για πίνακες 2x2) Lambda (λ) V του Crammer (για πινακας nxk) ή τ του Goodman και Kruskal ή τ του Goodman και Kruskal ΤΑΚΤΙΚΕΣ Gamma (γ) (για μεταβλητές με λίγες κατηγορίες) Sommer’s d Spearman ρ (για μεταβλητές με πολλές κατηγορίες, όταν έχουμε τη σειρά ατόμων σε αυτές τις μεταβλητές ανα δύο) Kentall’s tau-b (για τετραγωνικούς πίνακες δηλ πίνακες με ίσο αριθμό κατηγοριών για τις δύο μεταβλητές) Kentall’s tau-c ΙΣΟΔΙΑΣΤΗΜΙΚΕΣ Pearson r Παλινδρόμηση (δεν είναι στατιστικό, αλλά τεχνική όταν έχουμε εξαρτημένη μεταβλητή και μία ή περισσότερες ανεξάρτητες μεταβλητές Πίνακας Μέτρων ή Συντελεστών Συνάφειας 16

Υπολογισμός των συντελεστών φ και V του Crammer στηρίζεται στο στατιστικό χ 2 και κατά συνέπεια έχουν τις ίδιες αδυναμίες, που διαθέτει το συγκεκριμένο στατιστικό. Επομένως ο υπολογισμός τους απαιτεί συχνότητες μεγαλύτερες του 5 για κάθε φατνίο του πίνακας συνάφειας. Οι τύποι υπολογισμού των φ και V του Crammer είναι: Υπολογισμός Phi(φ) και V του Crammer Όπως φαίνεται από τους τύπους υπολογισμού τα δύο στατιστικά έχουν την ίδια τιμή όταν εξετάζονται πίνακες διαστάσεων 2x2. 17

Lambda (λ) Goodman και Kruskal’s tau (μόνο για τετραγωνικούς πίνακες) Gamma (γ) (για μεταβλητές με λίγες κατηγορίες) Συντελεστές Συνάφειας που δείχνουν την «αναλογική ελάττωση του σφάλματος» που επιτυγχάνεται όταν χρησιμοποιήσει κάποιος μια μεταβλητή για να προβλέψει μια άλλη σε σύγκριση με το αν χρησιμοποιήσει μόνη της την μεταβλητή 18

Το λ χρησιμοποιείται σε ονομαστικά δεδομένα και δείχνει το ποσοστό ελάττωσης του λάθους, που κάνει κάποιος όταν χρησιμοποιήσει μια ανεξάρτητη μεταβλητή για να προβλέψει την τιμή μιας. Οι τύποι υπολογισμού του λ είναι: Υπολογισμός του Lamda (λ) Το Ε1 είναι το λάθος, που κάνει κάποιος αν δεν χρησιμοποιήσει την ανεξάρτητη μεταβλητή και το Ε2 το λάθος που θα κάνει κάποιος, όταν την χρησιμοποιήσει. Η διαφορά τους ως μέρος του πρώτου δεν είναι παρά το ποσοστό ελάττωσης του λάθους 19

Παράδειγμα Υπολογισμού του Lamda (λ) Για να εξετάσει κάποιος αν το επίπεδο εκπαίδευσης των ερωτωμένων εξαρτάται από το φύλο θα κάνει τις εξής σκέψεις. Αν θεωρήσει, ότι όλοι πηγαίνουν στο Δημοτικό ή ότι όλοι πηγαίνουν στο γυμνάσιο ή ότι όλοι πηγαίνουν στο λύκειο το λάθος που θα κάνει είναι αντίστοιχα (84-21)=63, (84- 26)=58 και (84-37)=47. Απ’ αυτά παίρνει τη μικρότερη συχνότητα (47). Αυτό είναι το Ε1. Αν τώρα κάποιος χρησιμοποιήσει το Φύλο και ακολουθήσει την ίδια διαδικασία για κάθε στήλη το λάθος θα είναι για την πρώτη στήλη (24-10=14, 24-8=16, 24-6=18) το (14 ) και για τη δεύτερη (60-11=49, =42, 60-31= 29) το (29) η μικρότερη αντίστοιχα συχνότητα. Προσθέτοντας τις δύο αυτές ποσότητες έχουμε το Ε2=14+29=43. Αντικαθιστώντας στον τύπο τα λ θα είναι (47-43)/43=0,085. Αυτό σημαίνει, ότι στην περίπτωση που κάποιος χρησιμοποιήσει ως ανεξάρτητη μεταβλητή το Φύλο και ως εξαρτημένη μεταβλητή το Επίπεδο Εκπαίδευσης θα μπορέσει να πετύχει μείωση στο σφάλμα πρόβλεψης ίση με 8,5%. ΦύλοΣύνολο Σειράς ΆρρενΘήλυ Επίπεδο Εκπ/σης Δημοτικό Γυμνάσιο81826 Λύκειο63137 Σύνολο Στήλης

Υπολογισμός του Lamda (λ) με το Spss 21

Το γ, d του Somer και τau-b του Kendal χρησιμοποιούνται σε πίνακες με γραμμές και στήλες διατεταγμένων τιμών και γι’ αυτό έχουν πολλά κοινά σημεία. Οι τύποι υπολογισμού των παραπάνω στατιστικών είναι: Υπολογισμός των γ, d του Somer και τau-b του Kendal Όπως φαίνεται, όλοι οι παραπάνω τύποι για τον υπολογισμό τους απαιτούν τις ποσότητες Ν s και N d. 22

Παράδειγμα Υπολογισμού γ, d του Somer και tau-b του Kendall Με το διμεταβλητό πίνακα ταξινομημένο, έτσι ώστε οι χαμηλές κατηγορίες και των δύο μεταβλητών να βρίσκονται στο πάνω αριστερό κελί η διαδικασία έχει ως εξής : Για να υπολογισθεί το Νs, κάποιος αρχίζει από την πρώτη σειρά και πολλαπλασιάζει τη συχνότητα του αριστερού κελιού με το άθροισμα των συχνοτήτων των κελιών, που βρίσκονται κάτω και δεξιά από αυτό το κελί 40*( ). Μετά παίρνει το δεύτερο κελί της πρώτης σειράς και το πολλαπλάσιάζει πάλι με το άθροισμα αυτών που βρίσκονται κάτω και δεξιά από αυτό το κελί : 15*(20+15). Στη συνέχεια γίνεται το ίδιο για το πρώτο και δεύτερο κελί της δεύτερης σειράς : 5*(15+15) και 30*(15) αντίστοιχα. Το άθροισμα όλων αυτών είναι το Νs. Για το υπολογισμό του Νd, γίνεται η ίδια διαδικασία ξεκινώντας από το πάνω δεξί κελί και πολλαπλασιάζοντας με το άθροισμα των κελιών που βρίσκονται κάτω και αριστερά από αυτό το κελί [5*( )]. ΕισόδημαΣύνολο Σειράς ΧαμηλόΜεσαίοΥψηλό Κοινωνικό Επίπεδο Χαμηλό Μεσαίο Υψηλό Σύνολο Στήλης Στον παρακάτω πίνακα φαίνεται η κατανομή μεταξύ του κοινωνικού επιπέδου κατά επίπεδο εισοδήματος. 23

Υπολογισμός Ν s ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 Νs=40*( )+15*(20+15)+50*(15+15)+30*(15) =5,675 24

Υπολογισμός Ν d ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 Νd=5*( )+15*(50+10)+20*(15+10)+30*(10)=2,225 25

Υπολογισμός d του Somer ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 Για τον υπολογισμό του d του Somer πρέπει να υπολογισθεί η ποσότητα T ψ όπου ψ η εξαρτημένη μεταβλητή(στη συγκεκριμένη περίπτωση είναι η μεταβλητή σειράς) Τ ψ =40*(15+5)+15*(5)+50*(30+20)+30*(20)+10*(15+15)+15*(15)= = ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό

Υπολογισμός tau-b του Kendall ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 Για τον υπολογισμό του tau-b του Kendall πρέπει να υπολογισθεί η ποσότητα T x όπου x η ανεξάρτητη μεταβλητή (στη συγκεκριμένη περίπτωση είναι η μεταβλητή στήλης) Τ χ =40*(50+10)+50*(10)+15*(30+15)+30*(15)+5*(20+15)+20*(15)= = ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό

Υπολογισμού γ, d του Somer και tau-b του Kendall με το Spss 28

Τέλεια Αρνητική Σχέση 0 Παντελή Έλλειψη Σχέσης +1 Τέλεια Θετική Σχέση 0 – 0,30 Αδύναμη Σχέση 0,31 – 0,60 Μέτρια Σχέση 0, Ισχυρή Σχέση Ερμηνεία των Συντελεστών Συνάφειας 29

Διαγράμματα σκεδασμού 30

Συντελεστής Συσχέτισης ή r του Pearson  Ο συντελεστής συσχέτισης (r) δύο ποσοτικών μεταβλητών παίρνει τιμές από -1 μέχρι +1.  Όταν ο συντελεστής συχέτισης είναι κοντά στο +1 ή στο -1 έχουμε υψηλή θετική ή αντίστοιχα αρνητική γραμμική συσχέτιση, ενώ όταν είναι μηδέν έχουμε απουσία γραμμικής συσχέτισης. 31