Ε. Νέλλας Ανάλυση Δεδομένων με Χρήση του Στατιστικού Πακέτου SPSS για Windows (Τεύχος Διαφανειών 2) 1
Πίνακες Συνάφειας – Τεστ Ανεξαρτησίας Είναι ένας καλός τρόπος παρουσίασης δύο μεταβλητών, ώστε να μπορεί κάποιος να διερευνήσει την ύπαρξη σχέσης ανάμεσά τους. Στην Έρευνα και στη Στατιστική με την έκφραση «σχέση μεταξύ μεταβλητών » εννοεί κάποιος, ότι οι μεταβλητές αυτές μεταβάλλονται (αλλάζουν) μαζί. Σχέσεις μεταξύ τακτικών μεταβλητών ή ισοδιαστημικών/αναλογικών μεταβλητών σημαίνει ότι η σειρά ή η τιμή μιας μεταβλητής τείνει να αλλάξει με τη σειρά ή τη τιμή μιας άλλης μεταβλητής Σχέσεις μεταξύ ονομαστικών μεταβλητών σημαίνει ότι η μία κατηγορία της μιας μεταβλητής τείνει να παρουσιάζεται μαζί με μια κατηγορία μιας άλλης μεταβλητής. 2
Όταν δύο μεταβλητές μεταβάλλονται (αλλάζουν) προς την ίδια κατεύθυνση έχουν θετική σχέση ενώ όταν μεταβάλλονται προς την αντίθετη κατεύθυνση έχουν αρνητική σχέση. Θετικές ή Αρνητικές Σχέσεις (Στην περίπτωση που μία ή και οι δύο είναι ονομαστικές μεταβλητές δεν μπορεί να ισχυριστεί κάποιος ύπαρξη θετικής ή αρνητικής σχέσης διότι λείπει η έννοια της διάταξης) 3
Παρατηρούμενες – Αναμενόμενες Συχνότητες και Υπόλοιπα Παρατηρώντας κάποιος σε πίνακες διασταύρωσης ή και μεγαλύτερους (που κατασκέυασε με τη βοήθεια της εντολής Crosstabs στο SPSS) μέσα στα κελιά τις παρατηρούμενες διμεταβλητές συχνότητες (observed frequencies), τα ποσοστά γραμμών και στηλών, τις θεωρητικά αναμενόμενες συχνότητες (expected frequencies) σε περίπτωση ανεξαρτησίας, καθώς επίσης και τα υπόλοιπα – residuals(δηλ αναμενόμενη τιμή κελιού – πραγματική τιμή) μπορεί να έχει μια πρώτη εικόνα της σχέσης δύο ή περισσότερων μεταβλητών. 4
5 Τυπικό CROSS-TABS (Πίνακας διασταύρωσης ή Πίνακας συνάφειας) KOD_EIS Κωδικ Εισόδημα Total 1 < > (Συνολο Περιθώριας Στήλης) EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 1 Ικανοποι ημένος Count (Παρ/νη Συχν.) Expected Count (Αναμ/νη Συχν.) 48,717,315,381,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 69,1 % 16,0 % 14,8 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 76,1 % 50,0 % 52,2% 66,4 % 2 Δυσαρε στημένος Count (Παρ/νη Συχν.) Expected Count (Αναμ/νη Συχν.) 24,58,77,741,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 41,5 % 31,7 % 26,8 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 23,3 % 50,0 % 47,8% 33,6 % Total Count (Παρ/νη Συχν.) (Σύνολο Περιθώριας Γραμμής) Expected Count (Αναμ/νη Συχν.) 73,026,023,7122,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 59,8 % 21,3 % 18,9 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 100,0 % EPIKAN1 Κωδ Ικαν/σης ως προς το εισόδημα * KOD_EIS Κωδικ Εισόδημα Crosstabulation 5
6 Τυπικό CROSS-TABS (Πίνακας διασταύρωσης ή Πίνακας συνάφειας) KOD_EIS Κωδικ Εισόδημα Total 1 < > (Συνολο Περιθώριας Στήλης) EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 1 Ικανοποιη μένος Count (Παρ/νη Συχν.) Expected Count (Αναμ/νη Συχν.) 48,717,315,381,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 69,1 % 16,0 % 14,8 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 76,1 % 50,0 % 52,2 % 66,4 % 2 Δυσαρε στημένος Count (Παρ/νη Συχν.) Expected Count (Αναμ/νη Συχν.) 24,58,77,741,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 41,5 % 31,7 % 26,8 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 23,3 % 50,0 % 47,8% 33,6 % Total Count (Παρ/νη Συχν.) (Σύνολο Περιθώριας Γραμμής) Expected Count (Αναμ/νη Συχν.) 73,026,023,7122,0 % within EPIKAN1 Κωδ. Ικαν/ση ως προς το εισόδημα 59,8 % 21,3 % 18,9 % 100,0 % % within KOD_EIS Κωδικ. Εισόδημα 100,0 % EPIKAN1 Κωδ Ικαν/σης ως προς το εισόδημα * KOD_EIS Κωδικ Εισόδημα Crosstabulation Ετικέτα κατηγορίας στήλης Ετικέτα μεταβλητής στηλών Κελί ή Φατνίο Περιθωριακή ή περιθώρια στήλη Περιθωριακή ή περιθώρια γραμμή Ετικέτα μεταβλητής γραμμών Ετικέτα κατηγορίας γραμμής 6
Πως υπολογίζονται οι θεωρητικά αναμενόμενες συχνότητες (οι αριθμοί με το μπλε χρώμα) δηλ. αυτές που αναμένονται όταν ισχύει η πλήρη ανεξαρτησία μεταξύ των δύο μεταβλητών. 7
Οι Πίνακες των Cross-Tabs από μόνοι τους δεν προσφέρουν πληροφορίες για την ισχύ των σχέσεων μεταξύ των μεταβλητών. Μπορεί κάποιος όμως, χρησιμοποιώντας τους πίνακες και βλέποντας τα ποσοστά των κελιών να δεί αν δύο μεταβλητές συγγενεύουν ή αν μία μεταβλητή επηρεάζει μια άλλη. Αυτό επιτυγχάνεται αν κάποιος υπολογίσει με τον σωστό τρόπο τα ποσοστά. Γενικός κανόνας: Αν κάποιος θέλει να συγκρίνει τα φατνία οριζόντια θα πρέπει να υπολογίζει τα ποσοστά κάθετα (ποσοστά στηλών) και τανάπαλιν. Αν κάποιος θέλει να εξετάσει μία μεταβλητή (ανεξάρτητη ) επηρεάζει μία άλλη(εξαρτημένη) θα πρέπει να υπολογίζει τα ποσοστά ως προς τις κατηγορίες της ανεξάρτητης μεταβλητής και να τα συγκρίνει για κάθε κατηγορία της εξαρτημένης μεταβλητής. 8
Στον προηγούμενο Cross-Tabs αν ήθελε κάποιος να δεί αν το εισόδημα του εργαζόμενου τον επηρεάζει στην απάντηση που έδωσε στο ερώτημα σχετικά με την ικανοποίηση από αυτό θα έπρεπε να υπολογίσει τα ποσοστά για κάθε στήλη (αριθμοί με πράσινο χρώμα) και να τα συγκρίνει οριζόντια. Αν έκανε το αντίθετο τα συμπεράσματα, που θα έβγαζε θα ήταν εσφαλμένα. Αν κάποιος συγκρίνει οριζόντια, στο προηγούμενο Cross-Tabs, τα ποσοστά στηλών παρατηρεί, ότι 76,1% από τους εργαζόμενους με χαμηλό εισόδημα ( ) το 52,2%. Όπως φαίνεται υπάρχει κάποια σημαντική διαφορά ανάμεσα σε αυτούς με τα χαμηλά εισοδήματα και σε αυτούς με τα μεσαία και υψηλά. Αυτό οδηγεί κάποιον στο συμπέρασμα ότι μάλλον υπάρχει κάποια σχέση ανάμεσα στις δύο μεταβλητές 9
Πως υπολογίζεται το Τεστ Ανεξαρτησίας χ 2 r=αριθμός γραμμών του πίνακα και c=αριθμός στηλών του πίνακα χ2=χ2=χ2=χ2= 10
Το Τεστ Ανεξαρτησίας χ 2 είναι ένα μη παραμετρικό τεστ(έλεγχος) και για να είναι αξιόπιστο πρέπει να πληρούνται οι προϋποθέσεις των μη παραμετρικών ελέγχων. 4. Το μέγεθος του δείγματος θα πρέπει να κυμαίνεται από 25 μέχρι 250 κατά τον Champion Dean, Τα στοιχεία πρέπει να προέρχονται από τυχαίο δείγμα (δείγμα που προέρχεται από απλή τυχαία δειγματοληψία) 2. Ανεξάρτητες παρατηρήσεις, που σημαίνει ότι κάθε παρατήρηση θα πρέπει να προέρχεται από διαφορετικό υποκείμενο. 3. Θα πρέπει η αναμενόμενη συχνότητα (το θεωρητικό μέγεθος κάθε κατηγορίας) σε κάθε κελί του πίνακα να έχει τιμή ίση με 5 ή παραπάνω. Κάποιοι συγγραφείς δίνουν μια πιο ελαστική προϋπόθεση: το πολύ το 20% των αναμενόμενων συχνοτήτων των κελιών του πίνακα συνάφειας να έχουν τιμή κάτω από το 5. 11
Value= Η τιμή του ελέγχου όπως προκύπτει με αντικατάσταση στον αντίστοιχο τύπο που αναφέρθηκε προηγούμενα df= Οι βαθμοί ελευθερίας του τεστ, οι οποίοι για το συγκεκριμένο δείκτη είναι (r-1)*(c-1), όπου r και c οι διαστάσεις του Πίνακα Asymp. Sign (2-side d)= Η ισχύς του τεστ. Το τεστ χ 2 ονομάζεται και τεστ ανεξαρτησίας, άρα έχει μια μηδενική και μία εναλλακτική υπόθεση Ηο: Οι μεταβλητές είναι ανεξάρτητες, άρα δεν υπάρχει καμμία σχέση μεταξύ τους Ηο: Οι μεταβλητές είναι ανεξάρτητες, άρα δεν υπάρχει καμμία σχέση μεταξύ τους H1: Οι μεταβλητές δεν είναι ανεξάρτητες, άρα υπάρχει σχέση μεταξύ τους H1: Οι μεταβλητές δεν είναι ανεξάρτητες, άρα υπάρχει σχέση μεταξύ τους Ο έλεγχος γίνεται πολύ απλά με τη σύγκριση ενός προκαθορισμένου επιπέδου σημαντικότητας ‘α’ όπου α μια μικρή πιθανότητα(συνήθως 0.05), με την σημαντικότητα-significance p(0,013), που προκύπτει από το τεστ. Έτσι αποφασίζουμε σε επίπεδο σημαντικότητας α (0,05): Εάν p < α απορρίπτεται η Ηο, υπόθεση της ανεξαρτησίας (0,013<0,05) Εάν p > α δεν απορρίπτεται η Ηο υπόθεση της ανεξαρτησίας. ΠΙΝΑΚΑΣ Chi-Square Test από το Spss για Windows 12
Σχόλιο 1. Γενικά το Pearson Chi-Square είναι ένας δείκτης που εξασφαλίζει λίγες πληροφορίες σχετικά με το πώς συσχετίζονται οι μεταβλητές ή πόσο ισχυρή είναι η σχέση. Επίσης το μέγεθος του χ2 δεν εξαρτάται μόνο από την διαφορά των εμπειρικών και θεωρητικών τιμών αλλά και από το μέγεθος του δείγματος. Σχόλιο 2. Ο δείκτης Likelihoud Ratio (λόγος πιθανοφάνειας) είναι μία στατιστική παρόμοια με το χ2 του Pearson. Για μεγάλα μεγέθη δειγμάτων οι δύο στατιστικές έχουν παραπλήσια τιμή. Σχόλιο 3. Ο τρίτος δείκτης Linear by Linear είναι ένα μέτρο της γραμμικής σχέσης μεταξύ των μεταβλητών γραμμής και στήλης. Χρησιμοποιείται όταν και οι δύο μεταβλητές είναι ποσοτικές ή τακτικές και είναι ταξινομημένες από την μικρότερη προς την μεγαλύτερη. Στην πράξη είναι ο συντελεστής συσχέτισης του Pearson υψωμένος στο τετράγωνο, πολλαπλασιασμένος με το μέγεθος του δείγματος ελαττωμένος κατά μία μονάδα. Διάφορα σχόλια για το χ 2 (Chi-Square) 13
Η μέτρηση της ισχύς των σχέσεων μεταξύ δύο ή περισσότερων μεταβλητών γίνεται με στατιστικούς δείκτες, που είναι γνωστοί ως Μέτρα ή Συντελεστές Συνάφειας. Τα Μέτρα Συνάφειας παίρνουν τιμές μεταξύ –1 και Η τιμή μηδέν (0) δείχνει παντελή έλλειψη σχέσης. 2.Η τιμή +1 δείχνει τέλεια θετική σχέση και 3.Η τιμή –1 δείχνει τέλεια αρνητική σχέση Πως μετριούνται οι σχέσεις μεταξύ δύο ή περισσότερων μεταβλητών 14
Η επιλογή εξαρτάται από διάφορους παράγοντες εκ των οποίων δύο είναι οι πιο σημαντικοί : 1.Το Επίπεδο Μέτρησης των μεταβλητών. Άλλα μέτρα συνάφειας ισχύουν για τις ονομαστικές μεταβλητές, άλλα για τις τακτικές και άλλα για τις ισοδιαστημικές/αναλογικές(ποσοτικές μεταβλητές).Στην περίπτωση, που κάποιος έχει διαφορετική κλίμακα μέτρησης για τις μεταβλητές του τότε επιλέγει τα μέτρα συνάφειας, που είναι κατάλληλα για τις χαμηλότερες κλίμακες μέτρησης 2.Το αν η σχέση είναι Συμμετρική ή Ασύμμετρη, δηλαδή στην πράξη αν δεν γίνεται ή γίνεται διάκριση μεταξύ εξαρτημένης και ανεξάρτητης μεταβλητής). Με άλλα λόγια αν η ερώτηση, που θέτει κάποιος είναι «υπάρχει σχέση μεταξύ δύο μεταβλητών» τότε πρόκειται για συμμετρική σχέση, ενώ αν η ερώτηση είναι «αν μια μεταβλητή επηρεάζει μια άλλη» η σχέση είναι ασύμμετρη. Πως γίνεται η επιλογή του κατάλληλου Μέτρου ή Συντελεστού Συνάφειας 15
Κλίμακα Μέτρησης Κλίμακα ΜέτρησηςΣυμμετρικήΑσσύμετρη ΟΝΟΜΑΣΤΙΚΕΣ Phi(φ) (για πίνακες 2x2) Lambda (λ) V του Crammer (για πινακας nxk) ή τ του Goodman και Kruskal ή τ του Goodman και Kruskal ΤΑΚΤΙΚΕΣ Gamma (γ) (για μεταβλητές με λίγες κατηγορίες) Sommer’s d Spearman ρ (για μεταβλητές με πολλές κατηγορίες, όταν έχουμε τη σειρά ατόμων σε αυτές τις μεταβλητές ανα δύο) Kentall’s tau-b (για τετραγωνικούς πίνακες δηλ πίνακες με ίσο αριθμό κατηγοριών για τις δύο μεταβλητές) Kentall’s tau-c ΙΣΟΔΙΑΣΤΗΜΙΚΕΣ Pearson r Παλινδρόμηση (δεν είναι στατιστικό, αλλά τεχνική όταν έχουμε εξαρτημένη μεταβλητή και μία ή περισσότερες ανεξάρτητες μεταβλητές Πίνακας Μέτρων ή Συντελεστών Συνάφειας 16
Υπολογισμός των συντελεστών φ και V του Crammer στηρίζεται στο στατιστικό χ 2 και κατά συνέπεια έχουν τις ίδιες αδυναμίες, που διαθέτει το συγκεκριμένο στατιστικό. Επομένως ο υπολογισμός τους απαιτεί συχνότητες μεγαλύτερες του 5 για κάθε φατνίο του πίνακας συνάφειας. Οι τύποι υπολογισμού των φ και V του Crammer είναι: Υπολογισμός Phi(φ) και V του Crammer Όπως φαίνεται από τους τύπους υπολογισμού τα δύο στατιστικά έχουν την ίδια τιμή όταν εξετάζονται πίνακες διαστάσεων 2x2. 17
Lambda (λ) Goodman και Kruskal’s tau (μόνο για τετραγωνικούς πίνακες) Gamma (γ) (για μεταβλητές με λίγες κατηγορίες) Συντελεστές Συνάφειας που δείχνουν την «αναλογική ελάττωση του σφάλματος» που επιτυγχάνεται όταν χρησιμοποιήσει κάποιος μια μεταβλητή για να προβλέψει μια άλλη σε σύγκριση με το αν χρησιμοποιήσει μόνη της την μεταβλητή 18
Το λ χρησιμοποιείται σε ονομαστικά δεδομένα και δείχνει το ποσοστό ελάττωσης του λάθους, που κάνει κάποιος όταν χρησιμοποιήσει μια ανεξάρτητη μεταβλητή για να προβλέψει την τιμή μιας. Οι τύποι υπολογισμού του λ είναι: Υπολογισμός του Lamda (λ) Το Ε1 είναι το λάθος, που κάνει κάποιος αν δεν χρησιμοποιήσει την ανεξάρτητη μεταβλητή και το Ε2 το λάθος που θα κάνει κάποιος, όταν την χρησιμοποιήσει. Η διαφορά τους ως μέρος του πρώτου δεν είναι παρά το ποσοστό ελάττωσης του λάθους 19
Παράδειγμα Υπολογισμού του Lamda (λ) Για να εξετάσει κάποιος αν το επίπεδο εκπαίδευσης των ερωτωμένων εξαρτάται από το φύλο θα κάνει τις εξής σκέψεις. Αν θεωρήσει, ότι όλοι πηγαίνουν στο Δημοτικό ή ότι όλοι πηγαίνουν στο γυμνάσιο ή ότι όλοι πηγαίνουν στο λύκειο το λάθος που θα κάνει είναι αντίστοιχα (84-21)=63, (84- 26)=58 και (84-37)=47. Απ’ αυτά παίρνει τη μικρότερη συχνότητα (47). Αυτό είναι το Ε1. Αν τώρα κάποιος χρησιμοποιήσει το Φύλο και ακολουθήσει την ίδια διαδικασία για κάθε στήλη το λάθος θα είναι για την πρώτη στήλη (24-10=14, 24-8=16, 24-6=18) το (14 ) και για τη δεύτερη (60-11=49, =42, 60-31= 29) το (29) η μικρότερη αντίστοιχα συχνότητα. Προσθέτοντας τις δύο αυτές ποσότητες έχουμε το Ε2=14+29=43. Αντικαθιστώντας στον τύπο τα λ θα είναι (47-43)/43=0,085. Αυτό σημαίνει, ότι στην περίπτωση που κάποιος χρησιμοποιήσει ως ανεξάρτητη μεταβλητή το Φύλο και ως εξαρτημένη μεταβλητή το Επίπεδο Εκπαίδευσης θα μπορέσει να πετύχει μείωση στο σφάλμα πρόβλεψης ίση με 8,5%. ΦύλοΣύνολο Σειράς ΆρρενΘήλυ Επίπεδο Εκπ/σης Δημοτικό Γυμνάσιο81826 Λύκειο63137 Σύνολο Στήλης
Υπολογισμός του Lamda (λ) με το Spss 21
Το γ, d του Somer και τau-b του Kendal χρησιμοποιούνται σε πίνακες με γραμμές και στήλες διατεταγμένων τιμών και γι’ αυτό έχουν πολλά κοινά σημεία. Οι τύποι υπολογισμού των παραπάνω στατιστικών είναι: Υπολογισμός των γ, d του Somer και τau-b του Kendal Όπως φαίνεται, όλοι οι παραπάνω τύποι για τον υπολογισμό τους απαιτούν τις ποσότητες Ν s και N d. 22
Παράδειγμα Υπολογισμού γ, d του Somer και tau-b του Kendall Με το διμεταβλητό πίνακα ταξινομημένο, έτσι ώστε οι χαμηλές κατηγορίες και των δύο μεταβλητών να βρίσκονται στο πάνω αριστερό κελί η διαδικασία έχει ως εξής : Για να υπολογισθεί το Νs, κάποιος αρχίζει από την πρώτη σειρά και πολλαπλασιάζει τη συχνότητα του αριστερού κελιού με το άθροισμα των συχνοτήτων των κελιών, που βρίσκονται κάτω και δεξιά από αυτό το κελί 40*( ). Μετά παίρνει το δεύτερο κελί της πρώτης σειράς και το πολλαπλάσιάζει πάλι με το άθροισμα αυτών που βρίσκονται κάτω και δεξιά από αυτό το κελί : 15*(20+15). Στη συνέχεια γίνεται το ίδιο για το πρώτο και δεύτερο κελί της δεύτερης σειράς : 5*(15+15) και 30*(15) αντίστοιχα. Το άθροισμα όλων αυτών είναι το Νs. Για το υπολογισμό του Νd, γίνεται η ίδια διαδικασία ξεκινώντας από το πάνω δεξί κελί και πολλαπλασιάζοντας με το άθροισμα των κελιών που βρίσκονται κάτω και αριστερά από αυτό το κελί [5*( )]. ΕισόδημαΣύνολο Σειράς ΧαμηλόΜεσαίοΥψηλό Κοινωνικό Επίπεδο Χαμηλό Μεσαίο Υψηλό Σύνολο Στήλης Στον παρακάτω πίνακα φαίνεται η κατανομή μεταξύ του κοινωνικού επιπέδου κατά επίπεδο εισοδήματος. 23
Υπολογισμός Ν s ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 Νs=40*( )+15*(20+15)+50*(15+15)+30*(15) =5,675 24
Υπολογισμός Ν d ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 Νd=5*( )+15*(50+10)+20*(15+10)+30*(10)=2,225 25
Υπολογισμός d του Somer ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 Για τον υπολογισμό του d του Somer πρέπει να υπολογισθεί η ποσότητα T ψ όπου ψ η εξαρτημένη μεταβλητή(στη συγκεκριμένη περίπτωση είναι η μεταβλητή σειράς) Τ ψ =40*(15+5)+15*(5)+50*(30+20)+30*(20)+10*(15+15)+15*(15)= = ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό
Υπολογισμός tau-b του Kendall ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 Για τον υπολογισμό του tau-b του Kendall πρέπει να υπολογισθεί η ποσότητα T x όπου x η ανεξάρτητη μεταβλητή (στη συγκεκριμένη περίπτωση είναι η μεταβλητή στήλης) Τ χ =40*(50+10)+50*(10)+15*(30+15)+30*(15)+5*(20+15)+20*(15)= = ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό 1015 ΧαμηλόΜεσαίοΥψηλό Χαμηλό Μεσαίο Υψηλό
Υπολογισμού γ, d του Somer και tau-b του Kendall με το Spss 28
Τέλεια Αρνητική Σχέση 0 Παντελή Έλλειψη Σχέσης +1 Τέλεια Θετική Σχέση 0 – 0,30 Αδύναμη Σχέση 0,31 – 0,60 Μέτρια Σχέση 0, Ισχυρή Σχέση Ερμηνεία των Συντελεστών Συνάφειας 29
Διαγράμματα σκεδασμού 30
Συντελεστής Συσχέτισης ή r του Pearson Ο συντελεστής συσχέτισης (r) δύο ποσοτικών μεταβλητών παίρνει τιμές από -1 μέχρι +1. Όταν ο συντελεστής συχέτισης είναι κοντά στο +1 ή στο -1 έχουμε υψηλή θετική ή αντίστοιχα αρνητική γραμμική συσχέτιση, ενώ όταν είναι μηδέν έχουμε απουσία γραμμικής συσχέτισης. 31