Στατιστική I Γ. Παπαγεωργίου XEIM
Επιλογή μεθόδου Εξαρτάται από τον ερευνητή/τρια Ποιοτικά/ ποσοτικά όταν τα data αριθμοποιούνται. εδώ – Έμφαση – στην ερμηνεία των αριθμητικών αποτελεσμάτων (computer) Σημαντικά – κατάταξη και συντονισμός στοιχείων
Είδη ανάλυσης ποσοτικών δεδομένων Περιγραφική ανάλυση μονομεταβλητών– συνοπτική παρουσίαση χαρακτηριστικών ενός φαινομένου όσον αφορά την κατανομή των μεταβλητών p.x., Περιγραφική ανάλυση διμεταβλητών– περιγραφή μορφής + δύναμης σχέσης μεταξύ μεταβλητών/ + σύγκριση χαρακτηριστικών της ίδιας μεταβλητής διαφορικών πληθυσμών ή διαφορετικών μεταβλητών στον ίδιο πληθυσμό (Επε) ξηγηματική ανάλυση – κατεύθυνση και δύναμης της επιρροής μεταξύ μεταβλητών. Επαγωγική στατιστική -- αναφορά από τo δείγμα --στον πληθυσμό/ + από τον γνωστό – στο άγνωστο πληθυσμό- Γενικεύσεις
Μονομεταβλητές: κατανομή ηλικίας ΗλικίαΣυχνότητα (f)%
ΗλικίαΣυχνότητα (f)% (N)(460)100.0
ηλικίαf% N %
Τιμές (διαστήματα κλιμ)f%
Περιγραφή κοινωνικών φαινομένων Σημαντικό – αποτύπωση των γενικών χαρακτηριστικών DATA – πρωτογενή # ομαδικά, ομάδες, οργανώσεις, κοινότητες, κράτη, κλπ. (γενική εικόνα). Βάση για ανάλυση Μεταβλητές – ιδιότητες, χαρακτηριστικά Στατιστική μέθοδος – σχετική εξαρτάται από το χαρακτηριστικά (επίπεδα μέτρησης). SPSS- πακέτα/ τμήματα (modules)
Συνοπτική περιγραφή μεταβλητών μιας κατανομής Διαγράμματα (βλ. σχεδιάγραμμα) Συχνότητες (βλ. πίνακα) ΑΜΟ, (arithmetic mean), Ẍ, μ. X= ΣXi/N Διάμεσος (median), ιεραρχικά (όχι ονομαστικές Vαρ. (τακτικό ή ονομαστ.) Επικρατούσα τιμή (mode) ονομαστικό επ. ταξινόμηση Ν= Ν+1/2 (μέση θέση όχι μέση τιμή). Εύρος= απόσταση μεταξύ 2 ακραίων τιμών
Διάγραμμα
ιστογραμμα
Διάμεσος (median) (μέση θέση όχι μέση τιμή).
Διαφορετικές μορφές κατανομών Θετικές κατανομές Αρνητικές κατανομές Λεπτόκυρτες κατανομές Δίκορφες κατανομές Ασύμμετρες κατανομές Κανονική κατανομή κατανομή κανονική, όλα μέτρα = ίδια τιμή
κανονική κατανομή Normal and both)
δίκορφη
Αρνητική κατανομή (negative) negative
Θετική κατανομή (positive)
Διασπορά/ Τυπική απόκλιση Διακύμανση (range) απόσταση μεταξύ της μικρότερης και μεγαλύτερης τιμής Π,χ. 11, 15, 16, 19, 20, 21, 24, 26, 68. R= 68-11= 57
Διασπορά σ, (variance) Τυπική απόκλιση s, (+) (standard deviation
Μετατροπή κατανομών Διευκολύνει την σύγκριση τιμών από διαφορετικές κατανομές (need μ + s) Όταν θέλουμε να αλλάξουμε τον ΑΜΟ, s προσθέτουμε (ή αφαιρούμε) μια σταθερή σε όλες τις τιμές της μεταβλητής Τυπική κατανομή = ΑΜΟ = 0, s= 1. / συμμετρική κατανομή/ Τυπικές τιμές (Ζ) εκφράζουν τις αρχικές τιμές σε S / Δείχνει μία σταθερή τιμή σε μονάδες S (measure once) Υπολογισμός τα ποσοστά ή πιθανότητες να πάρει μια μεταβλητή τιμές πάνω ή κάτω από ένα δεδομένο όριο. 68% όλων των τιμών βρίσκονται σε -+1, 95% +-2, %.
Ζ- τιμές (standard scores) Χρήση - σύγκριση δύο τιμών που ανήκουν σε διαφορετικές κατανομές Δίχνει την απόκλιση μιας αρχικής τιμής απο τον Χ της κατανομής σε μονάδες τυπικής απόκλισης. Δηλαδή τιμή που έχει εκφραστεί σε μονάδες τυπικής απόκλισης Συγκρίνει τις τιμές δύο διαφορετικών κατανομών Υπολογίζουμε τον ΑΜΟ (μ) και ΤΑ (σ) Ζ= Χ- Χ/s
Ιδιότητες Ζ τιμών Δεν αλλαζει το σχήμα που παίρνει η κατανομή των αρχικών τιμών Ζ τιμές κυμαίνονται από +3 εως -3. Αλγεβρικό πρόσημο= ίδιο με τις αρχικές τιμές (πάνω απο τον ΑΜΟ = +, κάτω =-). ΑΜΟ = 0, και σ=1
Κανονική καμπύλη (Gauss)
Gauss
Μέτρα συνάφειας Σχέση = όταν οι μεταβλητές αλλάζουν μαζί Θετική, αρνητική σχέση (κομματική ταυτότητα# συμμετοχή / κοινωνική τάξη # ψήφος Συντελεστές συνάφειας = δείχνουν ισχύ και κατεύθυνση της σχέσης, , 0. Για την επιλογή του κατάλληλου συντελεστή = 2 κριτήρια: επίπεδο μέτρησης και συμμετρική ή ασύμμετρη μέτρηση (Ασύμμετρα (πριν προσδιορισμός Χ και Υ/ Συμμετρικά (δεν χρειάζεται προσδιορισμός των Χ και Υ).
Σύνδεση ονομαστικών / τακτικών μεταβλητών (βλ. πίνακας) Διασταύρωση – cross tabulation Τακτικές – Χ², φ, Cramer’s V Αναλογική μείωση του σφάλματος όσο πιο μεγάλη η μείωση του σφάλματος τόσο πιο μεγάλη η δυνατότητα πρόβλεψης Τακτική γ, Kendall’s τα, η, (τακτ. + διαστ.) (Ισο) διαστήματος/ Λόγου – Pearson’s r
Διμεταβλητές = Εξήγηση κοινωνικών φαινόμενων/ Παλινδρόμηση Γιατί…. Αιτιώδους μηχανισμούς Παλινδρομική ανάλυση- πρόβλεψη της Υ από την τιμή της Χ/ Εξίσωση ευθείας γραμμής (Y=α+βΧ) X= ερμηνευτικές ή προβλεπτικές var (predictors) Y= μεταβλητή κριτήριο (criterion var) Καθορίζει την γραμμή που χρησιμοποιείται στην πρόβλεψη, έτσι ώστε ελαχιστοποιούνται τα σφάλματα R² = πόσο καλά το παλινδρομικό μοντέλο (παλ. γραμμή ταιριάζει στα δεδομένα) Συντελεστής παλινδρ. (β) (regression coefficient) κλίση (slope), αλλαγή Υ για κάθε αλλαγή Χ α = (intercept / constant) σημείο τομής Χ και Υ
Ευθύγραμμη παλινδρόμηση (linear regression)
Τιμή πρόβλεψης = Υ Απόσταση d = υπολογίζεται το σφάλμα εκτίμησης Μέθοδος ελαχίστων τετραγώνων Τυπικό σφάλμα εκτίμησης