Στατιστικές Υποθέσεις (Ερευνητικά Ερωτήματα / Υποθέσεις προς επιβεβαίωση)
Περίπτωση Α Υπάρχουν διαφορές ανάμεσα σε δύο η περισσότερες ομάδες πληθυσμών? (π.χ. άνδρες/γυναίκες, καπνιστές/μη καπνιστές, ηλικία άνω των 40 / ηλικία κάτω των 40) ή (π.χ. ανάμεσα σε αγροτικές/αστικές/ημιαστικές περιοχές, αποφοίτους Δημοτικού/ Γυμνασίου / Λυκείου/ ΑΕΙ)
Παράδειγμα 1 Ισχυριζόμαστε πως οι άνδρες είναι πιο ψηλοί από τις γυναίκες Πήραμε δύο δείγματα (άνδρες / γυναίκες) και μετρήσαμε τα ύψη τους Π.χ. 150 άνδρες και 150 γυναίκες και βρήκαμε Μέση τιμή ανδρών (στο δείγμα) = 179 cm Μέση τιμή γυναικών (στο δείγμα) = 175 cm Τι συμπέρασμα βγάζουμε?
Παράδειγμα 2 Θέλουμε να συγκρίνουμε τα ποσοστά των ατόμων που ασχολούνται περισσότερες από 10 ώρες την ημέρα με το ιντερνετ ανάμεσα σε δύο ομάδες (Αποφοίτους Λυκείου και Αποφοίτους Πανεπιστημίου) Έστω ότι πήραμε 235 ερωτηματολόγια
Παράδειγμα 2 (συνέχεια) ή σε ποσοστά: Αποφ. Πανεπιστημίου Απόφ. Λυκείου Πάνω από 10 ώρες2643 Κάτω από 10 ώρες ΠΟΣΟΣΤΑ Αποφ. Πανεπιστημίου Απόφ. Λυκείου Πάνω από 10 ώρες20,8%39,1% Κάτω από 10 ώρες79,2%61,7% 100% Τι συμπέρασμα βγάζουμε?
Σε όλες τις περιπτώσεις παρατηρούμε μια ΔΙΑΦΟΡΑ στα δείγματα! Και τα ύψη ανδρών – γυναικών δεν είναι ίδια (ΣΤΑ ΔΕΙΓΜΑΤΑ) Και τα ποσοστά εξάρτησης από το Ιντερνετ φαίνεται να διαφέρουν ανάλογα με το επίπεδο μόρφωσης
Ερώτηση: Αυτά που παρατηρήσαμε στα δείγματα είναι τυχαία? (οι διάφορες που βρήκαμε ανάμεσα στις ομάδες ή στα ποσοστά είναι τυχαίες?) Ή μήπως ΥΠΑΡΧΟΥΝ πράγματι διαφορές και στους πληθυσμούς?
Ο αριθμός P Στη Στατιστική υπάρχει ένα «μαγικό» νούμερο, που μας δίνει την ΠΙΘΑΝΟΤΗΤΑ να είναι οι διαφορές τυχαίες. P-value (τιμή P) (στο SPSS αναφέρεται SIG.)
Κανόνας: Αν το P<0,05 (πιο μικρό από το 5%) τότε οι διαφορές ΔΕΝ είναι τυχαίες Δηλαδή οι διαφορές που βρήκαμε στα δείγματα, επιβεβαιώνονται πιθανότατα και στους πληθυσμούς (π.χ. οι άνδρες είναι πιο ψηλοί από τις γυναίκες ή το ποσοστό εθισμού στους απόφοιτους Λυκείου είναι πιο μεγάλο από αυτό των αποφοίτων Πανεπιστημίου) Η πιθανότητα να έχουμε κάνει λάθος είναι P
Διαδικασίες (1.Ποσοτικά Δεδομένα) Αν θέλουμε να συγκρίνουμε 2 ομάδες μεταξύ τους (τις μέσες τιμές τους δηλαδή), χρησιμοποιούμε T-TEST Αν θέλουμε να συγκρίνουμε περισσότερες από ομάδες μεταξύ τους (τις μέσες τιμές τους δηλαδή), χρησιμοποιούμε ANOVA Συμπέρασμα: Αν P<0,05, τότε οι ομάδες διαφέρουν
Στο παράδειγμα 1 - Αποτελέσματα Συμπέρασμα: Αφού P<<0,05 άρα η διαφορά ανάμεσα στα ύψη ανδρών και γυναικών στο δείγμα δεν είναι τυχαία, άρα οι άνδρες είναι πιο ψηλοί κατά μέσο όρο από τις γυναίκες. SPSS Output: Group Statistics N Mean Std. Deviation Std. Error Mean (μέση τιμή) (τυπ. Απόκλιση) (τυπ. Σφάλμα) Γυναίκες ,0 4,65 0,38 Ανδρες ,0 3,88 0,32 t-test for Equality of Means tdfSig. 8,092980,000 P-value
Πως ο υπολογιστής βρίσκει το P? Υπολογίζει μια τιμή (στο T-test ονομάζεται t) Και μετά υπολογίζει το p, σαν ένα εμβαδόν σε μια καμπύλη Εμπειρικά: Αν t >2, τότε p 0,05 To p και το t είναι αντιστρόφως ανάλογα, όσο μεγαλώνει το t, μικραίνει το p Άρα όσο πιο μακριά είναι το t από το 2, τόσο πιο μικρό είναι το p και τόσο πιο σίγουροι είμαστε ότι υπάρχουν ΔΙΑΦΟΡΕΣ και στους πληθυσμούς!
Άσκηση (Θεωρίας) Ένας ερευνητής Α σύγκρινε 2 ομάδες με Τ-test (από 50 άτομα η κάθε μία) και βρήκε t=5,3. Ένας ερευνητής Β σύγκρινε 2 ομάδες με Τ-test (από 50 άτομα η κάθε μία) και βρήκε t=2,8. Ποιος από τους δύο βρήκε μεγαλύτερο P? α) ο Α β) ο Β γ) βρήκαν περίπου το ίδιο P δ) Χρειαζόμαστε περισσότερα στοιχεία Να αιτιολογήσετε την απάντηση σας.
Διαδικασίες (2.Ποιοτικά Δεδομένα) Αν θέλουμε να συγκρίνουμε τα ποσοστά σε 2 ή περισσότερες ομάδες μεταξύ τους χρησιμοποιούμε X 2 -TEST
Στο παράδειγμα 2 - Αποτελέσματα SPSS output: Pearson’s Chi Square (Χ 2 ) = 9,438 Asympt. Sig. = 0,002 (P-value) Αφού P<0,05 άρα η διαφορά στα ποσοστά εθισμού στο Δίκτυο στο δείγμα δεν είναι τυχαία, άρα υπάρχει διαφορά. Πράγματι το ποσοστό εθισμού στους απόφοιτους Λυκείου είναι πιο μεγάλο από αυτό των αποφοίτων Πανεπιστημίου (39% έναντι 21% περίπου).
Πως ο υπολογιστής βρίσκει το P? Υπολογίζει μια τιμή (στο Χ 2 -test ονομάζεται Χ 2 ) Και μετά υπολογίζει το p, σαν ένα εμβαδόν σε μια καμπύλη Εμπειρικά: Αν Χ 2 >4, τότε p 0,05 To p και το Χ 2 είναι αντιστρόφως ανάλογα, όσο μεγαλώνει το Χ 2, μικραίνει το p Άρα όσο πιο μακριά είναι το Χ 2 από το 4, τόσο πιο μικρό είναι το p και τόσο πιο σίγουροι είμαστε ότι υπάρχει ΔΙΑΦΟΡΑ στα ποσοστά ανάμεσα στους πληθυσμούς