Στατιστικές Υποθέσεις (Ερευνητικά Ερωτήματα / Υποθέσεις προς επιβεβαίωση)
Περίπτωση Α Υπάρχουν διαφορές ανάμεσα σε δύο η περισσότερες ομάδες πληθυσμών? (π.χ. άνδρες/γυναίκες, καπνιστές/μη καπνιστές, ηλικία άνω των 40 / ηλικία κάτω των 40) ή (π.χ. ανάμεσα σε αγροτικές/αστικές/ημιαστικές περιοχές, αποφοίτους Δημοτικού/ Γυμνασίου / Λυκείου/ ΑΕΙ)
Παράδειγμα 1 Ισχυριζόμαστε πως οι άνδρες είναι πιο ψηλοί από τις γυναίκες Πήραμε δύο δείγματα (άνδρες / γυναίκες) και μετρήσαμε τα ύψη τους Π.χ. 150 άνδρες και 150 γυναίκες και βρήκαμε Μέση τιμή ανδρών (στο δείγμα) = 179 cm Μέση τιμή γυναικών (στο δείγμα) = 175 cm Τι συμπέρασμα βγάζουμε?
Παράδειγμα 2 Θέλουμε να συγκρίνουμε την αποτελεσματικότητα δύο φαρμάκων (Α και Β) για την αντιμετώπιση μιας ασθένειας Ο πληθυσμός είναι όλοι οι ασθενείς, όμως το δείγμα μας αναγκαστικά θα αποτελείται από τους διαγνωσμένους ασθενείς, που προσέρχονται σε κάποια κλινική. Έστω ότι πήραμε 235 ασθενείς
Παράδειγμα 2 (συνέχεια) φάρμακο Α φάρμακο Β βελτίωση 26 43 Όχι βελτίωση 99 67 125 110 ή σε ποσοστά: ΠΟΣΟΣΤΑ φάρμακο Α φάρμακο Β βελτίωση 20,8% 39,1% Όχι Βελτίωση 79,2% 61,7% 100% Τι συμπέρασμα βγάζουμε?
Σε όλες τις περιπτώσεις παρατηρούμε μια ΔΙΑΦΟΡΑ στα δείγματα! Και τα ύψη ανδρών – γυναικών δεν είναι ίδια (ΣΤΑ ΔΕΙΓΜΑΤΑ) Και τα φάρματα φαίνεται να διαφέρουν ως προς την αποτελεσματικότητα τους (ΣΤΑ ΔΕΙΓΜΑΤΑ)
Ερώτηση: Αυτά που παρατηρήσαμε στα δείγματα είναι τυχαία? (οι διάφορες που βρήκαμε ανάμεσα στις ομάδες ή τα φάρμακα είναι τυχαίες?) Ή μήπως ΥΠΑΡΧΟΥΝ πράγματι διαφορές και στους πληθυσμούς?
Ο αριθμός P Στη Στατιστική υπάρχει ένα «μαγικό» νούμερο, που μας δίνει την ΠΙΘΑΝΟΤΗΤΑ να είναι οι διαφορές τυχαίες. P-value (τιμή P) (στο SPSS αναφέρεται SIG.)
Κανόνας: Αν το P<0,05 (πιο μικρό από το 5%) τότε οι διαφορές ΔΕΝ είναι τυχαίες Δηλαδή οι διαφορές που βρήκαμε στα δείγματα, επιβεβαιώνονται πιθανότατα και στους πληθυσμούς (π.χ. οι άνδρες είναι πιο ψηλοί από τις γυναίκες ή το φάρμακο Β είναι πιο αποτελεσματικό από το Α) Η πιθανότητα να έχουμε κάνει λάθος είναι P
Διαδικασίες (1.Ποσοτικά Δεδομένα) Αν θέλουμε να συγκρίνουμε 2 ομάδες μεταξύ τους (τις μέσες τιμές τους δηλαδή), χρησιμοποιούμε T-TEST Αν θέλουμε να συγκρίνουμε περισσότερες από ομάδες μεταξύ τους (τις μέσες τιμές τους δηλαδή), χρησιμοποιούμε ANOVA Συμπέρασμα: Αν P<0,05, τότε οι ομάδες διαφέρουν
Στο παράδειγμα 1 - Αποτελέσματα SPSS Output: Group Statistics N Mean Std. Deviation Std. Error Mean (μέση τιμή) (τυπ. Απόκλιση) (τυπ. Σφάλμα) Γυναίκες 150 175,0 4,65 0,38 Ανδρες 150 179,0 3,88 0,32 t-test for Equality of Means t df Sig. 8,09 298 0,000 P-value Συμπέρασμα: Αφού P<<0,05 άρα η διαφορά ανάμεσα στα ύψη ανδρών και γυναικών στο δείγμα δεν είναι τυχαία, άρα οι άνδρες είναι πιο ψηλοί κατά μέσο όρο από τις γυναίκες.
Πως ο υπολογιστής βρίσκει το P? Υπολογίζει μια τιμή (στο T-test ονομάζεται t) Και μετά υπολογίζει το p, σαν ένα εμβαδόν σε μια καμπύλη Εμπειρικά: Αν t >2, τότε p<0,05 ενώ αν t<2 τότε p>0,05 To p και το t είναι αντιστρόφως ανάλογα, όσο μεγαλώνει το t, μικραίνει το p Άρα όσο πιο μακριά είναι το t από το 2, τόσο πιο μικρό είναι το p και τόσο πιο σίγουροι είμαστε ότι υπάρχουν ΔΙΑΦΟΡΕΣ και στους πληθυσμούς!
Άσκηση (Θεωρίας) Ένας ερευνητής Α σύγκρινε 2 ομάδες με Τ-test (από 50 άτομα η κάθε μία) και βρήκε t=5,3. Ένας ερευνητής Β σύγκρινε 2 ομάδες με Τ-test (από 50 άτομα η κάθε μία) και βρήκε t=2,8. Ποιος από τους δύο βρήκε μεγαλύτερο P? α) ο Α β) ο Β γ) βρήκαν περίπου το ίδιο P δ) Χρειαζόμαστε περισσότερα στοιχεία Να αιτιολογήσετε την απάντηση σας.
Διαδικασίες (2.Ποιοτικά Δεδομένα) Αν θέλουμε να συγκρίνουμε τα ποσοστά σε 2 ή περισσότερες ομάδες μεταξύ τους χρησιμοποιούμε X2-TEST
Στο παράδειγμα 2 - Αποτελέσματα SPSS output: Pearson’s Chi Square (Χ2) = 9,438 Asympt. Sig. = 0,002 (P-value) Αφού P<0,05 άρα η διαφορά στην αποτελεσματικότητα των φαρμάκων στο δείγμα δεν είναι τυχαία, άρα υπάρχει διαφορά. Το Β είναι καλύτερο από το Α γιατί το ποσοστό βελτίωσης είναι 39% έναντι 21% (περίπου).
Πως ο υπολογιστής βρίσκει το P? Υπολογίζει μια τιμή (στο Χ2-test ονομάζεται Χ2) Και μετά υπολογίζει το p, σαν ένα εμβαδόν σε μια καμπύλη Εμπειρικά: Αν Χ2 >4, τότε p<0,05 ενώ αν Χ2 <4 τότε p>0,05 To p και το Χ2 είναι αντιστρόφως ανάλογα, όσο μεγαλώνει το Χ2, μικραίνει το p Άρα όσο πιο μακριά είναι το Χ2 από το 4, τόσο πιο μικρό είναι το p και τόσο πιο σίγουροι είμαστε ότι υπάρχει ΔΙΑΦΟΡΑ στα ποσοστά ανάμεσα στους πληθυσμούς