ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Δ. Τσιπλακίδης (βασισμένο στις σημειώσεις παραδόσεων Π. Νικήτα-Σ. Σωτηρόπουλου) e-mail: dtsiplak@chem.auth.gr ∙ web: users.auth.gr/dtsiplak
ΣΤΑΤΙΣΤΙΚΕΣ ΥΠΟΘΕΣΕΙΣ Στη Στατιστική είμαστε πολλές φορές υποχρεωμένοι να κάνουμε στατιστικές υποθέσεις και ακολούθως να ελέγχουμε αν αυτές ισχύουν. Όμως το πρόβλημα με τη στατιστική είναι ότι – σε αντίθεση με τη θεωρία πιθανοτήτων - δεν είμαστε ελεύθεροι να κάνουμε όποια στατιστική υπόθεση θέλουμε. Ανάλογα με το πρόβλημα που εξετάζουμε οι στατιστικές υποθέσεις που μπορούμε να κάνουμε είναι αυστηρά προσδιορισμένες.
ΠΑΡΑΔΕΙΓΜΑ Kordelio Agia Sofia Date PM10 μg m-3 15/12/2006 114.98 10/1/2007 81.67 17/12/2006 141.20 22/1/2007 48.75 19/12/2006 95.75 26/1/2007 40.83 21/12/2006 33.08 28/1/2007 29.17 23/12/2006 40.81 30/1/2007 20.42 25/12/2006 28.75 1/2/2007 50.42 27/12/2006 71.85 5/2/2007 29/12/2006 106.04 7/2/2007 117.08 31/12/2006 32.61 9/2/2007 108.75 2/1/2007 83.49 11/2/2007 55.00 4/1/2007 37.96 13/2/2007 78.33 6/1/2007 34.71 15/2/2007 37.92 8/1/2007 62.57 17/2/2007 16.67 106.11 19/2/2007 12/1/2007 101.07 23/2/2007 56.67 14/1/2007 61.85 1/3/2007 32.13 3/3/2007 36.25 53.94 5/3/2007 16.25 236.76 7/3/2007 45.83 Στους πίνακες δίπλα δίνεται η μεταβολή των αιωρούμενων σωματιδίων στους σταθμούς Κορδελιό και Αγία Σοφία. Ερώτηση. Πoια περιοχή είναι πιο μολυσμένη;
ΣΤΑΤΙΣΤΙΚΕΣ ΥΠΟΘΕΣΕΙΣ Στο παράδειγμα αυτό έχουμε δύο δείγματα και θέλουμε να εξετάσουμε αν είναι ίδια ή πιο από τα δύο έχει περισσότερους ρύπους. Στη στατιστική ΔΕΝ συγκρίνουμε ποτέ άμεσα δύο (ή περισσότερα) δείγματα. Η σύγκριση γίνεται ΠΑΝΤΑ συγκρίνοντας τους πληθυσμούς από τους οποίους προέρχονται τα δείγματα.
ΣΤΑΤΙΣΤΙΚΕΣ ΥΠΟΘΕΣΕΙΣ Έτσι οι στατιστικές υποθέσεις που μπορούμε να κάνουμε είναι οι εξής: α) Τα δείγματα (Κορδελιού-Αγίας Σοφίας) προέρχονται από τον ίδιο πληθυσμό β) Τα δείγματα προέρχονται από διαφορετικούς πληθυσμούς με μ1 μ2 ή μ1 > μ2 ή μ1 < μ2
H MHΔΕΝΙΚΗ ΥΠΟΘΕΣΗ Γενικά οι στατιστικές υποθέσεις σε κάθε πρόβλημα διατυπώνονται ως ζεύγη: α) Τα δείγματα (Κορδελιού-Αγίας Σοφίας) προέρχονται από τον ίδιο πληθυσμό β) Τα δείγματα προέρχονται από διαφορετικούς πληθυσμούς α) Το δείγμα προέρχεται από πληθυσμό με μέση τιμή μ = 50 β) Το δείγμα προέρχεται από πληθυσμό με μέση τιμή μ 50 ή μ > 50 ή μ < 50
H MHΔΕΝΙΚΗ ΥΠΟΘΕΣΗ Από τις δύο υποθέσεις η μία ονομάζεται μηδενική υπόθεση (null hypothesis) και συμβολίζεται με Η0. Η εναλλακτική της μηδενικής συμβολίζεται με Η1. Η μηδενική υπόθεση είναι εκείνη που δεν διατυπώνει γενικά διαφοροποιήσεις.
H MHΔΕΝΙΚΗ ΥΠΟΘΕΣΗ Στο παράδειγμα των δειγμάτων με τους ρύπους, η μηδενική υπόθεση μπορεί να διατυπωθεί και ως Η0 : Τα δείγματα προέρχονται από τον ίδιο πληθυσμό Ενώ για την εναλλακτική υπόθεση Η1 έχουμε τις ακόλουθες δυνατότητες: Η1 : Τα δείγματα προέρχονται από διαφορετικούς πληθυσμούς με μ1 μ2 ή Η1 : Τα δείγματα προέρχονται από διαφορετικούς πληθυσμούς με μ1 > μ2 ή Η1 : Τα δείγματα προέρχονται από διαφορετικούς πληθυσμούς με μ1 < μ2
ΜΟΝΟΠΛΕΥΡΟΙ ΚΑΙ ΔΙΠΛΕΥΡΟΙ ΕΛΕΓΧΟΙ Όταν η εναλλακτική υπόθεση, Η1, διατυπώνεται με το σύμβολο ο έλεγχος ονομάζεται δίπλευρος. Αν η εναλλακτική υπόθεση, Η1, διατυπώνεται με το σύμβολο > ή το < ο έλεγχος ονομάζεται μονόπλευρος.
ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ Θα ήταν ιδανικό αν μπορούσαμε να υπολογίσουμε την πιθανότητα να ισχύει η υπόθεση Η0 ή η Η1. Τότε θα παίρναμε αποφάσεις με βάση αυτή την πιθανότητα. Δυστυχώς όμως αυτό ΔΕΝ ισχύει.
ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ Εκείνο που η στατιστική μπορεί να υπολογίσει είναι ΜΟΝΟ τη μέγιστη πιθανότητα να κάνουμε λάθος αν απορρίψουμε τη μηδενική υπόθεση ενώ αυτή είναι σωστή. Έτσι σε κάθε στατιστικό έλεγχο ορίζουμε ένα όριο, το οποίο ονομάζουμε επίπεδο ή στάθμη σημαντικότητας (significant level), συμβολίζεται με το ελληνικό γράμμα α και είναι η μέγιστη πιθανότητα με την οποία δεχόμαστε να κάνουμε σφάλμα απορρίπτοντας μια σωστή μηδενική υπόθεση. Συνήθως θέτουμε α = 0.05 (5%).
ΓΕΝΙΚΗ ΠΟΡΕΙΑ ΕΛΕΓΧΟΥ ΤΗΣ ΜΗΔΕΝΙΚΗΣ ΥΠΟΘΕΣΗΣ Σε ΟΛΟΥΣ τους στατιστικούς ελέγχους ορίζουμε πρώτα τη μηδενική υπόθεση Η0 και την εναλλακτική της Η1. Σε κάθε στατιστικό έλεγχο θέτουμε πάντα μια στάθμη σημαντικότητας (significant level), α, που είναι η μέγιστη πιθανότητα με την οποία δεχόμαστε να κάνουμε λάθος απορρίπτοντας τη μηδενική υπόθεση ενώ αυτή είναι σωστή.
ΓΕΝΙΚΗ ΠΟΡΕΙΑ ΕΛΕΓΧΟΥ ΤΗΣ ΜΗΔΕΝΙΚΗΣ ΥΠΟΘΕΣΗΣ Με βάση τις τιμές του δείγματος ή των δειγμάτων που εμπλέκονται στη μηδενική υπόθεση υπολογίζουμε την ποσότητα p-value (Sig.). Ακολούθως συγκρίνουμε την p-value (Sig.) με το α.
ΓΕΝΙΚΗ ΠΟΡΕΙΑ ΕΛΕΓΧΟΥ ΤΗΣ ΜΗΔΕΝΙΚΗΣ ΥΠΟΘΕΣΗΣ Όταν p-value < α (=0.05), τότε με μέγιστο κίνδυνο λάθους 5% απορρίπτουμε τη μηδενική υπόθεση και δεχόμαστε ως σωστή την εναλλακτική υπόθεση, Η1. Όταν p-value > α (=0.05), τότε δεν απορρίπτουμε τη μηδενική υπόθεση, αλλά και αποφεύγουμε να τη δεχτούμε ως σωστή. Σε αυτή την περίπτωση αποφεύγουμε να καταλήξουμε σε συμπεράσματα αποδεχόμενoι ότι η μηδενική υπόθεση είναι σωστή, κυρίως αν τα δείγματα είναι μικρά.
ΓΕΝΙΚΗ ΠΟΡΕΙΑ ΕΛΕΓΧΟΥ ΤΗΣ ΜΗΔΕΝΙΚΗΣ ΥΠΟΘΕΣΗΣ Συνεπώς στους στατιστικούς ελέγχους αξία έχει μόνο όταν απορρίπτεται η μηδενική υπόθεση.
Μια ενδιαφΕρουσα αναλογΙα Η διαδικασία ενός στατιστικού έλεγχου είναι συγκρίσιμη με την διαδικασία μιας ποινικής δίκης. Κατά την έναρξη της διαδικασίας, υπάρχουν δύο υποθέσεις: Η μηδενική: Ο κατηγορούμενος δεν είναι ένοχος, και η εναλλακτική: Ο κατηγορούμενος είναι ένοχος.
Μια ενδιαφΕρουσα αναλογΙα Ο εισαγγελέας προσπαθεί να αποδείξει την ενοχή του κατηγορουμένου, δηλαδή να απορρίψει τη μηδενική υπόθεση («ο κατηγορούμενος δεν είναι ένοχος»), ώστε να αποδείξει την εναλλακτική πρόταση, ότι «ο κατηγορούμενος είναι ένοχος». Όταν γίνει αυτό ο κατηγορούμενος καταδικάζεται ως ένοχος, πάντα όμως υπάρχει μια πιθανότητα να είναι αθώος. Αν ο εισαγγελέας αποτύχει να φέρει πειστικά επιχειρήματα, η μηδενική υπόθεση δεν μπορεί να απορριφθεί. Ο εναγόμενος αφήνεται ελεύθερος όχι επειδή βρέθηκε αθώος, αλλά επειδή δεν αποδείχθηκε η ενοχή του.
Μια ενδιαφΕρουσα αναλογΙα Αν με βάση τα στατιστικά δεδομένα απορρίψουμε μία μηδενική υπόθεση που είναι αληθινή, τότε λέμε ότι κάνουμε ένα σφάλμα τύπου Ι. Στην περίπτωση της δίκης έχουμε την καταδίκη ενός αθώου ανθρώπου. Στόχος της δικαιοσύνης και της ποινικής διαδικασίας είναι η πιθανότητα ενός τέτοιου σφάλματος να είναι όσο το δυνατόν πιο μικρή (Θέτουμε το α όσο το δυνατόν πιο μικρό). Όμως όσο πιο μικρή γίνεται αυτή η πιθανότητα τόσο πιο μεγάλη γίνεται η πιθανότητα να δεχθούμε ως σωστή μία λανθασμένη μηδενική υπόθεση, δηλαδή να αθωώσουμε έναν ένοχο. Τότε κάνουμε ένα σφάλμα τύπου ΙΙ.
Μια ενδιαφΕρουσα αναλογΙα Συνεπώς, όσο ελαττώνουμε το επίπεδο ή τη στάθμη σημαντικότητας α, τόσο ελαττώνουμε τη πιθανότητα να κάνουμε ένα σφάλμα τύπου Ι, δηλαδή να απορρίψουμε μια σωστή μηδενική υπόθεση. Όμως ταυτόχρονα αυξάνουμε την πιθανότητα κάνουμε ένα σφάλμα τύπου ΙΙ, δηλαδή να δεχθούμε ως σωστή μία λανθασμένη μηδενική υπόθεση. Η τιμή α = 0.05 εξισορροπεί τις δύο αυτές πιθανότητες.
H ΕΝΝΟΙΑ ΤΗΣ p-value Όπως αναφέρθηκε, σε ΟΛΟΥΣ τους στατιστικούς ελέγχους ορίζουμε πρώτα τη μηδενική υπόθεση Η0 και την εναλλακτική της Η1. Σε κάθε μηδενική υπόθεση αντιστοιχεί τουλάχιστον μία στατιστική συνάρτηση ελέγχου (test statistic), έστω η Χ. Αυτή ακολουθεί μια συγκεκριμένη κατανομή f(x) που μπορεί να είναι συμμετρική ή ασύμμετρη:
Κατανομή στατιστικής συνάρτησης ελέγχου H ΕΝΝΟΙΑ ΤΗΣ p-value Κατανομή στατιστικής συνάρτησης ελέγχου Γραφική παράσταση της κατανομής student με 10 βαθμούς ελευθερίας (αριστερά) και της χ2 με 5 βαθμούς ελευθερίας (δεξιά)
H ΕΝΝΟΙΑ ΤΗΣ p-value Με βάση τις τιμές του δείγματος ή των δειγμάτων που εμπλέκονται στη μηδενική υπόθεση υπολογίζουμε την τιμή της στατιστικής συνάρτησης ελέγχου (test statistic) Χ και έστω Χ = c. Τότε η ποσότητα p-value (Sig.) ορίζεται ως εξής:
Ορισμός της τιμής p-value μονόπλευρος έλεγχος (< ή >) H ΕΝΝΟΙΑ ΤΗΣ p-value Ορισμός της τιμής p-value δίπλευρος έλεγχος () μονόπλευρος έλεγχος (< ή >)
ΜΟΝΟΠΛΕΥΡΟΙ ΚΑΙ ΔΙΠΛΕΥΡΟΙ ΕΛΕΓΧΟΙ Όταν η εναλλακτική υπόθεση, Η1, διατυπώνεται με το σύμβολο ο έλεγχος ονομάζεται δίπλευρος. Αν η εναλλακτική υπόθεση, Η1, διατυπώνεται με το σύμβολο > ή το < ο έλεγχος ονομάζεται μονόπλευρος. p-value (δίπλευρου ελέγχου) = 2p-value (μονόπλευρου ελέγχου)
ΠΑΡΑΜΕΤΡΙΚΟΙ ΚΑΙ ΜΗ ΕΛΕΓΧΟΙ Οι στατιστικοί έλεγχοι διακρίνονται σε δύο κατηγορίες, σε παραμετρικούς και μη-παραμετρικούς ελέγχους. Παραμετρικοί είναι εκείνοι οι έλεγχοι, οι οποίοι για να εφαρμοστούν απαιτούν τα δεδομένα του δείγματος να ακολουθούν την κανονική κατανομή ή γενικότερα οι τιμές του δείγματος να προέρχονται από πληθυσμό με συγκεκριμένη κατανομή. Ως μη-παραμετρικοί έλεγχοι ή δοκιμασίες ή γενικότερα μέθοδοι ορίζονται εκείνες οι μέθοδοι της στατιστικής, στις οποίες δεν υπάρχουν παραδοχές σχετικά με την κατανομή των δεδομένων.
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ ΣΕ ΕΝΑ ΔΕΙΓΜΑ ΜΕΤΑΞΥ ΔΥΟ ΔΕΙΓΜΑΤΩΝ ΜΕΤΑΞΥ ΠΟΛΛΩΝ ΔΕΙΓΜΑΤΩΝ (ANOVA) ΜΕΤΑΞΥ ΠΟΛΛΩΝ ΟΜΑΔΩΝ ΔΕΙΓΜΑΤΩΝ (ΜANOVA)
Έλεγχος κανονικότητας ΕΛΕΓΧΟΙ ΣΕ ΕΝΑ ΔΕΙΓΜΑ Έλεγχος κανονικότητας Έλεγχος μέσης τιμής Έλεγχος ακραίων τιμών
ΕΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ H μηδενική και η εναλλακτική υπόθεση στον έλεγχο της κανονικότητας διατυπώνονται ως Η0 : το δείγμα προέρχεται από κανονικό πληθυσμό Η1 : το δείγμα δεν προέρχεται από κανονικό πληθυσμό Συνεπώς όταν p-value < 0.05 η μηδενική υπόθεση απορρίπτεται, δηλαδή δεχόμαστε ότι τα δεδομένα του δείγματος δεν ακολουθούν την κανονική κατανομή.
ΕΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ Αν p-value > 0.05 ΔΕΝ συμπεραίνουμε ότι τα δεδομένα του δείγματος ακολουθούν την κανονική κατανομή, αλλά ότι σε επίπεδο σημαντικότητας α = 0.05 δεν διαπιστώνονται στατιστικά σημαντικές αποκλίσεις από την κανονικότητα. Αυτό ΔΕΝ σημαίνει ότι δεν υπάρχουν αποκλίσεις από την κανονικότητα. Μπορεί να υπάρχουν και να μην έχουν εντοπιστεί ή να μην υπάρχουν. Ο έλεγχος δεν μας οδηγεί σε κάποια βεβαιότητα. Πάντως όταν δεν διαπιστώνονται στατιστικά σημαντικές αποκλίσεις από την κανονικότητα, δηλαδή όταν p-value ή Sig. > 0.05, τότε ΜΠΟΡΟΥΜΕ να χρησιμοποιήσουμε το δείγμα σε παραμετρικούς ελέγχους.
ΕΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ SPSS Analyze Descriptive Statistics Explore Μεταφέρουμε τη μεταβλητή του δείγματος στο πλαίσιο Dependent List. Συνεχίζουμε με κλικ στο κουμπί Plots και στο νέο πλαίσιο που εμφανίζεται επιλέγουμε Normality plots with tests. Από τους ελέγχους επιλέγουμε τα αποτελέσματα του Shapiro-Wilk.
ΕΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ Παράδειγμα 1. Για τον έλεγχο μιας νέας αναλυτικής μεθόδου προσδιορισμού της σεληνιοουρίας στο νερό, παρασκευάστηκε ένα διάλυμα της ουσίας αυτής με συγκέντρωση 50 ng/ml και ακολούθως έγιναν 5 μετρήσεις της συγκέντρωσης της σεληνιοουρίας. Ελήφθησαν τα αποτελέσματα: 50.3, 50.4, 50.2, 50.0, 50.3 Η συμβατική μέθοδος έδωσε τα αποτελέσματα 50.4, 50.7, 49.5, 49.6, 51.0 Ακολουθούν τα δεδομένα των δειγμάτων την κανονική κατανομή;
ΕΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ ΒΑΣΙΚΗ ΠΑΡΑΤΗΡΗΣΗ Μετρήσεις που γίνονται στο ίδιο σύστημα κάτω από σταθερές και ελεγχόμενες συνθήκες, όπως είναι μετρήσεις pH, συγκέντρωσης, ιξώδους, πυκνότητας κ.ο.κ, κατά κανόνα ακολουθούν την κανονική κατανομή. Η παρατήρηση αυτή είναι ισχυρότερη από τα αποτελέσματα του ελέγχου της κανονικότητας με βάση τα κριτήρια που έχουν αναφερθεί. Αντίθετα πρέπει να είμαστε ιδιαίτερα προσεκτικοί στην κανονικότητα δειγμάτων που προέρχονται από μετρήσεις σε διαφορετικά συστήματα ή στο ίδιο σύστημα αλλά κάτω από μεταβαλλόμενες συνθήκες. Τέτοιες μετρήσεις αφορούν περιβαλλοντικά και βιολογικά δείγματα, δείγματα τροφίμων κ.ά.
ΕΛΕΓΧΟΣ ΜΕΣΗΣ ΤΙΜΗΣ Σε πολλές περιπτώσεις, όταν για παράδειγμα προτείνεται μια νέα εργαστηριακή μέθοδος προσδιορισμού της τιμής μιας φυσικοχημικής ποσότητας ή όταν προτείνεται μια νέα αναλυτική μέθοδος ποσοτικού προσδιορισμού ενός αντιδραστηρίου, καλούμαστε να αξιολογήσουμε τη μέθοδο αυτή. Αν δηλαδή υπεισέρχεται ή όχι κάποιο συστηματικό σφάλμα στα αποτελέσματα της προτεινόμενης μεθόδου. Για το σκοπό αυτό προσδιορίζουμε τη μέση τιμή <x> ενός δείγματος με αποτελέσματα αυτής της μεθόδου και τη συγκρίνουμε με τη μέση τιμή μ του πληθυσμού, με την προϋπόθεση ότι αυτή είναι γνωστή.
ΕΛΕΓΧΟΣ ΜΕΣΗΣ ΤΙΜΗΣ Ως μηδενική υπόθεση θεωρούμε την περίπτωση η μέση τιμή του δείγματος, <χ>, να είναι ίση με την μέση τιμή του πληθυσμού, μ. Αν p-value > 0.05, δεν μπορούμε να απορρίψουμε την μηδενική υπόθεση, δηλαδή πιθανόν η μέθοδος να μην εισάγει κάποιο συστηματικό σφάλμα αλλά για να βεβαιωθούμε θα πρέπει να ελέγξουμε και άλλα δείγματα της μεθόδου και κυρίως δείγματα με μεγάλο αριθμό τιμών. Αν p-value < 0.05, τότε απορρίπτουμε την μηδενική υπόθεση και ισχύει η ενναλακτική, δηλαδή η μέθοδος εισάγει κάποιο συστηματικό σφάλμα.
ΕΛΕΓΧΟΣ ΜΕΣΗΣ ΤΙΜΗΣ Παράδειγμα 2. Για τον έλεγχο μιας νέας αναλυτικής μεθόδου προσδιορισμού της σεληνιοουρίας στο νερό, παρασκευάστηκε ένα διάλυμα της ουσίας αυτής με συγκέντρωση 50 ng/ml και ακολούθως έγιναν 5 μετρήσεις της συγκέντρωσης της σεληνιοουρίας. Ελήφθησαν τα αποτελέσματα: 50.3, 50.4, 50.2, 50.0, 50.3 Τι συμπέρασμα βγάζετε?
Analyze Compare Means One-Sample T Test ΕΛΕΓΧΟΣ ΜΕΣΗΣ ΤΙΜΗΣ Η μηδενική υπόθεση διατυπώνεται ως: Η0: μ = μ0, Η1: μ μ0 ή Η0: μ = μ0, Η1: μ > μ0 ή Η0: μ = μ0, Η1: μ < μ0 Analyze Compare Means One-Sample T Test Μεταφέρουμε τη μεταβλητή στο πλαίσιο Test Variable(s) και πληκτρολογούμε την τιμή μ0 στο Test Value.
Ερμηνεία αποτελέσματος ΕΛΕΓΧΟΣ ΜΕΣΗΣ ΤΙΜΗΣ Ερμηνεία αποτελέσματος Παρατηρούμε ότι p-value = 0.024 < 0.05. Άρα η μηδενική υπόθεση απορρίπτεται και δεχόμαστε ότι ισχύει η Η1,ότι δηλαδή το δείγμα προέρχεται από πληθυσμό με μ 50. Άρα η μέθοδος εισάγει κάποιο συστηματικό σφάλμα (με την προϋπόθεση ότι η αρχική συγκέντρωση είναι 50 ng/ml. Για να είναι έγκυρο το συμπέρασμα αυτό απαιτείται έλεγχος της κανονικότητας του δείγματος: P-value=0.492>0.05
ΕΛΕΓΧΟΣ ΜΕΣΗΣ ΤΙΜΗΣ Παράδειγμα 4. Για τον εργαστηριακό έλεγχο σταθερότητας ενός διαλύματος μιας ουσίας Α, παρασκευάζεται διάλυμά της με συγκέντρωση 10 mg/L και εξετάζεται η συγκέντρωση του διαλύματος μετά από μια μέρα. Έστω ότι έγιναν 10 μετρήσεις της συγκέντρωσης που έδωσαν τα αποτελέσματα του παρακάτω πίνακα. Να εξετασθεί αν παρατηρείται στατιστικά σημαντική διάσπαση της ουσίας Α. 10,1 9,8 10,3 9,2 10,0 9,4 9,6 9,5 9,0
ΕΛΕΓΧΟΣ ΜΕΣΗΣ ΤΙΜΗΣ Οι υποθέσεις Η0 και Η1 στο συγκεκριμένο πρόβλημα είναι Η0: μ = 10 και Η1: μ < 10 Συνεπώς πρέπει να βρούμε ποια από τις παραπάνω υποθέσεις είναι σωστή. Η μηδενική υπόθεση σημαίνει ότι οι μετρήσεις προέρχονται από κανονικό πληθυσμό με μέση τιμή μ = 10 και συνεπώς δεν παρατηρείται στατιστικά σημαντική αλλοίωση του διαλύματος. Αντίθετα, αν απορριφθεί η μηδενική υπόθεση σημαίνει ότι ισχύει η εναλλακτική της Η1: μ < 10, που δείχνει ότι η διάσπαση της ουσίας με το χρόνο είναι στατιστικά σημαντική.
ΕΛΕΓΧΟΣ ΜΕΣΗΣ ΤΙΜΗΣ P-value (1-tailed) = 0.055/2 = 0.0275 <0.05. Συνεπώς ισχύει η εναλλακτική Η1: μ < 10, που δείχνει ότι η διάσπαση της ουσίας με το χρόνο είναι στατιστικά σημαντική. Πρέπει να γίνει έλεγχος της κανονικότητας.
ΕΛΕΓΧΟΣ ΑΚΡΑΙΩΝ ΤΙΜΩΝ Η μηδενική υπόθεση διατυπώνεται ως: Η0: a δεν είναι ακραία Η1: a είναι ακραία ChemStat Test for Outliers Χρήσιμο είναι να γίνεται και το κατάλληλο θηκόγραμμα
ΕΛΕΓΧΟΣ ΑΚΡΑΙΩΝ ΤΙΜΩΝ Δ1 0,1 0,11 0,15 Παράδειγμα 4. Να εξετασθεί αν υπάρχουν ακραίες τιμές στα διπλανά δείγματα.
ΕΛΕΓΧΟΙ ΣΕ ΔΥΟ ΔΕΙΓΜΑΤΑ Τα δείγματα μπορεί να είναι: Έλεγχος μέσων τιμών Έλεγχος διασπορών Τα δείγματα μπορεί να είναι: Ανεξάρτητα (κάθε δείγμα έχει ληφθεί ανεξάρτητα από το άλλο) Εξαρτημένα (υπάρχει μία προς μία αντιστοιχία μεταξύ των τιμών των δύο δειγμάτων, π.χ. προσδιο-ρισμός συγκέντρωσης ενός αντιδραστηρίου σε διαφο-ρετικά σκευάσματα με δύο διαφορετικές μεθόδους)
ΔΙΕΥΘΕΤΗΣΗ ΔΕΙΓΜΑΤΩΝ ΣΤΟ SPSS Τα ανεξάρτητα δείγματα (δύο ή περισσότερα) τοποθετούνται ΟΛΑ σε μία στήλη, έστω τη στήλη samples, και σε μία άλλη στήλη δημιουργούμε μία νέα μεταβλητή, έστω την group, με τιμές 1, 2, …., που το 1 αντιστοιχεί σε τιμές του πρώτου δείγματος, το 2 σε τιμές του δευτέρου κ.ο.κ. Τα εξαρτημένα δείγματα τοποθετούνται σε διαφορετικές στήλες.
ΕΛΕΓΧΟΣ ΜΕΣΩΝ ΤΙΜΩΝ Στον παραμετρικό έλεγχο των μέσων τιμών δύο δειγμάτων, η μηδενική υπόθεση μπορεί να διατυπωθεί ως Η0 : Τα δείγματα προέρχονται από πληθυσμούς με μ1 = μ2 Για την εναλλακτική υπόθεση Η1 έχουμε τις ακόλουθες δυνατότητες: Η1 : Τα δείγματα προέρχονται από πληθυσμούς με μ1 μ2 ή Η1 : Τα δείγματα προέρχονται από πληθυσμούς με μ1 > μ2 ή Η1 : Τα δείγματα προέρχονται από πληθυσμούς με μ1 < μ2
Η1 : Τα δείγματα προέρχονται από πληθυσμούς με σ12 σ22 ΕΛΕΓΧΟΣ ΜΕΣΩΝ ΤΙΜΩΝ Ο παραμετρικός έλεγχος των μέσων τιμών δύο δειγμάτων, εξαρτάται από τις διασπορές των δύο δειγμάτων και συγκεκριμένα αν τα δείγματα προέρχονται από πληθυσμούς με ίσες ή διαφορετικές διασπορές. Έτσι πρώτα ελέγχουμε την υπόθεση Η0 : Τα δείγματα προέρχονται από πληθυσμούς με σ12 = σ22 με εναλλακτική υπόθεση: Η1 : Τα δείγματα προέρχονται από πληθυσμούς με σ12 σ22
ΕΛΕΓΧΟΣ ΜΕΣΩΝ ΤΙΜΩΝ Συνεπώς: Για να εφαρμόσουμε τον παραμετρικό έλεγχο των μέσων τιμών δύο δειγμάτων απαιτείται: Ο έλεγχος της κανονικότητας των τιμών των δειγμάτων. Ο έλεγχος της διασποράς. Πάντως μικρές αποκλίσεις από την κανονικότητα και την ισότητα των διασπορών επιτρέπονται.
ΕΛΕΓΧΟΣ ΜΕΣΩΝ ΤΙΜΩΝ Στον μη παραμετρικό έλεγχο δύο δειγμάτων, η μηδενική υπόθεση μπορεί να διατυπωθεί ως Η0 : Τα δείγματα προέρχονται από τον ίδιο πληθυσμό Για την εναλλακτική υπόθεση Η1 έχουμε τις ακόλουθες δυνατότητες: Η1 : Τα δείγματα προέρχονται από διαφορετικούς πληθυσμούς με d1 d2 ή Η1 : Τα δείγματα προέρχονται από διαφορετικούς πληθυσμούς με d1 > d2 ή Η1 : Τα δείγματα προέρχονται από διαφορετικούς πληθυσμούς με d1 < d2
ΕΛΕΓΧΟΣ ΜΕΣΩΝ ΤΙΜΩΝ Παράδειγμα 5. Ο Rayleigh προσπάθησε να προσδιορίσει τη μοριακή μάζα του αζώτου χρησιμοποιώντας δύο διαφορετικές τεχνικές. Στην πρώτη πήρε μια ορισμένη ποσότητα αέρα από την οποία απομάκρυνε τους υδρατμούς, το Ο2 και το CO2. Ακολούθως ζύγισε ένα συγκεκριμένο όγκο του αερίου και πήρε τα αποτελέσματα του δείγματος 1 στον παρακάτω πίνακα. Στη δεύτερη τεχνική παρασκεύασε χημικά καθαρό Ν2 και πήρε τα αποτελέσματα του δείγματος 2. Να εξετασθεί αν οι μέσες τιμές των δύο δειγμάτων παρουσιάζουν στατιστικά σημαντική απόκλιση. Δείγμα 1 2,31017 2,30986 2,3101 2,31001 2,31024 2,31028 Δείγμα 2 2,30143 2,29816 2,30182 2,2989 2,29869 2,2994 2,29849 2,2988
ΕΛΕΓΧΟΣ ΜΕΣΩΝ ΤΙΜΩΝ Έλεγχος κανονικότητας: Φαίνεται να υπάρχει πρόβλημα κανονικότητας με το δεύτερο δείγμα (p-value = 0.025 < 0.05). Γι αυτό καλό είναι να γίνει έλεγχος παραμετρικός και μη παραμετρικός.
ΕΛΕΓΧΟΣ ΜΕΣΩΝ ΤΙΜΩΝ Παραμετρικός έλεγχος (εφόσον τα δείγματα είναι κανονικά): Analyze Compare Means Independent-Samples T Test Ο έλεγχος των διασπορών δείχνει ότι δεν υπάρχει ισότητα διασπορών (Sig.=0.005 < 0.05), άρα ελέγχουμε την τιμή Sig.(2-tailed) της δεύτερης σειράς (αν και στο παράδειγμα αυτό δεν έχει καμία σημασία, επειδή και οι δύο τιμές είναι 0.000)
ΕΛΕΓΧΟΣ ΜΕΣΩΝ ΤΙΜΩΝ Μη παραμετρικός έλεγχος: Analyze Noparametric Tests Legacy Dialogs 2 Independent Samples Παρατηρούμε ότι όλοι οι έλεγχοι οδηγούν με βεβαιότητα στη απόρριψη της μηδενικής υπόθεσης.
ΕΛΕΓΧΟΣ ΜΕΣΩΝ ΤΙΜΩΝ Πάντως μια καλή εικόνα για τη σχέση δύο ή περισσότερων ΑΝΕΞΑΡΤΗΤΩΝ δειγμάτων παρέχουν τα θηκογράμματα.
ΕΛΕΓΧΟΣ ΜΕΣΩΝ ΤΙΜΩΝ
ΣΥΓΚΡΙΣΗ ΖΕΥΓΩΝ ΔΕΙΓΜΑΤΩΝ Δύο δείγματα σχηματίζουν ένα ζεύγος αν υπάρχει μια ένα προς ένα αντιστοιχία μεταξύ των τιμών των δειγμάτων δια μέσου μιας κοινής ιδιότητας. Τυπικό παράδειγμα αποτελούν οι τιμές της συγκέντρωσης μιας ένωσης που προσδιορίζονται σε δισκία με δύο διαφορετικές μεθόδους. Οι τιμές της συγκέντρωσης της μιας μεθόδου και αυτές της άλλης μεθόδου ανά δισκίο σχηματίζουν ένα ζεύγος δειγμάτων. Δείγματα αυτού του τύπου ονομάζονται ζεύγη δειγμάτων ή εξαρτημένα ή συσχετιζόμενα κατά ζεύγη. Σ’ αυτές τις περιπτώσεις το κύριο ερώτημα που εγείρεται είναι αν υπάρχει στατιστικά σημαντική διαφορά μεταξύ των μετρήσεων των δύο μεθόδων.
ΕΛΕΓΧΟΣ ΖΕΥΓΩΝ ΔΕΙΓΜΑΤΩΝ Η1 : μd 0 ή Η1 : μd > 0 ή Η1 : μd < 0 Στον παραμετρικό έλεγχο η μηδενική υπόθεση μπορεί να διατυπωθεί ως Η0 : μd = 0 με εναλλακτικές: Η1 : μd 0 ή Η1 : μd > 0 ή Η1 : μd < 0 μd η μέση τιμή του πληθυσμού από τον οποίο προέρχονται οι διαφορές μεταξύ των τιμών των δύο δειγμάτων (xi-yi) Ο παραμετρικός έλεγχος ισχύει όταν το δείγμα των διαφορών των τιμών των αρχικών δειγμάτων είναι κανονικό.
ΕΛΕΓΧΟΣ ΖΕΥΓΩΝ ΔΕΙΓΜΑΤΩΝ Η1 : d 0 ή Η1 : d > 0 ή Η1 : d < 0 Στον μη παραμετρικό έλεγχο η μηδενική υπόθεση μπορεί να διατυπωθεί ως Η0 : d = 0 με εναλλακτικές: Η1 : d 0 ή Η1 : d > 0 ή Η1 : d < 0 d η διάμεσος του πληθυσμού από τον οποίο προέρχονται οι διαφορές μεταξύ των τιμών των δύο δειγμάτων (xi-yi)
ΕΛΕΓΧΟΣ ΖΕΥΓΩΝ ΔΕΙΓΜΑΤΩΝ O πιο ισχυρός μη παραμετρικός έλεγχος είναι ο έλεγχος Wilcoxon Frank Wilcoxon 1982-1965
ΣΥΓΚΡΙΣΗ ΖΕΥΓΩΝ ΔΕΙΓΜΑΤΩΝ Παράδειγμα 7. Στον παρακάτω πίνακα δίνονται οι συγκεντρώσεις του ενεργού συστατικού σε 8 δισκία που προσδιορίστηκαν με δύο διαφορετικές τεχνικές. Να ελεγχθεί στατιστικά το αν οι τεχνικές δίνουν στατιστικά το ίδιο αποτέλεσμα. Δείγμα 1 4,6 3,4 3,1 2,8 1,5 4,1 2,5 3,3 Δείγμα 2 4,3 3,5 3 1,1 4,5
ΣΥΓΚΡΙΣΗ ΖΕΥΓΩΝ ΔΕΙΓΜΑΤΩΝ Έλεγχος κανονικότητας του δείγματος των διαφορών, d p-value=0.340>0.05, το δείγμα είναι κανονικό.
ΕΛΕΓΧΟΣ ΖΕΥΓΩΝ ΔΕΙΓΜΑΤΩΝ Παραμετρικός έλεγχος: Analyze Compare Means Paired-Samples T Test p-value = 0.732 > 0.05 Η μηδενική υπόθεση δεν απορρίπτεται
ΕΛΕΓΧΟΣ ΖΕΥΓΩΝ ΔΕΙΓΜΑΤΩΝ Μη παραμετρικός έλεγχος: Analyze Noparametric Tests Legacy Dialogs 2 Related Samples p-value = 0.778 > 0.05 Η μηδενική υπόθεση δεν απορρίπτεται
ΣΥΓΚΡΙΣΗ ΖΕΥΓΩΝ ΔΕΙΓΜΑΤΩΝ Συμπέρασμα: Όλοι οι έλεγχοι δείχνουν ότι η μηδενική υπόθεση δεν απορρίπτεται Συνεπώς οι δύο τεχνικές δεν δίνουν στατιστικά διαφορετικά αποτελέσματα. Όμως αυτό δεν σημαίνει ότι δίνουν στατιστικά το ίδιο αποτέλεσμα (!)
ΕΛΕΓΧΟΣ ΖΕΥΓΩΝ ΔΕΙΓΜΑΤΩΝ ΔΕΝ κάνουμε θηκογράμματα