Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗ ΜΕΣΗ ΤΙΜΗ

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗ ΜΕΣΗ ΤΙΜΗ"— Μεταγράφημα παρουσίασης:

1 ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗ ΜΕΣΗ ΤΙΜΗ
ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΕΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΧΝΟΛΟΓΙΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗΝ ΙΑΤΡΙΚΗ ΚΑΙ ΤΗ ΒΙΟΛΟΓΙΑ ΜΑΘΗΜΑ : ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗ ΜΕΣΗ ΤΙΜΗ ΔΙΟΝΥΣΗΣ ΛΙΝΑΡΔΑΤΟΣ 18 ΟΚΤΩΒΡΙΟΥ 2018

2 Έλεγχος υποθέσεων για τη μέση τιμή
Σύντομη επανάληψη Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων Έλεγχοι υποθέσεων για τη μέση τιμή με το ΜATLAB Παραδοχές των ελέγχων υποθέσεων

3 1. Σύντομη επανάληψη Συνδέστε κάθε διάστημα εμπιστοσύνης της μέσης τιμής ενός πληθυσμού που ακολουθεί την κανονική κατανομή με γνωστή διασπορά, με την αντίστοιχη περίπτωση (μονόπλευρου ή αμφίπλευρου) ελέγχου υποθέσεων (επίπεδο σημαντικότητας 5%): αμφίπλευρος μονόπλευρος προς τα δεξιά μονόπλευρος προς τα αριστερά

4 1. Σύντομη επανάληψη Η εκτιμήτρια συνάρτηση Θ μιας παραμέτρου θ είναι αμερόληπτος. Ποια από τα παρακάτω είναι αληθή;  Η Θ είναι συνάρτηση των παρατηρήσεων του δείγματος  Η Θ είναι μια τυχαία μεταβλητή  Η Θ ακολουθεί μία κατανομή πιθανότητας

5 1. Σύντομη επανάληψη Η δειγματική μέση τιμή Ε(Χ) είναι αμερόληπτος εκτιμήτρια της πληθυσμιακής μέσης τιμής μ, καθώς: Η δεν είναι αμερόληπτος εκτιμήτρια της πληθυσμιακής διασποράς σ2. Αντίθετα, η είναι αμερόληπτος εκτιμήτρια της πληθυσμιακής διασποράς, καθώς:

6 1. Σύντομη επανάληψη Όμως, ισχύει ότι: Άρα, Συνεπώς: και
Συνεπώς: και Άρα, η Τ2 είναι αμερόληπτος εκτιμήτρια της πληθυσμιακής διασποράς σ2 και για αυτό στη βιβλιογραφία ακολουθείται σε σχέση με την Τ1 ως ορισμός της δειγματικής διασποράς.

7 1. Σύντομη επανάληψη Εκτιμήτρια Bayes
Ας υποθέσουμε ότι μία άγνωστη παράμετρος θ ακολουθεί την κατανομή fθ. Έστω δ=θ(x) μία εκτιμήτρια του θ (με βάση κάποιες μετρήσεις) και R(θ,δ) μία συνάρτηση ρίσκου Bayes, όπως το μέσο τετραγωνικό σφάλμα (mean squared error) : όπου η μέση τιμή λαμβάνεται ως προς την από κοινού κατανομή των θ και x. Μία εκτιμήτρια δ είναι εκτιμήτρια Bayes (Bayes estimator) εάν ελαχιστοποιεί το ρίσκο Bayes ανάμεσα σε όλες τις εκτιμήτριες.

8 1. Σύντομη επανάληψη Εκτιμήτρια Bayes (συν.) Παράδειγμα :
Εάν x|θ ακολουθεί την κανονική κατανομή, δηλαδή x|θ ~ N(θ,σ2), και η θ ακολουθεί την κανονική κατανομή, δηλαδή θ ~ N(μ,τ2), τότε η εκτιμήτρια Bayes του θ με βάση τη συνάρτηση ρίσκου MSE δίνεται από τη σχέση :

9 1. Σύντομη επανάληψη Ποια είναι τα βήματα της διαδικασίας ελέγχου υποθέσεων; Βήμα 1ο : Ως εναλλακτική υπόθεση τίθεται η υπόθεση που θεωρείται ότι ισχύει στον πληθυσμό. Βήμα 2ο : Σχηματοποιείται η μηδενική υπόθεση. Βήμα 3ο : Επιλέγεται η στατιστική συνάρτηση ελέγχου και καθορίζεται η συνάρτηση πυκνότητας πιθανότητας αυτής. Βήμα 4ο : Επιλέγεται το επίπεδο σημαντικότητας του ελέγχου και καθορίζεται η κρίσιμη περιοχή. Βήμα 5ο : Υπολογίζεται η τιμή της συνάρτησης ελέγχου από το δείγμα. Βήμα 6ο : Εφαρμόζεται ο κανόνας απόφασης και απορρίπτεται ή γίνεται αποδεκτή η μηδενική υπόθεση.

10 1. Σύντομη επανάληψη (α) αμφίπλευρος έλεγχος (β) μονόπλευρος έλεγχος

11 1. Σύντομη επανάληψη Επίπεδο σημαντικότητας a
Είναι η μέγιστη αποδεκτή πιθανότητα εσφαλμένης απόρριψης της μηδενικής υπόθεσης (Σφάλμα Τύπου Ι). Απόρριψη της μηδενικής υπόθεσης σε επίπεδο σημαντικότητας a σημαίνει κατά τουλάχιστον 100*(1 − α)% βεβαιότητα ότι δεν ισχύει η μηδενική υπόθεση (και ισχύει η εναλλακτική). Αποδοχή της μηδενικής υπόθεσης δεν σημαίνει ότι αποδείχθηκε η ισχύς της αλλά σημαίνει ότι δεν αποδείχθηκε η αντίθετή της. Εάν μικρύνει το επίπεδο σημαντικότητας a, τότε η απόρριψη της μηδενικής υπόθεσης σημαίνει μεγαλύτερη βεβαιότητα ότι δεν ισχύει η μηδενική υπόθεση.

12 1. Σύντομη επανάληψη Επίπεδο σημαντικότητας a (συν.)
Η μικρότερη τιμή του a για την οποία απορρίπτεται η μηδενική υπόθεση λέγεται p-value (p-τιμή) του ελέγχου. Η p-value εκφράζει την πιθανότητα ότι η παρατηρούμενη τιμή της στατιστικής θα μπορούσε να είναι τόσο ακραία κατά τύχη, κάτω από την υπόθεση ότι η μηδενική υπόθεση είναι αληθής. Εάν η p-value είναι μικρότερη από το τιθέμενο επίπεδο σημαντικότητας a, τότε η μηδενική υπόθεση απορρίπτεται. Τέλος, όσο μικραίνει το a τόσο μεγαλώνει το διάστημα εμπιστοσύνης για τη μέση τιμή.

13 Έλεγχος υποθέσεων για τη μέση τιμή
Σύντομη επανάληψη Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων Έλεγχοι υποθέσεων για τη μέση τιμή με το ΜATLAB Παραδοχές των ελέγχων υποθέσεων

14 2. Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος
Το βασικό πρόβλημα στην αποτίμηση των εργαστηριακών και κλινικών ευρημάτων είναι η διάκριση μεταξύ του παθολογικού και του φυσιολογικού επιπέδου κατά τη διάρκεια της διαδικασίας διάγνωσης μιας ασθένειας. Ο χαρακτηρισμός ενός ποσοτικού ευρήματος ως παθολογικού προϋποθέτει την αναγνώριση των αντίστοιχων φυσιολογικών τιμών ή διαστημάτων. Σημειώνουμε ότι ένα βιολογικό μέγεθος έχει μεγάλη διακύμανση. Υπάρχουν πολλοί λόγοι στους οποίους οφείλεται αυτή η διακύμανση. Αναφέρουμε μερικούς από αυτούς ενδεικτικά: το φύλο η ηλικία η διατροφή κλπ

15 2. Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος
Στη συνέχεια, περιγράφουμε τη διαδικασία ελέγχου εάν πληθυσμός με κανονική κατανομή έχει (πληθυσμιακή) μέση τιμή μ=μ0 (την τιμή μ0 ορίζει ο ερευνητής), χρησιμοποιώντας ένα τυχαίο δείγμα από τον πληθυσμό [ή αλλιώς ελέγχου εάν το τυχαίο δείγμα προέρχεται από πληθυσμό με πληθυσμιακή μέση τιμή μ=μ0]. Κατά τον έλεγχο προσδιορίζουμε το διάστημα εμπιστοσύνης για την (πληθυσμιακή) μέση τιμή μ. Διακρίνουμε δύο περιπτώσεις : Η διασπορά του πληθυσμού είναι γνωστή Η διασπορά του πληθυσμού είναι άγνωστη

16 2. Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος
Πρώτη περίπτωση : Η πληθυσμιακή διασπορά σ είναι γνωστή Βήμα 1 : Θέτουμε τη μηδενική υπόθεση H0: μ=μ0 (όπου η μ0 είναι προκαθορισμένη). Βήμα 2 : Θέτουμε την εναλλακτική υπόθεση H1: μ≠μ0, (ή H1: μ>μ0 ή H1: μ<μ0). Βήμα 3 : Θέτουμε (το οποίο ακολουθεί την τυποποιημένη κανονική κατανομή). Βήμα 4 : Επιλέγουμε το επίπεδο σημαντικότητας a και υπολογίζουμε το αντίστοιχο σημείο qa/2 (ή qa ή -qa). Βήμα 5 : Υπολογίζουμε την τιμή του q για το δείγμα. Βήμα 6 : Απορρίπτουμε τη μηδενική υπόθεση υπέρ της : 1. H1 : μ≠μ0 εάν |q|>qa/2 (αμφίπλευρος έλεγχος) 2. H1 : μ>μ0 εάν q > qa (μονόπλευρος έλεγχος προς τα δεξιά) 3. H1 : μ<μ0 εάν q<-qa (μονόπλευρος έλεγχος προς τα αριστερά)

17 2. Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος
Δεύτερη περίπτωση : Η πληθυσμιακή διασπορά είναι άγνωστη Βήμα 1 : Θέτουμε τη μηδενική υπόθεση H0: μ=μ0 (όπου η μ0 είναι προκαθορισμένη). Βήμα 2 : Θέτουμε την εναλλακτική υπόθεση H1: μ≠μ0, (ή H1: μ>μ0 ή H1: μ<μ0). Βήμα 3 : Θέτουμε (που ακολουθεί την κατανομή του Student t με n-1 βαθμούς ελευθερίας) όπου s είναι η δειγματική τυπική απόκλιση. Βήμα 4 : Επιλέγουμε το επίπεδο σημαντικότητας a και υπολογίζουμε το αντίστοιχο σημείο ta/2,n-1 (ή ta,n-1 ή –ta,n-1). Βήμα 5 : Υπολογίζουμε την τιμή του t για το δείγμα. Βήμα 6 : Απορρίπτουμε τη μηδενική υπόθεση υπέρ της : 1. H1 : μ≠μ0 εάν |t|>ta/2,n-1 (αμφίπλευρος έλεγχος) 2. H1 : μ>μ0 εάν t > ta,n-1 (μονόπλευρος έλεγχος προς τα δεξιά) 3. H1 : μ<μ0 εάν t<-ta,n-1 (μονόπλευρος έλεγχος προς τα αριστερά)

18 2. Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος
Σημείωση : Στη γενική περίπτωση δε διαθέτουμε υπολογισμένη τη δειγματική μέση τιμή ούτε τη δειγματική τυπική απόκλιση. Αυτό που διαθέτουμε είναι τα δείγματα των παρατηρήσεων. Έτσι, για να μπορεί να εφαρμοστεί ο έλεγχος υποθέσεων, πρέπει να υπολογιστούν πρώτα η δειγματική μέση τιμή και η δειγματική τυπική απόκλιση χρησιμοποιώντας τις σχέσεις :

19 2. Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος
Παράδειγμα Ας υποθέσουμε ότι μελετούμε δείγμα 120 ασθενών που είχαν υποστεί καρδιακό επεισόδιο. Στους ασθενείς αυτούς μετρήθηκαν τα επίπεδα χοληστερόλης στο αίμα τους. Η δειγματική μέση τιμή των επιπέδων χοληστερόλης ήταν 259,77 mg/ml με τυπική απόκλιση 45,20mg/ml. Μας ζητούν να ελέγξουμε το δείγμα ως προς την υπόθεση ότι προέρχεται από έναν πληθυσμό με μέση τιμή μ0=260 mg/ml. Δεδομένου ότι δε γνωρίζουμε τη διασπορά του πληθυσμού, εφαρμόζουμε την αντίστοιχη διαδικασία αμφίπλευρου ελέγχου :

20 2. Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος
Βήμα 1 : Θέτουμε τη μηδενική υπόθεση H0: μ=260mg/ml. Βήμα 2 : Θέτουμε την εναλλακτική υπόθεση : H1: μ≠260 mg/ml. Βήμα 3 : Θέτουμε (το οποίο ακολουθεί την κατανομή του Student t με 119 βαθμούς ελευθερίας). Βήμα 4 : Επιλέγουμε το επίπεδο σημαντικότητας a=5% και προσδιορίζουμε το αντίστοιχο σημείο t0.025,119=1,98.

21 2. Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος
Βήμα 5 : Υπολογίζουμε την τιμή του Βήμα 6 : Αφού |t|<t0.025,119 αποδεχόμαστε τη μηδενική υπόθεση. Επομένως, αποδεχόμαστε ότι το δείγμα προέρχεται από ένα πληθυσμό με μέση τιμή μ0=260 mg/ml.

22 Έλεγχος υποθέσεων για τη μέση τιμή
Σύντομη επανάληψη Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων Έλεγχοι υποθέσεων για τη μέση τιμή με το ΜATLAB Παραδοχές των ελέγχων υποθέσεων

23 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Στη συνέχεια περιγράφουμε τη διαδικασία ελέγχου της διαφοράς των (πληθυσμιακών) μέσων τιμών μ1 και μ2 δύο ανεξάρτητων κανονικών πληθυσμών χρησιμοποιώντας δύο τυχαία δείγματα, ένα από κάθε πληθυσμό. Κατά τον έλεγχο προσδιορίζουμε το διάστημα εμπιστοσύνης της διαφοράς των δύο μέσων τιμών. Διακρίνουμε τρεις περιπτώσεις : Οι διασπορές των δύο πληθυσμών είναι γνωστές. Οι διασπορές των δύο πληθυσμών είναι άγνωστες αλλά ίσες. Οι διασπορές των δύο πληθυσμών είναι άγνωστες αλλά διαφορετικές (άνισες).

24 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Πρώτη περίπτωση : Οι διασπορές των δύο πληθυσμών σ1 και σ2 είναι γνωστές Βήμα 1 : Θέτουμε τη μηδενική υπόθεση H0: μ1=μ2 Βήμα 2 : Θέτουμε την εναλλακτική υπόθεση H1: μ1≠μ2, (ή H1: μ1>μ2 ή H1: μ1<μ2). Βήμα 3 : Θέτουμε (που ακολουθεί την τυποποιημένη κανονική κατανομή). Βήμα 4 : Επιλέγουμε το επίπεδο σημαντικότητας a και υπολογίζουμε το αντίστοιχο σημείο qa/2 (ή qa ή -qa). Βήμα 5 : Υπολογίζουμε την τιμή του q για τα δείγματα.

25 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Πρώτη περίπτωση : Οι διασπορές των δύο πληθυσμών σ1 και σ2 είναι γνωστές (συν.) Βήμα 6 : Απορρίπτουμε τη μηδενική υπόθεση υπέρ της 1. H1 : μ1≠μ2 εάν |q|>qa/2 (αμφίπλευρος έλεγχος) 2. H1 : μ1>μ2 εάν q > qa (μονόπλευρος έλεγχος προς τα δεξιά) 3. H1 : μ1<μ2 εάν q<-qa (μονόπλευρος έλεγχος προς τα αριστερά)

26 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Δεύτερη περίπτωση : Οι διασπορές των δύο πληθυσμών είναι άγνωστες αλλά ίσες Βήμα 1 : Θέτουμε τη μηδενική υπόθεση H0: μ1=μ2. Βήμα 2 : Θέτουμε την εναλλακτική υπόθεση H1: μ1≠μ2, (ή H1: μ1>μ2 ή H1: μ1<μ2). Βήμα 3 : Θέτουμε (που ακολουθεί την κατανομή του Student t με n1+n2-2 βαθμούς ελεθερίας) όπου s είναι η δειγματική τυπική απόκλιση:

27 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Δεύτερη περίπτωση : Οι διασπορές των δύο πληθυσμών είναι άγνωστες αλλά ίσες (συν.) Βήμα 4 : Επιλέγουμε το επίπεδο σημαντικότητας a και υπολογίζουμε το αντίστοιχο σημείο ta/2,n1+n2-2 (ή ta,n1+n2-2 ή –ta,n1+n2-2). Βήμα 5 : Υπολογίζουμε την τιμή t για τα δείγματα. Βήμα 6 : Απορρίπτουμε τη μηδενική υπόθεση υπέρ της 1. H1 : μ1≠μ2 εάν |t|>ta/2,n1+n2-2 (αμφίπλευρος έλεγχος) 2. H1 : μ1>μ2 εάν t > ta,n1+n2-2 (μονόπλευρος έλεγχος προς τα δεξιά) 3. H1 : μ1<μ2 εάν t<-ta,n1+n2-2 (μονόπλευρος έλεγχος προς τα αριστερά)

28 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Τρίτη περίπτωση : Οι διασπορές των δύο πληθυσμών είναι άγνωστες αλλά διαφορετικές Βήμα 1 : Θέτουμε τη μηδενική υπόθεση H0: μ1=μ2. Βήμα 2 : Θέτουμε την εναλλακτική υπόθεση H1: μ1≠μ2, (ή H1: μ1>μ2 ή H1: μ1<μ2). Βήμα 3 : Θέτουμε που ακολουθεί την κατανομή του Student t με ν βαθμούς ελευθερίας :

29 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Τρίτη περίπτωση : Οι διασπορές των δύο πληθυσμών είναι άγνωστες αλλά διαφορετικές (συν.) όπου s1 και s2 είναι οι δειγματικές τυπικές αποκλίσεις των δύο δειγμάτων : Βήμα 4 : Επιλέγουμε το επίπεδο σημαντικότητας a και υπολογίζουμε το αντίστοιχο σημείο ta/2,ν (ή ta,ν ή –ta,ν). Βήμα 5 : Υπολογίζουμε την τιμή του t για τα δείγματα. Βήμα 6 : Απορρίπτουμε τη μηδενική υπόθεση υπέρ της 1. H1 : μ1≠μ2 εάν |t|>ta/2,ν (αμφίπλευρος έλεγχος) 2. H1 : μ1>μ2 εάν t > ta,ν (μονόπλευρος έλεγχος προς τα δεξιά) 3. H1 : μ1<μ2 εάν t<-ta,ν (μονόπλευρος έλεγχος προς τα αριστερά)

30 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Παράδειγμα Μετρήθηκε η συγκέντρωση του ενζύμου “κρεατίνη-κινάση” σε 28 ασθενείς με πρόσφατο καρδιακό επεισόδιο. Έγινε σύγκριση των αποτελεσμάτων με τα αντίστοιχα αποτελέσματα 35 υγιών ίδιου φύλου και ηλικίας. Η δειγματική μέση τιμή και τυπική απόκλιση του ενζύμου για τις δύο ομάδες είναι : Ασθενείς με καρδιακό επεισόδιο: 79,30±23,80 Υγιείς : 61,40±20,20. Παρουσιάζουν οι ασθενείς με καρδιακό επεισόδιο διαφορετική συγκέντρωση του ενζύμου “κρεατίνη-κινάση” συγκριτικά με τους υγιείς ? Υποθέστε ότι και οι δύο πληθυσμοί ακολουθούν την κανονική κατανομή με άγνωστες αλλά ίσες διασπορές.

31 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Βήμα 1 : Θέτουμε τη μηδενική υπόθεση H0: μ1=μ2. Βήμα 2 : Θέτουμε την εναλλακτική υπόθεση : H1: μ1≠μ2, Βήμα 3 : Θέτουμε (που ακολουθεί την κατανομή του Student t με 61 βαθμούς ελευθερίας) όπου s είναι η δειγματική τυπική απόκλιση:

32 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Βήμα 4 : Επιλέγουμε το επίπεδο σημαντικότητας a=5% και υπολογίζουμε το αντίστοιχο σημείο t0.025,61=2,00 Βήμα 5 : Υπολογίζουμε την τιμή του t Βήμα 6 : Επειδή |t|>t0.025,61 απορρίπτουμε τη μηδενική υπόθεση υπέρ της H1 : μ1≠μ2

33 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Επομένως, οι ασθενείς με καρδιακό επεισόδιο παρουσιάζουν διαφορετική συγκέντρωση του ενζύμου “κρεατίνη-κινάση” συγκριτικά με τους υγιείς.

34 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Τέλος, περιγράφουμε τη διαδικασία ελέγχου των μέσων τιμών μ1 και μ2 δύο κανονικών πληθυσμών που δεν είναι ανεξάρτητοι, χρησιμοποιώντας ένα δείγμα από κάθε πληθυσμό. Στην περίπτωση αυτή χρησιμοποιούμε ως μεταβλητή τη διαφορά των τιμών των παρατηρήσεων των δύο δειγμάτων: με

35 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Βήμα 1 : Θέτουμε τη μηδενική υπόθεση H0: μd=0 Βήμα 2 : Θέτουμε την εναλλακτική υπόθεση H1: μd≠0, (ή H1: μd>0 ή H1: μd<0). Βήμα 3 : Θέτουμε (που ακολουθεί την κατανομή του Student t με n-1 βαθμούς ελευθερίας). Βήμα 4 : Επιλέγουμε το επίπεδο σημαντικότητας a και υπολογίζουμε το αντίστοιχο σημείο ta/2,n-1 (ή ta,n-1 ή –ta,n-1). Βήμα 5 : Υπολογίζουμε την τιμή του t για το δείγμα (των διαφορών di). Βήμα 6 : Απορρίπτουμε τη μηδενική υπόθεση υπέρ της 1. H1 : μd≠0 εάν |t|>ta/2,n-1 (αμφίπλευρος έλεγχος) 2. H1 : μd>0 εάν t > ta,n-1 (μονόπλευρος έλεγχος προς τα δεξιά) 3. H1 : μd<0 εάν t<-ta,n-1 (μονόπλευρος έλεγχος προς τα αριστερά)

36 3. Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων
Παράδειγμα Ένας ερευνητής επιθυμεί να μελετήσει την παρουσία της “b-ενδορφίνης” στους δρομείς. Μέτρησε τη συγκέντρωση της “b-ενδορφίνης” σε 11 δρομείς πριν και μετά από ένα ημιμαραθώνιο τον οποίο έτρεξαν. Τα αποτελέσματα των μετρήσεων είναι τα ακόλουθα : Δρομέας 1 2 3 4 5 6 7 8 9 10 11 Πριν τον αγώνα 4,3 4,6 5,2 6,6 7,2 8,4 9,0 10,4 14,0 17,8 Μετά τον αγώνα 29,6 25,1 15,5 24,1 37,8 20,2 21,9 14,2 34,6 46,2 Ο ερευνητής επιθυμεί να απαντήσει στο ερώτημα : Διαφέρουν τα επίπεδα της “b-ενδορφίνης” πριν και μετά τον αγώνα ? Τι πρέπει να κάνει ο ερευνητής για να απαντήσει στο ερώτημα?

37 Έλεγχος υποθέσεων για τη μέση τιμή
Σύντομη επανάληψη Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων Έλεγχοι υποθέσεων για τη μέση τιμή με το ΜATLAB Παραδοχές των ελέγχων υποθέσεων

38 4. Έλεγχοι με το MATLAB Matlab
Το Statistics Toolbox διαθέτει τις ακόλουθες συναρτήσεις για την πραγματοποίηση ελέγχου υποθέσεων για τη μέση τιμή ενός ή δύο δειγμάτων : Συνάρτηση Matlab Έλεγχος υποθέσεων ztest Έλεγχος μέσης τιμής ενός κανονικού δείγματος με γνωστή τυπική απόκλιση ttest Έλεγχος μέσης τιμής ενός κανονικού δείγματος ttest2 Έλεγχος μέσης τιμής δύο κανονικών δειγμάτων

39 4. Έλεγχοι με το MATLAB Η συνάρτηση ztest
Πραγματοποιεί τον έλεγχο υποθέσεων εάν ένα δείγμα x από κανονική κατανομή με γνωστή τυπική απόκλιση sigma θα μπορούσε να προέρχεται από πληθυσμό με μέση τιμή m. [h,p,ci,zval] = ztest(x,m,sigma,alpha,tail) Περιγραφή Τιμές Εξ’ ορισμού x Δείγμα m Μέση τιμή ως προς την οποία γίνεται ο έλεγχος sigma Η (γνωστή) τυπική απόκλιση alpha Το επίπεδο σημαντικότητας 0,05 tail Αμφίπλευρος ή μονόπλευρος έλεγχος ‘both’ ή ‘right’ ή ‘left’ ‘both’ h Το αποτέλεσμα του ελέγχου 0 (όχι απόρριψη της μηδενικής υπόθεσης) 1 (απόρριψη της μηδενικής υπόθεσης) p Η p-τιμή ci Το διάστημα εμπιστοσύνης για την εκτίμηση της (πληθυσμιακής) μέσης τιμής από το δείγμα zval Η z-στατιστική , n το πλήθος των παρατηρήσεων

40 4. Έλεγχοι με το MATLAB Η συνάρτηση ztest
Η p-τιμή είναι η πιθανότητα ότι η παρατηρούμενη τιμή του z θα μπορούσε να είναι τόσο ακραία ή πιο ακραία κατά τύχη, κάτω από την υπόθεση ότι η μηδενική υπόθεση είναι αληθής (η μέση τιμή του x είναι ίση με m). Εάν η p-τιμή είναι μικρότερη από το επίπεδο σημαντικότητας a, τότε η μηδενική υπόθεση απορρίπτεται. Για παράδειγμα, εάν a= 0.05 και η p-τιμή είναι 0.03, τότε η μηδενική υπόθεση απορρίπτεται. h = ztest(x,m,sigma) ή h = ztest(x,m,sigma,alpha) επίσης λειτουργούν.

41 4. Έλεγχοι με το MATLAB Η συνάρτηση ztest Παράδειγμα
x=normrnd(1,2,1000,1); [h,p,ci]=ztest(x,1,2) % Μηδενική υπόθεση : μx=1 / αμφίπλευρος h = 0 p = ci = mean(x) ans = h = 0 σημαίνει ότι η μηδενική υπόθεση δεν μπορεί να απορριφθεί. Η p= σημαίνει ότι κατά τύχη θα μπορούσαμε να είχαμε παρατηρήσει τιμές του z περισσότερο ακραίες από αυτή του παραδείγματος σε περίπου 98 στα 100 παρόμοια πειράματα. Το 95% διάστημα εμπιστοσύνης της (πληθυσμιακής) μέσης τιμής είναι [ ], το οποίο περιλαμβάνει τη θεωρητική (και υποτεθείσα) μέση τιμή του ‘1’.

42 4. Έλεγχοι με το MATLAB Η συνάρτηση ztest Παράδειγμα (συν.)
[h,p]=ztest(x,2,2) % Μηδενική υπόθεση : μx=2 / αμφίπλευρος h = 1 p = e-056 h = 1 σημαίνει ότι η μηδενική υπόθεση απορρίπτεται. Η p=3.9045e-056 είναι κατά πολύ μικρότερη του επιπέδου σημαντικότητας a.

43 4. Έλεγχοι με το MATLAB Η συνάρτηση ztest Παράδειγμα (συν.)
[h,p]=ztest(x,1.13,2) % Μηδενική υπόθεση : μx=1,13 / αμφίπλευρος h = 1 p = h = 1 σημαίνει ότι η μηδενική υπόθεση απορρίπτεται. Η p= είναι μικρότερη του επιπέδου σημαντικότητας a.

44 4. Έλεγχοι με το MATLAB Η συνάρτηση ztest Παράδειγμα (συν.)
[h,p,ci]=ztest(x,1.1255,2) % Μηδενική υπόθεση : μx=1,1255 / αμφιπλ. h = 0 p = ci = h = 0 σημαίνει ότι η μηδενική υπόθεση δεν μπορεί να απορριφθεί. Η p= είναι μεγαλύτερη του επιπέδου σημαντικότητας a. Σημείωση : Το 100(1-a) διάστημα εμπιστοσύνης δεν περιέχει την τιμή 1.13, και έτσι η μηδενική υπόθεση απορρίφθηκε στο επίπεδο σημαντικότητας a. Ωστόσο, το 100(1-a) διάστημα εμπιστοσύνης περιέχει την τιμή , και έτσι η μηδενική υπόθεση δεν απορρίφθηκε σε επίπεδο σημαντικότητας a.

45 4. Έλεγχοι με το MATLAB Η συνάρτηση ztest Παράδειγμα (συν.)
[h,p,ci]=ztest(x,1,2,0.05, 'right') % Μηδενική υπόθεση : μx=1 h = % Εναλλακτική υπόθεση : μχ>1 p = ci = Inf h = 0 σημαίνει ότι η μηδενική υπόθεση δεν μπορεί να απορριφθεί. Η p= σημαίνει ότι κατά τύχη θα μπορούσαμε να είχαμε παρατηρήσει τιμές του z πιο ακραίες από αυτή του παραδείγματος σε περίπου 49 από 100 παρόμοια πειράματα. Το 95% διάστημα εμπιστοσύνης για την (πληθυσμιακή) μέση τιμή είναι [ Inf], το οποίο περιλαμβάνει τη θεωρητική (και υποτεθείσα) μέση τιμή του ‘1’.

46 4. Έλεγχοι με το MATLAB Η συνάρτηση ztest Παράδειγμα (συν.)
[h,p,ci]=ztest(x,1,2,0.05, ’left') % Μηδενική υπόθεση : μx=1 h = % Εναλλακτική υπόθεση : μx<1 p = ci = -Inf h = 0 σημαίνει ότι η μηδενική υπόθεση δεν μπορεί να απορριφθεί. Η p= σημαίνει ότι κατά τύχη θα μπορούσαμε να είχαμε παρατηρήσει τιμές του z πιο ακραίες από αυτή του παραδείγματος σε περίπου 51 από 100 παρόμοια πειράματα. Το 95% διάστημα εμπιστοσύνης για την (πληθυσμιακή) μέση τιμή είναι [-Inf ], το οποίο περιλαμβάνει τη θεωρητική (και υποτεθείσα) μέση τιμή του ‘1’.

47 4. Έλεγχοι με το MATLAB Η συνάρτηση ztest Παράδειγμα (συν.)
[h,p,ci]=ztest(x,1.13,2) % Μηδενική υπόθεση : μx=1,13/ αμφίπλευρος h = 1 p = ci = h = 1 σημαίνει ότι η μηδενική υπόθεση απορρίπτεται σε επίπεδο σημαντικότητας 0.05. Η p= είναι μικρότερη από το επίπεδο σημαντικότητας a. Ωστόσο, [h,p,ci]=ztest(x,1.13,2,0.01) % Μηδενική υπόθεση : μx=1,13/ % αμφίπελυρος h = 0 p = ci =  h = 0 σημαίνει ότι η μηδενική υπόθεση δεν μπορεί να απορριφθεί σε επίπεδο σημαντικότητας 0.01. Σημείωση : Το a εκφράζει την πιθανότητα λανθασμένης απόρριψης της μηδενικής υπόθεσης όταν είναι στην πραγματικότητα αληθής.

48 4. Έλεγχοι με το MATLAB Η συνάρτηση ztest Παράδειγμα (συν.)
[h,p,ci]=ztest(x,1,2,0.05) % Μηδενική υπόθεση : μx=1 / αμφίπλ. h = 0 p = ci = Ενώ για a=0.01 [h,p,ci]=ztest(x,1,2,0.01) % Μηδενική υπόθεση : μx=1 / αμφίπλ. h = 0 p = ci = (και στις δύο περιπτώσεις του a) h = 0 σημαίνει ότι η μηδενική υπόθεση δεν μπορεί να απορριφθεί. Το διάστημα εμπιστοσύνης είναι μεγαλύτερο για μικρότερο a Σημείωση : 1-a είναι η πιθανότητα ότι το διάστημα εμπιστοσύνης περιέχει την αληθή τιμή της υποτεθείσας ποσότητας.

49 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest
Πραγματοποιεί τον έλεγχο υποθέσεων για τη μέση τιμή ενός δείγματος από κανονική κατανομή με άγνωστη τυπική απόκλιση. Συγκεκριμένα, πραγματοποιεί : το t-test της υπόθεσης ότι τα δεδομένα στο διάνυσμα x προέρχονται από πληθυσμό με κανονική κατανομή με μέση τιμή m το κατά ζεύγη t-test της υπόθεσης ότι δύο εξαρτημένα δείγματα x και y προέρχονται από πληθυσμούς με κατανομές με ίσες μέσες τιμές. Η υπόθεση είναι ότι η διαφορά x-y προέρχεται από κανονική κατανομή με άγνωστη διασπορά.

50 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest
Για τον έλεγχο της υπόθεσης ότι τα δεδομένα στο διάνυσμα x προέρχονται από πληθυσμό με κανονική κατανομή με μέση τιμή m: [h,p,ci,stats] = ttest(x,m,alpha,tail) Περιγραφή Τιμές Εξ΄ ορισμού x Δείγμα m Μέση τιμή προς έλεγχο alpha Το επίπεδο σημαντικότητας 0,05 tail Αμφίπλευρος ή μονόπλευρος έλεγχος ‘both’ ή ‘right’ ή ‘left’ ‘both’ h Το αποτέλεσμα του ελέγχου 0 (μη απόρριψη της μηδενικής υπόθεσης) ή 1 (απόρριψη της μηδενικής υπόθεσης) p η p-τιμή ci Το διάστημα εμπιστοσύνης για την εκτίμηση της πληθυσμιακής μέσης τιμής stats t-statistic: τιμή της t-στατιστικής df : βαθμοί ελευθερίας sd : εκτιμώμενη τυπική απόκλιση , n το πλήθος παρατηρήσεων df=n-1 sd=s

51 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest
Για τον κατά ζεύγη έλεγχο της υπόθεσης ότι τα δύο εξαρτημένα δείγματα x και y προέρχονται από κανονικές κατανομές με ίσες μέσες τιμές: [h,p,ci,stats] = ttest(x,y,alpha,tail) Σημείωση : τα x και y πρέπει να έχουν το ίδιο μήκος Περιγραφή Τιμές Εξ’ ορισμού x Δείγμα y alpha Το επίπεδο σημαντικότητας 0,05 tail Αμφίπλευρος ή μονόπλευρος έλεγχος ‘both’ ή ‘right’ ή ‘left’ ‘both’ h Το αποτέλεσμα του ελέγχου 0 (όχι απόρριψη της μηδενικής υπόθεσης) 1 (απόρριψη της μηδενικής υπόθεσης) p η p-τιμή ci Το διάστημα εμπιστοσύνης για την εκτίμηση της πληθυσμιακής μέσης τιμής (της διαφοράς) stats t-statistic: τιμής της t-στατιστικής df : βαθμοί ελευθερίας sd : τυπική απόκλιση του x-y , n το πλήθος παρατηρήσεων df=n-1 sd=s

52 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest h = ttest(x) ή
h=ttest(x,m) ή h=ttest(x,m,alpha) ή h=ttest(x,m,alpha,tail) ή h=ttest(x,y) ή h=ttest(x,y,alpha) ή h=ttest(x,y,alpha,tail) επίσης λειτουργούν.

53 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest Παράδειγμα
x=normrnd(3,1,100,1); [h,p,ci,stat]=ttest(x,3) % Μηδενική υπόθεση : μx=3 / αμφίπλευρος h = 0 p = ci = stat = tstat: df: 99 sd: mean(x) ans = std(x) ans = h = 0 σημαίνει ότι η μηδενική υπόθεση δεν μπορεί να απορριφθεί. Η p= σημαίνει ότι κατά τύχη θα μπορούσαμε να είχαμε παρατηρήσει τιμές του t περισσότερο ακραίες από αυτή του παραδείγματος σε περίπου 78 στα 100 παρόμοια πειράματα.

54 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest Παράδειγμα (συν.)
Το 95% διάστημα εμπιστοσύνης της εκτίμησης της (πληθυσμιακής) μέσης τιμής είναι [ ], το οποίο περιλαμβάνει την αληθή (και υποτεθείσα) μέση τιμή ‘3’. Η t στατιστική είναι – Οι βαθμοί ελευθερίας είναι 99. Η δειγματική τυπική απόκλιση είναι

55 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest Παράδειγμα (συν.)
[h,p,ci,stat]=ttest(x,4) % Μηδενική υπόθεση : μx=4 / αμφίπλευρος h = 1 p = e-019 ci = stat = tstat: df: 99 sd: h = 1 σημαίνει ότι η μηδενική υπόθεση απορρίπτεται. Η p=2.7867e-019 είναι κατά πολύ μικρότερη από το επίπεδο σημαντικότητας a.

56 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest2
Πραγματοποιεί τον έλεγχο υποθέσεων για τη διαφορά των μέσων τιμών δύο ανεξάρτητων δειγμάτων. Συγκεκριμένα, πραγματοποιεί : το t-test για τον προσδιορισμό του εάν δύο δείγματα από κανονικές κατανομές (τα x και y) θα μπορούσαν να προέρχονται από πληθυσμούς με την ίδια μέση τιμή όταν οι τυπικές αποκλίσεις είναι άγνωστες αλλά ίσες το t-test για τον προσδιορισμό του εάν δύο δείγματα από κανονικές κατανομές (τα x και y) θα μπορούσαν να προέρχονται από πληθυσμούς με την ίδια μέση τιμή όταν οι τυπικές αποκλίσεις είναι άγνωστες και άνισες

57 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest2
Περίπτωση άγνωστων αλλά ίσων τυπικών αποκλίσεων: [h,p,ci,stats] = ttest2(x,y,alpha,tail) Περιγραφή Τιμές Εξ’ ορισμού X Δείγμα (μήκους n) y Δείγμα (μήκους m) alpha Το επίπεδο σημαντικότητας 0,05 tail Αμφίπλευρος ή μονόπλευρος έλεγχος ‘both’ ή ‘right’ ή ‘left’ ‘both’ h Το αποτέλεσμα του ελέγχου 0 (όχι απόρριψη της μηδενικής υπόθεσης) ή 1 (απόρριψη της μηδενικής υπόθεσης) p η p-τιμή ci Το διάστημα εμπιστοσύνης για την διαφορά των (πληθυσμιακών) μέσων τιμών stats t-statistic: τιμή της t-στατιστικής df : βαθμοί ελευθερίας sd : εκτιμώμενη τυπική απόκλιση df=n+m-2

58 [h,p,ci,stats] = ttest2(x,y,alpha,tail,’unequal’)
4. Έλεγχοι με το MATLAB Η συνάρτηση ttest2 Περίπτωση άγνωστων και άνισων τυπικών αποκλίσεων : [h,p,ci,stats] = ttest2(x,y,alpha,tail,’unequal’) Στην περίπτωση αυτή η ποσότητα ‘sd’ του ‘stats’ είναι ένα διάνυσμα που περιέχει τις εκτιμήσεις των δύο τυπικών αποκλίσεων. Η συνάρτηση ttest2 h = ttest2(x,y) ή h=ttest2(x,y,alpha) ή [h,p]=ttest2(x,y) ή [h,p]=ttest2(x,y,alpha) ή επίσης λειτουργούν.

59 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest2 Παράδειγμα
x=normrnd(1,2,100,1); y=normrnd(2,2,100,1); [h,p,ci] = ttest2(x,y) % Μηδενική υπόθεση : μx=μy /αμφίπλευρος h = 1 p = ci = mean(x) ans = mean(y) ans =  h = 1 σημαίνει ότι η μηδενική υπόθεση απορρίπτεται.  Η p= είναι μικρότερη από το επίπεδο σημαντικότητας a=0.05.  Το 95% διάστημα εμπιστοσύνης για τη διαφορά των (πληθυσμιακών) μέσων τιμών είναι [ ], το οποίο περιλαμβάνει τη θεωρητική διαφορά του -1.

60 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest2 Παράδειγμα (συν.)
x=normrnd(1,2,100,1); y=normrnd(2,3,100,1); [h,p,ci,stats] = ttest2(x,y,0.05,’both’,'unequal') h = 1 p = ci = stats = tstat: df: sd: [ ]  h = 1 σημαίνει ότι η μηδενική υπόθεση απορρίπτεται.  Η p= είναι μικρότερη από το επίπεδο σημαντικότητας a=0.05.  Το 95% διάστημα εμπιστοσύνης της διαφοράς των (πληθυσμιακών) μέσων τιμών είναι [ ], το οποίο περιλαμβάνει τη θεωρητική διαφορά του -1.

61 4. Έλεγχοι με το MATLAB Η συνάρτηση ttest2 Παράδειγμα (συν.)
x=normrnd(1,2,100,1); y=normrnd(1,3,100,1); [h,p,ci,stats] = ttest2(x,y,0.05,’both’,'unequal') h = 0 p = ci = stats = tstat: df: sd: [ ]  h = 0 σημαίνει ότι η μηδενική υπόθεση δεν μπορεί να απορριφθεί.

62 Έλεγχος υποθέσεων για τη μέση τιμή
Σύντομη επανάληψη Έλεγχος υποθέσεων για τη μέση τιμή ενός δείγματος Έλεγχος υποθέσεων για τη μέση τιμή δύο δειγμάτων Έλεγχοι υποθέσεων για τη μέση τιμή με το ΜATLAB Παραδοχές των ελέγχων υποθέσεων

63 4. Έλεγχοι με το MATLAB Περιπτώσεις ελέγχου υποθέσεων μέσης τιμής για ένα ή δύο δείγματα Πλήθος δειγμάτων που ακολουθούν την κανονική κατανομή Διασπορά Ανεξαρτησία δειγμάτων H0 H1 (αμφίπλευρος έλεγχος) Στατιστική Κατανομή στατιστικής 1 σύνολο n δειγμάτων γνωστή : σ - μ=μ0 μ≠μ0 Τυποποιημένη κανονική άγνωστη Student’s t με n-1 β.ε. 1 σύνολο n1 δειγμάτων και 1 σύνολο n2 δειγμάτων γνωστές : σ1, σ2 Ναι μ1=μ2 μ1≠μ2 1 σύνολο n1 δειγμάτων και άγνωστες αλλά ίσες Student’s t με n1 + n2 -2 β.ε. άγνωστες αλλά άνισες Student’s t με ν=ν(s1,s2,n1,n2) β.ε. Όχι μD=0 μD≠0 Σχηματίζουμε ένα νέο δείγμα από τις διαφορές των παρατηρήσεων. Ακολουθούμε την περίπτωση ενός συνόλου n δειγμάτων με άγνωστη διασπορά. MATLAB function ztest ttest(x,m) ttest2 ttest (unequal) ttest(x,y)

64 5. Παραδοχές των ελέγχων υποθέσεων
Η παραδοχή της κανονικότητας Το t-test μπορεί να εφαρμοστεί εάν η κανονικότητα των κατανομών ισχύει και για τους δύο υπό μελέτη πληθυσμούς. Στις περιπτώσεις που δεν γνωρίζουμε εκ των προτέρων εάν οι κατανομές των υπό μελέτη πληθυσμών είναι κανονικές, πραγματοποιούμε (όπως θα δούμε σε επόμενο μάθημα) είτε οπτική επισκόπηση με γραφική μέθοδο είτε στατιστικούς ελέγχους για να ελέγξουμε (αποδεχθούμε) την κανονικότητα των κατανομών. Σε κάθε περίπτωση, πριν την πραγματοποίηση ελέγχου υποθέσεων πρέπει να προσέχουμε τα ακόλουθα σημεία : Μήπως υπάρχουν ενδείξεις μη κανονικότητας; Εάν προσθαφαιρέσουμε δύο τυπικές αποκλίσεις από τη μέση τιμή, δεν πρέπει να παρατηρούμε τιμές που δεν έχουν νόημα, π.χ. αρνητικές συγκεντρώσεις ή αρνητικά ύψη, κλπ

65 5. Παραδοχές των ελέγχων υποθέσεων
Η παραδοχή της κανονικότητας (συν.) Εάν παρατηρήσουμε τιμές χωρίς νόημα πρέπει να υποπτευθούμε ότι δεν έχουμε κανονικότητα. Η μέτρηση μιας νέας βιολογικής παραμέτρου σε μερικούς ανθρώπους δεν εξασφαλίζει την κανονικότητα του δείγματος, αφού η κατανομή της παραμέτρου αυτής στο γενικό πληθυσμό είναι άγνωστη. Το t-test δεν πρέπει να εφαρμόζεται σε περιπτώσεις για τις οποίες γνωρίζουμε ότι οι κατανομές είναι ασυμμετρικές ή ότι έχουν πολλές κορυφές ή ότι δεν είναι κανονικές.

66 5. Παραδοχές των ελέγχων υποθέσεων
Η παραδοχή κανονικότητας (συν.) Στην περίπτωση μη-κανονικότητας κατανομών μπορούμε να ακολουθήσουμε μία από τις ακόλουθες δύο λύσεις : Να χρησιμοποιήσουμε μη παραμετρικούς ελέγχους (τους οποίους θα δούμε σε επόμενα μαθήματα) που δεν απαιτούν ως προϋπόθεση την κανονικότητα των κατανομών. Να εφαρμόσουμε το t-test στους λογαρίθμους των παρατηρήσεων. Η διαδικασία αυτή βασίζεται στην ιδιότητα ότι οι λογάριθμοι έχουν περισσότερο “κανονικά” χαρακτηριστικά και έτσι είναι κατάλληλοι για την εφαρμογή του t-test.

67 5. Παραδοχές των ελέγχων υποθέσεων
Η παραδοχή της ισότητας των τυπικών αποκλίσεων Η εφαρμογή του t-test για ίσες διασπορές θεωρείται ασφαλής μόνο εάν οι δύο τυπικές αποκλίσεις δεν διαφέρουν πολύ. Στις περιπτώσεις που δεν γνωρίζουμε εκ των προτέρων εάν οι κατανομές των υπό μελέτη πληθυσμών έχουν ίσες τυπικές αποκλίσεις, πραγματοποιούμε (όπως θα δούμε σε επόμενο μάθημα) στατιστικούς ελέγχους για να ελέγξουμε (αποδεχθούμε) την ισότητα των τυπικών αποκλίσεων των κατανομών. Εμπειρικά, ο χρυσός κανόνας είναι : “η τυπική απόκλιση του ενός πληθυσμού δεν πρέπει να είναι μεγαλύτερη από το διπλάσιο της τυπικής απόκλισης του άλλου πληθυσμού”. Αυτός είναι ο λόγος που συχνά απαιτείται τα δύο υπό μελέτη δείγματα να έχουν περίπου τον ίδιο αριθμό παρατηρήσεων.

68 5. Παραδοχές των ελέγχων υποθέσεων
Η παραδοχή της ισότητας των τυπικών αποκλίσεων (συνέχεια) Για παράδειγμα, δεν θεωρείται ορθή προσέγγιση να έχουμε δύο ομάδες με εμφανώς άνισα πλήθη παρατηρήσεων, π.χ. μια ομάδα 300 υγιών ατόμων συγκριτικά με μια ομάδα 5 ασθενών. Στην περίπτωση αυτή, πρέπει να επιλέξουμε τυχαία 5 υγιείς και να τους συγκρίνουμε με την ομάδα των 5 ασθενών.


Κατέβασμα ppt "ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗ ΜΕΣΗ ΤΙΜΗ"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google