Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Μη-Παραμετρική Στατιστική Κεφάλαιο 17. Μη-Παραμετρική Στατιστική … Σε αυτό το κεφάλαιο αναπτύσσονται στατιστικές τεχνικές για διατακτικά δεδομένα. Θυμηθείτε:

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Μη-Παραμετρική Στατιστική Κεφάλαιο 17. Μη-Παραμετρική Στατιστική … Σε αυτό το κεφάλαιο αναπτύσσονται στατιστικές τεχνικές για διατακτικά δεδομένα. Θυμηθείτε:"— Μεταγράφημα παρουσίασης:

1 Μη-Παραμετρική Στατιστική Κεφάλαιο 17

2 Μη-Παραμετρική Στατιστική … Σε αυτό το κεφάλαιο αναπτύσσονται στατιστικές τεχνικές για διατακτικά δεδομένα. Θυμηθείτε: όταν τα δεδομένα είναι διατακτικά, ο μέσος δεν είναι κατάλληλο μέτρο κεντρικής θέσης (population locations). Σε αναπλήρωση, θα ελέγξουμε χαρακτηριστικά των πληθυσμών χωρίς να αναφερόμαστε σε συγκεκριμένες παραμέτρους, από όπου προκύπτει και ο όρος μη-παραμετρική. Αντί να ελέγχουμε εάν οι μέσοι διαφέρουν, θα ελέγχουμε εάν p μέτρα θέσης του πληθυσμού διαφέρουν …

3 Οι έλεγχοι που εξετάσαμε μέχρι τώρα μπορούν να εφαρμοστούν μόνο όταν τα δεδομένα είναι κανονικά ή προσεγγιστικά κανονικά. Εάν η παραπάνω υπόθεση δεν ικανοποιείται μπορούμε να χρησιμοποιήσουμε μη- παραμετρική στατιστική, επίσης γνωστή ως στατιστική χωρίς κατανομές (distribution free statistics). Μη-Παραμετρική Στατιστική …

4 Οι τεχνικές που πρόκειται να μελετήσουμε μπορούν να χρησιμοποιηθούν όταν τα δεδομένα είναι διαστημικά και η απαιτούμενη υπόθεση της κανονικότητας δεν ικανοποιείται. Σε τέτοιες περιπτώσεις θα μεταχειριστούμε τα διαστημικά δεδομένα σαν να ήταν διατακτικά. Μη-Παραμετρική Στατιστική …

5 Κατανομή των πληθυσμών όταν τα μέτρα θέσης τους είναι τα ίδια

6 Μέτρα Θέσης Πληθυσμού … Το μέτρο θέσης του πληθυσμού 1 είναι στα αριστερά του μέτρου θέσης του πληθυσμού 2 Το μέτρο θέσης του πληθυσμού 1 είναι στα δεξιά του μέτρου θέσης του πληθυσμού 2 πληθυσμός 1 πληθυσμός 2 πληθυσμός 1

7 Αντικειμενικός Στόχος του Προβλήματος… Όταν ο αντικειμενικός στόχος του προβλήματος είναι να συγκρίνουμε δύο πληθυσμούς, η μηδενική υπόθεση είναι: H 0 : Τα δύο μέτρα θέσης του πληθυσμού είναι τα ίδια. Η εναλλακτική υπόθεση μπορεί να πάρει μία από τις ακόλουθες τρεις μορφές:  H 1 : Το μέτρο θέσης του πληθυσμού 1 είναι διαφορετικό από το μέτρο θέσης του πληθυσμού 2.  H 1 : Το μέτρο θέσης του πληθυσμού 1 είναι στα δεξιά του μέτρο θέσης του πληθυσμού 2.  H 1 : Το μέτρο θέσης του πληθυσμού 1 είναι στα αριστερά του μέτρο θέσης του πληθυσμού 2.

8 Έλεγχος Άθροισης Βαθμών Wilcoxon  Τα χαρακτηριστικά του προβλήματος του ελέγχου είναι:  Ο αντικειμενικός στόχος του προβλήματος είναι η σύγκριση δύο πληθυσμών.  Τα δεδομένα είναι διατακτικά (ordinal) ή διαστημικά (interval), αλλά όχι αναγκαστικά κανονικά.  Τα δείγματα είναι ανεξάρτητα.

9 Έλεγχος Άθροισης Βαθμών Wilcoxon – Παράδειγμα Παράδειγμα 21.1 –Βασισμένοι στα δύο δείγματα που παρουσιάζονται παρακάτω, μπορούμε να συμπεραίνουμε, με 5% επίπεδο σημαντικότητας, ότι το μέτρο θέσης του πληθυσμού 1 είναι στα αριστερά του πληθυσμού 2; –Δείγμα 1: 22, 23, 20; Δείγμα 2: 18, 27, 26; –Οι υποθέσεις είναι: –H 0 : Τα δύο μέτρα θέσης των πληθυσμών είναι ίσα. H 1 : το μέτρο θέσης του πληθυσμού 1 είναι στα αριστερά του πληθυσμού 2.

10 Γραφική Παρουσίαση - Γιατί χρησιμοποιούμε το άθροισμα των βαθμών για να ελέγξουμε μέτρα θέσης; Άθροισμα βαθμών = 37Άθροισμα βαθμών = Εάν τα μέτρα θέσης των δύο πληθυσμών είναι περίπου ίσα, (η μηδενική υπόθεση είναι αληθής) θα περιμέναμε οι βαθμοί να είναι ομοίως απλωμένα μεταξύ των δειγμάτων. Σε αυτή την περίπτωση το άθροισμα των βαθμών για τα δύο δείγματα θα είναι κοντά το ένα με το άλλο. Οι δύο υποθετικοί πληθυσμοί και τα αντίστοιχα δείγματα παρουσιάζονται, ο ΠΡΑΣΙΝΟΣ πληθυσμός και ο ΡΟΖ πληθυσμός. Πληθυσμοί Ας βαθμολογήσουμε τις παρατηρήσεις των δύο δειγμάτων μαζί

11 Επιτρέπουμε τον ΠΡΑΣΙΝΟ πληθυσμό να μετατοπιστεί στα αριστερά του ΡΟΖ πληθυσμού. Γραφική Παρουσίαση - Γιατί χρησιμοποιούμε το άθροισμα των βαθμών για να ελέγξουμε μέτρα θέσης;

12 Άθροισμα βαθμών = 38 Άθροισμα βαθμών = Το πράσινο δείγμα αναμένεται να μετακινηθεί επίσης στα αριστερά. Ως αποτέλεσμα, αρκετές παρατηρήσεις ανταλλάσουν θέση. Τι συμβαίνει στο άθροισμά των βαθμών; Άθροισμα βαθμών = 37Άθροισμα βαθμών = 41 Άθροισμα βαθμών = 45 Άθροισμα βαθμών = 33 Γραφική Παρουσίαση - Γιατί χρησιμοποιούμε το άθροισμα των βαθμών για να ελέγξουμε μέτρα θέσης;

13 67 Άθροισμα βαθμών = 38 Άθροισμα βαθμών = Άθροισμα βαθμών = 37 Άθροισμα βαθμών = 41 Άθροισμα βαθμών = 45 Άθροισμα βαθμών = 33 Το «πράσινο» άθροισμα μειώνεται, και το «ροζ» άθροισμα αυξάνει. Αλλάζοντας την σχετική θέση των δύο πληθυσμών επηρεάζει το άθροισμα των βαθμών των δύο δειγμάτων που αναμείχθηκαν. Γραφική Παρουσίαση - Γιατί χρησιμοποιούμε το άθροισμα των βαθμών για να ελέγξουμε μέτρα θέσης;

14 Παράδειγμα 17.1 – (συνέχεια) Στατιστικός έλεγχος 1. Βαθμολόγηση όλων των έξι παρατηρήσεων (1 για το μικρότερο). Δείγμα Δείγμα Βαθμός Υπολογίστε το Άθροισμα των βαθμών: 9 2. Υπολογίστε το Άθροισμα των βαθμών: Ας ορίσουμε ως T = 9 να είναι ο στατιστικός έλεγχος (Αυθαίρετα ορίζουμε τον στατιστικό έλεγχο ως το άθροισμα των βαθμών του δείγματος 1.) Έλεγχος Άθροισης Βαθμών Wilcoxon – Παράδειγμα

15 Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου Μία μικρή τιμή του T υποδεικνύει ότι οι μικρότερες παρατηρήσεις ανήκουν στο δείγμα 1 οι οποίες επιλέχθηκαν από τον πληθυσμό 1 — αλλά πόσο μικρό είναι «μικρό»; Είναι 9 αρκετά «μικρό»; Έχουμε τιμή για τον στατιστικό έλεγχο, T=9. Χρειαζόμαστε να την συγκρίνουμε με κάποια κριτική τιμή του «T» ώστε να γνωρίζουμε αν ανήκει στην περιοχή απόρριψης για H 0 (ή όχι). Και έπειτα, πως είναι η δειγματοληπτική κατανομή των «βαθμών»;

16 Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου Μπορούμε να κατασκευάσουμε την δειγματοληπτική κατανομή του στατιστικού ελέγχου κατά τον ίδιο τρόπο που σχεδιάζουμε ιστογράμματα για τα αποτελέσματα των ρίψεων δύων ή τριών ζαριών … 1. Απαριθμήστε όλους τους δυνατούς συνδυασμούς των βαθμών 2.Υπολογίστε αθροίσματα βαθμών για τους συνδυασμούς 3.Η πιθανότητα για κάθε άθροισμα βαθμών είναι ο αριθμός των συμβάντων διαιρούμενος με τον συνολικό αριθμό των συνδυασμών …

17 ENUMERATE

18 Δειγματοληπτική Κατανομή του T με Δύο Δείγματα Μεγέθους 3 ΥΠΟΛΟΓΙΣΤΕ ΠΙΘΑΝΟΤΗΤΕΣ

19 Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου 1.Απαριθμήστε 2. Υπολογίστε 3. Πιθανότητες … Σύνολο 20 συνδυασμών 1 συνδυασμός 3 συνδυασμός 2 συνδυασμός

20 Παράδειγμα 17.1 … ΕΡΜΗΝΕΥΣΤΕ H 0 απορρίπτεται εάν T  Αφού T = 9, δεν υπάρχει επαρκής μαρτυρία να συμπεράνουμε ότι ο πληθυσμός 1 τοποθετείται στα αριστερά του πληθυσμού 2, με 5% επίπεδο σημαντικότητας.

21 X P(T ≤ 6) = 1/20 =.05 Έτσι η κριτική τιμή του T είναι 6 Αφού T=9 < T Κριτική =6, δεν μπορούμε να απορρίψουμε H 0 … Δειγματοληπτική Κατανομή του T με δύο Δείγματα Μεγέθους 3

22 Κριτικές Τιμές του Ελέγχου Άθροισης Βαθμών Wilcoxon

23 Κριτικές τιμές του Ελέγχου Άθροισης Βαθμών Wilcoxon α =.025 για μονό πλευρο έλεγχο, ή α =.05 για δί πλευρο έλεγχο Χρησιμοποιώντας τον πίνακα: Για δύο δοθέντα δείγματα μεγέθους n 1 και n 2, P(T T U )=  Για έναν δίπλευρο έλεγχο: P( T 25) =.025 εάν n 1 =4 και n 2 =4. Για έναν μονόπλευρο έλεγχο: P( T 25) =.05 εάν n 1 =4 και n 2 = Ένας παρόμοιος πίνακας υπάρχει για α =.05 (μονόπλευρος έλεγχος) και α =.10 (δίπλευρος έλεγχος) T L T U T L T U T L T U T L T U

24 Κριτικές Τιμές του Ελέγχου Άθροισης Βαθμών Wilcoxon

25 Κριτικές Τιμές: του Ελέγχου Άθροισης Βαθμών Wilcoxon … Για μεγέθη δειγμάτων μικρότερων των 10 παρατηρήσεων (σε κάθε δείγμα), αναφερόμαστε στις Κριτικές Τιμές του Πίνακα για τον έλεγχο Wilcoxon Για μεγέθη δειγμάτων μεγαλύτερων των 10 παρατηρήσεων, ο στατιστικός έλεγχος είναι προσεγγιστικά κανονικά κατανεμημένο με: Μέσο: Τυπική Απόκλιση: n i =μέγεθος του δείγματος i, i=1,2 Έτσι:

26 Έλεγχος Άθροισης Βαθμών Wilcoxon για δείγματα με n > 10 Ο στατιστικός έλεγχος είναι προσεγγιστικά κανονικά κατανεμημένα με τις ακόλουθες παραμέτρους: n 1 (n 1 + n 2 + 1) 2 E(T) = Επομένως, Z = T - E(T)  T

27 Παράδειγμα 17.2… Μία εταιρία φαρμάκων δοκιμάζει ένα φάρμακο για τον πόνο και 30 άνθρωποι επιλέχθηκαν τυχαία. Στους μισούς χορηγήθηκε το νέο φάρμακο και στους υπόλοιπους ασπιρίνη. Μετά την χορήγηση του φαρμάκου τους ζητήθηκε να βαθμολογήσουν την αποτελεσματικότητα του φαρμάκου σε κλίμακα από 1 ως 5 (επομένως έχουμε διατακτικά δεδομένα): 5 = Το φάρμακο ήταν πολύ αποτελεσματικό. 4 = Το φάρμακο ήταν αρκετά αποτελεσματικό. 3 = Το φάρμακο ήταν κάπως αποτελεσματικό. 2 = Το φάρμακο ήταν ελαφρώς αποτελεσματικό. 1 = Το φάρμακο δεν ήταν καθόλου αποτελεσματικό.

28 Παράδειγμα 17.2… Τα δεδομένα καταγράφηκαν. Μπορούμε να συμπεράνουμε (με 5% σημαντικότητα) ότι το νέο φάρμακο για τον πόνο κρίνεται να είναι πιο αποτελεσματικό; Είναι σημαντικό να σημειώσουμε εδώ ότι «5» είναι ένας καλός βαθμός και επομένως το φάρμακο είναι αποτελεσματικό. Θα θέλαμε να βλέπαμε το μέτρο θέσης του φαρμάκου να είναι «μεγαλύτερο από» το μέτρο θέσης της ασπιρίνης, επομένως: H 1 : Το μέτρο θέσης του πληθυσμού 1 είναι στα δεξιά του μέτρου θέσης του πληθυσμού 2, και έτσι: H 0 : Τα δύο μέτρα θέσης του πληθυσμού είναι ίσα. ΑΝΑΓΝΩΡΙΣΤΕ Νέο φάρμακο: 3, 5, 4, 3, 2, 5, 1, 4, 5, 3, 3, 5, 5, 5, 4 Ασπιρίνη: 4, 1, 3, 2, 4, 1, 3, 4, 2, 2, 2, 4, 3, 4, 5

29 Παράδειγμα 17.2… Τα δεδομένα είναι ως εξής: ΑΝΑΓΝΩΡΙΣΤΕ Αυτοί οι τρεις άσσοι θα είχαν βαθμούς 1, 2, & 3 — τους αναθέτουμε τον μέσο όρο ( )/3 = 2 Αυτά τα πέντε δυάρια θα είχαν τους βαθμούς 4,5,6,7, & 8 — ξανά, παίρνουμε τον μέσο όρο ( )/5 = 6 και έτσι συνεχίζουμε …

30 Παράδειγμα 17.2… ΑΝΑΓΝΩΡΙΣΤΕ Νέο φάρμακοΒαθμόςΑσπιρίνηΒαθμός Συνολικός Βαθμός€ T 1 = 276.5Συνολικός Βαθμός T 2 = 188.5

31 Παράδειγμα 17.2… Το άθροισμα βαθμών για το νέο φάρμακο είναι T 1 =276.5, και το άθροισμα βαθμών για την ασπιρίνη: T 2 =188.5 Τοποθετούμε T= T 1 =276.5, και αρχίζουμε τους υπολογισμούς … ΥΠΟΛΟΓΙΣΤΕ

32 Παράδειγμα 17.2… Η π-τιμή του ελέγχου είναι: π-τιμή = P(Z > 1.83) = =.0336 (ή Z=1.83 > Z κριτική =1.645) ΥΠΟΛΟΓΙΣΤΕ T - E(T) – Z = = = 1.83 σ T 24.1

33 Αφού Z = 1.83 > Z κριτική =1.645 «Υπάρχει επαρκές μαρτυρία να συμπεράνουμε ότι το νέο φάρμακο κρίνεται να είναι πιο αποτελεσματικό από την ασπιρίνη» ΕΡΜΗΝΕΥΣΤΕ Παράδειγμα 17.2…

34 Προσημικός Έλεγχος και Προσημικός Βαθμολογικός Έλεγχος Wilcoxon (Έλεγχοι σε Πειράματα με Ζεύγη Δειγμάτων) Θα κοιτάξουμε τώρα δύο μη-παραμετρικές τεχνικές (Προσημικός Έλεγχος και Προσημικός Βαθμολογικός Έλεγχος Wilcoxon) που ελέγχουν υποθέσεις σε προβλήματα με τα ακόλουθα χαρακτηριστικά: — Θέλουμε να συγκρίνουμε δύο πληθυσμούς, — Τα δεδομένα είναι διατακτικά ή διαστημικά (μη-κανονικά), — και τα δείγματα είναι ζευγαρωτά. Όπως πριν, θα υπολογίσουμε διαφορές ζευγών και να δουλέψουμε με αυτές …

35 Ο Προσημικός Έλεγχος … Μπορούμε να χρησιμοποιήσουμε τον Προσημικό Έλεγχο όταν εξετάζουμε δύο πληθυσμούς διατακτικών δεδομένων σε πειράματα με ζεύγη δειγμάτων. Για κάθε ζεύγος, παίρνουμε διαφορές και μετράμε τον αριθμό των θετικών και αρνητικών διαφορών. Εάν τα μέτρα θέσης των πληθυσμών είναι τα ίδια, θα αναμέναμε ο αριθμός των θετικών και των αρνητικών διαφορών να είναι ίσος. Εάν είχαμε περισσότερες θετικές από αρνητικές (ή αντιστρόφως) τι θα σήμαινε; Ξανά, πόσο πολύ είναι αρκετό για να κάνει διαφορά;

36 Ο Προσημικός Έλεγχος … Μπορούμε να παρομοιάσουμε τον προσημικό έλεγχο με ένα δυωνυμικό πείραμα, στον οποίο ένα θετικό πρόσημο είναι σαν να έχουμε μία «κεφαλή» σε μία ρίψη ενός νομίσματος. Χρησιμοποιούμε αυτόν τον συμβολισμό μαζί με στατιστικά στοιχεία που αναπτύσσαμε σε προηγούμενα κεφάλαια, και καταλήγουμε με τον τυποποιημένο στατιστικό έλεγχο (υποθέτοντας την μηδενική υπόθεση να είναι αληθής):

37 Στατιστικοί Έλεγχοι και Δειγματοληπτική Κατανομή Όταν τα x είναι διωνυμικά κατανεμημένα και όταν, για επαρκή μεγάλο n, τα x είναι προσεγγιστικά κανονικά κατανεμημένα με μέση τιμή μ = np και τυπική απόκλιση √ np ( 1- p ). Ο τυποποιημένος στατιστικός έλεγχος είναι x - np Z = √ np ( 1- p )

38 Η μηδενική υπόθεση είναι: H 0 = τα δύο μέτρα θέσης των πληθυσμών είναι ίσα ή ισοδύναμα: H 0 : p =.5 (δηλαδή, ίσες αναλογίες των «+» & «-») Έτσι οι στατιστικοί έλεγχοι γίνονται Στατιστικοί Έλεγχοι και Δειγματοληπτική Κατανομή x - np z = √ np ( 1- p ) x -.5n z =.5 √ n =

39 Η κανονική προσέγγιση της δυωνυμικής είναι έγκυρη όταν np ≥ 5 και n ( 1 –p ) ≥ 5 όταν p =. 5 np = n (.5) ≥ 5 και n( 1- p ) = n ( 1 -.5) = n(.5) ≥ 5 Συνεπάγει ότι n πρέπει να είναι μεγαλύτερο του 10. Αυτό είναι μία από τις απαιτήσεις του προσημικού ελέγχου. Στατιστικοί Έλεγχοι και Δειγματοληπτική Κατανομή

40 Υποθέσεις του Προσημικού Ελέγχου … Αφού η μηδενική υπόθεση είναι: H 0 : τα δύο μέτρα θέσης των πληθυσμών είναι ίσα(δηλαδή p=.5) Η εναλλακτική υπόθεση πρέπει να είναι: H 1 : τα δύο μέτρα θέσης των πληθυσμών είναι διαφορετικά Το οποίο είναι ισοδύναμο με: H 1 : p ≠.5

41 Παράδειγμα 17.3 … Σε 25 άτομα ζητηθήκαν να οδηγήσουν ένα Ευρωπαϊκό αυτοκίνητο και να βαθμολογήσουν την άνεση του οδηγήματος. Έπειτα οδήγησαν ένα Αμερικάνικο αυτοκίνητο και βαθμολόγησαν την άνεση του. Οι βαθμολογίες είναι διατακτικές, από 1 – καθόλου άνετο, μέχρι 5 – πολύ άνετο, και έχουμε ζεύγη αφού τα ίδια άτομα οδηγούν και τα δύο είδη αυτοκινήτων. Μπορούμε να συμπεράνουμε (με 5% επίπεδο σημαντικότητας) ότι το Ευρωπαϊκό αυτοκίνητο είναι πιο άνετο από το Αμερικάνικο;

42 Παράδειγμα 17.3 … ΆτομοEυρωπαϊκόΑμερικάνικοΔιαφορά ΆτομοEυρωπαϊκόΑμερικάνικο Διαφορά Βαθμολογίες Άνεσης αρνητικά 18 θετικά 2 ίδια βαθμολογία -2 00

43 Παράδειγμα 17.3 … The data was analyzed… Είχαμε 25 ζεύγη δεδομένων αρχικά, δύο ζεύγη έδωσαν ίσες βαθμολογίες (δηλαδή, Διαφορά=0) έτσι αυτά τα σημεία παραλείπονται, επομένως n=23 Είχαμε 18 θετικές απαντήσεις, έτσι x=18 Είχαμε 5 αρνητικές απαντήσεις. ΥΠΟΛΟΓΙΣΤΕ

44 Παράδειγμα 17.3 … Η π-τιμή είναι P(Z > 2.71) = =.0034, επομένως απορρίπτουμε την H 0 για την εύνοια της H 1, και συμπεραίνουμε: H 1 : τα δύο μέτρα θέσης των πληθυσμών είναι διαφορετικά Ή, στο μοτίβο αυτού του προβλήματος … «Υπάρχει σχετικά δυνατή μαρτυρία να υποδείξουμε ότι το Ευρωπαϊκό αυτοκίνητο προσφέρει πιο άνετη οδική συμπεριφορά από ότι το Αμερικάνικο αυτοκίνητο.» ΕΡΜΗΝΕΥΣΤΕ

45 Έξοδος Υπολογιστή

46 Ελέγχοντας τις Απαιτούμενες Υποθέσεις … Ο προσημικός έλεγχος απαιτεί: Οι πληθυσμοί να είναι παρόμοιοι σε σχήμα και σε άπλωμα: Το μέγεθος του δείγματος υπερβαίνει το 10 (n=23).

47 Προσημικός Βαθμολογικός Έλεγχος Wilcoxon … Θα χρησιμοποιούμε τον Προσημικό Βαθμολογικό Έλεγχο όταν θέλουμε να συγκρίνουμε δύο πληθυσμούς, όχι αναγκαστικά κανονικούς, με διαστημικά δεδομένα, σε ένα πείραμα ζευγών.  Συγκρίνουμε διαφορές ζευγών, αγνοώντας τα μηδενικά.  Ταξινομούμε τις απόλυτες τιμές των διαφορών από την μικρότερη (1) στην μεγαλύτερη (n), παίρνοντας τους μέσους όρους σε ισοβαθμίες. Αθροίζουμε τις ταξινομήσεις (βαθμολογίες) των θετικών διαφορών (T + ) και των αρνητικών διαφορών (T – ).  Χρησιμοποιούμε T=T + ως τον στατιστικό έλεγχο …

48 Προσημικός Βαθμολογικός Έλεγχος Wilcoxon … Τώρα έχουμε μία τιμή από έναν στατιστικό έλεγχο, αλλά με ποια τιμή να την συγκρίνουμε; Για μικρά μεγέθη δείγματος, δηλαδή n ≤ 30, κριτικές τιμές του T μπορούν να διαβαστούν από τον δοθέντος πίνακα. Για μεγάλα μεγέθη δείγματος, δηλαδή για n > 30, το T είναι προσεγγιστικά κανονικά κατανεμημένο, έτσι έχουμε:

49 Κριτικές Τιμές για τον Προσημικό Βαθμολογικό Έλεγχο Wilcoxon

50 Παράδειγμα 17.4… Διαφέρουν οι χρόνοι οδήγησης στον χώρο εργασίας μεταξύ δύο εναλλακτικών προγραμμάτων: α) έναρξη εργασίας στις 8:00 π.μ. και β) ελαστική έναρξη εργασία; Οι ώρες προέλευσης καταγράφονται για 32 εργάτες. Με την ελαστική έναρξη εργασία οι εργαζόμενοι μπορούν να αποφύγουν τις ώρες αιχμής της κυκλοφορίας. Θέλουμε να ελέγξουμε αυτήν την υπόθεση: H 1 : τα δύο μέτρα θέσης πληθυσμών διαφέρουν Έτσι απαιτούμαι: H 0 : τα δύο μέτρα θέσης πληθυσμών είναι ίσα ΑΝΑΓΝΩΡΙΣΤΕ

51 Παράδειγμα 17.4… Εργάτης … 32 Έναρξη στις 8.00 π.μ … 42 Ελαστικό πρόγραμμα … 38 Ώρα προέλευσης Δεδομένα

52 Παράδειγμα 17.4… Τα δεδομένα είναι διαστημικά (χρονικές στιγμές) και αποτελούν ένα πείραμα με ζεύγη. (οι ίδιοι εργάτες, την ίδια μέρα της εβδομάδας – Τετάρτη). Γιατί δεν χρησιμοποιούμε ένα t-test για μ D ; Ένα ιστόγραμμα διαφορών ζευγών αποκαλύπτει μία μη- κανονική κατανομή, και έτσι προτιμούμε μία μη- παραμετρική τεχνική. ΑΝΑΓΝΩΡΙΣΤΕ

53 Εργάτης … 32 Έναρξη στις 8.00 π.μ … 42 Ελαστικό πρόγραμμα … 38 Διαφορά … 4 Διαφοράς … 4 Ώρα προέλευσης Βαθμός … 27.0 Παράδειγμα 17.4… ΥΠΟΛΟΓΙΣΤΕ

54 Παράδειγμα 17.4… ΥΠΟΛΟΓΙΣΤΕ Τα αρχικά Δεδομένα Βαθμοί των θετικών διαφορών… Βαθμοί των αρνητικών διαφορών … Σύνολο βαθμών Ταξινομημένα ως |διαφοράς|

55 Παράδειγμα 17.4… Υπολογίζουμε τον στατιστικό έλεγχο ως εξής … Η περιοχή απόρριψης είναι … ΥΠΟΛΟΓΙΣΤΕ

56 Δεν υπάρχει αρκετή μαρτυρία να συμπεράνουμε ότι οι χρόνοι άφιξης με την ελαστική έναρξη διαφέρουν από τους χρόνους άφιξεις κάτω από το υπάρχων πρόγραμμα ΕΡΜΗΝΕΥΣΤΕ Παράδειγμα 17.4…

57 Έξοδος για Υπολογιστή Παράδειγμα 17.4… Βαθμοί

58 Παράδειγμα 17.4… ΕΡΜΗΝΕΥΣΤΕ Συγκρίνουμε… π-τιμή

59 Δύο ή Περισσότερους Πληθυσμούς

60 Έλεγχος Kruskal-Wallis … Μέχρι τώρα συγκρίναμε μέτρα θέσης δύο πληθυσμών, και τώρα θα συγκρίνουμε δύο ή περισσότερους πληθυσμούς. Ο Kruskal-Wallis έλεγχος εφαρμόζεται σε προβλήματα στα οποία θέλουμε να συγκρίνουμε δύο ή περισσότερους πληθυσμούς ή διατακτικά ή διαστημικά (αλλά μη-κανονικά) δεδομένα από ανεξάρτητα δείγματα. Οι υποθέσεις είναι: H 0 : Τα μέτρα θέσης των k πληθυσμών είναι ίσα. H 1 : Τουλάχιστον δύο μέτρα θέσης πληθυσμού διαφέρουν.

61 Στατιστικός Έλεγχος … Με στόχο να υπολογίσουμε τον Kruskal-Wallis στατιστικό έλεγχο, χρειαζόμαστε να: 1.Βαθμολογούμε όλες τις παρατηρήσεις από την μικρότερη (1) στην μεγαλύτερη (n), και παίρνουμε τους μέσους όρους σε περίπτωση ισοβαθμίας. 2. Υπολογίζουμε αθροίσματα βαθμών για κάθε δείγμα: T 1, T 2, …, T k 3.Τελευταία, υπολογίζουμε τον στατιστικό έλεγχο (συμβολισμένος ως H):

62 Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου: Για μεγέθη δείγματος μεγαλύτερα ή ίσα του 5, ο στατιστικός έλεγχος είναι προσεγγιστικά χ 2 κατανεμημένος με k–1 βαθμούς ελευθερίας. Η περιοχή απόρριψης είναι: H > χ 2 α,k-1 Και η π-τιμή είναι: P ( χ 2 > H )

63 Δειγματοληπτική Κατανομή της H π-τιμή

64 Παράδειγμα 17.5… Μπορούμε να συγκρίνουμε βαθμολογίες (4=καλό … 1=φτωχό) για «ταχύτητα εξυπηρέτησης» σε τρεις βάρδιες σε ένα εστιατόριο ταχείας εξυπηρέτησης; Οι υποθέσεις είναι: H 0 : Τα μέτρα θέσης των τριών πληθυσμών είναι ίσα. (δηλαδή, δεν υπάρχει διαφορά στην ταχύτητα εξυπηρέτησης μεταξύ των βαρδιών), και H 1 : Τουλάχιστον δύο μέτρα θέσης πληθυσμών διαφέρουν. Αξιολογήσεις (βαθμολογίες) πελατών καταγράφονται … ΑΝΑΓΝΩΡΙΣΤΕ

65 Παράδειγμα 17.5… 10 πελάτες επιλέχθηκαν τυχαία από κάθε βάρδια 4:00 – 12:00 μ.μ :00 - 8:00 π.μ :00 π.μ. - 4:00 μ.μ

66 Παράδειγμα 17.5… Ένας τρόπος για να επιλύσουμε το πρόβλημα είναι να βάλουμε τα αρχικά δεδομένα, σε στήλες και να τα ταξινομήσουμε σύμφωνα με τις αξιολογήσεις … ΥΠΟΛΟΓΙΣΤΕ Ταξινομημένα ανά βαθμολογία

67 Παράδειγμα 17.5… Βάζουμε τα δεδομένα σε στήλες, τα ταξινομούμε ανά βαθμούς από το 1 ως το 30, παίρνουμε τον μέσο όρο των βαθμών για την ίδια απάντηση, τοποθετούμε τα αποτελέσματα ανά βάρδια και υπολογίζουμε τα σύνολα των βαθμών ανά βάρδια … ΥΠΟΛΟΓΙΣΤΕ

68 Παράδειγμα 17.5… ΥΠΟΛΟΓΙΣΤΕ Η κριτική τιμή του χ 2 (5% σημαντικότητα και k–1=2 βαθμούς ελευθερίας) είναι , επομένως δεν υπάρχει μαρτυρία να απορρίψουμε την H 0. = 2.64

69 Παράδειγμα 17.5 … «Δεν υπάρχει μαρτυρία να συμπεράνουμε ότι υπάρχουν διαφορές στις ταχύτητες εξυπηρέτησης των τριών βαρδιών, δηλαδή και οι τρεις βάρδιες βαθμολογούνται ισοδύναμα, και οποιαδήποτε πρωτοβουλία για την βελτίωση εξυπηρέτησης θα πρέπει να εφαρμοστεί και στις τρεις βάρδιες» ΕΡΜΗΝΕΥΣΤΕ compare… p-value

70 Ο Έλεγχος Friedman… Ο έλεγχος Friedman είναι μία τεχνική που χρησιμοποιείται για να συγκρίνουμε δύο ή περισσότερους πληθυσμούς για διατακτικά ή διαστημικά (μη-κανονικά) δεδομένα γενικευμένα από ένα πείραμα με ζεύγη. Οι υποθέσεις είναι οι ίδιες όπως πριν: H 0 : Τα μέτρα θέσης των k πληθυσμών είναι ίσα. H 1 : Τουλάχιστον δύο μέτρα θέσης πληθυσμού διαφέρουν.

71 Έλεγχος Friedman – Στατιστικός Έλεγχος … Αφού είναι ένα πείραμα με ζεύγη, πρώτα βαθμολογούμε κάθε παρατήρηση εντός του κάθε τεμαχίου από το μικρότερο στο μεγαλύτερο (δηλαδή, από 1 ως k), και παίρνουμε τον μέσο όρο των ισοπαλιών. Ύστερα υπολογίζουμε τα σύνολα των βαθμών: T 1, T 2, …, T k. Έπειτα υπολογίζουμε τον στατιστικό έλεγχο:

72 Έλεγχος Friedman – Στατιστικός Έλεγχος … Αυτός ο στατιστικός έλεγχος είναι προσεγγιστικά χ 2 με k–1 βαθμούς ελευθερίας (εξασφαλίζοντας κάθε k ή b ≥ 5). Η περιοχή απόρριψης και η π-τιμή είναι:

73 Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου

74 Παράδειγμα 17.6… Τέσσερεις διευθυντές αξιολογούν και βαθμολογούν υποψήφιους για μία εργασία σε μία κλίμακα από 1 (καλό) ως 5 (όχι καλό). Υπήρξαν παράπονα ότι η διαδικασία δεν είναι δίκαιη. Έχει να κάνει αυτό με το γεγονός ότι όλοι οι διευθυντές βαθμολογούν τους υποψήφιους ισοδύναμα ή όχι; Δηλαδή: ΑΝΑΓΝΩΡΙΣΤΕ

75 H 0 : Τα μέτρα θέσης των τεσσάρων πληθυσμών είναι ίσα. (δηλαδή όλοι οι διευθυντές βαθμολογούν τους υποψηφίους με παραπλήσιο τρόπο) H 1 : Τουλάχιστον δύο μέτρα θέσης πληθυσμών διαφέρουν. (δηλαδή υπάρχει κάποια διαφωνία μεταξύ των βαθμών των διευθυντών) Η περιοχή απόρριψης είναι F r > χ 2 α,k-1 = χ 2.05,3 = Παράδειγμα 17.6… ΑΝΑΓΝΩΡΙΣΤΕ

76 Παράδειγμα 17.6… Τα δεδομένα είναι ως εξής: ΥΠΟΛΟΓΙΣΤΕ Υπάρχουν k=4 πληθυσμοί (διευθυντές) και b=8 τεμάχια (υποψήφιοι) σε αυτό το πρόβλημα.

77 Παράδειγμα 17.6… Υποψήφιος #1 για παράδειγμα, έλαβε άριστη βαθμολογία από τον διευθυντή  και πολύ καλές βαθμολογίες από τους άλλους τρεις. Υποψήφιος #7 έλαβε άριστη βαθμολογία από τον διευθυντή  και πολύ κακές βαθμολογίες από τους άλλους τρεις … ΥΠΟΛΟΓΙΣΤΕ

78 Παράδειγμα 17.6… «βαθμολογείται κάθε παρατήρηση εντός κάθε τεμαχίου από το μικρότερο στο μεγαλύτερο (δηλαδή από 1 ως k), δίνεται ο μέσος όρος για ισοβαθμίες» … Για παράδειγμα, θεωρήστε την περίπτωση του υποψηφίου #2: ΥΠΟΛΟΓΙΣΤΕ Διευθυντής  Διευθυντής  Διευθυντής  Διευθυντής  Αρχικοί Βαθμοί 4232 σύνολο «συνήθεις βαθμοί» Βαθμοί με μέσους όρους ισοβαθμιών 4 (1+2)/2= (1+2)/2= σύνολο = … + k

79 Παράδειγμα 17.6… Υπολογίστε το σύνολο των βαθμών: T 1, T 2, …, T k και του στατιστικού ελέγχου … ΥΠΟΛΟΓΙΣΤΕ

80 Παράδειγμα 17.6… ΥΠΟΛΟΓΙΣΤΕ Η περιοχή απόρριψης είναι: Fr > χ 2 α,k-1 = χ 2.05,3 = =

81 Παράδειγμα 17.6… Η τιμή του ελέγχου Friedman είναι συγκρίνεται με την κριτική τιμή του χ 2 (με 5% σημαντικότητας και 3 βαθμούς ελευθερίας) που είναι: Έτσι, υπάρχει επαρκής μαρτυρία να απορρίψουμε την H 0 για την εύνοια της H 1 ΕΡΜΗΝΕΥΣΤΕ Φαίνεται ότι οι αξιολογήσεις των διευθυντών για τους υποψηφίους πραγματικά διαφέρουν


Κατέβασμα ppt "Μη-Παραμετρική Στατιστική Κεφάλαιο 17. Μη-Παραμετρική Στατιστική … Σε αυτό το κεφάλαιο αναπτύσσονται στατιστικές τεχνικές για διατακτικά δεδομένα. Θυμηθείτε:"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google