Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Μη-Παραμετρική Στατιστική

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Μη-Παραμετρική Στατιστική"— Μεταγράφημα παρουσίασης:

1 Μη-Παραμετρική Στατιστική
Κεφάλαιο 17 Μη-Παραμετρική Στατιστική

2 Μη-Παραμετρική Στατιστική …
Σε αυτό το κεφάλαιο αναπτύσσονται στατιστικές τεχνικές για διατακτικά δεδομένα. Θυμηθείτε: όταν τα δεδομένα είναι διατακτικά, ο μέσος δεν είναι κατάλληλο μέτρο κεντρικής θέσης (population locations). Σε αναπλήρωση, θα ελέγξουμε χαρακτηριστικά των πληθυσμών χωρίς να αναφερόμαστε σε συγκεκριμένες παραμέτρους, από όπου προκύπτει και ο όρος μη-παραμετρική. Αντί να ελέγχουμε εάν οι μέσοι διαφέρουν, θα ελέγχουμε εάν p μέτρα θέσης του πληθυσμού διαφέρουν …

3 Μη-Παραμετρική Στατιστική …
Οι έλεγχοι που εξετάσαμε μέχρι τώρα μπορούν να εφαρμοστούν μόνο όταν τα δεδομένα είναι κανονικά ή προσεγγιστικά κανονικά. Εάν η παραπάνω υπόθεση δεν ικανοποιείται μπορούμε να χρησιμοποιήσουμε μη-παραμετρική στατιστική, επίσης γνωστή ως στατιστική χωρίς κατανομές (distribution free statistics).

4 Μη-Παραμετρική Στατιστική …
Οι τεχνικές που πρόκειται να μελετήσουμε μπορούν να χρησιμοποιηθούν όταν τα δεδομένα είναι διαστημικά και η απαιτούμενη υπόθεση της κανονικότητας δεν ικανοποιείται. Σε τέτοιες περιπτώσεις θα μεταχειριστούμε τα διαστημικά δεδομένα σαν να ήταν διατακτικά.

5 Κατανομή των πληθυσμών όταν τα μέτρα θέσης τους είναι τα ίδια

6 Μέτρα Θέσης Πληθυσμού …
Το μέτρο θέσης του πληθυσμού 1 είναι στα αριστερά του μέτρου θέσης του πληθυσμού 2 Το μέτρο θέσης του πληθυσμού 1 είναι στα δεξιά του μέτρου θέσης του πληθυσμού 2 πληθυσμός 1 πληθυσμός 2 πληθυσμός 2 πληθυσμός 1

7 Αντικειμενικός Στόχος του Προβλήματος…
Όταν ο αντικειμενικός στόχος του προβλήματος είναι να συγκρίνουμε δύο πληθυσμούς, η μηδενική υπόθεση είναι: H0: Τα δύο μέτρα θέσης του πληθυσμού είναι τα ίδια. Η εναλλακτική υπόθεση μπορεί να πάρει μία από τις ακόλουθες τρεις μορφές: H1: Το μέτρο θέσης του πληθυσμού 1 είναι διαφορετικό από το μέτρο θέσης του πληθυσμού 2. H1: Το μέτρο θέσης του πληθυσμού 1 είναι στα δεξιά του μέτρο θέσης του πληθυσμού 2. H1: Το μέτρο θέσης του πληθυσμού 1 είναι στα αριστερά του μέτρο θέσης του πληθυσμού 2.

8 Έλεγχος Άθροισης Βαθμών Wilcoxon
Τα χαρακτηριστικά του προβλήματος του ελέγχου είναι: Ο αντικειμενικός στόχος του προβλήματος είναι η σύγκριση δύο πληθυσμών. Τα δεδομένα είναι διατακτικά (ordinal) ή διαστημικά (interval), αλλά όχι αναγκαστικά κανονικά. Τα δείγματα είναι ανεξάρτητα.

9 Έλεγχος Άθροισης Βαθμών Wilcoxon – Παράδειγμα
Παράδειγμα 21.1 Βασισμένοι στα δύο δείγματα που παρουσιάζονται παρακάτω, μπορούμε να συμπεραίνουμε, με 5% επίπεδο σημαντικότητας, ότι το μέτρο θέσης του πληθυσμού 1 είναι στα αριστερά του πληθυσμού 2; Δείγμα 1: 22, 23, 20; Δείγμα 2: 18, 27, 26; Οι υποθέσεις είναι: H0: Τα δύο μέτρα θέσης των πληθυσμών είναι ίσα. H1: το μέτρο θέσης του πληθυσμού 1 είναι στα αριστερά του πληθυσμού 2.

10 Γραφική Παρουσίαση - Γιατί χρησιμοποιούμε το άθροισμα των βαθμών για να ελέγξουμε μέτρα θέσης;
Εάν τα μέτρα θέσης των δύο πληθυσμών είναι περίπου ίσα, (η μηδενική υπόθεση είναι αληθής) θα περιμέναμε οι βαθμοί να είναι ομοίως απλωμένα μεταξύ των δειγμάτων. Σε αυτή την περίπτωση το άθροισμα των βαθμών για τα δύο δείγματα θα είναι κοντά το ένα με το άλλο. Άθροισμα βαθμών = 37 Άθροισμα βαθμών = 41 Οι δύο υποθετικοί πληθυσμοί και τα αντίστοιχα δείγματα παρουσιάζονται, ο ΠΡΑΣΙΝΟΣ πληθυσμός και ο ΡΟΖ πληθυσμός. Πληθυσμοί Ας βαθμολογήσουμε τις παρατηρήσεις των δύο δειγμάτων μαζί 7 6 9 2 1 3 4 5 8 10 11 12

11 Γραφική Παρουσίαση - Γιατί χρησιμοποιούμε το άθροισμα των βαθμών για να ελέγξουμε μέτρα θέσης;
Επιτρέπουμε τον ΠΡΑΣΙΝΟ πληθυσμό να μετατοπιστεί στα αριστερά του ΡΟΖ πληθυσμού.

12 Γραφική Παρουσίαση - Γιατί χρησιμοποιούμε το άθροισμα των βαθμών για να ελέγξουμε μέτρα θέσης;
Άθροισμα βαθμών = 37 Άθροισμα βαθμών = 41 Άθροισμα βαθμών = 38 Άθροισμα βαθμών = 40 Άθροισμα βαθμών = 45 Άθροισμα βαθμών = 33 1 3 4 5 8 10 11 12 9 2 9 2 6 7 7 6 Το πράσινο δείγμα αναμένεται να μετακινηθεί επίσης στα αριστερά. Ως αποτέλεσμα, αρκετές παρατηρήσεις ανταλλάσουν θέση. Τι συμβαίνει στο άθροισμά των βαθμών;

13 Γραφική Παρουσίαση - Γιατί χρησιμοποιούμε το άθροισμα των βαθμών για να ελέγξουμε μέτρα θέσης;
Άθροισμα βαθμών = 37 Άθροισμα βαθμών = 41 Άθροισμα βαθμών = 38 Άθροισμα βαθμών = 40 Άθροισμα βαθμών = 45 Άθροισμα βαθμών = 33 1 2 3 4 5 6 7 8 9 10 11 12 Το «πράσινο» άθροισμα μειώνεται, και το «ροζ» άθροισμα αυξάνει. Αλλάζοντας την σχετική θέση των δύο πληθυσμών επηρεάζει το άθροισμα των βαθμών των δύο δειγμάτων που αναμείχθηκαν.

14 Έλεγχος Άθροισης Βαθμών Wilcoxon – Παράδειγμα
Παράδειγμα 17.1 – (συνέχεια) Στατιστικός έλεγχος 1. Βαθμολόγηση όλων των έξι παρατηρήσεων (1 για το μικρότερο). Δείγμα 1 22 23 20 Δείγμα 2 18 27 26 Βαθμός 1 6 5 3 4 2 2. Υπολογίστε το Άθροισμα των βαθμών: 9 βαθμών: 12 3. Ας ορίσουμε ως T = 9 να είναι ο στατιστικός έλεγχος (Αυθαίρετα ορίζουμε τον στατιστικό έλεγχο ως το άθροισμα των βαθμών του δείγματος 1.)

15 Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου
Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου Μία μικρή τιμή του T υποδεικνύει ότι οι μικρότερες παρατηρήσεις ανήκουν στο δείγμα 1 οι οποίες επιλέχθηκαν από τον πληθυσμό 1 — αλλά πόσο μικρό είναι «μικρό»; Είναι 9 αρκετά «μικρό»; Έχουμε τιμή για τον στατιστικό έλεγχο, T=9. Χρειαζόμαστε να την συγκρίνουμε με κάποια κριτική τιμή του «T» ώστε να γνωρίζουμε αν ανήκει στην περιοχή απόρριψης για H0 (ή όχι). Και έπειτα, πως είναι η δειγματοληπτική κατανομή των «βαθμών»;

16 Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου
Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου Μπορούμε να κατασκευάσουμε την δειγματοληπτική κατανομή του στατιστικού ελέγχου κατά τον ίδιο τρόπο που σχεδιάζουμε ιστογράμματα για τα αποτελέσματα των ρίψεων δύων ή τριών ζαριών … Απαριθμήστε όλους τους δυνατούς συνδυασμούς των βαθμών Υπολογίστε αθροίσματα βαθμών για τους συνδυασμούς Η πιθανότητα για κάθε άθροισμα βαθμών είναι ο αριθμός των συμβάντων διαιρούμενος με τον συνολικό αριθμό των συνδυασμών …

17 ENUMERATE

18 Δειγματοληπτική Κατανομή του T με Δύο Δείγματα Μεγέθους 3
ΥΠΟΛΟΓΙΣΤΕ ΠΙΘΑΝΟΤΗΤΕΣ Δειγματοληπτική Κατανομή του T με Δύο Δείγματα Μεγέθους 3

19 Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου
Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου 1.Απαριθμήστε 2. Υπολογίστε 3. Πιθανότητες … 1 συνδυασμός 2 συνδυασμός 3 συνδυασμός Σύνολο 20 συνδυασμών

20 Παράδειγμα 17.1 … ΕΡΜΗΝΕΥΣΤΕ H0 απορρίπτεται εάν T£6. Αφού T = 9, δεν υπάρχει επαρκής μαρτυρία να συμπεράνουμε ότι ο πληθυσμός 1 τοποθετείται στα αριστερά του πληθυσμού 2, με 5% επίπεδο σημαντικότητας.

21 Δειγματοληπτική Κατανομή του T με δύο Δείγματα Μεγέθους 3
P(T ≤ 6) = 1/20 = .05 Έτσι η κριτική τιμή του T είναι 6 Αφού T=9 < TΚριτική=6, δεν μπορούμε να απορρίψουμε H0… X

22 Κριτικές Τιμές του Ελέγχου Άθροισης Βαθμών Wilcoxon

23 Κριτικές τιμές του Ελέγχου Άθροισης Βαθμών Wilcoxon
α = .025 για μονόπλευρο έλεγχο, ή α = .05 για δίπλευρο έλεγχο TL TU TL TU TL TU TL TU Για έναν δίπλευρο έλεγχο: P(T<11) = P(T>25) = .025 εάν n1=4 και n2=4. Για έναν μονόπλευρο έλεγχο: P(T<11) = P(T>25) = .05 εάν n1=4 και n2=4. Χρησιμοποιώντας τον πίνακα: Για δύο δοθέντα δείγματα μεγέθους n1 και n2, P(T<TL)=P(T>TU)= a. Ένας παρόμοιος πίνακας υπάρχει για α = .05 (μονόπλευρος έλεγχος) και α = .10 (δίπλευρος έλεγχος)

24 Κριτικές Τιμές του Ελέγχου Άθροισης Βαθμών Wilcoxon

25 Κριτικές Τιμές: του Ελέγχου Άθροισης Βαθμών Wilcoxon …
Για μεγέθη δειγμάτων μεγαλύτερων των 10 παρατηρήσεων, ο στατιστικός έλεγχος είναι προσεγγιστικά κανονικά κατανεμημένο με: Μέσο: Τυπική Απόκλιση: Έτσι: ni=μέγεθος του δείγματος i, i=1,2

26 Έλεγχος Άθροισης Βαθμών Wilcoxon για δείγματα με n > 10
Ο στατιστικός έλεγχος είναι προσεγγιστικά κανονικά κατανεμημένα με τις ακόλουθες παραμέτρους: n1(n1 + n2 + 1) 2 E(T) = Επομένως, Z = T - E(T) sT

27 Παράδειγμα 17.2… Μία εταιρία φαρμάκων δοκιμάζει ένα φάρμακο για τον πόνο και 30 άνθρωποι επιλέχθηκαν τυχαία. Στους μισούς χορηγήθηκε το νέο φάρμακο και στους υπόλοιπους ασπιρίνη. Μετά την χορήγηση του φαρμάκου τους ζητήθηκε να βαθμολογήσουν την αποτελεσματικότητα του φαρμάκου σε κλίμακα από 1 ως 5 (επομένως έχουμε διατακτικά δεδομένα): 5 = Το φάρμακο ήταν πολύ αποτελεσματικό. 4 = Το φάρμακο ήταν αρκετά αποτελεσματικό. 3 = Το φάρμακο ήταν κάπως αποτελεσματικό. 2 = Το φάρμακο ήταν ελαφρώς αποτελεσματικό. 1 = Το φάρμακο δεν ήταν καθόλου αποτελεσματικό.

28 Παράδειγμα 17.2… ΑΝΑΓΝΩΡΙΣΤΕ Τα δεδομένα καταγράφηκαν. Μπορούμε να συμπεράνουμε (με 5% σημαντικότητα) ότι το νέο φάρμακο για τον πόνο κρίνεται να είναι πιο αποτελεσματικό; Είναι σημαντικό να σημειώσουμε εδώ ότι «5» είναι ένας καλός βαθμός και επομένως το φάρμακο είναι αποτελεσματικό. Θα θέλαμε να βλέπαμε το μέτρο θέσης του φαρμάκου να είναι «μεγαλύτερο από» το μέτρο θέσης της ασπιρίνης, επομένως: H1: Το μέτρο θέσης του πληθυσμού 1 είναι στα δεξιά του μέτρου θέσης του πληθυσμού 2, και έτσι: H0: Τα δύο μέτρα θέσης του πληθυσμού είναι ίσα. Νέο φάρμακο: 3, 5, 4, 3, 2, 5, 1, 4, 5, 3, 3, 5, 5, 5, 4 Ασπιρίνη: 4, 1, 3, 2, 4, 1, 3, 4, 2, 2, 2, 4, 3, 4, 5

29 Παράδειγμα 17.2… Τα δεδομένα είναι ως εξής: ΑΝΑΓΝΩΡΙΣΤΕ
Αυτοί οι τρεις άσσοι θα είχαν βαθμούς 1, 2, & 3 — τους αναθέτουμε τον μέσο όρο ( )/3 = 2 Αυτά τα πέντε δυάρια θα είχαν τους βαθμούς 4,5,6,7, & 8 — ξανά, παίρνουμε τον μέσο όρο ( )/5 = 6 και έτσι συνεχίζουμε …

30 Παράδειγμα 17.2… ΑΝΑΓΝΩΡΙΣΤΕ Νέο φάρμακο Βαθμός Ασπιρίνη 3 12 4 19.5 5
27 1 2 6 Συνολικός Βαθμός€ T1 = 276.5 Συνολικός Βαθμός T2 = 188.5

31 Παράδειγμα 17.2… ΥΠΟΛΟΓΙΣΤΕ Το άθροισμα βαθμών για το νέο φάρμακο είναι T1=276.5, και το άθροισμα βαθμών για την ασπιρίνη: T2=188.5 Τοποθετούμε T= T1=276.5, και αρχίζουμε τους υπολογισμούς …

32 Η π-τιμή του ελέγχου είναι:
Παράδειγμα 17.2… ΥΠΟΛΟΓΙΣΤΕ T - E(T) – 232.5 Z = = = 1.83 σT Η π-τιμή του ελέγχου είναι: π-τιμή = P(Z > 1.83) = = .0336 (ή Z=1.83 > Zκριτική=1.645)

33 Παράδειγμα 17.2… Αφού Z = 1.83 > Zκριτική =1.645
ΕΡΜΗΝΕΥΣΤΕ Αφού Z = 1.83 > Zκριτική =1.645 «Υπάρχει επαρκές μαρτυρία να συμπεράνουμε ότι το νέο φάρμακο κρίνεται να είναι πιο αποτελεσματικό από την ασπιρίνη»

34 Προσημικός Έλεγχος και Προσημικός Βαθμολογικός Έλεγχος Wilcoxon (Έλεγχοι σε Πειράματα με Ζεύγη Δειγμάτων) Θα κοιτάξουμε τώρα δύο μη-παραμετρικές τεχνικές (Προσημικός Έλεγχος και Προσημικός Βαθμολογικός Έλεγχος Wilcoxon) που ελέγχουν υποθέσεις σε προβλήματα με τα ακόλουθα χαρακτηριστικά: — Θέλουμε να συγκρίνουμε δύο πληθυσμούς, — Τα δεδομένα είναι διατακτικά ή διαστημικά (μη-κανονικά), — και τα δείγματα είναι ζευγαρωτά. Όπως πριν, θα υπολογίσουμε διαφορές ζευγών και να δουλέψουμε με αυτές …

35 Ο Προσημικός Έλεγχος … Μπορούμε να χρησιμοποιήσουμε τον Προσημικό Έλεγχο όταν εξετάζουμε δύο πληθυσμούς διατακτικών δεδομένων σε πειράματα με ζεύγη δειγμάτων. Για κάθε ζεύγος, παίρνουμε διαφορές και μετράμε τον αριθμό των θετικών και αρνητικών διαφορών. Εάν τα μέτρα θέσης των πληθυσμών είναι τα ίδια, θα αναμέναμε ο αριθμός των θετικών και των αρνητικών διαφορών να είναι ίσος. Εάν είχαμε περισσότερες θετικές από αρνητικές (ή αντιστρόφως) τι θα σήμαινε; Ξανά, πόσο πολύ είναι αρκετό για να κάνει διαφορά;

36 Ο Προσημικός Έλεγχος … Μπορούμε να παρομοιάσουμε τον προσημικό έλεγχο με ένα δυωνυμικό πείραμα, στον οποίο ένα θετικό πρόσημο είναι σαν να έχουμε μία «κεφαλή» σε μία ρίψη ενός νομίσματος. Χρησιμοποιούμε αυτόν τον συμβολισμό μαζί με στατιστικά στοιχεία που αναπτύσσαμε σε προηγούμενα κεφάλαια, και καταλήγουμε με τον τυποποιημένο στατιστικό έλεγχο (υποθέτοντας την μηδενική υπόθεση να είναι αληθής):

37 Στατιστικοί Έλεγχοι και Δειγματοληπτική Κατανομή
Όταν τα x είναι διωνυμικά κατανεμημένα και όταν, για επαρκή μεγάλο n, τα x είναι προσεγγιστικά κανονικά κατανεμημένα με μέση τιμή μ = np και τυπική απόκλιση √ np ( 1- p ) . Ο τυποποιημένος στατιστικός έλεγχος είναι x - np Z = √ np ( 1- p )

38 Στατιστικοί Έλεγχοι και Δειγματοληπτική Κατανομή
Στατιστικοί Έλεγχοι και Δειγματοληπτική Κατανομή Η μηδενική υπόθεση είναι: H0 = τα δύο μέτρα θέσης των πληθυσμών είναι ίσα ή ισοδύναμα: H0: p = .5 (δηλαδή, ίσες αναλογίες των «+» & «-») Έτσι οι στατιστικοί έλεγχοι γίνονται x - np z = √ np ( 1- p ) x - .5n z = .5 √ n =

39 Στατιστικοί Έλεγχοι και Δειγματοληπτική Κατανομή
Στατιστικοί Έλεγχοι και Δειγματοληπτική Κατανομή Η κανονική προσέγγιση της δυωνυμικής είναι έγκυρη όταν np ≥ 5 και n ( 1 –p ) ≥ 5 όταν p = .5 np = n (.5) ≥ 5 και n( 1- p ) = n ( ) = n(.5) ≥ 5 Συνεπάγει ότι n πρέπει να είναι μεγαλύτερο του 10. Αυτό είναι μία από τις απαιτήσεις του προσημικού ελέγχου.

40 Υποθέσεις του Προσημικού Ελέγχου …
Υποθέσεις του Προσημικού Ελέγχου … Αφού η μηδενική υπόθεση είναι: H0: τα δύο μέτρα θέσης των πληθυσμών είναι ίσα (δηλαδή p=.5) Η εναλλακτική υπόθεση πρέπει να είναι: H1: τα δύο μέτρα θέσης των πληθυσμών είναι διαφορετικά Το οποίο είναι ισοδύναμο με: H1: p ≠ .5

41 Παράδειγμα … Σε 25 άτομα ζητηθήκαν να οδηγήσουν ένα Ευρωπαϊκό αυτοκίνητο και να βαθμολογήσουν την άνεση του οδηγήματος. Έπειτα οδήγησαν ένα Αμερικάνικο αυτοκίνητο και βαθμολόγησαν την άνεση του. Οι βαθμολογίες είναι διατακτικές, από 1 – καθόλου άνετο, μέχρι 5 – πολύ άνετο, και έχουμε ζεύγη αφού τα ίδια άτομα οδηγούν και τα δύο είδη αυτοκινήτων. Μπορούμε να συμπεράνουμε (με 5% επίπεδο σημαντικότητας) ότι το Ευρωπαϊκό αυτοκίνητο είναι πιο άνετο από το Αμερικάνικο;

42 Παράδειγμα 17.3 … Βαθμολογίες Άνεσης -1 -1 -2 -1 -1 5 αρνητικά
Παράδειγμα … Βαθμολογίες Άνεσης Βαθμολογίες Άνεσης Άτομο Eυρωπαϊκό Αμερικάνικο Διαφορά Άτομο Αμερικάνικο Διαφορά 1 4 5 2 14 3 15 16 17 6 18 7 8 20 9 21 10 11 23 12 -1 -1 -2 -1 -1 5 αρνητικά 18 θετικά 2 ίδια βαθμολογία

43 Είχαμε 5 αρνητικές απαντήσεις. Είχαμε 18 θετικές απαντήσεις, έτσι x=18
Παράδειγμα 17.3 … ΥΠΟΛΟΓΙΣΤΕ Είχαμε 5 αρνητικές απαντήσεις. The data was analyzed… Είχαμε 25 ζεύγη δεδομένων αρχικά, δύο ζεύγη έδωσαν ίσες βαθμολογίες (δηλαδή, Διαφορά=0) έτσι αυτά τα σημεία παραλείπονται, επομένως n=23 Είχαμε 18 θετικές απαντήσεις, έτσι x=18

44 Παράδειγμα 17.3 … ΕΡΜΗΝΕΥΣΤΕ
Η π-τιμή είναι P(Z > 2.71) = = , επομένως απορρίπτουμε την H0 για την εύνοια της H1, και συμπεραίνουμε: H1: τα δύο μέτρα θέσης των πληθυσμών είναι διαφορετικά Ή, στο μοτίβο αυτού του προβλήματος … «Υπάρχει σχετικά δυνατή μαρτυρία να υποδείξουμε ότι το Ευρωπαϊκό αυτοκίνητο προσφέρει πιο άνετη οδική συμπεριφορά από ότι το Αμερικάνικο αυτοκίνητο.»

45 Έξοδος Υπολογιστή

46 Ελέγχοντας τις Απαιτούμενες Υποθέσεις …
Ελέγχοντας τις Απαιτούμενες Υποθέσεις … Ο προσημικός έλεγχος απαιτεί:  Οι πληθυσμοί να είναι παρόμοιοι σε σχήμα και σε άπλωμα:  Το μέγεθος του δείγματος υπερβαίνει το 10 (n=23).

47 Προσημικός Βαθμολογικός Έλεγχος Wilcoxon…
Θα χρησιμοποιούμε τον Προσημικό Βαθμολογικό Έλεγχο όταν θέλουμε να συγκρίνουμε δύο πληθυσμούς, όχι αναγκαστικά κανονικούς, με διαστημικά δεδομένα, σε ένα πείραμα ζευγών. j Συγκρίνουμε διαφορές ζευγών, αγνοώντας τα μηδενικά. k Ταξινομούμε τις απόλυτες τιμές των διαφορών από την μικρότερη (1) στην μεγαλύτερη (n), παίρνοντας τους μέσους όρους σε ισοβαθμίες. l Αθροίζουμε τις ταξινομήσεις (βαθμολογίες) των θετικών διαφορών (T+) και των αρνητικών διαφορών (T–). m Χρησιμοποιούμε T=T+ ως τον στατιστικό έλεγχο …

48 Προσημικός Βαθμολογικός Έλεγχος Wilcoxon…
Τώρα έχουμε μία τιμή από έναν στατιστικό έλεγχο, αλλά με ποια τιμή να την συγκρίνουμε; Για μικρά μεγέθη δείγματος, δηλαδή n ≤ 30, κριτικές τιμές του T μπορούν να διαβαστούν από τον δοθέντος πίνακα. Για μεγάλα μεγέθη δείγματος, δηλαδή για n > 30, το T είναι προσεγγιστικά κανονικά κατανεμημένο, έτσι έχουμε:

49 Κριτικές Τιμές για τον Προσημικό Βαθμολογικό Έλεγχο Wilcoxon

50 Παράδειγμα 17.4… ΑΝΑΓΝΩΡΙΣΤΕ Διαφέρουν οι χρόνοι οδήγησης στον χώρο εργασίας μεταξύ δύο εναλλακτικών προγραμμάτων: α) έναρξη εργασίας στις 8:00 π.μ. και β) ελαστική έναρξη εργασία; Οι ώρες προέλευσης καταγράφονται για 32 εργάτες. Με την ελαστική έναρξη εργασία οι εργαζόμενοι μπορούν να αποφύγουν τις ώρες αιχμής της κυκλοφορίας. Θέλουμε να ελέγξουμε αυτήν την υπόθεση: H1: τα δύο μέτρα θέσης πληθυσμών διαφέρουν Έτσι απαιτούμαι: H0: τα δύο μέτρα θέσης πληθυσμών είναι ίσα

51 Παράδειγμα 17.4… Δεδομένα Ώρα προέλευσης Εργάτης 1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 32 Έναρξη στις 8.00 π.μ. 34 35 43 46 16 26 68 38 61 52 13 69 18 53 42 Ελαστικό πρόγραμμα 31 44 15 28 63 39 54 65 12 71 13 55 19 38

52 Παράδειγμα 17.4… ΑΝΑΓΝΩΡΙΣΤΕ
Τα δεδομένα είναι διαστημικά (χρονικές στιγμές) και αποτελούν ένα πείραμα με ζεύγη. (οι ίδιοι εργάτες, την ίδια μέρα της εβδομάδας – Τετάρτη). Γιατί δεν χρησιμοποιούμε ένα t-test για μD; Ένα ιστόγραμμα διαφορών ζευγών αποκαλύπτει μία μη-κανονική κατανομή, και έτσι προτιμούμε μία μη-παραμετρική τεχνική.

53 Παράδειγμα 17.4… ΥΠΟΛΟΓΙΣΤΕ Ώρα προέλευσης 1 2 3 4 5 6 7 8 9 10 11 12
Εργάτης 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 32 Έναρξη στις 8.00 π.μ. 34 35 43 46 16 26 68 38 61 52 13 69 18 53 42 Ελαστικό πρόγραμμα Διαφορά 3 4 -1 2 1 -2 5 Διαφοράς 3 4 1 2 5 Βαθμός 21.0 27.0 4.5 13.0 31.0 31 44 15 28 63 39 54 65 12 71 13 55 19 38

54 Βαθμοί των αρνητικών διαφορών … Ταξινομημένα ως |διαφοράς|
Παράδειγμα 17.4… ΥΠΟΛΟΓΙΣΤΕ Βαθμοί των θετικών διαφορών… Βαθμοί των αρνητικών διαφορών … Τα αρχικά Δεδομένα Σύνολο βαθμών Ταξινομημένα ως |διαφοράς|

55 Παράδειγμα 17.4… Υπολογίζουμε τον στατιστικό έλεγχο ως εξής …
ΥΠΟΛΟΓΙΣΤΕ Υπολογίζουμε τον στατιστικό έλεγχο ως εξής … Η περιοχή απόρριψης είναι …

56 ΕΡΜΗΝΕΥΣΤΕ Παράδειγμα 17.4… Δεν υπάρχει αρκετή μαρτυρία να συμπεράνουμε ότι οι χρόνοι άφιξης με την ελαστική έναρξη διαφέρουν από τους χρόνους άφιξεις κάτω από το υπάρχων πρόγραμμα

57 Έξοδος για Υπολογιστή Παράδειγμα 17.4…
Βαθμοί

58 Παράδειγμα 17.4… ΕΡΜΗΝΕΥΣΤΕ Συγκρίνουμε… π-τιμή

59 Δύο ή Περισσότερους Πληθυσμούς

60 Έλεγχος Kruskal-Wallis …
Μέχρι τώρα συγκρίναμε μέτρα θέσης δύο πληθυσμών, και τώρα θα συγκρίνουμε δύο ή περισσότερους πληθυσμούς. Ο Kruskal-Wallis έλεγχος εφαρμόζεται σε προβλήματα στα οποία θέλουμε να συγκρίνουμε δύο ή περισσότερους πληθυσμούς ή διατακτικά ή διαστημικά (αλλά μη-κανονικά) δεδομένα από ανεξάρτητα δείγματα. Οι υποθέσεις είναι: H0: Τα μέτρα θέσης των k πληθυσμών είναι ίσα. H1: Τουλάχιστον δύο μέτρα θέσης πληθυσμού διαφέρουν.

61 Στατιστικός Έλεγχος … Με στόχο να υπολογίσουμε τον Kruskal-Wallis στατιστικό έλεγχο, χρειαζόμαστε να: Βαθμολογούμε όλες τις παρατηρήσεις από την μικρότερη (1) στην μεγαλύτερη (n), και παίρνουμε τους μέσους όρους σε περίπτωση ισοβαθμίας. Υπολογίζουμε αθροίσματα βαθμών για κάθε δείγμα: T1, T2, …, Tk Τελευταία, υπολογίζουμε τον στατιστικό έλεγχο (συμβολισμένος ως H):

62 Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου:
Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου: Για μεγέθη δείγματος μεγαλύτερα ή ίσα του 5, ο στατιστικός έλεγχος είναι προσεγγιστικά χ2 κατανεμημένος με k–1 βαθμούς ελευθερίας. Η περιοχή απόρριψης είναι: H > χ2α,k-1 Και η π-τιμή είναι: P ( χ2 > H )

63 Δειγματοληπτική Κατανομή της H
π-τιμή Δειγματοληπτική Κατανομή της H

64 Παράδειγμα 17.5… ΑΝΑΓΝΩΡΙΣΤΕ Μπορούμε να συγκρίνουμε βαθμολογίες (4=καλό … 1=φτωχό) για «ταχύτητα εξυπηρέτησης» σε τρεις βάρδιες σε ένα εστιατόριο ταχείας εξυπηρέτησης; Οι υποθέσεις είναι: H0: Τα μέτρα θέσης των τριών πληθυσμών είναι ίσα. (δηλαδή, δεν υπάρχει διαφορά στην ταχύτητα εξυπηρέτησης μεταξύ των βαρδιών), και H1: Τουλάχιστον δύο μέτρα θέσης πληθυσμών διαφέρουν. Αξιολογήσεις (βαθμολογίες) πελατών καταγράφονται …

65 Παράδειγμα 17.5… 10 πελάτες επιλέχθηκαν τυχαία από κάθε βάρδια
4:00 – 12:00 μ.μ. 4 3 2 00:00 - 8:00 π.μ. 3 4 2 8:00 π.μ. - 4:00 μ.μ. 3 1 2 4

66 Ταξινομημένα ανά βαθμολογία
Παράδειγμα 17.5… ΥΠΟΛΟΓΙΣΤΕ Ένας τρόπος για να επιλύσουμε το πρόβλημα είναι να βάλουμε τα αρχικά δεδομένα, σε στήλες και να τα ταξινομήσουμε σύμφωνα με τις αξιολογήσεις … Ταξινομημένα ανά βαθμολογία

67 Παράδειγμα 17.5… ΥΠΟΛΟΓΙΣΤΕ Βάζουμε τα δεδομένα σε στήλες, τα ταξινομούμε ανά βαθμούς από το 1 ως το 30, παίρνουμε τον μέσο όρο των βαθμών για την ίδια απάντηση, τοποθετούμε τα αποτελέσματα ανά βάρδια και υπολογίζουμε τα σύνολα των βαθμών ανά βάρδια …

68 Παράδειγμα 17.5… ΥΠΟΛΟΓΙΣΤΕ = 2.64 Η κριτική τιμή του χ2 (5% σημαντικότητα και k–1=2 βαθμούς ελευθερίας) είναι , επομένως δεν υπάρχει μαρτυρία να απορρίψουμε την H0.

69 Παράδειγμα 17.5 … ΕΡΜΗΝΕΥΣΤΕ «Δεν υπάρχει μαρτυρία να συμπεράνουμε ότι υπάρχουν διαφορές στις ταχύτητες εξυπηρέτησης των τριών βαρδιών, δηλαδή και οι τρεις βάρδιες βαθμολογούνται ισοδύναμα, και οποιαδήποτε πρωτοβουλία για την βελτίωση εξυπηρέτησης θα πρέπει να εφαρμοστεί και στις τρεις βάρδιες» compare… p-value

70 Ο Έλεγχος Friedman… H0: Τα μέτρα θέσης των k πληθυσμών είναι ίσα.
Οι υποθέσεις είναι οι ίδιες όπως πριν: H0: Τα μέτρα θέσης των k πληθυσμών είναι ίσα. H1: Τουλάχιστον δύο μέτρα θέσης πληθυσμού διαφέρουν.

71 Έλεγχος Friedman – Στατιστικός Έλεγχος …
Αφού είναι ένα πείραμα με ζεύγη, πρώτα βαθμολογούμε κάθε παρατήρηση εντός του κάθε τεμαχίου από το μικρότερο στο μεγαλύτερο (δηλαδή, από 1 ως k), και παίρνουμε τον μέσο όρο των ισοπαλιών. Ύστερα υπολογίζουμε τα σύνολα των βαθμών: T1, T2, …, Tk. Έπειτα υπολογίζουμε τον στατιστικό έλεγχο:

72 Έλεγχος Friedman – Στατιστικός Έλεγχος …
Αυτός ο στατιστικός έλεγχος είναι προσεγγιστικά χ2 με k–1 βαθμούς ελευθερίας (εξασφαλίζοντας κάθε k ή b ≥ 5). Η περιοχή απόρριψης και η π-τιμή είναι:

73 Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου
Δειγματοληπτική Κατανομή του Στατιστικού Ελέγχου

74 Παράδειγμα 17.6… ΑΝΑΓΝΩΡΙΣΤΕ Τέσσερεις διευθυντές αξιολογούν και βαθμολογούν υποψήφιους για μία εργασία σε μία κλίμακα από 1 (καλό) ως 5 (όχι καλό). Υπήρξαν παράπονα ότι η διαδικασία δεν είναι δίκαιη. Έχει να κάνει αυτό με το γεγονός ότι όλοι οι διευθυντές βαθμολογούν τους υποψήφιους ισοδύναμα ή όχι; Δηλαδή:

75 Παράδειγμα 17.6… H0: Τα μέτρα θέσης των τεσσάρων πληθυσμών είναι ίσα.
ΑΝΑΓΝΩΡΙΣΤΕ H0: Τα μέτρα θέσης των τεσσάρων πληθυσμών είναι ίσα. (δηλαδή όλοι οι διευθυντές βαθμολογούν τους υποψηφίους με παραπλήσιο τρόπο) H1: Τουλάχιστον δύο μέτρα θέσης πληθυσμών διαφέρουν. (δηλαδή υπάρχει κάποια διαφωνία μεταξύ των βαθμών των διευθυντών) Η περιοχή απόρριψης είναι Fr > χ2α,k-1 = χ2.05,3 =

76 Παράδειγμα 17.6… Τα δεδομένα είναι ως εξής:
ΥΠΟΛΟΓΙΣΤΕ Τα δεδομένα είναι ως εξής: Υπάρχουν k=4 πληθυσμοί (διευθυντές) και b=8 τεμάχια (υποψήφιοι) σε αυτό το πρόβλημα.

77 Παράδειγμα 17.6… ΥΠΟΛΟΓΙΣΤΕ Υποψήφιος #1 για παράδειγμα, έλαβε άριστη βαθμολογία από τον διευθυντή v και πολύ καλές βαθμολογίες από τους άλλους τρεις. Υποψήφιος #7 έλαβε άριστη βαθμολογία από τον διευθυντή v και πολύ κακές βαθμολογίες από τους άλλους τρεις …

78 Βαθμοί με μέσους όρους ισοβαθμιών
Παράδειγμα 17.6… ΥΠΟΛΟΓΙΣΤΕ «βαθμολογείται κάθε παρατήρηση εντός κάθε τεμαχίου από το μικρότερο στο μεγαλύτερο (δηλαδή από 1 ως k), δίνεται ο μέσος όρος για ισοβαθμίες» … Για παράδειγμα, θεωρήστε την περίπτωση του υποψηφίου #2: Διευθυντής u Διευθυντής v Διευθυντής w Διευθυντής x Αρχικοί Βαθμοί 4 2 3 σύνολο «συνήθεις βαθμοί» 1 10 Βαθμοί με μέσους όρους ισοβαθμιών (1+2)/2= 1.5 σύνολο = … + k

79 Παράδειγμα 17.6… Υπολογίστε το σύνολο των βαθμών:
ΥΠΟΛΟΓΙΣΤΕ Υπολογίστε το σύνολο των βαθμών: T1, T2, …, Tk και του στατιστικού ελέγχου …

80 Παράδειγμα 17.6… Η περιοχή απόρριψης είναι:
ΥΠΟΛΟΓΙΣΤΕ Η περιοχή απόρριψης είναι: Fr > χ2α,k-1 = χ2.05,3 = =

81 Παράδειγμα 17.6… ΕΡΜΗΝΕΥΣΤΕ Η τιμή του ελέγχου Friedman είναι συγκρίνεται με την κριτική τιμή του χ2 (με 5% σημαντικότητας και 3 βαθμούς ελευθερίας) που είναι: Έτσι, υπάρχει επαρκής μαρτυρία να απορρίψουμε την H0 για την εύνοια της H1 Φαίνεται ότι οι αξιολογήσεις των διευθυντών για τους υποψηφίους πραγματικά διαφέρουν


Κατέβασμα ppt "Μη-Παραμετρική Στατιστική"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google