ΜΗ ΠΑΡΑΜΕΤΡΙΚΟΙ ΕΛΕΓΧΟI ΥΠΟΘΕΣΕΩΝ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΕΧΝΟΛΟΓΙΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗΝ ΙΑΤΡΙΚΗ ΚΑΙ ΤΗ ΒΙΟΛΟΓΙΑ ΜΑΘΗΜΑ : ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΜΗ ΠΑΡΑΜΕΤΡΙΚΟΙ ΕΛΕΓΧΟI ΥΠΟΘΕΣΕΩΝ ΔΙΟΝΥΣΗΣ ΛΙΝΑΡΔΑΤΟΣ e-mail : dlinardatos@di.uoa.gr 9 ΝΟΕΜΒΡΙΟΥ 2017
Μη παραμετρικοί έλεγχοι υποθέσεων Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ-τετράγωνο Μη παραμετρικοί έλεγχοι υποθέσεων Επιλογή στατιστικών ελέγχων
1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Παράδειγμα Α Ένας ερευνητής επιθυμεί να μελετήσει την παρουσία της “b-ενδορφίνης” στους δρομείς. Μέτρησε τη συγκέντρωση της “b-ενδορφίνης” σε 11 δρομείς πριν και μετά από ένα ημιμαραθώνιο τον οποίο έτρεξαν. Τα αποτελέσματα των μετρήσεων είναι τα ακόλουθα : Δρομέας 1 2 3 4 5 6 7 8 9 10 11 Πριν τον αγώνα 4,3 4,6 5,2 6,6 7,2 8,4 9,0 10,4 14,0 17,8 Μετά τον αγώνα 29,6 25,1 15,5 24,1 37,8 20,2 21,9 14,2 34,6 46,2 Ο ερευνητής επιθυμεί να απαντήσει στο ερώτημα : Μεταβλήθηκαν τα επίπεδα της “b-ενδορφίνης” πριν και μετά τον αγώνα ? Τι πρέπει να κάνει για να απαντήσει στο ερώτημα ?
1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Παράδειγμα A (συν.) Ο ερευνητής αποφασίζει να εφαρμόσει το κατά ζεύγη t-τεστ με μηδενική υπόθεση ότι «τα δύο δείγματα x και y προέρχονται από κατανομές με ίσες μέσες τιμές». Πριν την εφαρμογή του, πρέπει να ελέγξει εάν η διαφορά x-y προέρχεται από κανονική κατ/μή. Μπορεί να εφαρμόσει το Lilliefors τεστ. Η μηδενική υπόθεση είναι ότι «η διαφορά x-y ακολουθεί κανονική κατανομή με απροσδιόριστη μέση τιμή και διασπορά». Η εναλλακτική υπόθεση εκφράζει το αντίθετο. Ο έλεγχος υλοποιείται με τις ακόλουθες εντολές MATLAB: x=[4.3 4.6 5.2 5.2 6.6 7.2 8.4 9.0 10.4 14.0 17.8]'; y=[29.6 25.1 15.5 29.6 24.1 37.8 20.2 21.9 14.2 34.6 46.2]’; [h,p,lstat,cv] = lillietest(x-y) h = 0 p = 0.6466 lstat =0.1293 cv = 0.2490 Συνεπώς, η μηδενική υπόθεση κανονικότητας δεν μπορεί να απορριφθεί.
1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Τα Q-Q διαγράμματα Με το Q-Q (quantile-quantile) διάγραμμα εκτιμάται εάν δύο δείγματα προέρχονται από την ίδια κατανομή (είτε κανονική είτε όχι). Εάν τα δύο δείγματα προέρχονται από την ίδια κατανομή (π.χ. κανονική), ακόμα και εάν η κατανομή του ενός δείγματος είναι ολισθημένη ή σε διαφορετική κλίμακα σε σχέση με του άλλου, το διάγραμμα είναι γραμμικό. Παράδειγμα : x=normrnd(1,1,200,1); y=normrnd(3,3,200,1); qqplot(x,y)
1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Ο έλεγχος x2 χρησιμοποιείται όταν οι μεταβλητές είναι ποιοτικές. Όταν επιθυμούμε να προσδιορίσουμε εάν υπάρχει συσχέτιση μεταξύ δύο ποιοτικών μεταβλητών ή όταν επιθυμούμε να εξετάσουμε εάν ένα σύνολο δεδομένων προέρχεται από μια καθορισμένη κατανομή, τότε εφαρμόζουμε το x2 έλεγχο. Σε καθεμία από τις δύο περιπτώσεις, υπάρχουν δύο κατηγορίες πληροφορίας που χρειαζόμαστε : την πραγματική συχνότητα κάθε «κελιού» του πίνακα συνάφειας (πραγματική ή παρατηρηθείσα συχνότητα) και την αναμενόμενη συχνότητα κάθε «κελιού», η οποία προέρχεται είτε από τη θεωρία ή μέσω μιας γνωστής σχέσης.
1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Παράδειγμα B Ας θεωρήσουμε μια διασταύρωση μεταξύ δύο καφέ αρουραίων. Το χρώμα καθορίζεται από ένα μόνο γονίδιο με δύο διαφορετικούς τύπους (αλλήλους), καφέ και μαύρο. Το καφέ αλληλόμορφο γονίδιο είναι το επικρατές. Συμβολίζουμε με B το καφέ αλληλόμορφο γονίδιο και με b το μαύρο. Κάθε αρουραίος φέρει δύο αλληλόμορφα γονίδια. Έτσι οι πιθανοί συνδυασμοί τους είναι BB (καφές αρουραίος), bb (μαύρος αρουραίος) και Bb (καφές αρουραίος λόγω της υπόθεσης ότι επικρατεί το καφέ). Ας σημειωθεί ότι, σύμφωνα με αυτή την υπόθεση, δεν μπορούμε να διακρίνουμε εάν ένας καφές αρουραίος έχει BB ή Bb. Η μητέρα αρουραίος που ονομάζεται “Honey” έχει καφέ χρώμα. Η μητέρα και ο πατέρας της Honey είχαν καφέ και μαύρο χρώμα, αντίστοιχα. Αυτό μας οδηγεί στην πρόβλεψη ότι η Honey έχει αλληλόμορφα γονίδια Bb.
1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Παράδειγμα B (συν.) Ο πατέρας αρουραίος που ονομάζεται “Ritz” έχει επίσης καφέ χρώμα και ο ένας γονέας του είχε καφέ χρώμα και ο άλλος μαύρο. Αυτό μας οδηγεί στην πρόβλεψη ότι τα αλληλόμορφα γονίδια του Ritz είναι επίσης Bb. Έτσι η διασταύρωσή μας είναι : Bb x Bb Οι προκύπτοντες συνδυασμοί είναι οι ακόλουθοι : Επομένως, μπορούμε να προβλέψουμε ότι θα έχουμε: 1/4 BB . 2/4 Bb ή 3/4 Καφέ 1/4 bb 1/4 Μαύρο ή με πιθανότητες: P(Καφέ) = 0.75 και P(Μαύρο) = 0.25 B b BB Bb bb
1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Παράδειγμα B (συν.) Μετά από σχετικές μετρήσεις τα πραγματικά δεδομένα των διασταυρώσεων έχουν ως εξής : Είναι τα πραγματικά δεδομένα αρκετά κοντά στις προβλέψεις με βάση την προηγούμενη ανάλυση; BB Bb bb 30 69 29 Μηδενική υπόθεση : Τα πραγματικά δεδομένα ΔΕΝ ΑΠΟΚΛΙΝΟΥΝ από τη θεωρητικά αναμενόμενη κατανομή (25%-50%-25% για τα BB-Bb-bb, αντίστοιχα). Εναλλακτική υπόθεση : Τα πραγματικά δεδομένα αποκλίνουν από τη θεωρητικά αναμενόμενη κατανομή. Υπολογίζουμε τις θεωρητικά αναμενόμενες συχνότητες με βάση την παραδοχή ότι η μηδενική υπόθεση είναι αληθής.
1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Παράδειγμα B (συν.) Παρατηρηθείσες/Αναμενόμενες συχνότητες : BB Bb bb Σύνολο Παρατηρηθείσες συχνότητες 30 69 29 128 Θεωρητικά αναμενόμενες συχνότητες =128*25% =128*50% Έτσι έχουμε : BB Bb bb Σύνολο Παρατηρηθείσες συχνότητες 30 69 29 128 Θεωρητικά αναμενόμενες συχνότητες 32 64
Παρατηρηθείσες συχνότητες Θεωρητικά αναμενόμενες συχνότητες 1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Παράδειγμα B (συν.) BB Bb bb Σύνολο Παρατηρηθείσες συχνότητες 30 69 29 128 Θεωρητικά αναμενόμενες συχνότητες 32 64 Η ελάχιστη θεωρητικά αναμενόμενη συχνότητα είναι 32>1. Καμία από τις θεωρητικά αναμενόμενες συχνότητες δεν είναι μικρότερη από 5. Έχουμε 128>40 παρατηρήσεις. Επομένως, δεν αληθεύει καμία από τις συνθήκες που δίνουν αναξιόπιστα αποτελέσματα.
1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Παράδειγμα B (συν.) Στη συνέχεια υπολογίζουμε το x2 : Οι βαθμοί ελευθερίας είναι : df=n-1=3-1=2. Έχουμε P=0.33<1-a (a=0.05). Επομένως, η μηδενική υπόθεση δεν μπορεί να απορριφθεί. Τα πραγματικά δεδομένα ΔΕΝ ΑΠΟΚΛΙΝΟΥΝ από τη θεωρητικά αναμενόμενη κατανομή.
1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Τι πρέπει να προσέχουμε όταν εφαρμόζουμε τα x2 τεστ; Το χ-τετράγωνο τεστ παρέχει αναξιόπιστα αποτελέσματα όταν: Η ελάχιστη θεωρητικά αναμενόμενη τιμή είναι μικρότερη από 1. Περισσότερες από το 20% των θεωρητικά αναμενόμενων συχνοτήτων είναι μικρότερες από 5. Έχουμε λιγότερες από 20 παρατηρήσεις. Στις περιπτώσεις των 2x2 πινάκων συνάφειας με 20-40 παρατηρήσεις, έχουμε τουλάχιστον μία από τις θεωρητικά αναμενόμενες τιμές μικρότερη από 5. Όταν ισχύει κάτι από τα παραπάνω, δεν εφαρμόζουμε το χ-τετράγωνο τεστ. Τονίζουμε επίσης το ότι τα x2 τεστ εφαρμόζονται στις αρχικές συχνότητες και όχι σε λόγους ή ποσοστά που προκύπτουν από τις αρχικές συχνότητες.
1. Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ2 Η διόρθωση τουYates Η διόρθωση αυτή εφαρμόζεται στους 2x2 πίνακες συνάφειας όταν τουλάχιστον ένα κελί του πίνακα έχει αναμενόμενη συχνότητα μικρότερη από 5. Η διόρθωση του Yates υπολογίζεται εύκολα και τροποποιεί τον τύπο του x-τετράγωνο ως εξής : Η διόρθωση μειώνει την τιμή του x-τετράγωνο και έτσι αυξάνει την p-τιμή του. Η διόρθωση εμποδίζει την υπερεκτίμηση της στατιστικής σημαντικότητας για μικρού πλήθους δεδομένα. Η διόρθωση δεν προκαλεί παρά μικρή διαφορά όταν οι μετρήσεις είναι πολλές.
Μη παραμετρικοί έλεγχοι υποθέσεων Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ-τετράγωνο Μη παραμετρικοί έλεγχοι υποθέσεων Επιλογή στατιστικών ελέγχων
2. Μη παραμετρικοί έλεγχοι υποθέσεων Οι έλεγχοι υποθέσεων διακρίνονται σε : Παραμετρικοί έλεγχοι Μη παραμετρικοί έλεγχοι Τα z-τεστ και t-τεστ που έχουμε δει μέχρι τώρα βασίζονται στην παραδοχή ότι οι παρατηρήσεις: ακολουθούν την κανονική κατανομή ή τουλάχιστον, προσεγγιστικά ακολουθούν την κανονική κατανομή ή ακολουθούν την κανονική κατανομή μετά από κάποιο μετασχηματισμό (π.χ. λογαριθμικό μετασχηματισμό) Τα z-τεστ και t-τεστ είναι παραμετρικοί έλεγχοι. Αυτοί είναι οι έλεγχοι, των οποίων η εφαρμογή βασίζεται στην ύπαρξη παραμέτρων κατανομών (π.χ. N(0,1), t(df), F(df))
2. Μη παραμετρικοί έλεγχοι υποθέσεων Αντίθετα, οι μη παραμετρικοί έλεγχοι (non-parametric tests ή distribution-free tests) είναι οι έλεγχοι των οποίων η εφαρμογή δεν απαιτεί υποθέσεις για τις παραμέτρους κατανομών. Οι μη παραμετρικές διαδικασίες είναι λιγότερο ισχυρές από τους ελέγχους που έχουν σχεδιαστεί με βάση συγκεκριμένη κατανομή. Είναι καλύτερα να χρησιμοποιούμε ένα ισχυρότερο εργαλείο όταν οι παραδοχές του ικανοποιούνται, έστω και προσεγγιστικά, από το να χρησιμοποιούμε ένα λιγότερο ισχυρό εργαλείο με λιγότερες παραδοχές. Για παράδειγμα, όταν μια μη κανονική κατανομή μπορεί να μετασχηματιστεί σε κανονική με λογαριθμικό μετασχηματισμό, προτιμούμε να χρησιμοποιούμε τις μετασχηματισμένες παρατηρήσεις με μία παραμετρική μέθοδο από το να χρησιμοποιούμε τις αρχικές παρατηρήσεις με μία μη παραμετρική μέθοδο.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Οι μη παραμετρικοί έλεγχοι δεν χρησιμοποιούν τις πραγματικές τιμές των παρατηρήσεων αλλά το πλήθος των παρατηρήσεων (π.χ. Sign test) ή την τάξη (θέση) κάθε παρατήρησης στο σύνολο όλων των δεδομένων (π.χ.Wilcoxon signed rank test, Mann-Whitney test, Wilcoxon rank sum test, Kruskal-Wallis test). Οι μη παραμετρικοί έλεγχοι εφαρμόζονται σε ποσοτικά χαρακτηριστικά στις περιπτώσεις όπου : η κατανομή είναι προφανώς μη κανονική ή η κατανομή είναι άγνωστη ή το πλήθος των παρατηρήσεων είναι μικρό ή γενικά όταν είναι αδύνατο να εφαρμοστεί παραμετρικός έλεγχος.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Οι μη παραμετρικοί έλεγχοι μπορούν να εφαρμοστούν σε κάθε κατανομή. Ωστόσο, δίνουν καλύτερα αποτελέσματα: όταν οι συγκρινόμενες ομάδες έχουν παρόμοιες κατανομές όταν η κατανομή του υπό μελέτη χαρακτηριστικού είναι συνεχής. Η εφαρμογή των μη-παραμετρικών ελέγχων είναι ευκολότερη και απλούστερη από την εφαρμογή των αντίστοιχων παραμετρικών ελέγχων. Ωστόσο, ο υπολογισμός του “ορίου αξιοπιστίας” μιας διαφοράς που προκύπτει από τους μη παραμετρικούς ελέγχους είναι πολύ δύσκολος.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Αντίστοιχοι μη παραμετρικοί έλεγχοι των κατά ζεύγη t-τεστ: Το Τεστ Προσήμου ή Προσημικός Έλεγχος (Sign test) Το Βαθμολογικό Προσημικό Τεστ Wilcoxon (Wilcoxon signed-rank τεστ) Εφαρμόζονται όταν η κατανομή είναι μη κανονική. Αντίστοιχοι μη παραμετρικοί έλεγχοι του t-τεστ δύο ανεξάρτητων δειγμάτων: Το Mann-Whitney τεστ Το Βαθμολογικό Τεστ Wilcoxon (Wilcoxon Rank Sum τεστ) Εφαρμόζονται όταν οι κατανομές είναι μη κανονικές αλλά ίδιες. Αντίστοιχος μη παραμετρικός έλεγχος της One-way ANOVA : Το Kruskal-Wallis τεστ Εφαρμόζεται όταν οι κατανομές των δύο ή περισσότερων δειγμάτων είναι μη κανονικές αλλά ίδιες.
Χαρακτηριστικά Έλεγχος Πρώτη επιλογή Δεύτερη επιλογή 2. Μη παραμετρικοί έλεγχοι υποθέσεων Χαρακτηριστικά Έλεγχος Πρώτη επιλογή Δεύτερη επιλογή Ποιοτικά Έλεγχος χ-τετράγωνο - Ποσοτικά με κανονική κατανομή t-τεστ Mann-Whitney τεστ ή Wilcoxon rank sum τεστ Κατά ζεύγη t-τεστ Sign test ή Wilcoxon signed-rank τεστ Οne-way ANOVA Kruskal-Wallis τεστ Ποσοτικά με μη κανονική ή άγνωστη κατανομή
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum τεστ Εφαρμόζεται όταν : θέλουμε να συγκρίνουμε (δηλαδή να διαπιστώσουμε εάν υπάρχει οποιαδήποτε διαφορά μεταξύ τους) δύο ανεξάρτητες ομάδες παρατηρήσεων οι δύο ομάδες έχουν μη κανονικές κατανομές ή οι κατανομές τους είναι άγνωστες (δηλαδή το t-τεστ δεν μπορεί να εφαρμοστεί). Υποθέτουμε ότι οι δύο ομάδες παρατηρήσεων προέρχονται από συνεχείς κατανομές οποιασδήποτε μορφής που είναι ίδιες με την εξαίρεση πιθανόν μιας ολίσθησης.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum τεστ Θέτουμε τη μηδενική υπόθεση H0: ΔΕΝ ΥΠΑΡΧΕΙ καμία διαφορά μεταξύ των δύο ομάδων (προέρχονται από κατανομές με ίσες διαμέσους). Θέτουμε την εναλλακτική υπόθεση H1 : Υπάρχει διαφορά μεταξύ των δύο ομάδων (δεν προέρχονται από κατανομές με ίσες διαμέσους). Ταξινομούμε όλες τις παρατηρήσεις (και των δύο ομάδων n1 και n2). Τις ταξινομούμε από τη μικρότερη προς τη μεγαλύτερη (ή το αντίθετο). Η τάξη κάθε παρατήρησης είναι η θέση της στην ταξινομημένη λίστα, ξεκινώντας από το 1 για τη μικρότερη παρατήρηση. Όλες οι ίσες τιμές ταξινομούνται με τη μέση τιμή των τάξεων που καταλαμβάνουν.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Υπολογίζουμε το άθροισμα των τάξεων κάθε ομάδας. Η Wilcoxon στατιστική W είναι το μικρότερο από τα δύο αθροίσματα. Επιλέγουμε το επίπεδο σημαντικότητας a. Υπολογίζουμε την p-τιμή (από τους πίνακες Wilcoxon) που αντιστοιχεί στη W στατιστική ή αλλιώς την κρίσιμη τιμή Τc. Απορρίπτουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής εάν p<a ή αλλιώς εάν W<Τc. Παρατηρήσεις α. Για n1, n2 >10, η στατιστική ακολουθεί προσεγγιστικά κανονική κατανομή με μέση τιμή και τυπική απόκλιση
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Πίνακες Wilcoxon με τις κρίσιμες τιμές
2. Μη παραμετρικοί έλεγχοι υποθέσεων
2. Μη παραμετρικοί έλεγχοι υποθέσεων
2. Μη παραμετρικοί έλεγχοι υποθέσεων
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Παράδειγμα 1 Επιθυμούμε να συγκρίνουμε τις τιμές μιας σφαιρίνης στο πλάσμα δύο ομάδων ασθενών: την ομάδα A και την ομάδα B, κάθε μία από τις οποίες αποτελείται από n1=n2=10 ασθενείς. Οι τιμές της σφαιρίνης (g/lt) στις δύο ομάδες είναι οι εξής : Οι κατανομές των παρατηρήσεων είναι άγνωστες αλλά ταυτόσημες (ίδιες με πιθανόν μια ολίσθηση). Επομένως, δεν μπορεί να εφαρμοστεί το t-test. Αφού οι παρατηρήσεις είναι ανεξάρτητες, εφαρμόζουμε το Wilcoxon Rank Sum Τεστ. Έτσι έχουμε: Ομάδα A 34 45 39 27 38 28 40 42 Ομάδα B 36 32 29 41 26 31 35 30 33
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Παράδειγμα 1 (συν.) Θέτουμε τη μηδενική υπόθεση H0: ΔΕΝ ΥΠΑΡΧΕΙ διαφορά μεταξύ των δύο ομάδων. Θέτουμε την εναλλακτική υπόθεση H1 : Υπάρχει διαφορά μεταξύ των δύο ομάδων (δεν προέρχονται από κατανομές με ίσες διαμέσους). Ταξινομούμε όλες τις παρατηρήσεις (και των δύο ομάδων): Σημείωση : Πολλές φορές οι υποθέσεις ορίζονται ως προς τις διαμέσους των πληθυσμών.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Ομάδα A 34 45 39 27 38 28 40 42 Ομάδα B 36 32 29 41 26 31 35 30 33 Ομάδα A Ομάδα B Τάξη - 26 1 36 11 27 2 38 12.5 28 3 29 4 39 14.5 30 5 31 6 40 16 32 7 41 17 33 8 42 18 34 9 45 19.5 35 10 Σημείωση : Για την επιβεβαίωση της ταξινόμησης πρέπει να γνωρίζουμε ότι το άθροισμα των τάξεων ισούται με n(n+1)/2, όπου n είναι το πλήθος των παρατηρήσεων και των δύο ομάδων.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Παράδειγμα 1 (συν.) Υπολογίζουμε το άθροισμα των τάξεων ανά ομάδα. Ομάδα A : 2+3+9+12.5+14.5+14.5+16+18+19.5+19.5=128.5 Ομάδα B : 1+4+5+6+7+8+10+11+12.5+17=81.5 Η Wilcoxon στατιστική W είναι το μικρότερο από τα δύο αθροίσματα: W=81.5 Επιλέγουμε το επίπεδο σημαντικότητας a=0.05. Υπολογίζουμε την κρίσιμη τιμή για n1=n2=10 : Tc=78. Επειδή W>Tc, δεν μπορούμε να απορρίψουμε τη μηδενική υπόθεση. Άρα, οι τιμές της σφαιρίνης των δύο ομάδων δεν διαφέρουν σημαντικά.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Matlab Το Statistics Toolbox διαθέτει την ακόλουθη συνάρτηση για την πραγματοποίηση του Wilcoxon Rank Sum τεστ : Συνάρτηση Matlab Έλεγχος υποθέσεων ranksum Wilcoxon rank sum τεστ
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Η συνάρτηση ranksum Πραγματοποιεί το Wilcoxon rank sum τεστ της μηδενικής υπόθεσης ότι δύο ανεξάρτητα δείγματα x και y προέρχονται από τις ίδιες κατανομές (αμφίπλευρος έλεγχος). Η συνάρτηση επιστρέφει την p-τιμή που αποτελεί την πιθανότητα παρατήρησης του δεδομένου αποτελέσματος, ή ενός περισσότερου ακραίου, κατά τύχη εάν η μηδενική υπόθεση αληθεύει. [p,h] = ranksum(x,y,'alpha',alpha) Περιγραφή Τιμές Εξ’ ορισμού x δείγμα (μήκους m) y δείγμα (μήκους n) p p-τιμή για τη μηδενική υπόθεση h Το αποτέλεσμα του ελέγχου 0 (μη απόρριψη της μηδενικής υπόθεσης) ή 1 (απόρριψη της μηδενικής υπόθεσης) alpha Το επίπεδο σημαντικότητας 0,05
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Παράδειγμα 2 x=exprnd(1,10,1); y=exprnd(1,10,1); [p,h]=ranksum(x,y) p = 0.3891 h = 0 Επομένως, η μηδενική υπόθεση δεν μπορεί να απορριφθεί.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Παράδειγμα 1 (συν.) x=[34 45 39 27 38 39 28 40 45 42]; y=[36 32 29 41 38 26 31 35 30 33]; [p,h]=ranksum(x,y) p = 0.0818 h = 0 Επομένως, η μηδενική υπόθεση δεν μπορεί να απορριφθεί. Οι τιμές της σφαιρίνης των δύο ομάδων δε διαφέρουν σημαντικά.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Παράδειγμα 3 Σε μια πρώτη κλινική δοκιμή ενός νέου φαρμάκου κατά της ημικρανίας, το νέο φάρμακο χορηγήθηκε σε n1=10 ασθενείς (ομάδα A). Σε άλλους n2=14 χορηγήθηκε placebo (ομάδα B). Το πλήθος των κρίσεων ημικρανίας μετά από ένα εξάμηνο για τις δύο ομάδες έχει ως εξής : Υπάρχει διαφορά στην κατανομή συχνοτήτων των κρίσεων ημικρανίας μεταξύ των δύο ομάδων; Οι κατανομές των δύο ομάδων είναι ταυτόσημες. Ομάδα A 14 6 19 9 10 7 12 13 11 Ομάδα B 18 17 8 16 15 20
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Παράδειγμα 3 (συν.) Υποθέτουμε ότι οι κατανομές των παρατηρήσεων είναι άγνωστες αλλά ταυτόσημες. Επομένως, το t-τεστ δεν μπορεί να εφαρμοστεί. Αφού οι παρατηρήσεις είναι ανεξάρτητες, εφαρμόζουμε το Wilcoxon Rank Sum Τεστ: Θέτουμε τη μηδενική υπόθεση H0: ΔΕΝ ΥΠΑΡΧΕΙ διαφορά μεταξύ των δύο ομάδων. Θέτουμε την εναλλακτική υπόθεση H1 : Υπάρχει διαφορά μεταξύ των δύο ομάδων. Ταξινομούμε όλες τις παρατηρήσεις (και των δύο ομάδων): Ομάδα A 14 6 19 9 10 7 12 13 11 Ομάδα B 18 17 8 16 15 20
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ Παράδειγμα 3 (συν.) Ομάδα A 14 6 19 9 10 7 12 13 11 Ομάδα B 18 17 8 16 15 20 Ομάδα A Ομάδα B Τάξη 6 - 1 15 13 7 2.5 16 14.5 8 4 17 16.5 9 5 10 6.5 18 19.5 11 12 19 22.5 14 11.5 20 24
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ (συν.) Παράδειγμα 3 (συν.) Υπολογίζουμε το άθροισμα των τάξεων ανά ομάδα. Ομάδα A : 1+2.5+5+6.5+8+9+10+11.5+11.5+22.5=87.5 Ομάδα B : 2.5+4+6.5+13+14.5+14.5+16.5+16.5+19.5+19.5+ 19.5 +19.5+22.5+24=212.5 Η Wilcoxon στατιστική W είναι το μικρότερο από τα δύο αθροίσματα: W=87.5 Επιλέγουμε το επίπεδο σημαντικότητας a=0.05 και υπολογίζουμε την κρίσιμη τιμή για n1=10, n2=14 : Tc=91. Επειδή W<Tc (p<a), απορρίπτουμε τη μηδενική υπόθεση. Συνεπώς, η συχνότητα των κρίσεων ημικρανίας είναι διαφορετική μεταξύ των δύο ομάδων.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Rank Sum Τεστ Παράδειγμα 3 (συν.) x=[14 6 19 9 10 7 12 13 14 11]; y=[18 17 8 18 7 16 10 15 18 20 19 17 16 18]; [p,h]=ranksum(x,y) p = 0.0297 h = 1 Επομένως, η μηδενική υπόθεση πρέπει να απορριφθεί. Άρα, η συχνότητα των κρίσεων ημικρανίας διαφέρει μεταξύ των δύο ομάδων.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Mann-Whitney Τεστ Εφαρμόζεται όταν : συγκρίνουμε δύο ανεξάρτητες ομάδες παρατηρήσεων οι δύο ομάδες έχουν μη κανονικές κατανομές ή οι κατανομές τους είναι άγνωστες (δηλαδή το t-τεστ δεν μπορεί να εφαρμοστεί). Οι δύο ομάδες παρατηρήσεων έχουν παρόμοιες κατανομές.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Mann-Whitney Τεστ (συν.) Θέτουμε τη μηδενική υπόθεση H0: ΔΕΝ υπάρχει καμία διαφορά μεταξύ των δύο ομάδων. Θέτουμε την εναλλακτική υπόθεση H1 : Υπάρχει διαφορά μεταξύ των δύο ομάδων. Για κάθε παρατήρηση του πρώτου δείγματος, καταμετρούμε το πλήθος των παρατηρήσεων του δεύτερου δείγματος που είναι μικρότερες από αυτή. Προσθέτουμε το 1/2 για κάθε παρατήρηση του δευτέρου δείγματος που είναι ίση με την (υπό μελέτη) παρατήρηση του πρώτου δείγματος. Για κάθε παρατήρηση του δεύτερου δείγματος, καταμετρούμε το πλήθος των παρατηρήσεων του πρώτου δείγματος που είναι μικρότερες από αυτή. Προσθέτουμε το 1/2 για κάθε παρατήρηση του πρώτου δείγματος που είναι ίση με την (υπό μελέτη) παρατήρηση του δεύτερου δείγματος.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Mann-Whitney Τεστ (συν.) Υπολογίζουμε το άθροισμα των καταμετρήσεων για κάθε ομάδα. Η Mann-Whitney στατιστική U είναι το μικρότερο από τα δύο αθροίσματα. Επιλέγουμε το επίπεδο σημαντικότητας a. Υπολογίζουμε την p-τιμή (από τους Mann-Whitney πίνακες) που αντιστοιχεί στην U στατιστική. Απορρίπτουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής εάν p<a.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Mann-Whitney Τεστ Παράδειγμα 1 (συν.) Ομάδα A 34 45 39 27 38 28 40 42 Ομάδα B 36 32 29 41 26 31 35 30 33 Ομάδα A Πλήθος χαμηλότερων σκορ της Ομάδας B Ομάδα B Πλήθος χαμηλότερων σκορ της Ομάδας A 27 1 26 28 29 2 34 6 30 38 8.5 31 39 9 32 33 40 35 3 42 10 36 45 3.5 41 7 Άθροισμα 73.5 26.5
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Mann-Whitney Τεστ (συν.) Παράδειγμα 1 (συν.) Η Mann-Whitney στατιστική U είναι το μικρότερο από τα δύο αθροίσματα: U=26.5 Επιλέγουμε το επίπεδο σημαντικότητας a=0.05. Βρίσκουμε την p-τιμή για n1=n2=10 : p=0.0818. Επειδή p>a, δεν μπορούμε να απορρίψουμε τη μηδενική υπόθεση. Άρα, οι τιμές της σφαιρίνης των δύο ομάδων δε διαφέρουν σημαντικά.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Mann-Whitney Τεστ (συν.) Η Mann-Whitney στατιστική U και η Wilcoxon στατιστική W δίνουν τα ίδια αποτελέσματα. Το Wilcoxon rank sum τεστ είναι ισοδύναμο με το Mann-Whitney τεστ. Για το λόγο αυτό το Mann-Whitney τεστ ονομάζεται επίσης ως το Mann-Whitney-Wilcoxon (MWW) τεστ, ή ως το Wilcoxon rank-sum τεστ, ή ως το Wilcoxon-Mann-Whitney τεστ. Αρχικά είχε προταθεί από τον Wilcoxon για δείγματα ίδιου μεγέθους και στη συνέχεια επεκτάθηκε για δείγματα οποιουδήποτε μεγέθους από τους Mann και Whitney.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Τεστ Πρόσημου (Sign Test) Εφαρμόζεται όταν : συγκρίνουμε δύο μη ανεξάρτητες ομάδες παρατηρήσεων οι διαφορές των δύο ομάδων προέρχονται από οποιαδήποτε συνεχή κατανομή. Οι ομάδες παρατηρήσεων πρέπει να έχουν το ίδιο πλήθος παρατηρήσεων. Βασίζεται στο πρόσημο των διαφορών.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Τεστ Πρόσημου (συν.) Θέτουμε τη μηδενική υπόθεση H0: Οι διαφορές μεταξύ των ζευγών των αντίστοιχων δειγμάτων των δύο ομάδων προέρχονται από κατανομή με μηδενική διάμεσο. Θέτουμε την εναλλακτική υπόθεση H1 : Οι διαφορές μεταξύ των ζευγών των αντίστοιχων δειγμάτων των δύο ομάδων ΔΕΝ προέρχονται από κατανομή με μηδενική διάμεσο. Σύμφωνα με τη μηδενική υπόθεση, το πλήθος των αρνητικών διαφορών ισούται με το πλήθος των θετικών διαφορών (ζεύγη με μηδενικές διαφορές αγνοούνται). Εάν έχουμε δείγματα με πλήθος n, το πλήθος των θετικών διαφορών ακολουθεί τη διωνυμική κατανομή B(n,1/2). Σημείωση : Η υπόθεση μηδενικής διαμέσου για τη διαφορά δεν είναι ισοδύναμη με την υπόθεση ίσων διαμέσων για τα δύο δείγματα. Το Τεστ Πρόσημου ελέγχει την πρώτη υπόθεση, όχι τη δεύτερη.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Τεστ Πρόσημου (συν.) Η στατιστική είναι το πλήθος των παρατηρήσεων με θετική διαφορά. Επιλέγουμε το επίπεδο σημαντικότητας a. Βρίσκουμε την p-τιμή που αντιστοιχεί στη στατιστική χρησιμοποιώντας τη διωνυμική κατανομή. Απορρίπτουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής εάν p<a.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Τεστ Πρόσημου (συν.) Matlab Το Statistics Toolbox διαθέτει την ακόλουθη συνάρτηση για την πραγματοποίηση του Τεστ Πρόσημου : Συνάρτηση Matlab Έλεγχος Υποθέσεων signtest Τεστ πρόσημου ή τεστ μηδενικής διαμέσου
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Τεστ Πρόσημου (συν.) Η συνάρτηση signtest (με ένα δείγμα) Πραγματοποιεί αμφίπλευρο έλεγχο της υπόθεσης ότι τα δεδομένα δείγματος x προέρχονται από κατανομή με διάμεσο ίση με m. Επιστρέφει την p-τιμή που είναι η πιθανότητα παρατήρησης του δοθέντος αποτελέσματος, ή ενός περισσότερο ακραίου, κατά τύχη εάν η μηδενική υπόθεση είναι αληθής. [p,h] = signtest(x,m,'alpha',alpha) Περιγραφή τιμές Εξ’ ορισμού x Δείγμα m Διάμεσος προς έλεγχο p p-τιμή της μηδενικής υπόθεσης h Το αποτέλεσμα του ελέγχου 0 (μη απόρριψη της μηδενικής υπόθεσης) ή 1 (απόρριψη της μηδενικής υπόθεσης) alpha Το επίπεδο σημαντικότητας 0,05
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Τεστ Πρόσημου (συν.) Η συνάρτηση signtest (με δύο δείγματα) Πραγματοποιεί αμφίπλευρο έλεγχο της υπόθεσης ότι οι κατά ζεύγη διαφορές μεταξύ των δειγμάτων x και y προέρχεται από κατανομή με μηδενική διάμεσο. Επιστρέφει την p-τιμή που είναι η πιθανότητα παρατήρησης του δοθέντος αποτελέσματος, ή ενός περισσότερο ακραίου, κατά τύχη εάν η μηδενική υπόθεση είναι αληθής. [p,h] = signtest(x,y,'alpha',alpha) Περιγραφή Τιμές Εξ’ ορισμού x δείγμα (μήκους n) y p p-τιμή για τη μηδενική υπόθεση h Το αποτέλεσμα του ελέγχου 0 (μη απόρριψη της μηδενικής υπόθεσης) ή 1 (απόρριψη της μηδενικής υπόθεσης) alpha Το επίπεδο σημαντικότητας 0,05
2. Μη παραμετρικοί έλεγχοι υποθέσεων Η συνάρτηση πρόσημου (συν.) Παράδειγμα 4 x=exprnd(1,7,1); y=exprnd(1,7,1); [p,h]=signtest(x,y) p = 0.4531 h = 0 Επομένως, η μηδενική υπόθεση δεν μπορεί να απορριφθεί. median(x) ans = 0.8559 median(y) ans = 0.1825 median(x-y) ans = 0.3181
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Τεστ Πρόσημου (συν.) Παράδειγμα 4 (συν.) x = 3.5492 0.2081 0.4941 0.3545 2.3838 0.8559 0.9793 y = 1.7948 0.1825 0.1760 0.7949 0.0444 1.9163 0.1393 x-y= 1.7543 0.0256 0.3181 -0.4404 2.3395 -1.0604 0.8400
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ Εφαρμόζεται όταν : θέλουμε να συγκρίνουμε δύο μη ανεξάρτητες ομάδες παρατηρήσεων. οι διαφορές μεταξύ των δύο ομάδων προέρχονται από οποιαδήποτε τυχαία κατανομή. Οι δύο ομάδες παρατηρήσεων πρέπει να έχουν το ίδιο πλήθος παρατηρήσεων. Αποτελεί βελτίωση του Τεστ Πρόσημου. Λαμβάνει υπόψη το βαθμό στον οποίο τα ζεύγη των δειγμάτων διαφέρουν. Υποθέτει ότι η κατανομή του πληθυσμού των κατά ζεύγη διαφορών είναι συμμετρική.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ (συν.) Θέτουμε τη μηδενική υπόθεση H0: Οι διαφορές μεταξύ των αντίστοιχων δειγμάτων των δύο ομάδων προέρχονται από μία κατανομή με μηδενική διάμεσο. Θέτουμε την εναλλακτική υπόθεση H1 : Οι διαφορές μεταξύ των αντίστοιχων δειγμάτων των δύο ομάδων ΔΕΝ προέρχονται από μία κατανομή με μηδενική διάμεσο. Υπολογίζουμε τις διαφορές των αντίστοιχων δειγμάτων. Οι διαφορές μπορεί να είναι θετικές, αρνητικές ή μηδενικές. Αγνοούμε τις μηδενικές διαφορές από την περαιτέρω επεξεργασία. Σημείωση : Η υπόθεση μηδενικής διαμέσου για τη διαφορά δεν είναι ισοδύναμη με την υπόθεση ίσων διαμέσων για τα δύο δείγματα. Το Wilcoxon Signed-Rank Τεστ ελέγχει την πρώτη υπόθεση, όχι τη δεύτερη.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ (συν.) Θεωρούμε τις απόλυτες τιμές των διαφορών. Ταξινομούμε τις απόλυτες τιμές των διαφορών κατά αύξουσα σειρά και τους αντιστοιχούμε τάξεις, σημειώνοντας ποιες από αυτές τις διαφορές ήταν αρχικά θετικές και ποιες αρνητικές. Οι ίσες τιμές λαμβάνουν τη μέση τιμή των τάξεών τους. Αθροίζουμε τις τάξεις των θετικών διαφορών και τις τάξεις των αρνητικών διαφορών. Η Wilcoxon στατιστική S είναι το μικρότερο από τα δύο αθροίσματα. Επιλέγουμε το επίπεδο σημαντικότητας a. Βρίσκουμε την p-τιμή που αντιστοιχεί στη στατιστική (ή αλλιώς την κρίσιμη τιμή Tc). Απορρίπτουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής εάν p<a (ή αλλιώς εάν S < Tc).
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ (συν.) Παρατηρήσεις α. Για n >30, η στατιστική ακολουθεί προσεγγιστικά κανονική κατανομή με μέση τιμή και τυπική απόκλιση
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ (συν.) Matlab Το Statistics Toolbox διαθέτει την ακόλουθη συνάρτηση για την πραγματοποίηση του Wilcoxon Signed-Rank Τεστ: Συνάρτηση Matlab Έλεγχος υποθέσεων signrank Wilcoxon Signed-Rank τεστ για μηδενική διάμεσο
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ (συν.) Η συνάρτηση signrank (για ένα δείγμα) Πραγματοποιεί αμφίπλευρο έλεγχο για το Wilcoxon signed-rank τεστ της υπόθεσης ότι «τα δεδομένα του δείγματος x προέρχονται από κατανομή με διάμεσο m.» Επιστρέφει την p-τιμή που είναι η πιθανότητα παρατήρησης του δοθέντος αποτελέσματος, ή ενός περισσότερο ακραίου, κατά τύχη εάν η μηδενική υπόθεση είναι αληθής. [p,h] = signrank(x,m,'alpha',alpha) Περιγραφή Τιμές Εξ’ ορισμού x Δείγμα m Διάμεσος προς έλεγχο p p-τιμή της μηδενικής υπόθεσης h Το αποτέλεσμα του ελέγχου 0 (μη απόρριψη της μηδενικής υπόθεσης) ή 1 (απόρριψη της μηδενικής υπόθεσης) alpha Το επίπεδο σημαντικότητας 0,05
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ (συν.) Η συνάρτηση signrank (για δύο δείγματα) Πραγματοποιεί αμφίπλευρο έλεγχο για το Wilcoxon Signed-Rank τεστ της υπόθεσης ότι «οι κατά ζεύγη διαφορές μεταξύ των x και y προέρχεται από κατανομή με μηδενική διάμεσο». Επιστρέφει την p-τιμή που είναι η πιθανότητα παρατήρησης του δοθέντος αποτελέσματος, ή ενός περισσότερο ακραίου, κατά τύχη εάν η μηδενική υπόθεση είναι αληθής. [p,h] = signrank(x,y,'alpha',alpha) Περιγραφή Τιμές Εξ’ ορισμού x δείγμα (μήκους n) y p p-τιμή της μηδενικής υπόθεσης h Το αποτέλεσμα του ελέγχου 0 (μη απόρριψη της μηδενικής υπόθεσης) ή 1 (απόρριψη της μηδενικής υπόθεσης) alpha Το επίπεδο σημαντικότητας 0,05
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ (συν.) Παράδειγμα 5 Επιθυμούμε να συγκρίνουμε τις τιμές μιας σφαιρίνης στο πλάσμα 10 ασθενών πριν και μετά τη χρήση ενός νέου φαρμάκου. Οι τιμές της σφαιρίνης (g/lt) στις δύο περιπτώσεις είναι οι εξής: Υπάρχει διαφορά στη συγκεκριμένη σφαιρίνη πριν και μετά τη χρήση του νέου φαρμάκου; Οι κατανομές των παρατηρήσεων είναι άγνωστες. Έτσι, δεν μπορεί να εφαρμοστεί το t-τεστ. Επειδή οι παρατηρήσεις δεν είναι ανεξάρτητες, θα εφαρμόσουμε το Wilcoxon Signed-Rank Τεστ για τις διαφορές πριν και μετά τη χορήγηση του φαρμάκου, η κατανομή των οποίων είναι συμμετρική. Πριν 38 26 29 41 36 31 32 30 35 33 Μετά 45 28 27 40 42 39 34
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ (συν.) Παράδειγμα 5 (συν.) Θέτουμε τη μηδενική υπόθεση H0: Οι κατά ζεύγη διαφορές των παρατηρήσεων των δύο ομάδων προέρχονται από κατανομή με μηδενική διάμεσο. Θέτουμε την εναλλακτική υπόθεση H1 : Οι κατά ζεύγη διαφορές των παρατηρήσεων των δύο ομάδων ΔΕΝ προέρχονται από κατανομή με μηδενική διάμεσο. Υπολογίζουμε τις διαφορές των αντίστοιχων δειγμάτων. Πριν 38 26 29 41 36 31 32 30 35 33 Μετά 45 28 27 40 42 39 34 Πριν-Μετά -7 -2 2 3 -4 -11 -9 1 -12
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ (συν.) Παράδειγμα 5 (συν.) Θεωρούμε τις απόλυτες τιμές των διαφορών. Ταξινομούμε τις απόλυτες τιμές κατ’ αύξουσα σειρά και αντιστοιχούμε σε αυτές την τάξη τους, κρατώντας ποιες ήταν αρχικά θετικές και ποιες αρνητικές. Οι ίσες τιμές λαμβάνουν τη μέση τιμή των τάξεών τους. Πρόσημο - + Απόλυτη τιμή 7 2 3 4 11 9 1 12 Πρόσημο + - Απόλυτη τιμή 1 2 3 4 7 9 11 12 Τάξη 2.5 5 6.5 8 10
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ (συν.) Παράδειγμα 5 (συν.) Αθροίζουμε τις τάξεις των θετικών διαφορών και τις τάξεις των αρνητικών διαφορών. Θετικές διαφορές : 1+2.5+4=7.5 Αρνητικές διαφορές : 2.5+5+6.5+6.5+8+9+10=47.5 Η Wilcoxon στατιστική S είναι το μικρότερο από τα αθροίσματα: S=7.5 Επιλέγουμε το επίπεδο σημαντικότητας a=0.05. Βρίσκουμε την κρίσιμη τιμή Tc=8 Επειδή S<Tc, απορρίπτουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. Άρα, υπάρχει σημαντική διαφορά στη συγκεκριμένη σφαιρίνη πριν και μετά τη χορήγηση του νέου φαρμάκου.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Wilcoxon Signed-Rank Τεστ (συν.) Παράδειγμα 5 (συν.) MATLAB : x=[38 26 29 41 36 31 32 30 35 33]; y=[45 28 27 38 40 42 39 39 34 45]; [p,h]=signrank(x,y) p = 0.0430 h = 1 Επομένως, απορρίπτουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής. Υπάρχει στατιστικά σημαντική διαφορά στη συγκεκριμένη σφαιρίνη πριν και μετά τη χορήγηση του νέου φαρμάκου.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Kruskal-Wallis Τεστ Εφαρμόζεται όταν : συγκρίνουμε δύο ή περισσότερες ανεξάρτητες ομάδες παρατηρήσεων οι δύο ή περισσότερες ομάδες παρατηρήσεων έχουν μη κανονικές κατανομές ή οι κατανομές τους είναι άγνωστες (δηλαδή όταν η one-way ANOVA δεν μπορεί να εφαρμοστεί). Υποθέτουμε ότι οι ομάδες παρατηρήσεων προέρχονται από συνεχείς (οποιεσδήποτε) κατανομές που είναι παρόμοιες (παρόμοια σχήματα) με την εξαίρεση πιθανόν κάποιας ολίσθησης.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Kruskal-Wallis Τεστ (συν.) Θέτουμε τη μηδενική υπόθεση H0: ΔΕΝ υπάρχει καμία διαφορά μεταξύ των ομάδων των παρατηρήσεων (προέρχονται από τις ίδιες κατανομές). Θέτουμε την εναλλακτική υπόθεση H1 : Υπάρχει διαφορά μεταξύ των ομάδων των παρατηρήσεων (τουλάχιστον μία δεν προέρχεται από την ίδια κατανομή με τις υπόλοιπες). Ταξινομούμε όλες τις παρατηρήσεις (από όλες τις ομάδες μαζί). Τις κατατάσσουμε από τη μικρότερη προς τη μεγαλύτερη. Η τάξη κάθε παρατήρησης είναι η θέση της σε αυτή την ταξινομημένη λίστα, ξεκινώντας από την τάξη 1 για τη μικρότερη παρατήρηση. Όλες οι ίσες τιμές λαμβάνουν τη μέση τιμή των τάξεων που καταλαμβάνουν.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Kruskal-Wallis Τεστ (συν.) Υπολογίζουμε το άθροισμα των τετραγώνων (στηλών και σφάλματος) με βάση τις τάξεις (δηλαδή One-way ANOVA με βάση τις τάξεις). Η Kruskal-Wallis στατιστική H είναι : Όταν τα μεγέθη των δειγμάτων είναι μεγάλα (τουλάχιστον 5 παρατηρήσεις ανά δείγμα) και όλοι οι n πληθυσμοί έχουν την ίδια συνεχή κατανομή, η H ακολουθεί προσεγγιστικά τη χ-τετράγωνο κατανομή με n-1 βαθμούς ελευθερίας. Βρίσκουμε την p-τιμή που αντιστοιχεί στην H στατιστική. Καθορίζουμε το επίπεδο σημαντικότητας a. Απορρίπτουμε τη μηδενική υπόθεση υπέρ της εναλλακτικής εάν p<a.
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Kruskal-Wallis Τεστ (συν.) Matlab Το Statistics Toolbox διαθέτει την ακόλουθη συνάρτηση για την πραγματοποίηση του Kruskal-Wallis τεστ για δύο ή περισσότερα δείγματα : Συνάρτηση Matlab Έλεγχος υποθέσεων kruskalwallis Kruskal-Wallis μη παραμετρική one-way analysis of variance (ANOVA)
2. Μη παραμετρικοί έλεγχοι υποθέσεων Η kruskalwallis συνάρτηση Πραγματοποιεί το Kruskal-Wallis τεστ για τη σύγκριση δύο ή περισσότερων δειγμάτων. Η συνάρτηση επιστρέφει την p-τιμή για τη μηδενική υπόθεση ότι όλα τα δείγματα προέρχονται από τον ίδιο πληθυσμό (ή από διαφορετικούς πληθυσμούς με την ίδια κατανομή). [p,table,stats]= kruskalwallis(X,group,'displayopt') Περιγραφή Τιμές Εξ’ ορισμού X m-επί-n πίνακας, όπου κάθε στήλη αναπαριστά ένα ανεξάρτητο δείγμα που περιέχει m αμοιβαία ανεξάρτητες παρατηρήσεις. group Ένας πίνακας χαρακτήρων ή κελιών που περιέχει ετικέτες για το box plot των δειγμάτων στο X ‘displayopt’ Ενεργοποιεί τον πίνακα ANOVA και τα σχήματα box plot ‘on’ ή ‘off’ ‘on’ p p-τιμή για τη μηδενική υπόθεση table ο ANOVA πίνακας υπολογισμένος χρησιμοποιώντας τις τάξεις των δεδομένων stats Η δομή που χρησιμοποιείται για την εκτέλεση ενός τεστ πολλαπλών συγκρίσεων (συνάρτηση multcompare).
2. Μη παραμετρικοί έλεγχοι υποθέσεων Η kruskalwallis συνάρτηση (συν.) ή Περιγραφή Τιμές Εξ’ ορισμού X Διάνυσμα που περιέχει αμοιβαία αποκλειόμενες παρατηρήσεις group Προσδιορίζει την ομάδα στην οποία ανήκει το αντίστοιχο στοιχείο του X (το group πρέπει να έχει το ίδιο μήκος με το X) ‘displayopt’ Ενεργοποιεί τον πίνακα ANOVA και τα σχήματα box plot ‘on’ ή ‘off’ ‘on’ p p-τιμή για τη μηδενική υπόθεση table ο ANOVA πίνακας υπολογισμένος χρησιμοποιώντας τις τάξεις των δεδομένων stats Η δομή που χρησιμοποιείται για την εκτέλεση ενός τεστ πολλαπλών συγκρίσεων (συνάρτηση multcompare). Εάν η p-τιμή είναι μικρότερη από το επίπεδο σημαντικότηας a, τουλάχιστον μία από τις διαμέσους των δειγμάτων διαφέρει στατιστικά από τις διαμέσους των υπόλοιπων δειγμάτων. Έτσι, η μηδενική υπόθεση πρέπει να απορριφθεί. p = kruskalwallis(X) ή p = kruskalwallis(X,group) ή [p,table] = kruskalwallis(X)
2. Μη παραμετρικοί έλεγχοι υποθέσεων Η kruskalwallis function (συν.) Η συνάρτηση kruskalwallis παρουσιάζει τα εξής: Τον τυπικό ANOVA πίνακα υπολογισμένο με βάση τις τάξεις των δεδομένων. Τα στοιχεία του πίνακα ANOVA είναι τα συνήθη αθροίσματα τετραγώνων, οι βαθμοί ελευθερίας και άλλες ποσότητες υπολογισμένες με βάση τις τάξεις. Η F στατιστική της ANOVA έχει αντικατασταθεί από τη χ-τετράγωνο στατιστική. Η p-τιμή μετρά τη σημαντικότητα της χ-τετράγωνο στατιστικής. Τα box plots κάθε στήλης του X (όχι των γραμμών του X).
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Kruskal-Wallis Τεστ (συν.) Παράδειγμα 6 Θέλουμε να συγκρίνουμε τις τιμές μιας σφαιρίνης στο πλάσμα τεσσάρων ομάδων ασθενών, των ομάδων A, B, C και D, κάθε μία από τις οποίες αποτελείται από n=6 ασθενείς. Οι τιμές της σφαιρίνης (g/lt) στις τέσσερις ομάδες είναι οι εξής : Δεδομένου ότι οι κατανομές των τεσσάρων ομάδων είναι παρόμοιες, είναι οι τιμές της σφαιρίνης διαφορετικές στις τέσσερις ομάδες; Ομάδα A 34 45 39 27 38 Ομάδα B 32 41 29 42 33 37 Ομάδα C 31 30 26 Ομάδα D 16 12 19 18
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Kruskal-Wallis Τεστ (συν.) Παράδειγμα 6 (συν.) Το πλήθος των παρατηρήσεων είναι μικρό και οι κατανομές τους είναι άγνωστες αλλά παρόμοιες. Επομένως, δεν μπορεί να εφαρμοστεί η one-way ANOVA. Επειδή οι παρατηρήσεις είναι ανεξάρτητες, εφαρμόζουμε το Kruskal-Wallis Τεστ για τον έλεγχο της μηδενικής υπόθεσης : ΔΕΝ υπάρχει διαφορά μεταξύ των τεσσάρων ομάδων παρατηρήσεων. Η εναλλακτική εκφράζει το αντίθετο. Έχουμε : X=[34 32 29 16; 45 41 31 12; 39 29 30 19; 27 42 32 31;38 33 26 18;39 37 41 16]; [p,table,stats]= kruskalwallis(X) p = 0.0057
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Kruskal-Wallis Τεστ (συν.) Παράδειγμα 6 (συν.) Έτσι η μηδενική υπόθεση πρέπει να απορριφθεί. Υπάρχει διαφορά μεταξύ των τεσσάρων ομάδων παρατηρήσεων. c=multcompare(stats) c = 1.0000 2.0000 -9.5577 0.9167 11.3910 1.0000 3.0000 -4.9743 5.5000 15.9743 1.0000 4.0000 2.4423 12.9167 23.3910 2.0000 3.0000 -5.8910 4.5833 15.0577 2.0000 4.0000 1.5257 12.0000 22.4743 3.0000 4.0000 -3.0577 7.4167 17.8910
2. Μη παραμετρικοί έλεγχοι υποθέσεων Το Kruskal-Wallis Τεστ (συν.) Παράδειγμα 6 (συν.)
Μη παραμετρικοί έλεγχοι υποθέσεων Παραδείγματα ελέγχων υποθέσεων για κανονικότητα και χ-τετράγωνο Μη παραμετρικοί έλεγχοι υποθέσεων Επιλογή στατιστικών ελέγχων
3. Επιλογή στατιστικών ελέγχων Ποιο είναι το ερώτημα της έρευνας; Ποια είναι η υπόθεσή μας; Τι είδος δεδομένων διαθέτουμε; Έχουμε μετρήσεις ή συχνότητες; Τι είδος μετρήσεων διαθέτουμε; Ποιοτικά δεδομένα; Ποσοτικά δεδομένα; Πόσα δείγματα έχουμε; Είναι τα δείγματα ανεξάρτητα ή εξαρτημένα; Ποιες είναι οι κατανομές των δειγμάτων ; Πόσες είναι οι παρατηρήσεις ανά δείγμα; Είναι οι παρατηρήσεις ανεξάρτητες;
3. Επιλογή στατιστικών ελέγχων Τύποι ελέγχων υποθέσεων Πρέπει να συγκρίνουμε δείγματα με κανονική κατανομή; z-τεστ ; t-τεστ ; one-way ANOVA ; Πρέπει να συγκρίνουμε δείγματα με μη κανονική κατανομή; Wilcoxon signed-rank τεστ ; Wilcoxon rank sum (Wilcoxon-Mann-Whitney); Kruskal-Wallis τεστ; Πρέπει να εξετάσουμε δεδομένα συχνοτήτων ; x-τετράγωνο τεστ ;
3. Επιλογή στατιστικών ελέγχων Έχοντας επιλέξει τον έλεγχο υπόθεσης, πρέπει να θεωρούμε τις ακόλουθες ερωτήσεις : Ποιες υποθέσεις ελέγχονται; Ποιες συνθήκες πρέπει να ικανοποιούνται; Ποια διαγράμματα είναι χρήσιμα ; Ποιες εναλλακτικές είναι διαθέσιμες εάν δεν ικανοποιούνται οι συνθήκες ; Ποια είναι η στατιστική του τεστ ; Ποιοι είναι οι βαθμοί ελευθερίας ;