Ανάλυση Διακύμανσης και εφαρμογές της Χ2 κατανομής Κεφάλαιο 11 Ανάλυση Διακύμανσης και εφαρμογές της Χ2 κατανομής © 2002 Thomson / South-Western
Στόχοι Μαθήματος Κατανόηση των διαφορών μεταξύ των ποικίλων πειραματικών σχεδίων και της χρήσης τους. Υπολογισμός και ερμηνεία των αποτελεσμάτων της ανάλυσης διακύμανσης κατά ένα παράγοντα (one-way ANOVA). Υπολογισμός και ερμηνεία των αποτελεσμάτων ενός τυχαίου σχεδίου πειράματος κατά κατηγορία (random block design). © 2002 Thomson / South-Western 2
Στόχοι Μαθήματος, συνέχεια Υπολογισμός και ερμηνεία των αποτελεσμάτων της ανάλυσης διακύμανσης κατά δυο παράγοντες (a two-way ANOVA). Υπολογισμός και ερμηνεία των αποτελεσμάτων πιθανών αλληλεπιδράσεων. Κατανόηση της χρήσης του ελέγχου καλής προσαρμογής του Χ2. Ανάλυση δεδομένων με τη χρήση του Χ2 τεστ της ανεξαρτησίας. © 2002 Thomson / South-Western
Εισαγωγή στο Σχεδιασμό των Πειραμάτων Η διαδικασία σχεδιασμού ενός πειράματος περιλαμβάνει το σχέδιο και τη δομή ενός ελέγχου υποθέσεων όπου ο αναλυτής της επιχείρησης ελέγχει ή διαχειρίζεται μια ή περισσότερες μεταβλητές. Η παραπάνω διαδικασία περιλαμβάνει ανεξάρτητες και εξαρτημένες μεταβλητές. Παράγοντες είναι ένα άλλο όνομα που χρησιμοποιείται για τις ανεξάρτητες μεταβλητές που υπεισέρχονται στο σχεδιασμό ενός πειράματος. © 2002 Thomson / South-Western 4
Σχεδιασμός Πειραμάτων, συνέχεια Μεταβλητή επίδρασης αποκαλείται η ανεξάρτητη μεταβλητή την οποία ο ερευνητής μπορεί να ελέγξει ή να μεταβάλλει. Μεταβλητή ταξινόμησης αποκαλείται η ανεξάρτητη μεταβλητή η οποία υπήρχε πριν την εκτέλεση του πειράματος και δεν αποτελεί αποτέλεσμα των ενεργειών του ερευνητή. © 2002 Thomson / South-Western
Σχεδιασμός Πειραμάτων, συνέχεια Επίπεδα ή Ταξινομήσεις είναι οι διάφορες υποκατηγορίες της ανεξάρτητης μεταβλητής που χρησιμοποιεί ο αναλυτής της επιχείρησης στον σχεδιασμό του πειράματος. Η εξαρτημένη μεταβλητή αντιπροσωπεύει τα διαφορετικά επίπεδα ανταπόκρισης των ανεξάρτητων μεταβλητών. © 2002 Thomson / South-Western
Τρεις Τύποι Σχεδιασμού Πειραμάτων Εντελώς Τυχαίος Σχεδιασμός (Completely Randomized Design) Τυχαίος σχεδιασμός κατά κατηγορίες (Randomized Block Design) Παραγοντικά Πειράματα (Factorial Experiments) © 2002 Thomson / South-Western 5
Εντελώς Τυχαίος Σχεδιασμός Χειριστής Μηχανής 1 2 3 . Μετρήσεις ανοίγματος βαλβίδων © 2002 Thomson / South-Western 6
Παράδειγμα: Αριθμός ξένων φορτηγών πλοίων που προσεγγίζουν λιμάνι ημερησίως Long Beach 5 7 4 2 Houston 3 6 New York 8 9 New Orleans © 2002 Thomson / South-Western 7
Ανάλυση της Διακύμανσης (ANOVA): Υποθέσεις Οι παρατηρήσεις προέρχονται από πληθυσμούς που ακολουθούν την κανονική κατανομή. Οι παρατηρήσεις αποτελούν τυχαία δείγματα από τους πληθυσμούς. Οι διακυμάνσεις των πληθυσμών είναι ίσες. © 2002 Thomson / South-Western 8
Ανάλυση διακύμανσης κατά έναν παράγοντα: Διαδικαστική Επισκόπηση Ανάλυση διακύμανσης κατά έναν παράγοντα: Διαδικαστική Επισκόπηση © 2002 Thomson / South-Western 9
Διαχωρισμός του Συνολικού Αθροίσματος Τετραγώνων στα επιμέρους συστατικά του SST (Συνολικό άθροισμα Τετραγώνων) SSC (Άθροισμα Τετραγώνων που οφείλεται στην μελετώμενη επίδραση) SSE (Άθροισμα Τετραγώνων των Σφαλμάτων) © 2002 Thomson / South-Western
Ανάλυση διακύμανσης κατά ένα παράγοντα : Αθροίσματα τετραγώνων:Ορισμοί Ανάλυση διακύμανσης κατά ένα παράγοντα : Αθροίσματα τετραγώνων:Ορισμοί © 2002 Thomson / South-Western 10
Ανάλυση διακύμανσης κατά ένα παράγοντα: Χρήσιμοι Τύποι Ανάλυση διακύμανσης κατά ένα παράγοντα: Χρήσιμοι Τύποι © 2002 Thomson / South-Western 12
Ανάλυση διακύμανσης κατά ένα παράγοντα παράδειγμα φορτηγών πλοίων: Αρχικοί υπολογισμοί Long Beach 5 7 4 2 T1 = 18 n1= 4 Houston 3 6 T2 = 20 n2 = 5 New York 8 9 T3 = 42 n3 = 6 New Orleans T4 = 17 n4 = 5 T = 97 N = 20 © 2002 Thomson / South-Western 13
Ανάλυση διακύμανσης κατά ένα παράγοντα παράδειγμα φορτηγών πλοίων : Υπολογισμοί αθροίσματα τετραγώνων © 2002 Thomson / South-Western 14
Ανάλυση διακύμανσης κατά ένα παράγοντα παράδειγμα φορτηγών πλοίων : Υπολογισμοί αθροίσματα τετραγώνων, συνέχεια © 2002 Thomson / South-Western 15
Ανάλυση διακύμανσης κατά ένα παράγοντα παράδειγμα φορτηγών πλοίων : Μέσο τετράγωνο & υπολογισμοί του F © 2002 Thomson / South-Western 16
Παράδειγμα φορτηγών πλοίων : Ανάλυση διακύμανσης Παράδειγμα φορτηγών πλοίων : Ανάλυση διακύμανσης Πηγή διακύμανσης β.ε. SS MS F Παράγοντας μεταξύ 3 42.35 14.12 5.12 Σφάλμα 16 44.20 2.76 Σύνολο 19 86.55 © 2002 Thomson / South-Western 17
Τμήμα του πίνακα της κατανομής για = 0.05 1 2 3 4 5 6 7 8 9 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 . . . 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.54 17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 Παρανομαστής Βαθμοί Ελευθερίας Αριθμητής Βαθμοί Ελευθερίας © 2002 Thomson / South-Western
Παράδειγμα φορτηγών πλοίων ANOVA κατά ένα παράγοντα: Ανακεφαλαίωση διαδικασίας Περιοχή απόρριψης Κριτική τιμή Περιοχή μη απόρριψης © 2002 Thomson / South-Western 19
Αποτέλεσμα του Excel για το παράδειγμα των φορτηγών πλοίων Anova: Single Factor SUMMARY Groups Count Sum Average Variance Long Beach 4 18 4.5 4.3333 Houston 5 20 2.5 New York 6 42 7 3.2 New Orleans 17 3.4 1.3 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 42.35 3 14.117 5.1101 0.0114 3.2389 Within Groups 44.2 16 2.7625 Total 86.55 19 © 2002 Thomson / South-Western
Έλεγχοι Πολλαπλών Συγκρίσεων Ένας έλεγχος ανάλυσης διακύμανσης (ANOVA) αποτελεί έναν ολοκληρωμένο έλεγχο των διαφορών που παρατηρούνται μεταξύ διαφορετικών υποομάδων ενός πληθυσμού. Οι τεχνικές πολλαπλών συγκρίσεων χρησιμεύουν στον εντοπισμό εκείνων των στατιστικά σημαντικών διαφορετικών μέσων ανά ζεύγη δεδομένου ότι ο έλεγχος ANOVA αποκαλύπτει την συνολική σημαντικότητα. © 2002 Thomson / South-Western 22
Τυχαιοποιημένο σχέδιο πειράματος κατά κατηγορίες Πρόκειται για ένα σχέδιο πειράματος όπου υπάρχει μια ανεξάρτητη μεταβλητή και μια δεύτερη μεταβλητή γνωστή ως μεταβλητή κατηγορίας η οποία χρησιμεύει για τον έλεγχο μεταβλητών συμφωνίας ή διαφωνίας (concomitant - confounding). Μια μεταβλητή συμφωνίας ή διαφωνίας είναι πέρα από τον έλεγχο του αναλυτή της επιχείρησης αλλά μπορεί να επηρεάσει το αποτέλεσμα της επίδρασης που μελετάται. © 2002 Thomson / South-Western
Τυχαιοποιημένο σχέδιο πειράματος κατά κατηγορίες, συνέχεια Η μεταβλητή κατηγορίας είναι μια μεταβλητή της οποίας ο αναλυτής της επιχείρησης επιθυμεί να έχει τον έλεγχο αλλά δεν αποτελεί την βασική μεταβλητή ενδιαφέροντος Το σχέδιο επαναλαμβανόμενων μετρήσεων είναι ένα τυχαιοποιημένο σχέδιο πειράματος στο οποίο κάθε κατηγορία αποτελεί ξεχωριστό αντικείμενο ή άτομο και των οποίων η αντίδραση καταγράφεται για όλες τις διαφορετικές κατηγορίες. © 2002 Thomson / South-Western
που οφείλεται στην μελετώμενη Διαχωρισμός του Συνολικού Αθροίσματος Τετραγώνων στα επιμέρους συστατικά του SST (Συνολικό άθροισμα τετραγώνων) SSE (Άθροισμα τετραγώνων καταλοίπων) SSC (Άθροισμα τετραγώνων που οφείλεται στην μελετώμενη επίδραση) SSR (Άθροισμα τετραγώνων κατηγοριών) SSE’ (Άθροισμα τετραγώνων καταλοίπων) © 2002 Thomson / South-Western
Τυχαιοποιημένο σχέδιο πειράματος κατά κατηγορίες Μεμονωμένες Παρατηρήσεις . Μεμονωμένη Ανεξάρτητη Μεταβλητή Μεταβλητή Κατηγορίας © 2002 Thomson / South-Western 30
Έλεγχος επιδράσεων σε ένα τυχαιοποιημένο σχέδιο πειράματος κατά κατηγορίες (Randomized Block Design) : Επισκόπηση διαδικασίας © 2002 Thomson / South-Western 32
Τυχαιοποιημένο Σχέδιο Πειράματος κατά κατηγορίες : Τύποι υπολογισμών Τυχαιοποιημένο Σχέδιο Πειράματος κατά κατηγορίες : Τύποι υπολογισμών © 2002 Thomson / South-Western 34
Μεταβλητή Ταχύτητας Μέσοι ( ) Παράδειγμα Φθοράς Ελαστικού: Τυχαιοποιημένο Σχέδιο Πειράματος κατά κατηγορίες Προμηθευτής 1 2 3 4 Αργή Μέτρια Γρήγορη Κατηγορίες Μέσοι ( ) 3.7 4.5 3.1 3.77 3.4 3.9 2.8 3.37 3.5 4.1 3.0 3.53 3.2 2.6 3.10 5 Μεταβλητή Ταχύτητας Μέσοι ( ) 4.8 4.03 3.54 4.16 2.98 3.56 Ταχύτητα n = 5 N = 15 C = 3 © 2002 Thomson / South-Western 35
Παράδειγμα Φθοράς Ελαστικού Τυχαιοποιημένο Σχέδιο Πειράματος κατά κατηγορίες : Υπολογισμοί Αθροίσματος Τετραγώνων (Μέρος 1) © 2002 Thomson / South-Western 36
Παράδειγμα Φθοράς Ελαστικού Τυχαιοποιημένο Σχέδιο Πειράματος κατά κατηγορίες : Υπολογισμοί Αθροίσματος Τετραγώνων(Μέρος 2) © 2002 Thomson / South-Western
Παράδειγμα Φθοράς Ελαστικού Τυχαιοποιημένο Σχέδιο Πειράματος κατά κατηγορίες : Υπολογισμοί Μέσων Τετραγώνων © 2002 Thomson / South-Western
Ανάλυση Διακύμανσης : Παράδειγμα Φθοράς Ελαστικού Πηγή διακύμανσης SS βε MS F Μεταβλητή Επίδρασης 3.484 2 1.742 96.78 Κατηγορία 1.549 4 0.387 Σφάλμα 0.143 8 0.018 Σύνολο 5.176 14 © 2002 Thomson / South-Western 39
Έλεγχος επιδράσεων - Παράδειγμα Φθοράς Ελαστικού Τυχαιοποιημένο Σχέδιο Πειράματος κατά κατηγορίες : Επισκόπηση διαδικασίας © 2002 Thomson / South-Western 40
Αποτελέσματα Excel για το Παράδειγμα Φθοράς Ελαστικού Τυχαιοποιημένο Σχέδιο Πειράματος κατά κατηγορίες Anova: Two-Factor Without Replication SUMMARY Count Sum Average Variance 1 3 11.3 3.7666667 0.4933333 2 10.1 3.3666667 0.3033333 10.6 3.5333333 4 9.3 3.1 0.21 5 12.1 4.0333333 0.5033333 Slow 17.7 3.54 0.073 Medium 20.8 4.16 0.258 Fast 14.9 2.98 0.092 ANOVA Source of Variation SS df MS F P-value F crit Rows 1.5493333 0.3873333 21.719626 0.0002357 7.0060651 Columns 3.484 1.742 97.682243 2.395E-06 8.6490672 Error 0.1426667 8 0.0178333 Total 5.176 14 © 2002 Thomson / South-Western
Σχέδιο Παραγοντικού Πειράματος κατά δυο παράγοντες Ένα σχέδιο πειράματος στα πλαίσια του οποίου μελετώνται ταυτόχρονα δυο ή περισσότερες ανεξάρτητες μεταβλητές και κάθε επίπεδο επίδρασης μελετάται για όλες τις διαφορετικές περιπτώσεις επιδράσεων. Επίσης γνωστό ως παραγοντικό πείραμα. © 2002 Thomson / South-Western
Σχέδιο Παραγοντικού Πειράματος κατά δυο παράγοντες Κελιά . Στήλη Επίδραση Γραμμή Επίδραση © 2002 Thomson / South-Western 43
ANOVA κατά δυο παράγοντες: Υποθέσεις © 2002 Thomson / South-Western 44
Χρήσιμοι τύποι ANOVA δυο παραγόντων © 2002 Thomson / South-Western 45
Ένα 2 3 Παραγοντικό Σχέδιο Πειράματος με Αλληλεπίδραση Μέσοι των κελιών C1 C2 C3 Επιδράσεις των γραμμών R1 R2 Στήλη © 2002 Thomson / South-Western 46
Ένα 2 3 Παραγοντικό Σχέδιο Πειράματος με Μερική Αλληλεπίδραση Μέσοι των κελιών C1 C2 C3 Επιδράσεις των γραμμών R1 R2 Στήλη © 2002 Thomson / South-Western 47
Ένα 2 3 Παραγοντικό Σχέδιο Πειράματος με καμία Αλληλεπίδραση Μέσοι των κελιών C1 C2 C3 Επιδράσεις των γραμμών R1 R2 Στήλη © 2002 Thomson / South-Western 48
Παράδειγμα μερίσματος επιχείρησης Ένα 2 3 παραγοντικό σχέδιο πειράματος: Δεδομένα και Μετρήσεις 1.75 2.75 3.625 Μέρος όπου διαπραγματεύονται οι μετοχές της εταιρείας Πώς οι μέτοχοι ενημερώνονται για τα μερίσματα NYSE AMEX OTC Ετήσιες/ Τριμηνιαίες Εκθέσεις 2 1 3 4 2.5 Παρουσιάσεις στους αναλυτές 2.9167 Xj Xi X11=1.5 X23=3.75 X22=3.0 X21=2.0 X13=3.5 X12=2.5 N = 24 n = 4 X=2.7083 © 2002 Thomson / South-Western 49
Παράδειγμα μερίσματος επιχείρησης Ένα 2 3 παραγοντικό σχέδιο πειράματος : Υπολογισμοί (Μέρος 1) © 2002 Thomson / South-Western 50
Παράδειγμα μερίσματος επιχείρησης Ένα 2 3 παραγοντικό σχέδιο πειράματος: Υπολογισμοί (Μέρος 2) © 2002 Thomson / South-Western
Παράδειγμα μερίσματος επιχείρησης Ένα 2 3 παραγοντικό σχέδιο πειράματος: Υπολογισμοί (Μέρος 3) © 2002 Thomson / South-Western 52
Παράδειγμα μερίσματος επιχείρησης: Ανάλυση Διακύμανσης Πηγή διακύμανσης SS βε MS F Γραμμή 1.0418 1 1.0418 2.42 Στήλη 14.0833 2 7.0417 16.35* Αλληλεπίδραση 0.0833 2 0.0417 0.10 Σφάλμα 7.7500 18 0.4306 Σύνολο 22.9583 23 *Υποδηλώνει σημαντικότητα = .01. © 2002 Thomson / South-Western 53
Παράδειγμα μερίσματος επιχείρησηςΑποτέλεσμα Excel (Μέρος 1) Anova: Two-Factor With Replication SUMMARY NYSE ASE OTC Total Reports Count 4 12 Sum 6 10 14 30 Average 1.5 2.5 3.5 Variance 0.3333 1 Presentation 8 15 35 2 3 3.75 2.9167 0.6667 0.25 0.9924 22 29 1.75 2.75 3.625 0.5 0.2679 © 2002 Thomson / South-Western
Παράδειγμα μερίσματος επιχείρησης Αποτέλεσμα Excel (Μέρος 2) ANOVA Source of Variation SS df MS F P-value F crit Sample 1.0417 1 2.4194 0.1373 4.4139 Columns 14.083 2 7.0417 16.355 9E-05 3.5546 Interaction 0.0833 0.0417 0.0968 0.9082 Within 7.75 18 0.4306 Total 22.958 23 © 2002 Thomson / South-Western
2 -έλεγχος καλής προσαρμογής Ο 2 έλεγχος καλής προσαρμογής συγκρίνει τις αναμενομενες (θεωρητικές) συχνότητες των κατηγοριών ενός πληθυσμού με τις παρατηρούμενες (πραγματικές) συχνότητες από μια κατανομή προκειμένου να ελέγχξουμε αν υπάρχει κάποια σημαντική διαφορά μεταξύ των αναμενόμενων και πραγματικών συχνοτήτων. . © 2002 Thomson / South-Western 6
2-έλεγχος καλής προσαρμογής © 2002 Thomson / South-Western 7
Δεδομένα Πωλήσεων Γάλακτος για την Εφαρμογή 11.4 Μήνας Γαλόνια Ιανουάριος 1,553 Φεβρουάριος 1,585 Μάρτιος 1,649 Απρίλιος 1,590 Μάιος 1,497 Ιούνιος 1,443 Ιούλιος 1,410 Αύγουστος 1,450 Σεπτέμβριος 1,495 Οκτώβριος 1,564 Νοέμβριος 1,602 Δεκέμβριος 1,609 18,447 © 2002 Thomson / South-Western 8
Εφαρμογή11.4: Υποθέσεις και Κανόνες Αποφάσεων © 2002 Thomson / South-Western 9
Εφαρμογή 11.4: Υπολογισμοί Μήνες fo fe (fo - fe)2/fe Ιανουάριος 1,553 1,537.25 0.16 Φεβρουάριος 1,585 1.48 Μάρτιος 1,649 8.12 Απρίλιος 1,590 1.81 Μάιος 1,497 1.05 Ιούνιος 1,443 5.78 Ιούλιος 1,410 10.53 Αύγουστος 1,450 4.95 Σεπτέμβριος 1,495 1.16 Οκτώβριος 1,564 0.47 Νοέμβριος 1,602 2.73 Δεκέμβριος 1,609 3.35 18,447 18,447.00 41.59 Παρατηρούμενο Χ2 = 41.59 © 2002 Thomson / South-Western 10
Εφαρμογή 11.4: Συμπέρασμα βε = 11 0.01 24.725 Περιοχή Μη απόρριψης 11 Εφαρμογή 11.4: Συμπέρασμα 0.01 βε = 11 24.725 Περιοχή Μη απόρριψης © 2002 Thomson / South-Western 11
Παράδειγμα ελαττωματικών προιόντων : Χρήση του 2 ελέγχου καλής προσαρμογής για μια Πληθυσμιακή Αναλογία © 2002 Thomson / South-Western 18
Παράδειγμα ελαττωματικών προιόντων : Υπολογισμοί Παράδειγμα ελαττωματικών προιόντων : Υπολογισμοί fo fe Ελαττώματα (defects) 33 16 Μη ελαττώματα (nondefects) 167 184 200 n = 2 33 16 167 184 18.06 + 1.57 19 63 o e f = . © 2002 Thomson / South-Western 19
Παράδειγμα ελαττωματικών προιόντων : Συμπέρασμα Παράδειγμα ελαττωματικών προιόντων : Συμπέρασμα 0.05 βε= 1 3.841 Περιοχή μη απόρριψης © 2002 Thomson / South-Western 20
Ανάλυση Συνάφειας: 2 Τεστ Ανεξαρτησίας Ανάλυση Συνάφειας: 2 Τεστ Ανεξαρτησίας Ένα στατιστικό τεστ το οποίο χρησιμοποιείται για την ανάλυση των συχνοτήτων δυο μεταβλητών οι οποίες περιλαμβάνουν πολλαπλές κατηγορίες προκειμένου να αποφασίσουμε αν οι μεταβλητές είναι ανεξάρτητες μεταξύ τους. Ποιοτικές μεταβλητές Ονομαστικά δεδομένα © 2002 Thomson / South-Western 21
Επενδυτικό Παράδειγμα: 2 Τεστ Ανεξαρτησίας Σε ποιά περιοχή τη χώρας κατοικείτε; A. Βορειοανατολικά B. Μεσοδυτικά Γ. Νότια Δ. Δυτικά Ποιό από τα παρακάτω επενδυτικά προϊόντα προτιμάτε; E. Μετοχές ΣΤ. Ομόλογα Ζ. Έντοκα Γραμμάτια Δημοσίου © 2002 Thomson / South-Western 22
Επενδυτικό Παράδειγμα: 2 Τεστ Ανεξαρτησίας Επενδυτικό προϊόν E ΣΤ Ζ A O13 nA Γεωγραφική περιοχή B nB Γ nΓ Δ nΔ nE nΣΤ nΖ N Πίνακας συνάφειας © 2002 Thomson / South-Western
Επενδυτικό Παράδειγμα: 2 Τεστ Ανεξαρτησίας Τύπος χρηματοοικονομικής επένδυσης E ΣΤ Ζ A e12 nA Γεωγραφική περιοχή B nB Γ nΓ Δ nΔ nE nΣΤ nΖ N Πίνακας Συνάφειας © 2002 Thomson / South-Western 23
2 Τεστ Ανεξαρτησίας : Τύποι 2 Τεστ Ανεξαρτησίας : Τύποι ij i j e n N όπου : = η γραμμή η στήλη το σύνολο των γραμμών το σύνολο των στηλών σύνολο όλων των συχνοτήτων 2 o f βε (r - 1)(c 1) r ο αριθμός των γραμμών c Αναμενόμενες Συχνότητες Υπολογισθέν (Παρατηρούμενο ) ο αριθμός των στηλών © 2002 Thomson / South-Western 24