Ανάλυση Διακύμανσης Analysis of Variance ( ANOVA )

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Advertisements

Keller: Stats for Mgmt & Econ, 7th Ed
© 2002 Thomson / South-Western Slide 2-1 Κεφάλαιο 2 Διαγράμματα και Γραφήματα Περιγράφικής Στατιστικής.
Ιούλιος Έρευνα Καταναλωτικής Εμπιστοσύνης Ιούλιος 2012.
Έρευνα για την οικοδομική δραστηριότητα 2010 Επαμεινώνδας Ε. Πανάς Καθηγητής Οικονομικού Πανεπιστημίου Αθηνών Πρόεδρος του Τμήματος Στατιστικής Απόψεις.
1 Έρευνα 16-19/5/05 Πανελλαδική πολιτική έρευνα κοινής γνώμης ΠΕΙΡΑΙΑΣ Μάιος 2005.
Keller: Stats for Mgmt & Econ, 7th Ed
Μάρτιος 2011 Βαρόμετρο ΕΒΕΘ - Καταναλωτές. “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι.
ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ
Ιούλιος Έρευνα Καταναλωτικής Εμπιστοσύνης Ιούλιος 2012.
Ανάλυση Πολλαπλής Παλινδρόμησης
Ασκήσεις Συνδυαστικής
Πίνακας Συνάφειας & Έλεγχος χ2
Μετρήσεις Κεντρικής Τάσης
Το μοντέλο της απλής παλινδρόμησης
Βαρόμετρο ΕΒΕΘ - Καταναλωτές Σεπτέμβριος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι.
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
Πειραματικά Σχέδια Ομάδων
Ανάλυση Πολλαπλής Παλινδρόμησης
Ανάλυση Πολλαπλής Παλινδρόμησης
Γραφήματα & Επίπεδα Γραφήματα
Σχέση Απόδοσης- Κινδύνου στα Πλαίσια της Θεωρίας Χαρτοφυλακίου
Καλώς ήρθατε στις Οικονομικές Επιστήμες
Εξάσκηση στην προπαίδεια
© 2002 Thomson / South-Western Slide 10-1 Κεφάλαιο 10 Έλεγχος Υποθέσεων με δυο Δείγματα.
Keller: Stats for Mgmt & Econ, 7th Ed
Η επιρροή του χώρου εργασίας των σχολικών τάξεων στη μάθηση
Βαρόμετρο ΕΒΕΘ Μάρτιος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι του Νομού Θεσσαλονίκης”
ΝΙΚΟΛΑΟΣ ΚΟΥΜΠΟΥΛΗΣ Α.Ε.Μ. : 655/09 3Η ΕΡΓΑΣΙΑ
2006 GfK Praha CORRUPTION CLIMATE IN EUROPE % % % %0 - 10% % % % % % ΚΛΙΜΑ ΔΙΑΦΘΟΡΑΣ Η.
Βαρόμετρο ΕΒΕΘ Μάρτιος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι του Νομού Θεσσαλονίκης”
ΚΕΦΑΛΑΙΟ 3 Περιγραφική Στατιστική
Βαρόμετρο ΕΒΕΘ Σεπτέμβριος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι του Νομού.
Εκτίμηση με Απλά Δείγματα
Βαρόμετρο ΕΒΕΘ Μάρτιος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι του Νομού Θεσσαλονίκης”
Ανάλυση Πολλαπλής Παλινδρόμησης
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Τρίτο Συστήματα.
Eλέγχουμε αν η διαφορά μεταξύ δύο μέσων τιμών (Τ και P) είναι σημαντική (δηλ. αν διαφέρει από το 0 ή ότι δεν είναι τυχαία) χρησιμοποιώντας το t-test: Recall.
Ανάλυση Παλινδρόμησης με Δεδομένα Χρονολογικών Σειρών
Δομές Δεδομένων 1 Στοίβα. Δομές Δεδομένων 2 Στοίβα (stack)  Δομή τύπου LIFO: Last In - First Out (τελευταία εισαγωγή – πρώτη εξαγωγή)  Περιορισμένος.
Μεταθέσεις & Συνδυασμοί
Στατιστική Ι Παράδοση 9 Ο Δείκτης Συσχέτισης.
Παράγοντες καρδιαγγειακού κινδύνου (ΠΚΚ) σε ηλικιωμένους και υπέργηρους με ισχαιμικό αγγειακό εγκεφαλικό επεισόδιο (ι-ΑΕΕ). Η θέση του σακχαρώδη διαβήτη.
Βαρόμετρο ΕΒΕΘ - Καταναλωτές Μάρτιος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι.
Στατιστική I Χειμερινό Γ. Παπαγεωργίου
Βαρόμετρο ΕΒΕΘ Σεπτέμβριος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι του Νομού.
Απλή και Παραγοντική Ανάλυση Διακύμανσης
Μη-Παραμετρική Στατιστική
Πειραματικές Μονάδες Ένα φυτό Ένα πειραματικό τεμάχιο (plot)
ΕΙΣΑΓΩΓΗ Η επιδίωξη: βελτίωση ποιότητας με συνεχή βελτίωση των διεργασιών με βάση τις οποίες παράγονται τα προϊόντα Παράγοντες: ελεγχόμενες μεταβλητές.
Στατιστικές Υποθέσεις (Ερευνητικά Ερωτήματα / Υποθέσεις προς επιβεβαίωση)
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. –Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας.
Έλεγχος Υποθέσεων Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης, Κατά την εκτέλεση ενός στατιστικού ελέγχου,
Σχεδιασμός Γεωργικών Πειραμάτων. Πειραματικές Μονάδες Ένα Φυτό Ένα Τεμάχιο (Plot) του χωραφιού.
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Μέτρα μεταβλητότητας ή διασποράς
Επαγωγική Στατιστική Εκτίμηση και Έλεγχος μέσων τιμών Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Εκτιμητική: σημειακές εκτιμήσεις παραμέτρων
Έλεγχος Υπόθεσης για το μέσο ενός πληθυσμού
Εισαγωγή στην Στατιστική
Ανάλυση Διακύμανσης κατά ένα παράγοντα
Έλεγχος για τη διαφορά μέσων τιμών μ1 και μ2 δύο πληθυσμών
Παραγοντικά Πειράματα (Factorial Experiments)
Έλεγχος υποθέσεων με την χ2 «χι -τετράγωνο» κατανομή
Πειραματικές Μονάδες Ένα φυτό Ένα πειραματικό τεμάχιο (plot)
ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ
Ανάλυση Διασποράς (ANOVA) Κατά Έναν Παράγοντα
Ανάλυση διακύμανσης Τι είναι η ανάλυση διακύμανσης
Μεταγράφημα παρουσίασης:

Ανάλυση Διακύμανσης Analysis of Variance ( ANOVA ) Κεφάλαιο 14 Ανάλυση Διακύμανσης Analysis of Variance ( ANOVA )

Ανάλυση Διακύμανσης… Η Ανάλυση Διακύμανσης είναι μία τεχνική που μας επιτρέπει να συγκρίνουμε δύο ή περισσότερους πληθυσμούς με διαστημικά δεδομένα. Η Ανάλυση Διακύμανσης είναι:  μία ακραίως δυναμική και ευρέως εφαρμοσμένη διαδικασία.  μία διαδικασία που καθορίζει εάν υπάρχουν διαφορές μεταξύ των μέσων των πληθυσμών.  μία διαδικασία η οποία δουλεύει με την ανάλυση δειγματοληπτική διακύμανση.

Ανάλυση Διακύμανσης Ενός Παράγοντα … Ανεξάρτητα δείγματα επιλέγονται από k πληθυσμούς: Σημειώστε: Αυτοί οι πληθυσμοί καλούνται ως αγωγές. Δεν απαιτείται ότι n1 = n2 = … = nk.

Πίνακας 14.1 Συμβολισμός για Ανάλυση Διακύμανσης με Έναν Παράγοντα Αγωγή Μέγεθος Δείγματος Δειγματοληπτική Μέση Τιμή

Δειγματοληπτική Μέση Τιμή X είναι μία «μεταβλητή απόκρισης». Συμβολισμός Ανεξάρτητα Δείγματα επιλέγονται από k πληθυσμούς (αγωγές). 1 2 k Πρώτη παρατήρηση, πρώτο δείγμα X11 x21 . Xn1,1 X12 x22 . Xn2,2 X1k x2k . Xnk,k Δεύτερη παρατήρηση, δεύτερο δείγμα Μέγεθος Δείγματος Δειγματοληπτική Μέση Τιμή X είναι μία «μεταβλητή απόκρισης».

Ανάλυση Διακύμανσης με Έναν Παράγοντα … Νέα Ορολογία: x είναι η μεταβλητή απόκρισης, και οι τιμές της είναι οι αποκρίσεις. xij αναφέρεται στην i στη παρατήρηση στο j στο δείγμα. Π.χ. x35 είναι η τρίτη παρατήρηση από το πέμπτο δείγμα. nj ∑ xij xj = μέσος του jth δείγματος = nj i=1 nj = ο αριθμός των παρατηρήσεων του δείγματος από τον jστο πληθυσμό.

Ανάλυση Διακύμανσης με Έναν Παράγοντα …

Ανάλυση Διακύμανσης με Έναν Παράγοντα… Επιπρόσθετη Νέα Ορολογία: Η μονάδα που μετρούμε καλείται πειραματική μονάδα. Το κριτήριο το οποίο ταξινομεί τους πληθυσμούς καλείται παράγοντας. Κάθε πληθυσμός καλείται επίπεδο παράγοντα.

Παράδειγμα 14-1 … Μία εταιρία παρασκευάζει έναν νέο προϊόν χυμού μήλου με τα εξής χαρακτηριστικά … καλύτερη συσκευασία, ίδια ή καλύτερη ποιότητα, και χαμηλότερη τιμή όταν συγκρίνονται με ήδη υπάρχοντα προϊόντα. Ποιο χαρακτηριστικό θα ήταν καλύτερα να προβάλει η εταιρεία με διαφημιστική εκστρατεία; Πρώτου να διαφημιστεί το προϊόν σε εθνικό επίπεδο, δοκιμάζονται τα τρία χαρακτηριστικά σε τρεις πόλεις, και τα δεδομένα καταγράφονται … Υπάρχουν διαφορές στις πωλήσεις μεταξύ στις τρεις παραπάνω αγορές;

Πόλη 1 Πόλη 2 Πόλη 3 (Συσκευασία) (Ποιότητα) (Τιμή) 529.00 658.00 793.00 514.00 663.00 719.00 711.00 606.00 461.00 498.00 604.00 495.00 485.00 557.00 353.00 542.00 614.00 804.00 630.00 774.00 717.00 679.00 604.00 620.00 697.00 706.00 615.00 492.00 719.00 787.00 699.00 572.00 523.00 584.00 634.00 580.00 624.00 672.00 531.00 443.00 596.00 602.00 502.00 659.00 689.00 675.00 512.00 691.00 733.00 698.00 776.00 561.00 572.00 469.00 581.00 679.00 532.00 Δεδομένα Xm15-01

Κόμμα προστίθεται για διευκρίνιση Παράδειγμα 14-1 … Ορολογία x είναι η μεταβλητή απόκρισης, και οι τιμές της είναι αποκρίσεις. εβδομαδιαίες πωλήσεις είναι η μεταβλητή απόκρισης; οι ακριβείς πωλήσεις είναι οι αποκρίσεις στο παράδειγμα. xij αναφέρεται στην iστη παρατήρηση στο jστο δείγμα. Δηλαδή x42 είναι οι πωλήσεις στην τέταρτη εβδομάδα από την Πόλη #2: 717 συσκευασίες. x20, 3 είναι οι πωλήσεις της τελευταίας εβδομάδας από την Πόλη #3: 532 συσκευασίες. Κόμμα προστίθεται για διευκρίνιση

Παράδειγμα 14-1 … Η μονάδα που μετρούμε καλείται πειραματική μονάδα. Ορολογία Η μονάδα που μετρούμε καλείται πειραματική μονάδα. Η μεταβλητή απόκρισης είναι οι εβδομαδιαίες πωλήσεις Το κριτήριο το οποίο ταξινομεί τους πληθυσμούς καλείται παράγοντας. Η στρατηγική διαφήμισης είναι ο παράγοντας που μας ενδιαφέρει. Αυτός είναι ο μόνος παράγοντας που μελετάμε (εκ’ τούτου ο όρος «ενός παράγοντα» ανάλυση διακύμανσης). Κάθε πληθυσμός είναι ένα επίπεδο παράγοντα. Στο παράδειγμα, υπάρχουν τρία επίπεδα παράγοντα: συσκευασία, ποιότητα, και τιμή.

Ορολογία Σε αυτό το πρόβλημα … Μεταβλητή απόκρισης – εβδομαδιαίες πωλήσεις Αποκρίσεις – ακριβείς τιμές πωλήσεων Πειραματική μονάδα – εβδομάδες στις τρεις πόλεις όταν καταγράφουμε τιμές πωλήσεων. Παράγοντας – το κριτήριο με το οποίο ταξινομούμε πληθυσμούς (οι αγωγές). Σε αυτό το πρόβλημα ο παράγοντας είναι η στρατηγική του μάρκετινγκ. Επίπεδα παράγοντα – Τα ονόματα των πληθυσμών (αγωγών). Σε αυτό το πρόβλημα τα επίπεδα του παράγοντα είναι οι στρατηγικές του μάρκετινγκ.

Παράδειγμα 14-1 … Η μηδενική υπόθεση σε αυτή την περίπτωση είναι: Αναγνωρίστε Η μηδενική υπόθεση σε αυτή την περίπτωση είναι: H0: μ1= μ2 =μ3 δηλαδή δεν υπάρχουν διαφορές μεταξύ των μέσων των πληθυσμών. Η εναλλακτική υπόθεση γίνεται: H1: τουλάχιστον δύο μέσοι διαφέρουν Τώρα, χρειαζόμαστε κάποιο στατιστικό τεστ …

Ο ορθολογισμός του στατιστικού τεστ Δύο είδη μεταβλητότητας δουλεύονται όταν ελέγχουμε την ισότητα των μέσων των πληθυσμών.

Ο ορθολογισμός πίσω από το στατιστικό τεστ – I Εάν η μηδενική υπόθεση είναι αληθές, θα αναμένουμε όλοι οι δειγματοληπτικοί μέσοι να είναι κοντά μεταξύ τους (και έτσι κοντά στον συνολικό μέσο). Εάν η εναλλακτική υπόθεση είναι αληθές, τουλάχιστον κάποιοι από τους μέσους θα διαφέρουν. Έτσι, μετράμε την μεταβλητότητα μεταξύ των δειγματοληπτικών μέσων.

Μεταβλητότητα μεταξύ στους δειγματοληπτικούς μέσους Η μεταβλητότητα μεταξύ των δειγματοληπτικών μέσων μετράτε ως το άθροισμα των τετραγώνων των αποστάσεων μεταξύ σε κάθε μέσο και τον συνολικό μέσο. Αυτό το άθροισμα καλείται το Άθροισμα Τετραγωνικών Αγωγών (Sum of Squares for Treatments) SST Στο παράδειγμα μας οι αγωγές αντιπροσωπεύονται από τις διαφορετικές στρατηγικές διαφήμισης.

Άθροισμα τετραγώνων των αγωγών (SST) There are k treatments Σημειώστε: Όταν οι δειγματοληπτικοί μέσοι είναι κοντά ο ένας με τον άλλο, οι αποστάσεις τους από τον συνολικό μέσο είναι μικρές, καταλήγοντας με ένα μικρό SST. Έτσι, μεγάλο SST υποδεικνύει μεγάλη διασπορά μεταξύ των δειγματοληπτικών μέσων, που υποστηρίζει H1. The mean of sample j The size of sample j

Στατιστικοί Έλεγχοι … Αφού μ1= μ2 =μ3 είναι αυτό που μας ενδιαφέρει, μία στατιστική που μετράει την εγγύτητα των δειγματοληπτικών μέσων θα μας ενδιέφερε. Μία τέτοια στατιστική υπάρχει, και καλείται διασπορά μεταξύ αγωγών. Συμβολίζεται ως SST, συντομογραφία για «Άθροισμα τετραγώνων των αγωγών », και υπολογίζεται ως: Συνολικός μέσος Άθροισμα επί k αγωγών Ένα μεγάλο SST υποδεικνύει μεγάλη διασπορά μεταξύ δειγματοληπτικών μέσων και υποστηρίζει την H1.

Παράδειγμα 14.1… ΥΠΟΛΟΓΙΣΤΕ Αφού: Εάν είχαμε την περίπτωση: τότε SST = 0 και η μηδενική υπόθεση, H0: Θα υποστηριζόταν. Πιο γενικά, μία «μικρή τιμή» του SST υποστηρίζει την μηδενική υπόθεση. Η ερώτηση είναι, πόσο μικρή είναι «μικρή αρκετά»;

Παράδειγμα 14.1… ΥΠΟΛΟΓΙΣΤΕ Τα ακόλουθα δειγματοληπτικά στατιστικά στοιχεία και ο συνολικός μέσος υπολογίζονται … Εκ τούτου, η διασπορά μεταξύ αγωγών, το άθροισμα τετραγώνων των αγωγών, είναι: Είναι SST = 57,512.23 «αρκετά μεγάλο» για να υποδείξουμε ότι οι μέσοι των πληθυσμών διαφέρουν;

Ο ορθολογισμός πίσω από το στατιστικό τεστ – IΙ Μεγάλη μεταβλητότητα εντός (within) των δειγμάτων εξασθενεί την «ικανότητα» των δειγματοληπτικών μέσων να αντιπροσωπεύουν τους μέσους των πληθυσμών. Συνεπώς, ακόμα και αν οι δειγματοληπτικοί μέσοι ενδέχεται να διαφέρουν αξιοσημείωτα ο ένας με τον άλλο, SST πρέπει να συνεκτιμήθει σε σχέση ως προς την «διασπορά εντός δειγμάτων».

Διασπορά Εντός Δειγμάτων Η μεταβλητότητα εντός δειγμάτων μετριέται προσθέτοντας όλες τις τετραγωνισμένες αποστάσεις μεταξύ των παρατηρήσεων και των δειγματοληπτικών μέσων. Αυτό καλείται το Άθροισμα Τετραγώνων των Σφαλμάτων (Sum of Squares for Error) SSE Στο παράδειγμά μας αυτό είναι το άθροισμα όλων των τετραγωνισμένων διαφορών sum of all squared differences μεταξύ των πωλήσεων της πόλης j και του δειγματοληπτικού μέσου της πόλης j (και στις τρεις πόλεις).

Στατιστικοί Έλεγχοι… SST μας δίνει την διασπορά εντός αγωγών. Ένα δεύτερο στατιστικό στοιχείο, SSE (Άθροισμα Τετραγώνων των Σφαλμάτων) μετράει την διασπορά εντός αγωγών. SSE δίνεται από: ή: Στην δεύτερη διατύπωση, είναι ευκολότερο να δούμε ότι παρέχει ένα μέτρο του ποσού της διασποράς που μπορούμε να αναμένουμε από την τυχαία μεταβλητή που παρατηρούμε.

Παράδειγμα 14.1… Και από αυτές, υπολογίζουμε την διασπορά ΥΠΟΛΟΓΙΣΤΕ Υπολογίζουμε τις δειγματοληπτικές διακυμάνσεις ως: 3 Και από αυτές, υπολογίζουμε την διασπορά εντός αγωγών ως:

Άθροισμα Τετραγώνων των Σφαλμάτων (SSE) Είναι το SST = 57,512.23 αρκετά μεγάλο σε σχέση ως προς το SSE = 506,983.50 ώστε να απορρίψουμε την μηδενική υπόθεση που προϋποθέτει ότι όλοι οι μέσοι είναι ίσοι; Χρειαζόμαστε ακόμα μερικές ποσότητες ώστε να συσχετίσουμε το SST και το SSE μαζί με ωφέλιμο τρόπο…

Μέσοι Τετραγώνων … ν1 = 3 – 1 = 2 ; ν2 = 60 – 3 = 57 Ο μέσος τετραγώνων των αγωγών (MST) δίνεται από: είναι F-κατανεμημένη με k–1 και n–k βαθμούς ελευθερίας. Ο μέσος τετραγώνων των σφαλμάτων (MSE) δίνεται από: Και ο στατιστικός έλεγχος: ν1 = 3 – 1 = 2 ; ν2 = 60 – 3 = 57

Παράδειγμα 14.1… ΥΠΟΛΟΓΙΣΤΕ Μπορούμε να υπολογίσουμε τους μέσους των τετραγώνων των αγωγών και τους μέσους των τετραγώνων των σφαλμάτων ως:

Σημειώστε ότι απαιτούνται οι υποθέσεις: Παράδειγμα 14.1… ΥΠΟΛΟΓΙΣΤΕ Δοθέντος την F-στατιστική: Πέφτει η F = 3.23 στην περιοχή απόρριψης ή όχι; Πως συγκρίνεται με την κριτική τιμή της F; Σημειώστε ότι απαιτούνται οι υποθέσεις: 1. Οι ελεγχόμενοι πληθυσμοί είναι κανονικά κατανεμημένοι. 2. Οι διακυμάνσεις όλων των πληθυσμών είναι ίσες.

Παράδειγμα 14.1… ΕΡΜΗΝΕΥΣΤΕ Αφού ο στόχος του υπολογισμού της F-στατιστικής είναι να καθορίσουμε αν η τιμή του SST είναι αρκετά μεγάλο ώστε να απορρίψουμε την μηδενική υπόθεση, εάν SST είναι μεγάλο, τότε και το F θα είναι μεγάλο. Άρα η περιοχή απόρριψης είναι: Η τιμή της Fκριτική είναι:

Παράδειγμα 14.1… ΕΡΜΗΝΕΥΣΤΕ Αφού F = 3.23 είναι μεγαλύτερη από την Fκριτική = 3.15, απορρίπτουμε την μηδενική υπόθεση (H0: μ1= μ2 =μ3 ) για την εύνοια της εναλλακτικής υπόθεσης (H1: τουλάχιστον δύο μέσοι των πληθυσμών διαφέρουν). Δηλαδή είναι: υπάρχει αρκετή μαρτυρία να συμπεράνουμε ότι οι μέσοι των εβδομαδιαίων πωλήσεων διαφέρουν μεταξύ των τριών πόλεων. Με άλλα λόγια: είμαστε αρκετά έμπιστοι ότι η διαφορετική στρατηγική που χρησιμοποιήθηκε για την διαφήμιση των προϊόντων θα προξενήσει διαφορές στις πωλήσεις.

Η Δειγματοληπτική Κατανομή για το Παράδειγμα 14.1 π-τιμή = .0468 Περιοχή Απόρριψης

Περίληψη των Τεχνικών (μέχρι τώρα)… Ανάλυσης Διακύμανσης Άθροισμα Τετραγώνων Μέσος Τετραγώνων Αγωγές Σφάλματα Στατιστικός Έλεγχος:

ANOVA Πίνακας… Τα αποτελέσματα της ανάλυσης της διακύμανσης (analysis of variance) συνήθως παρουσιάζονται σε έναν ANOVA πίνακα… Source of Variation degrees of freedom Sum of Squares Mean Square Treatments k–1 SST MST=SST/(k–1) Error n–k SSE MSE=SSE/(n–k) Total n–1 SS(Total) F-stat=MST/MSE

ANOVA Πίνακας για το Παράδειγμα 14.1

Ανάλυση Διακύμανσης σε Σχεδιασμό Πειραμάτων Ανάλυση Διακύμανσης σε Σχεδιασμό Πειραμάτων Ο σχεδιασμός πειράματος είναι ένας από τους παράγοντες που καθορίζει ποια τεχνική θα χρησιμοποιήσουμε. Στο προηγούμενο παράδειγμα συγκρίνουμε τρεις πληθυσμούς βασισμένοι σε έναν παράγοντα – στρατηγική διαφήμισης.

Ανάλυση Διακύμανσης σε Σχεδιασμό Πειραμάτων Ανάλυση Διακύμανσης σε Σχεδιασμό Πειραμάτων Ένα πολύ-παραγοντικό πείραμα είναι ένα πείραμα στο οποίο δύο ή περισσότεροι παράγοντες ορίζουν τις αγωγές. Για παράδειγμα, εάν αντί να ποικίλουμε μόνο την στρατηγική διαφήμισης, μπορούμε να ποικίλουμε τα μέσα διαφήμισης (δηλαδή, τηλεόραση ή εφημερίδα), τότε έχουμε ανάλυση διακύμανσης δύο παραγόντων. Ο πρώτος παράγοντας, στρατηγική διαφήμισης, έχει τρία επίπεδα (συσκευασία, ποιότητα, και τιμή) ενώ ο δεύτερος παράγοντας, μέσο διαφήμισης, έχει δύο επίπεδα (TV ή εφημερίδα).

One - way ANOVA Single factor Two - way ANOVA Two factors Δύο παράγοντες One - way ANOVA Single factor Two - way ANOVA Two factors Response Response Treatment 3 (level 1) Treatment 2 (level 2) Treatment 1 (level 3) Level 3 Ένας παράγοντας Level2 Factor A Level 1 Level2 Level 1 Factor B

Ανεξάρτητα Δείγματα και Τεμάχια Όπως και στα «Ζεύγη Δειγμάτων», ένα σχέδιο με τυχαιοποιημένα τεμάχια (blocks) περιορίζει την διασπορά εντός των δειγμάτων, κάνοντας ευκολότερη την ανίχνευση διαφορών μεταξύ πληθυσμών. Ο όρος τεμάχιο αναφέρεται ως ταιριαστές ομάδες παρατηρήσεων από κάθε πληθυσμό. Μπορούμε επίσης να εκτελέσουμε ένα πείραμα με τεμάχια χρησιμοποιώντας το ίδιο υποκείμενο για κάθε τεμάχιο σε ένα πείραμα με «επαναλαμβανόμενα μέτρα».

Ανάλυση Διακύμανσης Τυχαιοποιημένων Τεμαχίων Ο σκοπός του σχεδιασμού ενός πειράματος με τυχαιοποιημένα τεμάχια είναι να περιορίσει την διασπορά εντός αγωγών για την πιο εύκολη ανίχνευση διαφορών μεταξύ των μέσων των αγωγών. Σε αυτό το σχέδιο, διαμελίζουμε την συνολική απόκλιση σε τρεις πηγές απόκλισης: SS(Total) = SST + SSB + SSE όπου SSB, το άθροισμα τετραγώνων των τεμαχίων, μετρά την απόκλιση μεταξύ των τεμαχίων.

Τυχαιοποιημένα Τεμάχια Τεμαχίστε όλες τις παρατηρήσεις με κάποια ομοιότητα επί των αγωγών Αγωγή 4 Αγωγή 3 Αγωγή 2 Αγωγή 1 Τεμάχιο 3 Τεμάχιο 2 Τεμάχιο 1

Τυχαιοποιημένα Τεμάχια … Επιπρόσθετα στις k αγωγές, εισάγουμε συμβολισμό για b τεμάχια στον σχεδιασμό του πειράματος … Μέσος των παρατηρήσεων του 1ου τεμαχίου Τεμάχια Αγωγές Μέσος των παρατηρήσεων της 2ης αγωγής

Αθροίσματα Τετραγώνων: Τυχαιοποιημένα Τεμάχια … Αθροίσματα Τετραγώνων: Τυχαιοποιημένα Τεμάχια … Τετραγωνίζοντας την «απόσταση» από τον συνολικό μέσο, οδηγούμαστε στον ακόλουθους τύπους … Στατιστικός έλεγχος για αγωγές Στατιστικός έλεγχος για τεμάχια

ANOVA Πίνακας… Μπορούμε να συνοψίσουμε αυτή την νέα πληροφορία σε έναν πίνακα ανάλυση διακύμανσης (ANOVA) με τυχαιοποιημένα τεμάχια ως έξης … Πηγή Απόκλισης β.ε.: Άθροισμα Τετραγώνων Μέσος Τετραγώνων F στατιστική Αγωγές k–1 SST MST=SST/(k–1) F=MST/MSE Τεμάχια b–1 SSB MSB=SSB/(b-1) F=MSB/MSE Σφάλμα n–k–b+1 SSE MSE=SSE/(n–k–b+1) Σύνολο n–1 SS(Total)

Στατιστικοί Έλεγχοι & Περιοχές Απόρριψης … Στατιστικοί Έλεγχοι & Περιοχές Απόρριψης … Στατιστικός Έλεγχος Περιοχή Απόρριψης Αγωγές Τεμάχια

Παράδειγμα 14.2… ΑΝΑΓΝΩΡΙΣΤΕ Έχουν διαφορετική αποτελεσματικότητα τέσσερα νέα φάρμακα; 25 ομάδες αντρών δημιουργήθηκαν σύμφωνα με την ηλικία και το βάρος, και τα αποτελέσματα καταγράφηκαν. Οι υποθέσεις για να έλεγχο αυτής της περίπτωσης είναι: H0: μ1= μ2 =μ3 = μ4 H1: Τουλάχιστον δύο μέσοι διαφέρουν

Ομάδα Φάρμακο 1 Φάρμακο 2 Φάρμακο 3 Φάρμακο 4 2.70 2.40 6.50 16.20 8.30 5.40 15.40 17.10 7.70 16.10 9.00 24.30 9.30 19.20 18.70 18.90 7.90 23.80 8.80 26.70 25.20 27.30 17.60 25.60 26.10 1.00 2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00 13.00 14.00 15.00 16.00 17.00 18.00 19.00 20.00 21.00 22.00 23.00 24.00 25.00 6.60 7.10 7.50 9.90 13.80 13.90 15.90 14.30 16.00 16.30 14.60 18.70 17.30 19.60 20.70 18.40 21.50 20.40 21.90 22.50 25.20 23.00 23.70 28.40 12.60 3.50 4.40 7.50 6.40 13.50 16.90 11.40 14.80 18.60 21.20 10.00 17.00 21.00 27.20 26.80 28.00 31.70 11.90 28.70 29.50 22.20 19.50 31.20 8.70 9.30 10.00 12.60 10.60 15.40 16.30 18.90 13.70 19.40 18.50 21.10 19.30 21.90 22.10 25.40 26.50 22.20 23.50 19.60 30.10 26.60 24.50 27.40

Παράδειγμα 14.2… ΑΝΑΓΝΩΡΙΣΤΕ Κάθε από τα τέσσερα φάρμακα μπορεί να θεωρηθεί ως αγωγή. Κάθε ομάδα μπορεί να τεμαχιστεί, αφού κατασκευαστήκαν σύμφωνα με την ηλικία και το βάρος. Σχεδιάζοντας το πείραμα κατά αυτό τον τρόπο, εξαλείφουμε την μεταβλητότητα της μείωσης της χοληστερίνης σε διαφορετικούς συνδυασμούς ηλικίας και βάρους. Αυτό βοηθάει να ανιχνεύσουμε διαφορές στην μείωση του μέσου χοληστερίνης αποδομένη σε διαφορετικά φάρμακα.

Παράδειγμα 14.2… Τα δεδομένα Ομάδα Φάρμακο 4 1 6.6 12.6 2.7 8.7 14 Φάρμακο 1 Φάρμακο 2 Φάρμακο 3 Φάρμακο 4 1 6.6 12.6 2.7 8.7 14 19.6 17.0 19.2 21.9 2 7.1 3.5 2.4 9.3 15 20.7 21.0 18.7 22.1 3 7.5 4.4 6.5 10.0 16 18.4 27.2 18.9 19.4 4 9.9 16.2 17 21.5 26.8 7.9 25.4 5 13.8 6.4 8.3 10.6 18 20.4 28.0 23.8 26.5 6 13.9 13.5 5.4 15.4 19 31.7 8.8 22.2 7 15.9 16.9 16.3 20 22.5 11.9 26.7 23.5 8 14.3 11.4 17.1 21 28.7 25.2 9 16.0 7.7 13.7 22 29.5 27.3 30.1 10 14.8 16.1 23 23.0 17.6 26.6 11 14.6 18.6 9.0 18.5 24 23.7 19.5 25. 6 24.5 12 21.2 24.3 21.1 25 28.4 31.2 26.1 27.4 13 17.3 19.3

Έξοδος Υπολογιστικού Προγράμματος b - 1 K - 1 MSB MST Τεμάχια Αγωγές

Η π-τιμή καθορίζει εάν υπάρχουν διαφορές μεταξύ των τεσσάρων φαρμάκων (αγωγών) είναι .009. Έτσι απορρίπτουμε την H0 για την εύνοια της εναλλακτικής υπόθεσης: τουλάχιστον δύο μέσοι διαφέρουν. Η π-τιμή για ομάδες = 0 υποδεικνύει ότι υπάρχουν διαφορές μεταξύ των ομάδων των αντρών (τεμάχια) δηλαδή: ηλικία και βάρος έχουν επιρροή, αλλά ο σχεδιασμός του πειράματος ερμηνεύει για αυτό.

Ανάλυση Διακύμανσης Δύο Παραγόντων… Το σχέδιο του Παραδείγματος 14.1 εξετάζει έναν παράγοντα, ονομαστικά τα αποτελέσματα της στρατηγικής του μάρκετινγκ στις πωλήσεις. Έμφαση σε συσκευασία, Έμφαση σε ποιότητα, ή Έμφαση σε τιμή. Υποθέστε ότι εισάγουμε έναν δεύτερο παράγοντα, που εξετάζει τις επιδράσεις των επιλεγμένων μέσων στις πωλήσεις, δηλαδή: Διαφήμιση στην τηλεόραση, ή Διαφήμιση στις εφημερίδες. Σε ποιους παράγοντες ή στην αλληλεπίδραση των παραγόντων μπορούν να αποδοθούν οποιεσδήποτε διαφορές στους μέσους των πωλήσεων του χυμού μήλου;

Παράδειγμα 14.3 Έλεγχος των Στρατηγικών Διαφήμισης και των Μέσων Διαφήμισης Κατασκευή Μέσο: Τηλεόραση & Εφημερίδα Πόλη 1: Συσκευασία – Τηλεόραση Πόλη 2: Συσκευασία – Εφημερίδα Πόλη 3: Ποιότητα - Τηλεόραση Πόλη 4: Ποιότητα – Εφημερίδα Πόλη 5: Τιμή - Τηλεόραση Πόλη 6: Τιμή - Εφημερίδα

Δεδομένα πωλήσεων Π-1 Π-2 Π-3 Π-4 Π-5 Π-6 491 464 677 689 575 803 712 559 627 650 614 584 558 759 590 704 706 525 447 557 632 652 484 498 479 528 683 576 478 812 624 670 760 836 650 565 546 534 690 628 583 708 444 657 548 798 536 546 582 557 579 497 579 616 672 474 644 841 795 587

Τα δεδομένα Παράγοντας A: Στρατηγική: Συσκευασία; Ποιότητα; & Τιμή Παράγοντας B : Μέσο; Τηλεόραση & Εφημερίδα Συσκευασία Ποιότητα Τιμή Συσκευασία Ποιότητα Τιμή Τηλεόραση 491 677 575 Τηλεόραση 712 627 614 Τηλεόραση 558 590 706 Τηλεόραση 447 632 484 Τηλεόραση 479 683 478 Τηλεόραση 624 760 650 Τηλεόραση 546 690 583 Τηλεόραση 444 548 536 Τηλεόραση 582 579 579 Τηλεόραση 672 644 795 Εφημερίδα 464 689 803 Εφημερίδα 559 650 584 Εφημερίδα 759 704 525 Εφημερίδα 557 652 498 Εφημερίδα 528 576 812 Εφημερίδα 670 836 565 Εφημερίδα 534 628 708 Εφημερίδα 657 798 546 Εφημερίδα 557 497 616 Εφημερίδα 474 841 587

Παράγοντας «A» • Στρατηγική Παράδειγμα 14.3 … Τα Δεδομένα Παράγοντας «A» • Στρατηγική Παράγοντας «Β» Μέσο Υπάρχουν a = 3 επίπεδα του παράγοντα A, b = 2 επίπεδα του παράγοντα B, αποδίδοντας 3 x 2 = 6 επαναλήμματα, κάθε επανάλημμα έχει r = 10 παρατηρήσεις…

Πίνακας ANOVA … Πηγή Απόκλισης β.ε.: Άθροισμα Τετραγώνων Μέσος Τετραγώνων F Στατιστική Παράγοντας A a-1 SS(A) MS(A)=SS(A)/(a-1) F=MS(A)/MSE Παράγοντας B b–1 SS(B) MS(B)=SS(B)/(b-1) F=MS(B)/MSE Άλλη_ λεπίδραση (a-1)(b-1) SS(AB) MS(AB) = SS(AB) [(a-1)(b-1)] F=MS(AB)/MSE Σφάλμα n–ab SSE MSE=SSE/(n–ab) Σύνολο n–1 SS(Total)

Ανάλυση Διακύμανσης Δύο Παραγόντων… Έλεγχος για τις διαφορές μεταξύ των Επιπέδων του Παράγοντα A… H0: Οι μέσοι των επιπέδων του Παράγοντα Α είναι ίσοι (a) H1: Τουλάχιστον δύο μέσοι διαφέρουν Στατιστικός Έλεγχος: F = MS(A) / MSE Παράδειγμα 14.3: Υπάρχουν διαφορές στους μέσους των πωλήσεων που προκληθήκαν από διαφορετικές στρατηγικές μάρκετινγκ; H0: μσυσκευασία = μποιότητα = μτιμή

Ανάλυση Διακύμανσης Δύο Παραγόντων… Έλεγχος για τις διαφορές μεταξύ των Επιπέδων του Παράγοντα B… H0: Οι μέσοι των επιπέδων του Παράγοντα B είναι ίσοι H1: Τουλάχιστον δύο μέσοι διαφέρουν Στατιστικός Έλεγχος: F = MS(B) / MSE Παράδειγμα 14.3: Υπάρχουν διαφορές στους μέσους των πωλήσεων που προκληθήκαν από διαφορετικά μέσα διαφήμισης; H0: μτηλεόραση = μεφημερίδα

Ανάλυση Διακύμανσης Δύο Παραγόντων… Έλεγχος για την αλληλεπίδραση μεταξύ των Παραγόντων A και B… H0: Οι Παράγοντες A και B δεν αλληλεπιδρούν ώστε να επηρεάσουν τους μέσους των αποκρίσεων. H1: Οι Παράγοντες A και B αλληλεπιδρούν ώστε να επηρεάσουν τους μέσους των αποκρίσεων. Στατιστικός Έλεγχος: F = MS(AB) / MSE Παράδειγμα 14.3: Υπάρχουν διαφορές στους μέσους των πωλήσεων που προκληθήκαν από αλληλεπιδράσεις μεταξύ στρατηγικών μάρκετινγκ και μέσων διαφήμισης; H0: μσυσκευασία & τηλεόραση = μποιότητα & τηλεόραση = μτιμή & εφημερίδα H1: Τουλάχιστον δύο μέσοι διαφέρουν

ΥΠΟΛΟΓΙΣΤΕ Έξοδος Υπολογιστή Παράγοντας A – Στρατηγική Μάρκετινγκ Παράγοντας B - Μέσο Αλληλεπίδραση A&B Σφάλμα

Υπάρχει μαρτυρία, με 5% επίπεδο σημαντικότητας, Παράδειγμα 14.3 … ΕΡΜΗΝΕΥΣΤΕ Υπάρχει μαρτυρία, με 5% επίπεδο σημαντικότητας, να συμπεράνουμε ότι υπάρχουν διαφορές στις εβδομαδιαίες πωλήσεις μεταξύ των διαφορετικών στρατηγικών μάρκετινγκ (Παράγοντας A).

Δεν υπάρχει μαρτυρία, με 5% επίπεδο σημαντικότητας, Παράδειγμα 14.3 … ΕΡΜΗΝΕΥΣΤΕ Δεν υπάρχει μαρτυρία, με 5% επίπεδο σημαντικότητας, να συμπεράνουμε ότι υπάρχουν διαφορές στις εβδομαδιαίες πωλήσεις μεταξύ διαφήμισης με τηλεόραση και με εφημερίδα (Παράγοντας B).