Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Ανάλυση Διασποράς (ANOVA) Κατά Έναν Παράγοντα

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Ανάλυση Διασποράς (ANOVA) Κατά Έναν Παράγοντα"— Μεταγράφημα παρουσίασης:

1 Ανάλυση Διασποράς (ANOVA) Κατά Έναν Παράγοντα
Κεφάλαιο 10 Έλεγχοι Δύο Δειγμάτων και Ανάλυση Διασποράς (ANOVA) Κατά Έναν Παράγοντα

2 Στόχοι Σε αυτό το κεφάλαιο μαθαίνετε:
Πώς να χρησιμοποιήσετε τον έλεγχο υποθέσεων για τη σύγκριση της διαφοράς μεταξύ Των μέσων δύο ανεξάρτητων πληθυσμών Των μέσων δύο συσχετισμένων πληθυσμών Των ποσοστών δύο ανεξάρτητων πληθυσμών Των διασπορών δύο ανεξάρτητων πληθυσμών Των μέσων περισσότερων από δύο πληθυσμών

3 Έλεγχοι Δύο Δειγμάτων Έλεγχοι Δύο Δειγμάτων DCOVA
Πληθυσμιακοί Μέσοι, Ανεξάρτητα Δείγματα Πληθυσμιακοί Μέσοι, Συσχετισμένα Δείγματα Πληθυσμιακά Ποσοστά Πληθυσμιακές Διασπορές Παραδείγματα: Ομάδα 1 έναντι Ομάδας 2 Ίδια ομάδα προ αντιμετώπισης έναντι μετά αντιμετώπισης Ποσοστό 1 έναντι Ποσοστού 2 Διασπορά 1 έναντι Διασποράς 2

4 Διαφορά Μεταξύ Δύο Μέσων
DCOVA Στόχος: Ο έλεγχος υποθέσεων ή ο σχηματισμός ενός διαστήματος εμπιστοσύνης για την διαφορά μεταξύ δύο πληθυσμιακών μέσων, μ1 – μ2 Πληθυσμιακοί μέσοι, ανεξάρτητα δείγματα * σ1 και σ2 άγνωστα, θεωρούνται ίσα Η σημειακή εκτίμηση για την διαφορά είναι X1 – X2 σ1 και σ2 άγνωστα, δεν θεωρούνται ίσα

5 Διαφορά Μεταξύ Δύο Μέσων: Ανεξάρτητα Δείγματα
Διαφορά Μεταξύ Δύο Μέσων: Ανεξάρτητα Δείγματα DCOVA Διαφορετικές πηγές δεδομένων Μη Συσχετισμένα Ανεξάρτητα Το δείγμα που επιλέγεται από έναν πληθυσμό δεν έχει επίδραση στο δείγμα που επιλέγεται από τον άλλο πληθυσμό Πληθυσμιακοί μέσοι, ανεξάρτητα δείγματα * Χρησιμοποιήστε Sp για να εκτιμήσετε το άγνωστο σ. Χρησιμοποιήστε έναν έλεγχο t σταθμισμένης διασποράς. σ1 και σ2 άγνωστα, θεωρούνται ίσα Χρησιμοποιήστε S1 και S2 για να εκτιμήσετε τα άγνωστα σ1 και σ2. Χρησιμοποιήστε έναν έλεγχο t ξεχωριστών ή άνισων διασπορών σ1 και σ2 άγνωστα, δεν θεωρούνται ίσα

6 Έλεγχοι Υποθέσεων για Δύο Πληθυσμιακούς Μέσους
DCOVA Δύο Πληθυσμιακοί μέσοι, Ανεξάρτητα Δείγματα Έλεγχος Κατώτερου άκρου: H0: μ1  μ2 H1: μ1 < μ2 δηλ., H0: μ1 – μ2  0 H1: μ1 – μ2 < 0 Έλεγχος Ανώτερου Άκρου: H0: μ1 ≤ μ2 H1: μ1 > μ2 H0: μ1 – μ2 ≤ 0 H1: μ1 – μ2 > 0 Αμφίπλευρος έλεγχος: H0: μ1 = μ2 H1: μ1 ≠ μ2 H0: μ1 – μ2 = 0 H1: μ1 – μ2 ≠ 0

7 Έλεγχοι Υποθέσεων για μ1 – μ2
DCOVA Δύο Πληθυσμιακοί μέσοι, Ανεξάρτητα Δείγματα Έλεγχος Κατώτερου Άκρου: H0: μ1 – μ2  0 H1: μ1 – μ2 < 0 Έλεγχος Ανώτερου Άκρου: H0: μ1 – μ2 ≤ 0 H1: μ1 – μ2 > 0 Αμφίπλευρος Έλεγχος: H0: μ1 – μ2 = 0 H1: μ1 – μ2 ≠ 0 a a a/2 a/2 -ta ta -ta/2 ta/2 Απόρριψη της H0 αν tSTAT < -ta Απόρριψη της H0 αν tSTAT > ta Απόρριψη της H0 αν tSTAT < -ta/2 ή tSTAT > ta/2

8 Έλεγχοι υποθέσεων για µ1 - µ2 με σ1 και σ2 άγνωστα και υποτίθεται ίσα
DCOVA Πληθυσμιακοί μέσοι, ανεξάρτητα δείγματα Υποθέσεις: Τα δείγματα είναι τυχαία και ανεξάρτητα Οι πληθυσμοί είναι κανονικά κατανεμημένοι ή και τα δύο μεγέθη δειγμάτων είναι τουλάχιστον 30 Οι πληθυσμιακές διασπορές είναι άγνωστες αλλά υποτίθεται ίσες * σ1 και σ2 άγνωστα, υποτίθεται ίσα σ1 και σ2 άγνωστα, υποτίθεται όχι ίσα

9 Έλεγχοι υποθέσεων για µ1 - µ2 με σ1 και σ2 άγνωστα και υποτίθεται ίσα
(συνέχεια) DCOVA Η σταθμισμένη διασπορά είναι: Η στατιστική συνάρτηση ελέγχου είναι: Όπου η tSTAT έχει (df) β.ε. = (n1 + n2 – 2) Πληθυσμιακοί μέσοι, ανεξάρτητα δείγματα * σ1 και σ2 άγνωστα, υποτίθεται ίσα σ1 και σ2 άγνωστα, δεν υποτίθεται ίσα

10 Διάστημα εμπιστοσύνης για µ1 - µ2 με σ1 και σ2 άγνωστα και υποτίθεται ίσα
DCOVA Πληθυσμιακοί μέσοι, ανεξάρτητα δείγματα Το διάστημα εμπιστοσύνης για μ1 – μ2 είναι: Όπου η tα/2 έχει (df) β.ε. = n1 + n2 – 2 * σ1 και σ2 άγνωστα, υποτίθεται ίσα σ1 και σ2 άγνωστα, υποτίθεται όχι ίσα

11 Παράδειγμα t Ελέγχου Σταθμισμένης Διασποράς
DCOVA Είστε οικονομικός αναλυτής σε μια χρηματιστηριακή εταιρεία. Υπάρχει διαφορά στην απόδοση των μερισμάτων μεταξύ των μετοχών που είναι εισηγμένες στα χρηματιστήρια των NYSE & NASDAQ; Συλλέγετε τα παρακάτω δεδομένα: NYSE NASDAQ Αριθμός Δειγματικός Μέσος Δειγμ.τυπ.απόκλιση Υποθέτοντας οτι και οι δύο πληθυσμοί είναι κατά προσέγγιση κανονικοί με ίσες διασπορές, υπάρχει διαφορά στην μέση απόδοση ( = 0.05);

12 Η στατιστική συνάρτηση ελέγχου είναι:
Παράδειγμα t Ελέγχου Σταθμισμένης Διασποράς: Υπολογισμός της Στατιστικής Συνάρτησης Ελέγχου (συνέχεια) H0: μ1 - μ2 = 0 δηλ. (μ1 = μ2) H1: μ1 - μ2 ≠ 0 δηλ. (μ1 ≠ μ2) DCOVA Η στατιστική συνάρτηση ελέγχου είναι:

13 Παράδειγμα t Ελέγχου Σταθμισμένης Διασποράς: Λύση Ελέγχου Υποθέσεων
DCOVA Απόρριψη H0 ΑπόρριψηH0 H0: μ1 - μ2 = 0 δηλ. (μ1 = μ2) H1: μ1 - μ2 ≠ 0 δηλ. (μ1 ≠ μ2)  = 0.05 β.ε = = 44 Κρίσιμες Τιμές: t = ± 2,0154 Στατιστική Συνάρτηση Ελέγχου: .025 .025 -2,0154 2,0154 t 2,040 Απόφαση: Συμπέρασμα: Απόρριψη της H0 σε a = 0,05 Υπάρχει ένδειξη για διαφορά των μέσων.

14 Παράδειγμα t Ελέγχου Σταθμισμένης Διασποράς: Διάστημα Εμπιστοσύνης για µ1 - µ2
DCOVA Εφόσον απορρίψαμε την H0 μπορούμε να είμαστε 95% σίγουροι οτι µNYSE > µNASDAQ ; 95% Διάστημα εμπιστοσύνης για µNYSE - µNASDAQ Εφόσον το 0 είναι μικρότερο από το σύνολο του διαστήματος, μπορούμε να είμαστε 95% σίγουροι οτι µNYSE > µNASDAQ

15 Έλεγχοι υποθέσεων για µ1 - µ2 με σ1 και σ2 άγνωστα, δεν θεωρούνται ίσα
DCOVA Υποθέσεις: Τα δείγματα είναι τυχαία και ανεξάρτητα Οι πληθυσμοί είναι κανονικά κατανεμημένοι ή και τα δύο μεγέθη δειγμάτων είναι τουλάχιστον 30 Οι πληθυσμιακές διασπορές είναι άγνωστες και δεν μπορούν να θεωρηθούν οτι είναι ίσες Πληθυσμιακοί μέσοι, ανεξάρτητα δείγματα σ1 και σ2 άγνωστα, θεωρούνται ίσα * σ1 και σ2 άγνωστα, δεν θεωρούνται ίσα

16 Έλεγχοι υποθέσεων για µ1 - µ2 με σ1 και σ2 άγνωστα και δεν θεωρούνται ίσα
(συνέχεια) DCOVA Οι τύποι για αυτό τον έλεγχο δεν καλύπτονται στην ύλη αυτού του βιβλίου. Ανατρέξτε στην βιβλιογραφία 8 αυτού του κεφαλαίου για περισσότερες λεπτομέρειες. Αυτός ο έλεγχος χρησιμοποιεί δύο ξεχωριστές δειγματικές διασπορές για να εκτιμήσει τους βαθμούς ελευθερίας για τον έλεγχο t Πληθυσμιακοί μέσοι, ανεξάρτητα δείγματα σ1 και σ2 άγνωστα, θεωρούνται ίσα * σ1 και σ2 άγνωστα, δεν θεωρούνται ίσα

17 Παράδειγμα t Ελέγχου Ξεχωριστών Διασπορών
DCOVA Είστε οικονομικός αναλυτής σε μια χρηματιστηριακή εταιρεία. Υπάρχει διαφορά στην απόδοση των μερισμάτων μεταξύ των μετοχών που είναι εισηγμένες στα χρηματιστήρια των NYSE & NASDAQ; Συλλέγετε τα παρακάτω δεδομένα: NYSE NASDAQ Αριθμός Δειγματικός μέσος , ,53 Δειγμ.τυπ.αποκλιση , ,16 Υποθέτοντας οτι και οι δύο πληθυσμοί είναι κατά προσέγγιση κανονικοί με άνισες διασπορές, υπάρχει διαφορά στην μέση απόδοση ( = 0,05);

18 Παράδειγμα t Ελέγχου Ξεχωριστών Διασπορών: Υπολογισμός της Στατιστικής Συνάρτησης Ελέγχου
(συνέχεια) H0: μ1 - μ2 = 0 δηλ. (μ1 = μ2) H1: μ1 - μ2 ≠ 0 δηλ. (μ1 ≠ μ2) DCOVA

19 Παράδειγμα t Ελέγχου Ξεχωριστών Διασπορών: Λύση Ελέγχου Υποθέσεων
DCOVA Απόρριψη H0 Απόρριψη H0 H0: μ1 - μ2 = 0 δηλ. (μ1 = μ2) H1: μ1 - μ2 ≠ 0 δηλ. (μ1 ≠ μ2)  = 0.05 β.ε = 40 Κρίσιμες Τιμές: t = ± 2,021 Στατιστική Συνάρτηση Ελέγχου: ,025 ,025 -2,021 2,021 t 2,019 Απόφαση: Συμπέρασμα: Αποτυχία Απόρριψης της H0 σε a = 0.05 Δεν υπάρχει επαρκής ένδειξη διαφοράς στους μέσους.

20 Συσχετισμένοι Πληθυσμοί Έλεγχος Κατά Ζεύγη Διαφοράς
DCOVA Έλεγχοι Μέσων από 2 Συσχετισμένους Πληθυσμούς Δείγματα κατά ζεύγη Επαναλαμβανόμενες μετρήσεις (πριν/μετά) Χρήση διαφοράς μεταξύ κατά ζεύγη τιμών: Εξαλείφει την Μεταβλητότητα Μεταξύ Αντικειμένων Υποθέσεις: Οι διαφορές είναι κανονικά κατανεμημένες Ή, αν όχι Κανονικά, χρησιμοποιήστε μεγάλα δείγματα Συσχετισμένα δείγματα Di = X1i - X2i

21 Συσχετισμένοι Πληθυσμοί Έλεγχος Κατά Ζεύγη Διαφοράς
(συνέχεια) DCOVA Η i-οστή κατά ζεύγη διαφορά είναι Di , όπου Συσχετισμένα δείγματα Di = X1i - X2i Η σημειακή εκτίμηση για την κατά ζεύγη διαφορά πληθυσμιακού μέσου μD είναι D : Η δειγματική τυπική απόκλιση είναι SD n είναι ο αριθμός των ζευγών στο κατά ζεύγη δείγμα

22 Έλεγχος της Κατά Ζεύγη Διαφοράς: Εύρεση της tSTAT
DCOVA Η στατιστική συνάρτηση για το μD είναι: Κατά ζεύγη δείγματα Όπου η tSTAT έχει n - 1 β.ε.

23 Έλεγχος Κατά Ζεύγη Διαφοράς: Πιθανές Υποθέσεις
DCOVA Κατά ζεύγη δείγματα Έλεγχος Κατώτερου Άκρου: H0: μD  0 H1: μD < 0 Έλεγχος Ανώτερου Άκρου: H0: μD ≤ 0 H1: μD > 0 Αμφίπλευρος Έλεγχος: H0: μD = 0 H1: μD ≠ 0 a a a/2 a/2 -ta ta -ta/2 ta/2 Απόρριψη της H0 αν tSTAT > ta Απόρριψη της H0 αν tSTAT < -ta Απόρριψη της H0 αν tSTAT < -ta/2 ή tSTAT > ta/2 Όπου η tSTAT έχει n - 1 β.ε.

24 Διάστημα Εμπιστοσύνης Κατά Ζεύγη Διαφοράς
DCOVA Το διάστημα εμπιστοσύνης για το μD είναι Κατά ζεύγη δείγματα όπου

25 Έλεγχος Κατά Ζεύγη Διαφοράς: Παράδειγμα
Έλεγχος Κατά Ζεύγη Διαφοράς: Παράδειγμα DCOVA Ας υποθέσουμε οτι στέλνετε τους πωλητές σας σε ένα εργαστήριο εκπαίδευσης “εξυπηρέτησης πελατών”. Έχει κάνει η κατάρτιση αυτή διαφορά στον αριθμό των παραπόνων; Συλλέγετε τα παρακάτω δεδομένα: D = Di n = -4,2 Αριθμός παραπόνων: (2) - (1) Πωλητής Πριν (1) Μετά (2) Διαφορά, Di C.B T.F M.H R.K M.O -21

26 Έλεγχος Κατά Ζεύγη Διαφοράς: Λύση
DCOVA Έχει επιφέρει η κατάρτιση αλλαγή στον αριθμό των παραπόνων (σε 0,01 επίπεδο); Απόρριψη Απόρριψη H0: μD = 0 H1: μD  0 /2 /2  = ,01 D = - 4,2 - 4, ,604 - 1,66 t0,005 = ± 4, β.ε. = n - 1 = 4 Απόφαση: Δεν απορρίπτεται η H0 (Η tstat δεν είναι μέσα στην περιοχή απόρριψης) Στατιστική Συνάρτηση Ελέγχου: Συμπέρασμα: Δεν υπάρχουν επαρκή στοιχεία αλλαγής στον αριθμό των παραπόνων.

27 Το Διάστημα Εμπιστοσύνης Κατά Ζεύγη Διαφοράς -- Παράδειγμα
DCOVA Το διάστημα εμπιστοσύνης για το μD είναι: Εφόσον αυτό το διάστημα περιλαμβάνει το 0 είστε 99% σίγουροι οτι μD = 0 D = -4,2, SD = 5,67

28 Δύο Πληθυσμιακά Ποσοστά
DCOVA Στόχος: ο έλεγχος μιας υπόθεσης ή ο σχηματισμός ενός διαστήματος εμπιστοσύνης για την διαφορά μεταξύ δύο πληθυσμιακών ποσοστών, π1 – π2 ΠληθυσμιακάΠοσοστά Υποθέσεις: n1 π1  5 , n1(1- π1)  5 n2 π2  5 , n2(1- π2)  5 Η σημειακή εκτίμηση για τη διαφορά είναι

29 Δύο Πληθυσμιακά Ποσοστά
DCOVA Στην μηδενική υπόθεση υποθέτουμε οτι η μηδενική υπόθεση είναι αληθής, έτσι υποθέτουμε οτι π1 = π2 και σταθμίζουμε τις δύο δειγματικές εκτιμήσεις ΠληθυσμιακάΠοσοστά Η σταθμισμένη εκτίμηση για το συνολικό ποσοστό είναι: όπου X1 και X2 είναι ο αριθμός των υπό εξέταση στοιχείων στα δείγματα 1 και 2

30 Δύο Πληθυσμιακά Ποσοστά
(συνέχεια) DCOVA Η στατιστική συνάρτηση ελέγχου για το π1 – π2 είναι μια στατιστική συνάρτηση Z: ΠληθυσμιακάΠοσοστά όπου

31 Έλεγχοι Υποθέσεων για Δύο Πληθυσμιακά Ποσοστά
DCOVA Πληθυσμιακά Ποσοστά Έλεγχος Κατώτερου Άκρου: H0: π1  π2 H1: π1 < π2 δηλ., H0: π1 – π2  0 H1: π1 – π2 < 0 Έλεγχος Ανώτερου Άκρου: H0: π1 ≤ π2 H1: π1 > π2 δηλ., H0: π1 – π2 ≤ 0 H1: π1 – π2 > 0 Αμφίπλευρος Έλεγχος: H0: π1 = π2 H1: π1 ≠ π2 δηλ., H0: π1 – π2 = 0 H1: π1 – π2 ≠ 0

32 Έλεγχοι Υποθέσεων για Δύο Πληθυσμιακά Ποσοστά
(συνέχεια) DCOVA Πληθυσμιακά Ποσοστά Έλεγχος Κατώτερου Άκρου: H0: π1 – π2  0 H1: π1 – π2 < 0 Έλεγχος Ανώτερου Άκρου: H0: π1 – π2 ≤ 0 H1: π1 – π2 > 0 Αμφίπλευρος έλεγχος: H0: π1 – π2 = 0 H1: π1 – π2 ≠ 0 a a a/2 a/2 -za za -za/2 za/2 Απόρριψη της H0 αν ZSTAT < -Za Απόρριψη της H0 αν ZSTAT > Za Απόρριψη της H0 αν ZSTAT < -Za/2 ή ZSTAT > Za/2

33 Παράδειγμα Ελέγχου Υποθέσεων: Δύο Πληθυσμιακά Ποσοστά
Παράδειγμα Ελέγχου Υποθέσεων: Δύο Πληθυσμιακά Ποσοστά DCOVA Υπάρχει σημαντική διαφορά μεταξύ του ποσοστού των ανδρών και του ποσοστού των γυναικών που θα ψήφιζαν Ναι στην Πρόταση A; Σε ένα τυχαίο δείγμα, 36 από τους 72 άνδρες και 35 από τις 50 γυναίκες δηλώνουν οτι θα ψήφιζαν Ναι Έλεγχος σε ,05 επίπεδο σημαντικότητας

34 Η σταθμισμένη εκτίμηση για το συνολικό ποσοστό είναι:
Παράδειγμα Ελέγχου Υποθέσεων: Δύο Πληθυσμιακά Ποσοστά (συνέχεια) DCOVA Ο έλεγχος υποθέσεων είναι: H0: π1 – π2 = 0 (τα δύο ποσοστά είναι ίσα) H1: π1 – π2 ≠ 0 (υπάρχει σημαντική διαφορά μεταξύ των ποσοστών) Τα δειγματικά ποσοστά είναι: Άνδρες: p1 = 36/72 = 0,50 Γυναίκες: p2 = 35/50 = 0,70 Η σταθμισμένη εκτίμηση για το συνολικό ποσοστό είναι:

35 Παράδειγμα Ελέγχου Υποθέσεων : Δύο Πληθυσμιακά Ποσοστά
Παράδειγμα Ελέγχου Υποθέσεων : Δύο Πληθυσμιακά Ποσοστά (συνέχεια) DCOVA Απόρριψη H0 Απόρριψη H0 Η στατιστική συνάρτηση ελέγχου για π1 – π2 είναι: ,025 ,025 -1,96 1,96 -2,20 Απόφαση: Απόρριψη της H0 Συμπέρασμα: Υπάρχει ένδειξη σημαντικής διαφοράς στο ποσοστό των ανδρών και γυναικών που θα ψηφίσουν ναι. Κρίσιμες Τιμές = ±1,96 Για  = ,05

36 Διάστημα Εμπιστοσύνης για Δύο Πληθυσμιακά Ποσοστά
DCOVA Πληθυσμιακά Ποσοστά Το διάστημα εμπιστοσύνης για το π1 – π2 είναι:

37 Διάστημα Εμπιστοσύνης για Δύο Πληθυσμιακά Ποσοστά -- Παράδειγμα
Διάστημα Εμπιστοσύνης για Δύο Πληθυσμιακά Ποσοστά -- Παράδειγμα DCOVA Το 95% διάστημα εμπιστοσύνης για το π1 – π2 είναι: Εφόσον αυτό το διάστημα δεν περιέχει το 0 μπορείτε να είστε 95% σίγουροι οτι τα δύο ποσοστά είναι διαφορετικά.

38 Έλεγχος για το Λόγο Δύο Πληθυσμιακών Διασπορών
DCOVA Υποθέσεις FSTAT * Έλεγχοι για Δύο Πληθυσμιακές Διασπορές H0: σ12 = σ22 H1: σ12 ≠ σ22 S12 / S22 H0: σ12 ≤ σ22 H1: σ12 > σ22 Στατιστική Συνάρτηση Ελέγχου F Όπου: S12 = Διασπορά του δείγματος 1 (η μεγαλύτερη δειγματική διασπορά) n1 = δειγματικό μέγεθος του δείγματος 1 S22 = Διασπορά του δείγματος 2 (η μικρότερη δειγματική διασπορά) n2 = δειγματικό μέγεθος του δείγματος 2 n1 –1 = βαθμοί ελευθερίας αριθμητή n2 – 1 = βαθμοί ελευθερίας παρονομαστή

39 Η Κατανομή F DCOVA Η κρίσιμη τιμή F βρίσκεται από τον πίνακα F
Υπάρχουν δύο βαθμοί ελευθερίας που απαιτούνται: του αριθμητή και του παρονομαστή Η μεγαλύτερη δειγματική διασπορά είναι πάντα του αριθμητή Όταν Στον Πίνακα F, Οι βαθμοί ελευθερίας του αριθμητή προσδιορίζουν την στήλη Οι βαθμοί ελευθερίας του παρονομαστή προσδιορίζουν τη γραμμή df1 = n1 – 1 , df2 = n2 – 1

40 Εύρεση της Περιοχής Απόρριψης
DCOVA H0: σ12 = σ22 H1: σ12 ≠ σ22 H0: σ12 ≤ σ22 H1: σ12 > σ22 F /2 Απόρριψη της H0 Μη Απόρριψη της H0 Fα/2 F Απόρριψη της H0 Μη Απόρριψη της H0 Απορρίπτεται η H0 αν FSTAT > Fα/2 Απορρίπτεται η H0 αν FSTAT > Fα

41 F Έλεγχος: Παράδειγμα DCOVA NYSE NASDAQ Αριθμός 21 25
Μέσος 3,27 2,53 Τυπ. Απόκλ. 1,30 1,16 Υπάρχει διαφορά στις διασπορές μεταξύ του NYSΕ και NASDAQ σε επίπεδο  = 0,05;

42 F Έλεγχος : Λύση Παραδείγματος
DCOVA Σχηματισμός του ελέγχου υποθέσεων: H0: σ21 = σ22 (δεν υπάρχει διαφορά μεταξύ των διασπορών) H1: σ21 ≠ σ22 (υπάρχει διαφορά μεταξύ των διασπορών) Εύρεση της F κρίσιμης τιμής για  = 0,05: β.ε αριθμητή d.f. = n1 – 1 = 21 –1 =20 β.ε παρονομαστή d.f. = n2 – 1 = 25 –1 = 24 Fα/2 = F,025, 20, 24 = 2,33

43 F Έλεγχος : Λύση Παραδείγματος
DCOVA (συνέχεια) Η στατιστική συνάρτηση ελέγχου είναι: H0: σ12 = σ22 H1: σ12 ≠ σ22 /2 = ,025 F Δεν απορρίπτεται η H0 Απορρίπτεται η H0 F0.025=2.33 FSTAT = δεν είναι μέσα στην περιοχή απόρριψης, οπότε δεν απορρίπτεται η H0 Συμπέρασμα: Δεν υπάρχει επαρκής ένδειξη διαφοράς των διασπορών σε  = 0,05

44 Γενικό Πλαίσιο ANOVA DCOVA
Ο ερευνητής ελέγχει έναν ή περισσότερους παράγοντες ενδιαφέροντος Κάθε παράγοντας περιέχει δύο ή περισσότερα επίπεδα Τα επίπεδα μπορεί να είναι αριθμητικά ή κατηγορικά Διαφορετικά επίπεδα δημιουργούν διαφορετικές ομάδες Σκεφτείτε κάθε ομάδα σαν ένα δείγμα από ένα διαφορετικό πληθυσμό Παρατηρήστε επιδράσεις στην εξαρτημένη μεταβλητή Είναι οι ομάδες ίδιες; Πειραματικό σχέδιο: το σχέδιο που χρησιμοποιείται για την συλλογή των δεδομένων

45 Πλήρως Τυχαιοποιημένος Σχεδιασμός
DCOVA Οι πειραματικές μονάδες (αντικείμενα) αντιστοιχίζονται τυχαία σε ομάδες Τα αντικείμενα θεωρούνται ομογενή Μόνο ένας παράγοντας ή ανεξάρτητη μεταβλητή Με δύο ή περισσότερα επίπεδα Αναλύεται με έναν παράγοντα ανάλυσης διασποράς (ANOVA)

46 Ανάλυση Διασποράς Κατά Έναν Παράγοντα
DCOVA Εκτιμήστε τη διαφορά μεταξύ των μέσων τριών ή περισσότερων ομάδων Υποθέσεις Οι πληθυσμοί είναι κανονικά κατανεμημένοι Οι πληθυσμοί έχουν ίσες διασπορές Τα δείγματα είναι τυχαία και ανεξάρτητα Παραδείγματα: Αριθμός ατυχημάτων στην 1η, 2η και 3η βάρδια Αναμενόμενη απόσταση σε μίλια για πέντε μάρκες ελαστικών

47 Υποθέσεις της One-Way ANOVA
DCOVA Όλοι οι πληθυσμιακοί μέσοι είναι ίσοι δηλ., καμία επίδραση του παράγοντα (καμία μεταβλητότητα στους μέσους μεταξύ των ομάδων) Τουλάχιστον ένας πληθυσμιακός μέσος είναι διαφορετικός δηλ., υπάρχει επίδραση του παράγοντα Δεν σημαίνει οτι όλοι οι πληθυσμιακοί μέσοι είναι διαφορετικοί (κάποια ζεύγη ίσως είναι ίδια) H1 : Δεν είναι όλοι οι πληθυσμιακοί μέσοι ίσοι

48 ANOVA Κατά έναν Παράγοντα
DCOVA H1 : Δεν είναι όλα τα μ j ίσα Όταν η Μηδενική Υπόθεση είναι Αληθής Όλοι οι μέσοι είναι ίδιοι: (Καμία Επίδραση του Παράγοντα)

49 ANOVA Κατά Έναν Παράγοντα
(συνέχεια) DCOVA H1 : Δεν είναι όλα τα μ j ίσα Όταν η Μηδενική Υπόθεση Δεν είναι αληθής Τουλάχιστον ένας από τους μέσους είναι διαφορετικός (Η Επίδραση του Παράγοντα είναι παρούσα) ή

50 Διαμέριση της Μεταβλητότητας
DCOVA Η συνολική μεταβλητότητα μπορεί να διαχωριστεί σε δύο μέρη: SST = SSA + SSW SST = Συνολικό ΄Αθροισμα Τετραγώνων (Συνολική μεταβλητότητα) SSA = Άθροισμα Τετραγώνων Μεταξύ των Ομάδων (Μεταβλητότητα Μεταξύ των Ομάδων) SSW = Άθροισμα Τετραγώνων Εντός των Ομάδων (Μεταβλητότητα Εντός των Ομάδων)

51 Διαμέριση της Μεταβλητότητας
(συνέχεια) DCOVA SST = SSA + SSW Συνολική Μεταβλητότητα = η αθροιστική μεταβλητότητα μεμονωμένων τιμών δεδομένων στα διάφορα επίπεδα του παράγοντα (SST) Μεταβλητότητα Μεταξύ των Ομάδων = μεταβλητότητα μεταξύ των δειγματικών μέσων του παράγοντα (SSA) Μεταβλητότητα Εντός των Ομάδων = μεταβλητότητα που υπάρχει μεταξύ των τιμών δεδομένων εντός ενός συγκεκριμένου επιπέδου του παράγοντα (SSW)

52 Διαμέριση της Συνολικής Μεταβλητότητας
DCOVA Συνολική Μεταβλητότητα (SST) Μεταβλητότητα Λόγω του Παράγοντα (SSA) Μεταβλητότητα Λόγω του Τυχαίου Σφάλματος (SSW) = +

53 Συνολικό Άθροισμα Τετραγώνων
DCOVA SST = SSA + SSW Όπου: SST = Συνολικό άθροισμα τετραγώνων c = αριθμός ομάδων ή επιπέδων nj = αριθμός τιμών στην ομάδα j Xij = i-οστή παρατήρηση από την ομάδα j X = συνολικός μέσος όρος (μέσος όλων των τιμών δεδομένων)

54 Συνολική Μεταβλητότητα
DCOVA (συνέχεια)

55 Μεταβλητότητα Μεταξύ των Ομάδων
DCOVA SST = SSA + SSW Όπου: SSA = Άθροισμα τετραγώνων μεταξύ των ομάδων c = αριθμός ομάδων nj = μέγεθος δείγματος από την ομάδα j Xj = δειγματικός μέσος από την ομάδα j X = συνολικός μέσος όρος (μέσος όλων των τιμών δεδομένων)

56 Μεταβλητότητα Μεταξύ των Ομάδων
(συνέχεια) DCOVA Μεταβλητότητα Λόγω Διαφορών Μεταξύ των Ομάδων Μέσα Τετράγωνα Μεταξύ = SSA/βαθμοί ελευθερίας

57 Μεταβλητότητα Μεταξύ των Ομάδων
DCOVA (συνέχεια)

58 Μεταβλητότητα Εντός των Ομάδων
DCOVA SST = SSA + SSW Όπου: SSW = Άθροισμα τετραγώνων εντός ομάδων c = αριθμός ομάδων nj = μέγεθος δείγματος από την ομάδα j Xj = δειγματικός μέσος από την ομάδα j Xij = i-οστή παρατήρηση στην ομάδα j

59 Μεταβλητότητα Εντός των Ομάδων
(συνέχεια) DCOVA Συγκεντρώστε την μεταβλητότητα μέσα σε κάθε ομάδα και στην συνέχεια προσθέστε όλες τις ομάδες Μέσα Τετράγωνα Εντός = SSW/βαθμοί ελευθερίας

60 Μεταβλητότητα Εντός των Ομάδων
DCOVA (συνέχεια)

61 Απόκτηση Μέσων Τετραγώνων
DCOVA Τα Μέσα Τετράγωνα προκύπτουν διαιρώντας τα διάφορα αθροίσματα τετραγώνων με τους σχετικούς βαθμούς ελευθερίας Μέσο Τετράγωνο Μεταξύ (β.ε. = c-1) Μέσο Τετράγωνο Εντός (β.ε. = n-c) Συνολικό Μέσο Τετράγωνο (β.ε. = n-1)

62 Πίνακας One-Way ANOVA DCOVA Σύνολο SSA FSTAT = c - 1 SSA MSA = c - 1
Πηγή Μεταβλητότητας Μεταξύ των Ομάδων Εντός των Ομάδων Σύνολο Βαθμοί Ελευθερίας Άθροισμα Τετραγώνων Μέσο Τετράγωνο (Διασπορά) F SSA FSTAT = c - 1 SSA MSA = c - 1 MSA MSW SSW n - c SSW MSW = n - c n – 1 SST c = αριθμός ομάδων n = άθροισμα δειγματικών μεγεθών από όλες τις ομάδες df = βαθμοί ελευθερίας

63 ANOVA Κατά Έναν Παράγοντα Στατιστική Συνάρτηση Ελέγχου F
DCOVA H0: μ1= μ2 = … = μc H1: Τουλάχιστον δύο πληθυσμιακοί μέσοι είναι διαφορετικοί Στατιστική Συνάρτηση Ελέγχου MSA είναι μέσα τετράγωνα μεταξύ των ομάδων MSW είναι μέσα τετράγωνα εντός των ομάδων Βαθμοί ελευθερίας β.ε df1 = c – 1 (c = αριθμός ομάδων) β.ε df2 = n – c (n = άθροισμα δειγματικών μεγεθών από όλους τους πληθυσμούς)

64 Ερμηνεία της One-Way ANOVA Στατιστική Συνάρτηση F
DCOVA Η στατιστική συνάρτηση F είναι ο λόγος της μεταξύ των ομάδων εκτίμησης διασποράς και της εντός των ομάδων εκτίμησης διασποράς Ο λόγος πρέπει πάντα να είναι θετικός β.ε df1 = c -1 είναι συνήθως μικρό β.ε df2 = n - c είναι συνήθως μεγάλο Κανόνας Απόφασης: Απορρίπτετε την H0 αν FSTAT > Fα, διαφορετικά δεν απορρίπτετε την H0 Δεν απορρίπτεται η H0 Απορρίπτεται η H0

65 One-Way ANOVA Παράδειγμα F Ελέγχου
DCOVA Μπαστούνι 1 Μπαστούνι 2 Μπαστούνι Θέλετε να δείτε αν τρία διαφορετικά μπαστούνια γκολφ αποφέρουν διαφορετικές αποστάσεις. Επιλέγετε τυχαία πέντε μετρήσεις από δοκιμές σε μια αυτοματοποιημένη μηχανή οδήγησης για κάθε μπαστούνι. Σε 0.05 επίπεδο σημαντικότητας, υπάρχει διαφορά στην μέση απόσταση;

66 Παράδειγμα One-Way ANOVA: Διάγραμμα Διασποράς
DCOVA Απόσταση 270 260 250 240 230 220 210 200 190 Μπαστούνι 1 Μπαστούνι 2 Μπαστούνι Μπαστούνια

67 Παράδειγμα One-Way ANOVA Υπολογισμοί
DCOVA Μπαστούνι Μπαστούνι 2 Μπαστούνι X1 = 249,2 X2 = 226,0 X3 = 205,8 X = 227,0 n1 = 5 n2 = 5 n3 = 5 n = 15 c = 3 SSA = 5 (249,2 – 227)2 + 5 (226 – 227)2 + 5 (205,8 – 227)2 = 4716,4 SSW = (254 – 249,2)2 + (263 – 249,2)2 +…+ (204 – 205,8)2 = 1119,6 MSA = 4716,4 / (3-1) = 2358,2 MSW = 1119,6 / (15-3) = 93,3

68 Παράδειγμα One-Way ANOVA Λύση
DCOVA Στατιστική συνάρτηση ελέγχου: Απόφαση: Συμπέρασμα: H0: μ1 = μ2 = μ3 H1: μj όχι όλα ίσα  = 0,05 β.ε : df1= df2 = 12 Κρίσιμη Τιμή: Fα = 3.89 Απόρριψη της H0 σε  = 0,05  = ,05 Υπάρχει ένδειξη οτι τουλάχιστον ένα μj διαφέρει από τα υπόλοιπα Μη Απόρριψη της H0 Απόρριψη της H0 F0,05 = 3,89

69 Αποτελέσματα στο Excel
One-Way ANOVA Αποτελέσματα στο Excel DCOVA SUMMARY Groups Count Sum Average Variance Club 1 5 1246 249,2 108,2 Club 2 1130 226 77,5 Club 3 1029 205,8 94,2 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 4716,4 2 2358,2 25,275 0,0000 3,89 Within 1119,6 12 93,3 Total 5836,0 14

70 One-Way ANOVA Αποτελέσματα στο Minitab
DCOVA One-way ANOVA: Distance versus Club Source DF SS MS F P Club Error Total S = R-Sq = 80.82% R-Sq(adj) = 77.62% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev (-----*-----) (-----*-----) (-----*-----) Pooled StDev = 9.66

71 Υποθέσεις ANOVA Τυχαιότητα και Ανεξαρτησία Κανονικότητα
DCOVA Τυχαιότητα και Ανεξαρτησία Επιλέγετε τυχαία δείγματα από τις c ομάδες (ή τυχαία αντιστοιχίζετε τα επίπεδα) Κανονικότητα Οι δειγματικές τιμές για κάθε ομάδα είναι από έναν κανονικό πληθυσμό Ομοιογένεια της Διασποράς Όλοι οι πληθυσμοί από τους οποίους έχει παρθεί δείγμα έχουν την ίδια διασπορά Μπορεί να ελεγχθεί με τον έλεγχο Levene

72 Υποθέσεις ANOVA Έλεγχος Levene
DCOVA Ελέγχει την υπόθεση οτι οι διασπορές κάθε πληθυσμού είναι ίσες. Πρώτον, προσδιορίζετε την μηδενική και εναλλακτική υπόθεση: H0: σ21 = σ22 = …=σ2c H1: Δεν είναι όλα τα σ2j ίσα Δεύτερον, υπολογίζετε την απόλυτη τιμή της διαφοράς μεταξύ κάθε τιμής και της διαμέσου κάθε ομάδας. Τρίτον, εκτελείτε μια ANOVA κατά έναν παράγοντα σε αυτές τις απόλυτες διαφορές.

73 Έλεγχος Levene για Ομοιογένεια των Διασπορών : Παράδειγμα
DCOVA H0: σ21 = σ22 = σ23 H1: Δεν είναι όλα τα σ2j ίσα Υπολογισμός Διαμέσων Μπ. 1 Μπ. 2 Μπ. 3 237 216 197 241 218 200 251 227 204 Διάμεσος 254 234 206 263 235 222 Υπολογισμός Απόλυτων Διαφορών Μπ. 1 Μπ. 2 Μπ. 3 14 11 7 10 9 4 3 2 12 8 18

74 Έλεγχος Levene για Ομοιογένεια των Διασπορών: Παράδειγμα
(συνέχεια) DCOVA Anova: Single Factor SUMMARY Groups Count Sum Average Variance Club 1 5 39 7.8 36.2 Club 2 35 7 17.5 Club 3 31 6.2 50.2 Εφόσον η p-τιμή είναι μεγαλύτερη από 0.05 δεν υπάρχει επαρκής ένδειξη διαφοράς των διασπορών Source of Variation SS df MS F P-value F crit Between Groups 6.4 2 3.2 0.092 0.912 3.885 Within Groups 415.6 12 34.6 Total 422 14

75 Η Διαδικασία Tukey-Kramer
DCOVA Αναφέρει ποιοι πληθυσμιακοί μέσοι είναι σημαντικά διαφορετικοί π.χ.: μ1 = μ2  μ3 Γίνεται μετά από απόρριψη των ίσων μέσων στην ANOVA Επιτρέπει κατά ζεύγη συγκρίσεις Συγκρίνει τις απόλυτες μέσες διαφορές με το κρίσιμο εύρος μ μ μ x = 1 2 3

76 Κρίσιμο Εύρος για την Διαδικασία Tukey-Kramer
DCOVA όπου: Qα = Κρίσιμη Τιμή Άνω Άκρου από την Κατανομή Studentized Range με c και n - c βαθμούς ελευθερίας (βλ. πίνακα E.7 Σύνοψης) MSW = Μέσο Τετράγωνο Εντός nj και nj’ = Δειγματικά μεγέθη από τις ομάδες j και j’

77 Διαδικασία Tukey-Kramer: Παράδειγμα
DCOVA 1. Υπολογισμός απόλυτων μέσων διαφορών: Μπ Μπ Μπ 2. Εύρεση της τιμής Qα από τον πίνακα στην Σύνοψη E.7 με c = 3 και (n – c) = (15 – 3) = 12 βαθμούς ελευθερίας:

78 Διαδικασία Tukey-Kramer: Παράδειγμα
(συνέχεια) DCOVA 3. Υπολογισμός Κρίσιμου Εύρους: 4. Συγκρίνετε: 5. Όλες οι απόλυτες μέσες διαφορές είναι μεγαλύτερες από το κρίσιμο εύρος. Οπότε υπάρχει σημαντική διαφορά μεταξύ κάθε ζεύγους μέσων σε επίπεδο σημαντικότητας 5%. Thus, με 95% εμπιστοσύνη συμπεραίνουμε οτι η μέση απόσταση για το μπαστούνι 1 είναι μεγαλύτερη από οτι για τα μπαστούνια 2 και 3, και για το μπαστούνι 2 είναι μεγαλύτερη από οτι για το μπαστούνι 3.

79 Περίληψη Κεφαλαίου Σε αυτό το κεφάλαιο αναλύσαμε:
Πώς να χρησιμοποιήσετε τον έλεγχο υποθέσεων για την σύγκριση της διαφοράς μεταξύ Των μέσων δύο ανεξάρτητων πληθυσμών Των μέσων δύο συσχετισμένων πληθυσμών Των ποσοστών δύο ανεξάρτητων πληθυσμών Των διασπορών δύο ανεξάρτητων πληθυσμών Των μέσων περισσότερων από δύο πληθυσμών


Κατέβασμα ppt "Ανάλυση Διασποράς (ANOVA) Κατά Έναν Παράγοντα"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google