Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Κεφάλαιο 13-Δ Πίνακας Συνάφειας & Έλεγχος χ 2. Ένα Κοινό Θέμα … Τι να κάνω; Τύπος Δεδομένων; Αριθμός Κατηγοριών; Στατιστικές Τεχνικές: Περιγραφή ενός.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Κεφάλαιο 13-Δ Πίνακας Συνάφειας & Έλεγχος χ 2. Ένα Κοινό Θέμα … Τι να κάνω; Τύπος Δεδομένων; Αριθμός Κατηγοριών; Στατιστικές Τεχνικές: Περιγραφή ενός."— Μεταγράφημα παρουσίασης:

1 Κεφάλαιο 13-Δ Πίνακας Συνάφειας & Έλεγχος χ 2

2 Ένα Κοινό Θέμα … Τι να κάνω; Τύπος Δεδομένων; Αριθμός Κατηγοριών; Στατιστικές Τεχνικές: Περιγραφή ενός πληθυσμού Ονομαστικά Δύο ή Περισσότερες χ 2 έλεγχος προσαρμοστι_ κότητας Σύγκριση Δύο Πληθυσμών Ονομαστικά Δύο ή Περισσότερες χ 2 έλεγχος του πίνακα συνάφειας Σύγκριση Δύο ή Περισσοτέρων Πληθυσμών Ονομαστικά-- χ 2 έλεγχος του πίνακα συνάφειας Ανάλυση Σχέσης μεταξύ δύο Μεταβλητών Ονομαστικά-- χ 2 έλεγχος του πίνακα συνάφειας Ένας Τύπος Δεδομένων … …Δύο τεχνικές

3 Δύο Τεχνικές … Η πρώτη είναι ένας έλεγχος προσαρμοστικότητας που εφαρμόζεται σε ένα πολυωνυμικό πείραμα, μία γενίκευση του δυωνυμικού πειράματος και χρησιμοποιείται για την περιγραφή ενός πληθυσμού δεδομένων. Η δεύτερη χρησιμοποιεί δεδομένα διευθετημένα σε έναν πίνακα συνάφειας για να προσδιορίσουμε εάν δύο ταξινομήσεις ενός πληθυσμού με ονομαστικά δεδομένα είναι στατιστικά ανεξάρτητες; Αυτός ό έλεγχος μπορεί επίσης να ερμηνευθεί ως μία σύγκριση δύο ή περισσοτέρων πληθυσμών. Και στις δύο περιπτώσεις, χρησιμοποιούμε χ 2 - κατανομή.

4 Το Πολυωνυμικό Πείραμα … Σε αντιπαράθεση με το δυωνυμικό πείραμα το οποίο έχει δύο πιθανά ενδεχόμενα (π.χ. κορόνα ή γράμματα), ένα πολυωνυμικό πείραμα: • Αποτελείται από έναν σταθερό αριθμό, n, δοκιμών. • Κάθε δοκιμή μπορεί να έχει ένα από τα k ενδεχόμενα, καλούμενα ως κελιά. • Όλες οι πιθανότητες p i είναι σταθερές. • Η συνήθης ιδιότητα των πιθανοτήτων ισχύει: p 1 + p 2 + … + p k = 1, και • Κάθε δοκιμή είναι ανεξάρτητη από τις υπόλοιπες δοκιμές.

5 χ 2 έλεγχος προσαρμοστικότητας … Ελέγχουμε εάν υπάρχει επαρκή μαρτυρία ώστε να απορρίψουμε ένα καθορισμένο σύνολο τιμών για τις p i. Πιο αναλυτικά, η μηδενική υπόθεση είναι: H 0 : p 1 = a 1, p 2 = a 2, …, p k = a k (όπου a 1, a 2, …, a k είναι οι τιμές που μας ενδιαφέρουν) Η ερευνητική υπόθεση είναι: H 1 : Τουλάχιστον ένα p i ≠ a i

6 χ 2 έλεγχος προσαρμοστικότητας … Ο έλεγχος πραγματοποιεί την σύγκριση μεταξύ των πραγματικών συχνοτήτων και των αναμενόμενων συχνοτήτων των συμβάντων στα κελιά. Παράδειγμα 13.12… Συγκρίνουμε μερίδιο αγοράς πριν και μετά την διαφημιστική εκστρατεία για να δούμε αν υπάρχει διαφορά (δηλαδή εάν η διαφήμιση ήταν αποτελεσματική για την βελτίωση του μεριδίου αγοράς). H 0 : p 1 = a 1, p 2 = a 2, …, p k = a k Όπου a i είναι το μερίδιο αγοράς πριν από την εκστρατεία. Εάν δεν υπήρχε αλλαγή, θα περιμέναμε την H 0 να μην απορριφθεί. Εάν υπάρχει μαρτυρία να απορρίψουμε την H 0 για την εύνοια της: H 1 : τουλάχιστον μία p i ≠ a i, ποιο είναι ένα λογικό συμπέρασμα;

7 Παράδειγμα 13.12… Μερίδια αγοράς πριν από διαφημιστική εκστρατεία … Εταιρία A – 45% Εταιρία B – 40% Λοιπές – 15 % 200 πελάτες καταμετρήθηκαν μετά την εκστρατεία. Τα αποτελέσματα: Εταιρία A – 102 πελάτες προτίμησαν το προϊόν. Εταιρία B – 82 πελάτες … Λοιπές – 16 πελάτες. Πριν από την εκστρατεία, θα αναμέναμε 45% από τους 200 πελάτες (δηλαδή 90 πελάτες) να προτιμάν το προϊόν της εταιρίας Α. Μετά την εκστρατεία, παρατηρούμε 102 καταναλωτές της. Σημαίνει αυτό ότι η εκστρατεία ήταν αποτελεσματική; (σε επίπεδο σημαντικότητας). ΑΝΑΓΝΩΡΙΣΤΕ

8 Παράδειγμα 13.12… Συχνότητα που Παρατηρούμε A B Αναμενόμενη Συχνότητα A B Είναι αυτές οι αλλαγές στατιστικά σημαντικά;

9 Παράδειγμα 13.12… Η μηδενική υπόθεση είναι: H 0 : p ΕταιρίαΑ =.45, p ΕταιρίαΒ =.40, p Λοιπές =.15 (δηλαδή τα μερίδια αγοράς πριν την εκστρατεία), και η εναλλακτική υπόθεση είναι: H 1 : Τουλάχιστον μία p i ≠ a i Για να ολοκληρώσουμε την εκτέλεση του ελέγχου της υπόθεσης χρειαζόμαστε ένα στατιστικό τεστ και μία περιοχή απόρριψης … ΑΝΑΓΝΩΡΙΣΤΕ

10 χ 2 έλεγχος προσαρμοστικότητας … Το στατιστικό τεστ του χ 2 ελέγχου προσαρμοστικότητας δίνεται από: Σημειώστε: αυτό το στατιστικό είναι προσεγγιστικά χ 2 με k–1 βαθμούς ελευθερίας εφόσον το δείγμα είναι αρκετά μεγάλα. Η περιοχή απόρριψης είναι: Συχνότητα που Παρατηρούμε Αναμενόμενη Συχνότητα

11 Παράδειγμα 13.12… Για να υπολογίσουμε το στατιστικό τεστ, τοποθετούμε τα δεδομένα σε έναν πίνακα με τον παρακάτω τρόπο για ευκολότερους υπολογισμούς: Εταιρία Συχνότητα που Παρατηρούμ ε Αναμενόμενη Συχνότητα Δέλτα Όρος του Αθροίσματος fifi eiei (f i – ei)(f i – e i ) 2 /e i A B Λοιπές Σύνολο Ελέγξτε ότι είναι όμοια ΥΠΟΛΟΓΙΣΤΕ

12 Παράδειγμα 13.12… Η περιοχή απόρριψης είναι: Αφού το στατιστικό τεστ είναι 8.18 το οποίο είναι μεγαλύτερο από την κριτική τιμή του χ 2, απορρίπτουμε την H 0 την εύνοια της, H 1, δηλαδή, «Υπάρχει επαρκή μαρτυρία να συμπεράνουμε ότι οι αναλογίες έχουν αλλάξει αφότου η διαφημιστική εκστρατεία εφαρμόστηκε» ΕΡΜΗΝΕΥΣΤΕ χ 2 > χ 2 = χ 2 = α,k- 1.05,3-1

13 Απαιτούμενες Υποθέσεις… Για να χρησιμοποιήσουμε αυτή την τεχνική, το μέγεθος του δείγματος πρέπει να είναι αρκετά μεγάλο έτσι ώστε η αναμενόμενη τιμή για κάθε κελί είναι 5 ή μεγαλύτερη (δηλαδή n  p i ≥ 5) Εάν η αναμενόμενη συχνότητα είναι μικρότερη από 5, συνδυάστε την με άλλα κελιά για να ικανοποιηθεί η υπόθεση.

14 Αναγνώριση Παραγόντων … Παράγοντες που αναγνωρίζουν το τεστ του χ 2 ελέγχου προσαρμοστικότητας: Περιγραφή του πληθυσμού →Ονομαστικά δεδομένα→2 ή >2 κατηγορίες e i =(n)(p i ) Απαιτείται

15 χ 2 Έλεγχος για Πίνακα Συνάφειας Ο χ 2 έλεγχος για έναν πίνακα συνάφειας χρησιμοποιείται: • για να καθορίσουμε αν υπάρχει μαρτυρία να συμπεράνουμε ότι δύο ονομαστικές μεταβλητές συσχετίζονται, και • για να συμπεράνουμε ότι διαφορές υπάρχουν μεταξύ δύο η περισσοτέρων πληθυσμών με ονομαστικές μεταβλητές. Για να χρησιμοποιήσουμε αυτές τις τεχνικές, χρειαζόμαστε να ταξινομήσουμε τα δεδομένα σύμφωνα με δύο διαφορετικά κριτήρια.

16 Παράδειγμα 13.13… Η ζήτηση των μαθημάτων επιλογής και των κατευθύνσεων σε ένα MBA πρόγραμμα ποικίλει αρκετά ανά έτος. Η ερευνητική υπόθεση είναι ότι το ακαδημαϊκό υπόβαθρο των φοιτητών (δηλαδή τα προπτυχιακά τους πτυχία) επηρεάζει την επιλογή τους για την κατεύθυνση. Ένα τυχαίο δείγμα δεδομένων από φοιτητές του τελευταίου έτους του MBA συλλέγετε και περιληπτικά περιγράφεται με έναν πίνακα συνάφειας … ΑΝΑΓΝΩΡΙΣΤΕ

17 Παράδειγμα 13.13… Τα Δεδομένα Κατευθύνσεις του MBA Προπτυχιακό Πτυχίο Λογιστικ ή Χρηματο_ οικονομικά MarketingΣύνολο Θ. Επιστήμες Πολυτεχνείο Οικονομικά Λοιπά Σύνολο

18 Παράδειγμα 13.13… Ξανά, ενδιαφερόμαστε να καθορίσουμε εάν ή όχι το ακαδημαϊκό υπόβαθρο των φοιτητών επηρεάζει την επιλογή της κατεύθυνσης στο ΜBA. Έτσι η ερευνητική μας υπόθεση είναι: H 1 : Οι δύο μεταβλητές είναι εξαρτημένες Η μηδενική υπόθεση τότε, είναι: H 0 : Οι δύο μεταβλητές είναι ανεξάρτητες.

19 Παράδειγμα 13.13… Σε αυτή την περίπτωση, το στατιστικό τεστ είναι: (όπου k είναι ο αριθμός των κελιών σε έναν πίνακα συνάφειας, δηλαδή (γραμμές, r)  (στήλες, c) Η περιοχή απόρριψης είναι: Όπου ο αριθμός των βαθμών ελευθεριών είναι (r–1)(c–1)

20 Παράδειγμα 13.13… Για να υπολογίσουμε το στατιστικό στοιχείο του χ 2 ελέγχου, χρειάζεται να υπολογίσουμε τις αναμενόμενες συχνότητες για όλα τα κελιά … Η αναμενόμενη συχνότητα ενός κελιού στην γραμμή i και την στήλη j είναι: ΥΠΟΛΟΓΙΣΤΕ Σύνολο της i γραμμής x Σύνολο της j στήλης e ij = Μέγεθός του δείγματος

21 Η Δομή του Πίνακα Συνάφειας …

22 Παράδειγμα 13.13… ΥΠΟΛΟΓΙΣΤΕ Κατευθύνσεις του MBA Προπτυχιακό Πτυχίο Λογιστική Χρηματο_ οικονομικά MarketingΣύνολο Θ. Επιστήμες Πολυτεχνείο x Οικονομικά Λοιπά Σύνολο e 23 = (31)(47)/152 = 9.59 — σύγκριση αυτού με f 23 = 7 Υπολογισμός αναμενομένων συχνοτήτων… Σύνολο της i γραμμής x Σύνολο της j στήλης e ij = Μέγεθός του δείγματος

23 Παράδειγμα 13.13… Μπορούμε να συγκρίνουμε τις συχνότητες που παρατηρούνται με τις αναμενόμενες … και υπολογίζουμε το στατιστικό τεστ: Κατευθύνσεις του MBA Προπτυχιακό Πτυχίο Λογιστική Χρηματο_ οικονομικά Marketing Θ. Επιστήμες Πολυτεχνείο Οικονομικά Λοιπά

24 Παράδειγμα 13.13… Συγκρίνουμε χ 2 = με: Αφού το στατιστικό τεστ πέφτει σε περιοχή απόρριψης, απορρίπτουμε H 0 : Οι δύο μεταβλητές είναι ανεξάρτητες. για τη εύνοια της H 1 : Οι δύο μεταβλητές είναι εξαρτημένες. Δηλαδή, υπάρχει μαρτυρία για σχέση μεταξύ προπτυχιακού πτυχίου και κατεύθυνσης MBA. ΕΡΜΗΝΕΥΣΤΕ χ 2 = χ 2 = χ 2 = α,ν.05, (4-1)(3-1).05,6

25 Απαιτούμενη Υπόθεση – Κανόνας των Πέντε … Σε έναν πίνακα συνάφειας όπου ένα ή περισσότερα κελιά έχουν αναμενόμενες τιμές μικρότερες από 5, χρειάζεται να συνδυάσουμε γραμμές και στήλες για να ικανοποιήσουμε τον κανόνα των 5. Σημειώστε: όταν συνδυάζουμε γραμμές και στήλες αλλάζουν και οι βαθμοί ελευθερίας.

26 Αναγνωρίζοντας Παράγοντες… Αναλύουμε την σχέση μεταξύ δύο μεταβλητών και συγκρίνουμε δύο ή περισσότερους πληθυσμό θα με ονομαστικά δεδομένα

27 Αριθμός των Πακέτων χ 2 έλεγχος για Κανονικότητα χ2 έλεγχος για κανονικότητα στο Παράδειγμα 13.3

28 •χ2 έλεγχος για κανονικότητα στο Παράδειγμα 13.3 Για μέγεθος δείγματος ίσο με n=50, ο δειγματοληπτικός μέσος ήταν με τυπικό σφάλμα Μπορούμε να συμπεράνουμε από τα δεδομένα δοθέντος ότι το δείγμα επιλέχθηκε από μία κανονική κατανομή με  = και  = 38.8; Χρησιμοποιώντας 5% επίπεδο σημαντικότητας. χ 2 έλεγχος για Κανονικότητα

29 Διαστήματα Έπειτα βρίσκουμε τις πιθανότητες από διαστήματα των οποίων το πλήθος είναι αυθαίρετο. Διάστημα 1: X ≤ Διάστημα 2: < X ≤ Διάστημα 3: < X ≤ Διάστημα 4: X >

30 Υπολογίζουμε τις Πιθανότητες X – μ – P ( X ≤ ) = P ≤ σ = P ( Z ≤ -1) =.1587

31 χ 2 έλεγχος για Κανονικότητα Λύση Πρώτα επιλέγουμε z τιμές που ορίζουνε ένα κελί (αναμενόμενη συχνότητα > 5 για κάθε κελί.) z 1 = -1; P(z < -1) = p 1 =.1587; e 1 = np 1 = 50(.1587) = 7.94 z 2 = 0; P(-1 < z< 0) = p 2 =.3413; e 2 = np 2 = 50(.3413) = z 3 = 1; P(0 < z < 1) = p 3 =.3413; e 3 = P(z > 1) = p 4 =.1587; e 4 = Τα όρια των κελιών υπολογίζονται από τις αντίστοιχες τιμές των z τιμών κάτω από την Η 0. z 1 =(x )  = -1; x 1 = Οι αναμενόμενες συχνότητες μπορούν τώρα να καθοριστούν για κάθε κελί. e 1 = 7.94 e 2 = 17.07e 3 = e 4 =

32 χ 2 έλεγχος για Κανονικότητα ( ) ( ) e 1 = 7.94 e 2 = e 3 = e 4 = 7.94 f 1 = 10 f 2 = 13 f 3 = 19 f 4 = 8 ( ) ( ) 2=2= = – Το στατιστικό τεστ

33 χ 2 έλεγχος για Κανονικότητα Συμπέρασμα: Υπάρχει ανεπαρκή μαρτυρία να συμπεράνουμε με 5% επίπεδο σημαντικότητας ότι τα δεδομένα δεν είναι κανονικά κατανεμημένα. ( ) ( ) ( ) 2=2= = ( ) – Η περιοχή απόρριψης – Το στατιστικό τεστ

34 χ 2 έλεγχος για Κανονικότητα •Σημειώστε ότι η μηδενική υπόθεση είναι: •Η 0 : τα δεδομένα ακολουθούν κανονική κατανομή και η εναλλακτική υπόθεση είναι: •Η 1 : τα δεδομένα δεν ακολουθούν κανονική κατανομή


Κατέβασμα ppt "Κεφάλαιο 13-Δ Πίνακας Συνάφειας & Έλεγχος χ 2. Ένα Κοινό Θέμα … Τι να κάνω; Τύπος Δεδομένων; Αριθμός Κατηγοριών; Στατιστικές Τεχνικές: Περιγραφή ενός."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google