Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

© 2002 Thomson / South-Western Slide 7-1 Κεφάλαιο 7 Δειγματοληψία και Δειγματοληπτικές Κατανομές.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "© 2002 Thomson / South-Western Slide 7-1 Κεφάλαιο 7 Δειγματοληψία και Δειγματοληπτικές Κατανομές."— Μεταγράφημα παρουσίασης:

1 © 2002 Thomson / South-Western Slide 7-1 Κεφάλαιο 7 Δειγματοληψία και Δειγματοληπτικές Κατανομές

2 © 2002 Thomson / South-Western Slide 7-2 Στόχοι Μαθήματος Χρήση της μεθόδου της δειγματοληψίας έναντι της μεθόδου της απογραφής. Διάκριση μεταξύ της τυχαίας και μη τυχαίας δειγματοληψίας. Πότε και πώς χρησιμοποιούνται οι διάφορες τεχνικές δειγματοληψίας. Επίγνωση των διαφόρων τύπων λαθών που μπορούμε να συναντήσουμε σε μια μελέτη. Κατανόηση της σημαντικότητας του Κεντρικού Οριακού Θεωρήματος στη στατιστική ανάλυση. Χρήση των δειγματικών κατανομών του και του x  p

3 © 2002 Thomson / South-Western Slide 7-3 Λόγοι που δικαιολογούν την χρήση της Δειγματοληψίας Με τη δειγματοληψία μπορούμε να κερδίσουμε χρήματα και χρόνο. Σύμφωνα με κάποιες πηγές, με τη δειγματοληψία μπορεί να διευρυνθεί το πεδίο του συνόλου των διαθέσιμων δεδομένων. Επειδή η διαδικασία της έρευνας είναι μερικές φορές καταστροφική για το ΄προϊόν της μελέτης, το δείγμα μπορεί να ‘σώσει την παρτίδα’. Αν η πρόσβαση στον πληθυσμό είναι αδύνατη, η δειγματοληψία είναι η μόνη επιλογή.

4 © 2002 Thomson / South-Western Slide 7-4 Λόγοι που δικαιολογούν την χρήση της μεθόδου της Απογραφής Μειώνει τη πιθανότητα ένα τυχαίο δείγμα να μην είναι αντιπροσωπευτικό του πληθυσμού. Το πρόσωπο που εκτελεί τη μελέτη δεν είναι εξοικειωμένο με τις πληροφορίες που περιέχει το δείγμα.

5 © 2002 Thomson / South-Western Slide 7-5 Πλαίσιο του Πληθυσμού Μια λίστα, ένας χάρτης, ένας κατάλογος ή άλλη πηγή που χρησιμοποιείται για να αντιπροσωπεύσει έναν πληθυσμό Υπερεγγραφή (Overregistration) –το πλαίσιο περιλαμβάνει όλα τα μέλη του πληθυσμού στόχος και μερικά πρόσθετα στοιχεία. Παράδειγμα: Χρήση του καταλόγου του συνόλου των μελών του εμπορικού επιμελητηρίου ως το πλαίσιο του πληθυσμού των γυναικών, επιχειρηματιών μελών του επιμελητηρίου. Υποεγγραφή (Underregistration) -- το πλαίσιο δεν περιλαμβάνει όλα τα μέλη του πληθυσμού στόχος. Παράδειγμα: Χρήση του καταλόγου του συνόλου των μελών του εμπορικού επιμελητηρίου ως το πλαίσιο για τον πληθυσμό του συνόλου των επιχειρηματιών

6 © 2002 Thomson / South-Western Slide 7-6 Τυχαία έναντι Μη τυχαίας Δειγματοληψίας Τυχαία Δειγματοληψία Κάθε μονάδα του πληθυσμού έχει την ίδια πιθανότητα να περιληφθεί στο δείγμα. Ένας τυχαίος μηχανισμός χρησιμοποιείται στην διαδικασία επιλογής. Εξαλείφει την μεροληψία στην διαδικασία επιλογής. Επίσης γνωστή ως δειγματοληψία με την χρήση πιθανοτήτων Μη τυχαία Δειγματοληψία Κάθε μονάδα του πληθυσμού δεν έχει την ίδια πιθανότητα να περιληφθεί στο δείγμα. Ευάλωτη στην μεροληψία επιλογής Ακατάλληλες μέθοδοι συλλογής δεδομένων για τις περισσότερες στατιτικές μεθόδους. Επίσης γνωστή ως δειγματοληψία χωρίς την χρήση πιθανοτήτων (deterministic)

7 © 2002 Thomson / South-Western Slide 7-7 Τεχνικές Τυχαίας Δειγματοληψίας Απλό Τυχαίο Δείγμα Στρωματοποιημένο Τυχαίο Δείγμα –Ανάλογο του πληθυσμού –Δυσανάλογο του πληθυσμού Συστηματικό Τυχαίο Δείγμα Δειγματοληψία κατά Συστάδες (κατά περιοχές)

8 © 2002 Thomson / South-Western Slide 7-8 Απλό Τυχαίο Δείγμα Αρίθμηση κάθε μονάδας του πλαισίου από 1 έως N. Χρήση ενός πίνακα τυχαίων αριθμών ή ενός μηχανισμού τυχαίας παραγωγής αριθμών προκειμένου να επιλέξουμε n διακριτούς αριθμούς μεταξύ του 1 και του N, συμπεριλαμβανομένων των 1 και Ν. Ευκολότερο να χρησιμοποιηθεί για μικρούς πληθυσμούς. Δύσκαμπτο στη χρήση μεγάλων πληθυσμών.

9 © 2002 Thomson / South-Western Slide 7-9 Απλό Τυχαίο Δείγμα: Αριθμημένο Πλαίσιο Πληθυσμού 01 Alaska Airlines 02 Alcoa 03 Amoco 04 Atlantic Richfield 05 Bank of America 06 Bell of Pennsylvania 07 Chevron 08 Chrysler 09 Citicorp 10 Disney 11 DuPont 12 Exxon 13 Farah 14 GTE 15 General Electric 16 General Mills 17 General Dynamics 18 Grumman 19 IBM 20 Kmart 21 LTV 22 Litton 23 Mead 24 Mobil 25 Occidental Petroleum 26 JCPenney 27 Philadelphia Electric 28 Ryder 29 Sears 30 Time

10 © 2002 Thomson / South-Western Slide 7-10 Απλή Τυχαία Δειγματοληψία: Πίνακας Τυχαίων Αριθμών 9943787961457373755297969390943447531618 5065600127683676688208156800167822458326 8088063171428776683560515702965002645587 8642040853537988945468130912538810474319 6009786436018694775889535994004826830606 5258771965854534683400991997297694815941 8915590553906894863707955470627118264493 N = 30 n = 6

11 © 2002 Thomson / South-Western Slide 7-11 Απλό Τυχαίο Δείγμα: Στοιχεία Δείγματος 01 Alaska Airlines 02 Alcoa 03 Amoco 04 Atlantic Richfield 05 Bank of America 06 Bell Pennsylvania 07 Chevron 08 Chrysler 09 Citicorp 10 Disney 11 DuPont 12 Exxon 13 Farah 14 GTE 15 General Electric 16 General Mills 17 General Dynamics 18 Grumman 19 IBM 20 KMart 21 LTV 22 Litton 23 Mead 24 Mobil 25 Occidental Petroleum 26 Penney 27 Philadelphia Electric 28 Ryder 29 Sears 30 Time N = 30 n = 6

12 © 2002 Thomson / South-Western Slide 7-12 Στρωματοποιημένο Τυχαίο Δείγμα Ο πληθυσμός διακρίνεται σε μη επικαλυπτόμενους υποπληθυσμούς που ονομάζονται στρώματα. Ένα τυχαίο δείγμα επιλέγεται από κάθε στρώμα Υπάρχει η δυνατότητα να μειωθεί το δειγματικό σφάλμα. Ανάλογο – το ποσοστό τριών δειγμάτων που επιλέγονται από κάθε στρώμα είναι ανάλογο του ποσοστού κάθε στρώμα να ανήκει στον πληθυσμό. Δυσανάλογο – αναλογίες των στρωμάτων εντός του δείγματος διαφέρουν από τις αναλογίες των στρωμάτων εντός του πληθυσμού.

13 © 2002 Thomson / South-Western Slide 7-13 Στρωματοποιημένο Τυχαίο Δείγμα: Πληθυσμός των ακροατών του FM Radio 20 - 30 ετών (ομοογένεια εντός) (όμοιοι) 30 - 40 ετών (ομοιογένεια εντός) (όμοιοι) 40 - 50 ετών (ομοιογένεια εντός) (όμοιοι) Ετερογενείς (διαφορετικοί) μεταξύ Διάκριση κατά ηλικία Ετερογενείς (διαφορετικοί) μεταξύ

14 © 2002 Thomson / South-Western Slide 7-14 Συστηματική Δειγματοληψία Βολική και σχετικά εύκολη στη διαχείριση. Τα στοιχεία του πληθυσμού αποτελούν μια διατεταγμένη ακολουθία (τουλάχιστον, εννοιολογικά). Το πρώτο στοιχείο του δείγματος επιλέγεται τυχαία από τα πρώτα k στοιχεία του πληθυσμού. Συνεπώς, τα στοιχεία του δείγματος επιλέγονται σε ένα συνεχές διάστημα, μεγέθους k, από το πλαίσιο της διατεταγμένης ακολουθίας. k = N n, όπου: n=μέγεθος δείγματος N=Μέγεθος πληθυσμού k= μέγεθος του διαστήματος επιλογής

15 © 2002 Thomson / South-Western Slide 7-15 Συστηματική Δειγματοληψία: Παράδειγμα Οι εντολές αγοράς για το προηγούμενο οικονομικό έτος παίρνουν τιμές από 1 έως 10,000 (N = 10,000). Ένα δείγμα από πενήντα (n = 50) εντολές αγορών είναι απαραίτητο για τον έλεγχο. k = 10,000/50 = 200 Το πρώτο στοιχείο του δείγματος επιλέγεται τυχαία από τις πρώτες 200 αγορές εντολών. Υποθέτουμε ότι η 45 η εντολή αγοράς επιλέχθηκε. Επακόλουθα στοιχεία δείγματος: 245, 445, 645...,

16 © 2002 Thomson / South-Western Slide 7-16 Δειγματοληψία κατά Συστάδες Ο πληθυσμός διακρίνεται σε μη επικαλυπτόμενες συστάδες ή περιοχές. Κάθε συστάδα είναι μια μικρογραφία, ή ένας μικρόκοσμός, του πληθυσμού. Ένα υποσύνολο των συστάδων επιλέγεται τυχαία για το δείγμα. Αν ο αριθμός των στοιχείων σε ένα υποσύνολο συστάδων είναι μεγαλύτερο από την επιθυμητή τιμή του n, τότε οι συστάδες αυτές μπορούν να υποδιαιρεθούν για να διαμορφώσουν ένα νεό σύνολο συστάδων και αυτό να υποβληθεί σε μια διαδικασία τυχαίας επιλογής.

17 © 2002 Thomson / South-Western Slide 7-17 Δειγματοληψία κατά Συστάδες u Πλεονεκτήματα Πιο βολική για γεωγραφικά διασκορπισμένους πληθυσμούς. Μειωμένα έξοδα μετακίνησης για την συλλογή πληροφοριών σχετικά με το δείγμα. Απλοποιημένη διαχείριση της έρευνας Μη διαθεσιμότητα του πλαισίου δειγματοληψίας απαγορεύει τη χρήση άλλων μεθόδων τυχαίας δειγματοληψίας. u Μειονεκτήματα Στατιστικά λιγότερο αποτελεσματική όταν τα στοιχεία των συστάδων είναι παρόμοια. Τα διάφορα κόστη και προβλήματα της στατιστικής ανάλυσης είναι μεγαλύτερα απ΄ό,τι στην απλή τυχαία δειγματοληψία.

18 © 2002 Thomson / South-Western Slide 7-18 Δειγματοληψία κατά Συστάδες: Πόλεις Ελέγχου της Αγοράς των ΗΠΑ San Jose Boise Phoenix Denver Cedar Rapids Buffalo Louisville Atlanta Portland Milwaukee Kansas City San Diego Tucson Grand Forks Fargo Sherman- Dension Odessa- Midland Cincinnati Pittsfield

19 © 2002 Thomson / South-Western Slide 7-19 Μη Τυχαία Δειγματοληψία Δειγματοληψία ευκολίας: τα στοιχεία του δείγματος επιλέγονται για την ευκολία του ερευνητή. Δειγματοληψία κρίσης: τα στοιχεία του δείγματος επιλέγονται κατά τη κρίση του ερευνητή. Δειγματοληψία με την χρήση ποσοστώσεων: τα στοιχεία του δείγματος επιλέγονται μέχρις ότου ικανοποιηθούν οι έλεγχοι των ποσοστώσεων. Δειγματοληψία χιονστιβάδα: τα θέματα της έρευνας επιλέγονται με βάση τις παραπομπές από άλλους συμμετέχοντες στην έρευνα.

20 © 2002 Thomson / South-Western Slide 7-20 Σφάλματα u Δεδομένα που προέρχονται από μη τυχαία δείγματα δεν είναι κατάλληλα για την ανάλυση επαγωγικών στατιστικών μεθόδων. u Δειγματικό Σφάλμα προκύπτει όταν το δείγμα δεν είναι αντιπροσωπευτικό του πληθυσμού. u Μη Δειγματικά Σφάλματα Έλλειπή δεδομένα, Καταγραφή, Επεξεργασία Δεδομένων και Σφάλματα Ανάλυσης. Παρανόηση εννοιών, ασαφείς ορισμοί και ελαττωματικά ερωτηματολόγια. Σφάλματα στις απαντήσεις συμβαίνουν όταν οι άνθρωποι δηλώνουν ότι δεν γνωρίζουν ή δεν λένε ή υπερεκτιμούν τις απαντήσεις τους.

21 © 2002 Thomson / South-Western Slide 7-21 Σωστή ανάλυση και ερμηνεία ενός στατιστικού δείγματος απαιτεί γνώση της κατανομής του. Δειγματική Κατανομή του δειγματικού μέσου Διαδικασία της Επαγωγικής Στατιστικής

22 © 2002 Thomson / South-Western Slide 7-22 Κατανομή ενός Μικρού Πεπερασμένου Πληθυσμού Ιστόγραμμα Πληθυσμού 0 1 2 3 52.557.562.567.572.5 Συχνότητα N = 8 54, 55, 59, 63, 68, 69, 70

23 © 2002 Thomson / South-Western Slide 7-23 Δειγματικός Χώρος για n = 2 με Επανάθεση ΔείγμαΜέσος΄ΔείγμαΜέσοςΔείγμαΜέσοςΔείγμαΜέσος 1(54,54)54.017(59,54)56.533(64,54)59.049(69,54)61.5 2(54,55)54.518(59,55)57.034(64,55)59.550(69,55)62.0 3(54,59)56.519(59,59)59.035(64,59)61.551(69,59)64.0 4(54,63)58.520(59,63)61.036(64,63)63.552(69,63)66.0 5(54,64)59.021(59,64)61.537(64,64)64.053(69,64)66.5 6(54,68)61.022(59,68)63.538(64,68)66.054(69,68)68.5 7(54,69)61.523(59,69)64.039(64,69)66.555(69,69)69.0 8(54,70)62.024(59,70)64.540(64,70)67.056(69,70)69.5 9(55,54)54.525(63,54)58.541(68,54)61.057(70,54)62.0 10(55,55)55.026(63,55)59.042(68,55)61.558(70,55)62.5 11(55,59)57.027(63,59)61.043(68,59)63.559(70,59)64.5 12(55,63)59.028(63,63)63.044(68,63)65.560(70,63)66.5 13(55,64)59.529(63,64)63.545(68,64)66.061(70,64)67.0 14(55,68)61.530(63,68)65.546(68,68)68.062(70,68)69.0 15(55,69)62.031(63,69)66.047(68,69)68.563(70,69)69.5 16(55,70)62.532(63,70)66.548(68,70)69.064(70,70)70.0

24 © 2002 Thomson / South-Western Slide 7-24 Κατανομή Δειγματικών Μέσων Ιστόγραμμα Δειγματικής Κατανομής 0 5 10 15 20 53.7556.2558.7561.2563.7566.2568.7571.25 Συχνότητα

25 © 2002 Thomson / South-Western Slide 7-25 Κεντρικό Οριακό Θεώρημα

26 © 2002 Thomson / South-Western Slide 7-26 Δειγματοληψία από έναν Πληθυσμό που ακολουθεί την Κανονική Κατανομή Η κατανομή του δειγματικού μέσου είναι η κανονική για οποιοδήποτε μέγεθος του δείγματος.

27 © 2002 Thomson / South-Western Slide 7-27 Κατανομή Δειγματικών Μέσων για διάφορα μεγέθη Δείγματος Εκθετική Κατανομή n = 2n = 5n = 30 Ομοιόμορφη Κατανομή n = 2n = 5n = 30

28 © 2002 Thomson / South-Western Slide 7-28 Κατανομή Δειγματικών Μέσων για διάφορα μεγέθη Δείγματος Κατανομή U-Σχήματος n = 2n = 5n = 30 Κανονική Κατανομή n = 2n = 5n = 30

29 © 2002 Thomson / South-Western Slide 7-29 Τύπος της Z-Κατανομής για τον Δειγματικό Μέσο

30 © 2002 Thomson / South-Western Slide 7-30 Λύση στο Παράδειγμα με το Κατάστημα με Λάστιχα

31 © 2002 Thomson / South-Western Slide 7-31 Γραφική Λύση στο Παράδειγμα με το Κατάστημα με Λάστιχα Z1.410.5000.4207 X8785.5000.4207 Ίσες περιοχές μεγέθους.0793

32 © 2002 Thomson / South-Western Slide 7-32 Γραφική Λύση για το Πρόβλημα 7.1 0 Z-2.33-.67.2486.4901.2415 448 X441446.2486.4901.2415

33 © 2002 Thomson / South-Western Slide 7-33 Δειγματοληψία από πεπερασμένο πληθυσμό χωρίς επανάθεση Σε αυτή την περίπτωση, η τυπική απόκλιση της κατανομής του δειγματικού μέσου είναι μικρότερη από την αντίστοιχη κατανομή όταν ο πληθυσμός είναι άπειρος (ή όταν πρόκειται για έναν πεπερασμένο πληθυσμό με επανάθεση). Η σωστή τιμή της τυπικής απόκλισης υπολογίζεται εφαρμόζοντας έναν πεπερασμένο παράγοντα διόρθωσης στην τυπική απόκλιση της δειγματοληψίας από έναν άπειρο πληθυσμό. Εάν το μέγεθος του δείγματος είναι μικρότερο του 5% του πληθυσμού η συγκεκριμένη προσαρμογή δεν είναι απαραίτητη.

34 © 2002 Thomson / South-Western Slide 7-34 Δειγματοληψία από έναν Πεπερασμένο Πληθυσμό Πεπαρασμένος παράγοντας διόρθωσης Τροποποημένος τύπος της Z

35 © 2002 Thomson / South-Western Slide 7-35 Πεπερασμένος παράγοντας διόρθωσης για Επιλεγμένα Μεγέθη Δείγματος Μέγεθος ΜέγεθοςΔείγμα %Τιμή του Πληθυσμού Δείγματος του Πληθυσμού Παράγοντα (N) (n) 6,000300.50%0.998 6,0001001.67%0.992 6,0005008.33%0.958 2,000301.50%0.993 2,0001005.00%0.975 2,00050025.00%0.866 500306.00%0.971 5005010.00%0.950 50010020.00%0.895 2003015.00%0.924 2005025.00%0.868 2007537.50%0.793

36 © 2002 Thomson / South-Western Slide 7-36 Δειγματική Κατανομή του p  Δειγματική αναλογία Κατανομή Δειγματοληψίας Κατά προσέγγιση κανονική αν nP > 5 and nQ > 5 (P είναι η πληθυσμιακή αναλογία και Q = 1 - P.) Ο μέσος της κατανομής είναι P. Η τυπική απόκλιση της κατανομής είναι PQ n 

37 © 2002 Thomson / South-Western Slide 7-37 Λύση Προβλήματος 7.3 Παράμετροι Πληθυσμού =. =- Δείγμα = P QP n X p X n PpPZ p p 010 11 90 80 12 80 015     .. . ( .).               PZ P PQ n P PZ PZ PZ... (.) ).. (.).(.)... 15 10 90 80 005 00335 149 501 54319 0681

38 © 2002 Thomson / South-Western Slide 7-38 Γραφική Λύση προβλήματος 7.3 Z1.490.5000.4319 p0.150.10.5000.4319 ^


Κατέβασμα ppt "© 2002 Thomson / South-Western Slide 7-1 Κεφάλαιο 7 Δειγματοληψία και Δειγματοληπτικές Κατανομές."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google