Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Εισαγωγή στην Στατιστική

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Εισαγωγή στην Στατιστική"— Μεταγράφημα παρουσίασης:

1 Εισαγωγή στην Στατιστική
ΤΕΙ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ Εισαγωγή στην Στατιστική Κουκούμιαλος Στυλιανός «Εισαγωγή στην Στατιστική» / Συνοπτική Παρουσίαση Κεφάλαιο 6,7, /10/2015 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 1

2 ΚΑΤΑΝΟΜΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ - ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ
1.- Κατανομές δειγματοληψίας 2.- Κατανομή δειγματοληψίας δειγματικού μέσου 3.- Κατανομή δειγματοληψίας αναλογίας 4.- Εκτίμηση παραμέτρων -Διαστήματα εμπιστοσύνης 5.- Διάστημα εμπιστοσύνης για την μέση τιμή μ 6.- Διάστημα εμπιστοσύνης για την αναλογία p 7.- Καθορισμός μεγέθους δείγματος Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 2

3 Κατανομές δειγματοληψίας
Θεωρούμε ότι από ένα στατιστικό πληθυσμό επιλέγονται όλα τα δυνατά δείγματα μεγέθους n. Κάθε δείγμα αποτελεί μία εμπειρική κατανομή, από την οποία υπολογίζεται η τιμή μίας δειγματικής συνάρτησης, όπως μέση τιμή , διακύμανση , αναλογία ενός ποιοτικού χαρακτηριστικού. Έστω ότι επιλέγονται κ δείγματα. Οι δειγματικοί μέσοι αποτελούν εκτιμήσεις για την μέση τιμή μ του στατιστικού πληθυσμού. Οι δειγματικές διακυμάνσεις αποτελούν εκτιμήσεις για την διακύμανση του στατιστικού πληθυσμού. Οι δειγματικές αναλογίες αποτελούν εκτιμήσεις για την αναλογία p του στατιστικού πληθυσμού. Οι τιμές των παραμέτρων αναφέρονται στον πληθυσμό και είναι άγνωστα αλλά σταθερά μεγέθη. Οι τιμές των στατιστικών μεταβάλλονται από δείγμα σε δείγμα, και σχηματίζουν την κατανομή δειγματοληψίας του αντίστοιχου στατιστικού μεγέθους. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 3

4 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Κατανομή δειγματοληψίας του δειγματικού μέσου Έστω Δ1, Δ2,…, Δκ όλα τα δυνατά δείγματα μεγέθους n που επιλέγονται από ένα στατιστικό πληθυσμό. Αν θεωρήσουμε σαν δειγματική συνάρτηση την μέση τιμή , σε κάθε δείγμα αντιστοιχεί ένας δειγματικός μέσος. Οι δειγματικοί μέσοι σχηματίζουν μία νέα κατανομή, την κατανομή δειγματοληψίας των δειγματικών μέσων. Κεντρικό Οριακό Θεώρημα (Κ.Ο.Θ) Από ένα στατιστικό πληθυσμό, με μέση τιμή μ και τυπική απόκλιση σ, επιλέγονται τυχαία δείγματα μεγέθους n. Η τυχαία μεταβλητή ακολουθεί προσεγγιστικά κανονική κατανομή με μέση τιμή και διακύμανση Συμπληρωματικά: Δύο ενδεχόμενα καλούνται συμπληρωματικά, όταν είναι ξένα και η ένωσή τους είναι ο δειγματικός χώρος. Ισχύει Α  Β =  και Α  Β =Ω Διαφορά Α-Β: Είναι το ενδεχόμενο που πραγματοποιείται, όταν πραγματοποιείται το Α και όχι το Β. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 4

5 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Ισχύει Η μεταβλητή Η τυπική απόκλιση των δειγματικών μέσων καλείται τυπικό σφάλμα του μέσου και εκφράζει την διασπορά των γύρω από την μέση τιμή τους μ. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 5

6 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Σε έλεγχο ποιότητας, επιλέγονται δείγματα 9 προϊόντων. Το μέσο βάρος των δειγμάτων πρέπει να κυμαίνεται από 145 έως 155 γραμμάρια. Να υπολογισθεί το ποσοστό των δειγμάτων, στα οποία το μέσο βάρος αναμένεται να βρίσκεται εκτός των ορίων ασφαλείας. Η μεταβλητή Χ: Βάρος, ακολουθεί κανονική κατανομή Ν(150 ,6). Ο δειγματικός μέσος Το 98.76% των δειγματικών μέσων θα είναι μέσα στα όρια, και το 1.24% των δειγματικών μέσων εκτός των ορίων ασφαλείας . Παράδειγμα: Το βάρος τυποποιημένων προϊόντων ενός εργοστασίου, ακολουθεί κανονική κατανομή, με μέση τιμή μ=150 γραμμάρια και τυπική απόκλιση σ=9. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 6

7 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Κατανομή δειγματοληψίας της αναλογίας Έστω η τ.μ Χ: αριθμός εμφάνισης του ενδεχομένου Α ή ισοδύναμα Χ: αριθμός «επιτυχιών» σε n ανεξάρτητες δοκιμές με Ρ(Α)=p, αναλογία «επιτυχιών» στον στατιστικό πληθυσμό Έστω η αναλογία «επιτυχιών» στο δείγμα. Η αναλογία είναι τυχαία μεταβλητή διότι μεταβάλλεται από δείγμα σε δείγμα. Για μεγάλα δείγματα, n>30, σύμφωνα με το Κ.Ο.Θ, η κατανομή δειγματοληψίας της μεταβλητής προσεγγίζει κανονική κατανομή με μέση τιμή και διακύμανση Ισχύει Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 7

8 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Παράδειγμα: Το ποσοστό των ψήφων που έλαβε ένας συνδυασμός σε δημοτικές εκλογές ήταν 46%. Να υπολογισθεί η πιθανότητα, σε δημοσκόπηση που έγινε σε δείγμα α)n= 200 β) n= 1000 ψηφοφόρων, το ποσοστό του συνδυασμού στο δείγμα να είναι μεγαλύτερο από 50%. H αναλογία ψηφοφόρων στον πληθυσμό υπέρ του συνδυασμού, είναι p=0.46. α) Αν n= 200, η μέση τιμή , τυπική απόκλιση Στο 12.9% των δειγμάτων, το ποσοστό υπέρ του συνδυασμού θα είναι μεγαλύτερο από 50%. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 8

9 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
β) Αν n= 1000, μέση τιμή , τυπική απόκλιση αντίστοιχα Σε ποσοστό 0.5 % των δειγμάτων, το ποσοστό υπέρ του συνδυασμού θα είναι μεγαλύτερο από 50%. Στη δεύτερη περίπτωση, αυξάνοντας το μέγεθος του δείγματος, η πιθανότητα σφάλματος, μειώνεται από 12.9% σε 0.5%. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 9

10 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Εκτίμηση παραμέτρων –Διαστήματα εμπιστοσύνης Επαγωγική Στατιστική: Μεθοδολογία εκτίμησης παραμέτρων και λήψης αποφάσεων, με βάση τα δεδομένα ενός δείγματος, το οποίο επιλέγεται με κατάλληλες τεχνικές δειγματοληψίας. Διαστήματα εμπιστοσύνης: Μέθοδος για την εκτίμηση των αγνώστων παραμέτρων, που καθορίζουν ένα στατιστικό πληθυσμό, με ορισμένο βαθμό αβεβαιότητας. Για κάθε δείγμα, προσδιορίζεται ένα διάστημα τιμών (θ1, θ2) το οποίο περιέχει την πραγματική τιμή θ, της παραμέτρου που θέλουμε να εκτιμήσουμε, με καθορισμένο εκ των προτέρων βαθμό αξιοπιστίας. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 10

11 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Το διάστημα (θ1,θ2) καλείται διάστημα εμπιστοσύνης. Οι αριθμοί θ1,θ2 όρια εμπιστοσύνης. Η πιθανότητα 1-α επίπεδο εμπιστοσύνης. Η πιθανότητα α (βαθμός αβεβαιότητας), επίπεδο σημαντικότητας. Η πιθανότητα, ένα διάστημα να μην περιέχει την παράμετρο θ, είναι ίση με α. Το διάστημα (θ1,θ2) μεταβάλλεται για κάθε δείγμα. Από τα διαστήματα, ένα ποσοστό (1-α)% δίνει σωστή εκτίμηση της παραμέτρου. Τα όρια του διαστήματος καθορίζονται από: α) Το μέγεθος n του δείγματος β) Την διασπορά του στατιστικού πληθυσμού γ) Τον βαθμό αξιοπιστίας 1-α Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 11

12 Διάστημα εμπιστοσύνης για την μέση τιμή μ
Έστω : μέσος δείγματος n στοιχείων, που επιλέγεται από στατιστικό πληθυσμό με μέση τιμή μ και τυπική απόκλιση σ. α)Τυπική απόκλιση σ του πληθυσμού γνωστή Το διάστημα εμπιστοσύνης, που περιέχει την παράμετρο μ με πιθανότητα 1-α σχηματίζεται με βάση την κανονική κατανομή και είναι Ισοδύναμα Η τιμή υπολογίζεται από τον πίνακα της κανονικής κατανομής, από την σχέση Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 12

13 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Παράδειγμα Η περιεκτικότητα του νερού σε τοξικές ουσίες μετρήθηκε σε 16 δείγματα ύδατος σε μία περιοχή και η μέση περιεκτικότητα ήταν mg. Η τυπική απόκλιση της περιεκτικότητας, σε όλη την περιοχή είναι γνωστή από προηγούμενες μετρήσεις και ίση με σ=5. Να εκτιμηθεί σε επίπεδο αξιοπιστίας 95% η μέση περιεκτικότητα του νερού σε τοξικές ουσίες για όλη την περιοχή. Επίπεδο εμπιστοσύνης 1-α=0.95 α=0.05 Από την σχέση = προκύπτει = Το 95% Δ.Ε είναι (9.15, ) ή ισοδύναμα Η μέση περιεκτικότητα του νερού σε τοξικά, εκτιμάται με βαθμό αξιοπιστίας 95%, ότι κυμαίνεται από 9.15 μέχρι mg Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 13

14 β)Τυπική απόκλιση σ του πληθυσμού άγνωστη
Αν η τυπική απόκλιση του πληθυσμού είναι άγνωστη, το διάστημα σχηματίζεται με βάση την κατανομή t-Student. Η μεταβλητή ακολουθεί κατανομή t με ν=n-1 βαθμούς ελευθερίας. Το διάστημα είναι όπου s: τυπική απόκλιση δείγματος, η κριτική τιμή της κατανομής t, που αντιστοιχεί σε n-1 β.ε και επίπεδο σημαντικότητας α/2. Ισοδύναμα Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 14

15 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Παράδειγμα Στο συμβόλαιο παράδοσης μίας παρτίδας προϊόντων, συμφωνήθηκε το μέσο βάρος να είναι 500 γραμμάρια. Σε τυχαίο δείγμα 40 προϊόντων, το μέσο βάρος υπολογίσθηκε ίσο με γραμμάρια και η τυπική απόκλιση s=7.4. Να εκτιμηθεί το μέσος βάρος των προϊόντων της παρτίδας σε επίπεδο 99%.Πληροί η παρτίδα τις προδιαγραφές; Από τον πίνακα της κατανομής t για n-1=39 β.ε και α/2=0.005 η κριτική τιμή Το 99% Δ.Ε είναι Η παρτίδα πληροί τις προδιαγραφές, διότι σύμφωνα με την εκτίμηση, η μέση τιμή του πληθυσμού κυμαίνεται από μέχρι 501.2, δηλαδή η τιμή μ=500 που υποθέσαμε για τον πληθυσμό περιέχεται στο διάστημα. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 15

16 Διάστημα εμπιστοσύνης για την αναλογία p
: αναλογία ποιοτικού χαρακτηριστικού στο δείγμα Το διάστημα εμπιστοσύνης, που περιέχει την παράμετρο p με πιθανότητα 1-α σχηματίζεται με βάση την κανονική κατανομή και είναι Ισοδύναμα Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 16

17 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Παράδειγμα Σε δημοσκόπηση που έγινε σε δείγμα 1200 δημοτών μίας πόλης, 450 άτομα δήλωσαν θετική πρόθεση ψήφου για τον συνδυασμό Α. Να εκτιμηθεί σε επίπεδο 90% το ποσοστό των δημοτών, που στηρίζουν τον συνδυασμό Α, στο σύνολο των ψηφοφόρων. Το ποσοστό υπέρ του συνδυασμού στο δείγμα Επίπεδο σημαντικότητας α=0.10 Από τη σχέση προκύπτει Το διάστημα είναι Το ποσοστό p στον στατιστικό πληθυσμό κυμαίνεται από 35.3 μέχρι 39.7%. The mean of the data in the sample of 36 CK measurements is given by Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 17

18 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Προσδιορισμός μεγέθους δείγματος α) Εκτίμηση μέσης τιμής Για να προσδιορισθεί το μέγεθος n του δείγματος, έτσι ώστε η εκτίμηση της μέσης τιμής μ του πληθυσμού να έχει ορισμένη ακρίβεια, καθορίζεται Το επιτρεπτό σφάλμα δειγματοληψίας Το επίπεδο εμπιστοσύνης 1-α Μέγεθος δείγματος σ: τυπική απόκλιση πληθυσμού Αν ο πληθυσμός αποτελείται από πεπερασμένο αριθμό στοιχείων, Ν όπου The mean of the data in the sample of 36 CK measurements is given by Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 18

19 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
β)Εκτίμηση αναλογίας p Για να προσδιορισθεί το μέγεθος n του δείγματος, έτσι ώστε η εκτίμηση της αναλογίας p του πληθυσμού να έχει ορισμένη ακρίβεια, καθορίζεται Το επιτρεπτό σφάλμα δειγματοληψίας Το επίπεδο εμπιστοσύνης 1-α Το μέγεθος δείγματος είναι Επειδή το p είναι άγνωστο, επιλέγεται η τιμή p=0.5 που μεγιστοποιεί το γινόμενο pq. Όταν ο πληθυσμός αποτελείται από πεπερασμένο αριθμό στοιχείων, Ν όπου Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 19

20 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ 1.- Στατιστικοί έλεγχοι 2.- Έλεγχος για την μέση τιμή μ 3.- Έλεγχος για την αναλογία p 4.- Έλεγχος ανεξαρτησίας δύο ποιοτικών μεταβλητών Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

21 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Στατιστικοί έλεγχοι Στατιστικοί έλεγχοι: Μέθοδος της Επαγωγικής Στατιστικής, εφαρμόζεται για την λήψη αποφάσεων, σχετικά με τις τιμές αγνώστων παραμέτρων, ή την κατανομή ενός πληθυσμού. Σε ένα έλεγχο α) Διατυπώνονται δύο υποθέσεις : Η μηδενική υπόθεση Ηο και η εναλλακτική υπόθεση Η1, η ισχύς των οποίων ελέγχεται με βάση τις πληροφορίες ενός δείγματος. β) Υπολογίζεται το κριτήριο του ελέγχου, με βάση το οποίο η Ηο γίνεται δεκτή ή απορρίπτεται, με ορισμένη πιθανότητα σφάλματος. γ) Περιοχή απόρριψης ονομάζεται το σύνολο των δυνατών τιμών του κριτηρίου του ελέγχου, για τις οποίες η μηδενική υπόθεση Ηο απορρίπτεται. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 21

22 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
δ) Κριτική τιμή είναι η τιμή που χωρίζει την περιοχή αποδοχής από την περιοχή απόρριψης της μηδενικής υπόθεσης Ηο. ε) Στους ελέγχους διακρίνουμε δύο είδη σφαλμάτων: Σφάλμα τύπου Ι : Το σφάλμα να απορριφθεί η Ηο ενώ είναι αληθής. Η πιθανότητα P( απόρριψη Ηο  Ηο αληθής ) = α καλείται επίπεδο σημαντικότητας του ελέγχου. Σφάλμα τύπου ΙΙ : Το σφάλμα να γίνει δεκτή η Ηο ενώ είναι ψευδής. P( αποδοχή Ηο  Ηο ψευδής ) = β Ισχύς του ελέγχου καλείται η πιθανότητα να απορριφθεί η Ηο ενώ είναι ψευδής. P( απόρριψη Ηο  Ηο ψευδής ) = 1-β Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 22

23 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Έλεγχος για την μέση τιμή μ α)Τυπική απόκλιση σ του πληθυσμού γνωστή Κριτήριο ελέγχου Διακρίνουμε τις εξής περιπτώσεις: 1.- Η0 : μ =μο Η1 : μ >μο Περιοχή απόρριψης R ={z > zα } Η κριτική τιμή zα υπολογίζεται από την σχέση F(zα)=1-α 2.- Η0 : μ =μο Η1 : μ < μο Περιοχή απόρριψης R ={z <- zα } 3.- Η0 : μ =μο Η1 : μ ≠μο Περιοχή απόρριψης R ={z > zα/2 ή z <- zα/2 } Η κριτική τιμή zα/2 υπολογίζεται από την σχέση F(zα/2)=1-α/2 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 23

24 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Παράδειγμα Σε έλεγχο κατά πόσον η μέση περιεκτικότητα σε νικοτίνη, ορισμένης μάρκας τσιγάρων είναι μεγαλύτερη από αυτή που διαφημίζεται, δηλαδή milligram, μετρήθηκε η μέση περιεκτικότητα σε δείγμα τσιγάρων, ίση με Η τυπική απόκλιση εκτιμήθηκε ίση με σ= milligram. Γίνεται δεκτή η τιμή που διαφημίζεται, σε επίπεδο σημαντικότητας α=0.01; Στατιστικές υποθέσεις Η0 : μ = Η1 : μ > Κριτήριο ελέγχου Κριτική τιμή zα = Περιοχή απόρριψης R ={z > } z=2.5>zα=2.326  Η μηδενική υπόθεση Η0 απορρίπτεται, δηλαδή η μέση περιεκτικότητα σε νικοτίνη είναι μεγαλύτερη από 1.4 milligram. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 24

25 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
β)Τυπική απόκλιση σ του πληθυσμού άγνωστη Κριτήριο ελέγχου Διακρίνουμε τις εξής περιπτώσεις: 1.- Η0 : μ =μο Η1 : μ >μο Περιοχή απόρριψης R ={t >tn-1;α } Η0 : μ =μο Η1 : μ < μο Περιοχή απόρριψης R ={t <-tn-1;α } Η0 : μ =μο Η1 : μ ≠μο Περιοχή απόρριψης R ={t >tn-1;α/2 ή t <-tn-1;α/2 } Οι κριτικές τιμές tn-1;α , tn-1;α/2 υπολογίζονται από τον πίνακα της κατανομής t. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 25

26 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Παράδειγμα Ο ρυθμός απόδοσης των μετοχών ενός χαρτοφυλακίου, κατά το προηγούμενο έτος κυμάνθηκε, κατά μέσον όρο στο 10.2%. Σε δείγμα 10 μετοχών η μέση απόδοση ήταν και η τυπική απόκλιση s=4. Παραμένει ο ρυθμός απόδοσης των μετοχών στο ίδιο επίπεδο με το προηγούμενο έτος ή έχει μεταβληθεί; (α=0.05) Στατιστικές υποθέσεις Η0 : μ = Η1 : μ ≠ Κριτήριο ελέγχου Κριτική τιμή tn-1;α/2 = t9;0.025= t=-1.58 >  Η μηδενική υπόθεση Η0 δεν απορρίπτεται, τα δεδομένα του δείγματος δείχνουν ότι ο ρυθμός απόδοσης δεν έχει μεταβληθεί. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 26

27 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Έλεγχος για την αναλογία p Κριτήριο ελέγχου όπου το ποσοστό του δείγματος Διακρίνουμε τις εξής περιπτώσεις: 1.- Η0 : p =pο Η1 : p >pο Περιοχή απόρριψης R ={z > zα } Η κριτική τιμή zα υπολογίζεται από την σχέση F(zα)=1-α 2.- Η0 : p =pο Η1 : p < pο Περιοχή απόρριψης R ={z <- zα } 3.- Η0 : p =pο Η1 : p ≠pο Περιοχή απόρριψης R ={z > zα/2 ή z <- zα/2 } Η κριτική τιμή zα/2 υπολογίζεται από την σχέση F(zα/2)=1-α/2 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 27

28 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Παράδειγμα Σε δημοσκόπηση που διενεργήθηκε σε δείγμα ψηφοφόρων, 400 άτομα δήλωσαν θετική πρόθεση ψήφου για ένα συνδυασμό. Σε προηγούμενες εκλογές το ποσοστό του συνδυασμού ήταν 25%. Μπορούμε να δεχθούμε σε επίπεδο στατιστικού σφάλματος 1%, ότι ο συνδυασμός διατηρεί την εκλογική του δύναμη ή έχει μειωθεί από τις προηγούμενες εκλογές; Η0 : p =0.25 Η1 : p < 0.25 Ποσοστό δείγματος Κριτική τιμή zα=2.326 Κριτήριο ελέγχου Z=-2.94<  Η Η0 απορρίπτεται, συνεπώς η εκλογική δύναμη του συνδυασμού έχει μειωθεί. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

29 Έλεγχος ανεξαρτησίας δύο ποιοτικών μεταβλητών
Τα δεδομένα ενός δείγματος n στοιχείων ταξινομούνται σε πίνακα συναφείας κ x m, ως προς δύο ποιοτικά χαρακτηριστικά Α, Β, της μορφής Α\Β Β1 Β2 …. Βm Α1 f11 f12 … f1m . Aκ fκ1 fκ2…… fκm Στατιστικές υποθέσεις Ηο: Τα χαρακτηριστικά Α,Β είναι στατιστικά ανεξάρτητα Η1: Τα χαρακτηριστικά Α,Β είναι στατιστικά μη ανεξάρτητα Κριτήριο ελέγχου το οποίο ακολουθεί την κατανομή Χ2 με (κ-1)( m-1) βαθμούς ελευθερίας. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

30 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
κ: κατηγορίες χαρακτηριστικού Α m: κατηγορίες χαρακτηριστικού Β : παρατηρούμενες συχνότητες : θεωρητικές συχνότητες, υπολογίζονται ως = (άθροισμα ι-γραμμής)(άθροισμα j-στήλης) γενικό άθροισμα Περιοχή απόρριψης όπου η κριτική τιμή της κατανομής Χ2 σε επίπεδο σημαντικότητας α, με ν=(κ-1)(m-1) βαθμούς ελευθερίας Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

31 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Παράδειγμα Τυχαίο δείγμα φοιτητών του τμήματος Διοίκησης, ταξινομήθηκε ως προς την βαθμολογία και την συχνότητα παρακολούθησης ενός μαθήματος. Είναι η απόδοση στις εξετάσεις στατιστικά ανεξάρτητη από την συχνότητα παρακολούθησης;(α=0.01) Βαθμός Συχνότητα < Σχεδόν πάντα Συχνά Σπάνια ή καθόλου Ηο: Βαθμολογία, συχνότητα παρακολούθησης στατιστικά ανεξάρτητα Η1: Βαθμολογία συχνότητα παρακολούθησης μη ανεξάρτητα Κριτήριο ελέγχου Χ2 =25.9 Κριτική τιμή για ν=(4-1)(3-1)=6 β.ε και α=0.01 Χ2 >  Ηο απορρίπτεται συνεπώς βαθμολογία και συχνότητα παρακολούθησης μη ανεξάρτητα. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

32 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
ΔΕΙΓΜΑΤΟΛΗΨΙΑ 1.- Βασικές έννοιες 2.- Τυχαίο δείγμα 3.- Απλή τυχαία δειγματοληψία 4.- Δειγματοληψία κατά στρώματα 5.- Δειγματοληψία κατά ομάδες 6.- Δειγματοληψία κατά στάδια 7.- Δείγμα ποσοστών Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

33 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Βασικές έννοιες Στατιστικός πληθυσμός : Σύνολο μετρήσεων ή παρατηρήσεων, οι οποίες αναφέρονται σε ένα ποιοτικό ή ποσοτικό χαρακτηριστικό των μονάδων που αποτελούν τον πληθυσμό. Δειγματοληπτικές μονάδες: Οι μονάδες που αποτελούν τον στατιστικό πληθυσμό, όπως φυσικά πρόσωπα(εργαζόμενοι σε μία επιχείρηση, ψηφοφόροι μίας περιοχής), επιχειρήσεις, οικοδομικά τετράγωνα. Πλαίσιο δειγματοληψίας: Κατάλογος στον οποίο καταχωρούνται οι δειγματοληπτικές μονάδες, όπως Κατάλογοι καταχώρησης φυσικών προσώπων Χαρτογραφικά διαγράμματα πόλεων Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

34 Δειγματοληπτικά και μη δειγματοληπτικά σφάλματα
Σφάλμα δειγματοληψίας : Η διαφορά μεταξύ της πραγματικής τιμής μίας παραμέτρου θ, και της εκτίμησης που προκύπτει από ένα δείγμα. Με την δειγματοληψία εξετάζεται ένα μέρος του αρχικού πληθυσμού, και οι γενικεύσεις που διατυπώνονται για τον πληθυσμό, με βάση το δείγμα, γίνονται κατά προσέγγιση. Για να είναι οι εκτιμήσεις των παραμέτρων έγκυρες και αξιόπιστες, θα πρέπει το δείγμα να αντιπροσωπεύει κατά το δυνατόν καλύτερα τον πληθυσμό. Αν αυξηθεί το μέγεθος του δείγματος , μειώνεται το σφάλμα δειγματοληψίας και αυξάνει η ακρίβεια των εκτιμήσεων. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

35 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Μη δειγματοληπτικά σφάλματα: Δεν οφείλονται στην δειγματοληψία, αλλά εμφανίζονται και σε απογραφικές έρευνες. Διακρίνονται σε Μη συστηματικά ή τυχαία, όπως σφάλματα μέτρησης, σφάλματα καταχώρησης δεδομένων. Συστηματικά σφάλματα ή σφάλματα μεροληψίας, που προκύπτουν από Απόκρυψη στοιχείων- δήλωση μη πραγματικών στοιχείων Ακατάλληλο δειγματοληπτικό πλαίσιο Ατελής σχεδιασμός ερωτηματολογίου Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

36 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Τυχαίο δείγμα Δειγματοληψία με πιθανότητα(probability sampling) γίνεται σύμφωνα με νόμους πιθανότητας. Αν κάθε δειγματοληπτική μονάδα έχει την ίδια πιθανότητα επιλογής, το δείγμα που προκύπτει ονομάζεται τυχαίο δείγμα ή δείγμα πιθανότητας. Η επιλογή των μονάδων γίνεται κατά τρόπο τυχαίο και αμερόληπτο. Στην τυχαία δειγματοληψία, προσδιορίζεται το μέγεθος του σφάλματος και η ακρίβεια της εκτίμησης των παραμέτρων. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

37 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Στην μη τυχαία δειγματοληψία, οι δειγματοληπτικές μονάδες επιλέγονται με υποκειμενικά κριτήρια, όπως Ευκολία στην πρόσβαση στοιχείων (συμβατικό δείγμα) Σύμφωνα με την κρίση ειδικών (δειγματοληψία κρίσης ή σκοπιμότητας) Δειγματοληψία με προκαθορισμένα ποσοστά Στην μη τυχαία δειγματοληψία, επειδή η επιλογή του δείγματος δεν γίνεται με κάποιους νόμους πιθανότητας, δεν είναι δυνατόν να προσδιορισθεί το μέγεθος του στατιστικού σφάλματος και ο βαθμός ακρίβειας των εκτιμήσεων. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

38 Απλή τυχαία δειγματοληψία(Simple random sampling)
Από ένα πεπερασμένο στατιστικό πληθυσμό με Ν μονάδες, επιλέγονται n μονάδες, έτσι ώστε κάθε δυνατό δείγμα μεγέθους n να έχει την ίδια πιθανότητα επιλογής, ίση με Η α.τ.δ. εφαρμόζεται σε ομοιογενείς πληθυσμούς με μικρό πλήθος στοιχείων. Η τυχαία επιλογή ενός δείγματος, γίνεται με την μέθοδο των τυχαίων αριθμών, από ειδικούς πίνακες, που περιέχουν σε σειρές και στήλες αριθμούς που δημιουργούνται σύμφωνα με μία τυχαία διαδικασία. Κάθε αριθμός ενός πίνακα τυχαίων αριθμών έχει την ίδια πιθανότητα να επιλεγεί. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

39 Η επιλογή ενός τυχαίου δείγματος γίνεται ως εξής:
Αντιστοιχούμε σε κάθε μονάδα του πληθυσμού έναν αριθμό από το 1 μέχρι το Ν. Από ένα πίνακα τυχαίων αριθμών, επιλέγουμε μία σειρά n τυχαίων αριθμών, από το 1 μέχρι το n. Οι αριθμοί αυτοί θα αποτελέσουν το τυχαίο δείγμα. Παράδειγμα: Έστω Ν=200. Θα επιλεγεί τυχαίο δείγμα με n=20 στοιχεία. Οι μονάδες του πληθυσμού αριθμούνται από 001,002,…έως 200. Από πίνακα τυχαίων αριθμών, αρχίζοντας από τυχαία στήλη, επιλέγονται 20 τριψήφιοι μικρότεροι(ή ίσοι) του 200,όπως 194,012,136,113,093,150,067,124,065,175,029,081,148,165 073,166,063,001,026,085. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

40 Δειγματοληψία κατά στρώματα (Stratified sampling)
Ο στατιστικός πληθυσμός χωρίζεται σε υποπληθυσμούς ή στρώματα(strata),έτσι ώστε ο κάθε υποπληθυσμός να παρουσιάζει κατά το δυνατόν μεγαλύτερη ομοιογένεια ως προς κάποιο χαρακτηριστικό (κοινωνικό, δημογραφικό, γεωγραφικό). Στόχος:Τα στρώματα να είναι ομοιογενή , και να υπάρχουν διαφορές μεταξύ των στρωμάτων. Από κάθε στρώμα λαμβάνεται ένα δείγμα με απλή τυχαία δειγματοληψία. Με την υποδιαίρεση του αρχικού πληθυσμού επιτυγχάνεται μεγαλύτερη ακρίβεια στις εκτιμήσεις από την απλή τυχαία δειγματοληψία, χωρίς να αυξηθεί το κόστος. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

41 Αναλογική στρωματοποιημένη δειγματοληψία
Οι Ν μονάδες του πληθυσμού χωρίζονται σε κ στρώματα, με Ν1,Ν2,…Νκ μονάδες έκαστο. Ν=Ν1+Ν2 +…+Νκ Από κάθε στρώμα επιλέγεται δείγμα με ni μονάδες i=1,2,…κ. Το δείγμα αποτελείται από n= n1 + n2 +…+ nκ μονάδες, έτσι ώστε (κλάσμα δειγματοληψίας σταθερό) Μη αναλογική στρωματοποιημένη δειγματοληψία: επιλέγουμε το μέγεθος του δείγματος σε κάθε στρώμα. Μπορούμε να αυξήσουμε το μέγεθος του δείγματος σε ορισμένα στρώματα χωρίς να αυξηθεί το συνολικό δείγμα. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

42 Δειγματοληψία κατά ομάδες (Cluster sampling)
από τις οποίες επιλέγονται με τυχαίο τρόπο ορισμένες ομάδες (δείγμα ομάδων). Το δείγμα σχηματίζεται από όλες τις δειγματοληπτικές μονάδες των ομάδων που έχουν επιλεγεί (one stage cluster sampling). Παράδειγμα: Στατιστικός πληθυσμός: Άτομα που απασχολούνται σε ελληνικές επιχειρήσεις. Ο πληθυσμός χωρίζεται σε ομάδες(επιχειρήσεις). Επιλέγεται τυχαίο δείγμα επιχειρήσεων, οι εργαζόμενοι των οποίων αποτελούν το δείγμα. Στόχος: Οι ομάδες να αποτελούνται από ανομοιογενή στοιχεία, ώστε να αντιπροσωπεύουν την ανομοιογένεια του αρχικού πληθυσμού. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

43 Δειγματοληψία κατά στάδια (Multi-Stage sampling)
Στη δειγματοληψία κατά ομάδες, το δείγμα σχηματίζεται από όλες τις δειγματοληπτικές μονάδες των ομάδων που έχουν επιλεγεί. Αν από κάθε ομάδα επιλέξουμε ένα δείγμα, το δειγματοληπτικό σχήμα ονομάζεται δειγματοληψία σε δύο στάδια (Two-stage sampling). Παράδειγμα: Σε μία πόλη με 100 εκλογικά τμήματα, Στο 1ο στάδιο επιλέγεται δείγμα με 20 εκλογικά τμήματα (ομάδες). Στο 2ο στάδιο από κάθε εκλογικό τμήμα επιλέγεται ένα δείγμα ψηφοφόρων. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

44 Η δειγματοληψία κατά στάδια μπορεί να διεξαχθεί σε περισσότερα στάδια.
Στο 1ο στάδιο επιλέγεται ένα τυχαίο δείγμα ομάδων. Σε επόμενα στάδια λαμβάνονται, από ομάδες που έχουν ήδη επιλεγεί, δείγματα μικρότερων ομάδων. Παράδειγμα: Σε πανελλαδική έρευνα, η χώρα υποδιαιρείται σε πρωτεύουσες νομών (ομάδες). 1ο Στάδιο : Επιλέγεται τυχαία ένα δείγμα πόλεων. Κάθε πόλη υποδιαιρείται σε οικοδομικά τετράγωνα. 2ο Στάδιο : Λαμβάνεται τυχαίο δείγμα οικοδομικών τετραγώνων. 3ο Στάδιο : Σχηματίζεται δείγμα κατοικιών, από τις κατοικίες στο δείγμα των οικοδομικών τετραγώνων. 4ο Στάδιο : επιλέγεται ένα δείγμα από τα άτομα του δείγματος των κατοικιών, που σχηματίσθηκε στο 3ο στάδιο. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»

45 Δείγμα ποσοστών (Quota sampling)
Στην δειγματοληψία ποσοστών, η επιλογή των δειγματοληπτικών μονάδων γίνεται έτσι, ώστε η αναλογία ορισμένων χαρακτηριστικών στο δείγμα να είναι ίδια με την αναλογία των χαρακτηριστικών αυτών στον πληθυσμό. Τα χαρακτηριστικά αυτά ονομάζονται χαρακτηριστικά ποσόστωσης. Π.χ αν το χαρακτηριστικό ποσόστωσης είναι η απασχόληση σε πληθυσμό φυσικών προσώπων, με 70% εργαζόμενους και 30% άνεργους, η δειγματοληψία θα σχεδιασθεί έτσι ώστε το δείγμα να αποτελείται από 70% εργαζόμενους και 30% άνεργους. Το δείγμα ποσοστών δεν είναι δείγμα πιθανότητας, διότι η επιλογή των μονάδων δεν γίνεται με τυχαίο τρόπο. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»


Κατέβασμα ppt "Εισαγωγή στην Στατιστική"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google