ΙΕΚ Γαλατσίου Στατιστική Ι Μάθημα 2 ΙΕΚ Γαλατσίου Στατιστική Ι Μάθημα 2 Βαγγέλης Ντάλλας
Διαλογή - Κατανομή Συχνοτήτων -Σχετικών συχνοτήτων Πήραμε δείγμα 30 πτυχιούχων οδοντιάτρων και ζητήσαμε να μάθουμε το χρόνο που απαιτήθηκε για την απόκτηση πτυχίου. Οι απαντήσεις έδωσαν τους ακόλουθους χρόνους σε έτη: 7,8,6,8, 6, 6, 6, 6, 6, 6, 6, 6, 8, 7, 8 6, 6, 6, 5, 5, 6, 5, 8, 7, 5, 6, 5, 6, 6,5 Ένας απλός τρόπος συνοπτικής παρουσίασης των δεδομένων είναι η διαλογή που γίνεται ως εξής: Σε μία στήλη (την στήλη "Παρατηρήσεις") τοποθετούμε όλες τις δυνατές τιμές των παρατηρήσεων, από μία φορά την κάθε τιμή. Δίπλα στη στήλη "Παρατηρήσεις" τοποθετούμε τη στήλη "Διαλογή" και στη στήλη αυτή απέναντι από κάθε παρατήρηση σημειώνουμε μία κατακόρυφη γραμμή για κάθε φορά που η παρατήρηση εμφανίζεται στο δείγμα. Η συμπλήρωση πέντε εμφανίσεων μιας συγκεκριμένης παρατήρησης σημειώνεται με διαγραφή των τεσσάρων κατακόρυφων γραμμών.
Ο πίνακας διαλογής των δεδομένων του χρόνου που απαιτήθηκε από τους 30 πτυχιούχους για την απόκτηση πτυχίου είναι: Παρατήρηση Διαλογή 55 6 77 IIIIII 8
Το πλήθος των γραμμών που αντιστοιχούν σε κάθε παρατήρηση δείχνει πόσες φορές αυτή εμφανίζεται στο συγκεκριμένο δείγμα και καλείται συχνότητα της παρατήρησης, π.χ. η συχνότητα του 5 είναι 6 και του 7 είναι 3. Αξίζει να σημειωθεί ότι η χρήση πινάκων διαλογής σε περιπτώσεις δεδομένων μεγάλου εύρους (R ), όπου R = max{xj} - min{xj}, δεν ενδείκνυται. Στην περίπτωση αυτή ο πίνακας διαλογής μπορεί να αντικατασταθεί από τον πίνακα: Παρατηρήσεις (x1) 5 6 7 8 Συχνότητα (ν1) 16 3 ο οποίος ονομάζεται πίνακας κατανομής συχνοτήτων. Για να σχηματίσουμε πίνακα συχνοτήτων της μεταβλητής Χ, καταγράφουμε το φυσικό αριθμό vj (vj ≤ ν), που δείχνει πόσες φορές εμφανίζεται η τιμή xj της εξεταζόμενης μεταβλητής Χ στο σύνολο των παρατηρήσεων και τον ονομάζουμε συχνότητα της τιμής xj Το σύνολο των ζευγών της μορφής (xj, νj) αποτελεί την κατανομή συχνοτήτων.
Π.χ. η κατανομή συχνοτήτων του παραδείγματος είναι: {(5,6) (6,16) (7,3) (8,5)} Είναι φανερό ότι το άθροισμα όλων των συχνοτήτων μας δίνει το μέγεθος ν του δείγματος. Δηλαδή :.ν1+ ν2 + ν3 +...+ νκ= ν Σε πολλές μελέτες και ειδικότερα όταν το δείγμα είναι πολυπληθές, για να έχουμε μια σαφή συγκριτική εικόνα για το μέρος του συνολικού πλήθους του δείγματος που καταλαμβάνει κάθε τιμή της μεταβλητής που εξετάζουμε, χρησιμοποιούμε τη σχετική συχνότητα (fj) ή την επί τοις εκατό σχετική συχνότητα (fj % ) .
Σχετική συχνότητα (fj )
Η Σχετική συχνότητα (fj ) της τιμής xj ορίζεται ως ο λόγος της συχνότητας vj ως προς το μέγεθος του δείγματος, δηλαδή fj=vj /v. Η «επί τοις εκατό» σχετική συχνότητα (fj%) της τιμής xj ορίζεται ως εξής: fj% = (vj /v) *100 Άμεση συνέπεια του ορισμού της σχετικής συχνότητας είναι οι ιδιότητες της: α ) 0 < fj < 1, για j = 1,2,...κ και β) f1 + f2 +...+ fK = 1 Σύμφωνα με τα παραπάνω θα συμπληρώσουμε τον πίνακα συχνοτήτων του παραδείγματος που αναφέραμε με τις σχετικές συχνότητες των τιμών της μεταβλητής «διάρκεια σπουδών» ή χρόνος που απαιτήθηκε για την απόκτηση πτυχίου.
Η επί τοις εκατό σχετική συχνότητα (ή%) Διάρκεια σπουδών (x1) Συχνότητα (ν1) Σχετική συχνότητα (f1) Η επί τοις εκατό σχετική συχνότητα (ή%) 5 6 0,20 20 16 0,53 53 7 3 0,10 10 8 0,17 17 Σύνολο 30 1,00 100
Άσκηση 1 1. Ρωτήσαμε ένα δείγμα 50 μαθητών ως προς την ομάδα που υποστηρίζουν. Η απαντήσεις που πήραμε ήταν οι εξής : 7 ΠΑΟΚ, 3 ΑΡΗΣ, 13 ΠΑΝΑΘΗΝΑΙΚΟΣ, 8 ΑΕΚ , 25 ΟΛΥΜΠΙΑΚΟΣ και κάποιοι από αυτούς ΗΡΑΚΛΗΣ. i. Να βρείτε πόσοι υποστηρίζουν τον ΗΡΑΚΛΗ. ii. Να κατασκευάσετε τον πίνακα κατανομής συχνοτήτων, σχετικών συχνοτήτων και σχετικών % συχνοτήτων.
Άσκηση 1 Συχνότητα v i Σχετ. συχνότητα fi Σχετ. συχνοτ. fi % ΠΑΟΚ ΑΡΗΣ ΠΑΝΑΘΗΝΑΙΚΟΣ ΑΕΚ ΟΛΥΜΠΙΑΚΟΣ ΗΡΑΚΛΗΣ Σύνολο 50 100
Άσκηση 2 Ρωτήσαμε ένα δείγμα 100 Ψηφοφόρων ως προς την ομάδα που υποστηρίζουν και πήραμε τις παρακάτω απαντήσεις: Άσπρο 25 Μαύρο 17 Μπλε 23 Κόκκινο 30 Πράσινο 5 Να κατασκευάσετε τον πίνακα κατανομής συχνοτήτων, σχετικών συχνοτήτων και σχετικών % συχνοτήτων.