Ταξινόμηση και Γραφικές παραστάσεις ποιοτικών δεδομένων Παναγιώταρου Αλίκη Τμήμα Νοσηλευτικής 3η Διάλεξη
Εισαγωγή Κατά την διεξαγωγή μιας έρευνας συλλέγονται μεγάλες ποσότητες δεδομένων τα οποία δεν μπορούν να παρουσιαστούν χωρίς κάποια επεξεργασία Οι αρχικές τιμές (ή πρωτογενή δεδομένα) της έρευνας είναι τα δεδομένα που συλλέγει ο ερευνητής Προτού αποφασίσουμε για τον τρόπο με τον οποίο θα περιγράψουμε τα δεδομένα μας πρέπει να απαντήσουμε στο ακόλουθο ερώτημα: Είναι τα δεδομένα μας ποιοτικά ή ποσοτικά;
Μεθόδοι σύνοψης και παρουσίασης ποιοτικών δεδομένων(1) Κατανομές Η κατανομή ενός συνόλου πρωτογενών δεδομένων σε κατηγορίες , ομάδες ή τάξεις (περιορίζει τον όγκο, ακαταστασία) 1.Κατανομές συχνοτήτων Οι συχνότητες είναι απόλυτοι αριθμοί. Οι αριθμοί αυτοί δηλώνουν πόσα από τα δεδομένα ανήκουν σε κάθε κατηγορία ταξινόμησης.( ) 2.Κατανομές σχετικών συχνοτήτων Οι συχνότητες είναι σχετικοί αριθμοί (%).Οι αριθμοί αυτοί δηλώνουν τους σχετικούς αριθμούς δεδομένων.
Μεθόδοι σύνοψης και παρουσίασης ποιοτικών δεδομένων(2) Η κατανομή συχνοτήτων έχει την μορφή ενός πίνακα δύο στηλών. Στην πρώτη στήλη παρουσιάζονται κατά σειρά (γραμμών) οι τιμές της μεταβλητής μεμονωμένα ή κατά ομάδες Στην δεύτερη στήλη παράλληλα με τις γραμμές της πρώτης στήλης δίνονται οι συχνότητες . Οι πίνακες αυτοί είναι πίνακες μιας εισόδου (Η διάσταση τους αντιστοιχούν στην συμπεριφορά μιας μεταβλητής).
Μεθόδοι σύνοψης και παρουσίασης ποιοτικών δεδομένων(3) Παράδειγμα 1.1. Μια φαρμακευτική εταιρεία θέλει να μελετήσει την ποσότητα του προϊόντος σε κάθε παραγγελία. Από τα αρχεία της εταιρείας βρέθηκαν 120 πρόσφατες παραγγελίες και ο αριθμός των παρτίδων φαίνεται στον παρακάτω πίνακα.
Μεθόδοι σύνοψης και παρουσίασης ποιοτικών δεδομένων(4) Η τ.μ. Χ είναι ο αριθμός των παρτίδων ανα παραγγελία. Χωρίζουμε τα δεδομένα σε τακτικές μεταβλητές (ποιοτικές) με βάση των αριθμό των παρτίδων ,μικρού μεγέθους για 1-2 παραγγελίες, μεσαίου μεγέθους για 3-4 και μεγάλου μεγέθους για 5 και πάνω. Πρίν την ταξινόμηση Είναι εύκολο να απαντήσουμε: Ποιος αριθµός παρτίδων εµφανίζεται συχνότερα ; Είναι περισσότερες παραγγελίες των 2 παρτίδων ή των 3 παρτίδων ; Μετά την ταξινόμηση xi fi Μικρού μεγέθους 67 Μεσαίου μεγέθους 43 Μεγάλου μεγέθους 10 Άθροισμα 120 ή
Άλλα χαρακτηριστικά πινάκων κατανομής Αθροιστικές συχνότητες Αθροιστικές σχετικές συχνότητες
Πίνακας κατανομής συχνοτήτων
Γραφικές παραστάσεις ποιοτικών δεδομένων (1) Ραβδόγραμμα. Τα δεδομένα του πίνακα συχνοτήτων μπορούν να παρασταθούν γραφικά σε ένα ραβδόγραμμα (bar chart), όπου η κάθε ράβδος παρουσιάζει τη συχνότητα (ή τη σχετική συχνότητα ή την αθροιστική συχνότητα, ή ακόμα την αθροιστική σχετική συχνότητα) για κάθε τιμή xi.
Ραβδόγραμμα
Γραφικές παραστάσεις ποιοτικών δεδομένων (2) Κυκλικό διάγραμμα. το κυκλικό διάγραμμα ή διάγραμμα πίτας (pie chart) όπου το κάθε κομμάτι της επιφάνειας του κύκλου (πίτα) παρουσιάζει τη συχνότητα της αντίστοιχης τιμής.
Κυκλικό διάγραμμα
Γραφικές παραστάσεις ποσοτικών δεδομένων Ομαδοποιήση Οταν τα δεδομένα είναι αριθμητικά και είτε ο αριθμός των διακεκριμένων τιμών που παίρνει η τ.μ. X είναι μεγάλος, ή η X είναι συνεχής (δηλαδή παίρνει τιμές σε ένα διάστημα τιμών). Πως φτιάχνουμε τις ομάδες; χωρίζουμε τα δεδομένα σε k ομάδες (groups), ή κλάσεις διαστημάτων, μετά παρουσιάζουμε σε πίνακα ή σε γράφημα τη συχνότητα της κάθε ομάδας, δηλαδή τον αριθμό των παρατηρήσεων που ανήκουν σε κάθε ομάδα.
Γραφικές παραστάσεις ποσοτικών δεδομένων (1) Ιστόγραμμα Το ιστόγραμμα (histogram) χρησιμοποιείται για τη γραφική παράσταση ποσοτικών δεδομένων όταν οι διαφορετικές τιμές της μεταβλητής έχουν ομαδοποιηθεί σε k κλάσεις (συνήθως ίδιου πλάτους).
Ιστόγραμμα
Γραφικές παραστάσεις ποσοτικών δεδομένων (2) Διάγραμμα μίσχου-φύλλου Χρησιμοποιείται όταν οι διαφορετικές τιμές της ποσοτικής μεταβλητής (παρατηρήσεις) δεν είναι πολλές αλλά είναι το πολύ 150 περίπου. Ο τρόπος κατασκευής του έχει ως παρακάτω: Ταξινόμηση των παρατηρήσεων κατά αύξουσα σειρά. Φτιάχνουμε δύο στήλες χωρισμένες μεταξύ τους με μία κάθετη γραμμή, την αριστερή που είναι ο μίσχος και η δεξιά που είναι το φύλλο. Καταγραφή όλων των αριθμών όπου συνήθως ως φύλλο κάθε στοιχείου λαμβάνεται το τελευταίο ή τα δύο τελευταία ψηφία της τιμής της παρατήρησης και ως κορμός το πρώτο ή τα εναπομείναντα πρώτα ψηφία. π.χ 134 – 1|34 ή 13|4. Εάν υπάρχουν δεκαδικά στρογγυλοποιούνται.
Απεικόνιση
Παράδειγμα
Γραφικές παραστάσεις ποσοτικών δεδομένων (3) Θηκόγραμμα Την κατασκευή του οποίου θα την μάθουμε όταν θα ορίσουμε τα μέτρα θέσης
Ερωτήσεις Ποια η σημασία της ταξινόμησης ή ομαδοποίησης των δεδομένων σε κατηγορίες; Πως επιλέγουμε τις κατηγορίες ταξινόμησης μέσα στις οποίες ταξινομούμε τα δεδομένα; Ποια τα είδη των κατανομών συχνοτήτων ποσοτικών δεδομένων και σε ποιους ειδικότερους σκοπούς εξυπηρετεί το καθένα;