Εβδομάδα 3 Παρουσίαση Δεδομένων Στατιστική Ι Εβδομάδα 3 Παρουσίαση Δεδομένων
Εισαγωγή Κατά τη διεξαγωγή μιας έρευνας συλλέγονται μεγάλες ποσότητες δεδομένων, τα οποία είναι αδύνατον να παρουσιαστούν χωρίς κάποια επεξεργασία. Αρχικές τιμές: Τα δεδομένα που συλλέγει ο ερευνητής Προτού αποφασίσουμε για τον τρόπο με τον οποίο θα περιγράψουμε τα δεδομένα μας πρέπει να απαντήσουμε στο ακόλουθο ερώτημα: - Είναι τα δεδομένα μας κατηγορικά ή ποσοτικά;
Οργάνωση & παρουσίαση κατηγορικών δεδομένων Οι πίνακες και τα διαγράμματα που παρουσιάζουν ποιοτικά δεδομένα πρέπει να δείχνουν τη συχνότητα (frequency) των περιπτώσεων κάθε κατηγορίας Συχνότητα: Ο αριθμός των ατόμων ή των περιπτώσεων που εμπίπτουν σε μια κατηγορία Απόλυτη Συχνότητα: Ο αριθμός των ατόμων ή των περιπτώσεων μιας κατηγορίας σε απόλυτο αριθμό Σχετική Συχνότητα: Ο αριθμός των ατόμων ή των περιπτώσεων μιας κατηγορίας σε ποσοστό (%) επί του συνόλου
Πίνακας Συχνοτήτων Κατηγορικών Δεδομένων Πίνακας 1: Εκπαιδευτικό Επίπεδο Συμμετεχόντων
Κυκλικό Διάγραμμα Διάγραμμα 1: Εκπαιδευτικό Επίπεδο Συμμετεχόντων.
Ακιδωτό Διάγραμμα Διάγραμμα 1: Εκπαιδευτικό Επίπεδο Συμμετεχόντων.
Οργάνωση & παρουσίαση ποσοτικών δεδομένων Ο πιο συνηθισμένος τρόπος οργάνωσης μιας ομάδας ποσοτικών δεδομένων είναι η κατανομή συχνότητας (frequency distribution). Η κατανομή συχνότητας δείχνει πόσο συχνά συναντάται κάθε τιμή της μεταβλητής (όχι τόσο κατάλληλη για δεδομένα αναλογικής κλίμακας). Ομαδοποιημένη Κατανομή Συχνότητας: Πίνακας στον οποίο παρουσιάζεται ο αριθμός των ατόμων ή των περιπτώσεων που εμπίπτουν σε κάθε διάστημα τιμών
Παράδειγμα ομαδοποιημένης κατανομής συχνότητας Πίνακας 1: Ομαδοποιημένη Κατανομή Συχνότητας Εμφάνισης Τιμών Κανόνες κατασκευής ομαδοποιημένης κατανομής συχνότητας (Παρασκευόπουλος, 1990) Εύρος κατανομής τιμών Εύρος κατανομής < 30 –δεν χρειάζεται ομαδοποίηση Εύρος κατανομής 30-50 – 3 κατηγορίες Εύρος κατανομής 50-80 – 5 κατηγορίες Εύρος κατανομής > 80 – 7,9,11 κοκ κατηγορίες 2. Πλήθος τιμών ή μέγεθος δείγματος (Ν) Αριθμός κατηγοριών = Τετραγωνική ρίζα του Ν Η οργάνωση των δεδομένων πρέπει να γίνεται έτσι ώστε αυτά να παρουσιάζονται καλύτερα
Πραγματικά όρια των αριθμών
Παράδειγμα ομαδοποιημένης κατανομής συχνότητας με αθροιστικές συχνότητες Αθροιστική συχνότητα: Ο αριθμός (ή το ποσοστό) των περιπτώσεων που μετρήθηκαν με μια τιμή της κλίμακας και όλες τις χαμηλότερες από αυτήν τιμές
Διάγραμμα μίσχου και φύλλων (Tukey, 1977) Αυτός ο τύπος διαγράμματος είναι αποτέλεσμα της δουλειάς του Tukey (1977) στην διερευνητική ανάλυση δεδομένων (exploratory data analysis) Σχήμα 1: Διάγραμμα Μίσχου-και-Φύλλων των Ηλικιών των Συμμετεχόντων.
Βελτιωμένο διάγραμμα μίσχου και φύλλων
Ιστόγραμμα Ερώτημα: ‘οι υπολογιστές δεν με φοβίζουν καθόλου’ (Ν=80) Διάγραμμα 1: Στάσεις των Φοιτητών Απέναντι στους Υπολογιστές.
Ιστόγραμμα ομαδοποιημένης κατανομής Τα διαστήματα αναπαρίστανται από την μέση τιμή τους στο κέντρο κάθε ράβδου. Όλες οι ράβδοι έχουν το ίδιο πλάτος. Η επιφάνεια της κάθε ράβδου είναι ανάλογη του αριθμού (ή του ποσοστού) των περιπτώσεων που αναπαριστά. Το συνολικό εμβαδόν του ιστογράμματος αναπαριστά το σύνολο του δείγματος. Τα ιστογράμματα μας δίνουν πληροφορίες για τα χαρακτηριστικά της κατανομής των δεδομένων. Πχ ποιά είναι η τιμή με την υψηλότερη συχνότητα, αν υπάρχουν ακραίες τιμές στην κατανομή, και (το σημαντικότερο) πώς διασπείρονται (κατανέμονται) οι διάφορες τιμές (σκορς).
Πολύγωνο συχνότητας Βάζουμε μία κουκίδα στο μέσο του ανώτερου σημείου της κάθε ράβδου, και ενώνουμε τις κουκίδες. Κάτω από την κατώτερη και πάνω από την ανώτερη τιμή συμπεριλαμβάνουμε μηδενικές τιμές (συχνότητες) στον οριζόντιο άξονα,κλείνοντας το πολύγωνο, γιατί υπάρχουν κι αυτές οι τιμές στην κλίμακα, οι οποίες είχαν συχνότητα μηδέν. Η γραμμή και στα δύο άκρα της κατανομής ξεκινάει από το μηδέν.
Η κατασκευή πολυγώνου συχνότητας Προσέχουμε να συμπεριλαμβάνουμε την τιμή μηδέν, όταν η συχνότητα ενός διαστήματος είναι μηδέν. Πχ αν δεν υπάρχει κανείς συμμετέχων που να έχει ηλικία από 13 έως 17, δεν παραλείπουμε να σημειώσουμε την τιμή μηδέν. Λάθος παράσταση Σωστή παράσταση Συχνότητα διαστημάτων 8-12 και 18-22= 7 Συχνότητα διαστήματος 13-17= 0
Η κατασκευή πολυγώνου συχνότητας Η επίδραση του χειρισμού του κάθετου άξονα στη μορφή του πολυγώνου… Πληθωρισμός 1997: 3.7% Πληθωρισμός 2000: 3.5%