ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧ/ΣΕΩΝ ΕΡΓΑΣΤΗΡΙΟ 3 ΔΔΕ
Γραφικές Μέθοδοι Παρουσίασης στατιστικών δεδομένων (Ιστόγραμμα) και Ποσοτικές μέθοδοι ανάλυσης στατιστικών δεδομένων (Περιγραφικά μέτρα κεντρικής τάσης και διασποράς). Κατασκευή Ιστογράμματος (Histogram) Ιστόγραμμα συχνοτήτων, Αθροιστικών συχνοτήτων, Ποσοστιαίων συχνοτήτων, και Ποσοστιαίων Αθροιστικών συχνοτήτων: Για την κατασκευή ενός ιστογράμματος συχνοτήτων ποσοτικής μεταβλητής , χρειάζεται να ομαδοποιήσουμε τα δεδομένα μας, να σχηματίσουμε διαδοχικά ορθογώνια των οποίων οι βάσεις είναι τα διαστήματα των τάξεων που δημιουργήσαμε και το ύψος τους είναι ίσο με την συχνότητα των παρατηρήσεων στην αντίστοιχη τάξη.
Α) Ιστόγραμμα συχνοτήτων: Μενού Graphs Histogram επιλέγω Pulse1 (Ποσοτική μεταβλητή από το αρχείο PULSE)
Options α) Στο Type of Histogram επιλέγω Frequency (συχνότητα) β) Στο Type of intervals (=τύπος διαστημάτων) Αν επιλέξω CutPoint : θα εμφανιστούν στον οριζόντιο άξονα τα όρια των διαστημάτων και γ) Στο Definition of intervals (= προσδιορισμός διαστημάτων) Στο MidPoints - CutPoints positions: Ορίζω όρια των διαστημάτων : 48 56 64 72 80 88 96 104 (ή πληκτρολογώ 48:104/8) δ) και οκ μία φορά
ή β) Στο Type of intervals (=τύπος διαστημάτων) Αν επιλέξω MidPoint : θα εμφανιστούν στον οριζόντιο άξονα κεντρικές τιμές των διαστημάτων και γ) Στο Definition of intervals (= προσδιορισμός διαστημάτων) Στο MidPoints- CutPoints positions: Ορίζω τις κεντρικές τιμές των διαστημάτων : 52 60 68 76 84 92 100 (ή πληκτρολογώ 52:100/8) δ) και οκ μία φορά
2) Annotation: επιλέγω data labels…
…και επιλέγω Show data labels και μία φορά οκ
3) Edit Attributes (= επεξεργασία κάθε ράβδου ) α) Όπου Fill Type = επιλέγω Solid β) Όπου Fore Color = επιλέγω τι χρώμα θα είναι το περίγραμμα της ράβδου. γ) Όπου Back Color = επιλέγω τι χρώμα θα είναι το εσωτερικό της ράβδου. και τέλος οκ δύο φορές
Αν επέλεξα CutPoint : στον οριζόντιο άξονα εμφανίστηκαν τα όρια των διαστημάτων
Αν επέλεξα MidPoint : στον οριζόντιο άξονα εμφανίστηκαν οι κεντρικές τιμές των διαστημάτων
Β) Ιστόγραμμα Αθροιστικών συχνοτήτων: Μενού Graphs Histogram επιλέγω Pulse1 Options Στο Type of Histogram επιλέγω Cumulative Frequency Και οκ 2 φορές
Ομοίως για Γ) Ιστόγραμμα Ποσοστιαίων συχνοτήτων και Δ) Ποσοστιαίων Αθροιστικών συχνοτήτων στο Options επιλέγω Percent και Cumulative Percent
Περιγραφικά μέτρα κεντρικής τάσης και διασποράς μιας ποσοτικής μεταβλητής π.χ. Να υπολογιστούν τα περιγραφικά μέτρα κεντρικής τάσης και διασποράς για την ποσοτική μεταβλητή Pulse 1 Stat Basic statistics Display Descriptive Statistics Επιλέγω ποσοτική μεταβλητή: Pulse 1 (Variables) και στο ίδιο παράθυρο διαλόγου επιλέγω : Graphs Graphical Summary 2 φορές οκ Στο παράθυρο Session εμφανίζονται τα παρακάτω: Descriptive Statistics Variable N Mean Median TrMean StDev SE Mean Pulse1 92 72,87 71,00 72,61 11,01 1,15 Variable Minimum Maximum Q1 Q3 Pulse1 48,00 100,00 64,00 80,00
…και
Q = Q3 – Q1 = 80 – 64 = 16 Α) Μέτρα θέσης ή Κεντρικής τάσης : Ο μέσος αριθμητικός ή μέση τιμή (Mean Value, ) = 72,87 Διάμεσος (Μ,Median) = 71 Τεταρτημόρια (Quartiles) : α) 1ο τεταρτημόριο Q1 = 64 β) 2ο τεταρτημόριο (Διάμεσος Μ) Q2 = 71 γ) 3ο τεταρτημόριο Q3 = 80 Επικρατούσα τιμή ( Μο, Μode) Μο = 3 * Μ – 2 * Χ = 67,26 Β) Μέτρα Διασποράς ή Μεταβλητότητας Εύρος μεταβολής ή εύρος (Range) : R = Xmax – Xmin = 100-48=52 Ενδοτεταρτημοριακό Εύρος (Interquartile Range, Q) : Q = Q3 – Q1 = 80 – 64 = 16
3) Διακύμανση (variance, s2) = 121,192 4) Τυπική απόκλιση (Standard deviation, s) StDev = 11,01 ή επειδή η τυπική απόκλιση ορίζεται ως η τετραγωνική ρίζα της διακύμανσης δηλ. μπορούμε και να την υπολογίσουμε από το μενού Calk Calculator και στο Expression: επιλέγω συνάρτηση square root SQRT(number) SQRT(121,192) s = StDev = 11,01 5) Ο συντελεστής μεταβλητότητας (coefficient of variation, CV) * 100 ≈ 15 % > 10% Άρα το δείγμα είναι ανομοιογενές
1ος τρόπος έλεγχος ασυμμετρίας : Γ) Μέτρα Ασυμμετρίας: 1ος τρόπος έλεγχος ασυμμετρίας : Mo < M < ή Mode < Median < Mean 67,26 < 71 < 72,87 Θετική ασυμμετρία Xmin Xmax Mo < M < 2ος τρόπος έλεγχος ασυμμετρίας : Skewness = 0, 397389>0 Θετική ασυμμετρία το πλήθος των παρατηρήσεων βρίσκεται δεξιά της κορυφής άρα τα περισσότερα άτομα στο δείγμα έχουν μεγάλο σφυγμό
Θεωρία Μέτρα ασυμμετρίας και κύρτωσης : 1)Συντελεστής Λοξότητας (Skewness) 2)Συντελεστής Κύρτωσης (kurtosis) Πιθανές Μορφές Καμπύλης Κατανομής Συχνοτήτων : 1) Συμμετρική καμπύλη (Κανονική κατανομή) Skewness = 0 ή Mean = Median = Mode = Μ = Μο ) 2) Θετική ασυμμετρία Skewness > 0 ή Mode < Median < Mean Mo < M < Δηλ. το πλήθος των παρατηρήσεων βρίσκεται δεξιά της κορυφής 3) Αρνητική ασυμμετρία Skewness < 0 ή Mean < Median < Mode < M < Mo Δηλ. το πλήθος των παρατηρήσεων βρίσκεται αριστερά της κορυφής
2)Συντελεστής Κύρτωσης (kurtosis)