ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧ/ΣΕΩΝ ΕΡΓΑΣΤΗΡΙΟ 2 ΔΔΕ
ΕΙΣΑΓΩΓΗ
Η συλλογή, οργάνωση, περιγραφή και περιληπτική παρουσίαση των δεδομένων αποτελούν εκείνο το τµήµα της στατιστικής που είναι γνωστό σαν περιγραφική στατιστική, ενώ η διερεύνηση, ανάλυση και εξαγωγή συμπερασμάτων από τα δεδομένα αποτελούν το τµήµα της στατιστικής που αναφέρεται σαν συμπερασματική στατιστική.
Τα δεδομένα προκύπτουν από μία διαδικασία μέτρησης ή παρατήρησης διαφόρων χαρακτηριστικών ενός στατιστικού πληθυσμού. Στατιστικός πληθυσμός είναι ένα σύνολο στοιχείων, στο οποίο εξετάζονται διάφορα χαρακτηριστικά, τα οποία ονομάζονται μεταβλητές. Τα στοιχεία ενός στατιστικού πληθυσμού τα λέμε άτομα ή στοιχεία ή στατιστικές μονάδες του πληθυσμού.
Στατιστικός πληθυσμός : Επιχειρήσεις Νομού Χ Στατιστική μονάδα: Επιχείρηση Μεταβλητές : Κλάδος, Πωλήσεις, ετήσια έξοδα, αριθμός απασχολούμενων
Δείγμα είναι ένα υποσύνολο του πληθυσμού που επιλέγεται για ερευνητικούς σκοπούς Για να είναι ένα δείγμα αντιπροσωπευτικό πρέπει τα κρίσιμα χαρακτηριστικά του να είναι τα ίδια με αυτά του πληθυσμού Αυτό εξαρτάται από τον τρόπο επιλογής του δείγματος (δηλ. να έχει επιλεγεί με τυχαίο τρόπο) και το μέγεθός του (δηλ. να είναι πολυπληθές) Επιλέγοντας αντιπροσωπευτικό δείγμα ο/η ερευνητής/τρια μπορεί να επιχειρήσει να προχωρήσει σε γενικεύσεις των συμπερασμάτων της έρευνας στο σύνολο του πληθυσμού
Τύποι δεδομένων (μεταβλητών) Συμβολισμός Χi Ποσοτικές: μόνο αριθμητικά δεδομένα Διακριτές (ή Ασυνεχείς): Αναφέρονται στα χαρακτηριστικά που εκφράζονται μόνο με ακέραιους αριθμούς, π.χ. αριθμός παιδιών οικογένειας, ο αριθμός επισκεπτών στον κινηματογράφο. Συνεχείς: μπορούν να πάρουν οποιαδήποτε τιμή σε ένα διάστημα πραγματικών αριθμών (α,β) π.χ. το βάρος (κιλά, γραμμάρια, δέκατα γραμμαρίων), το μήκος (μέτρα, εκατοστά, χιλιοστά, δέκατα χιλιοστών ), χρόνος (ώρες, λεπτά, δευτερόλεπτα, δέκατα δευτερολέπτων. Ποιοτικές: δεν εκφράζουν κάτι μετρήσιμο αλλά μία ιδιότητα π.χ. φύλο (άνδρες, γυναίκες)
Βήματα Στατιστικής Έρευνας 1)Καθορισµός του σκοπού της έρευνας 2)Προσδιορισµός των πηγών από όπου θα συλλεγούν τα στατιστικά δεδοµένα 3)Συλλογή και επεξεργασία των στατιστικών δεδοµένων (Απογραφή , δειγματοληψία) 4)Οργάνωση και Παρουσίαση των στατιστικών δεδοµένων 5)Χρήση Η/Υ και στατιστικών προγραμμάτων (π.χ. excel, SPSS, Minitab, κτλ) για την επεξεργασία και καταχώρηση των δεδομένων 6)Ανάλυση των στατιστικών δεδοµένων 7)Παρουσίαση των σχετικών συµπερασµάτων που προέκυψαν από τη στατιστική έρευνα
Οργάνωση και Παρουσίαση των στατιστικών δεδοµένων με πίνακες και διαγράμματα Πίνακες Κατανομής Συχνοτήτων Χρήσιμο μέσο για την σαφή και κατανοητή παρουσίαση των δεδομένων περιγραφή των δεδομένων (π.χ. εύρος τιμών, έλεγχος συμμετρικότητας, ύπαρξη ακραίων τιμών) Τα δεδομένα ενός δείγματος (N) για μια τμ Χ που παίρνει τιμές σε ένα σύνολο τιμών (κατηγορίες, αριθμητικές τιμές) μπορούν να παρουσιαστούν σε ένα πίνακα συχνοτήτων.
Ο πίνακας ή κατανομή συχνοτήτων = Η βασική τεχνική σύνοψης των δεδομένων , με την οποία κατηγοριοποιούμε τα δεδομένα και μελετάμε τη συγκέντρωση που αυτά έχουν ανά κατηγορία. ή Μπορούμε να συνοψίσουμε τα δεδομένα σε έναν πίνακα ο οποίος παρουσιάζει τις κατηγορίες με τις συχνότητες τους. Σημείωση: Αρχικά, ο ερευνητής θα πρέπει να συγκεντρώσει στοιχεία τουλάχιστον 20 με 25 παρατηρήσεων έτσι ώστε να έχει κάποια σημαντικότητα η ανάλυσή του.
Α) Πίνακας Κατανομής Συχνοτήτων ποσοτικής μεταβλητής: (με Ν<30) ΜΕΝΟΥ FILE OPEN WORKSHEET DATA ΑΡΧΕΙΟ RSOPT Μενού Stat Tables Tally
Μεταβλητή Χi: MatTemp (C7)
MatTemp Count CumCnt Percent CumPct 50 1 1 3,23 3,23 50 1 1 3,23 3,23 70 8 9 25,81 29,03 90 13 22 41,94 70,97 110 8 30 25,81 96,77 130 1 31 3,23 100,00 N= 31 1)Count = Συχνότητα (fi) 2)Cumulative count = Αθροιστική συχνότητα (Fi) 3)Percent = Ποσοστιαία συχνότητα ή σχετική (fi%) 4)Cumulative percent = Αθροιστική Ποσοστιαία συχνότητα Fi%
MatTemp Count CumCnt Percent CumPct 50 1 1 3,23 3,23 50 1 1 3,23 3,23 70 8 9 25,81 29,03 90 13 22 41,94 70,97 110 8 30 25,81 96,77 130 1 31 3,23 100,00 N= 31 1)Count = Συχνότητα (fi) πόσες φορές εμφανίζεται η τιμή (xi) της τμ Χ στο σύνολο του δείγματος (Ν) Σ fi = Ν, δηλ. f1+f2+f3…fκ = Ν (όπου i = 1,2,3,..,κ)
MatTemp Count CumCnt Percent CumPct 50 1 1 3,23 3,23 50 1 1 3,23 3,23 70 8 9 25,81 29,03 90 13 22 41,94 70,97 110 8 30 25,81 96,77 130 1 31 3,23 100,00 2)Cumulative count = Αθροιστική συχνότητα (Fi) Αθροιστική συχνότητα (Fi) μιας τιμής (xi) είναι το άθροισμα των συχνοτήτων όλων των τιμών που είναι μικρότερες ή ίσες της xi Δηλ. Fi = f1+f2+f3+ …+fi
MatTemp Count CumCnt Percent CumPct 50 1 1 3,23 3,23 50 1 1 3,23 3,23 70 8 9 25,81 29,03 90 13 22 41,94 70,97 110 8 30 25,81 96,77 130 1 31 3,23 100,00 N= 31 100,00 3)Percent = Ποσοστιαία συχνότητα ή σχετική (fi%) fi % = fi / N * 100 f2% = f2 / N = 8 / 31 * 100 = 25,81 %
MatTemp Count CumCnt Percent CumPct 50 1 1 3,23 3,23 50 1 1 3,23 3,23 70 8 9 25,81 29,03 90 13 22 41,94 70,97 110 8 30 25,81 96,77 130 1 31 3,23 100,00 N= 31 4)Cumulative percent = Αθροιστική Ποσοστιαία συχνότητα Fi% = Fi / N * 100 F3% = F3 / N * 100 = 22 / 31 * 100 = 70,97 %
Β) Κατασκευή πίνακα κατανομής συχνοτήτων ομαδοποιημένων τιμών με τάξεις (Με Ν>30) Από το ΜΕΝΟΥ FILE OPEN WORKSHEET DATA ανοίγουμε το αρχείο: PULSE Μεταβλητή Χi: Pulse1(Ποσοτική μεταβλητή) Ομαδοποίηση των τιμών της μεταβλητής Pulse1 σε τάξεις. Οι σφυγμοί χρειάζεται να συγκεντρωθούν σε διαστήματα τιμών ώστε ή εικόνα της κατανομής τους να είναι πιο συνοπτική. Ο νέος περιληπτικός πίνακας που θα κατασκευάσουμε θα δείχνει τη συχνότητα (πλήθος) των φοιτητών που έχουν σφυγμό στα αντίστοιχα διαστήματα τιμών.
1ο Βήμα) Κατάταξη των δεδομένων της Pulse1 κατά αύξουσα διάταξη: Manip Sort Sort Column(s): Pulse1 Store sorted columns: C9 (κενή στήλη) Store by columns: Pulse1 2ο Βήμα) Εμφάνιση της στήλης C9 στο Session Manip Display Data 3ο Βήμα) Υπολογισμός του κατάλληλου αριθμού των τάξεων κ και του σωστού πλάτους δ των διαστημάτων κάθε τάξης. α) κ από τον τύπο: κ = 1+3,3*log N, όπου Ν=92 κ = 7,48050 ≈ 7 (στρογγυλοποίηση ) Στρογγυλοποίηση = Επιλέγω την στήλη Δεξί κλικ και format column Numeric fixed decimal with
β) δ από τον τύπο: δ= R/κ , όπου Range (εύρος) = X max - X min , άρα δ = (100 - 48) / 7 = 7,42857 ≈ 8 (στρογγυλοποίηση ) 4ο Βήμα) Δημιουργία διαστημάτων τάξεων με κ=7 και δ=8 Και υπολογισμός κεντρικών τιμών των διαστημάτων. TAXEIS Xi Xi = (Άνω όριο διαστημ.+ 1)[48-56) 52 Κάτω όριο διαστημ.) / 2 2)[56-64) 60 δηλ. Χ1 = (48+56) / 2 = 52 3)[64-72) 68 4)[72-80) 76 5)[80-88) 84 6)[88-96) 92 7)[96-104) 100
5ο Βήμα) Υπολογισμός Count , Cumulative count, Percent, Cumulative percent Α) Κωδικοποίηση τάξεων Manip Code Numeric to Numeric
kentra Count CumCnt Percent CumPct 52 3 3 3,26 3,26 Β) Μενού Stat Tables Tally kentra Count CumCnt Percent CumPct 52 3 3 3,26 3,26 60 17 20 18,48 21,74 68 26 46 28,26 50,00 76 21 67 22,83 72,83 84 12 79 13,04 85,87 92 10 89 10,87 96,74 100 3 92 3,26 100,00 N= 92
TAXEIS Xi fi fi% Fi. Fi% . 1)[48-56) 52 3 3,26 3 3,26 . 2)[56-64) 60 17 18,48 20 21,74 . 3)[64-72) 68 26 28,26 46 50,00 . 4)[72-80) 76 21 22,83 67 72,83 . 5)[80-88) 84 12 13,04 79 85,87 . 6)[88-96) 92 10 10,87 89 96,74 . 7)[96-104) 100 3 3,26 92 100,00. Σύνολο 92 100 .
Κατασκευή ιστογράμματος (Histogram): Γραφικές Μέθοδοι Παρουσίασης Κατασκευή ιστογράμματος (Histogram): Ιστόγραμμα συχνοτήτων: αποτελείται από διαδοχικά ορθογώνια των οποίων το ύψος επιλέγεται έτσι ώστε το εμβαδόν του ορθογωνίου να είναι ίσο με τη συχνότητα της τιμής στην οποία αναφέρεται Μενού Graphs Histogram Επιλέγω Weight Options επιλέγω Frequency Στο Type of intervals επιλέγω CutPoints είναι όρια των διαστημάτων και Στο MidPoints- CutPoints positions: Ορίζω όρια των διαστημάτων