Εισαγωγή στην Στατιστική ΤΕΙ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ Εισαγωγή στην Στατιστική Κούκουμιαλος Στυλιανός «Εισαγωγή στην Στατιστική» / Συνοπτική Παρουσίαση Κεφ. 1-2 05/10/2015
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ 1.- Βασικές στατιστικές έννοιες 2.-Μέθοδοι συλλογής στατιστικών δεδομένων 3.-Συνοπτική παρουσίαση δεδομένων Πίνακες συχνοτήτων - Διαγράμματα 4.-Μέτρα κεντρικής τάσης 5.-Μέτρα διασποράς 6.-Εμπειρικός κανόνας 7.- Ασυμμετρία Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Βασικές στατιστικές έννοιες Στατιστικός πληθυσμός: Σύνολο ομοειδών στοιχείων τα οποία μελετώνται ως προς διάφορες χαρακτηριστικές ιδιότητες. Στατιστικές μονάδες: Τα στοιχεία από τα οποία αποτελείται ένας στατιστικός πληθυσμός. Μεταβλητές: Οι ιδιότητες που εξετάζονται σε ένα στατιστικό πληθυσμό. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Είδη μεταβλητών Ποσοτικές: Μετρήσιμες μεταβλητές π.χ ύψος, εισόδημα, αριθμός φοιτητών ανά εργαστηριακό τμήμα. Ποιοτικές ή κατηγορικές: Μη μετρήσιμες μεταβλητές, οι οποίες εκφράζουν ιδιότητα ή κατηγορία π.χ. φύλο, επίπεδο εκπαίδευσης Μεταβλητές διαβάθμισης ή ιεραρχικές: Εκφράζουν διαβάθμιση ή ιεραρχία (π.χ. επίπεδο παρεχόμενων υπηρεσιών: χαμηλό-μέτριο-άριστο) Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Μέθοδοι συλλογής στατιστικών δεδομένων Απογραφή: Λήψη πληροφοριών από κάθε στατιστική μονάδα Δειγματοληψία: Λήψη πληροφοριών από ένα μέρος του στατιστικού πληθυσμού, το δείγμα, το οποίο επιλέγεται με κατάλληλη μέθοδο, ώστε να είναι αντιπροσωπευτικό του αρχικού πληθυσμού. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Συνοπτική παρουσίαση δεδομένων: Πίνακες συχνοτήτων - Διαγράμματα 1.- Πίνακας συχνοτήτων για ποιοτικές ή ποσοτικές ασυνεχείς μεταβλητές Παρουσιάζει τον αριθμό των δεδομένων(συχνότητα) που αντιστοιχούν σε κάθε κατηγορία ή σε κάθε τιμή της μεταβλητής. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Παράδειγμα 1: Κατανομή δείγματος n=25 επιχειρήσεων ως προς το εργατικό δυναμικό X Xi fi fi % 20 3 12 25 6 24 30 10 40 4 16 50 2 8 Σύνολο 100 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Ραβδόγραμμα κατανομής επιχειρήσεων ως προς το εργατικό δυναμικό Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
2.- Πίνακας συχνοτήτων για ποσοτικές συνεχείς μεταβλητές Τα δεδομένα ομαδοποιούνται σε κ τάξεις ή κλάσεις. Η εμπειρική κατανομή (πίνακας) συχνοτήτων παρουσιάζει τον αριθμό των δεδομένων που αντιστοιχούν σε κάθε κλάση. Το πλάτος των κλάσεων είναι δ = όπου R εύρος μεταβολής των δεδομένων του δείγματος(διαφορά μεγαλύτερης και μικρότερης τιμής) Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Παράδειγμα 2: Κατανομή δείγματος n=40 επιχειρήσεων ως προς τα ετήσια κέρδη(χιλιάδες ευρώ) Ετήσια κέρδη fi fi % 800-900 4 10 900-1000 9 22.5 1000-1100 12 30 1100-1200 7 17.5 1200-1300 6 15 1300-1400 2 5 Σύνολο 40 100 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Ιστόγραμμα κατανομής επιχειρήσεων ως προς τα ετήσια κέρδη Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αριθμητικά περιγραφικά μέτρα Αριθμητικά περιγραφικά μέτρα που αναφέρονται στον στατιστικό πληθυσμό ονομάζονται παράμετροι. Αριθμητικά περιγραφικά μέτρα που αναφέρονται στο δείγμα ονομάζονται στατιστικές ή στατιστικά δείγματος. Κεντρική τάση: Η συγκέντρωση των τιμών μίας μεταβλητής, που έχουν τοποθετηθεί σε διάταξη, γύρω από ένα κεντρικό σημείο, το οποίο καθορίζει το κέντρο των δεδομένων. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Μέτρα κεντρικής τάσης 1.- Μέσος αριθμητικός ή μέση τιμή Έστω x1, x2, x3,…,xn οι τιμές μίας μεταβλητής Χ από ένα δείγμα μεγέθους n. Ο μέσος αριθμητικός του δείγματος ορίζεται ως το άθροισμα των τιμών δια του πλήθους αυτών Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 2.- Διάμεσος Διάμεσος Μ ενός συνόλου δεδομένων x1, x2, x3,…,xn που έχουν τοποθετηθεί σε αύξουσα τάξη μεγέθους, καλείται ο αριθμός που βρίσκεται στο μέσον των δεδομένων. α) Αν n περιττός, η διάμεσος είναι στην θέση β) Αν n άρτιος, η διάμεσος υπολογίζεται από το ημιάθροισμα των δύο κεντρικών όρων. 3.- Επικρατούσα τιμή Επικρατούσα τιμή Μο σε ένα σύνολο δεδομένων καλείται η τιμή που εμφανίζεται με την μεγαλύτερη συχνότητα Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Παράδειγμα 3: Η ετήσια απόδοση των μετοχών ενός χαρτοφυλακίου είναι ως εξής: 9, 2, 4, 40, 6, 5, 4 Η μέση απόδοση των μετοχών είναι Οι τιμές σε διάταξη είναι : 2, 4, 4, 5, 6, 9, 40 Η διάμεσος βρίσκεται στην δηλαδή στην 4η θέση και είναι Μ =5 Η επικρατούσα τιμή είναι Μο = 4 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Τεταρτημόρια Σε ένα σύνολο δεδομένων που έχουν τοποθετηθεί κατά αύξουσα τάξη μεγέθους, τα τεταρτημόρια είναι τρείς αριθμοί που χωρίζουν τα δεδομένα σε 4 ίσα μέρη. Το 1ο τεταρτημόριο Q1 χωρίζει τα δεδομένα έτσι ώστε το 25% των δεδομένων έχουν τιμές μικρότερες ή ίσες από Q1 το και το 75% των δεδομένων, τιμές μεγαλύτερες ή ίσες από το Q1. Το 2ο τεταρτημόριο είναι η διάμεσος Μ. Το 3ο τεταρτημόριο Q3 χωρίζει τα δεδομένα έτσι ώστε το 75% των δεδομένων έχουν τιμές μικρότερες ή ίσες από Q3 το και το 25% των δεδομένων, τιμές μεγαλύτερες ή ίσες από το Q3. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Διασπορά Ορισμός: Η διασπορά εκφράζει την μεταβλητότητα των τιμών μιας μεταβλητής γύρω από την μέση τιμή τους. Μέτρα διασποράς: 1. Εύρος 2. Διακύμανση - Τυπική απόκλιση 3.-Συντελεστής μεταβλητικότητας 4.-Ενδοτεταρτημοριακή απόκλιση The mean of the data in the sample of 36 CK measurements is given by Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 1. Εύρος Το εύρος είναι η διαφορά μεταξύ μεγίστης και ελαχίστης τιμής R = Xμεγίστη-X ελαχίστη The mean of the data in the sample of 36 CK measurements is given by Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
2.-Διακύμανση - Τυπική απόκλιση Έστω x1, x2, x3,…,xn οι τιμές της μεταβλητής Χ από ένα δείγμα μεγέθους n. Η διακύμανση s2 ή μέση τετραγωνική απόκλιση του δείγματος ορίζεται ως Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Η τυπική απόκλιση s είναι η τετραγωνική ρίζα της διακύμανσης Η τυπική απόκλιση εκφράζεται στις αρχικές μονάδες μέτρησης. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Διαγραμματική απεικόνιση κατανομών με ίδια μέση τιμή και διαφορετική διακύμανση (α) και διαφορετική μέση τιμή και διαφορετική διακύμανση (β) α β Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
3.-Συντελεστής μεταβλητικότητας Ο συντελεστής μεταβλητικότητας ή σχετική διασπορά, ορίζεται σαν το πηλίκο της τυπικής απόκλισης προς την μέση τιμή. Πολλαπλασιάζεται με το 100 και εκφράζει την τυπική απόκλιση σαν ποσοστό της μέσης τιμής. CV(X) = Με τον συντελεστή μεταβλητικότητας είναι δυνατή η σύγκριση συνόλων δεδομένων που εκφράζονται σε διαφορετικές μονάδες μέτρησης. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
4.-Ενδοτεταρτημοριακή απόκλιση Η ενδοτεταρτημοριακή απόκλιση Q είναι η διαφορά τρίτου και πρώτου τεταρτημορίου Q =Q3-Q1 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Για τα δεδομένα του παραδείγματος 3 τα μέτρα διασποράς είναι Εύρος R = 40 -2 =38 Διακύμανση s2 = = s2= 179.6 Tυπική απόκλιση s =13.4 Συντελεστής μεταβλητικότητας CV(X) =134 % Ενδοτεταρτημοριακή απόκλιση Q=9-4=5 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Θηκόγραμμα (Box-plot) Με το θηκόγραμμα τα δεδομένα απεικονίζονται μέσω πέντε σημείων (ελάχιστη τιμή, τεταρτημόρια, μέγιστη τιμή). Θηκόγραμμα της κατανομής των ετήσιων κερδών για τα δεδομένα του παραδείγματος 2 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Εμπειρικός κανόνας Μία κατανομή είναι συμμετρική, όταν οι τιμές κατανέμονται ομοιόμορφα γύρω από τη μέση τιμή τους, δεν υπάρχουν ακραίες τιμές και οι μικρές τιμές ισορροπούν με τις μεγάλες τιμές. Σε μία συμμετρική κατανομή, η μέση τιμή ισούται με τη διάμεσο, δηλαδή . Σε μία συμμετρική κατανομή, γνωστή ως κανονική κατανομή, τα ποσοστά συγκέντρωσης των τιμών της μεταβλητής γύρω από την μέση τιμή, σε σχέση με την τυπική απόκλιση s, είναι ως εξής: Στο διάστημα συγκεντρώνεται το 68 % των τιμών της μεταβλητής Στο διάστημα συγκεντρώνεται το 95 % των τιμών της μεταβλητής Στο διάστημα συγκεντρώνεται το 99.7 % των τιμών της μεταβλητής Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Ασυμμετρία (θετική) Μία κατανομή παρουσιάζει θετική ασυμμετρία, όταν οι περισσότερες τιμές είναι συγκεντρωμένες στο αριστερό άκρο της κατανομής (αριστερά της κορυφής). Στη θετική ασυμμετρία, ο μέσος αριθμητικός αυξάνεται από ορισμένες μεγάλες τιμές και ισχύει: Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Ασυμμετρία (αρνητική) Μία κατανομή παρουσιάζει αρνητική ασυμμετρία όταν οι περισσότερες τιμές συγκεντρώνονται δεξιά της κορυφής. Στην αρνητική ασυμμετρία ο μέσος αριθμητικός μειώνεται από ορισμένες τιμές και ισχύει: Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»