Εισαγωγή Στατιστική είναι η επιστήμη που με τη βοήθεια επιστημινκών μεθόδων ασχολείται με τη συλλογή, οργάνωση, παρουσίαση και ανάλυση αριθμητικών στοιχείων ή χαρακτηριστικών για την κατάληξη σε γενικά συμπεράσματα, που είναι χρήσιμα στη διαδικασία λήψης ορθών αποφάσεων. Χρησιμοποιείται σε όλους τους τομείς της ανθρώπινης δραστηριότητας και είναι απαραίτητη στη Διοίκηση γενικά, όπου η λήψη ορθών αποφάσεων έχει μεγάλη σημασία για την πρόοδο ενός κράτους, μιας βιομηχανίας ή μιας επιχείρησης.
Ποιοτικά -κατηγοριοποιήσεων : Είδη στοιχείων Ποιοτικά -κατηγοριοποιήσεων : π χ χρώμα φύλο εθνικότητα Διακριτά Ποσοτικά –μετρήσιμα : π χ θερμοκρασία μισθός βαθμολογία γραπτών Διακριτά ή συνεχή
Κλίμακες Ποιοτική κλίμακα ονομαστική ( Nominal ) ομάδες ή κατηγορίες, κατατάξεις - φύλο, θρησκεία Ποιοτική κλίμακα κατάταξης ( Ordinal ) σειρά προτεραιότητας, ποιοτική διαβάθμιση Ποσοτική κλίμακα διαστημάτων είναι αριθμητικά μετρήσιμες, διατάξιμες, καθώς και η διαφορά τους - θερμοκρασίες , βαθμός πτυχίου Ποσοτική κλίμακα αναλογική η αριθμητική σειρά και η διαφορά μεταξύ τους είναι καθορισμένη και ο λόγος των τιμών τους δίνει σημαντικές πληροφορίες - βάρος , ύψος , μισθοί
Πληθυσμός και δείγμα Πληθυσμός είναι ένα σύνολο με όλα τα στοιχεία των μετρήσεων πάνω στα οποία θα γίνει έρευνα. Δείγμα είναι ένα υπό-σύνολο μετρήσεων που επιλέγουμε από έναν πληθυσμό. Απογραφή είναι μια πλήρης καταγραφή όλων των στοιχείων ενός πληθυσμού . Μια απογραφή συνήθως είναι είτε αδύνατη, είτε μη πρακτική είτε κοστίζει πολύ Η δειγματοληψία από έναν πληθυσμό συνήθως γίνεται με τυχαίο τρόπο , έτσι ώστε κάθε πιθανό δείγμα ίσου μεγέθους (n) έχει την ίδια πιθανότητα να επιλεγεί . Ένα δείγμα επιλέγεται με τον τρόπο αυτό ονομάζεται τυχαίο δείγμα .
Παράμετροι Τάσης Οι παράμετροι τάσης που χρησιμοποιούνται για τον ορισμό του σημείου γύρω από το οποίο συσσωρεύονται οι διάφορες τιμές ενός πληθυσμού είναι: Μέσος αριθμητικός Μέσος γεωμετρικός Μέσος αρμονικός
Μέσος Αριθμητικός å å m = x N x n = Μέσος πληθυσμού Μέσος δείγματος i 1 x n i = å 1 Μέσος δείγματος Μέσος σταθμικός
Μέσος Γεωμετρικός & Αρμονικός Μέσος Αρμονικός
Παράμετροι Θέσης Οι παράμετροι θέσεις που χρησιμοποιούνται για τον ορισμό της θέσης της κατανομής είναι: Διάμεσος Τεταρτημόρια Δεκατημόρια Εκατοστημόρια Επικρατούσα Τιμή
Διάμεσος Διάμεσος είναι η τιμή εκείνη πάνω και κάτω της οποίας βρίσκεται ίσος αριθμός παρατηρήσεων του δείγματος που έχουν τοποθετηθεί κατ’ αύξουσα φυσική τάξη. Σε περίπτωση περιττού αριθμού παρατηρήσεων η διάμεσος ορίζεται ωςη παρατήρηση της θέσης Ν+1/2. -Σε περίπτωση άρτιου αριθμού παρατηρήσεων η διάμεσος ορίζεται ως ο μέσος των δύο κεντρικών διαδοχικών τιμών. -Σε περίπτωση συνεχούς κατανομής η διάμεος ορίζεται από τον τύπο: Μ διάμεσος, αΜ κάτω όριο διαστήματος τιμών που περιέχεται η M, Ν αριθμός παρατηρήσεων,FI-1 αθροιστική συχνότητα μέχρι αM, W πλάτος διαστήματος τιμών που περιέχεται η Μ και fM απόλυτη συχνότητα του διαστήματος τιμών όπου περιέχεται η δίαμεσος.
Τεταρτημόρια-Δεκατημόρια-Εκατοστημόρια Τεταρτημόρια: οι τιμές πάνω των οποίων βρίσκεται το 75% των παρατηρήσεων του πληθυσμού(I τεταρτημόριο), η το 25%(III τεταρτημόριο). Δεκατημόρια & Εκατοστημόρια: οι τιμές της μεταβλητής, που η θέση τους βρίσκεται στα ανάλογα δέκατα ή εκατοστά του εύρους της μεταβλητής. Πρώτο τεταρτημόριο Τρίτο Τεταρτημόριο
Επικρατούσα Τιμή όπου Δ1 = fmax – fmax-1 και Δ2 = fmax - fmax+1 Επικρατούσα Τιμή: είναι η τιμή εκείνης της μεταβλητής που εμφανίζει τη μέγιστη συχνότητα και συμβολίζεται με το ΜΟ, όπου Δ1 = fmax – fmax-1 και Δ2 = fmax - fmax+1
Σύγκριση Μέσου Αριθμητικού-Διαμέσου & Επικρατούσας Τιμής Στην περίπτωση που μία κατανομή είναι συμμετρική, οι τιμές των τριών παραμέτρων (μέσος αριθμητικός, διάμεσος και επικρατούσα τιμή) συμπίπτουν. Στις ασυμμετρικές κατανομές οι παραπάνω παράμετροι διαφέρουν μεταξύ τους και η διάμεσος βρίσκεται μεταξύ των δύο άλλων παραμέτρων.
Παράμετροι Διασποράς Οι παράμετροι θέσεις που χρησιμοποιούνται για τον ορισμό της θέσης της κατανομής είναι: Εύρος Διασποράς Ημιενδοτεταρτημοριακό εύρος Μέση Απόκλιση Διακύμανση και Τυπική Απόκλιση Συντελεστές Μεταβλητικότητας Τυποποιημένες ή Ανηγμένες Διαφορές
Εύρος Διασποράς Εύρος Διασποράς: είναι η διαφορά ανάμεσα στη μικρότερη και μεγαλύτερη τιμή μίας σειράς παρατηρήσεων Σε περίπτωση συνεχούς κατανομής το Εύρος Διασποράς ισούται με τη διαφορά του πάνω ορίου του τελευταίου διαστήματος τάξης μείον το κάτω όριο του πρώτου διαστήματος τάξης
Ημιενδοτεταρτημοριακό Εύρος Ημιενδοτεταρτημοριακό Εύρος: είναι το ημιάθροισμα της διαφοράς μεταξύ τρίτου και πρώτου ταταρτημορίου. Όσο μικρότερη είναι η τιμή Q, τόσο μεγαλύτερη είναι η συγκέντρωση των τιμών της μεταβλητής
Μέση Απόκλιση Μέση Απόκλιση: είναι ο μέσος αριθμητικός όλων των απολύτων διαφορών των τιμών μιας μεταβλητής από το μέσο αριθμητικό (μ) της μεταβλητής. Στην περίπτωση συνεχούς κατανομής η μέση απόκλιση ορίζεται:
Διακύμανση – Τυπική Απόκλιση Διακύμανση: είναι ο μέσος αριθμητικός των τετραγώνων των αποκλίσεων των τιμών από το μέσο αριθμητικό (μ)της μεταβλητής. (μ είναι ο μέσος και Ν το πλήθος των παρατηρήσεων) Στην περίπτωση δειγματικών δεδομένων η διακύμανση για να είναι αμερόληπτη ορίζεται με βάση τους βαθμούς ελευθερίας (Μ είναι ο μέσος του δείγματος και Ν το πλήθος των παρατηρήσεων) : Τυπική Απόκλιση: είναι η θετική τετραγωνική ρίζα της διακύμανσης.
Συντελεστής Μεταβλητικότητας Στην περίπτωση της σύγκρισης μεταβλητών ή κατανομών μεταβλητών οι οποίες εκφράζονται σε διαφορετικές μονάδες μέτρησης, χρησιμοποιείται για τη μέτρηση της σχετικής διασποράς ο συντελεστής μεταβλητικότητας. Εκφράζεται ο λόγος της τυπικής απόκλισης μίας κατανομής προς τον αριθμητικό μέσο της.
Τυποποιημένες ή Ανηγμένες Διαφορές Για τη μέτρηση της σχετικής διασποράς χρησιμοποιούμε και τις τυποποιημένες ή ανηγμένες διαφορές. Μετατρέπουμε τις απόλυτες διαφορές των τιμών της μεταβλητής από το μέσο τους σε σχετικές, διαιρώντας με την τυπική τους απόκλιση.
Παράμετροι Ασυμμετρίας Αρνητική συμμετρία Θετική συμμετρία Συμμετρία Συμμετρική είναι η κατανομή που έχει το ίδιο πλήθος τιμών της μεταβλητής σε ίσες αποστάσεις απο τη μέση αριθμητική τιμή της μεταβλητής
Παράμετροι Ασυμμετρίας* Οι κανονικές κατανομές είναι συμμετρικές. Ο μέσος είναι μεγαλύτερος από τη διάμεσο στις θετικά ασυμμετρικές κατανομές. Ο μέσος είναι μικρότερος απο τη διάμεσο στις αρνητικά ασυμμετρικές κατανομές. -1≤Sk≤1 Aν Sk=0 η κατανομή είναι συμμετρική. Αν Sk>0 έχουμε θετική ασυμμετρία. Αν Sk <0 έχουμε αρνητική ασυμμετρία. Δείκτης του Pearson Δείκτης του Βowley
Παράδειγμα Μέσος<Διάμεσος Μέσος 10,02>Διάμεσος 7 Συχνότητα Υ Χ 45 4 50 35 55 20 5 60 15 6 65 14 8 70 75 80 85 90 Μέσος<Διάμεσος Μέσος 10,02>Διάμεσος 7
Παράμετροι Κύρτωσης Η κανονική κατανομή είναι μεσόκυρτη. Η κύρτωση μιας κατανομής μετράει το βαθμό συγκεντρώσεως των τιμών της μεταβλητής στην περιοχή των άκρων και του μέσου αριθμητικού. Η κανονική κατανομή είναι μεσόκυρτη. Η καμπύλη είναι λεπτόκυρτη όταν φανερώνει μεγάλη συγκέντρωση των τιμών περί το μέσο αριθμητικό. Η καμπύλη είναι πλατύκυρτη όταν φανερώνει ότι οι τιμές διασπείρονται πολύ αριστερά και δεξιά του μέσου αριθμητικού.
Παράμετροι Κύρτωσης* Πλατύκυρτη Μεσόκυρτη Λεπτόκυρτη
Μέθοδοι γραφικών παραστάσεων Διάγραμμα πίτας (Pie Chart) Ιστόγραμμα (Bar Graph) Πολύγωνο συχνοτήτων (Frequency Polygon) Χρονικό διάγραμμα (Time Plot) Box Plot
Ποσοστιαίας Κατανομής Διάγραμμα Πίτας (α) (β) (γ)=[(β)/42,800]100 (δ)=(γ)3,6 Κατηγορία Εξόδων Επιχείρησης Απόλυτα Μεγέθη Ποσοστιαία Κατανομή Τόξα ανάλογα Ποσοστιαίας Κατανομής ΑμοιβήΠροσωπικού Αμοιβές Τρίτων Αποσβέσεις Παγίων Παροχές Τρίτων Χρηματοοικονομικά Φόροι & Τέλη 18,600 7,400 5,200 3,400 6,800 1,400 43,5 17,3 12,1 7,9 15,9 3,3 156,6 62,28 43,56 28,44 57,24 11,88 ΣΥΝΟΛΟ 42,800 100,0 360,0
Ιστόγραμμα Το ιστόγραμμα συχνοτήτων είναι μία σειρά από συνδεόμενα ορθογώνια παραλληλόγραμμα πλάτους, ίσου με το εύρος των τάξεων και ύψους ίσου με τη συχνότητα κάθε τάξης.
Πολύγωνο Συχνοτήτων fi %= fi/Σfi Πολυγωνική Γραμμή Απολύτων Συχνοτήτων Τάξεις Όρια Τάξεων Απόλυτη Συχνότητα fi) Σχετική fi %= fi/Σfi 1 2 3 4 5 6 7 (25-30] (30-35] (35-40] (40-45] (45-50] (50-55] 8 12 18 10 0,12 0,19 0,28 0,16 0,11 0,08 0,06 Σύνολο 64 1,00 Πολυγωνική Γραμμή Απολύτων Συχνοτήτων Πολυγωνική Γραμμή Σχετικών Συχνοτήτων
Πολύγωνο Συχνοτήτων* Η «Μικρότερη από» (ή «Μεγαλύτερη από») αθροιστική κατανομή παρουσιάζει το άθροισμα των συχνοτήτων που αντιστοιχουν σε τιμές της μεταβλητής μικρότερες(ή μεγαλύτερες) από μία συγκεκριμένη τιμή αντίστοιχα. «Μικρότερη από» Αθροιστική Κατανομή Τιμή Μετοχής 400 450 500 550 600 650 700 Μικρότερη από 7 18 36 46 54 60 64 Μεγαλύτερη 57 28 10 4 «Μεγαλύτερη από» Αθροιστική Κατανομή
Διαγράμματα χρονικά (Time Plot) 8 . 5 7 . 5 6 . 5 5 . 5 J F M A M J J A S O N D J F M A M J J A S O N D J F M A M J J A S O
Box Plot Q1 Διάμεσος Q3 Ενδο-τεταρτημοριακό Εύρος