Στατιστική Στατιστική είναι η συλλογή, οργάνωση, ανάλυση, παρουσίαση και ερμηνεία δεδομένων, μέσω της διεξαγωγής ερευνών και πειραμάτων
Μεταβλητές και δεδομένα ΠΛΗΘΥΣΜΟΣ: Το θεωρητικό σύνολο ομοειδών «περιπτώσεων» Μεταβλητή: Ένα χαρακτηριστικό το οποίο μεταβάλλεται, δηλαδή με κάποιο τρόπο μετράται και μπορεί να πάρει διάφορες τιμές Π.χ το ύψος των φοιτητών του τμήματος ΛΧ 1. Ποσοτικές Μεταβλητές: Επιδέχονται μέτρηση 2. Ποιοτικές Μεταβλητές: Δεν επιδέχονται μέτρηση π.χ το φύλο, η οικογ. κατάσταση
Μεταβλητές και δεδομένα ΣΤΑΤΙΣΤΙΚΟ ΣΤΟΙΧΕΙΟ (Σ.Σ.): Οποιαδήποτε τιμή της Μεταβλητής Σταθερές: Υπάρχουν πράγματα στη φύση που είναι αμετάβλητα. Παράδειγμα, το νερό βράζει στους 100 βαθμούς Κελσίου, η ταχύτητα του φωτός είναι περίπου 300.000 Km ανά δευτερόλεπτο, κλπ.
δεδομένα ποιοτικά ή κατηγορικά ονομαστικά ιεραρχικά ποσοτικά ή αριθμητικά διακριτά συνεχή
Ποσοτικές Μεταβλητές: Συνεχείς. Μπορούν να πάρουν οποιαδήποτε τιμή μεταξύ δυο πραγματικών αριθμών Ασυνεχείς. Παίρνουν μόνο ακέραιες τιμές Πίνακας συχνοτήτων (ποιοτικά) ή κατανομή συχνοτήτων (ποσοτικά): Καταχωρούμε ή κατατάσσουμε τα δεδομένα σε πίνακα Συχνότητα: Το πλήθος των στοιχείων κάθε κατηγορίας Απόλυτη συχνότητα, που συμβολίζεται με f, και δείχνει το πλήθος σε απόλυτο αριθμό σχετική συχνότητα, που συμβολίζεται με fi/n και δείχνει την ποσοστιαία αναλογία της κατηγορίας στο σύνολο των κατηγοριών. ,
Σχετική f/n % συχνότητα Εταιρεία Συχνότητα f Σχετική f/n % συχνότητα Cosmote 6 0,3 ή 30% Vodafone 10 0,5 ή 50% Wind 4 0,2 ή 20% Σύνολο 20 1 ή 100%
Πήγατε διακοπές το περασμένο καλοκαίρι; Πήγατε διακοπές το περασμένο καλοκαίρι; Συχνότητα Σχετική συχνότητα Ναι 440 0,269113 ή 26,91% Όχι 981 0,6 ή 60,0 % Δεν απαντώ 214 0,130887 ή 13,09% Σύνολο 1.635 1 ή 100%
Ομαδοποίηση: η ταξινόμηση των δεδομένων σε κάποιες κλάσεις ή ομάδες. Γενικά, ο αριθμός των κλάσεων που θα πρέπει να γίνουν για την ομαδοποίηση μιας σειράς δεδομένων καθορίζεται αφενός από το συνολικό αριθμό των δεδομένων, αφετέρου όμως, και κυρίως, από την εμπειρία του ερευνητή και από το τι ακριβώς θέλει να δείξει ο ερευνητής. Τα δεδομένα μας, όσα και αν είναι, έχουν μια ελάχιστη τιμή και μια μέγιστη τιμή. Η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής καλείται εύρος:
Εάν προσθέσουμε όλες τις συχνότητες κάτω από μία συγκεκριμένη τιμή προκύπτει η αθροιστική συχνότητα, η οποία συμβολίζεται με F Κλάσεις εισοδήματος f F 7.200 – 10.450 5 10.450 – 13.700 7 12 13.700 – 16.950 8 20 16.950 – 20.200 32 20.200 – 23.450 37 23.450 – 26.700 3 40
Για να χωρίσουμε το εύρος των δεδομένων σε k κλάσεις διαιρούμε το εύρος των δεδομένων R με το k παίρνουμε έναν αριθμό τον οποίο στρογγυλοποιούμε, έτσι ώστε τελικά να προκύψει ένας εύχρηστος αριθμός που θα αποτελέσει το εύρος της κάθε κλάσης. Προσοχή: η στρογγυλοποίηση πρέπει να γίνεται πάντα προς τα πάνω, αλλιώς υπάρχει ο κίνδυνος να χάσουμε ακραίες παρατηρήσεις. Tι γίνεται όταν έχουμε μια τιμή στο όριο; Αν και είναι σχετικά σπάνιο να συμβεί κάτι τέτοιο σε συνεχή δεδομένα, θα πρέπει να έχουμε προσυμφωνήσει σε έναν κανόνα. [ , )
Το γράφημα για ομαδοποιημένα -ταξινομημένα δεδομένα λέγεται ιστόγραμμα συχνοτήτων. Οι ράβδοι στην περίπτωσή μας λέγονται ιστοί είναι στην ουσία κάποια ορθογώνια με βάση ίση με το εύρος της κλάσης και ύψος ίσο με τη συχνότητα της κάθε κλάσης. Στο ιστόγραμμα οι ιστοί εκπροσωπούν ομάδες αριθμών που βρίσκονται σε ορισμένη σειρά και για το λόγο αυτό ενώνονται μεταξύ τους.
Κάποιες φορές τα δεδομένα δίνουν στο ιστόγραμμα συγκεκριμένες μορφές, οι κυριότερες από τις οποίες είναι οι εξής: Ομοιόμορφο: Εάν σε όλες τις κλάσεις μπαίνει περίπου ίδιος αριθμός δεδομένων τότε το ιστόγραμμα είναι επίπεδο και ομοιόμορφο. Λοξό αριστερά: Εάν οι περισσότερες παρατηρήσεις συγκεντρώνονται στη δεξιά πλευρά του ιστογράμματος και προς τα αριστερά έχουμε όλο και λιγότερες παρατηρήσεις, με άλλα λόγια εάν δημιουργείται μια ουρά προς τα αριστερά, τότε το ιστόγραμμα εμφανίζει αριστερή λοξότητα. Σημειώνεται ότι εναλλακτικά χρησιμοποιείται ο όρος αρνητική ασυμμετρία.
Λοξό δεξιά: Εάν οι περισσότερες παρατηρήσεις συγκεντρώνονται στην αριστερή πλευρά του ιστογράμματος και προς τα δεξιά έχουμε όλο και λιγότερες παρατηρήσεις, με άλλα λόγια εάν δημιουργείται μια ουρά προς τα δεξιά, τότε το ιστόγραμμα εμφανίζει δεξιά λοξότητα. Σημειώνεται ότι εναλλακτικά χρησιμοποιείται ο όρος θετική ασυμμετρία.
Καμπάνα: Εάν ένα ιστόγραμμα έχει όλο και περισσότερες παρατηρήσεις καθώς πλησιάζουμε στο κέντρο του από οποιαδήποτε πλευρά και στα δύο άκρα σχηματίζει ουρές τότε έχει σχήμα καμπάνας. Συμμετρικό: Εάν σε ένα ιστόγραμμα φέρουμε μια κάθετη γραμμή στη μέση και η εικόνα αριστερά είναι περίπου ή ακριβώς “καθρέφτης” της εικόνας δεξιά τότε το ιστόγραμμα είναι συμμετρικό.
Σχήματος U: Εάν οι περισσότερες παρατηρήσεις συγκεντρώνονται στα άκρα του ιστογράμματος και στο μέσο έχουμε λιγότερες παρατηρήσεις τότε το ιστόγραμμα έχει σχήμα U.
Δικόρυφο: Εάν υπάρχουν δύο σημεία στο ιστόγραμμα όπου συγκεντρώνονται περισσότερα στοιχεία και σχηματίζουν κορυφές, τότε έχουμε δικόρυφο ιστόγραμμα.
ΔΕΙΓΜΑ: ΜΕΓΕΘΟΣ ΠΛΗΘΥΣΜΟΥ: Μέρος ενός πληθυσμού. Το σύνολο των Στοιχείων του Πληθυσμού (σύμβολο: Ν).
Ένα δείγμα μπορεί να ληφθεί κατά "τυχαίο" ή μη τυχαίο τρόπο. Τo "δείγμα" είναι μέρος ενός συνόλου που, συνήθως, καλείται "πληθυσμός". Ένα δείγμα μπορεί να ληφθεί κατά "τυχαίο" ή μη τυχαίο τρόπο. Στην περίπτωση τυχαίου δείγματος, επεκτείνουμε τα συμπεράσματα από τη μελέτη του δείγματος στον πληθυσμό. Μόνο όταν έχουμε τη δυνατότητα τυχαίας δειγματοληψίας, μπορούμε πράγματι να κάνουμε χρήση των αρχών της Επαγωγικής Στατιστικής.
Είναι διαφορετική η επεξεργασία των αποτελεσμάτων από "μεγάλο" δείγμα, από ό,τι από "μικρό". Ένα δείγμα θεωρείται μεγάλο όταν έχει τουλάχιστον 30 παρατηρήσεις.
Αθροίσματα ΚΑΝΟΝΕΣ ΑΘΡΟΙΣΕΩΣ Κανόνας 1. Αν α είναι μια σταθερή ποσότητα,τότε ισχύει η ισότητα:
Αθροίσματα ΚΑΝΟΝΕΣ ΑΘΡΟΙΣΕΩΣ Κανόνας 2. Αν α είναι μια σταθερή ποσότητα και Χi μια μεταβλητή ποσότητα, τότε ισχύει η ισότητα: Απόδειξη
Αθροίσματα ΚΑΝΟΝΕΣ ΑΘΡΟΙΣΕΩΣ Κανόνας 3. Αν α και β είναι σταθερές ποσότητες και xi μεταβλητή ποσότητα, τότε ισχύει η ισότητα:
Αθροίσματα ΚΑΝΟΝΕΣ ΑΘΡΟΙΣΕΩΣ Κανόνας 4. Αν xi και yi είναι μεταβλητές ποσότητες, τότε ισχύει η ισότητα:
Στατιστικά μέτρα Αντιπροσωπευτικοί αριθμοί Συνοψίζουν τα χαρακτηριστικά μιας κατανομής Τα στατιστικά μέτρα χωρίζονται σε δύο γενικές κατηγορίες: μέτρα θέσης και κεντρικής τάσης και μέτρα διασποράς. Τα μέτρα θέσης περιγράφουν περιληπτικά τη θέση που έχουν τα δεδομένα πάνω στην ευθεία των πραγματικών αριθμών, ενώ τα μέτρα κεντρικής τάσης εξετάζουν την τάση των δεδομένων να συγκεντρώνονται γύρω από ένα μέσο όρο.
Στατιστικά μέτρα τάσης α) Μέσοι Κεντρικής Τάσεως : ο Αριθμητικός, ο Γεωμετρικός και β) Μέσοι (παράμετροι) Θέσεως: η Διάμεσος, τα Τεταρτημόρια, τα Δεκατημόρια, η επικρατούσα τιμή
Απλός αριθμητικός μέσος Το πιο κοινό μέτρο του κέντρου των δεδομένων είναι ο αριθμητικός μέσος (arithmetic mean) ή απλά μέσος (mean). Πρόκειται για ένα εύκολα υπολογιζόμενο μέτρο που συμβολίζεται με το ελληνικό γράμμα μ εάν πρόκειται για το μέσο του πληθυσμού και με το λατινικό γράμμα εάν πρόκειται για το μέσο ενός δείγματος.
Απλός αριθμητικός μέσος Ημέρα Μεταβολή τιμής Δευτέρα 0,12 Τρίτη 0,05 Τετάρτη -0,08 Πέμπτη -0,14 Παρασκευή -0,05
Έστω τα δεδομένα 1, 2, 4, 5 Να βρεθεί ο αριθμητικός μέσος
Να βρεθεί ο αριθμητικός μέσος Έστω τα δεδομένα 1, 2, 4, 5 Να βρεθεί ο αριθμητικός μέσος
Έστω τα δεδομένα -1, 2, -4, 5, 3 Να βρεθεί ο αριθμητικός μέσος
Να βρεθεί ο αριθμητικός μέσος Έστω τα δεδομένα -1, 2, -4, 5, 3 Να βρεθεί ο αριθμητικός μέσος
Ιδιότητες Μέσου Αριθμητικού α) Αν προσθέσουμε σε όλες τις τιμές μιας μεταβλητής Χ μια σταθερή ποσότητα c, τότε και ο μέσος αριθμητικός τους αυξάνεται κατά τη σταθερή αυτή ποσότητα.
β) Αν αφαιρέσουμε από όλες τις τιμές μιας μεταβλητής Χ μια σταθερή ποσότητα c, τότε και ο μέσος αριθμητικός τους ελαττώνεται κατά τη σταθερή αυτή ποσότητα
γ) Αν πολλαπλασιάσουμε όλες τις τιμές μιας μεταβλητής Χ με μια σταθερή ποσότητα c, τότε και ο μέσος αριθμητικός τους πολλαπλασιάζεται με τη σταθερή αυτή ποσότητα.
δ) Το αλγεβρικό άθροισμα των αποκλίσεων (διαφορών) του μέσου αριθμητικού από κάθε τιμή της μεταβλητής Χ είναι μηδέν. Δηλαδή ισχύει η σχέση:
Ο αριθμητικός μέσος τιμών με συχνότητες Αριθμός παιδιών Συχνότητα 56 1 71 2 52 104 3 29 87 4 24 96 5 11 55 6 36 7 Σύνολο
Ο αριθμητικός μέσος τιμών ομαδοποιημένων – ταξινομημένων δεδομένων Σύνολο 6500
Να βρεθεί ο μέσος στα παρακάτω ομαδοποιημένα δεδομένα Κλάσεις Συχνότητα 0 – 10 1 10 – 20 3 20 – 30
Να βρεθεί ο μέσος στα παρακάτω ομαδοποιημένα δεδομένα Κλάσεις Συχνότητα xi fixi 0 – 10 1 5 5*1=5 10 – 20 3 15 45 20 – 30 25 Σύνολο 75
Μέσος Γεωμετρικός Εάν πολλαπλασιάσουμε όλες τις τιμές και πάρουμε τη -οστή ρίζα του γινομένου τότε έχουμε το γεωμετρικό μέσο ο οποίος συμβολίζεται με
Μέσος Γεωμετρικός Για τον υπολογισμό του μέσου γεωμετρικού χρησιμοποιούμε λογαριθμούς Λογαριθμούμε και τα δύο μέλη της σχέσεως ο μέσος αριθμητικός είναι πάντοτε μεγαλύτερος από το μέσο γεωμετρικό
Σταθμικός Γεωμετρικός Μέσος Εάν η κάθε τιμή εμφανίζεται με συχνότητα , τότε στον τύπο υπολογισμού του γεωμετρικού μέσου έχουμε:
Κυριότερες εφαρμογές του Μέσου Γεωμετρικού Ο υπολογισμός της μέσης ποσοστιαίας μεταβολής κυρίως οικονομικών χρονοσειρών Κατάρτιση αριθμοδεικτών Μετατρέπουμε τα δεδομένα σε αριθμοδείκτες ποσοστιαίας μεταβολής Διαιρούμε κάθε όρο με τον προηγούμενο
Να βρεθεί ο γεωμετρικός μέσος Έτος Τιμή Λόγος ετήσιας αύξησης 2002 1,25€ 2003 1,35€ 1,08 2004 1,44€ 1,07 2005 1,52€ 1,05 2006 1,62€ 2007 1,69€ 1,04 2008 1,74€ 1,03 2009 1,83€ 2010 1,90€ 2011 2,05€ 2012 2,30€ 1,12
Εάν θέλουμε να υπολογίσουμε τη μέση αύξηση της δεκαετίας τότε θα πρέπει να υπολογίσουμε το γεωμετρικό μέσο: Η μέση ετήσια ποσοστιαία αύξηση της τιμής του προϊόντος είναι περίπου 6,27%.
Χαρακτηριστικά μέσου αριθμητικού Η τιμή του αριθμητικού μέσου επηρεάζεται από όλες τις τιμές της μεταβλητής ιδιαιτέρως από τις ακραίες τιμές Ο τύπος του αριθμητικού μέσου δύναται να χρησιμοποιηθεί αλγεβρικά καθώς αποτελεί εξίσωση Ο αριθμητικός μέσος βρίσκεται πάντοτε ανάμεσα στην ελάχιστη και μέγιστη τιμή της μεταβλητής.
Χαρακτηριστικά μέσου γεωμετρικού Η τιμή του γεωμετρικού μέσου δεν επηρεάζεται τόσο πολύ από τις ακραίες τιμές όσο ο αριθμητικός μέσος Ο γεωμετρικός μέσος έχει νόημα και υπολογίζεται μόνο όταν οι τιμές της μεταβλητής είναι θετικοί αριθμοί και μη μηδενικοί. Ο τύπος του γεωμετρικού μέσου δύναται να χρησιμοποιηθεί αλγεβρικά
Αν μια κατανομή είναι συμμετρική ή κατά προσέγγιση συμμετρική τότε ο μέσος αριθμητικός είναι το πιο αντιπροσωπευτικό στατιστικό μέτρο έκφρασης κεντρικής –μέσης τιμής Αν μια κατανομή είναι ασυμμετρική τότε πιθανώς ο μέσος αριθμητικός να μην είναι το πιο αντιπροσωπευτικό μέτρο Υπάρχουν αλλά στατιστικά μέτρα όπως Διάμεσος Επικρατούσα τιμή
Να βρεθεί ο Γεωμετρικός μέσος στην παρακάτω σειρά των δεδομένων Ημερ/νιες X 20/7/2014 15 19/7/2014 13 0.15 18/7/2014 10 0.3 17/7/2014 11 -0.09 16/7/2014 12 -0.08 15/7/2014 9 0.33
Να βρεθεί ο Γεωμετρικός μέσος στην παρακάτω σειρά των δεδομένων Ημερ/νιες X 20/7/2014 6 19/7/2014 5 18/7/2014 7 17/7/2014 4 16/7/2014 3 15/7/2014 1
Διάμεσος Η διάμεσος είναι, πολύ απλά, η μεσαία τιμή της κατανομής, εάν κατατάξουμε τις τιμές σύμφωνα με αύξουσα ή φθίνουσα σειρά. Συνήθως από τη μικρότερη προς τη μεγαλύτερη Η διάμεσος κατέχει την κεντρική θέση είναι η τιμή που χωρίζει τις τιμές της μεταβλητής σε δύο ισοπληθείς ομάδες. 50% κάτω της Διαμέσου και τα υπόλοιπα 50% πάνω. Η διάμεσος συμβολίζεται με Μ η Μd
Διάμεσος απλών δεδομένων Τα δεδομένα διατάσσονται κατά αύξουσα σειρά Διακρίνουμε δύο περιπτώσεις: Όταν το πλήθος είναι μονός αριθμός, τότε υφίσταται μόνο μία τιμή της μεταβλητής που κατέχει την κεντρική θέση. 5, 9, 2, 7, 12 2, 5, 7, 9, 12 Η διάμεσος βρίσκεται στη 3η θέση
Το πλήθος των τιμών είναι ζυγός αριθμός. Υπάρχουν δύο τιμές. Μεταξύ των δύο κεντρικών τιμών βρίσκεται η Διάμεσος. Η διάμεσος ισούται με το ημιάθροισμα των δύο "κεντρικών" τιμών - 5, 9, 7, 11, 99, 1 1, 5, 7, 9, 11, 99 Η διάμεσος βρίσκεται μεταξύ του 3ου και 4ου όρου
Να βρεθεί η διάμεσος στις παρακάτω τιμές Χ: -1, 5, 1, 1, 4, 82, 9, 4
Να βρεθεί η διάμεσος στις παρακάτω τιμές Χ: -1, 5, 1, 1, 4, 82, 9, 3 Κατατάσσουμε τα δεδομένα με σειρά Χ: -1, 1, 1, 3, 4, 5, 9, 82 Η διάμεσος ισούται με το ημιάθροισμα των δύο "κεντρικών" τιμών - -1, 1, 1, 3, 4, 5, 9, 82 Η διάμεσος βρίσκεται μεταξύ του 4ου και 5ου όρου
Διάμεσος ομαδοποιημένων δεδομένων Εντοπίζεται Ν/2=50 Επομένως Μd=3
Να βρεθεί η διάμεσος των παρακάτω δεδομένων: 1 2 3 5 4 Σύνολο 15
1 2 3 5 10 4 13 15 Σύνολο
Διάμεσος ταξινομημένων δεδομένων Ν/2 η θέση – αθροιστική σειρά που εντοπίζουμε τη διάμεσο xi = το κάτω όριο της τάξεως που βρίσκεται η διάμεσος δ = το διάστημα της τάξης που βρίσκεται η διάμεσος fi =η συχνότητα της τάξης που βρίσκεται η διάμεσος Fi-1 = η αμέσως μικρότερη αθροιστική συχνότητα από αυτή που έχουμε εντοπίσει τη διάμεσο.
xi = το κατώτερο όριο της τάξης =370 δ = το διάστημα της τάξης 10 Αρχίζουμε με το υπολογισμό του Ν/2 Fi-1 Εντοπίζεται στην αθρ συχν xi = το κατώτερο όριο της τάξης =370 δ = το διάστημα της τάξης 10 fi = η συχνότητα της τάξης που εντοπίζεται=44 Ν =το σύνολο των συχνοτήτων =100 Fi-1=η αμέσως μικρότερη από το F που εντοπίζεται
Κλάσεις Συχνότητα 0 – 10 1 10 – 20 3 20 – 30 5 30 – 40 40 - 50 2 Να βρεθεί η Διάμεσος; Κλάσεις Συχνότητα 0 – 10 1 10 – 20 3 20 – 30 5 30 – 40 40 - 50 2
Αθροιστική συχνότητα F Κλάσεις Συχνότητα f Αθροιστική συχνότητα F 0 – 10 2 10 – 20 3 5 20 – 30 10 30 – 40 13 40 - 50 15 Σύνολο
Κλάσεις Συχνότητα 0 – 4 1 4 – 8 2 8 – 12 4 12– 16 16- 20 Να βρεθεί η Διάμεσος; Κλάσεις Συχνότητα 0 – 4 1 4 – 8 2 8 – 12 4 12– 16 16- 20
Τεταρτημόρια Το πρώτο Τεταρτημόριο συμβολίζεται με το Q1 είναι η τιμή εκείνη της μεταβλητής που χωρίζει τα δεδομένα στο 25% και στο 75 % του συνόλου των τιμών. Κάτω από το Q1 βρίσκεται το 25 % των δεδομένων και πάνω από την τιμή αυτή το 75 %. Το δεύτερο τεταρτημόριο είναι η Διάμεσος. Το τρίτο τεταρτημόριο συμβολίζεται με το Q3 Κάτω από το Q3 βρίσκεται το 75 % των δεδομένων και πάνω από την τιμή αυτή το 25 %.
Διατάσσουμε τα δεδομένα. Χρησιμοποιούμε τους εξής τύπους: Απλά Δεδομένα Διατάσσουμε τα δεδομένα. Χρησιμοποιούμε τους εξής τύπους: το πρώτο τεταρτημόριο εντοπίζεται στη θέση PN=0,25*N, το τρίτο τεταρτημόριο εντοπίζεται στη θέση PN=0,75*N, Αν το παραπάνω αποτέλεσμα είναι δεκαδικός τότε το στρογγυλοποιούμε προς τον αμέσως μεγαλύτερο Αν το παραπάνω αποτέλεσμα είναι ακέραιος τότε το ποσοστιαίο σημείο είναι το ημιάθροισμα αυτού του ακέραιου με τον αμέσως επόμενο στη σειρά
Τεταρτημόρια Q1=PN=0,25*N=0,25*12=3 12,17,22,45,23,11,23,56,90,2,44,78 Θέτουμε τα δεδομένα κατά αύξουσα σειρά 2, 11, 12, 17, 22, 23, 23, 44, 45, 56, 78, 90 Αν το παραπάνω αποτέλεσμα είναι ακέραιος τότε το ποσοστιαίο σημείο είναι το ημιάθροισμα αυτού του ακέραιου με τον αμέσως επόμενο στη σειρά
Να βρεθεί το Q1 στην παρακάτω κατανομή 1, 1, 3 , -5, -23, 11, 23, 56, 1022
Να βρεθεί το Q1 στην παρακάτω κατανομή 1, 1, -5, -23, 11, 23, 56, 1022 Λύση Θέτουμε τα δεδομένα κατά αύξουσα σειρά -23, -5, 1, 1, 11, 23, 56, 1022 =6*0,25=2 Αν το παραπάνω αποτέλεσμα είναι ακέραιος τότε το ποσοστιαίο σημείο είναι το ημιάθροισμα αυτού του ακέραιου με τον αμέσως επόμενο στη σειρά
Τεταρτημόρια Να βρεθεί το Q1 στην παρακάτω κατανομή Q1=PN=0,25*N=0,25*100=25
Τεταρτημόρια Q3=PN=0,75*N=0,75*12=9 12,17,22,45,23,11,23,56,90,2,44,78 Θέτουμε τα δεδομένα κατά αύξουσα σειρά 2, 11, 12, 17, 22, 23, 23, 44, 45, 56, 78, 90 Αν το παραπάνω αποτέλεσμα είναι ακέραιος τότε το ποσοστιαίο σημείο είναι το ημιάθροισμα αυτού του ακέραιου με τον αμέσως επόμενο στη σειρά
Τεταρτημόρια Να βρεθεί το Q3 στην παρακάτω κατανομή Q3=PN=0,75*N=0,75*100=75
Τεταρτημόρια Για τον υπολογισμό των τεταρτημορίων χρησιμοποιούμε τους εξής τύπους: β) Για ταξινομημένα δεδομένα σε κατανομή συχνοτήτων χρησιμοποιούνται οι τύποι:
xi = το κατώτερο όριο της τάξης =50 δ = το διάστημα της τάξης 10 Fi-1 Εντοπίζεται στην αθρ συχν xi = το κατώτερο όριο της τάξης =50 δ = το διάστημα της τάξης 10 fi = η συχνότητα της τάξης που εντοπίζεται=19 Ν = σύνολο δεδομένων =100 Fi-1=17 η αμέσως μικρότερη από το F που εντοπίζεται
xi = το κατώτερο όριο της τάξης =50 δ = το διάστημα της τάξης 10 Fi-1 Εντοπίζεται στην αθρ συχν xi = το κατώτερο όριο της τάξης =50 δ = το διάστημα της τάξης 10 fi = η συχνότητα της τάξης που εντοπίζεται=19 Ν = σύνολο δεδομένων =100 Fi-1=17 η αμέσως μικρότερη από το F που εντοπίζεται
Να βρεθούν τα τεταρτημόρια στα παρακάτω δεδομένων: κλάσεις 0-10 10-20 20-30 30-40 40-50 Σύνολο 2 3 5 15
Υπολογίζουμε την αθροιστική σειρά: Κλάσεις 0 – 10 2 10 – 20 3 5 20 – 30 10 30 – 40 13 40 - 50 15 Σύνολο
Υπολογίζουμε την αθροιστική σειρά: Κλάσεις 0 – 10 2 10 – 20 3 5 20 – 30 10 30 – 40 13 40 - 50 15 Σύνολο
Επικρατούσα τιμή Επικρατούσα τιμή (Mode) συμβολίζεται Μο είναι η τιμή η οποία εμφανίζεται πιο συχνά στα δεδομένα. Είναι πιθανόν σε μία κατανομή να μην έχουμε καμία τιμή που να εμφανίζεται πάνω από μία φορά, οπότε δεν υπάρχει επικρατούσα τιμή
X 10 12 7 5 21 4 Επικρατούσα τιμή Μο = 7
Να βρεθεί το πρώτο και τρίτο τεταρτημόριο στα παρακάτω δεδομένα Χ Συχνότητα f 1 2 3 5 4 Σύνολο 15
Κλάσεις Συχνότητα f 0 – 10 2 10 – 20 3 20 – 30 5 30 – 40 40 – 50 Να βρεθούν τα τεταρτημόρια στα παρακάτω δεδομένων Κλάσεις Συχνότητα f 0 – 10 2 10 – 20 3 20 – 30 5 30 – 40 40 – 50 Σύνολο 15
Τα στατιστικά μέτρα θέση και τάσης δεν επαρκούν για την πλήρη περιγραφή της κατανομής μιας μεταβλητής δεν παρέχουν πληροφορίες για τη διασπορά των τιμών γύρω από το μέσο ούτε για τη μορφή της κατανομής που αντιπροσωπεύουν. Για να περιγραφεί ικανοποιητικά μια κατανομή θα πρέπει να μελετηθούν: 1) Κεντρική Τάση, 2) Διασπορά, 3) Ασυμμετρία και 4) Κύρτωση.