Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεΆλκηστις Παχής Τροποποιήθηκε πριν 6 χρόνια
1
ΣΤΑΤΙΣΤΙΚΗ Partalidou Xanthi, PhD Candidate, MSc, BSc.
Department University of Thrace Department of Agricultural Development
2
Στατιστική Στατιστική είναι μέσω της διεξαγωγής ερευνών και πειραμάτων
η συλλογή, οργάνωση, ανάλυση, παρουσίαση και ερμηνεία δεδομένων, μέσω της διεξαγωγής ερευνών και πειραμάτων
3
μεταβλητές και δεδομένα
ΠΛΗΘΥΣΜΟΣ (Population): είναι το σύνολο των ομοειδών «περιπτώσεων» - μετρήσεων που αναφέρονται σε ένα πλήθος οντοτήτων (έμψυχων ή άψυχων) που έχουν ένα ή περισσότερα κοινά χαρακτηριστικά. Άπειρος Πληθυσμός: Πρακτικά πολύ μεγάλος (π.χ.πληθυσμός της γης) Πεπερασμένος Πληθυσμός: μετρήσιμος (π.χ. οι Έλληνες)
4
Κατηγορίες μεταβλητών
μεταβλητές Στατιστικές μεταβλητές: Τα χαρακτηριστικά και ιδιότητες ενός πληθυσμού. Κατηγορίες μεταβλητών Ποσοτικές μεταβλητές αυτές που είναι αριθμητικές και μετρήσιμες (Βάρος, ηλικία, ύψος ατόμου). Ποιοτικές μεταβλητές αυτές που δεν είναι αριθμητικές (π.χ. άγαμος-έγγαμος). Συνεχείς και Ασυνεχείς μεταβλητές Οι συνεχείς μπορούν να πάρουν οποιαδήποτε αριθμητική τιμή (π.χ. το ύψος και βάρος ενός ανθρώπου), -απαραίτητα ποσοτικές-. Οι ασυνεχείς μπορούν να πάρουν μόνο ακέραιες τιμές (π.χ. αριθμός παιδιών οικογένειας), –συνήθως ποιοτικές-.
5
μεταβλητές και δεδομένα
ΣΤΑΤΙΣΤΙΚΟ ΣΤΟΙΧΕΙΟ (Σ.Σ.): Οποιαδήποτε τιμή της μεταβλητής Σταθερές: Υπάρχουν πράγματα στη φύση που είναι αμετάβλητα. Παράδειγμα, το νερό βράζει στους 100 βαθμούς Κελσίου, η ταχύτητα του φωτός είναι περίπου Km ανά δευτερόλεπτο, κλπ.
6
Περιγραφική και Επαγωγική Στατιστική
Περιγραφική Στατιστική: Παρουσίαση στατιστικών δεδομένων σε πίνακες και διαγράμματα, υπολογισμός στατιστικών παραμέτρων και εξαγωγή συμπερασμάτων για τα δεδομένα Επαγωγική Στατιστική: Εξαγωγή συμπερασμάτων (επαγωγικά), από ένα αντιπροσωπευτικό δείγμα για τον συνολικό πληθυσμό. Βασίζεται στη θεωρία πιθανοτήτων και την θεωρία της Στατιστικής
7
ΣΥΛΛΟΓΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟμΕΝΩΝ
Απογραφή: καταγραφή όλων των ατόμων του πληθυσμού χωρίς εξαίρεση. Προβλήματα: κόστος, χρόνος. Δειγματοληψία: Συλλογή δεδομένων μόνο από τμήμα του πληθυσμού (Δείγμα). Πρέπει το δείγμα να είναι αντιπροσωπευτικό ώστε να δώσει αξιόπιστες πληροφορίες για όλο τον πληθυσμό (π.χ. 5% του συνόλου) Πλεονεκτήματα: χαμηλό κόστος, ταχύτητα Προβλήματα: επιλογή δείγματος, εκτέλεση δειγματοληψίας, μη αντιπροσωπευτικότητα, Δειγματοληπτικό σφάλμα, μη Δειγματοληπτικό σφάλμα.
8
ΕΡΩΤΗμΑΤΟΛΟΓΙΟ Ειδικό έντυπο συλλογής στατιστικού υλικού.
Τρόποι Συλλογής (συμπλήρωσης) Προσωπική συνέντευξη Ταχυδρομικά Ηλεκτρονικό Ταχυδρομείο ( ) Απαιτήσεις για ερωτηματολόγιο και στατιστικό υλικό Αξιοπιστία Αντικειμενικότητα Αντιπροσωπευτικότητα Συγκρισιμότητα Επεξεργασία Χρήση υπολογιστή και κατάλληλου λογισμικού για ταχύτητα και ακρίβεια.
9
ΣΤΑΤΙΣΤΙΚΑ ΠΡΟΓΡΑμμΑΤΑ ΚΑΙ ΛΟΓΙΣμΙΚΟ
Η χρήση ειδικών προγραμμάτων στατιστικής διευκολύνει την εφαρμογή στατιστικών μεθόδων και τεχνικών, ειδικά σε περιπτώσεις πολλών δεδομένων και πολύπλοκων μεθόδων. Υπάρχουν ειδικά στατιστικά πακέτα που έχουν αντικείμενο αποκλειστικά τη στατιστική και προγράμματα «γενικότερου» ενδιαφέροντος που προσφέρουν και στατιστικές μεθόδους, π.χ. τα λογιστικά φύλλα. Στατιστικά Πακέτα: Τα πιο γνωστά είναι το SPSS, SAS, Statistica,…
10
Λογιστικά φύλλα: Το excel της Microsoft είναι εξαιρετικά διαδεδομένο σε επιχειρήσεις, περιλαμβάνει στατιστικά εργαλεία: στατιστικές συναρτήσεις (functions) π.χ. για υπολογισμό του μέσου και τυπικής απόκλισης δεδομένων και στατιστικά εργαλεία π.χ. τα ιστογράμματα για δημιουργία ιστογραμμάτων. Πλεονέκτημα της στατιστικής ανάλυσης με λογιστικά φύλλα είναι το χαμηλό κόστος, δεν χρειάζεται να αγοραστεί ειδικό λογισμικό για στατιστική και επιπλέον η ευκολία χρήσης αφού το «περιβάλλον» εργασίας είναι ήδη γνωστό. μειονέκτημα είναι ότι απαιτούν κάποια εξοικείωση με τις στατιστικές μεθόδους, δεν προσφέρουν μεθόδους και τεχνικές που θεωρούνται «προχωρημένες».
11
ΠΑΡΟΥΣΙΑΣΗ: ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ
Ένας Πίνακας έχει στόχο να παρουσιάσει στατιστικά δεδομένα με τρόπο κατανοητό στους πιθανούς αναγνώστες.
13
ΣΤΑΤΙΣΤΙΚΑ ΔΙΑ ΓΡΑμμΑΤΑ
Ένα διάγραμμα πρέπει να περιέχει τα παρακάτω στοιχεία: Τίτλο, Κλίμακα, Υπόμνημα, Πηγή.
14
Πίνακας συχνοτήτων (ποιοτικά) ή κατανομή συχνοτήτων (ποσοτικά):
Πίνακας συχνοτήτων (ποιοτικά) ή κατανομή συχνοτήτων (ποσοτικά): Καταχωρούμε ή κατατάσσουμε τα δεδομένα σε πίνακα Συχνότητα: Το πλήθος των στοιχείων κάθε κατηγορίας Απόλυτη συχνότητα, που συμβολίζεται με f, και δείχνει το πλήθος σε απόλυτο αριθμό Σχετική συχνότητα, που συμβολίζεται με fi/n και δείχνει την ποσοστιαία αναλογία της κατηγορίας στο σύνολο των κατηγοριών. ,
15
Ομαδοποίηση: η ταξινόμηση των δεδομένων σε κάποιες κλάσεις ή ομάδες.
Ομαδοποίηση: η ταξινόμηση των δεδομένων σε κάποιες κλάσεις ή ομάδες. Γενικά, ο αριθμός των κλάσεων που θα πρέπει να γίνουν για την ομαδοποίηση μιας σειράς δεδομένων καθορίζεται αφενός από το συνολικό αριθμό των δεδομένων, αφετέρου όμως, και κυρίως, από την εμπειρία του ερευνητή και από το τι ακριβώς θέλει να δείξει ο ερευνητής.
16
Τα δεδομένα μας, όσα και αν είναι, έχουν μια ελάχιστη τιμή και μια μέγιστη τιμή.
Η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής καλείται εύρος: Κλάσεις εισοδήματος 7.200 – – – – – – R= – 7.200 =19.500
17
Για να χωρίσουμε το εύρος των δεδομένων σε k κλάσεις :
διαιρούμε το εύρος των δεδομένων R με το k παίρνουμε έναν αριθμό τον οποίο στρογγυλοποιούμε, έτσι ώστε τελικά να προκύψει ένας εύχρηστος αριθμός που θα αποτελέσει το εύρος της κάθε κλάσης. Προσοχή: η στρογγυλοποίηση πρέπει να γίνεται πάντα προς τα πάνω, αλλιώς υπάρχει ο κίνδυνος να χάσουμε ακραίες παρατηρήσεις.
18
ΠΑΡΑΔΕΙΓμΑ Εάν θέλουμε να χωρίσουμε τα δεδομένα σε 6 κλάσεις, τότε έχουμε: R ⁄ k = / 6 = Οπότε η κλάσεις διαμορφώνονται ως εξής : Κλάσεις εισοδήματος 7.200 – – – – – –
19
ΤΑΞΙΝΟμΗΣΗ – ΚΑΤΑΤΑΞΗ - ΟμΑΔΟΠΟΙΗΣΗ
ΔΕΔΟμΕΝΑ: ΒΑΘμΟΛΟΓΙΑ μΑΘΗΤΩΝ Επιλέγω 3 τάξεις επειδή στα δεδομένα έχουμε από: 0-4 Ανεπαρκώς, 5-7 Καλώς, 8-10 Άριστα ΚΑΤΑΝΟμΗ ΣΥΧΝΟΤΗΤΩΝ Τάξη (Κλάση) Κεντρική Τιμή Συχνότητα 0-4 2 20 5-7 6 11 8-10 9 25 Σύνολο 56
20
Σχετική f/n % συχνότητα
Εταιρεία Συχνότητα f Σχετική f/n % συχνότητα Cosmote 6 0,3 ή 30% Vodafone 10 0,5 ή 50% Wind 4 0,2 ή 20% Σύνολο 20 1 ή 100% Από πόσα;; (διευκόλυνση για μεγάλα δείγματα)
21
Πήγατε διακοπές το περασμένο καλοκαίρι;
Πήγατε διακοπές το περασμένο καλοκαίρι; Συχνότητα Σχετική συχνότητα Ναι 440 0, ή 26,91% Όχι 981 0,6 ή 60,0 % Δεν απαντώ 214 0, ή 13,09% Σύνολο 1.635 1 ή 100% Ποσοστό Ανταπόκρισης ή Δείκτης Ανταπόκρισης καλείται το ποσοστό των ατόμων που, δέχτηκαν να δώσουν απάντηση στα ερωτήματα ΠΟΣΟΣΤΟ ΑΝΤΑΠΟΚΡΙΣΗΣ: 100%-13,09%=86,914%
22
Όσο υψηλότερος δείκτης ανταπόκρισης τόσο καλύτερο για την διεξαγωγή της έρευνας.
23
είναι στην ουσία κάποια ορθογώνια
Το γράφημα για ομαδοποιημένα -ταξινομημένα δεδομένα λέγεται ιστόγραμμα συχνοτήτων. Οι ράβδοι στην περίπτωσή μας λέγονται ιστοί είναι στην ουσία κάποια ορθογώνια με βάση ίση με το εύρος της κλάσης και ύψος ίσο με τη συχνότητα της κάθε κλάσης. Στο ιστόγραμμα οι ιστοί εκπροσωπούν ομάδες αριθμών που βρίσκονται σε ορισμένη σειρά και για το λόγο αυτό ενώνονται μεταξύ τους.
25
Κάποιες φορές τα δεδομένα δίνουν στο ιστόγραμμα συγκεκριμένες μορφές, οι κυριότερες από τις οποίες είναι οι εξής: Ομοιόμορφο: Εάν σε όλες τις κλάσεις μπαίνει περίπου ίδιος αριθμός δεδομένων τότε το ιστόγραμμα είναι επίπεδο και ομοιόμορφο. Λοξό αριστερά: Εάν οι περισσότερες παρατηρήσεις συγκεντρώνονται στη δεξιά πλευρά του ιστογράμματος και προς τα αριστερά έχουμε όλο και λιγότερες παρατηρήσεις, με άλλα λόγια εάν δημιουργείται μια ουρά προς τα αριστερά, τότε το ιστόγραμμα εμφανίζει αριστερή λοξότητα. Σημειώνεται ότι εναλλακτικά χρησιμοποιείται ο όρος αρνητική ασυμμετρία.
27
τότε το ιστόγραμμα εμφανίζει δεξιά λοξότητα.
Λοξό δεξιά: Εάν οι περισσότερες παρατηρήσεις συγκεντρώνονται στην αριστερή πλευρά του ιστογράμματος και προς τα δεξιά έχουμε όλο και λιγότερες παρατηρήσεις, με άλλα λόγια εάν δημιουργείται μια ουρά προς τα δεξιά, τότε το ιστόγραμμα εμφανίζει δεξιά λοξότητα. Σημειώνεται ότι εναλλακτικά χρησιμοποιείται ο όρος θετική ασυμμετρία.
29
Καμπάνα: Εάν ένα ιστόγραμμα έχει όλο και περισσότερες παρατηρήσεις καθώς πλησιάζουμε στο κέντρο του από οποιαδήποτε πλευρά και στα δύο άκρα σχηματίζει ουρές τότε έχει σχήμα καμπάνας. Συμμετρικό: Εάν σε ένα ιστόγραμμα φέρουμε μια κάθετη γραμμή στη μέση και η εικόνα αριστερά είναι περίπου ή ακριβώς “καθρέφτης” της εικόνας δεξιά τότε το ιστόγραμμα είναι συμμετρικό.
30
Σχήματος U: Εάν οι περισσότερες παρατηρήσεις συγκεντρώνονται στα άκρα του ιστογράμματος και στο μέσο έχουμε λιγότερες παρατηρήσεις τότε το ιστόγραμμα έχει σχήμα U.
31
Δικόρυφο: Εάν υπάρχουν δύο σημεία στο ιστόγραμμα όπου συγκεντρώνονται περισσότερα στοιχεία και σχηματίζουν κορυφές, τότε έχουμε δικόρυφο ιστόγραμμα.
32
Περιγραφικά στατιστικά μέτρα
Στην περιγραφική στατιστική εκτός από τους πίνακες και τα γραφήματα, ιδιαίτερη θέση έχουν κάποια αριθμοί που συμψηφίζουν και περιγράφουν ένα σύνολο δεδομένων. Αντιπροσωπευτικοί αριθμοί Παρακάτω θα γίνει ανάλυση τα σημαντικότερα από αυτά τα νούμερα που ονομάζονται περιγραφικά στατιστικά μέτρα ή στατιστικά μέτρα
33
μέτρα θέσης και κεντρικής τάσης
Στατιστικά μέτρα μέτρα θέσης και κεντρικής τάσης Περιγράφουν περιληπτικά τη θέση που έχουν τα δεδομένα πάνω στην ευθεία των πραγματικών αριθμών μέτρα διασποράς Εξετάζουν την τάση των δεδομένων να συγκεντρώνονται γύρω από το ένα μέσο όρο
34
Ένας εύκολος τρόπος για να περιγράψουμε το σύνολο των διαθέσιμων δεδομένων είναι οι μεσαίες τιμές, που βρίσκεται στο κέντρο. Ωστόσο κέντρο της κατανομής των δεδομένων μπορεί να εννοούμε διάφορα πράγματα. Η μέθοδος που μετράμε το κέντρο μπορεί να μας δώσει διάφορα μέτρα και να επηρεάσει τον τρόπο που ερμηνεύουμε τα δεδομένα.
35
Δείγμα & πληθυσμός
36
ΔΕΙΓμΑ: μΕΓΕΘΟΣ ΠΛΗΘΥΣμΟΥ: μέρος ενός πληθυσμού.
Το σύνολο των Στοιχείων του Πληθυσμού (σύμβολο: Ν).
37
Ένα δείγμα μπορεί να ληφθεί κατά "τυχαίο" ή μη τυχαίο τρόπο.
Τo "δείγμα" είναι μέρος ενός συνόλου που, συνήθως, καλείται "πληθυσμός". Ένα δείγμα μπορεί να ληφθεί κατά "τυχαίο" ή μη τυχαίο τρόπο. Στην περίπτωση τυχαίου δείγματος, επεκτείνουμε τα συμπεράσματα από τη μελέτη του δείγματος στον πληθυσμό. μόνο όταν έχουμε τη δυνατότητα τυχαίας δειγματοληψίας, μπορούμε πράγματι να κάνουμε χρήση των αρχών της Επαγωγικής Στατιστικής.
38
Είναι διαφορετική η επεξεργασία των αποτελεσμάτων από "μεγάλο" δείγμα, από ό,τι από "μικρό".
Ένα δείγμα θεωρείται μεγάλο όταν έχει τουλάχιστον 30 παρατηρήσεις.
39
Αθροίσματα ΚΑΝΟΝΕΣ ΑΘΡΟΙΣΕΩΣ Κανόνας 1. Αν α είναι μια σταθερή ποσότητα,τότε ισχύει η ισότητα:
40
Αθροίσματα ΚΑΝΟΝΕΣ ΑΘΡΟΙΣΕΩΣ Κανόνας 2. Αν α είναι μια σταθερή ποσότητα και Χi μια μεταβλητή ποσότητα, τότε ισχύει η ισότητα: Απόδειξη
41
Αθροίσματα ΚΑΝΟΝΕΣ ΑΘΡΟΙΣΕΩΣ Κανόνας 3. Αν α και β είναι σταθερές ποσότητες και xi μεταβλητή ποσότητα, τότε ισχύει η ισότητα:
42
Αθροίσματα ΚΑΝΟΝΕΣ ΑΘΡΟΙΣΕΩΣ Κανόνας 4. Αν xi και yi είναι μεταβλητές ποσότητες, τότε ισχύει η ισότητα:
43
Στατιστικά μέτρα Αντιπροσωπευτικοί αριθμοί
Συνοψίζουν τα χαρακτηριστικά μιας κατανομής Τα στατιστικά μέτρα χωρίζονται σε δύο γενικές κατηγορίες: μέτρα θέσης και κεντρικής τάσης και μέτρα διασποράς. Τα μέτρα θέσης περιγράφουν περιληπτικά τη θέση που έχουν τα δεδομένα πάνω στην ευθεία των πραγματικών αριθμών, ενώ τα μέτρα κεντρικής τάσης εξετάζουν την τάση των δεδομένων να συγκεντρώνονται γύρω από ένα μέσο όρο.
44
Στατιστικά μέτρα τάσης
α) μέσοι Κεντρικής Τάσεως : ο Αριθμητικός, ο Γεωμετρικός και β) μέσοι (παράμετροι) Θέσεως: η Διάμεσος, τα Τεταρτημόρια, τα Δεκατημόρια, η επικρατούσα τιμή
45
Απλός αριθμητικός μέσος
Το πιο κοινό μέτρο του κέντρου των δεδομένων είναι ο αριθμητικός μέσος (arithmetic mean) ή απλά μέσος (mean). Πρόκειται για ένα εύκολα υπολογιζόμενο μέτρο που συμβολίζεται: με το ελληνικό γράμμα μ εάν πρόκειται για το μέσο του πληθυσμού και με το λατινικό γράμμα εάν πρόκειται για το μέσο ενός δείγματος.
46
Απλός αριθμητικός μέσος
47
Εύρεση του μ.Ο. της ημερήσιας μεταβολής στην τιμή της μετοχής
Ημέρα μεταβολή τιμής Δευτέρα 0,12 Τρίτη 0,05 Τετάρτη -0,08 Πέμπτη -0,14 Παρασκευή -0,05 ΑΡΝΗΤΙΚΟ ΠΡΟΣΤΗμΟ: Κατά μέσο όρο μία πτώση στην ημερήσια τιμή της μετοχής.
48
Ο μΕΣΟΣ ΕΊΝΑΙ ΣΥΝΗΘΟΣ ΘΕΤΙΚΟΣ ΑΡΙΘμΟΣ, OμΩΣ μΠΟΡΕΙ ΝΑ ΕΊΝΑΙ ΚΑΙ ΑΡΝΗΤΙΚΟΣ ΑΝΑΛΟΓΑ μΕ ΤΟ ΠΏΣ ΕΧΟΥμΕ ΟΡΙΣΕΙ ΤΟ Χi. O μΕΣΟΣ ΕΊΝΑΙ ΕΝΑΣ ΑΡΙΘμΟΣ ΠΟΥ ΔΕΝ ΕΊΝΑΙ ΑΠΑΡΑΙΤΗΤΑ ΈΝΑ ΣΤΟΙΧΕΙΟ ΤΟΥ ΠΛΗΘΥΣμΟΥ.
49
Η μέση τιμή είναι το ’κέντρο ισορροπίας’ των δεδομένων.
Για να καταλάβουμε τη ϕυσική της σημασία ας ϕανταστούμε µία σανίδα πάνω στην οποία σκορπίζουμε ένα αριθμό n ίδιων ϐαριδιών. Το σημείο στήριξης της σανίδας (ώστε να ισορροπεί σε οριζόντια ϑέση) είναι η μέση τιμή της ϑέσης των ϐαριδιών πάνω στη σανίδα,
50
Έστω τα δεδομένα 1, 2, 4, 5 Να βρεθεί ο αριθμητικός μέσος-πληθυσμού
51
Να βρεθεί ο αριθμητικός μέσος-πληθυσμού
Έστω τα δεδομένα 1, 2, 4, 5 Να βρεθεί ο αριθμητικός μέσος-πληθυσμού
52
Έστω τα δεδομένα -1, 2, -4, 5, 3 Να βρεθεί ο αριθμητικός μέσος - πληθυσμού
53
Να βρεθεί ο αριθμητικός μέσος - πληθυσμού
Έστω τα δεδομένα -1, 2, -4, 5, 3 Να βρεθεί ο αριθμητικός μέσος - πληθυσμού
54
Τα γραπτά 20 μαθητών που έλαβαν μέρος σε ένα διαγλωνισμα στην στατιστική έχουν μέσο όρο βαθμολογίας 80%. Βγάζοντας έξω το χειρότερο γραπτό ο μ.Ο. ανεβαίνει στο 82% . Ποια ήταν η τελική βαθμολογία του γραπτού που αφαιρέσαμε;
55
Απάντηση
56
Ιδιότητες μέσου Αριθμητικού
α) Αν προσθέσουμε σε όλες τις τιμές μιας μεταβλητής Χ μια σταθερή ποσότητα c, τότε και ο μέσος αριθμητικός τους αυξάνεται κατά τη σταθερή αυτή ποσότητα.
57
Πρακτική Εφαρμογή Ας υποθέσουμε πως ο μέσος μηνιαίως μισθός των εργαζόμενων σε μία εταιρία είναι ευρώ. Εάν, όλοι οι εργαζόμενοι πάρουν αύξηση 150 ευρώ ποιος είναι ο νέος μέσος όρος; Απάντηση Ο νέος μ.Ο. θα είναι ευρώ. Εφόσον όλοι έχουν την ίδια αύξηση ..
58
β) Αν αφαιρέσουμε από όλες τις τιμές μιας μεταβλητής Χ μια σταθερή ποσότητα c, τότε και ο μέσος αριθμητικός τους ελαττώνεται κατά τη σταθερή αυτή ποσότητα
59
γ) Αν πολλαπλασιάσουμε όλες τις τιμές μιας μεταβλητής Χ με μια σταθερή ποσότητα c, τότε και ο μέσος αριθμητικός τους πολλαπλασιάζεται με τη σταθερή αυτή ποσότητα.
60
Ο αριθμητικός μέσος τιμών με συχνότητες
Σε πολλές περιπτώσεις οι τιμές εμφανίζονται σε συχνότητες, δηλαδή πολλές φορές η κάθε μία τιμή. Παράδειγμα: Να υπολογιστεί ο αριθμητικός μέσος
61
Ο αριθμός των παιδιών σε 250 οικογένειες
Αριθμός παιδιών Συχνότητα 56 1 71 2 52 104 3 29 87 4 24 96 5 11 55 6 36 7 Σύνολο
62
Επομένως, ο αριθμητικός μέσος είναι 1,82 .
63
Ο αριθμητικός μέσος τιμών ομαδοποιημένων – ταξινομημένων δεδομένων
1ο βήμα υπολογίζω την κεντρική τιμή κάθε ηλικιακής ομάδας Σύνολο
64
Να βρεθεί ο μέσος στα παρακάτω ομαδοποιημένα δεδομένα
Κλάσεις Συχνότητα 0 – 10 1 10 – 20 3 20 – 30
65
Να βρεθεί ο μέσος στα παρακάτω ομαδοποιημένα δεδομένα
Κλάσεις Συχνότητα xi fixi 0 – 10 1 5 5*1=5 10 – 20 3 15 45 20 – 30 25 Σύνολο 75
66
Μέσος Γεωμετρικός Εάν πολλαπλασιάσουμε όλες τις τιμές και πάρουμε τη - οστή ρίζα του γινομένου τότε έχουμε το γεωμετρικό μέσο ο οποίος συμβολίζεται με
67
Μέσος Γεωμετρικός ο μέσος αριθμητικός είναι πάντοτε μεγαλύτερος
Για τον υπολογισμό του μέσου γεωμετρικού χρησιμοποιούμε λογαριθμούς Λογαριθμούμε και τα δύο μέλη της σχέσεως ο μέσος αριθμητικός είναι πάντοτε μεγαλύτερος από το μέσο γεωμετρικό
68
Σταθμικός Γεωμετρικός μέσος
Εάν η κάθε τιμή εμφανίζεται με συχνότητα , τότε στον τύπο υπολογισμού του γεωμετρικού μέσου έχουμε:
69
Κυριότερες εφαρμογές του μέσου Γεωμετρικού
Ο υπολογισμός της μέσης ποσοστιαίας μεταβολής κυρίως οικονομικών χρονοσειρών. Επίσης, ο Γ.Μ. είναι κατάλληλος για την εύρεση της μέσης αύξησης ή γενικά της μέσης μεταβολής, καθώς επίσης και για την εύρεση του μέσου όρου κάποιων δεικτών.
70
Να βρεθεί ο γεωμετρικός μέσος
Έτος Τιμή Λόγος ετήσιας αύξησης 2002 1,25€ 2003 1,35€ 1,08 2004 1,44€ 1,07 2005 1,52€ 1,05 2006 1,62€ 2007 1,69€ 1,04 2008 1,74€ 1,03 2009 1,83€ 2010 1,90€ 2011 2,05€ 2012 2,30€ 1,12
71
Εάν θέλουμε να υπολογίσουμε τη μέση αύξηση της δεκαετίας τότε θα πρέπει να υπολογίσουμε το γεωμετρικό μέσο: Η μέση ετήσια ποσοστιαία αύξηση της τιμής του προϊόντος είναι περίπου 6,27%.
72
Χαρακτηριστικά μέσου αριθμητικού
Η τιμή του αριθμητικού μέσου επηρεάζεται από όλες τις τιμές της μεταβλητής ιδιαιτέρως από τις ακραίες τιμές Ο τύπος του αριθμητικού μέσου δύναται να χρησιμοποιηθεί αλγεβρικά καθώς αποτελεί εξίσωση Ο αριθμητικός μέσος βρίσκεται πάντοτε ανάμεσα στην ελάχιστη και μέγιστη τιμή της μεταβλητής.
73
Χαρακτηριστικά μέσου γεωμετρικού
Η τιμή του γεωμετρικού μέσου δεν επηρεάζεται τόσο πολύ από τις ακραίες τιμές όσο ο αριθμητικός μέσος – ανθεκτικό στις ακραίες τιμές Ο γεωμετρικός μέσος έχει νόημα και υπολογίζεται μόνο όταν οι τιμές της μεταβλητής είναι θετικοί αριθμοί. Δεν υπολογίζει μηδενικές τιμές. Ο τύπος του γεωμετρικού μέσου δύναται να χρησιμοποιηθεί αλγεβρικά
74
Αν μια κατανομή είναι συμμετρική ή κατά προσέγγιση συμμετρική
τότε ο μέσος αριθμητικός είναι το πιο αντιπροσωπευτικό στατιστικό μέτρο έκφρασης κεντρικής –μέσης τιμής Αν μια κατανομή είναι ασυμμετρική τότε πιθανώς ο μέσος αριθμητικός να μην είναι το πιο αντιπροσωπευτικό μέτρο Υπάρχουν αλλά στατιστικά μέτρα όπως Διάμεσος Επικρατούσα τιμή
75
Να βρεθεί ο Γεωμετρικός μέσος στην παρακάτω σειρά των δεδομένων
Να βρεθεί ο Γεωμετρικός μέσος στην παρακάτω σειρά των δεδομένων Ημερ/νιες X 20/7/2014 15 19/7/2014 13 0.15 18/7/2014 10 0.3 17/7/2014 11 -0.09 16/7/2014 12 -0.08 15/7/2014 9 0.33
76
Να βρεθεί ο Γεωμετρικός μέσος στην παρακάτω σειρά των δεδομένων
Ημερ/νιες X 20/7/2014 6 19/7/2014 5 18/7/2014 7 17/7/2014 4 16/7/2014 3 15/7/2014 1
77
Να βρεθεί ο Γεωμετρικός μέσος στην παρακάτω σειρά των δεδομένων
Να βρεθεί ο Γεωμετρικός μέσος στην παρακάτω σειρά των δεδομένων Ημερ/νιες X 20/7/2014 6 19/7/2014 5 0,2 18/7/2014 7 -0,2857 17/7/2014 4 0,75 16/7/2014 3 0,333 15/7/2014 1 2
78
Διάμεσος Η διάμεσος είναι, πολύ απλά, η μεσαία τιμή της κατανομής,
Η διάμεσος είναι, πολύ απλά, η μεσαία τιμή της κατανομής, εάν κατατάξουμε τις τιμές σύμφωνα με αύξουσα ή φθίνουσα σειρά. Συνήθως από τη μικρότερη προς τη μεγαλύτερη Η διάμεσος κατέχει την κεντρική θέση είναι η τιμή που χωρίζει τις τιμές της μεταβλητής σε δύο ισοπληθείς ομάδες. 50% κάτω της Διαμέσου και τα υπόλοιπα 50% πάνω. Η διάμεσος συμβολίζεται με μ η μd
79
Διάμεσος απλών δεδομένων
Τα δεδομένα διατάσσονται κατά αύξουσα σειρά Διακρίνουμε δύο περιπτώσεις: Όταν το πλήθος είναι μονός αριθμός, τότε υφίσταται μόνο μία τιμή της μεταβλητής που κατέχει την κεντρική θέση. 5, 9, 2, 7, 12 2, 5, 7, 9, Η διάμεσος βρίσκεται στη 3η θέση
80
Το πλήθος των τιμών είναι ζυγός αριθμός.
Υπάρχουν δύο τιμές. μεταξύ των δύο κεντρικών τιμών βρίσκεται η Διάμεσος. Η διάμεσος ισούται με το ημιάθροισμα των δύο "κεντρικών" τιμών - 5, 9, 7, 11, 99, 1 1, 5, 7, 9, 11, 99 Η διάμεσος βρίσκεται μεταξύ του 3ου και 4ου όρου
81
Να βρεθεί η διάμεσος στις παρακάτω τιμές
Χ: -1, 5, 1, 1, 4, 82, 9, 4
82
Να βρεθεί η διάμεσος στις παρακάτω τιμές
Χ: -1, 5, 1, 1, 4, 82, 9, 3 Κατατάσσουμε τα δεδομένα με σειρά Χ: -1, 1, 1, 3, 4, 5, 9, 82 Η διάμεσος ισούται με το ημιάθροισμα των δύο "κεντρικών" τιμών - -1, 1, 1, 3, 4, 5, 9, 82 Η διάμεσος βρίσκεται μεταξύ του 4ου και 5ου όρου
83
Διάμεσος ομαδοποιημένων δεδομένων
Εντοπίζεται Ν/2=50 Επομένως μd=3
84
Να βρεθεί η διάμεσος των παρακάτω δεδομένων:
1 2 3 5 4 Σύνολο 15
85
1 2 3 5 10 4 13 15 Σύνολο
86
Διάμεσος ταξινομημένων δεδομένων
Διάμεσος ταξινομημένων δεδομένων Ν/ η θέση – αθροιστική σειρά που εντοπίζουμε τη διάμεσο xi = το κάτω όριο της τάξεως που βρίσκεται η διάμεσος δ = το διάστημα της τάξης που βρίσκεται η διάμεσος fi =η συχνότητα της τάξης που βρίσκεται η διάμεσος Fi-1 = η αμέσως μικρότερη αθροιστική συχνότητα από αυτή που έχουμε εντοπίσει τη διάμεσο.
87
xi = το κατώτερο όριο της τάξης =370 δ = το διάστημα της τάξης 10
Αρχίζουμε με το υπολογισμό του Ν/2 Fi-1 Εντοπίζεται στην αθρ συχν xi = το κατώτερο όριο της τάξης =370 δ = το διάστημα της τάξης 10 fi = η συχνότητα της τάξης που εντοπίζεται=44 Ν =το σύνολο των συχνοτήτων =100 Fi-1=η αμέσως μικρότερη από το F που εντοπίζεται
88
Κλάσεις Συχνότητα 0 – 10 1 10 – 20 3 20 – 30 5 30 – 40 40 - 50 2
Να βρεθεί η Διάμεσος; Κλάσεις Συχνότητα 0 – 10 1 10 – 20 3 20 – 30 5 30 – 40 2
89
Αθροιστική συχνότητα F
Κλάσεις Συχνότητα f Αθροιστική συχνότητα F 0 – 10 2 10 – 20 3 5 20 – 30 10 30 – 40 13 15 Σύνολο
90
Κλάσεις Συχνότητα 0 – 4 1 4 – 8 2 8 – 12 4 12– 16 16- 20
Να βρεθεί η Διάμεσος; Κλάσεις Συχνότητα 0 – 4 1 4 – 8 2 8 – 12 4 12– 16 16- 20
91
Τεταρτημόρια Το πρώτο Τεταρτημόριο συμβολίζεται με το Q1
είναι η τιμή εκείνη της μεταβλητής που χωρίζει τα δεδομένα στο 25% και στο 75 % του συνόλου των τιμών. Κάτω από το Q1 βρίσκεται το 25 % των δεδομένων και πάνω από την τιμή αυτή το 75 %. Το δεύτερο τεταρτημόριο είναι η Διάμεσος. Το τρίτο τεταρτημόριο συμβολίζεται με το Q3 Κάτω από το Q3 βρίσκεται το 75 % των δεδομένων και πάνω από την τιμή αυτή το 25 %.
92
Διατάσσουμε τα δεδομένα. Χρησιμοποιούμε τους εξής τύπους:
Απλά Δεδομένα Διατάσσουμε τα δεδομένα. Χρησιμοποιούμε τους εξής τύπους: το πρώτο τεταρτημόριο εντοπίζεται στη θέση PN=0,25*N, το τρίτο τεταρτημόριο εντοπίζεται στη θέση PN=0,75*N, Αν το παραπάνω αποτέλεσμα είναι δεκαδικός τότε το στρογγυλοποιούμε προς τον αμέσως μεγαλύτερο Αν το παραπάνω αποτέλεσμα είναι ακέραιος τότε το ποσοστιαίο σημείο είναι το ημιάθροισμα αυτού του ακέραιου με τον αμέσως επόμενο στη σειρά
93
Τεταρτημόρια Q1=PN=0,25*N=0,25*12=3
12,17,22,45,23,11,23,56,90,2,44,78 Θέτουμε τα δεδομένα κατά αύξουσα σειρά 2, 11, 12, 17, 22, 23, 23, 44, 45, 56, 78, 90 Αν το παραπάνω αποτέλεσμα είναι ακέραιος τότε το ποσοστιαίο σημείο είναι το ημιάθροισμα αυτού του ακέραιου με τον αμέσως επόμενο στη σειρά
95
Να βρεθεί το Q1 στην παρακάτω κατανομή
1, 1, 3 , -5, -23, 11, 23, 56, 1022
96
Να βρεθεί το Q1 στην παρακάτω κατανομή
1, 1, -5, -23, 11, 23, 56, 1022 Λύση Θέτουμε τα δεδομένα κατά αύξουσα σειρά -23, -5, 1, 1, 11, 23, 56, 1022 =6*0,25=2 Αν το παραπάνω αποτέλεσμα είναι ακέραιος τότε το ποσοστιαίο σημείο είναι το ημιάθροισμα αυτού του ακέραιου με τον αμέσως επόμενο στη σειρά
97
Τεταρτημόρια Να βρεθεί το Q1 στην παρακάτω κατανομή
Q1=PN=0,25*N=0,25*100=25
98
Τεταρτημόρια Q3=PN=0,75*N=0,75*12=9
12,17,22,45,23,11,23,56,90,2,44,78 Θέτουμε τα δεδομένα κατά αύξουσα σειρά 2, 11, 12, 17, 22, 23, 23, 44, 45, 56, 78, 90 Αν το παραπάνω αποτέλεσμα είναι ακέραιος τότε το ποσοστιαίο σημείο είναι το ημιάθροισμα αυτού του ακέραιου με τον αμέσως επόμενο στη σειρά
99
Τεταρτημόρια Να βρεθεί το Q3 στην παρακάτω κατανομή
Q3=PN=0,75*N=0,75*100=75
100
Τεταρτημόρια Για τον υπολογισμό των τεταρτημορίων χρησιμοποιούμε τους εξής τύπους: β) Για ταξινομημένα δεδομένα σε κατανομή συχνοτήτων χρησιμοποιούνται οι τύποι:
101
xi = το κατώτερο όριο της τάξης =50 δ = το διάστημα της τάξης 10
Fi-1 Εντοπίζεται στην αθρ συχν xi = το κατώτερο όριο της τάξης =50 δ = το διάστημα της τάξης 10 fi = η συχνότητα της τάξης που εντοπίζεται=19 Ν = σύνολο δεδομένων =100 Fi-1=17 η αμέσως μικρότερη από το F που εντοπίζεται
102
xi = το κατώτερο όριο της τάξης =50 δ = το διάστημα της τάξης 10
Fi-1 Εντοπίζεται στην αθρ συχν xi = το κατώτερο όριο της τάξης =50 δ = το διάστημα της τάξης 10 fi = η συχνότητα της τάξης που εντοπίζεται=19 Ν = σύνολο δεδομένων =100 Fi-1=17 η αμέσως μικρότερη από το F που εντοπίζεται
103
Να βρεθούν τα τεταρτημόρια στα παρακάτω δεδομένων:
κλάσεις 0-10 10-20 20-30 30-40 40-50 Σύνολο 2 3 5 15
104
Υπολογίζουμε την αθροιστική σειρά: Κλάσεις
0 – 10 2 10 – 20 3 5 20 – 30 10 30 – 40 13 15 Σύνολο
105
Υπολογίζουμε την αθροιστική σειρά: Κλάσεις
0 – 10 2 10 – 20 3 5 20 – 30 10 30 – 40 13 15 Σύνολο
106
Επικρατούσα τιμή Επικρατούσα τιμή (Mode) συμβολίζεται μο
είναι η τιμή η οποία εμφανίζεται πιο συχνά στα δεδομένα. Είναι πιθανόν σε μία κατανομή να μην έχουμε καμία τιμή που να εμφανίζεται πάνω από μία φορά, οπότε δεν υπάρχει επικρατούσα τιμή
107
Η δειγµατική επικρατούσα τιµή χρησιµοποιείται επίσης για να δηλώσει την κεντρική τάση των δεδοµένων κι ορίζεται ως η τιµή που εµφανίζεται µε τη µεγαλύτερη συχνότητα. Αν υπάρχουν πάνω από µία τέτοιες τιµές, τότε όλες αυτές ϑεωρούνται επικρατούσες τιµές. Είναι ϕανερό πως η επικρατούσα τιµή δεν έχει νόηµα όταν το δείγµα δεν αποτελείται από διακεκριµένες επαναλαµβανόµενες τιµές. Η δειγµατική µέση τιµή είναι το πιο σηµαντικό από τα τρία µέτρα κεντρικής τάσης και ϑα µας απασχολήσει ιδιαίτερα καθώς ϑα τη χρησιµοποιήσουµε στη στατιστική συµπερασµατολογία για να ϐγάλουµε συµπεράσµατα για τη µέση τιµή µ του πληθυσµού.
108
Για τον υπολογισµό της µέσης τιµής χρησιµοποιούνται όλες οι τιµές του δείγµατος, ενώ γι- α τη διάµεσο µόνο η τάξη τους. Γι αυτό και η µέση τιµή επηρεάζεται από µακρινές τιµές αλλά η διάµεσος όχι. ΄Οταν η κατανοµή των αριθµητικών δεδοµένων είναι µονοκόρυφη και συµµετρική, τότε και τα τρία µέτρα κεντρικής τάσης συµπίπτουν. Η ύπαρξη µακρινών παρατηρήσεων στο δείγµα δυσκολεύει τη στατιστική περιγραφή κι ανάλυση. Γι αυτό πριν προχωρήσουµε ϑα πρέπει να αποφασίσουµε αν ϑα συµπεριλάβουµε τη µακρινή παρατήρηση (αν πιστεύουµε ότι είναι σωστή) ή αν ϑα την αγνοήσουµε (αν έχουµε λόγους να πιστεύουµε ότι δεν είναι ακριβής).
109
X 10 12 7 5 21 4 Επικρατούσα τιμή μο = 7
110
Να βρεθεί το πρώτο και τρίτο τεταρτημόριο στα
παρακάτω δεδομένα Χ Συχνότητα f 1 2 3 5 4 Σύνολο 15
111
Κλάσεις Συχνότητα f 0 – 10 2 10 – 20 3 20 – 30 5 30 – 40 40 – 50
Να βρεθούν τα τεταρτημόρια στα παρακάτω δεδομένων Κλάσεις Συχνότητα f 0 – 10 2 10 – 20 3 20 – 30 5 30 – 40 40 – 50 Σύνολο 15
112
για τη διασπορά των τιμών γύρω από το μέσο
Τα στατιστικά μέτρα θέση και τάσης δεν επαρκούν για την πλήρη περιγραφή της κατανομής μιας μεταβλητής δεν παρέχουν πληροφορίες για τη διασπορά των τιμών γύρω από το μέσο ούτε για τη μορφή της κατανομής που αντιπροσωπεύουν. Για να περιγραφεί ικανοποιητικά μια κατανομή θα πρέπει να μελετηθούν: 1) Κεντρική Τάση, 2) Διασπορά, 3) Ασυμμετρία και 4) Κύρτωση.
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.