Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεΛαδων Μάγκας Τροποποιήθηκε πριν 9 χρόνια
1
ΣΤΑΤΙΣΤΙΚΗ Η επιστήμη που ασχολείται με την συλλογή δεδομένων,ανάλυση και ερμηνεία αυτών Η επιστήμη με τη χρήση της οποίας λαμβάνουμε αποφάσεις κάτω από συνθήκες αβεβαιότητας Βασικό γνώρισμα των διαφόρων πειραμάτων η μεταβλητότητα των δεδομένων
2
Η επεξεργασία των εισαγόμενων δεδομένων με το κατάλληλο θεωρητικό υπόβαθρο και την χρήση των στατιστικών πακέτων οδηγεί στην εξαγωγή των αποτελεσμάτων και την ερμηνεία αυτών
3
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: ένα σύνολο στοιχείων που μας ενδιαφέρει να μελετήσουμε Δείγμα: υποσύνολο ενός πληθυσμού Παράμετρος: αριθμητική ποσότητα που εκφράζει ένα χαρακτηριστικό του πληθυσμού Στατιστική συνάρτηση: μια συνάρτηση των στοιχείων του δείγματος
4
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Στατιστική μεταβλητή: μια καλά ορισμένη μετρήσιμη έκφραση ενός χαρακτηριστικού του πληθυσμού που μας ενδιαφέρει Σκοπός είναι η χρησιμοποίηση ενός δείγματος για την εκτίμηση των παραμέτρων του προβλήματος μέσω στατιστικής συμπερασματολογίας και η αναγωγή των αποτελεσμάτων στον πληθυσμό ΔΕΙΓΜΑ ΠΛΗΘΥΣΜΟΣ Εκτίμηση παραμέτρων Στατιστική συμπερασματολογία
5
ΕΙΔΗ ΔΕΔΟΜΕΝΩΝ Ποιοτικά:
Τα δεδομένα παίρνουν διακριτές τιμές και ανήκουν σε κατηγορίες Έμφαση στη συχνότητα κάθε κατηγορίας Χωρίζονται σε δεδομένα διάταξης ή ονομαστικής κλίμακας Ποσοτικά: Τα δεδομένα των οποίων οι μεταβλητές παίρνουν πάντα συνεχείς τιμές Αριθμητικές παρατηρήσεις Χωρίζονται σε δεδομένα διαστήματος ή λόγου
6
ΠΟΙΟΤΙΚΑ ΔΕΔΟΜΕΝΑ Παραδείγματα Οικογενειακή κατάσταση
(παντρεμένη, ανύπαντρη, χωρισμένη) Βαθμολογία στο μάθημα της στατιστικής (κακή, μέτρια, καλή, πολύ καλή, άριστη) Ακτινοβολία κινητών (ελάχιστη, μερική, υψηλή) Επίπεδα εκπαίδευσης (μέση, ανώτερη, ανώτατη)
7
ΠΟΣΟΤΙΚΑ ΔΕΔΟΜΕΝΑ Παραδείγματα Μέτρηση του ύψους των ανθρώπων
Μέτρηση του βάρους των ανθρώπων Μέτρηση του εισοδήματος κάθε οικογένειας Αριθμός γεννήσεων σε κάθε νομό της Ελλάδος Συνολικά κέρδη εταιρειών από το χρηματιστήριο
8
ΠΕΡΙΓΡΑΦΗ ΔΕΔΟΜΕΝΩΝ Γραφική
Περιγραφή μέσω γραφικής απεικόνισης των δεδομένων Ενδιαφέρει η κατανομή τους, δηλαδή πως ταξινομούνται αυτά Αριθμητική Περιγραφή μέσω αριθμητικών ποσοτήτων Είναι συνήθως τιμές συναρτήσεων
9
ΠΑΡΑΔΕΙΓΜΑ ΓΙΑ ΠΟΣΟΤΙΚΑ ΔΕΔΟΜΕΝΑ
Το ετήσιο κέρδος μικρομεσαίας εταιρείας από το 1961 έως το 2000 παρουσιάζεται στον παρακάτω πίνακα:(σε χιλιάδες Ευρώ)
10
ΠΕΡΙΓΡΑΦΗ ΜΕ ΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΥΣ
Διάγραμμα σημείων – DOT DIAGRAM Eυθύγραμμο τμήμα πάνω στο οποίο τοποθετούνται οι διαθέσιμες τιμές Αν υπάρχουν ίδιες τιμές τοποθετούνται η μία πάνω στην άλλη
11
Διάγραμμα μίσχου φύλλου - Stem and leaf plot
Γράφημα στο οποίο χωρίζεται κάθε παρατήρηση σε δυο μέρη (μίσχος, φύλλο) Ομαδοποίηση των δεδομένων βάσει κοινού μίσχου
12
Ιστόγραμμα - Histogram
Γράφημα κατανομής των συχνοτήτων των δεδομένων Χωρισμός δεδομένων σε ίσου μήκους διαστήματα και καταγραφή συχνότητας σε κάθε διάστημα
13
Πολύγωνο συχνότητας – Frequency polygon
Ίδιος τρόπος παρουσίασης και κατασκευής με το ιστόγραμμα Σημειώνεται η συχνότητα πάνω από τον μέσο κάθε διαστήματος Τα διαδοχικά σημεία ενώνονται με γραμμή
14
Πολύγωνο αθροιστικής συχνότητας – cumulative frequency polygon
Ίδιος τρόπος παρουσίασης με το πολύγωνο συχνότητας Υπολογίζεται αθροιστικά η συχνότητα κάθε κατηγορίας
15
ΠΑΡΑΔΕΙΓΜΑ ΓΙΑ ΠΟΙΟΤΙΚΑ ΔΕΔΟΜΕΝΑ
Αριθμός εταιρειών που εισήχθησαν σε συγκεκριμένους κλάδους χρηματιστηρίου ανά κατηγορία
16
Κυκλικό διάγραμμα – Pie chart
Γράφημα για ποιοτικά δεδομένα Εύρεση ποσοστού κάθε κατηγορίας Χωρισμός κύκλου σε τομείς ανάλογα με κάθε ποσοστό
17
Ραβδόγραμμα – Bar chart
Γράφημα για ποιοτικά δεδομένα Εύρεση συχνότητας κάθε κατηγορίας Κατασκευή ράβδων ανάλογα με κάθε συχνότητα
18
ΠΕΡΙΓΡΑΦΗ ΜΕ ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟΔΟΥΣ
Αριθμητικός μέσος: ενός συνόλου n παρατηρήσεων είναι ο μέσος του δείγματος Επηρεάζεται από ακραίες τιμές Αποτελεί εκτίμηση του μέσου μ του πληθυσμού Τύπος υπολογισμού:
19
Υπολογισμός μέσου του παραπάνω παραδείγματος με το ετήσιο κέρδος εταιρείας:
Άρα το μέσο ετήσιο κέρδος της εταιρείας για τα χρόνια 1961 έως 2000 είναι χιλιάδες ευρώ
20
Σταθμισμένος αριθμητικός μέσος – Weighted Mean: ενός συνόλου n παρατηρήσεων είναι ο αριθμητικός μέσος που προκύπτει σταθμίζοντας κάθε παρατήρηση με συγκεκριμένη βαρύτητα w Αν όλες οι σταθμίσεις είναι ίδιες τότε προκύπτει ο αριθμητικός μέσος Τύπος υπολογισμού:
21
Σταθμίζοντας κάθε παρατήρηση του παραπάνω παραδείγματος ανά δεκαετία με σταθμίσεις αντίστοιχα εκφράζοντας αντίστοιχα το ποσοστό των κερδών που διατέθηκαν για επενδύσεις στο χρηματιστήριο Υπολογισμός σταθμισμένου μέσου: Άρα το μέσο σταθμισμένο κέρδος ανά δεκαετία που διατίθεται για επένδυση στο χρηματιστήριο είναι ίσο με ,69
22
Γεωμετρικός μέσος – Geometric mean: ενός συνόλου n παρατηρήσεων είναι η νιοστή ρίζα του γινομένου των παρατηρήσεων Δεν χρησιμοποιείται όταν υπάρχουν μηδενικές τιμές παρατηρήσεων Μέτρο ανθεκτικό στις ακραίες τιμές Τύπος υπολογισμού: Υπολογισμός γεωμετρικού μέσου: Το μέσο γεωμετρικό ετήσιο κέρδος της εταιρείας για την περίοδο 1961 έως 2000 είναι περίπου ίσο με χιλιάδες ευρώ
23
Αρμονικός μέσος – Harmonic mean: ενός συνόλου n παρατηρήσεων είναι το αντίστροφο του αριθμητικού μέσου των αντίστροφων παρατηρήσεων Μέτρο κατάλληλο για ρυθμούς μεταβολής Τύπος υπολογισμού:
24
Υπολογισμός αρμονικού μέσου του παραπάνω παραδείγματος:
Άρα το μέσο αρμονικό ετήσιο κέρδος της εταιρείας για την περίοδο 1961 έως 2000 είναι ,08 χιλιάδες ευρώ
25
Διάμεσος – median: ενός συνόλου n διατεταγμένων κατ’ αύξουσα σειρά παρατηρήσεων είναι η κεντρική τιμή αν n περιττός και το ημιάθροισμα των δυο κεντρικών παρατηρήσεων αν n άρτιος Μέτρο κατάλληλο για ποσοτικά δεδομένα Ανθεκτικό στις ακραίες τιμές
26
Υπολογισμός διαμέσου: (άρτιος αριθμός παρατηρήσεων)
Άρα το διάμεσο ετήσιο κέρδος της εταιρείας για την περίοδο 1961 έως 2000 είναι ίσο με χιλιάδες ευρώ
27
Επικρατούσα τιμή – mode: ενός συνόλου n παρατηρήσεων είναι η παρατήρηση με την μεγαλύτερη συχνότητα εμφάνισης Δεν είναι απαραίτητο να υπάρχει Μπορεί να υπάρχουν περισσότερες της μιας Υπολογισμός επικρατούσας τιμής: Οι τιμές των παρατηρήσεων με τη μεγαλύτερη συχνότητα είναι οι (6η και 7η), (9η και 10η) και (31η και 32η παρατήρηση)
28
Διασπορά – variance: ενός συνόλου n παρατηρήσεων είναι η τιμή εκείνη που δείχνει τον βαθμό απλώματος των δεδομένων από την μέση τιμή Αποτελεί εκτίμηση της διακύμανσης του πληθυσμού Τύπος υπολογισμού:
29
Υπολογισμός διασποράς των δεδομένων του παραπάνω παραδείγματος:
Άρα το μέσο τετραγωνικό ετήσιο κέρδος της εταιρείας για την περίοδο 1961 έως 2000 είναι τετραγωνικές χιλιάδες ευρώ
30
Εύρος – Range: ενός συνόλου n παρατηρήσεων είναι η διαφορά της ελάχιστης τιμής από την μέγιστη τιμή
Επηρεάζεται από ακραίες τιμές Εύκολος υπολογισμός Τύπος υπολογισμού: Υπολογισμός εύρους του παραπάνω παραδείγματος: Άρα το εύρος του ετήσιου κέρδους της εταιρείας την περίοδο 1961 έως 2000 είναι χιλιάδες ευρώ
31
Τυπική απόκλιση – standard deviation: ενός συνόλου n παρατηρήσεων είναι η θετική τετραγωνική ρίζα της διακύμανσης Τύπος υπολογισμού: Υπολογισμός τυπικής απόκλισης των δεδομένων του παραπάνω προβλήματος: Άρα η τυπική απόκλιση του ετήσιου κέρδους είναι χιλιάδες ευρώ
32
Μέση απόλυτη απόκλιση – mean absolute deviation: ενός συνόλου N παρατηρήσεων είναι ο μέσος των απόλυτων αποκλίσεων των παρατηρήσεων από την μέση τιμή Ανθεκτικό σε ακραίες τιμές Τύπος υπολογισμού:
33
Υπολογισμός της μέσης απόλυτης απόκλισης για το παραπάνω πρόβλημα:
Άρα η μέση απόλυτη απόκλιση για το ετήσιο κέρδος της εταιρείας είναι ίση με ,93 χιλιάδες ευρώ
34
Συντελεστής μεταβλητότητας – variation coefficient : είναι ο συντελεστής εκείνος ο οποίος μετρά το βαθμό απλώματος των παρατηρήσεων σε σχέση με το μέσο Συντελεστής μεταβλητότητας για τον πληθυσμό είναι ο Συντελεστής μεταβλητότητας για το δείγμα είναι ο Μερικές φορές πολλαπλασιάζεται με το 100 και συνεπώς εκφράζει ποσοστό Σύγκριση περιπτώσεων όπου οι μονάδες είναι διαφορετικές
35
Υπολογισμός του συντελεστή μεταβλητότητας για τα δεδομένα του παραδείγματος:
Άρα συμπεραίνουμε ότι η μεταβλητότητα του ετήσιου κέρδους της εταιρείας για την περίοδο από 1961 έως 2000 σε σχέση με το μέσο ετήσιο κέρδος είναι ίση με 18,3%
36
Ποσοστιαία σημεία – quantiles: ενός συνόλου διατεταγμένων παρατηρήσεων είναι αριθμοί οι οποίοι χωρίζουν το δείγμα σε ομάδες με όσο το δυνατόν ίσο αριθμό παρατηρήσεων Υπάρχουν εκατοστημόρια, δεκατημόρια κτλ Τεταρτημόρια: πρώτο τεταρτημόριο δεύτερο τεταρτημόριο τρίτο τεταρτημόριο Χωρίζουν την κατανομή σε τέσσερα ίσα μέρη Το είναι η διάμεσος
37
Υπολογισμός ποσοστιαίων σημείων (τεταρτημόρια) του παραπάνω παραδείγματος:
Έχοντας διατάξει τα δεδομένα του παραδείγματος κατ’ αύξουσα σειρά τα χωρίζουμε σε τέσσερα ίσα μέρη βάσει τάξης μεγέθους (Ν).Αντίστοιχα: Άρα το πρώτο τεταρτημόριο είναι το = και το τρίτο τεταρτημόριο είναι το = Το δεύτερο τεταρτημόριο είναι η διάμεσος δ=
38
Ενδοτεταρτημοριακό εύρος – interquartile range : ενός συνόλου n παρατηρήσεων είναι η διαφορά του πρώτου από το τρίτο τεταρτημόριο Δεν επηρεάζεται από ακραίες τιμές Τύπος υπολογισμού: Υπολογισμός ενδοτεταρτημοριακού εύρους των δεδομένων του παραδείγματος Άρα η απόκλιση των δεδομένων από την διάμεσο είναι ίση με χιλιάδες ευρώ
39
Τυποποιημένος συντελεστής ασυμμετρίας – standardized coefficient of skewness: ενός συνόλου n παρατηρήσεων ονομάζεται η αριθμητική ποσότητα Αν Α>0 τότε θετική ή δεξιά ασυμμετρία Αν Α=0 τότε συμμετρία Αν Α<0 αρνητική ή αριστερή ασυμμετρία
40
Είδη κατανομών ως προς τη συμμετρία
Συμμετρική κατανομή
41
Δεξιά ασύμμετρη ή θετική ασύμμετρη
42
Αριστερή ή αρνητική ασύμμετρη
43
Συντελεστής κύρτωσης – coefficient of kurtosis: ενός συνόλου παρατηρήσεων ονομάζεται η αριθμητική ποσότητα Αν Β=0 τότε η κατανομή είναι μεσόκυρτη Αν Β>0 τότε η κατανομή είναι λεπτόκυρτη Αν Β<0 τότε η κατανομή είναι πλατύκυρτη
44
Είδη κατανομών ως προς την κύρτωση
Λεπτόκυρτη κατανομή
45
Πλατύκυρτη κατανομή
46
Μεσόκυρτη κατανομή
47
Υπολογισμός συντελεστή ασυμμετρίας και συντελεστή κύρτωσης στο παραπάνω παράδειγμα:
Ο συντελεστής ασυμμετρίας στο παράδειγμα είναι ίσος με 1,218 Άρα η κατανομή είναι θετικά ασύμμετρη Ο συντελεστής κύρτωσης είναι ίσος με 2,35 Άρα η κατανομή του παραδείγματος είναι λεπτόκυρτη
48
Διάγραμμα πλαισίου απολήξεων – boxplot
Διάγραμμα για ποσοτικά δεδομένα Δίνει πληροφορίες σχετικά με τα εξής μέτρα: Το 50% των τιμών βρίσκεται μέσα στο πλαίσιο ενώ 25% στην αριστερή απόληξη και 25% στην δεξιά απόληξη Διευκολύνει αρκετές συγκρίσεις δεδομένων Δίνει ενδείξεις για ύπαρξη ή όχι ασυμμετρίας
49
Υπολογισμός διαγράμματος πλαισίου και απολήξεων για το προαναφερθέν παράδειγμα:
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.