Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεActeon Petras Τροποποιήθηκε πριν 10 χρόνια
1
Η ΕΝΝΟΙΑ «ΣΤΑΤΙΣΤΙΚΗ» Στατιστική είναι η επιστήμη που ασχολείται με τη συγκέντρωση, την παρουσίαση και την εν συνεχεία επεξεργασία της πληροφορίας με την εξαγωγή κατάλληλων συμπερασμάτων. Η ρίζα της λέξης «Στατιστική» αναζητείται στη λατινική λέξη «Status» (καθεστώς, κοινωνία, κράτος) και παραπέμπει στην καταγραφή και αρχειοθέτηση ποσοτικών μεγεθών. Σε θεωρητικό επίπεδο η Στατιστική είναι Μαθηματικά αλλά στο επίπεδο της εφαρμογής χρησιμοποιεί το πλαίσιο όλων σχεδόν των γνωστικών περιοχών. Επιδημιολογικές μελέτες, κλινικές δοκιμές φαρμάκων, ποιοτικός έλεγχος προϊόντων, αξιολόγηση οικολογικών συστημάτων είναι μερικές μόνο περιπτώσεις στις οποίες η Στατιστική συνεργάζεται επιτυχώς με άλλες επιστήμες.
2
Η ΚΑΤΑΓΡΑΦΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΙ ΤΑ ΔΕΔΟΜΕΝΑ
Η ανάγκη καταγραφής της πληροφορίας οδήγησε στη δημιουργία οργανωμένων στατιστικών υπηρεσιών υπεύθυνων για τις διάφορες μετρήσεις αλλά και για την οργανωμένη αρχειοθέτηση και αποθήκευση όλων των συγκεντρωμένων στοιχείων. Η ανάπτυξη της τεχνολογίας των υπολογιστών έφερε μία έκρηξη στη συγκέντρωση πληροφοριακού υλικού και τροφοδότησε την ανάγκη της αξιολόγησης και της χρήσης του. Η Περιγραφική Στατιστική είναι το επιστημονικό εργαλείο για τη συγκέντρώση, την ταξινόμηση και την παρουσίαση των πρωτογενών δεδομένων. Δεδομένα (Data) θεωρούμε συγκεκριμένες πληροφορίες (στοιχεία, γεγονότα) που μπορούν να χρησιμοποιηθούν για περαιτέρω σκέψεις και αποφάσεις.
3
Η ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΚΑΙ ΟΙ ΦΑΣΕΙΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΩΝ ΔΕΔΟΜΕΝΩΝ
Η Στατιστική Συμπερασματολογία καθιστά δυνατή την προσέγγιση χαρακτηριστικών του συνόλου των δεδομένων από τη μελέτη ενός μικρού υποσυνόλου τους. Σε γενικές γραμμές η επεξεργασία των δεδομένων γίνεται σε δύο φάσεις: 1η Φάση: Άθροιση και σύνοψη των δεδομένων. Είναι ο στόχος της Περιγραφικής Στατιστικής και γίνεται με τη χρήση πινάκων (π.χ.συχνοτήτων, διπλής εισόδου) γραφημάτων (π.χ. ραβδόγραμμα, θηκόγραμμα, διάγραμμα διασποράς) και στατιστικών μέτρων (π.χ. μέτρα κεντρικής τάσης και μεταβλητότητας). 2η φάση: Εξαγωγή, από τα δεδομένα, νόμων, κανόνων και συμπερασμάτων των οποίων η ισχύς να ξεπερνά το επίπεδο των παρατηρήσεων που διαθέτουμε. Είναι ο στόχος της Στατιστικής Συμπερασματολογίας (ή Μαθηματικής Στατιστικής).
4
ΤΟ ΜΑΘΗΜΑΤΙΚΟ ΜΟΝΤΕΛΟ Το βασικό εργαλείο της δεύτερης φάσης είναι η Θεωρία Πιθανοτήτων που μας βοηθάει στην κατασκευή κατάλληλων μαθηματικών μοντέλων. Τα μοντέλα αποτελούν την πιο διαδεδομένη μέθοδο για την περιγραφή ενός φυσικού ή κοινωνικού φαινομένου (ή συστήματος). Είναι μία προσομοίωση της πραγματικότητας. Η πολυπλοκότητα των συστημάτων μας οδηγεί σε παραδοχές και απλοποιήσεις. Η βασική μας απαίτηση είναι το «μαθηματικό» και το «πραγματικό» σύστημα να είναι ισόμορφα σε όλα τα σημαντικά θέματα που σχετίζονται με το πρόβλημα που μελετάμε. Η επιτυχία ενός μαθηματικού μοντέλου έγκειται στην κατάλληλη χρήση της παραδοχής και της απλοποίησης ώστε να παρέχει όσον το δυνατόν περισσότερη από την «πραγματικότητα», δημιουργώντας ένα εξυπηρετικό μαθηματικό υποκατάστατο του συστήματος. Στα περισσότερα συστήματα η μεταβλητότητα αποτελεί κύριο χαρακτηριστικό και ενυπάρχει με την«τυχαιότητα». Στοχαστικά φαινόμενα είναι π.χ. ρίψη ζαριού, φύλο νεογέννητου παιδιού κλπ. Με το μοντέλο που κατασκευάζουμε διατυπώνουμε τη δικιά μας θεωρία-υπόθεση που μπορεί να αφορά την πιθανότητα εμφάνισης ενός γεγονότος, την εξάρτηση μεταξύ διαφόρων παραγόντων κλπ.
5
ΜΕΤΑΒΛΗΤΕΣ, ΠΛΗΘΥΣΜΟΣ ΚΑΙ ΔΕΙΓΜΑ
Κάθε φαινόμενο εξελίσσεται σε υποκείμενα δηλαδή σε αυτόνομες μονάδες παρατήρησης, το σύνολο των οποίων ορίζει τον πληθυσμό αναφοράς. Το φαινόμενο αναλύεται σε επιμέρους μετρήσιμα χαρακτηριστικά, τις μεταβλητές στις οποίες αντιστοιχούμε τιμές. Η αντιστοίχηση καλείται μέτρηση και γίνεται είτε «αντικειμενικά» με τη χρήση επιστημονικών οργάνων είτε «υποκειμενικά» π.χ. με τη χρήση ερωτηματολογιών. Στην κατασκευή ενός μοντέλου η μελέτη είναι σίγουρο ότι είναι μερική. Π.χ. δεν είναι δυνατόν να μελετήσουμε όλους τους ανθρώπους για να κατασκευάσουμε ένα μοντέλο για το ύψος τους. Σ’ αυτό το σημείο έρχεται η Στατιστική Συμπερασματολογία να διαψεύσει ή να επιβεβαιώσει την υπόθεση-θεωρία που διατυπώθηκε με το μοντέλο στη βάση των όσων προκύπτουν ως στοιχεία από το υπό-μελέτη υποσύνολο του πληθυσμού που στη Στατιστική καλείται δείγμα (sample).
6
ΣΥΝΟΨΙΖΟΝΤΑΣ... Η συνηθισμένη προσέγγιση σε ένα πρόβλημα που απαιτεί στατιστική ανάλυση είναι η οργάνωση των παρατηρήσεων και η διατύπωση της υπόθεσης-θεωρίας, γενικότερα του μαθηματικού μοντέλου. Συστατικά αυτής της προσέγγισης είναι: ο πληθυσμός το δείγμα η μεταβλητή η μέτρηση τα όργανα μέτρησης το μοντέλο
7
Ο ΠΛΗΘΥΣΜΟΣ Σύνολο ατόμων ή αντικειμένων ή οποιονδήποτε άλλων οντοτήτων για τα οποία ενδιαφερόμαστε να εξάγουμε συμπεράσματα σε σχέση με κάποιες ιδιότητες που αφορούν τα στοιχεία τους. Ο πληθυσμός πρέπει να είναι καλά ορισμένος ώστε να μπορούμε να αποφασίσουμε μονοσήμαντα αν κάποιο στοιχείο του είναι μέλος του ή όχι. Π.χ. Το σύνολο των Ελλήνων, τα αγόρια ηλικίας ετών, το σύνολο των μηνυμάτων που φθάνουν στο υπολογιστικό κέντρο είναι πληθυσμοί. Τα στοιχεία του πληθυσμού καλούνται υποκείμενα π.χ. ένα άτομο με Ελληνικό διαβατήριο ή ταυτότητα είναι υποκείμενο του πληθυσμού «όλοι οι Έλληνες». Τα υποκείμενα του πληθυσμού έχουν διάφορα χαρακτηριστικά που πιθανότατα μεταβάλλονται από υποκείμενο σε υποκείμενο. Τα χαρακτηριστικά αυτά αναφέρονται στη βιβλιογραφία με τον όρο μεταβλητή (variable).
8
Π.χ. Οι άνθρωποι μπορεί να διαφέρουν μεταξύ τους όσον αφορά την
ηλικία, το βάρος, το φύλο, το ύψος, το εισόδημα κλπ. Με τον όρο μεταβλητή εννοούμε κάθε ποσότητα που μεταβάλλεται ανάμεσα στα υποκείμενά μας. «Μετράμε» το καθένα από τα χαρακτηριστικά αυτά με τη βοήθεια κατάλληλων οργάνων μέτρησης ή με κατάλληλη κωδικοποίηση βρίσκοντας τις τιμές του κάθε υποκειμένου. Σε αντίθεση με την απογραφή (την πλήρη καταγραφή των τιμών ενός πληθυσμού) που συχνά απαιτεί πολύ κόπο, χρόνο, χρήμα, ενώ υπάρχουν και περιπτώσεις που είναι πρακτικά αδύνατη, η Στατιστική μελετά δείγματα του πληθυσμού και επάγει τα όποια συμπεράσματα στο συνολικό πληθυσμό.
9
ΤΟ ΔΕΙΓΜΑ ΚΑΙ Η ΜΕΤΡΗΣΗ Είναι το υποσύνολο των υποκειμένων που επιλέγονται από τον πληθυσμό για να χρησιμοποιηθούν στην ανάλυση. Επίσης δείγμα θεωρείται και το σύνολο των παρατηρήσεων (τιμών) που χρησιμοποιούνται στην ανάλυση. Στη Στατιστική ανάλυση χρησιμοποιούμε το δείγμα των τιμών για να εξάγουμε συμπεράσματα που αφορούν τον πληθυσμό των υποκειμένων. Αντιστοιχίζοντας τιμή από ένα γνωστό σύνολο του οποίου τα στοιχεία είναι αριθμοί (π.χ. σύνολο πραγματικών αριθμών) ή άλλα σύμβολα (π.χ. χρώμα μαλλιών, Νομοί της Ελλάδας κλπ.) στο χαρακτηριστικό (μεταβλητή) που μελετάμε στο καθένα των υποκειμένων του δείγματός μας λέμε ότι κάνουμε μία μέτρηση. Η αντιστοίχηση πρέπει να είναι όσον το δυνατόν πιο σαφής και ακριβής. Στη διαδικασία της μέτρησης συχνά υπεισέρχονται σφάλματα που οφείλονται στην ακρίβεια των οργάνων μέτρησης, στην ιδιαιτερότητα των προσώπων που κάνουν τη μέτρηση, σε λανθασμένες καταγραφές κλπ. Η σημαντική παραδοχή που γίνεται είναι ότι τα σφάλματα δεν είναι συστηματικά.
10
Η ΦΥΣΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ Καθορίζει το είδος των τεχνικών που θα πρέπει να χρησιμοποιηθούν κατά τη στατιστική ανάλυση. Ας δούμε ένα απλό παράδειγμα. Για τις ανάγκες μίας έρευνας με σκοπό τη μελέτη των συνηθειών του Ελληνικού πληθυσμού σχετικά με το κάπνισμα καταρτίστηκε σχετικό ερωτηματολόγιο. Δύο από τις ερωτήσεις ήταν: (α) τι ηλικία έχετε; Πιθανή απάντηση: 27 ετών. Οι πληροφορίες που μπορούν να αντληθούν άμεσα από τη συγκεκριμένη ερώτηση είναι αριθμητικές δηλαδή ποσότητες. Τέτοιου είδους στατιστικά στοιχεία καλούνται αριθμητικά ή ποσοτικά δεδομένα (numeric or quantitative data). Π.χ. ύψος, βάρος, ηλικία, εισόδημα, θερμοκρασία, τιμές προϊόντων, εμβαδόν οικοπέδου. (β) Είστε καπνιστής; Ναι ή όχι; Η πληροφορία που παρέχεται εκφράζει κατάσταση ή ιδιότητα. Τέτοιου είδους στοιχεία καλούνται ονομαστικά ή ποιοτικά (nominal or qualitative data). Π.χ. φύλο, οικογενειακή κατάσταση, επίπεδο εκπαίδευσης, θρήσκευμα, πολιτικές προτιμήσεις.
11
Για τους σκοπούς της ίδιας έρευνας υποβλήθηκαν επίσης οι εξής
ερωτήσεις: (α) τι ύψος έχετε; π.χ (β) πόσα παιδιά έχετε; π.χ (α) Συνεχή δεδομένα (continuous data), π.χ. ύψος, βάρος, ηλικία, εισόδημα (β) Ασυνεχή ή διακριτά δεδομένα (discrete, non-continuous data). Π.χ. αριθμός παιδιών, αριθμός μελών νοικοκυριού Τα συνεχή δεδομένα είναι μετρήσιμα με κάποια καθιερωμένη μονάδα μέτρησης (π.χ. μέτρο, κιλό κλπ.) ενώ τα διακριτά δεδομένα είναι απαριθμήσιμα.
12
Η ΦΥΣΗ ΤΩΝ ΜΕΤΑΒΛΗΤΩΝ Καθορίζει το είδος των δεδομένων. Οι μεταβλητές διακρίνονται σε ποσοτικές και ποιοτικές ανάλογα αν οι τιμές τους εκφράζονται αριθμητικά ή ονομαστικά. Οι ποσοτικές μεταβλητές διακρίνονται σε συνεχείς και σε διακριτές ανάλογα με το αν οι τιμές τους είναι συνεχείς ή διακριτές, αντίστοιχα. Οι ποιοτικές μεταβλητές διακρίνονται σε κατηγορικές (categorical variables) και σε διατάξιμες (ordinal variables). Οι ποιοτικές μεταβλητές που δίνουν τη δυνατότητα στον ερευνητή να διατάξει και να διαβαθμίσει τις κατηγορίες που προκύπτουν από τις τιμές τους καλούνται διατάξιμες ή τακτικές. Οι υπόλοιπες που από τη φύση τους δεν παρέχουν αυτή τη δυνατότητα διάταξης και επιτρέπουν απλά και μόνο τη διάκριση ορισμένων κατηγοριών ή υπο-ομάδων καλούνται κατηγορικές. Π.χ. Κατηγορικών. Φύλο, θρήσκευμα. Π.χ. Διατάξιμων. Επίπεδο εκπαίδευσης.
13
Η ΧΡΗΣΗ ΤΩΝ ΨΕΥΔΟΜΕΤΑΒΛΗΤΩΝ
Οι τιμές μίας ποιοτικής μεταβλητής μπορούν να κωδικοποιηθούν και να αντικατασταθούν από αριθμητικές τιμές καθοριζόμενες από τον ερευνητή. Προκύπτει μία «νέα» αριθμητική διακριτή μεταβλητή που καλείται ψευδομεταβλητή (dummy variable). Π.χ. Μεταβλητή Φύλο Τιμή «0»: άνδρες και Τιμή «1»: Γυναίκες. Πρακτική αξία: Διευκολύνεται η εισαγωγή των δεδομένων στον υπολογιστή. Χρησιμοποιούνται ευρέως στην Ανάλυση Παλινδρόμησης και στην Οικονομετρία.
14
ΑΝΕΞΑΡΤΗΤΕΣ ΚΑΙ ΕΞΑΡΤΗΜΕΝΕΣ ΜΕΤΑΒΛΗΤΕΣ
Οι μεταβλητές των οποίων οι τιμές εξαρτώνται από τις αντίστοιχες τιμές άλλων μεταβλητών καλούνται εξαρτημένες μεταβλητές (Dependent variables). Οι μεταβλητές των οποίων οι τιμές δεν εξαρτώνται από τις αντίστοιχες τιμές άλλων μεταβλητών αλλά μόνο τις επηρεάζουν καλούνται ανεξάρτητες μεταβλητές (Independent variables). Τυχαία ή στοχαστική μεταβλητή (Random or stochastic variable) είναι μία μεταβλητή της οποίας οι τιμές διέπονται από πιθανοθεωρητικούς νόμους και κατά συνέπεια δεν μπορούν να προσδιοριστούν εκ των προτέρων. Μη τυχαία ή πρoσδιορίσιμη μεταβλητή (non-random or deterministic variable) είναι μία μεταβλητή της οποίας οι τιμές δεν διέπονται από πιθανοθεωρητικούς νόμους και κατά συνέπεια οι τιμές τους μπορούν να προσδιοριστούν εκ των προτέρων. Οι περισσότερες μεταβλητές που εκφράζουν οικονομικά, κοινωνικά φαινόμενα είναι τυχαίες μεταβλητές.
15
ΕΙΣΑΓΩΓΗ ΣΤΟ SPSS SPSS: Statistical package for Social Sciences Σύστημα ανάλυσης και διαχείρισης δεδομένων. Φιλικό προς τον χρήστη. Οι περισσότερες από τις διεργασίες που πραγματοποιούνται με το SPSS μπορούν να εκτελεστούν με τη χρήση του ποντικιού. Βασικές λειτουργίες πραγματοποιούνται μέσω μίας σειράς παραθύρων. Τα κυριότερα παράθυρα που εμφανίζονται στο menu File-New (or Open) είναι: Data: Εδώ τα δεδομένα ενός αρχείου καταχωρούνται, τροποποιούνται ή απλά εμφανίζονται με τη μορφή ενός αρχείου δεδομένων (data file). Τα αρχεία του Data Editor μπορούν να αποθηκεύονται ως αρχεία δεδομένων με την επέκταση .sav. Output: Εδώ εμφανίζονται τα αποτελέσματα οποιασδήποτε διεργασίας του SPSS. Θα το δούμε όταν κάνουμε μία οποιαδήποτε ανάλυση δεδομένων. Τα αρχεία αποτελεσμάτων του SPSS αποθηκεύονται με την επέκταση .spv.
16
ΠΕΡΙΗΓΗΣΗ ΣΤΑ ΒΑΣΙΚΑ MENU ΤΟΥ SPSS
λογισμικό. File: Διασφαλίζει το άνοιγμα, το κλείσιμο και την αποθήκευση των αρχείων που διαχειρίζεται το SPSS. Από το ίδιο menu εμφανίζονται οι πληροφορίες που συνοδεύουν ένα αρχείο όπως τα ονόματα και οι τύποι των μεταβλητών. Μπορούν επίσης εδώ να τυπωθούν τα περιεχόμενα ενός αρχείου και να πραγματοποιηθεί και η έξοδος από το SPSS (με την εντολή Exit). Edit: Εδώ πραγματοποιούνται οι διαδικασίες αντιγραφής, αποκοπής και επικόλλησης δεδομένων στο ίδιο αρχείο ή από ένα αρχείο δεδομένων σε άλλο. Στο ίδιο menu υπάρχει και η διαδικασία αναζήτησης δεδομένων ενός αρχείου. View: Εδώ μπορούμε να ρυθμίζουμε την εμφάνιση του Data Editor. Data: Eδώ μπορούμε να διαχειριστούμε τα δεδομένα ενός ή περισσότερων αρχείων δεδομένων. Μπορούμε να ορίζουμε τις ιδιότητες μίας μεταβλητής π.χ. το όνομά της, το format της εμφάνισής της στην οθόνη κλπ. να διατάσσουμε με την εντολή sort τα δεδομένα ενός αρχείου να ενώνουμε (merge) αρχεία με διάφορους τρόπους κλπ.
17
Transform: Εδώ μπορούμε να μετασχηματίζουμε τις τιμές των μεταβλητών ενός αρχείου, να υπολογίζουμε τις τιμές νέων μεταβλητών, να αντικαθιστούμε τα ενδεχόμενα missing values μίας μεταβλητής κλπ. Analyze: Εδώ είναι συγκεντρωμένες όλες οι στατιστικές διαδικασίες που περιλαμβάνει το πακέτο. Οι διαδικασίες αυτές ξεκινούν από τον υπολογισμό απλών περιγραφικών μέτρων μέχρι την εκτέλεση σύνθετων πολυμεταβλητών αναλύσεων. Περιλαμβάνει διάφορους τύπους γραμμικής πολλαπλής παλινδρόμησης, μεθόδους ανάλυσης χρονολογικών σειρών, τεχνικές πολυδιάστατης ανάλυσης κτλ. Graphs: Eδώ μπορούν να παραχθούν διαγράμματα υψηλής ευκρίνειας τα οποία μπορούν να τροποποιούνται μέσω του Chart Editor. Μπορούν να παραχθούν ιστογράμματα, ραβδογράμματα, κυκλικά διαγράμματα, θηκογράμματα, διαγράμματα διασποράς κτλ. Utilities: Εδώ περιλαμβάνεται μία σειρά από συμπληρωματικές επιλογές που παρέχει το SPSS στον χρήστη οι οποίες αφορούν την περιγραφή των μεταβλητών ενός αρχείου, τη δυνατότητα ενσωμάτωσης σχολίων κατά την αποθήκευση αρχείων δεδομένων κτλ. Help: Παρέχει on-line βοήθεια στον χρήστη για κάθε θέμα που αφορά τη χρήση του πακέτου.
18
ΒΗΜΑΤΑ ΠΟΥ ΑΚΟΛΟΥΘΟΥΝΤΑΙ ΚΑΤΑ ΤΗΝ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΜΕ ΤΟ SPSS
1o Bήμα: Eισαγωγή των δεδομένων στο SPSS. 2o Βήμα: Μετασχηματισμοί δεδομένων (αν αυτό είναι απαραίτητο), δημιουργία νέων μεταβλητών, επανακωδικοποίηση παλιών μεταβλητών κλπ. Χρήση των menu Data και Transform. 3ο Βήμα: Χρήση στατιστικών διαδικασιών κυρίως με το menu Analyze (συμπληρωματικά υπάρχει και το menu Graphs). 4o Βήμα: Εκτέλεση στατιστικών διαδικασιών. Ανάλυση και σχολιασμός των αποτελεσμάτων.
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.