Μεθοδολογία Έρευνας Διάλεξη 9η: Ανάλυση Ποσοτικών Δεδομένων

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Applied Econometrics Second edition
Advertisements

Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Άλλες Στατιστικές Παλινδρόμησης
Applied Econometrics Second edition
ΕΡΕΥΝΑ ΜΑΡΚΕΤΙΝΓΚ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ ΙΙ: ΤΥΠΟΙ ΕΡΩΤΗΣΕΩΝ.
ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ (Εργαστήριο) Εισηγητής: Θανάσης Βαφειάδης
Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Μπουντζιούκα Βασιλική, MSc Βιοστατιστικός Εξωτ. Συνεργάτης ΕΣΔΥ
Factorial Analysis of Variance – Παραγοντική Ανάλυση Διακύμανσης
Βασικές Αρχές Μέτρησης
Στατιστική I Χειμερινό Γ. Παπαγεωργίου
ΘΕΩΡΙΕΣ ΚΑΙ ΥΠΟΘΕΣΕΙΣ: Διατύπωση Αναπτυξιακών Ερωτημάτων
ΚΕΦΑΛΑΙΟ 6 ΓΕΩΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ: ΣΗΜΕΙΑ
Πηγή: Βιοστατιστική [Β.Γ. Σταυρινός, Δ.Β. Παναγιωτάκος]
Εισαγωγή Στατιστική είναι η επιστήμη που με τη βοήθεια επιστημινκών μεθόδων ασχολείται με τη συλλογή, οργάνωση, παρουσίαση και ανάλυση αριθμητικών στοιχείων.
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
Διάλεξη  Μέτρηση: Είναι μια διαδικασία κατά την οποία προσδίδουμε αριθμητικά δεδομένα σε κάποιο αντικείμενο, σύμφωνα με κάποια προκαθορισμένα.
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
Εργαστήριο Στατιστικής (7 ο Εργαστήριο) Συσχετίσεις μεταξύ μεταβλητών (ερωτήσεων)
ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ - ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Δρ. Κουνετάς Η Κωνσταντίνος.
Εργαστήριο Στατιστικής (9 ο Εργαστήριο) Συσχετίσεις μεταξύ μεταβλητών (ερωτήσεων)
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 2: Επαγωγική Στατιστική Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και Αγωγής.
Εργαστήριο Στατιστικής (8 ο Εργαστήριο) Συσχετίσεις μεταξύ μεταβλητών (ερωτήσεων)
Στατιστικές Υποθέσεις (Ερευνητικά Ερωτήματα / Υποθέσεις προς επιβεβαίωση)
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. –Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας.
Διαστήματα Εμπιστοσύνης για αναλογίες. Ποιοτικές μεταβλητές χαρακτηρίζονται εκείνες οι οποίες τα στοιχεία τους δεν έχουν μετρηθεί με κάποιον τρόπο – οι.
Διάστημα εμπιστοσύνης για τη διακύμανση. Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως Όταν τα δεδομένα αφορούν πληθυσμό – μ είναι ο μέσος του πληθυσμού.
Γραμμική Συσχέτιση, Απλή και Πολλαπλή Γραμμική Παλινδρόμηση (Εργαστήριο Σχολής Κοινωνικών Επιστημών)
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΙΝΑΚΕΣ ΚΑΙ ΔΙΑΓΡΑΜΜΑΤΑ Πηγή: Βιοστατιστική [Σταυρινός / Παναγιωτάκος] Βιοστατιστική [Τριχόπουλος / Τζώνου / Κατσουγιάννη]
Στατιστική Ανάλυση. Ποιοτικές και ποσοτικές μέθοδοι Ποιες είναι οι διαφορές; Πότε χρησιμοποιούνται; Πότε κάνω στατιστική ανάλυση;
ΔΙΑΛΕΞΗ 11η Ποσοτική έρευνα υγείας
Έλεγχος υποθέσεων με την χ2 «χι -τετράγωνο» κατανομή
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Ανάλυση- Επεξεργασία των Δεδομένων
Στατιστικές Υποθέσεις
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική
Δειγματοληψία Στην Επαγωγική στατιστική οδηγούμαστε σε συμπεράσματα και αποφάσεις για τις παραμέτρους ενός πληθυσμού με τη βοήθεια ενός τυχαίου δείγματος.
Επαγωγική Στατιστική Εκτίμηση και Έλεγχος μέσων τιμών Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Συντελεστής συσχέτισης
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ 1η Διάλεξη
Μεθοδολογία Έρευνας Διάλεξη 5η: Δειγματοληψία
Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής
Στατιστικές Υποθέσεις II
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική
Έλεγχος για τη διαφορά μέσων τιμών μ1 και μ2 δύο πληθυσμών
Διαλέξεις στη Βιοστατιστική
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
Κανονικότητα Μια από τις υποθέσεις του υποδείγματος της γραμμικής παλινδρόμησης είναι ότι ο διαταρακτικός όρος κατανέμεται κανονικά με μέσο μηδέν και σταθερή.
5o Μάθημα: Το τεστ χ2 Κέρκυρα.
Πολυσυγγραμμικότητα Εξειδίκευση
Έλεγχος υποθέσεων με την χ2 «χι -τετράγωνο» κατανομή
Δρ. Γιώργος Μαρκάκης Καθηγητής Βιομετρίας Τ.Ε.Ι. Κρήτης
Εισαγωγή στην Στατιστική
Η παρουσίαση του στατιστικού υλικού γίνεται με δύο τρόπους. 1 Η παρουσίαση του στατιστικού υλικού γίνεται με δύο τρόπους! 1. Ο πρώτος συνίσταται.
Μεθοδολογία Έρευνας Διάλεξη 5η: Δειγματοληψία
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
Σχέση μεταξύ δυο ποσοτικών μεταβλητών & Μονοπαραγοντική γραμμική εξάρτηση 2017.
Επαγωγική Στατιστική Συσχέτιση – Συντελεστής συσχέτισης Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Απλή γραμμική παλινδρόμηση
Τμήμα Λογιστικής & Χρηματοοικονομικής
Στατιστικές Υποθέσεις
Μεθοδολογία Έρευνας Διάλεξη 5η: Δειγματοληψία
Είδη Ερωτήσεων-Μεταβλητές-Κλιμακες Μέτρησης
Μέθοδοι Έρευνας Στις Επιχειρήσεις και την Οικονομία
Τ. Ε. Ι. Αθήνας Τμήμα Ιατρικών Εργαστηρίων ΒΙΟΣΤΑΤΙΣΤΙΚΗ
Βιοστατιστική (Θ) ΤΕΙ Αθήνας Ενότητα 3: Περιγραφική στατιστική
Επαγωγική Στατιστική Συσχέτιση – Συντελεστές συσχέτισης Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
ΕΛΕΓΧΟΣ ΑΝΕΞΑΡΤΗΣΙΑΣ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ
Ανάλυση διακύμανσης Τι είναι η ανάλυση διακύμανσης
Μεταγράφημα παρουσίασης:

Μεθοδολογία Έρευνας Διάλεξη 9η: Ανάλυση Ποσοτικών Δεδομένων Μεθοδολογία Έρευνας Διάλεξη 9η: Ανάλυση Ποσοτικών Δεδομένων Δρ. Αλέξανδρος Αποστολάκης Email: aapostolakis@staff.teicrete.gr Τηλ.: 2810379603 E-class μαθήματος: https://eclass.teicrete.gr/courses/PGRAD_OMM104/

Κωδικοποίηση Δεδομένων Όλοι οι τύποι δεδομένων καλό είναι να καταγράφονται κωδικοποιημένοι αριθμητικά. καταχωρίζετε τα δεδομένα γρήγορα και με λιγότερα λάθη διευκολύνονται οι αναλύσεις ειδικά αν απαιτείται επανακωδικοποίηση προσοχή στις ακατανόητες αναλύσεις (π.χ. ο υπολογισμός μέσου όρου για τη μεταβλητή «φύλο») εάν χρησιμοποιείτε υπολογιστικό φύλλο (Excel), θα χρειαστείτε μια χωριστή λίστα με κωδικούς για κάθε μεταβλητή. Τα ειδικά λογισμικά στατιστικής ανάλυσης (SPSS κλπ) συνδέουν αυτόματα κάθε κωδικό με μια προκαθορισμένη ετικέτα. Eπανακωδικοποίηση δεδομένων Ομαδοποίηση ή συνδυασμός δεδομένων σε λιγότερο λεπτομερείς κατηγορικές μεταβλητές. Για παράδειγμα η ηλικία ενός ατόμου, π.χ. 28 ετών θα μπορούσε με επανακωδικοποίηση να τοποθετηθεί στην ηλικιακή κατηγορία, π.χ., από 25 ως 30 ετών (κατηγορικά δεδομένα κατάταξης).

Κανόνες Κωδικοποίησης Δεδομένων Όλα τα δεδομένα πρέπει να είναι αριθμητικά Τα δεδομένα από κάθε περίπτωση πρέπει να καταλαμβάνουν μόνο μια γραμμή (row) Κάθε στήλη (column) πρέπει να περιέχει δεδομένα της ίδιας μεταβλητής για όλες τις περιπτώσεις Όταν η ίδια μεταβλητή μετριέται περισσότερες από μία φορές για κάθε περίπτωση (π.χ. Αποτελέσματα εξέτασης πριν και μετά) τότε πρέπει να εισάγουμε διαφορετικές στήλες με διαφορετικά ονόματα Όλες οι τιμές(κωδικοί) για μια μεταβλητή πρέπει να είναι αμοιβαία αποκλειόμενες Μόνο μια τιμή μπορεί να καταγραφεί για κάθε μεταβλητή Σε ερωτήσεις(π.χ. Προτιμήσεις προϊόντων) όπου οι ερωτώμενοι αφήνονται να συμπληρώσουν περισσότερες από μια απαντήσεις κάθε επιλογή πρέπει να αποτελεί ξεχωριστή μεταβλητή με τιμές1 που θα αντιστοιχεί στο «ΝΑΙ»(επιλογή) και 0 που θα αντιστοιχεί στο «ΟΧΙ»(δεν το επέλεξε)

Δημιουργία Βάσης Δεδομένων κάθε στήλη αναπαριστά μια ξεχωριστή μεταβλητή κάθε γραμμή περιέχει τις τιμές των μεταβλητών για μια μεμονωμένη περίπτωση για την οποία έχετε αποκτήσει δεδομένα.

Ανάλυση και Παρουσίαση Δεδομένων Διερευνητική ανάλυση δεδομένων (EDA) χρησιμοποιεί διαγράμματα για την εξερεύνηση και κατανόηση των δεδομένων δίνει την ευελιξία να χρησιμοποιείτε νέες τεχνικές ανάλυσης στην πορεία ανοίγει το δρόμο για άλλες γόνιμες μεθόδους ανάλυσης οι υπολογιστές διευκολύνουν και επιταχύνουν τις διεργασίες.

Παραδείγματα Περιγράφικής Ανάλυσης Διάγραμμα 5.6: Βαθμολογία Τομέων ΕΚΕ Διάγραμμα 2: Εμπειρία

Παραδείγματα Περιγράφικής Ανάλυσης

Διάκριση Εργαλείων Ανάλυσης Δεδομένων μη παραμετρικοί έλεγχοι: χρησιμοποιούνται όταν τα δεδομένα δεν κατανέμονται κανονικά. συνήθως χρησιμοποιούνται με κατηγορικά δεδομένα παραμετρικοί έλεγχοι : θεωρούνται πιο ισχυροί επειδή χρησιμοποιούν αριθμητικά δεδομένα, πρέπει να ικανοποιούνται οι παρακάτω προϋποθέσεις οι περιπτώσεις δεδομένων που επιλέγονται για το δείγμα είναι ανεξάρτητες τα δείγματα εξάγονται από κανονικά κατανεμημένους πληθυσμούς οι πληθυσμοί από τους οποίους εξάγονται τα δείγματα έχουν ίσες διακυμάνσεις χρησιμοποιούνται αριθμητικά δεδομένα. το μέγεθος του δείγματος είναι αρκετά μεγάλο και ικανοποιεί τις απαιτήσεις των στατιστικών αναλύσεων που χρησιμοποιούνται

Παραμετρική Ανάλυση

Μη Παραμετρική Ανάλυση

Είδη Ανάλυσης

Μονομεταβλητή Ανάλυση

Διμεταβλητή Ανάλυση

Πολυμεταβλητή Ανάλυση

Λογιστική Παλινδρόμηση

Παραγοντική Ανάλυση

Έλεγχος Σημαντικότητας Σχέσεων & Διαφορών Ο έλεγχος για την πιθανότητα μια παρατηρούμενη σχέση ή διαφορά ανάμεσα σε μεταβλητές να είναι συμπτωματική και μόνο μηδενική υπόθεση (Η0): «δεν υπάρχει σημαντική σχέση ή διαφορά ανάμεσα στις μεταβλητές ...» Εναλλακτική υπόθεση (Η1): «υπάρχει σημαντική σχέση ή διαφορά ανάμεσα στις μεταβλητές ...» η στατιστική σημαντικότητα μιας σχέσης που υποδεικνύεται από ένα στατιστικό έλεγχο καθορίζεται εν μέρει από το μέγεθος του δείγματος είναι πολύ δύσκολο να προκύψει στατιστικά σημαντικός έλεγχος από ένα πολύ μικρό δείγμα. όσο αυξάνεται το μέγεθος του δείγματος, λιγότερο προφανείς σχέσεις και διαφορές διαπιστώνεται ότι είναι στατιστικά σημαντικές μικρά δείγματα μπορούν να μειώσουν στο ελάχιστο την ευαισθησία των στατιστικών ελέγχων, ενώ τα πολύ μεγάλα δείγματα μπορούν να κάνουν το αντίθετο

Έλεγχος Συσχέτισης Δύο (2) Μεταβλητών Έλεγχος χ τετράγωνο (χ2) δεδομένα σε πίνακα συνάφειας διπλής εισόδου υπολογίζει την πιθανότητα τα δεδομένα στον πίνακά σας, ή δεδομένα ακόμα πιο ακραία, να είναι συμπτωματικά και μόνο βασίζεται σε σύγκριση των τιμών που παρατηρούνται στον πίνακα μ’ αυτές που θα αναμένονταν αν οι δύο μεταβλητές ήταν εντελώς ανεξάρτητες βασίζεται στις ακόλουθες προϋποθέσεις: οι κατηγορίες που χρησιμοποιούνται στον πίνακα συνάφειας είναι αμοιβαία αποκλειόμενες, ώστε κάθε παρατήρηση να ανήκει σε μία μόνο κατηγορία ή κλάση,

Έλεγχος Διαφορετικότητας Δύο (2) Ομάδων Δεδομένα κατάταξης ο έλεγχος Kolmogorov–Smirnov δίνει τη δυνατότητα να διαπιστωθεί αν η κατανομή των τιμών ενός δείγματος διαφέρει από μια καθορισμένη κατανομή, εκτός της κανονικής ελέγχεται η πιθανότητα η κατανομή των υπό παρατήρηση δεδομένων να διαφέρει από εκείνη του καθορισμένου πληθυσμού μόνο συμπτωματικά πιθανότητα 0,05 ή μικρότερη σημαίνει ότι μπορείτε να είστε τουλάχιστον 95% βέβαιοι ότι η διαφορά ανάμεσα στις δύο κατανομές δεν προέρχεται μόνο από σύμπτωση Αριθμητικά δεδομένα (2 διακριτές ομάδες) έλεγχος t ανεξαρτήτων δειγμάτων έλεγχος t συζευγμένων δειγμάτων Αριθμητικά δεδομένα (3 ή περισσότερες ομάδες) μονόδρομη ανάλυση διακύμανσης ή μονόδρομη ANOVA

Έλεγχος Διαφορετικότητας Δύο (2) Ομάδων Αριθμητικά δεδομένα (3 ή περισσότερες ομάδες) μονόδρομη ανάλυση διακύμανσης ή μονόδρομη ANOVA προϋποθέσεις χρήσης οι τιμές των δεδομένων είναι ανεξάρτητες και δε σχετίζονται μεταξύ τους τα δεδομένα για κάθε ομάδα είναι κανονικά κατανεμημένα (η προϋπόθεση δεν είναι ιδιαίτερα σημαντική, εφόσον ο αριθμός των περιπτώσεων σε κάθε ομάδα είναι > 30). οι διακυμάνσεις των ομάδων δεδομένων δε διαφέρουν μεταξύ τους, στατιστικά (όταν ο αριθμός των περιπτώσεων στη μεγαλύτερη ομάδα δεν υπερβαίνει περισσότερο του 50% τον αριθμό των περιπτώσεων στη μικρότερη ομάδα, η επίδραση στα αποτελέσματα του ελέγχου, από την παραβίαση της συγκεκριμένης προϋπόθεσης, είναι αμελητέα).

Αξιολόγηση της Έντασης της Σχέσης Μεταξύ Δύο Μεταβλητών Συντελεστής Συσχέτισης: δίνει τη δυνατότητα να ποσοτικοποίησης της έντασης της γραμμικής σχέσης ανάμεσα σε δύο μεταβλητές κατάταξης ή αριθμητικές. συμβολίζεται με το γράμμα r μπορεί να πάρει οποιαδήποτε τιμή ανάμεσα στο +1 που αναπαριστά μια πλήρως θετική συσχέτιση και -1 που αναπαριστά μια πλήρως αρνητική συσχέτιση συντελεστές συσχέτισης ανάμεσα στο +1 και το -1 αναπαριστούν ασθενέστερες θετικές και αρνητικές συσχετίσεις, ενώ η τιμή 0 σημαίνει ότι οι μεταβλητές είναι απόλυτα ανεξάρτητες στην έρευνα στους τομείς των επιχειρήσεων και της διοίκησης, οι τέλειες ή μηδενικές συσχετίσεις είναι εξαιρετικά ασυνήθιστες.

Αξιολόγηση της Έντασης της Σχέσης Μεταξύ Δύο Μεταβλητών συντελεστής γραμμικής συσχέτισης του Pearson (PMCC) και οι δύο μεταβλητές είναι αριθμητικές τα δείγματα είναι τυχαία αν η μία ή και οι δύο μεταβλητές περιέχουν δεδομένα κατάταξης συντελεστής συσχέτισης κατάταξης του Spearman (rho [ρ] του Spearman) συντελεστής συσχέτισης κατάταξης του Kendall (tau [τ] του Kendall) ο συντελεστής του Kendall θεωρείται πιο κατάλληλος αν τα δεδομένα μιας εκ των μεταβλητών περιέχουν συνδεμένες βαθμίδες (tied ranks).

Αξιολόγηση της Έντασης Σχέσης Αιτιώδους Συνάφειας Αξιολόγηση της Έντασης Σχέσης Αιτιώδους Συνάφειας Συντελεστής προσδιορισμού ή συντελεστής παλινδρόμησης (r2) αξιολογεί την ένταση της σχέσης ανάμεσα σε μια αριθμητική εξαρτημένη μεταβλητή και μία ή περισσότερες αριθμητικές ανεξάρτητες μεταβλητές τα δεδομένα πρέπει να έχουν επιλεγεί τυχαία μπορεί να πάρει οποιαδήποτε τιμή ανάμεσα στο 0 και το +1 μετρά το ποσοστό διακύμανσης μιας εξαρτημένης μεταβλητής που μπορεί να εξηγηθεί στατιστικά από τη διακύμανση μίας ανεξάρτητης μεταβλητής ή πολλών ανεξάρτητων μεταβλητών αν η μεταβολή μπορεί να εξηγηθεί, στο σύνολό της, ο συντελεστής προσδιορισμού θα είναι 1. αν κανένα ποσοστό της μεταβολής δεν μπορεί να εξηγηθεί, ο συντελεστής θα είναι 0 στις έρευνές μας, σπάνια παίρνουμε τιμές συντελεστή πάνω από 0,5 η διαδικασία υπολογισμού του συντελεστή προσδιορισμού και της εξίσωσης παλινδρόμησης με μία ανεξάρτητη μεταβλητή ορίζεται ως ανάλυση παλινδρόμησης.