Προετοιμασία των δεδομένων Τα δεδομένα τείνουν να έχουν 2 είδη προβλημάτων: Να μην έχουν κανονική κατανομή, να μην είναι ευθύγραμμες οι σχέσεις μεταξύ.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Περιγραφική Στατιστική
Advertisements

Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Ανάλυση Πολλαπλής Παλινδρόμησης
Η αξιολόγηση των σχολικών βιβλίων Κοινωνικών Επιστημών της Πέμπτη τάξης Akdoğan Dr. Fazıl Küçük Τάξη 5 Rabiya Mentes.
Πιθανότητες & Τυχαία Σήματα Συσχέτιση
EDUC 612 Ανωτερες μορφες στατιστικης αναλυσησ
Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
Μη παραμετρικά κριτήρια
Η αξιολόγηση και η συμβολή της στη σύγχρονη διδασκαλία των μαθηματικών Δρ. Σάλτας Βασίλειος Επ. Συν. ΤΕΙ Καβάλας
Factorial Analysis of Variance – Παραγοντική Ανάλυση Διακύμανσης
ΙΑΝΟΥΑΡΙΟΣ 2012 © Συντάχθηκε για λογαριασμό του Τηλεοπτικού Σταθμού.
ΕΥΡΕΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΕΚΤΟΠΩΝ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ
1 Ανάλυση και επεξεργασία δεδομένων Περιλαμβάνουν Ο ερευνητής πρέπει να ελέγξει λογικά τις συγκεντρωθείσες πληροφορίες των ερωτηματολογίων καθώς και την.
ΔΙΑΔΙΚΑΣΙΑ ΕΡΕΥΝΑΣ ΣΥΓΓΡΑΦΗ ΕΡΕΥΝΗΤΙΚΟΥ ΠΡΩΤΟΚΟΛΛΟΥ
Διπλωματική Εργασία με θέμα: «ΠΡΟΣΤΙΘΕΜΕΝΗ ΑΞΙΑ ΕΣΩΤΕΡΙΚΟΥ ΕΛΕΓΧΟΥ
ΚΕΦΑΛΑΙΟ 5 ΧΩΡΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ
Στατιστική Ι Παράδοση 9 Ο Δείκτης Συσχέτισης.
Διάλεξη 9η: Εφαρμογή της μεθόδου Simplex στο γραμμικό προγραμματισμό κατά τη μεγιστοποίηση Μέθοδος Simplex 1.Όταν υπάρχουν μέχρι πέντε κλάδοι παραγωγής.
Στατιστική I Χειμερινό Γ. Παπαγεωργίου
Στατιστική I Γ. Παπαγεωργίου XEIM Επιλογή μεθόδου Εξαρτάται από τον ερευνητή/τρια Ποιοτικά/ ποσοτικά όταν τα data αριθμοποιούνται. εδώ – Έμφαση.
Γραφικές Μέθοδοι Περιγραφής Δεδομένων
Στατιστική IΙ (ΨΥΧ-122) Διάλεξη 4 Πολλαπλή γραμμική παλινδρόμηση
ΚΕΦΑΛΑΙΟ 10 ΠΑΛΙΝΔΡΟΜΗΣΗ
 Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον:  Τεχνικές Διδασκαλίας.
Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Διάλεξη 5 Σύγκριση μέσω όρων
Στατιστική – Πειραματικός Σχεδιασμός Βασικά. Πληθυσμός – ένα μεγάλο σετ από Ν παρατηρήσεις (πιθανά δεδομένα) από το οποίο το δείγμα λαμβάνεται. Δείγμα.
ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΚΟΙΝΩΝΙΚΗΣ ΔΙΟΙΚΗΣΗΣ Εργασία στο μάθημα: Συγκριτική Κοινωνική Εργασία. Καθηγήτρια: Κανδυλάκη Αγάπη. Φοιτητής: Καβούκης.
Αρχές επαγωγικής στατιστικής Τμήμα :Νοσηλευτικής Πατρών Διδάσκουσα: Παναγιώταρου Αλίκη Διάλεξη 9.
Διάστημα εμπιστοσύνης για τη διακύμανση. Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως Όταν τα δεδομένα αφορούν πληθυσμό – μ είναι ο μέσος του πληθυσμού.
Πειράματα και παρατηρήσεις Υποθέσεις έρευνας. Πείραμα ή παρατήρηση;  Το κάπνισμα προκαλεί καρκίνο;  Πώς βγήκε αυτό το συμπέρασμα;  Τί μέθοδος χρησιμοποιήθηκε.
Γραμμική Συσχέτιση, Απλή και Πολλαπλή Γραμμική Παλινδρόμηση (Εργαστήριο Σχολής Κοινωνικών Επιστημών)
Δραματική Τέχνη στην εκπαίδευση: Ερευνητικό Σχέδιο Ι Στις ανθρωπιστικές επιστήμες επικράτησαν δύο ερευνητικές κατευθύνσεις: Η στατιστική ανάλυση (συνυπολογίζει.
ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ για επεξεργασία δεδομένων έρευνας Εμμανουήλ Κακάρογλου Σχολικός Σύμβουλος ΠΕ12.
ΔΙΑΛΕΞΗ 9η Οργανωτική Δομή και Ανάλυση Γραφειοκρατία Οργανογράμματα
ΣΥΓΚΡΙΤΙΚΗ ΠΟΛΙΤΙΚΗ/ 5 & 6
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Μέτρα Διασποράς Η μεταβλητότητα, ή αλλιώς η ποικιλομορφία, στις τιμές μιας μεταβλητής θα πρέπει πάντοτε να λαμβάνεται υπόψη σε οποιαδήποτε στατιστική ανάλυση!
Στατιστικές Υποθέσεις
Βασική Στατιστική Επεξεργασία. Ερμηνεία Δεδομένων.
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική
Τι μπορούμε να δούμε σε αυτό το ιστόγραμμα?
Δειγματοληψία Στην Επαγωγική στατιστική οδηγούμαστε σε συμπεράσματα και αποφάσεις για τις παραμέτρους ενός πληθυσμού με τη βοήθεια ενός τυχαίου δείγματος.
Επαγωγική Στατιστική Εκτίμηση και Έλεγχος μέσων τιμών Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Συντελεστής συσχέτισης
Έλεγχος Υπόθεσης για το μέσο ενός πληθυσμού
Ερμηνεία Σχετικού λόγου ( Odds ratio ) -1
Μεθοδολογία έρευνας και στατιστική – Δείγμα – Πληθυσμός
Άσκηση 2-Περιγραφικής Στατιστικής
ΙΕΚ Γαλατσίου Στατιστική ΙΙ Μάθημα 6
Εισαγωγή στην Στατιστική
ΠΟΛΥΩΝΥΜΙΚΗ ΚΑΤΑΝΟΜΗ Στη θεωρία των πιθανοτήτων η πολυωνυμική κατανομή είναι μια γενίκευση της διωνυμικής κατανομής. Η διωνυμική κατανομή είναι η κατανομή.
ΑΝΑΛΥΣΗ ΧΩΡΙΚΩΝ ΠΡΟΤΥΠΩΝ
Ποσοτικές μέθοδοι περιγραφής δεδομένων
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
ΧΡΟΝΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΕΡΓΩΝ
Κατανομές πιθανοτήτων
ΚΑΤΑΝΟΜΕΣ Δ. Τσιπλακίδης
ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ
Βασικά δεδομένα στην πρόσθεση και τον πολλαπλασιασμό
Επαγωγική Στατιστική Συσχέτιση – Συντελεστής συσχέτισης Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
ΕΡΕΥΝΑ – ΘΕΩΡΙΑ – ΕΠΙΣΤΗΜΟΝΙΚΗ ΓΝΩΣΗ
Στατιστικές Υποθέσεις
Εισαγωγή & Ανάλυση δεδομένων με το SPSS
تقدير المتغيرات في دراسات الجدوى
ΣΤΟΙΧΕΙΟΜΕΤΡΙΑ. Λύση ΣΤΟΙΧΕΙΟΜΕΤΡΙΑ Λύση.
يئΎصحإ΍ ليϠحتل΍ يف ΔصصΨتϤل΍ ΔيΒيέΪتل΍ ΓέϭΪل΍ عϤجتϤل΍ ΔيϠك ΏΎحέ يف ΕΪقع جمΎنήب ϡ΍ΪΨتسΎب (SPSS) ήيمأ΍ ΪϬعم ΎϬϤظن يتل΍ϭ ،ΔعمΎجلΎب سيέΪتل΍ ΔΌيه.
Επαγωγική Στατιστική Συσχέτιση – Συντελεστές συσχέτισης Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Ανάλυση διακύμανσης Τι είναι η ανάλυση διακύμανσης
Μεταγράφημα παρουσίασης:

Προετοιμασία των δεδομένων Τα δεδομένα τείνουν να έχουν 2 είδη προβλημάτων: Να μην έχουν κανονική κατανομή, να μην είναι ευθύγραμμες οι σχέσεις μεταξύ των μεταβλητών, κλπ Να έχουν ακραίες τιμές, να υπάρχουν αναπάντητες ερωτήσεις Αυτά τα προβλήματα μπορεί να επηρεάσουν τη μορφή καταχώρησης των δεδομένων. Τα δεδομένα μπορούν να καταχωρηθούν με 2 μορφές πίνακας συσχετίσεων (correlations + τυπική απόκλιση) ή πίνακας συνδιασποράς (covariance) Δεδoμένων στο SPSS

Προετοιμασία των δεδομένων Τα δεδομένα μπορούν να καταχωρηθούν με τη μορφή Πινάκων (πίνακας συσχετίσεων) Προσφέρει οικονομία χώρου Τα δεδομένα μπορούν να αναλυθούν και από άλλους ερευνητές Δεδoμένων στο SPSS Δεν είναι κανονική η κατανομή των δεδομένων Η μη κανονική κατανομή διορθώνεται με επεξεργασία των δεδομένων Πρέπει να ληφθούν υπόψη οι αναπάντητες ερωτήσεις

Missing data Μερικές φορές τα missing data έχουν προγραμματιστεί να υπάρχουν Για μεγάλες εξετάσεις και ερωτηματολόγια Ερωτηματολόγια με σύντομη και εκτεταμένη μορφή Άλλες φορές προκαλούνται από προβλήματα στη συλλογή δεδομένων Συνήθως δεν δημιουργούν μεγάλα πρoβλήματα <10% είναι εντάξει Missing at random είναι εντάξει Διαφορετικά αν οι αναπάντητες ερωτήσεις σχετίζονται με μια μεταβλητή σου, τότε υπάρχει πρόβλημα που δεν μπορεί να διορθωθεί στατιστικά

Αντιμετώπιση των missing cases Imputation Average (Μέσος όρος)- πιο κοινή μέθοδος Regression Pattern matching Listwise deletion Pairwise deletion (Matrix may not be positive definite)

Multicollinearity Όταν r>0.85 Οι μεταβλητές μετράνε το ίδιο πράγμα Οι μεταβλητές προέρχονται η μια από την άλλη Μπορεί να αφαιρεθεί η μια μεταβλητή ή να ενωθούν Διαφορετικά έχουμε non positive definite matrix

Outliers (ακραίες τιμές) Αν η τιμή είναι > 3* τυπική απόκλιση Λύσεις: Έλεγχος ορθότητας δεδομένων Αφαίρεση των δεδομένων του συγκεκριμένου ατόμου Επεξεργασία της μεταβλητής ή της τιμής

Κανονικότητα δεδομένων (Normality) Skewness Positive skew Negative skew Καλύτερα να είναι <|3| Kurtosis Leptokurtic Platykurtic Καλύτερα να είναι <|10| Corrected through transformations

Linearity and homoscedasticity (solved through transformations)

Άλλοι έλεγχοι Οι έλεγχοι να γίνονται μέσα σε κάθε ομάδα Αν το μέγεθος της διασποράς διαφέρει πολύ μεταξύ μεταβλητών, μπορεί να αλλαχτεί η μια κλίμακα (πχ. Πολλαπλασιασμός επί μια σταθερή τιμή) Ν>200 Αναλογία ατόμων προς μεταβλητές 20:1 ή 10:1

ΒΑΘΜΟΣ ΑΞΙΟΠΙΣΤΙΑΣ ΜΕΤΡΗΣΕΩΝ

Α ΞΙΟΠΙΣΤΙΑ (R ELIABILITY ) Τα αποτελέσματα ενός οργάνου μέτρησης είναι αξιόπιστα αν σε επαναλαμβανόμενες μετρήσεις ενός χαρακτηριστικού γνωρίσματος των υποκειμένων, και κάτω από τις ίδιες συνθήκες, δίνουν τα ίδια αποτελέσματα. (Οι διαφορές = σφάλμα μέτρησης) Η αξιοπιστία αναφέρεται στα αποτελέσματα του οργάνου μέτρησης και όχι στο όργανο αυτό καθαυτό

Σ ΦΑΛΜΑ ΜΕΤΡΗΣΗΣ Χ=Τ+Ε Τα σφάλματα μέτρησης είναι οι λόγοι που επηρεάζουν αρνητικά το βαθμό αξιοπιστίας των οργάνων μέτρησης.

Μ ΕΘΟΔΟΣ ΤΗΣ ΕΠΑΝΑΧΟΡΗΓΗΣΗΣ ( TEST RETEST ) 1 δοκίμιο, 2 χορηγήσεις, ίδια άτομα Διάστημα (2-4 βδομάδων) Προβλήματα: Μνήμη και άλλες μαθησιακές αλλαγές

Μ ΕΘΟΔΟΣ ΤΩΝ ΙΣΟΔΥΝΑΜΩΝ ΤΥΠΩΝ ( ALTERNATE FORM RELIABILITY ) 2 δοκίμιο, ίδια άτομα Χορήγηση (συνεχόμενη ή ξεχωριστά) (Συστήνεται η συνεχόμενη χορήγηση) Προβλήματα: Δυσκολία κατασκευής ισοδύναμων τύπων

Μ ΕΘΟΔΟΣ ΤΗΣ ΕΣΩΤΕΡΙΚΗΣ ΣΥΝΕΠΕΙΑΣ ( INTERNAL CONSISTENCY RELIABILITY ) Split half reliability Spearman Brown prophecy formula Kuder-Richardson Formula (KR-20, KR-21) Coefficient alpha (πιο διαδεδομένος) Δεν περιορίζεται σε βαθμολόγηση σωστό/λάθος

Α ΞΙΟΠΙΣΤΙΑ ΚΡΙΤΩΝ ( INTER - RATER RELIABILITY ) Συσχέτιση των κρίσεων των κριτών (Θέματα επιείκειας και αυστηρότητας)

Ε ΞΩΤΕΡΙΚΟΙ ΠΑΡΑΓΟΝΤΕΣ ΠΟΥ ΕΠΗΡΕΑΖΟΥΝ ΤΟ ΒΑΘΜΟ ΑΞΙΟΠΙΣΤΙΑΣ Ομοιογένεια εξεταζόμενων - Αριθμός ερωτήσεων + Χρήση ‘καλών’ ερωτήσεων + Σταθμισμένοι μέθοδοι χορήγησης +

B ΑΘΜOΙ ΑΞΙΟΠΙΣΤΙΑΣ >.90 άριστοι >80πολύ καλοί >.70 ικανοποιητικοί <.50 Χ

Ε ΓΚΥΡΟΤΗΤΑ Είναι μια έννοια η οποία αναφέρεται στο βαθμό επίτευξης του σκοπού για τον οποίο έγινε το όργανο μέτρησης Ένα όργανο μέτρησης έχει υψηλό βαθμό εγκυρότητας όταν μετρά τις πραγματικές διαφορές των ατόμων στο χαρακτηριστικό γνώρισμα για το οποίο έχει κατασκευαστεί

Ε ΓΚΥΡΟΤΗΤΑ ΠΕΡΙΕΧΟΜΕΝΟΥ ( CONTENT RELATED VALIDITY ) Αναφέρεται στο βαθμό που οι ερωτήσεις του δοκιμίου καλύπτουν το περιεχόμενο για το οποίο έχει σχεδιαστεί να μετρήσει. Πίνακας προδιαγραφών

Ε ΓΚΥΡOTΗΤΑ ΣΧΕΤΙΖΟΜΕΝΗ ΜΕ ΚΡΙΤΗΡΙΟ ( CRITERION RELATED VALIDITY ) Αναφέρεται στη σχέση μεταξύ του δοκιμίου και εξωτερικών παραγόντων που μετρούν άμεσα την έννοια προς μελέτη. Συντρέχουσα Προγνωστική

Ε ΓΚΥΡOΤΗΤΑ ΕΝΝΟΙΟΛΟΓΙΚHΣ ΚΑΤΑΣΚΕYHΣ ( CONSTRUCT RELATED VALIDITY ) Αναφέρεται στα αποδεικτικά στοιχεία με τα οποία ο εκπαιδευτικός προσπαθεί να πείσει ότι η αξιολόγηση μετρά τις έννοιες για τις οποίες έχει κατασκευαστεί για να μετρά.