ΕΛΕΓΧΟΣ ΑΝΕΞΑΡΤΗΣΙΑΣ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ
Advertisements

Ανάλυση Πολλαπλής Παλινδρόμησης
διαστήματα εμπιστοσύνης
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
Μπουντζιούκα Βασιλική, MSc Βιοστατιστικός Εξωτ. Συνεργάτης ΕΣΔΥ
Factorial Analysis of Variance – Παραγοντική Ανάλυση Διακύμανσης
ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Α’ εξάμηνο
Τμήμα Πολιτικών Μηχανικών ΠΘ, Αξιολόγηση αποτελεσμάτων βελτίωσης.
ΚΕΦΑΛΑΙΟ 5 ΧΩΡΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ
Στατιστική Ι Παράδοση 9 Ο Δείκτης Συσχέτισης.
ΚΕΦΑΛΑΙΟ 6 ΓΕΩΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ: ΣΗΜΕΙΑ
ΚΕΦΑΛΑΙΟ 10 ΠΑΛΙΝΔΡΟΜΗΣΗ
Πηγή: Βιοστατιστική [Β.Γ. Σταυρινός, Δ.Β. Παναγιωτάκος]
ΣΤΑΤΙΣΤΙΚΗ ΕΠΑΓΩΓΗ: ΣΗΜΕΙΑΚΕΣ ΕΚΤΙΜΗΣΕΙΣ & ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
Αρχές επαγωγικής στατιστικής
Τι είναι η Κατανομή (Distribution)
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
TO ΣΤΑΤΙΣΤΙΚΟ ΚΡΙΤΗΡΙΟ t (Ελεγχος Διαφορων Μεσων Ορων Αναμεσα Σε Δυο Ανεξαρτητα Δειγματα) Για τον ελεγχο στατιστικών υποθέσεων ανάμεσα στους μέσους όρους.
ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ - ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Δρ. Κουνετάς Η Κωνσταντίνος.
Στατιστικές Υποθέσεις III (Ερευνητικά Ερωτήματα / Υποθέσεις προς επιβεβαίωση)
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 2: Επαγωγική Στατιστική Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και Αγωγής.
Έλεγχος υποθέσεων για αναλογίες. Εάν έχουμε αναλογίες σχετικά με ένα συγκεκριμένο χαρακτηριστικό σε έναν πληθυσμό τότε κάνουμε ελέγχους υποθέσεων για.
Διαστήματα εμπιστοσύνης – δοκιμή t Δ. Κομίλης. Είναι διαφορετικές οι διεργασίες?
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. –Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας.
Έλεγχος Υποθέσεων Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης, Κατά την εκτέλεση ενός στατιστικού ελέγχου,
Διαστήματα Εμπιστοσύνης για αναλογίες. Ποιοτικές μεταβλητές χαρακτηρίζονται εκείνες οι οποίες τα στοιχεία τους δεν έχουν μετρηθεί με κάποιον τρόπο – οι.
Διάστημα εμπιστοσύνης για τη διακύμανση. Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως Όταν τα δεδομένα αφορούν πληθυσμό – μ είναι ο μέσος του πληθυσμού.
Γραμμική Συσχέτιση, Απλή και Πολλαπλή Γραμμική Παλινδρόμηση (Εργαστήριο Σχολής Κοινωνικών Επιστημών)
Δραματική Τέχνη στην εκπαίδευση: Ερευνητικό Σχέδιο Ι Στις ανθρωπιστικές επιστήμες επικράτησαν δύο ερευνητικές κατευθύνσεις: Η στατιστική ανάλυση (συνυπολογίζει.
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΙΝΑΚΕΣ ΚΑΙ ΔΙΑΓΡΑΜΜΑΤΑ Πηγή: Βιοστατιστική [Σταυρινός / Παναγιωτάκος] Βιοστατιστική [Τριχόπουλος / Τζώνου / Κατσουγιάννη]
Μεθοδολογία έρευνας και στατιστική – Δείγμα – Διαφορά μέσων τιμών
ΔΙΑΛΕΞΗ 11η Ποσοτική έρευνα υγείας
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Έλεγχος ανεξαρτησίας (συσχέτισης) 2 κατηγορικών μεταβλητών
Πηγή: ‘Βιοστατιστική’ [Β.Γ. Σταυρινός, Δ.Β.Παναγιωτάκος]
Έλεγχος υποθέσεων με την χ2 «χι -τετράγωνο» κατανομή
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Ανάλυση- Επεξεργασία των Δεδομένων
Μεθοδολογία έρευνας και στατιστική – Δείγμα –Κατανομές
Μέτρα μεταβλητότητας ή διασποράς
Επαγωγική Στατιστική Εκτίμηση και Έλεγχος μέσων τιμών Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Εκτιμητική: σημειακές εκτιμήσεις παραμέτρων
Έλεγχος Υπόθεσης για το μέσο ενός πληθυσμού
Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
Κανονικότητα Μια από τις υποθέσεις του υποδείγματος της γραμμικής παλινδρόμησης είναι ότι ο διαταρακτικός όρος κατανέμεται κανονικά με μέσο μηδέν και σταθερή.
5o Μάθημα: Το τεστ χ2 Κέρκυρα.
Πολυσυγγραμμικότητα Εξειδίκευση
Έλεγχος υποθέσεων με την χ2 «χι -τετράγωνο» κατανομή
Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική
Μορφές κατανομών Αθανάσιος Βέρδης.
Ομαδοποιημένη Κατανομή Συχνοτήτων
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
ΤΕΙ Δυτικής Μακεδονίας Τμήμα Λογιστικής & Χρηματοοικονομικής
Εφαρμογές Στατιστικής στην Τεχνολογία Τροφίμων (Θ)
ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ
Επαγωγική Στατιστική Συσχέτιση – Συντελεστής συσχέτισης Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
ΜΗ ΠΑΡΑΜΕΤΡΙΚΟΙ ΕΛΕΓΧΟI ΥΠΟΘΕΣΕΩΝ
ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Η ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ Β. ΚΑΡΑΓΙΑΝΝΗ
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Τ. Ε. Ι. Αθήνας Τμήμα Ιατρικών Εργαστηρίων ΒΙΟΣΤΑΤΙΣΤΙΚΗ
ΤΕΙ Αθήνας Βιοστατιστική (Θ)
Μεθοδολογία Έρευνας Διάλεξη 9η: Ανάλυση Ποσοτικών Δεδομένων
Στατιστικές Υποθέσεις III
Κεφάλαιο 9 Βασικές Αρχές Του Ελέγχου Υποθέσεων: Έλεγχοι Ενός Δείγματος.
Ανάλυση Διασποράς (ANOVA) Κατά Έναν Παράγοντα
Επαγωγική Στατιστική Συσχέτιση – Συντελεστές συσχέτισης Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Ανάλυση διακύμανσης Τι είναι η ανάλυση διακύμανσης
Μεταγράφημα παρουσίασης:

ΕΛΕΓΧΟΣ ΑΝΕΞΑΡΤΗΣΙΑΣ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ B. KAΡΑΓΙΑΝΝΗ

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ - ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Tα διαστήματα εμπιστοσύνης δίνουν πληρέστερη πληροφορία σε σχέση με τον έλεγχο υποθέσεων καθώς δίνουν φάσμα πιθανών τιμών για την πραγματική τιμή της παραμέτρου. Ο αντίστοιχος έλεγχος υποθέσεων έχει να κάνει με το εάν η τιμή της παραμέτρου είναι ίση με κάποια υποθετική τιμή ή κάποια άλλη πρωτύτερα γνωστή τιμή

ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΑΖΙ ΜΕ ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ : ΓΙΑΤΙ; Α ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΠΟΥ ΕΠΙΚΑΛΥΠΤΟΝΤΑΙ ΠΛΗΡΩΣ . . . Β. ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΠΟΥ ΔΕΝ ΕΠΙΚΑΛΥΠΤΟΝΤΑΙ . . Γ. ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΠΟΥ ΕΠΙΚΑΛΥΠΤΟΝΤΑΙ ΜΕΡΙΚΩΣ . . Ο έλεγχος υποθέσεων μας δίνει την απάντηση

ΠΟΙΑ Η ΣΧΕΣΗ ΜΕΤΑΞΥ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ ΚΑΙ ΕΛΕΓΧΟΥ ΥΠΟΘΕΣΕΩΝ; Υπάρχει μια εξαιρετικά στενή σχέση μεταξύ διαστημάτων εμπιστοσύνης και δοκιμασίας υποθέσεων. Όταν κατασκευάζεται ένα διάστημα εμπιστοσύνης 95%, όλες οι τιμές στο διάστημα θεωρούνται εύλογες τιμές για την εκτιμώμενη παράμετρο. Οι τιμές εκτός του διαστήματος απορρίπτονται ως σχετικά μη αξιόπιστες. Εάν η τιμή της παραμέτρου που καθορίζεται από την μηδενική υπόθεση περιέχεται στο διάστημα 95% τότε η μηδενική υπόθεση δεν μπορεί να απορριφθεί στο επίπεδο 0.05. Εάν η τιμή που καθορίζεται από τη μηδενική υπόθεση δεν είναι στο διάστημα τότε η μηδενική υπόθεση μπορεί να απορριφθεί στο επίπεδο 0.05.

ΕΙΔΙΚΕΣ ΠΕΡΙΠΤΩΣΕΙΣ ΡΑΒΔΟΓΡΑΜΜΑΤΩΝ: ΑΠΕΙΚΟΝΙΣΗ ΤΗΣ ΑΠΟ ΚΟΙΝΟΥ ΣΥΜΠΕΡΙΦΟΡΑΣ ΔΥΟ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ Όταν έχουμε να απεικονίσουμε πίνακα διπλής εισόδου (two way table) δηλ. πίνακα που παρέχει πληροφορίες για 2 πληθυσμιακά χαρακτηριστικά ταυτόχρονα χρησιμοποιούμε ενοποιημένο ραβδόγραμμα (clustered bar chαrt) ή σωρευμένο (stacked bar chart). 5

Παραδειγμα χρήσης ειδικού τύπου ραβδογραμμάτων   ΧΡΗΣΤΕΣ ΜΗ ΧΡΗΣΤΕΣ ΣΥΝΟΛ Α ΚΑΠΝΙΣΤΕΣ 70 20 90 ΜΗ ΚΑΠΝΙΣΤΕΣ 30 80 110  ΣΥΝΟΛΑ 100 200 6

Ενοποιημένο ραβδόγραμμα (clustered bar chαrt) 7

Σωρευμένο (stacked bar chart). 8

Η συνάφεια και τα χαρακτηριστικά της Στην Στατιστική ο όρος συνάφεια (contingency) αναφέρεται στον τρόπο με τον οποίο δύο ή περισσότερες μεταβλητές συμεταβάλλονται και καθορίζει την κατεύθυνση και τον βαθμό μεταβολής που παρατηρείται στις τιμές της μιας μεταβλητής, όταν συμβαίνει αλλαγή στις αντίστοιχες τιμές της άλλης. 9

Η συνάφεια χαρακτηρίζεται από: 1) την κατεύθυνση (θετική ή αρνητική) 2) το βαθμό (απόλυτη ή σχετική) 3) τη μορφή (ευθύγραμμη ή καμπυλόγραμμη) Η συνάφεια μεταξύ των μεταβλητών Χ και Υ χαρακτηρίζεται ως • θετική (positive) αν αυξανομένων (ή ελαττωμένων) των τιμών της Χ αυξάνονται ή (ελαττώνονται) οι τιμές της Υ αντίστοιχα • αρνητική (negative) αν αυξανομένων (ή ελαττωμένων) των τιμών της Χ ελαττώνονται (ή αυξάνονται) οι τιμές της αντίστοιχα • θετική και απόλυτη όταν η μεγαλύτερη τιμή της Χ αντιστοιχεί στην μεγαλύτερη τιμή της Υ, η δεύτερη μεγαλύτερη τιμή της Χ στην δεύτερη αμέσως μεγαλύτερη τιμή της Υ κ.ο.κ. • αρνητική και απόλυτη όταν η μεγαλύτερη τιμή της Χ αντιστοιχεί στην μικρότερη τιμή της Υ, η δεύτερη μεγαλύτερη τιμή της Χ στην προτελευταία τιμή της Υ κ.ο.κ. 10

Πίνακες συνάφειας διαστάσεων 2Χ2 Στο φατνίο (i,j) i=1, 2 j=1, 2 αντιστοιχεί η συχνότητα fij, και δίνει τον αριθμό των στοιχείων του πίνακα που αντιστοιχούν στο επίπεδο i του παράγοντα Α και στο επίπεδο j του παράγοντα Β. 11

Στο φατνίο (i,j) i=1, 2, …, r, j=1, 2, …, c αντιστοιχεί η συχνότητα fij, και δίνει τον αριθμό των στοιχείων του πίνακα που αντιστοιχούν στο επίπεδο i του παράγοντα Α και στο επίπεδο j του παράγοντα Β. 12

Στο φατνίο (i,j) i=1, 2, …, r, j=1, 2, …, c αντιστοιχεί η συχνότητα fij, και δίνει τον αριθμό των στοιχείων του πίνακα που αντιστοιχούν στο επίπεδο i του παράγοντα Α και στο επίπεδο j του παράγοντα Β. 13

Χί-τετράγωνο (Chi-square) Χρησιμοποιείται για κατηγορικά δεδομένα στις ακόλουθες περιπτώσεις: Ως τεστ ομοιογένειας/ανεξαρτησίας (homogeneity test, contingency tables test) Ως τεστ καλής προσαρμογής (goodness of fit). 14

ΠΑΡΑΔΕΙΓΜΑΤΑ Τεστ ομοιογένειας: Πίνακας συνάφειας που περιλαμβάνει 1. Πληθυσμιακές ομάδες 2. Βαθμό ικανοποίησης από το προιόν Α. Τεστ ανεξαρτησίας: Πίνακας συνάφειας που περιλαμβάνει: Κάπνισμα (Ναι-Όχι) και συχνότητα χρήσης υπερτροφών (Ναι-Όχι) 15

Χί-τετράγωνο (Chi-square) 16

ΔΙΑΦΟΡΑ ΜΕΤΑΞΥ ΤΕΣΤ ΟΜΟΙΟΓΕΝΕΙΑΣ ΚΑΙ ΑΝΕΞΑΡΤΗΣΙΑΣ Υπόκεινται στις ίδιες υπολογιστικές διαδικασίες . Στη μεν όμως περίπτωση της ομοιογένειας μας ενδιαφέρει να ελέγξουμε αν 2 ή περισσότερα δείγματα προέρχονται ή όχι από τον ίδιο πληθυσμό ενώ στην περίπτωση της ανεξαρτησίας μας ενδιαφέρει αν ένα χαρακτηριστικό επηρεάζει ή όχι ένα άλλο. 17

ΒΗΜΑΤΑ ΥΠΟΛΟΓΙΣΜΟΥ ΤΟΥ Χί-τετράγωνο 1. Φτιάχνω τον πίνακα των παρατηρούμενων συχνοτήτων. 2. Θέτω τη μηδενική και εναλλακτική υπόθεση (π.χ : Η0 :οι 2 παράγοντες είναι ανεξάρτητοι έναντι της: Η1 : οι 2 παράγοντες δεν είναι ανεξάρτητοι)

ΒΗΜΑΤΑ ΥΠΟΛΟΓΙΣΜΟΥ ΤΟΥ Χί-τετράγωνο 3. Υπολογίζω και βάζω σε πίνακα τις αναμενόμενες θεωρητικές συχνότητες: Mας δείχνει πως θα ήταν διαμορφωμένες οι παρατηρούμενες συχνότητες κάτω από τη μηδενική υπόθεση. Οσο πιο μακριά βρίσκονται οι τιμές μεταξύ παρατηρούμενων και θεωρητικών συχνοτήτων τόσο πιο μακριά είμαστε από την υπόθεση αποδοχής της ανεξαρτησίας. ΠΡΟΣΟΧΗ: Για να εφαρμοστεί θα πρέπει όχι πάνω από 20% των αναμενόμενων συχνοτήτων να έχουν τιμή<5

ΒΗΜΑΤΑ ΥΠΟΛΟΓΙΣΜΟΥ ΤΟΥ Χί-τετράγωνο 4. Υπολογίζω τον πίνακα σφαλμάτων (προαιρετικά) 5. Υπολογίζω την ποσότητα χ2 Όπου οι παρατηρηθείσες και οι αναμενόμενες συχνότητες αντίστοιχα και r, c o αριθμός γραμμών και στηλών. Οι βαθμοί ελευθερίας είναι (c-1)(r-1). Εάν η τιμή που βρήκα υπερβαίνει την τιμή των πινάκων σε επίπεο στατιστικής σημαντικότητας α απορρίπτω τη μηδενική υπόθεση 20

ΠΑΡΑΔΕΙΓΜΑ ΣΕ ΕΛΕΓΧΟ ΑΝΕΞΑΡΤΗΣΙΑΣ Kατανάλωση προιόντων με χαμηλά λιπαρά. 21

Ελέγχω την υπόθεση H0 : οι 2 παράγοντες είναι ανεξάρτητοι, έναντι της εναλλακτικής: Η1: οι 2 παράγοντες δεν είναι ανεξάρτητοι 22

ΠΙΝΑΚΑΣ ΑΝΑΜΕΝΟΜΕΝΩΝ Η ΘΕΩΡΗΤΙΚΩΝ ΣΥΧΝΟΤΗΤΩΝ 23

AΠΑΝΤΗΣΗ Άρα σε επίπεδο σημαντικότητας 5% και με 1 βαθμό ελευθερίας απορρίπτω την ανεξαρτησία μεταξύ των 2 παραγόντων 24

Πίνακας των τιμών της κατανομής χ2 για τις οποίες: Πίνακας των τιμών της κατανομής χ2 για τις οποίες:

ΠΑΡΑΔΕΙΓΜΑ Σχέση μεταξύ των απόψεων για ανάπτυξη της τοπικής επιχειρηματικότητας και την ανάπτυξη της τοπικής αγοράς εργασίας μετά την ιδιωτικοποίηση του λιμανιού του Πειραιά . 26

ΠΙΝΑΚΑΣ ΑΝΑΜΕΝΟΜΕΝΩΝ Η ΘΕΩΡΗΤΙΚΩΝ ΣΥΧΝΟΤΗΤΩΝ 27

28

ΠΑΡΑΤΗΡΗΘΕΙΣΕΣ ΣΥΧΝΟΤΗΤΕΣ 29

30