Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Αναλυτική Στατιστική Μπουντζιούκα Βασιλική, MSc Βιοστατιστικός Εξωτ. Συνεργάτης ΕΣΔΥ Εθνική Σχολή Δημόσιας Υγείας, 16-11-2009.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Αναλυτική Στατιστική Μπουντζιούκα Βασιλική, MSc Βιοστατιστικός Εξωτ. Συνεργάτης ΕΣΔΥ Εθνική Σχολή Δημόσιας Υγείας, 16-11-2009."— Μεταγράφημα παρουσίασης:

1 Αναλυτική Στατιστική Μπουντζιούκα Βασιλική, MSc Βιοστατιστικός Εξωτ. Συνεργάτης ΕΣΔΥ Εθνική Σχολή Δημόσιας Υγείας,

2 Συμπερασματολογία  Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού  Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων (ατόμων) Χαρακτηριστικό: μέτρηση που αφορά όλα τα άτομα του πληθυσμού Δείγμα: υποσύνολο του πληθυσμού

3 Κλάδοι Στατιστικής  Παραμετρική: οι τιμές των παρατηρήσεων ακολουθούν μια γνωστή κατανομή (π.χ. κανονική)  Μη-παραμετρική: οι τιμές των παρατηρήσεων ακολουθούν κάποια μη γνωστή κατανομή

4 Έλεγχοι υποθέσεων  Λήψη απόφασης σε κάποιο επιστημονικό πρόβλημα  Υπολογισμός σφάλματος στην περίπτωση της εσφαλμένης απόφασης  Σε όλους τους στατιστικούς ελέγχους υποθέσεων έχουν οριστεί οι: Μηδενική υπόθεση Η ο : η υπόθεση εκείνη την οποία καλείται να απορρίψει ο ερευνητής  Απουσία σχέσης μεταξύ δύο χαρακτηριστικών Εναλλακτική υπόθεση Η 1 : η άρνηση της Η ο  Παρουσία σχέσης μεταξύ δύο χαρακτηριστικών

5 Στρατηγική  Βήματα: Καθορίζεται η Η ο Καθορίζεται μια πιθανότητα (συνήθως 0,05) η οποία είναι η μέγιστη πιθανότητα αποδεκτού σφάλματος Λαμβάνουμε ένα κατάλληλο δείγμα για τη μελέτη της ερευνητικής μας υπόθεσης Ανάλογα με τη μορφή της Η ο και την τιμή του στατιστικού κριτηρίου απορρίπτουμε την Η ο

6 Λήψη απόφασης Η επιλογή της κατάλληλης στατιστικής εξαρτάται από: τη φύση της μηδενικής υπόθεσης Η ο και της εναλλακτικής υπόθεσης Η 1 τη δύναμη του ελέγχου Πραγματική Κατάσταση της Ηο Η Η ο είναι αληθής (Α) Η Η ο είναι ψευδής (Ψ) Η Η ο είναι αληθής (Α) (αποδεκτή) Σωστή απόφαση, 1-α Σφάλμα Τύπου ΙΙ, β Η Η ο είναι ψευδής (Ψ) (απορρίπτεται) Σφάλμα Τύπου Ι, α, επίπεδο σημαντικότητας Σωστή απόφαση 1-β, δύναμη του ελέγχου

7 Επίπεδο σημαντικότητας  Η ακριβής τιμή του σφάλματος Τύπου Ι για τα δεδομένα του προβλήματος (επίπεδο σημαντικότητας, “p – value”, significance level) η πιθανότητα η ληφθείσα απόφαση να είναι υπέρ της ύπαρξης σχέσης, ενώ στην πραγματικότητα δεν υπάρχει σχέση  Θέλουμε να έχει πολύ μικρή τιμή  (συνήθως < 5%)  Μπορεί το επίπεδο σημαντικότητας p να είναι μικρό χωρίς απαραίτητα και η συσχέτιση να είναι βιολογικά ή κλινικά σημαντική

8 Στατιστική ισχύς  Η πιθανότητα να απορριφθεί η H o υπόθεση (δηλ. δεν υπάρχει σχέση), ενώ αυτή είναι εσφαλμένη Αυτό επιζητούμε σε κάθε έρευνα!!!

9 Τελική Επιλογή Υπόθεσης  Ορίζουμε το επίπεδο στατιστικής σημαντικότητας α, στο οποίο θα διεξαχθεί ο έλεγχος  p-value: η μικρότερη τιμή του α για την οποία απορρίπτεται η Η ο p-value < α τότε απορρίπτω την Η ο και αποδέχομαι την Η 1 p-value > α τότε δεν απορρίπτω την Η ο  Προσοχή τι δηλώνει η Η ο στην ερμηνεία του αποτελέσματος!!!

10 Έλεγχοι Υποθέσεων για Μέσους  Μέσος ενός πληθυσμού π.χ. αν το εισόδημα ενός πληθυσμού είναι 900€ Η ο : μ = 900€ vs. H 1 : μ ≠ 900€  Μέσοι δύο πληθυσμών Αξιολόγηση ενός χαρακτηριστικού σε δύο ανεξάρτητα δείγματα  π.χ. τη διαφορά της μέσης συστολικής αρτηριακής πίεσης σε άνδρες και γυναίκες  Η ο : ΣΑΠ(άνδρες) = ΣΑΠ(γυναίκες) vs. H 1 : ΣΑΠ(άνδρες) ≠ ΣΑΠ(γυναίκες) Μέτρηση ενός χαρακτηριστικού στα ίδια άτομα πριν και μετά  π.χ. διαφορά στο βάρος σώματος πριν και μετά την παρέμβαση  Η ο : Βάρος(πριν) = Βάρος(μετά) vs. H 1 : Βάρος(πριν) ≠ Βάρος(μετά)

11  Όταν θέλουμε να ελέγξουμε αν η μέση τιμή μιας μεταβλητής σε μια ομάδα Α διαφέρει από τη μέση τιμή μιας άλλης ομάδας Β Η μεταβλητή πρέπει να κατανέμεται κανονικά και στις 2 ομάδες Έλεγχος για την ισότητα των διακυμάνσεων  Στατιστικό κριτήριο: t-test του Student Η ο : μ1=μ2 έναντι Η 1 : μ1μ2 (αμφίπλευρος έλεγχος) ή Η 1 : μ1>μ2 ή μ1<μ2 (μονόπλευροι έλεγχοι)

12 Ανάλυση Διακύμανσης  Έλεγχος για την ύπαρξη διαφορών στις μέσες τιμές ενός ποσοτικού χαρακτηριστικού μεταξύ των κατηγοριών (>2) ενός άλλου χαρακτηριστικού π.χ. έλεγχος του σωματικού βάρους σε άτομα με καθιστική ζωή, με μέτρια φυσική δραστηριότητα, με έντονη φυσική δραστηριότητα  Η ο : μ1 = μ2 = μ3 vs. H 1 : οι μέσοι διαφέρουν για τουλάχιστον ένα ζεύγος Η μεταβλητή πρέπει να κατανέμεται κανονικά και στις 2 ομάδες Έλεγχος για την ισότητα των διακυμάνσεων

13 Έλεγχοι υποθέσεων για Ποιοτικές Μεταβλητές  Έλεγχος ανεξαρτησίας Χ 2 : δύο ομάδες (ασθενείς-μάρτυρες) εξετάζονται ως προς την έκθεσή τους σε κάποιο κίνδυνο Ελέγχουμε αν τα επίπεδα έκθεσης σε κάποιο παράγοντα διαφέρουν σε δύο ή περισσότερες κατηγορίες του χαρακτηριστικού  π.χ. Η ο : το σύνδρομο επαγγελματικής εξουθένωσης και η επαγγελματική κατάσταση είναι ανεξάρτητες vs. H 1 : οι δύο παράγοντες δεν είναι ανεξάρτητοι

14  Όσο πιο μεγάλες τιμές παίρνει το κριτήριο Χ 2 τόσο πιο κοντά είμαστε στο να απορρίψουμε την Η ο  Όσο πιο μικρές τιμές (0) παίρνει το κριτήριο Χ 2 τόσο πιο κοντά είμαστε στο να ΜΗΝ απορρίψουμε την Η ο

15  Το στατιστικό κριτήριο Χ2 μπορεί επίσης να χρησιμοποιηθεί για έλεγχο Ομοιογένειας:  π.χ. ελέγχουμε αν η κατανάλωση αλκοόλ διαφέρει στους ασθενείς απ’ ότι στους υγιείς και αν αυτό επηρεάζεται από το φύλο Καλής προσαρμογής: ελέγχουμε αν η κατανομή του πληθυσμού από όπου προέρχεται το δείγμα είναι μια δεδομένη θεωρητική κατανομή (κανονική)

16 Συσχέτιση  Εξετάζει κατά πόσο η μια μεταβλητή επηρεάζεται από την άλλη Απλή συσχέτιση: 2 μεταβλητές Πολλαπλή συσχέτιση: >2 μεταβλητές  Χαρακτηριστικά: Γραμμική – μη γραμμική Θετική – αρνητική Πλήρης Όχι συσχέτιση

17 Συντελεστές συσχέτισης  Εργαλεία στατιστικού ελέγχου r του Pearson (για συνεχείς και κανονικά κατανεμημένες μεταβλητές) ρ (rho) του Spearman (για διακριτές ή μη κανονικά κατανεμημένες μεταβλητές)

18 Συντελεστής Συσχέτισης Pearson  Ενδεδειγμένος για έλεγχο γραμμικής συσχέτισης μεταξύ δύο μεταβλητών  Δεν έχει μονάδες μέτρησης  Όρια: -1 ≤ ρ ≤ 1 -1 πλήρης αρνητική συσχέτιση +1 πλήρης θετική συσχέτιση 0 απουσία γραμμικής συσχέτισης  Αν δύο μεταβλητές είναι ανεξάρτητες είναι και ασυσχέτιστες Δεν ισχύει το αντίθετο!!!

19 Συντελεστής Συσχέτισης Τάξεως Spearman  Ενδείκνυται όταν μια από τις δύο μεταβλητές που εξετάζουμε είναι διατάξιμη  Εναλλακτικός του συντελεστή συσχέτισης Pearson όταν τα δεδομένα παρουσιάζουν ασυμμετρία  Όταν οι δύο μεταβλητές είναι κατηγορικές αλλά μπορούν να διαταχθούν  Όρια: -1 ≤ spearman’s rho ≤ 1

20 Συντελεστής Συμφωνίας Kendall’s-tau  Μετρά το βαθμό συμφωνίας μεταξύ δύο ποσοτικών ή διατάξιμων μεταβλητών  Όρια: -1 ≤ kendall’s tau ≤ 1

21 -1 … -0,8-0,8 … -0,3-0,3 … +0,3+0,3 … +0,8+0,8 … +1 Ισχυρή αρνητική συσχέτιση Μέτρια αρνητική συσχέτιση Ελαφρά συσχέτιση ή ασυσχέτιστα Μέτρια θετική συσχέτιση Ισχυρή θετική συσχέτιση Η παραπάνω κατηγοριοποίηση δεν εκφράζει στατιστική σημαντικότητα Για να γνωρίζουμε αν η παρατηρηθείσα συσχέστιση είναι το ίδιο σημαντική και στον πληθυσμό πρέπει να γίνει ο κατάλληλος στατιστικός έλεγχος που θα δώσει και το αντίστοιχο σφάλμα (p)

22 Σύνοψη Ο συντελεστής συσχέτισης εκφράζει μόνο την «ένταση» της γραμμικής σχέσης Αν η τιμή του είναι 0 σημαίνει ότι δεν υπάρχει γραμμική συσχέτιση μεταξύ των μεταβλητών. Αυτό όμως δεν αποκλείει τη δυνατότητα να υπάρχει μη γραμμική συσχέτιση Η τιμή του συντελεστή δεν προσδιορίζει την ευθεία γύρω από την οποία συγκεντρώνονται τα σημεία του διαγράμματος. Δηλαδή δεν προσδιορίζει την κλίση και το σταθερό όρο της ευθείας Ο συντελεστής συσχέτισης δίνει ένα μέτρο της γραμμικής συσχέτισης των μεταβλητών Χ και Υ αλλά δεν προσδιορίζει την αιτιώδη σχέση που τις συνδέει, δηλαδή δεν προσδιορίζει ποιο είναι το αίτιο και ποιο το αποτέλεσμα Έτσι είναι δυνατόν η Χ να επηρεάζει την Υ, ή αντίστροφα ή και τα δύο να συμμεταβάλονται διότι εξαρτώνται από μια τρίτη μεταβλητή ή τέλος η συσχέτιση που βρέθηκε στο δείγμα να οφείλεται στην τύχη ή σε κάποιο συστηματικό σφάλμα

23 Γραμμική Παλινδρόμηση (Ι)  Τεχνική που προσδιορίζει ποια η αιτία και ποιο το αποτέλεσμα  Πόσο μεταβάλλεται η τιμή μιας μεταβλητής Υ (εξαρτημένης) από την μεταβολή μιας άλλης μεταβλητής Χ (ανεξάρτητης) Η Υ στη γραμμική παλινδρόμηση είναι συνεχής Υποθέσεις:  Γραμμική σχέση Υ κ Χ  Γνωρίζουμε όλες τις τιμές της Χ

24 Γραμμική Παλινδρόμηση (ΙΙ) Απλή: ένας ανεξάρτητος παράγοντας Πολλαπλή: πολλοί ανεξάρτητοι παράγοντες  b o : σταθερός όρος, η τιμή Υ για Χ i =0  b i : κλίση της ευθείας, συντελεστής παλινδρόμησης (i=1,2,..,k)  εκφράζει την κατά μέσο όρο μεταβολή στην εξαρτημένη μεταβλητή, όταν η αντίστοιχη ανεξάρτητη μεταβλητή μεταβάλλεται κατά μια μονάδα και οι άλλες μεταβλητές παραμένουν σταθερές

25 Γραμμική Παλινδρόμηση (ΙΙΙ)  Προϋποθέσεις: Κανονικότητα: οι παρατηρήσεις προέρχονται από πληθυσμό ο οποίος ακολουθεί την κανονική κατανομή Ομοσκεδαστικότητα: η διασπορά της Υ είναι η ίδια για κάθε τιμή της Χ Ανεξαρτησία: η τιμή της Υ i δεν επηράζει την τιμή της Υ j (i≠j, i, j=1,2,…,n) Οι τιμές των ανεξάρτητων μεταβλητών Χ i παραμένουν σταθερές σε επανειλημμένα δείγματα Οι τιμές των Χ & Υ έχουν μετρηθεί χωρίς σφάλματα  Τα σφάλματα της παλινδρόμησης, έχουν μέση τιμή μηδέν (0) για κάθε τιμή της Χ και διακύμανση ανεξάρτητη από τις τιμές της Χ  Σφάλματα μέτρησης, παράλειψη προσθήκης σημαντικών μεταβλητών

26 Συσχέτιση vs Παλινδρόμηση  Οι μεταβλητές Χ κ Υ είναι τυχαίες  Δείχνει την παρουσία ή όχι σχέσης μεταξύ δύο μεταβλητών  Μετράει την ένταση της σχέσης  Θετική συσχέτιση  θετική κλίση της ευθείας παλινδρόμησης  Η μεταβλητή Υ είναι τυχαία  Η μεταβλητή Χ είναι καθορισμένη  Δείχνει το βαθμό μεταβολής μιας μεταβλητής, αν μεταβάλλεται μια ή περισσότερες μεταβλητές  Μαθηματική σχέση μεταξύ Υ & Χ ΣυσχέτισηΠαλινδρόμηση

27 Λογαριθμιστική Παλινδρόμηση (Ι)  Η εξαρτημένη μεταβλητή Υ είναι δίτιμη Παίρνει τις τιμές 0 (π.χ. υγιείς, μη καπνιστές) & 1 (π.χ. ασθενείς, καπνιστές)  Αναδρομικές μελέτες (ασθενών-μαρτύρων) Τυχαιοποίηση ως προς την έκθεση Εκτιμάμε τον Σχετικό Λόγο (Odds Ratio): η πιθανότητα να έχουν εκτεθεί σε κάποιο παράγοντα οι νοσούντες σε σχέση με τους μη νοσούντες  Προοπτικές μελέτες Τυχαιοποίηση ως προς το συμβάν Εκτιμάμε το Σχετικό Κίνδυνο (Risk Ratio): ο κίνδυνος να νοσήσουν οι εκτεθέντες σε κάποιο παράγοντα προς τους μη εκτεθέντες

28 Λογαριθμιστική Παλινδρόμηση (ΙΙ)  Η πιθανότητα π(Χ) είναι συνήθως συνάρτηση μιας ή περισσοτέρων μεταβλητών {Χ} (ανεξάρτητες μεταβλητές) οι οποίες ερμηνεύουν σε μικρό ή μεγάλο βαθμό την π, δηλαδή την πιθανότητα της παρουσίας μιας κατάστασης Η πιθανότητα να συμβεί ένα γεγονός για δεδομένες τιμές των ανεξάρτητων μεταβλητών Χ i

29 Λογαριθμιστική Παλινδρόμηση (ΙΙΙ)  Η πιθανότητα π(Χ) είναι συνήθως συνάρτηση μιας ή περισσοτέρων μεταβλητών {Χ} (ανεξάρτητες μεταβλητές) οι οποίες ερμηνεύουν σε μικρό ή μεγάλο βαθμό την π, δηλαδή της πιθανότητα της παρουσίας μιας κατάστασης

30 Ευχαριστώ!!!


Κατέβασμα ppt "Αναλυτική Στατιστική Μπουντζιούκα Βασιλική, MSc Βιοστατιστικός Εξωτ. Συνεργάτης ΕΣΔΥ Εθνική Σχολή Δημόσιας Υγείας, 16-11-2009."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google