Διαλέξεις στη Βιοστατιστική Διαλέξεις στη Βιοστατιστική Γεώργιος Αντωνογεώργος,MSc, PhD Παιδίατρος, Βιοστατιστικός-Επιδημιολογός Μετα-διδακτορικός Συνεργάτης, Τμήμα Επιστήμης Διαιτολογίας – Διατροφής 1
Πληροφορίες επικοινωνίας μαθήματος Eclass μαθήματος: eclass.uoa.gr Βιοστατιστική (MED412) Εγγραφή στην υπηρεσία: email χρήστη Ελεύθερη εγγραφή
Υλη του μαθήματος Περιγραφική στατιστική Επαγωγική στατιστική Ορισμός της Στατιστικής Περιγραφική στατιστική Επαγωγική στατιστική Κλασσικές μέθοδοι Έλεγχοι υποθέσεων Συσχέτιση Παλινδρόμηση Απλή γραμμική παλινδρόμηση Πολλαπλή γραμμική παλινδρόμηση Λογαριθμική παλινδρόμηση Άλλα μοντέλα εξάρτησης Μη παραμετρικές μέθοδοι
Η έρευνα είναι το μέσο για την αποκτηση γνώσης Γνώση Τυχαία Συστηματικά Έρευνα (εργαστηριακή, κλινική, πληθυσμιακή) Ανάλυση των δεδομένων Δεδομένα Πειραματικά Βιοστατιστική Άνθρωποι Ερμηνεία & Συμπεράσματα
Κάθε έρευνα ακολουθεί συγκεκριμένα βήματα
Η έρευνα περιέχει δεδομένα και ανάγκη για επεξεργασία τους «Συστηματική εξέταση δεδομένων για την επιβεβαίωση, τον εμπλουτισμό, ή την ανακάλυψη νέων στοιχείων». Μπαμπινιώτης Γ. Λεξικό της Νέας Ελληνικής Γλώσσας, 2002
Τι είναι η Βιοστατιστική; Η βιοστατιστική συνεισφέρει στον σχεδιασμό και στην ορθή, «ασφαλή» εξαγωγή συμπερασμάτων από την έρευνα στο χώρο της ιατρικής και της βιολογίας. Παράδειγμα Ένας ερευνητής χορήγησε τη «δίαιτα Α» σε 1000 ασθενείς με ΟΕΜ και τη «δίαιτα Β» σε άλλους 1000 ασθενείς με ΟΕΜ. Μετά από 12 μήνες η μέση τιμή της ολικής χοληστερόλης στην κάθε ομάδα ήταν…
Είναι οι τιμές συγκρίσιμες; Είναι οι τιμές συγκρίσιμες; Μέση τιμή δείγματος = 215 mg/dl Μέση τιμή δείγματος = 215 mg/dl Μέση τιμή δείγματος = 215 mg/dl Μέση τιμή δείγματος = 215 mg/dl Μέση τιμή δείγματος = 215 mg/dl ΕΡΩΤΗΜΑ Μπορεί να ισχυριστεί κανείς ότι η δίαιτα Α μείωσε τα επίπεδα ολικής χοληστερόλης σε σύγκριση με τη δίαιτα Β, σε ασθενείς με ΟΕΜ; ΕΡΩΤΗΜΑ Μπορεί να ισχυριστεί κανείς ότι η δίαιτα Α μείωσε τα επίπεδα ολικής χοληστερόλης σε σύγκριση με τη δίαιτα Β, σε ασθενείς με ΟΕΜ; ΕΡΩΤΗΜΑ Μπορεί να ισχυριστεί κανείς ότι η δίαιτα Α μείωσε τα επίπεδα ολικής χοληστερόλης σε σύγκριση με τη δίαιτα Β, σε ασθενείς με ΟΕΜ; ΕΡΩΤΗΜΑ Μπορεί να ισχυριστεί κανείς ότι η δίαιτα Α μείωσε τα επίπεδα ολικής χοληστερόλης σε σύγκριση με τη δίαιτα Β, σε ασθενείς με ΟΕΜ; ΕΡΩΤΗΜΑ Μπορεί να ισχυριστεί κανείς ότι η δίαιτα Α μείωσε τα επίπεδα ολικής χοληστερόλης σε σύγκριση με τη δίαιτα Β, σε ασθενείς με ΟΕΜ; ΕΡΩΤΗΜΑ Μπορεί να ισχυριστεί κανείς ότι η δίαιτα Α μείωσε τα επίπεδα ολικής χοληστερόλης σε σύγκριση με τη δίαιτα Β, σε ασθενείς με ΟΕΜ; ΕΡΩΤΗΜΑ Μπορεί να ισχυριστεί κανείς ότι η δίαιτα Α μείωσε τα επίπεδα ολικής χοληστερόλης σε σύγκριση με τη δίαιτα Β, σε ασθενείς με ΟΕΜ; ΕΡΩΤΗΜΑ Μπορεί να ισχυριστεί κανείς ότι η δίαιτα Α μείωσε τα επίπεδα ολικής χοληστερόλης σε σύγκριση με τη δίαιτα Β, σε ασθενείς με ΟΕΜ; Ολική χοληστερόλη (mg/dl) Ολική χοληστερόλη (mg/dl) Ολική χοληστερόλη (mg/dl) Ολική χοληστερόλη (mg/dl) Ολική χοληστερόλη (mg/dl) Ολική χοληστερόλη (mg/dl) Ολική χοληστερόλη (mg/dl) Ολική χοληστερόλη (mg/dl) Μέση τιμή δείγματος = 165 mg/dl Μέση τιμή δείγματος = 165 mg/dl Μέση τιμή δείγματος = 165 mg/dl Μέση τιμή δείγματος = 165 mg/dl Μέση τιμή δείγματος = 165 mg/dl Μέση τιμή δείγματος = 165 mg/dl Μέση τιμή δείγματος = 165 mg/dl Μέση τιμή δείγματος = 165 mg/dl Δίαιτα Β Δίαιτα Β Δίαιτα Β Δίαιτα Β Δίαιτα Α Δίαιτα Α Δίαιτα Α
Η άμεση σύγκριση αγνοεί την μεταβλητότητα Μέση τιμή δείγματος = 215 45 mg/dl Τα 2 δείγματα έχουν πολύ μεγάλο κοινό εύρος τιμών, γεγονός που κάνει την σύγκριση των μέσων τιμών αναξιόπιστη. Ολική χοληστερόλη (mg/dl) Μέση τιμή δείγματος = 165 97 mg/dl Δίαιτα Β Δίαιτα Α
Λάθος μεθοδολογία οδηγεί σε λάθος συμπεράσματα..
Στατιστικά προγράμματα στην Βιοστατιστική Απαραίτητα εργαλεία για τον ερευνητή Μη εξειδικευμένα MS EXCEL Εξειδικευμένα Mintab SPSS Stata SAS R κ.α
Βασικές έννοιες Βιοστατιστικής-Πληθυσμός Οποιοδήποτε σύνολο στοιχείων ( π.χ. ατόμων, εισαγωγών σε νοσοκομείο ) με κοινά χαρακτηριστικά και μπορεί να μελετηθεί Σπάνια, και συνήθως ποτέ, δεν μπορεί να μελετηθεί στο σύνολό του Προσεγγίζεται με την επιλογή του κατάλληλου δείγματος
Βασικές έννοιες Βιοστατιστικής-Δείγμα Υποσύνολο του πληθυσμού Πρέπει να είναι Τυχαίο και αντιπροσωπευτικό Επαρκές ( ικανού μεγέθους) Η σχέση μεταξύ δείγματος και πληθυσμού χαρακτηρίζεται από αβεβαιότητα, η οποία πρέπει να ποσοτικοποιηθεί με την χρήση της Θεωρίας Πιθανοτήτων Γενίκευση συμπερασμάτων στον πληθυσμό
Βασικές έννοιες - Σχηματικά Πληθυσμός Δείγμα Αντιπροσωπευτικότητα Δείγμα Επάρκεια
Βασικές έννοιες Βιοστατιστικής Μεταβλητή Κάθε χαρακτηριστικό που μπορεί να μεταβληθεί ή να διαφοροποιηθεί κατά χρόνο τόπο άτομο ομάδα Παράδειγμα: ηλικία, φύλο, ύψος, βάρος, εισόδημα κτλ
Η ανάγκη χρήσης μεταβλητών Έννοιες Άγχος, μόρφωση, διατροφή κλπ Χαρακτηριστικά Φύλο, επάγγελμα κλπ Μεγέθη Ηλικία, βάρος, λιπίδια κλπ Υπάρχει ανάγκη ποσοτικής αποτίμησης ΜΕΤΑΒΛΗΤΕΣ
Είδη μεταβλητών Ποιοτικές, κατηγορικές (Qualitative, Categorical) Μεταβλητές που δεν μπορούν να μετρηθούν Μπορεί όμως να μετρηθούν τα άτομα που έχουν το χαρακτηριστικό Διατάξιμες: Βαρύτητα νόσου, Κάπνισμα Μη διατάξιμες ( κατηγορικές) : Φύλο, Πάσχοντες ή μη από μια νόσο Ποσοτικές (Quantitative) Μεταβλητές που μπορούν να μετρηθούν Συνεχείς: Ηλικία, βάρος, εισόδημα ( τιμές με πολλά δεκαδικά ψηφία ) Διακριτές: Αριθμός παιδιών ( τιμές με ακέραιους αριθμούς )
Συσχέτιση (association) Εκφράζει την συμμεταβολή δυο ή περισσοτέρων χαρακτηριστικών Σχέση βάρους-ύψους Σχέση παχυσαρκίας-Στεφανιαίας Νόσου Είναι τυχαία ή μη τυχαία;
Επίδραση ( effect ) Ασκείται όταν μια μεταβλητή επηρεάζει μια άλλη μεταβλητή Η κατανάλωση αλκοόλ κατά την διάρκεια της κύησης αυξάνει την πιθανότητα εκδηλώσεις συγγενών διαμαρτιών στο νεογνό ( αλκοολικό σύνδρομο ) Η μεταβλητή που επιδρά ονομάζεται ανεξάρτητη ( independent ) Η μεταβλητή που δέχεται την επίδραση ονομάζεται εξαρτημένη ( dependent )
Χώρος εισαγωγής δεδομένων Χώρος διαχείρισης δεδομένων
Εισαγωγή μεταβλητών στο SPSS Ποσοτικές μεταβλητές: εισάγονται ως έχουν Κατηγορικές μεταβλητές: κωδικοποίηση (αντιστοιχία κατηγορίας με αριθμό πχ αγόρι-1, κορίτσι-2) Εφαρμογή ετικετών (label) έτσι ώστε στα αποτελέσματα να εμφανίζονται οι κατηγορίες και όχι η κωδικοποίηση Μη αριθμητικές μεταβλητές δεν αναγνωρίζονται από το SPSS και καλό θα είναι να αποφεύγονται
Ετικέτα μεταβλητής (π.χ. Age of subjects) Ετικέτες τιμών μεταβλητής (π.χ. 1 = male, 2 = female) Μήκος και αριθμός δεκαδικών ψηφίων μεταβλητής Όνομα μεταβλητής (μέχρι 64 χαρακτήρες, χωρίς σημεία στίξης) Τύπος μεταβλητής (αριθμητική, κείμενο κλπ)
Ερωτήσεις;;
Περιγραφή ποσοτικών μεταβλητών Στατιστικά μέτρα Μέτρα Θέσης Μέτρα Διασποράς 24
Περιγραφή ποσοτικών μεταβλητών Παράδειγμα: Σε 48 ασθενείς με έμφραγμα του μυοκαρδίου και σε 87 υγιείς μετρήθηκε η ολική χοληστερόλη του ορού. Παρουσίαση των αποτελεσμάτων με απλή καταγραφή. Υγιείς 181 152 197 228 226 242 124 183 223 157 169 139 135 161 167 126 …. Ασθενείς 236 246 241 167 302 233 311 84 146 259 173 294 279 200 207 287 … 25
Μέτρα Θέσης Αριθμητικός μέσος (Mean) Διάμεση τιμή (Median) Το άθροισμα του συνόλου των τιμών της ποσοτικής μεταβλητής διαιρημένου δια του πλήθους τους. Διάμεση τιμή (Median) Η τιμή που διαιρεί το δείγμα (σε διατεταγμένες τιμές) σε δύο ακριβώς ίσα τμήματα. Επικρατούσα τιμή (Mode) Τιμή με την μεγαλύτερη συχνότητα εμφάνισης 26
Μέτρα Διασποράς Διακύμανση (Variance) Μέτρο της απόστασης των παρατηρήσεων από τον αριθμητικό μέσο. Τυπική απόκλιση (Standard Deviation) Η τετραγωνική ρίζα της διακύμανσης. Έχει ίδιες μονάδες μέτρησης. Εύρος (Range) Απόσταση (=διαφορά) μεγαλύτερης-μικρότερης τιμής Ποσοστημόρια (Percentiles) Συντελεστής μεταβλητότητας 27
Η ερμηνεία των περιγραφικών μέτρων Αριθμητικός μέσος Η αναμενόμενη τιμή που θα έχει η ποσοτική μεταβλητή σε ένα τυχαία επιλεγμένο άτομο του δείγματος. Πόσο αξιόπιστο μέτρο είναι; (όταν στο δείγμα υπάρχει ανισοκατανομή)
Αριθμητικός μέσος Αριθμητικός μέσος
Η ερμηνεία των περιγραφικών μέτρων Τυπική απόκλιση Ένας δείκτης μεταβλητότητας των τιμών της ποσοτικής μεταβλητής. Όσο μικρότερες τιμές λαμβάνει, τόσο πιο ομοιογενές το δείγμα. Επηρεάζεται από τι μονάδες μέτρησης.
Μέτρηση της μεταβλητότητας Συντελεστής μεταβλητότητας: Ένας δείκτης μεταβλητότητας των τιμών της ποσοτικής μεταβλητής, που λαμβάνει υπόψη την μέση τιμή και δεν επηρεάζεται από τις μονάδες μέτρησης.
Ο συντελεστής μεταβλητότητας Συμβολίζεται με CV (coef. variation) και ισούται με το πηλίκο της τυπικής απόκλισης προς τον μέσο. Όσο πιο μικρές τιμές έχει, τόσο το καλύτερο, διότι εκφράζει μεγαλύτερη ομοιογένεια της μεταβλητής. 32
Η ερμηνεία των περιγραφικών μέτρων Πότε χρειαζόμαστε τη διάμεσο; Όταν έχουμε ακραίες τιμές στην κατανομή της ποσοτικής μεταβλητής, και ειδικότερα όταν είναι ασύμμετρα κατανεμημένες.
Αριθμητικός μέσος & ακραίες τιμές Β
Η χρήση των στατιστικών προγραμμάτων
Επιλογή μεταβλητών για ανάλυση 36
Παράδειγμα Περιγραφικά Στατιστικά Μέτρα (Summary Statistics) 37
Γραφήματα στο SPSS 38
Περιγραφή ποσοτικών μεταβλητών Γραφήματα, Ιστόγραμμα συχνοτήτων Ιστόγραμμα Συχνοτήτων του ΔΜΣ (ΒΜΙ) σε δείγμα 2994 ατόμων. 39
Περιγραφή ποσοτικών μεταβλητών Γραφήματα, Θηκογράμματα Θηκόγραμμα που παρουσιάζει τη μέση τιμή και το 95% διάστημα εμπιστοσύνης του πληθυσμιακού μέσου Θηκόγραμμα που παρουσιάζει τη διάμεσο, το Q1, Q3 και το 2,5% & 97,5% ποσοστημόριο της κατανομής 40