Αρχές Bιοστατιστικής Γεωργία Βουρλή Τμήμα Βιοστατιστικής και Επιδημιολογίας Ιατρική Σχολή ΕΚΠΑ gvourli@med.uoa.gr Μεταπτυχιακό Πρόγραμμα Αγγειοχειρουργική.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Μπεττίνα Χάιδιτς Τρίτος παράγοντας ΈκθεσηΈκβαση ? Συγχυτικός παράγοντας Τροποποιητικός παράγοντας.
Advertisements

Μπεττίνα Χάιδιτς Επίκουρη Καθηγήτρια Υγιεινής-Ιατρικής Στατιστικής 1.
Στατιστικές Μέθοδοι στην Επιδημιολογία Επαναληπτικό μάθημα 22/2/2012.
Περιγραφικά μέτρα κεντρικής τάσης και διασποράς μιας Ποσοτικής μεταβλητής σε σχέση με μία Ποιοτική μεταβλητή (εντολή By variable) π.χ. Να συγκριθούν οι.
1 ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ ΠΑΡΑΔΟΣΗ 1Οη (Θ) Στοιχεία Επαγωγικής Στατιστικής.
Οικονομική Αξιολόγηση στις Υπηρεσίες Υγείας Γενικό Νοσοκομείο «ATTIKON» Dr. Βασίλειος Φραγκουλάκης Εθνική Σχολή Δημόσιας Υγείας Αθήνα, 2015 Εθνική Σχολή.
SCHOOL OF EUROPEAN EDUCATION - HERAKLION OPTIONS OF SUBJECTS FOR YEAR 3 (Γ’ ΤΑΞΗ)
Τεκμηριωμένη Λήψη Κλινικής Απόφασης Ενότητα 11: Ποιοτική αξιολόγηση μελετών Κλαίρη Γουρουντή, PhD Τμήμα Μαιευτικής Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ.
Γ.Ν.Π «ΤΖΑΝΕΙΟ» Το Γ.Ν.Π «ΤΖΑΝΕΙΟ» προσφέρει τις υπηρεσίες του αδιάλειπτα από το 1873.
1 Ανάλυση Χρηματοοικονομικών Καταστάσεων Επενδυτικοί Αριθμοδείκτες Διακομίχαλης Μιχαήλ Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
ΠΟΙΑ ΕΙΝΑΙ Η ΚΑΛΥΤΕΡΗ ΘΕΡΑΠΕΙΑ ΓΙΑ ΤΟΥΣ ΟΓΚΟΥΣ ΤΟΥ ΝΕΦΡΟΥ >3CM ΣΕ ΗΛΙΚΙΩΜΕΝΟΥΣ ΑΣΘΕΝΕΙΣ ; Ο ρόλος του χειρουργείου Α. Σκολαρίκος.
ΔΙΕΡΕΥΝΗΣΗ ΤΟΥ ΒΑΘΜΟΥ ΕΘΙΣΜΟΥ ΣΤΟ ΔΙΑΔΙΚΤΥΟ ΤΩΝ ΕΦΗΒΩΝ ΜΕ ΣΑΚΧΑΡΩΔΗ ΔΙΑΒΗΤΗ ΤΥΠΟΥ 1 Δανιηλίδου Αικατερίνη, Τριανταφύλλου Παναγιώτα, Χριστοφορίδης Αθανάσιος.
1 ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ Θεωρία Παρουσίαση 3 η-α ΕΙΔΗ ΕΠΙΔΗΜΙΟΛΟΓΙΩΝ ΜΕΛΕΤΩΝ (συνέχεια)
Ανάλυση επιβίωσης Επαναληπτικό μάθημα. Ανάλυση επιβίωσης Μελέτη κατανομής χρόνου από ένα καλά ορισμένο σημείο έναρξης έως την εμφάνιση ενός γεγονότος.
Βασικές Έννοιες της Πληροφορικής
Σύγκριση ομάδων Πολλές φορές στην εκπαιδευτική έρευνα θέλουμε να συγκρίνουμε τις τιμές δύο γκρουπ, χωρίς να έχουμε κανονικές κατανομές.
Αρχές Bιοστατιστικής Κλέα Κατσουγιάννη Καθηγήτρια Βιοστατιστικής και Επιδημιολογίας Ιατρική Σχολή ΕΚΠΑ Μεταπτυχιακό Πρόγραμμα Αγγειοχειρουργική.
Φροντίδα Ψυχικά Πάσχοντος στο Σπίτι
ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ
Λύσεις αναλυτικού προβλήματος
ΠΕΡΙΓΡΑΦΙΚΗ ΒΙΟΣΤΑΤΙΣΤΙΚΗ – Ποσοτικές μεταβλητές
Στατιστική ανάλυση των πειραματικών μετρήσεων
Αστική Ανανέωση & Εξευγενισμός Οι ελληνικές Ιδιαιτερότητες
Μέτα-ανάλυση Θεωρητικές και πρακτικές κατευθύνσεις
Διαξιφισμοί : Ο δρόμος από τα πρωτότυπα στα γενόσημα-Υπέρ
Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή β) για ένα ποσοστό
Στατιστικές Υποθέσεις
Μάνεση Ζωή Επίβλεψη: Κορδούτης Παναγιώτης Πάντειο Πανεπιστήμιο
Εκτιμητική: σημειακές εκτιμήσεις παραμέτρων
Εισαγωγή στην Ανάλυση Γλωσσικών Δεδομένων
Κλινικές Δοκιμές Οι Κλινικές Δοκιμές αποτελούν κορυφαίο μεθοδολογικό εργαλείο στη σύγχρονη ιατρο-βιολογική έρευνα.
Το πρόβλημα της μέτρησης Μέτρηση είναι η ένταξη αριθμών σε αντικείμενα σύμφωνα με oρισμένους κανόνες και υπό την βασική προϋπόθεση ότι υπάρχει ακριβής.
Επανασχεδιασμός του Ευρωπαϊκού Συστήματος Ενδοκοινοτικών Συναλλαγών (Revised Intrastat) Η συγκεκριμένη παρουσίαση συνοψίζει την ανάλυση των αποτελεσμάτων.
Ο ΓΗΡΙΑΤΡΙΚΟΣ ΑΣΘΕΝΗΣ ΜΕ ΝΕΟΠΛΑΣΜΑΤΙΚΟ ΝΟΣΗΜΑ
ΜΠΣ Τραπεζική και Χρηματοοικονομική
Εισαγωγή στη Λήψη των Αποφάσεων
Κεντρο πληροφορησησ ανεργων τησ γ.σ.ε.ε.(κεπεα)
Ανάλυση επιβίωσης Μπεττίνα Χάιδιτς
Στατιστικές δοκιμασίες που χρησιμοποιούνται συχνά Παραμετρική δοκιμασία Αντίστοιχη μη-παραμετρική δοκιμασία Λόγος εφαρμογής Παράδειγμα t test για.
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧ/ΣΕΩΝ ΕΡΓΑΣΤΗΡΙΟ 3 ΔΔΕ
Ενότητα 1 : Σύνολα & Σχέσεις (1/2) Αλέξανδρος Τζάλλας
Αιτιολογία και φυσική ιστορία ΑΚΑ
Εισαγωγή στην Βιοστατιστική
ΕΡΩΤΗΣΗ 1 Ως μέρος μιας επιδημιολογικής μελέτης, 2 ομάδες γυναικών ρωτήθηκαν (με συνέντευξη) για την ύπαρξη ναυτίας και στομαχικού πόνου. Σε μια σύγκριση.
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
Meeting of the Balkan Excellent Centers
Διατροφή-Διαιτολογία
Χαρακτηριστικά μιας Κατανομής
Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική
Πρόγραμμα μεταπτυχιακών σπουδών Ιατρικής σχολής ΕΚΠΑ
Bài giảng tin ứng dụng Gv: Trần Trung Hiếu Bộ môn CNPM – Khoa CNTT
האם ניתן להגדיל את עוצמת המבחן?
Choosing between Competing Experimental Designs
Μάθημα [GD3021]: ΑΝΑΛΥΣΗ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΩΝ ΚΑΤΑΣΤΑΣΕΩΝ
Στατιστικές Υποθέσεις
Ψυχιατρική Επιδημιολογία
xBSM meeting, problems with C-line CA
Τ. Ε. Ι. Αθήνας Τμήμα Ιατρικών Εργαστηρίων ΒΙΟΣΤΑΤΙΣΤΙΚΗ
Κεφάλαιο 12 Απλή Γραμμική Παλινδρόμηση.
7ο Επιστημονικό Συμπόσιο Γενικής Ιατρικής
ΜΠΑΜΙΑ ΧΡΙΣΤΙΝΑ* (Υπεύθυνη) Αν. Καθηγήτρια ΒΟΥΡΛΗ ΓΕΩΡΓΙΑ* (Θεωρία)
Κεφάλαιο 3 Αριθμητικά Περιγραφικά Μέτρα.
Στατιστικές Μέθοδοι στην Επιδημιολογία
ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (ΜΕΡΟΣ Γ’)
Φ. ΜΗΛΙΩΝΗ, Δ.Ν., Δ/ΝΤΡΙΑ ΝΠΙΔ ΕΠΑΝΟΔΟΣ
Time course of visual responsiveness induced by BIC ejection into the SC in dopamine-intact and AMPT-treated animals. Time course of visual responsiveness.
Στατιστική Επαγωγή Ένα τεράστιο μέρος της έρευνας διενεργείται μέσω της ανάλυσης δειγμάτων προκειμένου να εξάγουμε συμπεράσματα για τον πληθυσμό. Αυτό.
Kaplan-Meier curve showing similar survival in patients with coexisting granulomatous inflammation and lung cancer versus patients with lung cancer alone.
Μεταγράφημα παρουσίασης:

Αρχές Bιοστατιστικής Γεωργία Βουρλή Τμήμα Βιοστατιστικής και Επιδημιολογίας Ιατρική Σχολή ΕΚΠΑ gvourli@med.uoa.gr Μεταπτυχιακό Πρόγραμμα Αγγειοχειρουργική ενδαγγειακές τεχνικές Αγγειοχειρουργική Κλινική Ιατρικής Σχολής ΕΚΠΑ, Π.Γ.Ν. «Αττικόν»

Βιοστατιστική Η Στατιστική όπως εφαρμόζεται για να απαντά στα προβλήματα της Ιατρικής πράξης

Ποιοτικές μεταβλητές Δίτιμες (π.χ. φύλο, παρουσία νόσου (ναι/όχι)) Κατηγορικές με περισσότερες από δύο τιμές (π.χ. χώρα προέλευσης, ομάδα θεραπείας (Α,Β,Γ)) Περιγράφονται συνοπτικά με τον αριθμό ατόμων ανά κατηγορία και το αντίστοιχο ποσοστό

Ποσοτικές μεταβλητές Διακριτές ή συνεχείς Συνεχείς: Ηλικία, Ύψος, Βάρος. Διακριτές: score Οι βασικές ομάδες παραμέτρων που χρησιμοποιούνται για την περιγραφή τους είναι οι αντιπροσωπευτικές τιμές θέσης και οι αντιπροσωπευτικές τιμές διασποράς Υπολογίζονται με βάση τις παρατηρήσεις και μπορούν να υποδείξουν τα κύρια χαρακτηριστικά της κατανομής του μεγέθους.

Κατανομή Ποσοτικών Δεδομένων Συμμετρική, σχήμα καμπάνας Κανονική (Gaussian) κατανομή Θετικά λοξή Σε εργαστηριακά δεδομένα πχ. CD4 counts in HIV+ Αρνητικά λοξή Λιγότερο συνηθισμένη Ομοιόμορφη κατανομή Ίδια πιθανότητα οποιασδήποτε τιμής μέσα στο εύρος

Παράδειγμα κανονικής κατανομής Διαστολική αρτηριακή πίεση

Ποιες είναι οι βασικές αντιπροσωπευτικές τιμές θέσης? Μέση τιμή (mean). Καταλληλότερη για κανονικές κατανομές. Διάμεση τιμή (median). Καταλληλότερη για θετικά λοξές κατανομές.

Τι είναι η διασπορά μιας κατανομής? Είναι μια έκφραση της ποικιλίας των παρατηρήσεων Πχ οι παρατηρήσεις αναστήματος (εκατοστά) 151, 153, 157, 156, 154 έχουν μικρότερη διασπορά από τις 151, 175, 167, 189, 188

Ποιες είναι οι κυριότερες αντιπροσωπευτικές τιμές διασποράς? Εκατοστημόρια (percentiles) 25o, 50o, 75o: τεταρτημόρια (quartiles) Σταθερή ή τυπική απόκλιση (standard deviation)

Τυπικό σφάλμα (Standard error) Το τυπικό σφάλμα είναι μέτρο της αβεβαιότητας της εκτίμησής μας Είναι η τυπική απόκλιση μιας δειγματικής στατιστικής ποσότητας Εξαρτάται από το μέγεθος του δείγματος -> μειώνεται όσο αυξάνεται το μέγεθος του δείγματος Εξαρτάται από την μεταβλητότητα του μεγέθους στην πραγματικότητα -> αυξάνεται με τη μεταβλητότητα Μπορεί να υπολογιστεί από μαθηματικούς τύπους ή να προσεγγιστεί μέσω προσομοιώσεων. Ο τύπος για τον υπολογισμό του τυπικού σφάλματος είναι διαφορετικός για κάθε στατιστική ποσότητα (μέση τιμή, διαφορά δύο ποσοστών, πηλίκο πιθανοτήτων).

Ιδιότητες Κανονικής Κατανομής (πώς η σταθερή απόκλιση δείχνει τον τρόπο διασποράς των παρατηρήσεων)

95% των παρατηρήσεων 16.65 80.15

Τεταρτημόρια Q1 Q2 Q3 Q4 5.0e-04 .001 .0015 Density 500 1000 1500 2000 5.0e-04 .001 .0015 Density 500 1000 1500 2000 CD4 count (cells/microL) Q1 Q2 Q3 Q4

Λογαριθμικός μετασχηματισμός δεδομένων κλινικής δοκιμής (Shaper et al 1983) Μέτρηση δείκτη ήπατος σε σχέση με κατανάλωση οινοπνευματωδών ποτών σε 7.613 άντρες. Μέση τιμή 19,2 IU/lt Γεωμετρικός μέσος του x =exp(mean ln(x)) = 15.6 IU/lt

Θηκόγραμμα (Boxplot) Q3+1.5(Q3-Q1) - Q3 -Q1 Q1-1.5(Q3-Q1)

Τι είδους υποθέσεις ελέγχουμε με στατιστικά τεστ Τι είδους υποθέσεις ελέγχουμε με στατιστικά τεστ? Μερικά απλά παραδείγματα. Διαφέρει η μέση τιμή της διαστολικής αρτηριακής πίεσης σε άτομα άνω των 70 ετών σε σχέση με νεώτερα άτομα? Εχει σχέση το κάπνισμα με την εμφάνιση εμφράγματος του μυοκαρδίου? Η μετεγχειριτική αντιμετώπιση των ασθενών που έκαναν χολοκυστεκτομή με την διαδικασία Α προφυλάσει από την εμφάνιση συγκεκριμένης επιπλοκής σε σχέση με αυτούς που αντιμετωπίστηκαν με τη διαδικασία Β? Βελτιώνει η νέα θεραπεία Α την επιβίωση σε καρκινοπαθείς του πνεύμονα σε σχέση με την καθιερωμένη σήμερα θεραπεία Β?

Βασικές αρχές που διέπουν μια στατιστική αξιολόγηση, έναν έλεγχο υπόθεσης Διαφέρει η μέση τιμή της διαστολικής αρτηριακής πίεσης σε άτομα άνω των 70 ετών σε σχέση με νεώτερα άτομα? Έχουμε 2 μέσες τιμές: x1 η μέση τιμή σε άτομα άνω των 70 ετών και x2 σε νεώτερα άτομα Συμβολίζουμε με μ1 και μ2 τις μέσες τιμές των αντίστοιχων πληθυσμών (όλων των ατόμων άνω των 70 ετών και όλων των νεώτερων) Θέλουμε να ελέγξουμε αν οι 2 μέσες τιμές είναι ίσες ή όχι. H0: μ1=μ2 (Μηδενική υπόθεση) HA: μ1≠μ2 (Εναλλακτική υπόθεση)

Έλεγχος υπόθεσης Τα αποτελέσματα από το δείγμα μας επιτρέπουν να απορρίψουμε την H0 και να δεχθούμε ότι ισχύει η H1? Μπορεί το εύρημά μας να οφείλεται στην τύχη. Μπορεί η H0 να ισχύει, και απλά πετύχαμε ένα ασυνήθιστο/ μη αντιπροσωπευτικό δείγμα. Χρειαζόμαστε ένα μέτρο για το πόσο πιθανό είναι το αποτέλεσμα μας από το δείγμα, υπό την υπόθεση ότι ισχύει η Ηο

Τι συμπέρασμα μας δίνει μια στατιστική δοκιμασία? Μετά την εφαρμογή του κατάλληλου στατιστικού τεστ (t-test) για τον έλεγχο π.χ. της διαφοράς των δύο μέσων τιμών μαθαίνουμε αν η διαφορά είναι στατιστικά σημαντική ή όχι. Υπολογίζουμε δηλαδή πόσο πιθανό θα ήταν να οφείλεται στην τύχη (στην τυχαία δειγματοληπτική διακύμανση) η διαφορά που υπολογίσαμε με βαση τα δείγματα (ίση με p, το επίπεδο στατιστικής σημαντικότητας), αν στην πραγματικότητα (στους αντίστοιχους πληθυσμούς) δεν υπήρχε διαφορά (κάτω από την υπόθεση ότι θα ίσχυε η Ηο). Αν η p είναι μικρότερη από 5% (0,05) την θεωρούμε μικρή και απορρίπτουμε την Ηο. Δεχόμαστε δηλαδή ότι υπάρχει διαφορά στις μέσες τιμές των πληθυσμών

ΕΠΙΠΕΔΟ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ (Significance Level, α) Ορισμός Η πιθανότητα η παρατηρούμενη διαφορά να οφείλεται στην τύχη (αυτό είναι απλοποιημένο, αλλά βοηθάει στην επικοινωνία...) Όταν P<5% η διαφορά θεωρείται στατιστικά σημαντική Όταν P>5% η διαφορά θεωρείται μη-στατιστικά σημαντική

P-value 10% 5% 1% 0.1% πάρα πολύ σημ. Μη στατιστικά σημαντική Ασαφής Στατιστικά πολύ σημ. πάρα πολύ σημ.

Σφάλμα τύπου Ι, σφάλμα τύπου ΙΙ, Ισχύς Αν βρούμε λοιπόν τη διαφορά στατιστικά σημαντική μπορεί το συμπέρασμα μας να είναι λάθος? ΝΑΙ, μπορεί, με μικρή πιθανότητά, ίση με το p. Αυτό λέγεται σφάλμα τύπου Ι. Αν δεν βρούμε τη διαφορά στατιστικά σημαντική, αυτό μπορεί να αντανακλά το γεγονός ότι δεν υπάρχει διαφορά στην πραγματικότητα, ή μπορεί να υπάρχει όντως διαφορά στους πληθυσμούς (να μην ισχύει η Ηο) και εμείς να μην την τεκμηριώσαμε στατιστικά. Αυτό λέγεται σφάλμα τύπου ΙΙ. ΙΣΧΥΣ μιας στατιστικής δοκιμασίας λέγεται η πιθανότητα να τεκμηριώσουμε στατιστικά μια διαφορά και ισούται με 1-σφάλμα τύπου ΙΙ. Συνήθως αποδετά επίπεδα ισχύος είναι 80-90%.

Διαστήματα εμπιστοσύνης (όρια αξιοπιστίας) confidence interval Ένας τρόπος να περιγράψουμε τη διακύμανση (ή την αβεβαιότητα) της εκτίμησης που βασίστηκε στο δείγμα μας είναι να υπολογίσουμε ένα διάστημα εμπιστοσύνης Συνήθως υπολογίζουμε το 95% διάστημα εμπιστοσύνης, που εκφράζει το διάστημα στο οποίο με 95% βεβαιότητα βρίσκεται η πραγματική τιμή του πληθυσμού της παραμέτρου που εκτιμήθηκε (π.χ. της μέσης τιμής) Δηλαδή, είμαστε κατά 95% σίγουροι ότι η πραγματική τιμή βρίσκεται εντός του 95% Δ.Ε. Σωστότερα, ξέρουμε ότι αν θα επαναλαμβάναμε τη μελέτη 100 φορές, στις 95 φορές η τιμή που θα βρίσκαμε θα κυμαινόταν ανάμεσα στα 95% Δ.Ε.

ΟΡΙΑ ΑΞΙΟΠΙΣΤΙΑΣ (Confidence Interval) Ορισμός Δίνει το διάστημα στο οποίο διακυμαίνεται η πραγματική τιμή της εκάστοτε παραμέτρου με πιθανότητα αντίστοιχη, συνήθως 95% π.χ. Για μια μέση τιμή x ± t * SEx όπου t είναι συντελεστής από την αντίστοιχη κατανομή και SE το πιθανό σφάλμα της μέσης τιμής (SE= SD/√n) π.χ. Για τη διαφορά δύο μέσων τιμών x1-x2 ± t * SEΔ, όπου t είναι συντελεστής από την αντίστοιχη κατανομή και SE το πιθανό σφάλμα της διαφοράς των μέσων τιμών (SE= √SE12 + SE22)

ΠΡΟΣΟΧΗ Η ύπαρξη στατιστικής σημαντικότητας δεν σημαίνει ότι το έυρημα μας έχει κλινική ή άλλη βιολογική σημασία!! Απλώς γνωρίζουμε ότι πιθανότατα δεν οφείλεται στην τύχη και γνωρίζουμε την πιθανή διακύμανση του μεγέθους που εκτιμήσαμε Θα πρέπει να περιγράψουμε το εύρημα και να αξιολογήσουμε τη σημασία του με βάση τις ιατρικές γνώσεις. Τα διαστήματα εμπιστοσύνης πλεονεκτούν στην περιγραφική πληροφορία.

Σφάλμα τύπου I και τύπου II, Ισχύς Αποτελέσματα από τον έλεγχο στα δείγματα Αλήθεια στον πληθυσμό Ύπαρξη σχέσης Η1 ισχύει Απουσία σχέσης Η0 ισχύει Ύπαρξη στατιστικά σημαντικής σχέσης (απόριψη Ηο) Σωστό (Ισχύς) Σφάλμα τύποιυ Ι (Type I error) (a) Απουσία στατιστικά σημαντικής σχέσης Σφάλμα τύπου ΙΙ (Type II error) (β) Αποτελέσμα στο δείγμα της μελέτης Αλήθεια στον πληθυσμό Ύπαρξη σχέσης Απουσία σχέσης

Τυχαία σφάλματα (περιλαμβάνουν τα σφάλματα τύπου Ι και ΙΙ) Σχετίζονται με την εγγενή αβεβαιότητα στα βιολογικά φαινόμενα Μικρότερα τυχαία σφάλματα σχετίζονται με μεγαλύτερη ακρίβεια στις εκτιμήσεις μας Ένας τρόπος να μειωθούν τα τυχαία σφάλματα είναι να κάνουμε περισσότερες παρατηρήσεις (μεγαλύτερες έρευνες, περισσότεροι συμμετέχοντες) Ένας άλλος είναι να βελτιωθεί η αποτελεσματικότητα του σχεδιασμού, ώστε να έχουμε παρατηρήσεις σε όλους τους συνδυασμούς έκθεσης-έκβασης

Συστηματικά σφάλματα (μεροληψίες) Σχετίζονται με την εγκυρότητα των αποτελεσμάτων Μπορεί να ταξινομηθούν σε 3 βασικές κατηγορίες: Σφάλμα επιλογής (selection bias) Σφάλμα πληροφορίας (information bias) Επίδραση συγχυτικού παράγοντα (confounding)

Η επίδραση του τυχαίου και του συστηματικού σφάλματος στις εκτιμήσεις μας Συστηματικό σφάλμα + Μεγάλο τυχαίο σφάλμα x Όχι συστηματικό σφάλμα + Μεγάλο τυχαίο σφάλμα x Συστηματικό σφάλμα + Μικρό τυχαίο σφάλμα x Όχι συστηματικό σφάλμα + Μικρό τυχαίο σφάλμα x Πραγματική σχέση

P-value και όρια αξιοπιστίας ανάλογα με το μέγεθος του δείγματος (n=32) (n=208) (n=656) favors control favors test Trial 1 (n=32) 95% CI for difference in response rates Trial 2 (n=208) Trial 3 (n=656) p=0.45 p=0.05 p<0.001

Οι επιδράσεις των συγχυτικών παραγόντων Έκθεση Έκβαση Συγχυτικός παράγων Συγχυτικός παράγοντας είναι μια μεταβλητή που έχει ανεξάρτητη σχέση και με την έκθεση που μελετάμε και με την έκβαση.

Παράδειγμα Συγχυτικού Παράγοντα Κατανάλωση Καφέ Ca πνεύμονα Άτομα με μεγάλη κατανάλωση καφέ είναι πιθανότερο να καπνίζουν Κάπνισμα Πλασματική συσχέτιση

Οι συγχυτικές επιδράσεις δημιουργούν συστηματικό σφάλμα.

Πώς γίνεται ο έλεγχος των συγχυτικών παραγόντων? Στον σχεδιασμό της έρευνας: κρατώντας σταθερές τις τιμές του συγχυτικού παράγοντα (πχ κάνοντας μια μελέτη μόνο σε ηλικιωμένους, ή μόνο σε γυναίκες) Κατά την ανάλυση των δεδομένων με την εφαρμογή κατάλληλης στατιστικής μεθοδολογίας

Πώς εξαρτάται λοιπόν μια μεταβλητή (μια έκβαση υγείας- health outcome) από την μελετούμενη έκθεση και από άλλες μεταβλητές (πιθανούς συγχυτικούς παράγοντες) Για να διερευνήσουμε την σχέση μια έκβασης από μια έθεση με ταυτόχρονο έλεγχο των πιθανολογούμενων συγχυτικών παραγόντων, μπορούμε να εφαρμόσουμε κατάλληλα μοντέλα

Συνοπτικά: η επιλογή μεθόδου στατιστικής αξιολόγησης εξαρτάται: Συνοπτικά: η επιλογή μεθόδου στατιστικής αξιολόγησης εξαρτάται: από την μεταβλητή της έκβασης υγείας που θέλουμε να μελετήσουμε. επίσης εξαρτάται από το αν θέλουμε να ελέγξουμε την επίδραση πιθανών συγχυτικών παραγόντων (πολυπαραγοντική ανάλυση - μοντέλα) ή όχι (μονοπαραγοντική ανάλυση) στους επόμενους Πίνακες αναφέρονται επιλεκτικά οι μέθοδοι που εφαρμόζονται συχνότερα ή είναι περισσότερο γνωστές αν δεν μπορέσετε να καταλάβετε πώς πρέπει να αντιμετωπιστεί ένα πρόβλημα, τότε θα χρειαστείτε συμβουλή ειδικού.

Έκβαση υγείας (outcome) Έκθεση (exposure) Έλεγχος συγχυτικών (confounding) πραγόντων Στατιστική μέθοδος Ποσοτική κανονικά κατανεμημένη Ποιοτική (διαχωρισμός σε 2 ομάδες) ΟΧΙ T-test (απλό ή κατά ζεύγη με αντίστοιχες προϋποθέσεις) Ποσοτική (ή διατάξιμη), μη κανονικά κατανεμημένη ή άγνωστης κατανομής Wilcoxon (για παρατηρήσεις χωρίς ή με αντιστοιχία) Ποιοτική Χ2 (απλό ή κατά ζεύγη με αντίστοιχες προϋποθέσεις) ΝΑΙ (ένας ή δύο παράγοντες) Χ2 κατά Mantel-Haenszel

Έκβαση υγείας (outcome) Έκθεση (exposure) Έλεγχος συγχυτικών (confounding) πραγόντων Στατιστική μέθοδος Ποσοτική κανονικά κατανεμημένη οτιδήποτε ΝΑΙ (οποιασδήποτε μορφής) Πολλαπλή γραμμική παλινδρόμηση (multiple linear regression) Ποιοτική δίτιμη (συνήθως εμφάνιση ή όχι έκβασης υγείας) Πολλαπλή λογαριθμιστική παλινδρόμηση (multiple logistic regression) «Χρόνος επιβίωσης» Ανάλυση επιβίωσης (survival analysis)

Ανάλυση επιβίωσης Εφαρμόζεται σε δεδομένα που αφορούν το χρόνο από μία καλά καθορισμένη αρχή μέτρησης του χρόνου μέχρι την εμφάνιση του υπό μελέτη συμβάντος, που ονομάζεται συχνά «αποτυχία» π.χ. από ημερομηνία ένταξης ενός ασθενούς στη μελέτη μέχρι το θάνατο του ή το πέρας της μελέτης, από την ημερομηνία έναρξης της νόσου μέχρι το θάνατο, την εμφάνιση νόσου, την υποτροπή κλπ ή το πέρας της μελέτης

Ιδιαιτερότητες δεδομένων επιβίωσης Τα δεδομένα των χρόνων επιβίωσης σχεδόν πάντα περιλαμβάνουν αποκομμένες (censored) παρατηρήσεις. Αυτό σημαίνει ότι η πληροφορία του χρόνου μέχρι την εμφάνιση του υπό μελέτη συμβάντος δεν υπάρχει για κάποια άτομα γιατί: το συμβάν δεν πραγματοποιήθηκε στα εν λόγω άτομα κατά την διάρκεια της παρακολούθησής τους, ή γιατί κάποιοι ασθενείς εγκατέλειψαν πρόωρα τη μελέτη (lost to follow-up)

Στην ανάλυση επιβίωσης: Οι ασθενείς παρακολουθούνται και καταγράφεται αν παρουσιάστηκε το υπό μελέτη συμβάν και πότε εν ζωή 1 2 3 4 5 6 εγκατέλειψε εν ζωή Ασθενής θάνατος εγκατέλειψε θάνατος τέλος μελέτης

Απαραίτητα δεδομένα για την ανάλυση επιβίωσης Για κάθε άτομο Μία μεταβλητή με τιμές 0 και 1 που να εκφράζει αν στο άτομο παρατηρήθηκε το υπό μελέτη συμβάν ή όχι Χρόνος μέχρι την εμφάνιση του υπό μελέτη συμβάντος. Για τα άτομα στα οποία δεν παρατηρήθηκε το συμβάν, ο χρόνος μέχρι το τελευταίο follow-up

Συνήθη ερωτήματα σε μία ανάλυση επιβίωσης Πως μεταβάλλεται στο χρόνο η πιθανότητα επιβίωσης; Τι ποσοστό των ασθενών επιβιώνει π.χ. τα δύο πρώτα έτη από τη διάγνωση ενός καρκίνου; Ποιος είναι ο χρόνος που επιβιώνει π.χ. το 50% των ασθενών (διάμεσος χρόνος επιβίωσης) Σύγκριση χρόνου επιβίωσης μεταξύ ομάδων ασθενών Διαφέρει η επιβίωση των ασθενών ανάλογα με το είδος θεραπείας που λαμβάνουν; Αξιολόγηση της επίδρασης πολλών παραγόντων στο χρόνο μέχρι την εμφάνιση του υπό μελέτη συμβάντος Τι ρόλο παίζει η θεραπεία, η ηλικία των ασθενών κατά τη διάγνωση, το μέγεθος του όγκου κλπ;

Υπό εκτίμηση μεγέθη: Συνάρτηση επιβίωσης (survivor function) S(t)

Kaplan-Meier εκτίμηση Μήνες 10 20 30 40 0.00 0.25 0.50 0.75 1.00 Kaplan-Meier survival estimate Κάθε «σκαλί» αντιπροσωπεύει 1 συμβάν τη συγκεκριμένη χρονική στιγμή Πιθανότητα επιβίωσης

KAPLAN-MEIER RESULTS FROM: Rich et al, as before

This is a Kaplan-Meier curve generated from the data on the previous slide. Censoring is indicated by the black dot tic mark. From: Rich et al, as before

Διάμεσος χρόνος επιβίωσης (median survival time) Ο χρόνος πέραν του οποίου αναμένεται να επιβιώσει το 50% των υπό μελέτη ατόμων Μήνες 10 20 30 40 0.00 0.25 0.50 0.75 1.00 Πιθανότητα επιβίωσης Διάμεσος χρόνος επιβίωσης

Ποσοστημόρια χρόνου επιβίωσης (25th, 75th percentiles) 1.00 17 μήνες (8 μήνες,33 μήνες) 0.75 Πιθανότητα επιβίωσης 0.50 0.25 0.00 10 20 30 40 Μήνες

Τι ποσοστό επιβιώνει τους πρώτους 10 μήνες; Kaplan-Meier survival estimate 10 20 30 40 0.00 0.25 0.50 0.75 1.00 Μήνες Πιθανότητα επιβίωσης Περίπου το 70% των ασθενών

Υπό εκτίμηση μεγέθη: Συνάρτηση αποτυχίας F(t) μικρότερος του t  F(t)=1-S(t)

Σύγκριση δύο καμπυλών επιβίωσης Mη-παραμετρικές μέθοδοι για τη σύγκριση των Kaplan-Meier καμπύλων Log-rank τεστ Wilcoxon τεστ Εξετάζουν αν υπάρχει διαφορά στις συναρτήσεις επιβίωσης μεταξύ 2 ή περισσότερων ομάδων Hμι-παραμετρικές Cox μοντέλο αναλογικών κινδύνων (Cox proportional hazards model) Παραμετρικές μεθόδους π.χ. μοντέλο Weibull

From: J Vasc Syrg 2014; 59:956-67

h(t)=h0(t)*exp(β0+β1Χ1+β2Χ2+ … +βpXp) Μοντέλο αναλογικών κινδύνων Cox (Cox proportional hazards model) Πολυπαραγοντική Ανάλυση Έλεγχος συγχυτικών παραγόντων Μοντέλο Cox h(t)=h0(t)*exp(β0+β1Χ1+β2Χ2+ … +βpXp) δηλαδή εξαρτημένη μεταβλητή είναι η συνάρτηση κινδύνου Hazard Ratio (HR): HR = eβ Εκφράζει πόσο θα μεταβληθεί o κίνδυνος εμφάνισης του υπό μελέτη συμβάντος για μία μονάδα αύξησης της ανεξάρτητης μεταβλητής (διατηρώντας τις υπόλοιπες μεταβλητές του μοντέλου σταθερές

Ερμηνεία του HR (eb) Aν HR κοντά στο 1: παρόμοιος στιγμιαίος κίνδυνος παρουσίας της νόσου σε εκτεθειμένα και μη-εκτεθειμένα άτομα Αν ΗR>1, π.χ. ΗR=1.2: τα εκτεθειμένα άτομα έχουν 1.2 φορές μεγαλύτερο στιγμιαίο κίνδυνο να πάθουν ένα συμβάν σε σχέση με τα μη-εκτεθειμένα άτομα ENAΛΛΑΚΤΙΚΑ: ο στιγμιαίος κίνδυνος για ένα συμβάν είναι αυξημένος κατά 20% σε σχέση με τα μη-εκτεθειμένα άτομα 1.2-1=0.2=20% Αν ΗR<1, π.χ. ΗR=0.75: τα εκτεθειμένα άτομα έχουν 0.75 φορές μικρότερο στιγμιαίο κίνδυνο σε σχέση με τα μη-εκτεθειμένα άτομα ENAΛΛΑΚΤΙΚΑ: ο στιγμιαίος κίνδυνος είναι μειωμένος κατά 25% στα εκτεθειμένα άτομα σε σχέση με τα μη-εκτεθειμένα άτομα 0.75-1=-0.25=-25%

Περισσότερη βιβλιογραφία Petrie, A. and Sabin, C. (2005) Medical Statistics at a glance 2nd edition, Blackwell, Oxford. Μετ: Ιατρική Στατιστική με μια ματιά, Εκδόσεις Παρισιάνος, Επιμέλεια: Α. Τζώνου. Altman GD. (1991) Practical Statistics for Medical Research. Chapman & Hall, London. Pagano M & Gauvreau K. Principles of Biostatistics. Wandsworth. (μετ.: Ο. Δαφνή) Kirkwood BR & Sterne JAC. Essential Medical Statistics 2nd ed. Blackwell 2003. Τριχόπουλος Δ, Τζώνου Α, Κατσουγιάννη Κ. Βιοστατιστική. Παρισιάνος, 2000 Collette. Modelling Survival data in Medical research. Chapman & Hall, 1994 Hosmer D, Lemeshow S, May S. Applied Survival Regression. 2nd Edition, Wiley, 2008 Kleinbaum D, Klein M. Survival Analysis. A shelf-learning text. 3rd Edition, Springer Sciences, 2012

Ευχαριστώ για την προσοχή σας Ευχαριστίες: Γ. Τουλούμη, Β. Σύψα, Κ. Κατσουγιάννη