Παρουσίαση στατιστικής μεθοδολογίας και αποτελεσμάτων Μπεττίνα Χάιδιτς Επίκουρη Καθηγήτρια Υγιεινής-Ιατρικής Στατιστικής haidich@med.auth.gr
Στατιστική στα ιατρικά περιοδικά Αύξηση χρήσης στατιστικής τα τελευταία χρόνια Pediatrics : Μεταξύ 1952-1982 4x των στατιστικών μεθόδων [Hayden et al. Pediatrics 1983; 72:84-87] New England Journal of Medicine: Δραματικές αλλαγές στη χρήση στατιστικών μεταξύ 1978-79 και 1990
Altman. Stat Med 1991;10:1897-1913
Προηγούμενες έρευνες 75% (n=59) των άρθρων στο Transfusion με λάθος στατιστική δοκιμασία ή σφάλματα στον υπολογισμό ή ερμηνεία και 22% με λάθος συμπέρασμα [Kanter et al. Transfusion 1994; 34:697-701] 40% με στατιστικά σφάλματα (n=164) στο British Journal of Psychiatry χωρίς βελτίωση στο χρόνο [McGuigan. Br J Psychiatry 1995;167:683-688] Συγκριτική μελέτη 1999 με 1994 έδειξε βελτίωση στη ολοκληρωμένη αναφορά των στατιστικών (74.3% vs 47.4%; P<0.001), και στη σωστή χρήση των στατιστικών δοκιμασιών (56.4% vs 30.3%; P < 0.001) [Welch GE et al. Am J Obstet Gynecol 2002;186:584-6].
Πρόσφατες έρευνες Το 2010 μόνο 16/37 (43%) εργασίες είχαν σωστή στατιστική μεθοδολογία Η πλειοψηφία των εργασιών με σωστή στατιστική μεθοδολογία δημοσιεύτηκαν σε περιοδικά με υψηλή απήχηση
Εισαγωγή Αναφορά στο σκοπό της μελέτης. Αναγνώριση των σχέσεων που μελετούνται με αιτιολόγηση Δήλωση των ερευνητικών υποθέσεων εκ των προτέρων Αναγνώριση των κύριων και δευτερεύοντων ερευνητικών ερωτημάτων
Υλικό και μέθοδοι Προσδιορισμός των μελετούμενων μονάδων Οφθαλμολογία: αριθμός οφθαλμών ή ασθενών Οδοντιατρική: αριθμός δοντιών ή ασθενών Περιγραφή και προέλευση μελετούμενου πληθυσμού Μεταμόσχευση ήπατος σε ασθενείς με τελικό στάδιο ηπατικής νόσου και ιστορικό αλκοολισμού Έγκυες με παθολογικά ευρήματα υπερηχογραφήματος κατά το 3ο τρίμηνο
Υλικό και μέθοδοι Περιγραφή σχεδιασμού μελέτης Περιγραφική ή πειραματική Αναδρομική ή προοπτική Τυχαιοποιημένη κλινική μελέτη Ταύτιση στις ομάδες (matching) Συγχυτικοί παράγοντες και τρόπος αντιμετώπισης Ταύτιση Τυχαιοποίηση Στατιστικές τεχνικές (πολυπαραγοντική ανάλυση)
Υλικό και μέθοδοι Προσδιορισμός της δειγματοληπτικής τεχνικής Τυχαία επιλογή Δείγμα ευκολίας Εθελοντές Ταύτιση Διαστρωμάτωση Κριτήρια εισαγωγής και αποκλεισμού
Στατιστική μεθοδολογία Περιγραφή των δεδομένων με τα κατάλληλα στατιστικά περιγραφικά Το τυπικό σφάλμα (SEM) δεν θεωρείται περιγραφικό στατιστικό Να αποφεύγεται ο συμβολισμός ± Για κανονικά κατανεμημένα δεδομένα: Mean (SD) Παραμετρική ανάλυση Για μη κανονικά κατανεμημένα δεδομένα: Median (IQR) Μη παραμετρική ανάλυση
Στατιστική μεθοδολογία Οι κύριες και οι δευτερεύουσες στατιστικές αναλύσεις Περιγραφή εκ των υστέρων αναλύσεις ή αναλύσεις σε υπο-ομάδες (ανάλυση ευαισθησίας) Διαδικασία διόρθωσης πολλαπλών συγκρίσεων Περιγραφή των μοντέλων και των παραδοχών τους Στοιχεία για τον υπολογισμό του μεγέθους του δείγματος
Στατιστική μεθοδολογία Στοιχεία για τις ομάδες σύγκρισης Στις τυχαιοποιημένες κλινικές δοκιμές - πηγή τυχαίων αριθμών - απόκρυψη διανομής (allocation concealment) - διαστρωμάτωση - τυφλοποίηση (blinding) - intention to treat analysis ή per-protocol analysis - CONSORT statement Το επίπεδο σημαντικότητας (0.05) αμφίπλευρο Το στατιστικό πακέτο
Ανάλυση με βάση το πρωτόκολλο ή με πρόθεση για θεραπεία?
Αποτελέσματα Αναφορά στον αριθμό ατόμων που εγγράφηκαν και πόσοι τελικά συμμετείχαν στη μελέτη (διάγραμμα ροής) Αναφορά στο 95% διάστημα εμπιστοσύνης όπως και η τιμή P (P-value). P-value → στατιστικά σημαντικό. Διάστημα εμπιστοσύνης → εκτίμηση των τιμών Στην περίπτωση δύο ομάδων να παρουσιάζεται και το 95% CI της διαφοράς.
Αποτελέσματα Όλες οι συντομογραφίες να παρουσιάζονται αρχικά ολογράφως Να αποφεύγεται η έκφραση «στατιστικά σημαντικό» αυτό υποδηλώνεται από την τιμή P Ότι περιέχεται σε πίνακες και γραφήματα να μην ξαναεπαναλαμβάνονται στο κείμενο Ότι περιγράφεται στη μεθοδολογία να παρουσιάζεται στα αποτέλεσματα και το αντίθετο
1o Παράδειγμα εργασίας
Στατιστική ανάλυση
Αποτελέσματα
Κριτική Ενώ περιγράφει πως τα δεδομένα αναλύθηκαν μη-παραμετρικά με non-parametric Wilcoxon test συνοψίστηκαν με μέση τιμή και τυπική απόκλιση ενώ θα έπρεπε διάμεση τιμή και ενδοτεταρτημοριακό εύρος Υπάρχουν 4 ομάδες οπότε θα έπρεπε να χρησιμοποιηθεί αρχικά ένας συνολικός έλεγχος π.χ. Kruskal-Wallis test Δεν υπήρχε διόρθωση για τις πολλαπλές συγκρίσεις π.χ. διόρθωση Bonferroni
2o Παράδειγμα εργασίας
Στατιστική ανάλυση
Αποτελέσματα
Αποτελέσματα
Κριτική Αναφέρει ότι χρησιμοποιεί AVOVA ενώ έχει σύγκριση 2 ανεξάρτητων ομάδων (t-test) και 2 εξαρτημένων ομάδων (paired t-test). Έχει δεδομένα που δεν κατανέμονται κανονικά π.χ. HCV PCR(x103) που θα έπρεπε να συγκριθούν με Mann-Whitney U test Έχει ποιοτικά δεδομένα που θα πρέπει να αναλυθούν με χ2 ή Fisher’s exact test Αναφέρει Spearman’s correlation αλλά δεν παρουσιάζεται πουθενά αυτή η ανάλυση
Σφάλμα Δεν έχει σχεδιαστεί η μελέτη με αρκετά μεγάλη ισχύ έτσι ώστε οι διαφορές να είναι και «στατιστικά σημαντικές». Οπότε συμπεραίνουμε ότι δεν ισχύει η μηδενική υπόθεση, αλλά στην ουσία σημαίνει ότι «δεν υπάρχει αρκετή απόδειξη για να υποστηριχτεί ότι δεν ισχύει η μηδενική υπόθεση».
Παράδειγμα: Χαμηλή Ισχύς Success = Yes, I recycle. Gender X N Sample p Male 33 59 0.559322 Female 54 79 0.683544 Estimate for p(1) - p(2): -0.124222 95% CI for p(1) - p(2): (-0.287215, 0.0387704) Test for p(1) - p(2) = 0 (vs not = 0): Z = -1.49 P-Value = 0.135 Σε πολλούς φοιτητές φάνηκε παράξενο το αποτέλεσμα ότι “δεν υπήρχαν διαφορές στα ποσοστά”
Παράδειγμα: Χαμηλή Ισχύς Υπολογισμός ισχύος και μεγέθους δείγματος Test for Two Proportions Testing proportion 1 = proportion 2 (versus not =) Calculating power for: proportion 1 = 0.55 and proportion 2 = 0.70 Alpha = 0.05 Difference = -0.15 Sample Size Power 60 0.4366 70 0.4911 80 0.5421 *Sample size = # in EACH group Τελικά θα χρειαζόταν 176 άτομα ανά ομάδα με 80% ισχύ!
Σφάλμα Παρερμηνεία των αποτελεσμάτων μιας περιγραφικής μελέτης. Συμπεραίνοντας ότι η μια μεταβλητή «προκάλεσε» τις διαφορές στην άλλη μεταβλητή. Ενώ πιο σωστά θα έπρεπε να αναφερθεί ότι οι δύο μεταβλητές σχετίζονται ή συσχετίζονται. Προσοχή στο σημαντικό αποτέλεσμα διότι μπορεί να είναι “ψευδές”.
Σφάλμα Χρήση μη τυχαίου ή μη αντιπροσωπευτικού δείγματος. Επεκτείνοντας τα αποτελέσματα από ένα μη αντιπροσωπευτικό δείγμα στον πληθυσμό.
Παράδειγμα: Μη αντιπροσωπευτικό δείγμα Παράδειγμα: Μη αντιπροσωπευτικό δείγμα Εκτίμηση του μέσου αναστήματος των Ελλήνων αγοριών 7 ετών δείγμα από την Πρωτεύουσα Εκτίμηση της συχνότητας ομάδας αίματος ΑΒΟ στον πληθυσμό δείγμα από την ορθοπεδική κλινική ενός νοσοκομείου
Σφάλμα Μη χρήση των βασικών αρχών των πειραμάτων, όπως τυχαιοποίηση, διπλός τυφλός σχεδιασμός και ομάδα ελέγχου.
Σφάλμα Κατηγοριοποίηση μιας ποσοτικής μεταβλητής → μεροληψία → ↓ ισχύς → ↑ σφάλμα τύπου Ι
Χρυσοί κανόνες στην περιγραφή αριθμών Σε πρόταση, αριθμοί < 10 → ολογράφως Στη μελέτη οκτώ συμμετέχοντες δεν ολοκλήρωσαν την παρέμβαση Σε πρόταση, αριθμοί ≥ 10 → αριθμητικά Υπήρχαν 120 συμμετέχοντες στη μελέτη Έναρξη πρότασης με αριθμούς → ολογράφως Είκοσι τοις εκατό από τους ασθενείς είχαν διαβήτη Αριθμοί που αντιπροσωπεύουν στατιστικές ή μαθηματικές συναρτήσεις → αριθμητικά Οι αρχικές τιμές πολλαπλασιάστηκαν με 3 και μετά μετασχηματίστηκαν
Χρυσοί κανόνες στην περιγραφή αριθμών Σε πρόταση, συνδυασμός αριθμών < 10 & ≥ 10 → αριθμητικά Στο δείγμα, 18 αγόρια και 6 κορίτσια επιλέχτηκαν Σε δεκαδικούς αριθμούς < 1, χρήση 0 πριν το κόμμα Το P = 0.015 Όχι κενό μεταξύ % και αριθμού Στο σύνολο, 67% των ασθενών είχαν υπέρταση 1 κενό μεταξύ αριθμού και μονάδας μέτρησης Η μέση τιμή της χοληστερίνης ήταν 210 mg/dL
Χρυσοί κανόνες στην περιγραφή αριθμών n≥100 τότε 1 δεκαδικό στα ποσοστά Στο δείγμα των 212 παιδιών, το 10.4% είχαν διαβήτη n<100 τότε κανένα δεκαδικό στα ποσοστά Στους 65 ενήλικες, το 35% εμφάνισε υπέρταση n<20 τότε δεν αναφέρονται ποσοστά Στα 16 παιδιά, τα 5 ήταν παχύσαρκα 1 δεκαδικό παραπάνω από τη μονάδας μέτρησης Το μέσο ύψος ήταν 145.6 εκατοστά
Χρυσοί κανόνες στην περιγραφή αριθμών Στα διαστήματα μεταξύ των αριθμών χρήση «,» ή μέχρι όχι «-» Το μέσο βάρος ήταν 55.6 κιλά (95%ΔΕ 43.2 μέχρι 68.0) ή (95%ΔΕ 43.2, 68.0) H διάμεση διαφορά στην ενδοφθάλμια πίεση μεταξύ ανδρών και γυναικών ήταν 0.5 mmHg με ενδοτεταρτημοριακό εύρος (-1.0, 1.0) Οι παρενθέσεις προηγούνται από τις αγκύλες ([{ Η πιθανότητα για παρενέργειες ήταν αυξημένη στην πειραματική ομάδα σε σχέση το εικονικό φάρμακο (OR: 1.86, 95%CI [1.21, 2,13])
Χρυσοί κανόνες στην περιγραφή αριθμών 0.001 < P < 0.05, 3 δεκαδικά ψηφία Η αρτηριακή πίεση διέφερε σημαντικά μεταξύ των δύο ομάδων (P=0.023) P >0.05, 2 δεκαδικά ψηφία αρκούν Οι δύο ομάδες δε διέφεραν σημαντικά ως προς το φύλο (P=0.86) P=0.000 → P<0.001 Τα επίπεδα ινσουλίνης διέφεραν σημαντικά μεταξύ των παιδιών με διαβήτη σε σχέση με τα παιδιά χωρίς διαβήτη (P<0.001). Ποτέ P=NS ή P>0.05
Χρήσιμο βιβλίο Medical Statistics: A Guide to Data Analysis and Critical Appraisal (Peat J, Barton B, BMJ books) http://users.auth.gr/haidich/MSc
Και άλλο χρήσιμο βιβλίο How to Report Statistics in Medicine (Thomas A. Lang, Michelle Secic)
Statistical notes Martin’s Bland homepage: http://www-users.york.ac.uk/~mb55/pubs/pbstnote.htm Bettina’s homepage: http://users.auth.gr/haidich/MSc
Χρήσιμη ιστοσελίδα!!! http://www.equator-network.org
Uniform Requirements for Manuscripts Submitted to Biomedical Journals IV. A. 6. c. Statistics Describe statistical methods with enough detail to enable a knowledgeable reader with access to the original data to verify the reported results. When possible, quantify findings and present them with appropriate indicators of measurement error or uncertainty (such as confidence intervals). Avoid relying solely on statistical hypothesis testing, such as P values, which fail to convey important information about effect size. References for the design of the study and statistical methods should be to standard works when possible (with pages stated). Define statistical terms, abbreviations, and most symbols. Specify the computer software used. http://www.icmje.org/urm_full.pdf