Επιλογή και Υπολογισμός Μεγέθους Δείγματος

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Προβλέψεις με τη χρήση προτύπων γραμμικής παλινδρόμησης και συσχέτισης
Advertisements

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ
διαστήματα εμπιστοσύνης
Μπουντζιούκα Βασιλική, MSc Βιοστατιστικός Εξωτ. Συνεργάτης ΕΣΔΥ
Εισαγωγή στην Κοινωνιογλωσσολογία
Ερευνητική Μεθοδολογία
Υπολογισμός μεγέθους δείγματος

Μπεττίνα Χάιδιτς Τρίτος παράγοντας ΈκθεσηΈκβαση ? Συγχυτικός παράγοντας Τροποποιητικός παράγοντας.
ΗΥ Παπαευσταθίου Γιάννης1 Clock generation.
Αρχές επαγωγικής στατιστικής
Ορισμοί-Είδη επιδημιολογικής έρευνας
Στατιστικές Μέθοδοι στην Επιδημιολογία Επαναληπτικό μάθημα 22/2/2012.
Week 11 Quiz Sentence #2. The sentence. λαλο ῦ μεν ε ἰ δότες ὅ τι ὁ ἐ γείρας τ ὸ ν κύριον Ἰ ησο ῦ ν κα ὶ ἡ μ ᾶ ς σ ὺ ν Ἰ ησο ῦ ἐ γερε ῖ κα ὶ παραστήσει.
WRITING B LYCEUM Teacher Eleni Rossidou ©Υπουργείο Παιδείας και Πολιτισμού.
Ο PID έλεγχος. Integral Lag Distance velocity lag Υλοποιούμε την.
Διοίκηση Απόδοσης Επιχειρηματικών Διαδικασιών Ενότητα #5: Key result indicators (KRIs), Performance Indicators (PIs), Key Performance Indicators (KPIs)
Time Management Matrix Assignment Submitted By Safwan Zubair October 21, 2013 BUS Contemporary Business Practice Professor Nankin.
Πειραματικές Μονάδες Ένα φυτό Ένα πειραματικό τεμάχιο (plot)
Αριθμητική Επίλυση Διαφορικών Εξισώσεων 1. Συνήθης Δ.Ε. 1 ανεξάρτητη μεταβλητή x 1 εξαρτημένη μεταβλητή y Καθώς και παράγωγοι της y μέχρι n τάξης, στη.
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή β) για ένα ποσοστό.
Εργαστήριο Στατιστικής (7 ο Εργαστήριο) Συσχετίσεις μεταξύ μεταβλητών (ερωτήσεων)
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. –Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας.
Έλεγχος Υποθέσεων Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης, Κατά την εκτέλεση ενός στατιστικού ελέγχου,
Διαχείριση Διαδικτυακής Φήμης! Do the Online Reputation Check! «Ημέρα Ασφαλούς Διαδικτύου 2015» Ε. Κοντοπίδη, ΠΕ19.
Σχεδιασμός Γεωργικών Πειραμάτων. Πειραματικές Μονάδες Ένα Φυτό Ένα Τεμάχιο (Plot) του χωραφιού.
Στατιστική Ανάλυση. Ποιοτικές και ποσοτικές μέθοδοι Ποιες είναι οι διαφορές; Πότε χρησιμοποιούνται; Πότε κάνω στατιστική ανάλυση;
Guide to Business Planning The Value System © Guide to Business Planning The “value system” is also referred to as the “industry value chain”. In contrast.
Βιοστατιστική Ι Μέτρα συσχέτισης στις επιδημιολογικές μελέτες
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Πηγή: ‘Βιοστατιστική’ [Β.Γ. Σταυρινός, Δ.Β.Παναγιωτάκος]
Μέτρα Διασποράς Η μεταβλητότητα, ή αλλιώς η ποικιλομορφία, στις τιμές μιας μεταβλητής θα πρέπει πάντοτε να λαμβάνεται υπόψη σε οποιαδήποτε στατιστική ανάλυση!
Στατιστικές Υποθέσεις
Βασική Στατιστική Επεξεργασία. Ερμηνεία Δεδομένων.
Επαγωγική Στατιστική Εκτίμηση και Έλεγχος μέσων τιμών Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Εκτιμητική: σημειακές εκτιμήσεις παραμέτρων
Έλεγχος Υπόθεσης για το μέσο ενός πληθυσμού
Μεθοδολογία Έρευνας Διάλεξη 5η: Δειγματοληψία
Η Ύλη του Μαθήματος Επανάληψη της πολλαπλή παλινδρόμησης και Ασυμπτωτική κατανομή της εκτιμήτριας ελαχίστων τετραγώνων. Βοηθητικές μεταβλητές και παλινδρόμηση.
ΔΙΑΛΕΞΗ 9η Δειγματοληψία Ορισμοί Είδη δειγματοληψίας
Σχεδιασμός Ερευνών Συγχρονικές Ερευνες.
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Βιοστατιστική Ι Μέτρα συσχέτισης στις επιδημιολογικές μελέτες
Πειραματικές Μονάδες Ένα φυτό Ένα πειραματικό τεμάχιο (plot)
Μεθοδολογία Έρευνας Διάλεξη 5η: Δειγματοληψία
Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας
Προσαρμοστικά μοντέλα
Γεώργιος Σ. Γκουμάς MD,PhD, FESC
Αξιοπιστία Γ. Σιδερίδης
Στατιστικές Υποθέσεις
Μεθοδολογία Έρευνας Διάλεξη 5η: Δειγματοληψία
Ανάλυση Γεωργικού Οικογενειακού Εισήματος (ΓΟΕ)
Postgraduate Courses related to Clinical Criminology and Legal Psychology - Italy WE CAN – ΜΠΟΡΟΥΜΕ! Cyberbullying – Κυβερνοεκφοβισμός Δίκτυο Δράσης για.
ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ
Find: φ σ3 = 400 [lb/ft2] CD test Δσ = 1,000 [lb/ft2] Sand 34˚ 36˚ 38˚
aka Mathematical Models and Applications
GLY 326 Structural Geology
ΕΝΣΤΑΣΕΙΣ ΠΟΙΟΣ? Όμως ναι.... Ένα σκάφος
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
ΤΕΙ Αθήνας Βιοστατιστική (Θ)
τ [lb/ft2] σ [lb/ft2] Find: c in [lb/ft2] σ1 = 2,000 [lb/ft2]
Financial Market Theory
Find: Force on culvert in [lb/ft]
Deriving the equations of
Κεφάλαιο 9 Βασικές Αρχές Του Ελέγχου Υποθέσεων: Έλεγχοι Ενός Δείγματος.
Find: ρc [in] from load (4 layers)
ΜΠΑΜΙΑ ΧΡΙΣΤΙΝΑ* (Υπεύθυνη) Αν. Καθηγήτρια ΒΟΥΡΛΗ ΓΕΩΡΓΙΑ* (Θεωρία)
Αρχές Bιοστατιστικής Γεωργία Βουρλή Τμήμα Βιοστατιστικής και Επιδημιολογίας Ιατρική Σχολή ΕΚΠΑ Μεταπτυχιακό Πρόγραμμα Αγγειοχειρουργική.
Μεταγράφημα παρουσίασης:

Επιλογή και Υπολογισμός Μεγέθους Δείγματος Μπεττίνα Χάιδιτς Επίκουρη Καθηγήτρια Υγιεινής-Ιατρικής Στατιστικής e-mail: haidich@med.auth.gr

Υπολογισμός μεγέθους δείγματος Πιο πολλές επιδημιολογικές μελέτες έχουν ως στόχο να εκτιμηθεί κάποιο χαρακτηριστικό του πληθυσμού ή μία σχέση. Ανάλογα με τη έκβαση της μελέτης, αυτό μπορεί να είναι ένα ποσοστό (επιπολασμός) ή μία διαφορά μεταξύ ομάδων Ένα βασικό ερώτημα που τίθεται, κατά το σχεδιασμό της μελέτης είναι «Πόσο μεγάλο θα πρέπει να το δείγμα της μελέτης, προκειμένου να ικανοποιήσει τους βασικούς στόχους της;»

Παραδείγματα Έλεγχος υπόθεσης Διερεύνηση της σχέσης μεταξύ της θεραπείας ορμονικής υποκατάστασης και της καρδιαγγειακής νόσου. Διερεύνηση του κάτα πόσο ο κίνδυνος της ελονοσίας θα μειωθεί με τη χρήση των εμποτισμένων κουνουπιέρων με εντομοκτόνα. Διερεύνηση της επίδρασης μιας νέας παρέμβασης στην συχνότητα εμφάνισης του καρκίνου του στομάχου.

Παραδείγματα Εκτίμηση μιας τιμής Τι ποσοστό του πληθυσμού της Ελλάδας καπνίζει σήμερα?  Εκτίμηση του επιπολασμού της αναιμίας σε παιδιά κάτω των πέντε ετών.

Τυχαίο σφάλμα Σε επιδημιολογικές μελέτες, παίρνουμε ένα δείγμα για να εκτιμήσουμε την έκβαση που μας ενδιαφέρει τυχαίο σφάλμα (τυπικό σφάλμα)  Μειώνει? Με τη αύξηση του μεγέθους του δείγματος!

Υπολογισμός μεγέθους δείγματος Επιλογή του κατάλληλου μεγέθους δείγματος είναι ένα σημαντικό βήμα για να επιβεβαιωθεί ότι πληρούνται οι στόχοι της μελέτης. Πολύ μικρή μελέτη αδυναμία στην ανίχνευση σημαντικών αποτελεσμάτων με ανακριβή εκτίμηση (με ευρεία διαστήματα εμπιστοσύνης). σπατάλη των πόρων. Ανήθικο να εγγραφούν άτομα σε μια μελέτη που δεν θα μπορεί να απαντήσει το ερευνητικό ερώτημα. Πολύ μεγάλη μελέτη χάσιμο χρόνου, χρημάτων και άλλων πόρων. Μειωμένες πιθανότητες για χρηματοδότηση.

Μερικές βασικές αρχές Οι εκτιμήσεις του μεγέθους δείγματος είναι προσεγγίσεις και χρησιμοποιούνται ως οδηγός κατά το σχεδιασμό μιας μελέτης. Διακρίνουν μεταξύ της ανάγκης για 100 ή 1000 άτομα, αλλά όχι μεταξύ των 100 και 103 άτομα. Οι τύποι για τον υπολογισμό του δείγματος στα περισσότερα βιβλία και στατιστικά προγράμματα προϋποθέτουν ότι ο τύπος δειγματοληψίας είναι η απλή τυχαία δειγματοληψία (δηλαδή δεν είναι δειγματοληψία κατά συστάδες ή διαστρωματωμένη δειγματοληψία). Συνήθως το μέγεθος του δείγματος θα πρέπει να αυξηθεί για άλλους τύπους δειγματοληψίας. Επίσης, θα πρέπει να αυξηθεί ανάλογα με την πολυπλοκότητα της ανάλυσης, για παράδειγμα, η ανάγκη ελέγχου για συγχυτικούς παράγοντες και αλληλεπιδράσεων.

Ισχύς της μελέτης Οι υπολογισμοί μεγέθους δείγματος βασίζονται στη στατιστική ισχύ που επιλέγεται για να εντοπιστεί μια επίδραση ή διαφορά. Η ισχύς της μελέτης είναι ένα μέτρο που δείχνει πόσο πιθανό είναι ότι ο έλεγχος των υποθέσεων (ή σημαντικότητας) θα καταλήξει με στατιστικά σημαντικό αποτέλεσμα το οποίο στην πραγματικότητα ισχύει. Για παράδειγμα, μια ισχύς της μελέτης 90% σημαίνει ότι αν επαναλαμβανόταν η μελέτη πολλές φορές, 9 στις 10 φορές θα κατέληγε σε στατιστικά σημαντικό αποτέλεσμα, δεδομένου ότι στην πραγματικότητα ισχύει το συγκεκριμένο αποτέλεσμα. Η απαιτούμενη ισχύς της μελέτης αποφασίζεται από πριν

Σφάλματα τύπου Ι και ΙΙ Βασισμένη στο δείγμα η απόφαση είναι Απόρριψη μηδενικής υπόθεσης (στατ. σημαντικό) Μη απόρριψη μηδενικής υπόθεσης (μη στατ. σημαντικό) Στον πληθυσμό από όπου το δείγμα εξάγεται, η μηδενική υπόθεση είναι Αληθής α=Σφάλμα τύπου Ι (επίπεδο σημαντικότητας) (Ψευδώς θετικό αποτέλεσμα) Σωστή απόφαση 1-α Ψευδής Σωστή απόφαση (ισχύς ελέγχου) 1-β Σφάλμα τύπου ΙΙ Β (Ψευδώς αρνητικό αποτέλεσμα) The first row of the table illustrates what can happen when the null hypothesis is true. We can either draw the correct conclusion from our study, and don't reject the null hypothesis, Or we can make a Type I error and reject the null hypothesis when it is, in fact, true (a false positive result). The probability of a Type I error is α. The significance level of the study is 1 – α. The second row shows what can happen when the null hypothesis is false. We can either draw the correct conclusion from our study, and reject the null hypothesis, Or make a Type II error, and not reject the null hypothesis when it is, in fact, false (a false negative result). The probability of a Type II error is β. The power of the study is 1 – β. The power of the study is the probability of getting a statistically significant result with the selected sample if a true difference exists. The power is equal to 1-Type II error - the larger the power of the study, the smaller the Type II error.

Υπολογισμός μεγέθους δείγματος Ελαχιστοποίηση των δύο τύπων σφαλμάτων Κλινικά σημαντική διαφορά μεταξύ των ομάδων και να υπάρχει και στατιστικά σημαντική διαφορά μεταξύ τους Ικανοποίηση Μη στατιστικά σημαντικά αποτελέσματα δεν υπάρχει πραγματική διαφορά μεταξύ των συγκρινόμενων ομάδων, ή υπάρχει μια πραγματική διαφορά, αλλά το συγκεκριμένο δείγμα δεν είχε την απαιτούμενη στατιστική ισχύ. Αποτελέσματα είναι ασαφή   Σαφώς εάν σχεδιάσουμε μια μελέτη για να έχουν ένα υψηλό επίπεδο ισχύος και τα αποτελέσματα δεν είναι στατιστικά σημαντικά τότε μπορούμε να είμαστε περισσότερο βέβαιοι ότι αυτό συμβαίνει διότι δεν υπάρχει πραγματική διαφορά.

Υπολογισμός μεγέθους δείγματος N α , β Σφάλμα Τύπου Ι πιο σοβαρό από σφάλμα τύπου ΙΙ σφάλμα τύπου Ι = ψεύτικη δήλωση σφάλμα τύπου Ι Ι= ουδέτερη δήλωση   α= 5%, υπάρχει μια 5% πιθανότητα ότι η παρατηρούμενη σχέση δεν υπάρχει στον πληθυσμό. Αυτό ονομάζεται το επίπεδο σημαντικότητας. «το καινοτόμο θεραπεία είναι πιο αποτελεσματική από ό, τι το πρότυπο ένα"), ενώ η συνέπεια ενός σφάλματος τύπου II είναι ένα ουδέτερο δήλωση (για παράδειγμα, "δεν έχουμε καμία απόδειξη ότι η πρωτοποριακή θεραπεία είναι πιο αποτελεσματική από ό, τι το πρότυπο ένα "- ο οποίος δεν αποκλείει το ενδεχόμενο να είναι πράγματι πιο αποτελεσματική, απλά δεν ξέρω).

Ισχύς της μελέτης Περισσότερες μελέτες σχεδιάζονται με μια ισχύ ≥ 80% Το οποίο τι σημαίνει? Υπάρχει 20% πιθανότητα ότι η πραγματική διαφορά θα εντοπιστεί στη μελέτη Υπάρχει 20% πιθανότητα ότι η πραγματική διαφορά δεν θα εντοπιστεί

Υπολογισμός μεγέθους δείγματος Πρέπει να προσδιοριστεί: H ελάχιστη κλινική σημαντική διαφορά που θέλεις να εντοπίσεις μαζί με ένα μέτρο ακρίβειας (τυπική απόκλιση) Συνήθως από πιλοτική ή προηγούμενη μελέτη Την ισχύ της μελέτης. 1-β = 80-90% Το επίπεδο σημαντικότητας α=5% Την αναλογία των ατόμων στις ομάδες σύγκρισης Π.χ. Ίδιος αριθμός ασθενών και μαρτύρων σε μια μελέτη ασθενών-μαρτύρων?

Υπολογισμός μεγέθους δείγματος Πρέπει να προσδιοριστεί: Το βασικό επίπεδο της νόσου Μελέτη ασθενών-μαρτύρων: Το ποσοστό των μαρτύρων που έχουν εκτεθεί στον παράγοντα κινδύνου Μελέτη κοόρτης: Το ποσοστό των ατόμων που έχουν τη νόσο και δεν έχουν εκτεθεί στο παράγοντα κινδύνου. Την ελάχιστη κλινική σημαντική διαφορά που θέλεις να εντοπίσεις Μελέτη ασθενών-μαρτύρων: OR Μελέτη κοόρτης: RR, RD Την ισχύ της μελέτης. 1-β = 80-90% Το επίπεδο σημαντικότητας α=5% Την αναλογία των ατόμων στις ομάδες σύγκρισης Π.χ. Ίδιος αριθμός ασθενών και μαρτύρων σε μια μελέτη ασθενών-μαρτύρων?

Διαφορά μέσων τιμών Represents the desired power (typically .84 for 80% power). Sample size in each group (assumes equal sized groups) Standard deviation of the outcome variable Represents the desired level of statistical significance (typically 1.96). Effect Size (the difference in means)

Nomograms (Altman)

Διαφορά ποσοστών Represents the desired power (typically .84 for 80% power). Sample size in each group (assumes equal sized groups) A measure of variability (similar to standard deviation) Represents the desired level of statistical significance (typically 1.96). Effect Size (the difference in proportions)

Ανάλυση επιβίωσης d=αριθμός περιστατικών Π.χ. Σχεδιάζουμε μία μελέτη με 2 ομάδες και θέλουμε να βρούμε μια αναλογία κινδύνου HR=1.5 με 90% ισχύ και 5% αμφίπλευρο επίπεδο σημαντικότητας. Απαιτούμενος αριθμός περιστατικών:

Απώλεια Ποσοστό απώλειας = r Ν* = Ν/ (1-r) Π.χ. Ποσοστό απώλειας = 30% Ν = 200 Ν* = 200 /(1-0.3) = 200/0.7 = 286 άτομα

OPENEPI http://www.openepi.com/Menu/OE_Menu.htm

Παράδειγμα μελέτης κοόρτης we wish to detect a risk ratio of 1.5 the risk of disease in an unexposed population is 5% 90% power 5% level of significance equal numbers of exposed and non-exposed

Υπολογισμός μεγέθους δείγματος για μελέτες κοόρτης Total sample size required for given risk ratio and risk in the unexposed population Risk of disease in unexposed group Risk Ratio 5% 10% 15% 1.5 4102 2.0 5.0 1906 1174 1244 572 348 150 62 32 As the size of the effect of the exposure increases, the sample size needed to detect the effect DECREASES. As the risk of disease in the population decreases, the sample size required INCREASES. Όσο μεγαλώνει ο κίνδυνος, ΜΕΙΩΝΕΙ το μέγεθος δείγματος Όσο μεγαλώνει ο σχετικός κίνδυνος, ΜΕΙΩΝΕΙ το μέγεθος δείγματος

Υπολογισμός μεγέθους δείγματος για μελέτες ασθενών-μαρτύρων Total sample size required for given οdds ratio and percent of controls exposed Percentage of exposure in the control group Odds Ratio 10% 50% 80% 1.5 2.0 5.0 2530 1076 1894 806 388 740 124 92 218 Απαιτείται πολύ μεγάλο δείγμα όταν η έκθεση σε έναν παράγοντα κινδύνου θεωρείται πολύ ΣΠΑΝΙΑ ή πολύ ΣΥΝΗΘΙΣΜΕΝΗ ή όταν ο λόγος σχετικών πιθανοτήτων είναι ΜΙΚΡΟΣ.

All-purpose power formula…

Ισχύς Η μηδενική υπόθεση θα απορριφθεί (για α=0.05) αν η τιμή της δοκιμασίας είναι > | 2 | θα είμαστε στη περιοχή απόρριψης

Αύξηση της διαφοράς μ1 – μ2 Για να ΑΥΞΗΘΕΙ η ισχύς μιας μελέτης η οποία συγκρίνει δύο ομάδες, ο ερευνητής θα μπορούσε να μεγαλώσει την αναμενόμενη διαφορά

Αύξηση της διαφοράς μ1 – μ2 Για να ΑΥΞΗΘΕΙ η ισχύς μιας μελέτης η οποία συγκρίνει δύο ομάδες, ο ερευνητής θα μπορούσε να μεγαλώσει την αναμενόμενη διαφορά

Αύξηση του μεγέθους δείγματος n Για να ΑΥΞΗΘΕΙ η ισχύς μιας μελέτης η οποία συγκρίνει δύο ομάδες, ο ερευνητής θα μπορούσε να αυξήσει το μέγεθος του δείγματος

Αύξηση του μεγέθους δείγματος n Για να ΑΥΞΗΘΕΙ η ισχύς μιας μελέτης η οποία συγκρίνει δύο ομάδες, ο ερευνητής θα μπορούσε να αυξήσει το μέγεθος του δείγματος

Αύξηση επιπέδου σημαντικότητας α Για να ΑΥΞΗΘΕΙ η ισχύς μιας μελέτης η οποία συγκρίνει δύο ομάδες, ο ερευνητής θα μπορούσε να αυξήσει το επίπεδο σημαντικότας α (πιο “εύκολα” απορρίπτεται η Η0) Εδώ, με =0.05: -

Αύξηση επιπέδου σημαντικότητας α Για να ΑΥΞΗΘΕΙ η ισχύς μιας μελέτης η οποία συγκρίνει δύο ομάδες, ο ερευνητής θα μπορούσε να αυξήσει το επίπεδο σημαντικότας α (πιο “εύκολα” απορρίπτεται η Η0) Εδώ, με =0.10:

Η ισχύς αυξάνει Διαφορά Τυπική απόκλιση Μέγεθος δείγματος Επίπεδο σημαντικότητας (α) It turns out that if you were to go out and sample many, many times, most sample statistics that you could calculate would follow a normal distribution. What are the 2 parameters (from last time) that define any normal distribution? Remember that a normal curve is characterized by two parameters, a mean and a variability (SD) What do you think the mean value of a sample statistic would be? The standard deviation? Remember standard deviation is natural variability of the population Standard error can be standard error of the mean or standard error of the odds ratio or standard error of the difference of 2 means, etc. The standard error of any sample statistic.

Υπολογισμός ισχύος-Παράδειγμα Σχεδιάζεται μια μελέτη κοόρτης για τη διερεύνηση της χρήσης αντισυλληπτικών και του κινδύνου για υπέρταση: Η χρηματοδότηση επαρκεί μόνο για 200 άτομα σε κάθε ομάδα Ο σχετικός κίνδυνος αναμένεται να είναι περίπου 2.0 Από προηγούμενες μελέτες, ο κίνδυνος υπέρτασης εκτιμάται 10% σε άτομα που δεν έχουν εκτεθεί σε κάποιο παράγοντα κινδύνου.

OPENEPI

Παράδειγμα Σχεδιάζεται μια μελέτη ασθενών-μαρτύρων για τη διερεύνηση της σχέσης μεταξύ του καπνίσματος και της στεφανιαίας νόσου: Η χρηματοδότηση επαρκεί για να μελετηθούν 600 άτομα και γνωρίζεις ότι μπορείς να βρεις μόνο 200 ασθενείς με στεφανιαία νόσο Αναμένεται ο λόγος σχετικών πιθανοτήτων να είναι 1.8 Από προηγούμενες μελέτες, εκτιμάται πως η συχνότητα καπνίσματος είναι περίπου 35%. p2= (OR*p1)/[1+(OR-1)*p1] = 49% Ποια είναι η ισχύς με 200 ασθενείς και 200 μάρτυρες με 5% επίπεδο σημαντικότητας?

Πόσο αυξάνει η ισχύς αν έχεις το διπλάσιο αριθμό μαρτύρων σε σχέση με τους ασθενείς και συμπεριλάβεις τελικά 600 άτομα?

Ισχύς από 81% σε 91%

Ακρίβεια της μελέτης Ο υπολογισμός μεγέθους δείγματος προσδιορίζεται από το μέγεθος του τυχαίου σφάλματος που θεωρείται αποδεκτό Όσο πιο στενά τα διαστήματα εμπιστοσύνης τόσο μεγαλύτερη και η ακρίβεια (μειωμένο τυχαίο σφάλμα) Π.χ. OpenEpi(Proportion)

Άνισες ομάδες Για να επιτευχθεί η ίδια ισχύ με μελέτη ίσων ομάδων: Το συνολικό μέγεθος δείγματος θα πρέπει να αυξηθεί n1 = n (k+1)/2k π.χ. Αν n=16 (n1 = n2 = 16) και k=2 τότε n1 = 16 (2+1)/2k = 48/4 =12 Το μέγεθος της 2ης ομάδας θα αυξηθεί n2=kn1 n2=2*12=24 Σε μια μελέτη ίσων ομάδων Ν=16+16 = 32 ενώ σε μια μελέτη άνισων ομάδων Ν = 12+24 = 36 Δεν έχει νόημα να αυξήσεις την αναλογία k > 3 ή 4 διότι μεγάλες αυξήσεις στο n2 καταλήγει σε μικρές μειώσεις στο n1 A study with groups of unequal sample size (unequal groups) is used if it is preferable to minimize the numbers in one of the groups. For example, if an experimental drug is very expensive, investigators may wish to reduce the number of subjects receiving that drug for cost reasons.

Πολλαπλές ομάδες Ο υπολογισμός μεγέθους δείγματος βασίζονται στη σύγκριση που σε ενδιαφέρει περισσότερο Μπορεί η μελέτη να μην έχει αρκετά μεγάλο μέγεθος δείγματος για να εντοπίσει διαφορές σε άλλες συγκρίσεις It is important to remember that this may mean that your study will not necessarily have an adequate sample size to draw conclusions for every sub-analysis that you may wish to perform (for example, analysis by different age-groups).

Μελέτη κατά συστάδες Το απαιτούμενο μέγεθος δείγματος πρέπει να αυξηθεί διότι τα άτομα μέσα σε κάθε συστάδα θεωρούνται πιο όμοια απ΄ότι στις άλλες συστάδες Το αρχικό δείγμα πολλαπλασιάζεται με το: Design effect = 1 + (n’ - 1) * ΙCC n’ = μέσο μέγεθος κάθε συστάδας. ICC = Var (Between)/Total Variance Δοκιμάζεις διάφορες τιμές ICC (0, 1) The sample size needed for studies with a clustered design are greater than those without a clustered design, because individuals within each cluster tend to be more similar to each other than to individuals in other clusters. The amount by which the sample size needs to be multiplied (increased) is known as the design effect . This, in turn, depends on the intraclass correlation coefficient (ICC), which is the ratio of the between-cluster variance to the total variance. The design effect and the intraclass correlation coefficient are linked by the following equation: Design effect = 1 + (n’ - 1) X Intraclass correlation coefficientwhere n’ is the average cluster size. Estimating the ICC when the study is being designed can be difficult because there may be no a-priori information about this factor. In this situation, researchers usually calculate the required number of clusters under a range of assumptions about the ICC, as well as using a range of values for the cluster size.

Tips & Hints

Tips & Hints Οι πιο πολλές μελέτες δεν έχουν ένα σκοπό, οπότε ένα μέγεθος δείγματος που είναι αρκετό για μια σύγκριση μπορεί να μην είναι αρκετό για άλλη σύγκριση. Στον υπολογισμό μεγέθους δείγματος επικεντρώνεσαι στις κύριες εκβάσεις. Μεγάλα δείγματα θεωρούνται άχρηστα αν δεν έχουν επιλεγεί σωστά (μεροληψία) Οι τύποι για τον υπολογισμό του δείγματος στα περισσότερα βιβλία και στατιστικά προγράμματα προϋποθέτουν ότι πρόκειται για απλή τυχαία δειγματοληψία. Συνήθως το μέγεθος του δείγματος θα πρέπει να αυξηθεί για άλλους τύπους δειγματοληψίας. It is important to remember the following when conducting sample size calculations: Most surveys are not confined to one purpose. A sample size that is adequate for one variable or one comparison may be inadequate for another. In calculating the sample size, one should concentrate on the most important variable(s) being measured in the study. Large numbers in themselves are worse than useless if the samples are biased. It is advisable to increase the calculated sample size to allow for non-response, loss to follow-up and other factors that reduce the actual, achieved sample size.

Tips & Hints Δοκιμάστε διαφορετικά σενάρια πριν καταλήξετε σε ένα δείγμα Χρησιμοποιήστε πολλές εναλλακτικές βιβλιογραφικές πηγές για τις εκτιμήσεις Ο υπολογισμός μεγέθους δείγματος βασίζεται στη σύγκριση που σε ενδιαφέρει περισσότερο Μπορεί η μελέτη να μην έχει αρκετά μεγάλο μέγεθος δείγματος για να εντοπίσει διαφορές σε άλλες συγκρίσεις The calculations shown in this session have assumed simple random sampling. Adjustments need to be made if other methods such as cluster sampling or stratified sampling are used. These may increase the sample size considerably, e.g. by a factor two or higher. The calculations shown in this session have also assumed a very large or infinite population size from which the sample is drawn, and the sample actually taken is only a small fraction of the total population. Adjustments need to be made if this fraction becomes sizeable (above, say, 10%). Sample sizes should be increased if control for confounding factors is anticipated to be necessary. Typically, increases of 20-25% should be considered.

Tips & Hints Το μέγεθος του δείγματος θα πρέπει να αυξηθεί: Στην περίπτωση της τυχαιοποίησης κατά συστάδες ή διαστρωματωμένης τυχαιοποίησης Αν ο έλεγχος για συγχυτικούς παράγοντες θεωρείται απαραίτητος Συνήθως αύξηση κατά 20-25% για να ληφθούν υπόψη οι απώλειες ή άλλοι παράγοντες που μπορεί να μειώσουν τελικά το πραγματικό μέγεθος του δείγματος. Προσαρμόστε για την πιθανή απώλεια στην απαντητικότητα The calculations shown in this session have assumed simple random sampling. Adjustments need to be made if other methods such as cluster sampling or stratified sampling are used. These may increase the sample size considerably, e.g. by a factor two or higher. The calculations shown in this session have also assumed a very large or infinite population size from which the sample is drawn, and the sample actually taken is only a small fraction of the total population. Adjustments need to be made if this fraction becomes sizeable (above, say, 10%). Sample sizes should be increased if control for confounding factors is anticipated to be necessary. Typically, increases of 20-25% should be considered.

Χρήσιμες ιστοσελίδες! http://www.sample-size.net/ http://www.openepi.com/Menu/OE_Menu.htm http://www.ats.ucla.edu/stat/gpower/

Κύριες βιβλιογραφικές πηγές EPIET Introductory course, 2000-2004. Thomas Grein, Denis Coulombier, Philippe Sudre, Mike Catchpole, Denise Antona, Viviane Bremer. Moser CA, Kalton G. Survey methods in social investigation. Second edition. London: Heinemann education books. 1971. Armitage P, Berry G. Statistical methods in medical research. Third edition. Oxford: Blackwell. 1994. Lemeshaw S, Hosmer DW, Klar J, Lwanga SK. Adequacy of sample size in health studies. Chichester: WHO, John Wiley. 1990.

Ασκήσεις

Πρόκειται να πραγματοποιήσετε Μελέτη εμβολιαστικής κάλυψης σε παιδιά ηλικίας 6 ετών στην Ελλάδα, με σκοπό την εκτίμηση του ποσοστού εμβολιασμού για 2η δόση του εμβολίου MMR (Ιλαράς-Ερυθράς-Παρωτίτιδας). Υπολογίστε το απαιτούμενο μέγεθος δείγματος για: α) απλή τυχαία δειγματοληψία β) δειγματοληψία κατά συστάδες (συνήθως DEFF=2) λαμβάνοντας υπόψη τις εξής παραμέτρους: - Δ.Α. 95% (δηλ. z=1.96) - αναμενόμενη συχνότητα (p) 2ης δόσης MMR 80% - επιθυμητή ακρίβεια εκτιμήσεων (d) +/- 5%

Απλή τυχαία δειγματοληψία

Κατά συστάδες

Πρόκειται να πραγματοποιήσετε Μελέτη εμβολιαστικής κάλυψης σε παιδιά ηλικίας 6 ετών στην Ελλάδα, με σκοπό την εκτίμηση του ποσοστού εμβολιασμού για 2η δόση του εμβολίου MMR (Ιλαράς-Ερυθράς-Παρωτίτιδας). Υπολογίστε το απαιτούμενο μέγεθος δείγματος για α) ΔΑ 95% (δηλ. z=1,96) β) ΔΑ 99% (δηλ. z=2,576) γ) ΔΑ 90% (δηλ. z=1,645) λαμβάνοντας υπόψη τις εξής παραμέτρους: - αναμενόμενη συχνότητα (p) 2ης δόσης MMR 75% - επιθυμητή ακρίβεια εκτιμήσεων (d) +/- 5% - δειγματοληψία κατά συστάδες

Πρόκειται να πραγματοποιήσετε Μελέτη εμβολιαστικής κάλυψης σε παιδιά ηλικίας 6 ετών στην Ελλάδα, με σκοπό την εκτίμηση του ποσοστού εμβολιασμού για 2η δόση του εμβολίου MMR (Ιλαράς-Ερυθράς-Παρωτίτιδας). Υπολογίστε το απαιτούμενο μέγεθος δείγματος για α) αναμενόμενη συχνότητα (p) 2ης δόσης MMR 15% β) » » » » 50% γ) » » » » 85% λαμβάνοντας υπόψη τις εξής παραμέτρους: - Δ.Α. 95% (δηλ. z=1.96) - επιθυμητή ακρίβεια εκτιμήσεων (d) +/- 5% - απλή τυχαία δειγματοληψία

Πρόκειται να πραγματοποιήσετε Μελέτη εμβολιαστικής κάλυψης σε παιδιά ηλικίας 6 ετών στην Ελλάδα, με σκοπό την εκτίμηση του ποσοστού εμβολιασμού για 2η δόση του εμβολίου MMR (Ιλαράς-Ερυθράς-Παρωτίτιδας). Υπολογίστε το απαιτούμενο μέγεθος δείγματος για α) επιθυμητή ακρίβεια (d) εκτιμήσεων +/-3% β) » » » +/-5% γ) » » » +/-8% λαμβάνοντας υπόψη τις εξής παραμέτρους: - αναμενόμενη συχνότητα 2ης δόσης MMR: άγνωστη - Δ.Α. 95% (δηλ. z=1.96) - δειγματοληψία κατά συστάδες

Είστε έτοιμοι για τον υπολογισμό μεγέθους δείγματος !!!