Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ"— Μεταγράφημα παρουσίασης:

1 ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ
ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΕΧΝΟΛΟΓΙΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗΝ ΙΑΤΡΙΚΗ ΚΑΙ ΤΗ ΒΙΟΛΟΓΙΑ ΜΑΘΗΜΑ : ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΔΙΟΝΥΣΗΣ ΛΙΝΑΡΔΑΤΟΣ 22 ΙΑΝΟΥΑΡΙΟΥ 2015

2 Ανάλυση Επιβίωσης Παραγοντική Ανάλυση / Γραμμική Διακριτική Ανάλυση (Επανάληψη) Ανάλυση Επιβίωσης Βιοστατιστική και έρευνα

3 1. Παραγοντική Ανάλυση Κάθε παρατηρούμενη μεταβλητή υποθέτουμε ότι είναι εξαρτημένη από ένα γραμμικό συνδυασμό των κοινών παραγόντων. Οι συντελεστές αυτού του συνδυασμού είναι γνωστοί ως φορτώσεις ή φορτία ή επιβαρύνσεις. Επίσης, κάθε παρατηρούμενη μεταβλητή περιλαμβάνει μία συνιστώσα λόγω τυχαίας ανεξάρτητης μεταβλητότητας, που είναι γνωστή ως ειδική μεταβλητότητα ή ειδικός παράγοντας, επειδή είναι συγκεκριμένη (ειδική) για κάθε μεταβλητή.

4 1. Παραγοντική Ανάλυση MATLAB Statistics Toolbox : Η συνάρτηση factoran Πραγματοποιεί την Παραγοντική Ανάλυση (factor analysis) στον πίνακα δεδομένων X με τη μέθοδο της μεγίστης πιθανοφάνειας. [lambda,psi,T,stats,F] = factoran(X,m,’param’,value) Περιγραφή Τιμές X Ο n×p πίνακας των δεδομένων X. Οι γραμμές του X αντιστοιχούν σε παρατηρήσεις, οι στήλες σε μεταβλητές. m Το πλήθος των κοινών παραγόντων. ‘param’, value Παράμετροι που ελέγχουν το μοντέλο και τις εξόδους του. Η πλέον συνηθισμένη παράμετρος είναι η ΄rotate’ που χρησιμοποιείται για να δηλώσει τη μέθοδο στροφής των φορτώσεων. Άλλη παράμετρος είναι η ‘delta’ που αποτελεί το χαμηλότερο όριο για τις ειδικές διασπορές psi κατά τη διάρκεια της βελτιστοποίησης της μεγίστης πιθανοφάνειας. Εξορισμού: ‘rotate’=‘varimax’ (είδος ορθογώνιας περιστροφής) ‘delta’=0.05 lambda Ο πίνακας (διαστάσεων pxm) των εκτιμήσεων των φορτώσεων. psi To διάνυσμα (διάστασης m) των εκτιμήσεων των διασπορών των ειδικών παραγόντων Τ Ο πίνακας (διαστάσεων mxm) στροφής των παραγόντων. stats Δομή, το τελευταίο στοιχείο της οποίας περιέχει πληροφορία σχετική με τη μηδενική υπόθεση Η0 ότι το πλήθος των κοινών παραγόντων είναι m. F O πίνακας (διαστάσεων nxm) των τιμών των κοινών παραγόντων.

5 1. Παραγοντική Ανάλυση Παράδειγμα 1.1
Να πραγματοποιηθεί Παραγοντική Ανάλυση στα ακόλουθα δεδομένα: X =[ ];

6 1. Παραγοντική Ανάλυση Παράδειγμα 1.1(συν.)
Εφαρμόζουμε την Παραγοντική Ανάλυση : lambda,psi,T,stats,F] = factoran(X,2) ??? Error using ==> factoran The covariance matrix of X must be positive definite. % size(cov(X)) = % rank(cov(X)) = 2 Παρατήρηση 1 : Οι μεταβλητές του πίνακα Χ των παρατηρήσεων πρέπει να είναι γραμμικώς ανεξάρτητες, δηλαδή ο πίνακας συνδιασποράς του Χ, cov(X), πρέπει να είναι πλήρους τάξης για να μπορεί να εφαρμοστεί η εκτίμηση μεγίστης πιθανοφάνειας (MLE). Παρατήρηση 2 : Η συνάρτηση factoran τυποποιεί τον πίνακα δεδομένων Χ ώστε να έχει μηδενική μέση τιμή και μοναδιαία διασπορά πριν υπολογίσει τις φορτώσεις L. Αυτό σημαίνει ότι ο πίνακας συνδιασποράς γίνεται ο πίνακας συσχέτισης του Χ. Αυτή η η τυποποίηση δεν επηρεάζει το αποτέλεσμα καθώς η MLE στην περίπτωση αυτή δεν εξαρτάται από την κλίμακα. Ωστόσο, οι φορτώσεις L και οι διασπορές Ψ που παρέχει η factoran αφορούν τις τυποποιημένες μεταβλητές, δηλαδή είναι τέτοιες ώστε:

7 1. Παραγοντική Ανάλυση Παράδειγμα 1.2
Να πραγματοποιηθεί Παραγοντική Ανάλυση στα ακόλουθα δεδομένα: X = [ ];

8 1. Παραγοντική Ανάλυση Παράδειγμα 1.2 (συν.)
Εφαρμόζουμε την Παραγοντική Ανάλυση (εξορισμού περιστροφή) : [lambda,psi,T,stats,F] = factoran(X,2) Warning: Some unique variances are zero: cannot compute significance. lambda =[ ]; psi =[ 0.8036 0.5253 0.0050 0.9096 0.8712 0.8102]; T =[ ]; stats = loglike: dfe: 4 Περίπτωση Heywood: Εάν κάποιες ειδικές διασπορές είναι ίσες με την τιμή της παραμέτρου 'delta‘, δηλαδή ουσιαστικά μηδενικές, έχουμε την περίπτωση Heywood. Η ερμηνεία των αποτελεσμάτων στην περίπτωση αυτή είναι προβληματική. Μπορεί να υπάρχουν πολλαπλά τοπικά μέγιστα της συνάρτησης πιθανοφάνειας, καθένα από τα οποία δίνει διαφορετικές φορτώσεις και ειδικές διασπορές. Η περίπτωση Heywood μπορεί να οφείλεται σε πολλούς λόγους π.χ. σε μεγάλο m. F=[ ]

9 1. Παραγοντική Ανάλυση Παράδειγμα 1.2 (συν.)
Εφαρμόζουμε την Παραγοντική Ανάλυση χωρίς περιστροφή: [lambdan,psi,Tn,stats,Fn] = factoran(X,2,'rotate','none') Warning: Some unique variances are zero: cannot compute significance. lambdan =[ ]; psi =[ 0.8036 0.5253 0.0050 0.9096 0.8712 0.8102]; Tn =[ ]; stats = loglike: dfe: 4 Fn= [ ]; Παρατήρηση : lamba= lambdan*T lambdan*T =[ ];

10 1. Παραγοντική Ανάλυση Παράδειγμα 1.2 (συν.)
Ο στόχος της περιστροφής είναι να βρούμε παραμετροποίηση στην οποία κάθε μεταβλητή έχει μικρό πλήθος μεγάλων φορτώσεων, άρα επηρεάζεται από μικρό πλήθος κοινών παραγόντων (το επιθυμητό είναι ένας). Έτσι μπορεί να γίνει ευκολότερη η ερμηνεία των κοινών παραγόντων. Η στροφή μπορεί να γίνει με πολλές μεθόδους. Κάποιες αφήνουν τους άξονες ορθογώνιους άλλες μεταβάλουν τις γωνίες μεταξύ τους. Στο παράδειγμα, όπως φαίνεται στο σχήμα που έχει προκύψει με plot(lamda(:,1), lambda(:,2)), η περιστροφή δημιούργησε απλούστερη δομή φορτώσεων έτσι ώστε τα περισσότερα σημεία έχουν μεγάλη φόρτωση σε ένα μόνο παράγοντα. Rotation No rotation

11 1. Παραγοντική Ανάλυση Παράδειγμα 1.2 (συν.)
Εφαρμόζουμε την Παραγοντική Ανάλυση αλλάζοντας το ‘delta’ : [lambda,psi,T,stats,FF] = factoran(X,2,'delta', ) lambda =[ ]; psi = [ 0.8042 0.5278 0.0000 0.9095 0.8706 0.8106]; T =[ ] stats = loglike: dfe: 4 chisq: p: F=[ ];

12 1. Γραμμική Διακριτική Ανάλυση
Η Γραμμική Διακριτική (ή Διαχωριστική) Ανάλυση (Linear Discriminant Analysis) είναι μια τεχνική που χρησιμοποιείται για τη δημιουργία ενός προγνωστικού μοντέλου μέλους ομάδας με βάση τα παρατηρούμενα χαρακτηριστικά κάθε ομάδας. Η Γραμμική Διακριτική Ανάλυση παράγει γραμμικές συναρτήσεις διαχωρισμού από ένα δείγμα παρατηρήσεων με γνωστή την ομάδα στην οποία κάθε μία παρατήρηση ανήκει. Στη συνέχεια, οι συναρτήσεις μπορούν να εφαρμοστούν σε νέες περιπτώσεις με μετρήσεις των μεταβλητών πρόβλεψης αλλά άγνωστη την ομάδα στην οποία ανήκουν. Όταν υπάρχουν δύο ομάδες, τότε παράγεται μόνο μία συνάρτηση διαχωρισμού.

13 1. Γραμμική Διακριτική Ανάλυση
Όταν υπάρχουν περισσότερες από δύο ομάδες, παράγονται περισσότερες συναρτήσεις. Πιο συγκεκριμένα, εάν υπάρχουν k επίπεδα της εξαρτημένης μεταβλητής, μπορεί να εξαχθούν μέχρι k-1 συναρτήσεις διαχωρισμού και μπορούμε να ελέγξουμε πόσες τελικά αξίζει να κρατήσουμε. Συνήθως, μόνο οι τρεις πρώτες από τις συναρτήσεις αυτές είναι χρήσιμες. Η Γραμμική Διακριτική Ανάλυση παράγει μια νέα μεταβλητή συνδυάζοντας τις αρχικές μεταβλητές κατά τέτοιο τρόπο ώστε να μεγιστοποιούνται οι διαφορές μεταξύ των προκαθορισμένων ομάδων. Τα μέλη των ομάδων πρέπει να είναι γνωστά πριν από την εφαρμογή της Γραμμικής Διακριτικής Ανάλυσης. Ένας δεύτερος σκοπός της Γραμμικής Διακριτικής Ανάλυσης είναι η κατανόηση του συνόλου των δεδομένων. Μια προσεκτική εξέταση του μοντέλου πρόβλεψης που προκύπτει από την ανάλυση μπορεί να δώσει πληροφόρηση για τη σχέση μεταξύ της ιδιότητας μέλους ομάδας και των μεταβλητών που χρησιμοποιούνται για την πρόβλεψή της.

14 1. Γραμμική Διακριτική Ανάλυση
Η συνάρτηση classify Ταξινομεί κάθε γραμμή των δεδομένων που περιέχονται στο “sample” με βάση τη Διακριτική Ανάλυση που έχει πραγματοποιηθεί χρησιμοποιώντας τα “training”- “group”. [class,err]= classify(sample,training,group,'type') Περιγραφή Τιμές sample Ένας πίνακας του οποίου οι γραμμές είναι οι προς ταξινόμηση παρατηρήσεις και οι στήλες είναι οι μεταβλητές. training Ένας πίνακας του οποίου οι γραμμές είναι οι παρατηρήσεις με γνωστή ταξινόμηση (η πληροφορία παρέχεται από το διάνυσμα “group”) και οι στήλες είναι οι μεταβλητές. group Είναι μια μεταβλητή ομαδοποίησης που αντιστοιχεί στις παρατηρήσεις του “training”. Οι τιμές της ορίζουν τις ομάδες και κάθε στοιχείο της ορίζει την ομάδα στην οποία ανήκει η αντίστοιχη γραμμή του “training”. ‘type’ Προσδιορίζει τον τύπο της συνάρτησης διαχωρισμού. ‘linear’ (εξ’ ορισμού) ‘quadratic’ κλπ class Δείχνει σε ποια ομάδα αντιστοιχεί κάθε γραμμή του “sample” και είναι του ίδιου τύπου με τη “group”. err Η εκτίμηση του ποσοστού εσφαλμένης ταξινόμησης.

15 1. Γραμμική Διακριτική Ανάλυση
Η συνάρτηση classify (συν.) [class,err]= classify(sample,training,group,'type') Σημειώνεται ότι : Οι “sample” και “training” πρέπει να είναι πίνακες με το ίδιο πλήθος στηλών. Οι “training” και “group” πρέπει να έχουν το ίδιο πλήθος γραμμών. Η συνάρτηση classify επιστρέφει ως ποσοστό των σφαλμάτων (err) το ποσοστό των παρατηρήσεων του “training” που ταξινομούνται εσφαλμένα. Η επιλογή του συνόλου “training” πρέπει να γίνεται προσεκτικά ώστε να υπάρχει ισορροπημένη συμμετοχή σε αυτό όλων των ομάδων των παρατηρήσεων. Δεν μπορούμε για παράδειγμα να εισάγουμε στο σύνολο “training” τις παρατηρήσεις που αντιστοιχούν σε μία μόνο από τις ομάδες.

16 1. Γραμμική Διακριτική Ανάλυση
Παράδειγμα 1.3 Οι τρεις πρώτες στήλες του ακόλουθου πίνακα περιέχουν τις μετρήσεις τριών χαρακτηριστικών σε τρεις ομάδες ασθενών (30 ασθενείς σε κάθε ομάδα). Κάθε ομάδα ασθενών πάσχει από διαφορετική ασθένεια σε σχέση με τις υπόλοιπες. Η τέταρτη στήλη του πίνακα περιγράφει την ομάδα που ανήκει κάθε ασθενής (κωδικοποίηση σε 1, 2, 3).

17 1. Γραμμική Διακριτική Ανάλυση
Data =

18 1. Γραμμική Διακριτική Ανάλυση
Παράδειγμα 1.3 (συν.) Δεδομένου ότι ισχύουν οι υποθέσεις εφαρμογής της, πραγματοποιείστε Ανάλυση Κυρίων Συνιστωσών. Στη συνέχεια, με τη βοήθεια των κυρίων συνιστωσών που εξηγούν τουλάχιστον το 80% της μεταβλητότητας, πραγματοποιείστε Γραμμική Διακριτική Ανάλυση. Ως σύνολο εκπαίδευσης να χρησιμοποιηθεί όλο το σύνολο των παρατηρήσεων. Ποιο είναι το σφάλμα του ταξινομητή στο σύνολο εκπαίδευσης; Σε ποια ομάδα ασθενών ταξινομούνται οι παρακάτω μετρήσεις : Data1=[ ];

19 1. Γραμμική Διακριτική Ανάλυση
Παράδειγμα 1.3 (συν.) Πραγματοποιούμε Ανάλυση Κυρίων Συνιστωσών αφού τυποποιήσουμε τα δεδομένα (οι τρεις πρώτες στήλες του πίνακα Data). X=Data(:,1:3);m=mean(X);s=std(X); XX=[(X(:,1)-m(1))./s(1) (X(:,2)-m(2))./s(2) (X(:,3)-m(3))./s(3)]; [Coeff,Score,latent] = princomp(XX); latent = 0.7160 0.0057 Η πρώτη κύρια συνιστώσα εξηγεί το 76% της μεταβλητότητας, ενώ η πρώτη και η δεύτερη μαζί σχεδόν το 100%. Άρα κρατάμε τις δύο πρώτες κύριες συνιστώσες. Η μεταβλητή Score περιλαμβάνει τα δεδομένα στο χώρο των κυρίων συνιστωσών. Άρα πραγματοποιούμε στη συνέχεια Γραμμική Διακριτική Ανάλυση χρησιμοποιώντας τις δύο πρώτες στήλες του Score :

20 1. Γραμμική Διακριτική Ανάλυση
Παράδειγμα 1.3 (συν.) group=Data(:,4); training=Score(:,1:2); sample=training; [class,err]=classify(sample,training,group); class' = err = % Σφάλμα ταξινόμησης του training 15,56%

21 1. Γραμμική Διακριτική Ανάλυση
Παράδειγμα 1.3 (συν.) Για να βρούμε σε ποια ομάδα ασθενών ταξινομούνται οι μετρήσεις: Data1=[ ]; πρέπει να βρούμε τα σημεία στο χώρο των δύο πρώτων κυρίων συνιστωσών: X1=Data1; XX1=[(X1(:,1)-m(1))./s(1) (X1(:,2)-m(2))./s(2) (X1(:,3)-m(3))./s(3)]; Score1=XX1*Coeff; sample=Score1(:,1:2); [class,err]=classify(sample,training,group) class = err = Άρα και οι τρεις μετρήσεις ταξινομούνται στην Ομάδα 1. Προσοχή : To err δεν αναφορά το sample (αλλά το training).

22 1. Γραμμική Διακριτική Ανάλυση
Σύγκριση της Γραμμικής Διακριτικής Ανάλυσης με άλλες τεχνικές Η Γραμμική Διακριτική Ανάλυση (LDA) μοιάζει με την ANOVA και την Ανάλυση Παλινδρόμησης, οι οποίες επίσης προσπαθούν να εκφράσουν μία εξαρτημένη μεταβλητή ως ένα γραμμικό συνδυασμό άλλων χαρακτηριστικών ή μετρήσεων. Ωστόσο, στην ANOVA και στην Ανάλυση Παλινδρόμησης η εξαρτημένη μεταβλητή είναι μια αριθμητική ποσότητα, ενώ στην LDA είναι μια κατηγορική μεταβλητή (η ομάδα).

23 1. Γραμμική Διακριτική Ανάλυση
Σύγκριση της Γραμμικής Διακριτικής Ανάλυσης με άλλες τεχνικές (συν.) Επίσης, η LDA μοιάζει με την Ανάλυση Κυρίων Συνιστωσών (PCA) ως προς το ότι και οι δύο αναζητούν γραμμικούς συνδυασμούς μεταβλητών, οι οποίοι εξηγούν καλύτερα τα δεδομένα. Ωστόσο, ενώ η LDA ρητά προσπαθεί να μοντελοποιήσει τη διαφορά μεταξύ των ομάδων των δεδομένων, η PCA δεν λαμβάνει υπόψη οποιαδήποτε διαφορά στις ομάδες. Οι συναρτήσεις διαχωρισμού είναι ορθογώνιες η μία ως προς την άλλη, όπως οι κύριες συνιστώσες, ωστόσο δεν είναι ίδιες με τις κύριες συνιστώσες που λαμβάνονται από την PCA, διότι κατασκευάζονται με άλλο κριτήριο (να μεγιστοποιούν τις διαφορές μεταξύ των τιμών της εξαρτημένης μεταβλητής).

24 1. Γραμμική Διακριτική Ανάλυση
Σύγκριση της Γραμμικής Διακριτικής Ανάλυσης με άλλες τεχνικές (συν.) Η Γραμμική Διακριτική Ανάλυση είναι αντίστροφη της one-way MANOVA: Τα επίπεδα της ανεξάρτητης μεταβλητής για τη MANOVA είναι ουσιαστικά οι κατηγορίες της εξαρτημένης μεταβλητής για τη Διακριτική Ανάλυση. Στη MANOVA αναζητούμε εάν η ιδιότητα μέλους ομάδας παράγει αξιόπιστες διαφορές για ένα συνδυασμό εξαρτημένων μεταβλητών. Εάν η απάντηση στην ερώτηση αυτή είναι ‘ναι’ τότε σαφώς ο συνδυασμός των μεταβλητών μπορεί να χρησιμοποιηθεί για να προβλέψει την ιδιότητα μέλους ομάδας.

25 Ανάλυση Επιβίωσης Παραγοντική Ανάλυση / Γραμμική Διακριτική Ανάλυση (Επανάληψη) Ανάλυση Επιβίωσης Βιοστατιστική και έρευνα

26 2. Ανάλυση επιβίωσης Η Ανάλυση Επιβίωσης (Survival Analysis) περιλαμβάνει μια μεγάλη ποικιλία μεθόδων για την ανάλυση του χρόνου γεγονότων. Η Ανάλυση Επιβίωσης είναι μια συλλογή στατιστικών διαδικασιών για την ανάλυση δεδομένων στα οποία η μεταβλητή ενδιαφέροντος είναι ο χρόνος μέχρι να συμβεί ένα γεγονός. Ο χρόνος μπορεί να είναι ημέρες, εβδομάδες, μήνες ή έτη από την έναρξη παρακολούθησης μέχρι ένα γεγονός να συμβεί ή η ηλικία ενός προσώπου μέχρι να συμβεί ένα γεγονός κ.ο.κ. Το εξεταζόμενο γεγονός μπορεί να είναι ο θάνατος, κάτι στο οποίο οφείλεται και η ονομασία αυτών των μεθόδων. Ωστόσο, η ανάλυση επιβίωσης είναι επίσης κατάλληλη για πολλούς άλλους τύπους γεγονότων, όπως η εμφάνιση μιας ασθένειας, η ανάνηψη ή οποιαδήποτε άλλο γεγονός μπορεί να συμβεί που μας ενδιαφέρει, όπως η υποτροπή, η ανεργία, η αποφοίτηση κ.λπ.

27 2. Ανάλυση επιβίωσης Οι χρόνοι επιβίωσης έχουν δύο σημαντικά ειδικά χαρακτηριστικά : Οι χρόνοι επιβίωσης είναι μη αρνητικοί. Μερικοί υποκείμενοι στη μελέτη έχουν λογοκριμένους ή αποκομμένους ή ελλιπείς (censored) χρόνους επιβίωσης: Ειδικά σε μια μακρά περίοδο παρακολούθησης, πολλοί υποκείμενοι στη μελέτη χάνονται. Η μόνη πληροφορία που διαθέτουμε για αυτούς είναι μέχρι την τελευταία στιγμή της παρακολούθησης (follow-up). Επομένως, δε γνωρίζουμε ακριβώς το χρόνο επιβίωσης. Για παράδειγμα, αυτό συμβαίνει επειδή το γεγονός που ενδιαφέρει δεν λαμβάνει χώρα για αυτούς τους υποκείμενους πριν τον τερματισμό της μελέτης. Το πρόβλημα αυτό ονομάζεται αποκοπή (censoring). Μη λήψη υπ’ όψιν του προβλήματος αυτού μπορεί να παράγει σημαντική μεροληψία στην εκτίμηση της κατανομής του χρόνου επιβίωσης και των σχετικών ποσοτήτων.

28 2. Ανάλυση επιβίωσης Υπάρχουν τρεις τρόποι αποκοπής :
Αποκοπή από δεξιά (Right censoring) Αποκοπή από δεξιά έχουμε όταν το γεγονός που ενδιαφέρει δεν λαμβάνει χώρα πριν τον τερματισμό της μελέτης. Είναι ο πιο συνηθισμένος τύπος αποκοπής. Η αποκοπή από δεξιά επιπλέον διακρίνεται σε : Συστηματική (ή σταθερή) Αυτή (σε αντίθεση με την τυχαία) καθορίζεται από τη διαδικασία της μελέτης. Τυχαία Αυτή καθορίζεται από ένα μηχανισμό εκτός ελέγχου του ερευνητή.

29 2. Ανάλυση επιβίωσης Αποκοπή από αριστερά (Left censoring)
Έχουμε αποκοπή από αριστερά όταν έχουμε καθυστερημένη εισαγωγή των υποκείμενων στη μελέτη. Αποκοπή Διαστήματος (Interval censoring) Έχουμε αποκοπή διαστήματος όταν υπάρχουν διαστήματα κατά τη διάρκεια της μελέτης κατά τα οποία οι υποκείμενοι δεν παρακολουθούνται, ενώ υπάρχουν άλλα διαστήματα στη μελέτη κατά τα οποία οι υποκείμενοι παρακολουθούνται.

30 2. Ανάλυση επιβίωσης Παράδειγμα 2.1 : Αποκοπή
Έστω ότι πραγματοποιούμε μια μελέτη επιβίωσης ασθενών με μεταμόσχευση καρδιάς και πνευμόνων που παρακολουθούνται για ένα χρόνο μετά την επέμβαση. Το γεγονός που ενδιαφέρει είναι ο θάνατος. Δε θα πεθάνουν όλοι οι ασθενείς κατά τη διάρκεια του έτους παρακολούθησης, ωστόσο όλοι κάποτε θα πεθάνουν. Ο A.Δ. συμμετέχει στη μελέτη από την ημερομηνία της μεταμόσχευσης και μετά από 43 εβδομάδες πεθαίνει. Ο ασθενής αυτός είναι μη αποκομμένος (uncensored). Ο Δ.Γ. συμμετέχει στη μελέτη από την ημερομηνία της μεταμόσχευσης και παραμένει εν ζωή μετά από 1 έτος. Αυτό είναι ένα παράδειγμα συστηματικής αποκοπής από τα δεξιά. Η αποκοπή είναι σταθερή διότι καθορίζεται από τη διαδικασία της μελέτης, η οποία ορίζει ότι η παρατήρηση σταματά 1 έτος μετά τη μεταμόσχευση. Ας σημειωθεί ότι ο Δ.Γ. μπορεί να πεθάνει 1.5 έτος μετά τη μεταμόσχευση. Ωστόσο, ο θάνατος είναι απαρατήρητος και έτσι δε λαμβάνεται υπ’ όψιν στην ανάλυση των δεδομένων από τη μελέτη.

31 2. Ανάλυση επιβίωσης Παράδειγμα 2.1 : Αποκοπή (συν.)
Ο A.N. εισάγεται στη μελέτη από την ημερομηνία της μεταμόσχευσης, ωστόσο παύει η παρατήρησή του 3 μήνες αργότερα επειδή ο ίδιος σταματά να πηγαίνει στο νοσοκομείο για εξετάσεις. Αυτό είναι ένα παράδειγμα τυχαίας αποκοπής από δεξιά. Η αποκοπή είναι τυχαία διότι καθορίζεται από ένα μηχανισμό εκτός του ελέγχου του ερευνητή. Σημειώνεται ότι παρόλο που ο ασθενής μπορεί να είχε πεθάνει εντός του έτους παρακολούθησης, το γεγονός αυτό δεν θα παρατηρηθεί. Ο K.Λ. συμμετέχει στη μελέτη 4 μήνες μετά τη μεταμόσχευση και πεθαίνει 3 μήνες αργότερα. Αυτό είναι ένα παράδειγμα καθυστερημένης εισόδου στη μελέτη (αποκοπή από αριστερά).

32 2. Ανάλυση επιβίωσης Παράδειγμα 2.1 : Αποκοπή (συν.)
Ο M.A. εισάγεται στη μελέτη 7 μήνες μετά τη μεταμόσχευση και παρακολουθείται μέχρι το ένα έτος, σημείο στο οποίο η παρατήρηση αποκόπτεται. Έχουμε δηλαδή αποκοπή από αριστερά και αποκοπή από δεξιά (ο θάνατος του ασθενούς μετά από δύο χρόνια περνά απαρατήρητος). Ο Π.Ρ. συμμετέχει στη μελέτη από τη μέρα της μεταμόσχευσης και παρατηρείται μέχρι τον 3ο μήνα μετά τη μεταμόσχευση, σημείο στο οποίο ο υποκείμενος αποκόπτεται από την παρατήρηση μέχρι τον 7ο μήνα. Ο υποκείμενος παρατηρείται από το σημείο αυτό και μετά μέχρι το θάνατό του στον 11ο μήνα. Αυτό είναι ένα παράδειγμα αποκοπής διαστήματος.

33 2. Ανάλυση επιβίωσης Παράδειγμα 2.2
Το πρώτο πρόσωπο εισέρχεται στη μελέτη τον 6ο μήνα. Παρακολουθείται μέχρι που αποσύρεται από τη μελέτη τον 9ο μήνα. Δηλαδή έχουμε αποκοπή από δεξιά μετά τον 9ο μήνα (και αποκοπή από αριστερά). Το δεύτερο πρόσωπο παρακολουθείται από την αρχή της μελέτης μέχρι που συμβαίνει το γεγονός στον 6ο μήνα. Ο χρόνος επιβίωσής του είναι 6 μήνες και δεν είναι αποκομμένος. Το τρίτο πρόσωπο παρατηρείται από την αρχή μέχρι το τέλος της μελέτης. Ο χρόνος επιβίωσής του είναι αποκομμένος, καθώς είναι ίσος τουλάχιστον με 12 μήνες. κ.ο.κ.

34 2. Ανάλυση επιβίωσης Χρόνος επιβίωσης και ημερολογιακός χρόνος
Ο χρόνος επιβίωσης που αποτελεί το αντικείμενο μελέτης στην ανάλυση επιβίωσης πρέπει να διαχωριστεί από τον ημερολογιακό χρόνο. Ο χρόνος επιβίωσης μετράται σχετικά ως προς κάποια αρχή των χρόνων, όπως είναι η ημερομηνία της μεταμόσχευσης. Η κατάλληλη αρχή των χρόνων δεν είναι πάντοτε προφανής. Όταν υπάρχουν εναλλακτικές για την αρχή των χρόνων, αυτές που δεν χρησιμοποιούνται για τον ορισμό του χρόνου επιβίωσης, μπορούν να χρησιμοποιούνται ως επεξηγηματικές μεταβλητές. Στην περίπτωση της μεταμόσχευσης, ο χρόνος επιβίωσης μετράται από την ημερομηνία της μεταμόσχευσης ενώ η ηλικία μπορεί να είναι μια κατάλληλη επεξηγηματική μεταβλητή.

35 2. Ανάλυση επιβίωσης Μη πληροφοριακή αποκοπή (Non-informative censoring) Οι μέθοδοι της ανάλυσης επιβίωσης χειρίζονται ως ευρισκόμενους σε κίνδυνο για ένα γεγονός στο χρόνο επιβίωσης t εκείνους που είναι υπό παρατήρηση σε εκείνο το χρόνο επιβίωσης. Θεωρώντας μόνο εκείνα τα άτομα που είναι υπό παρατήρηση, αμερόληπτες εκτιμήσεις των χρόνων επιβίωσης, των πιθανοτήτων επιβίωσης κλπ., μπορούν να γίνουν μόνον όσο τα άτομα υπό παρατήρηση είναι αντιπροσωπευτικά όλου του πληθυσμού. Αυτό υπονοεί ότι ο μηχανισμός αποκοπής είναι ασυσχέτιστος με το χρόνο επιβίωσης. Δηλαδή, η κατανομή των χρόνων επιβίωσης των ατόμων που αποκόπτονται σε μια συγκεκριμένη χρονική στιγμή t δεν διαφέρει από αυτή των ατόμων που εξακολουθούν να παρατηρούνται αυτή τη χρονική στιγμή. Όταν αυτό ισχύει, η αποκοπή λέμε ότι είναι μη πληροφοριακή (non-informative) (π.χ. για το χρόνο επιβίωσης).

36 2. Ανάλυση επιβίωσης Μη πληροφοριακή αποκοπή (συν.)
Η συστηματική αποκοπή είναι βέβαια μια περίπτωση μη πληροφοριακής αποκοπής. Στην τυχαία αποκοπή, είναι αρκετά πιθανό ότι ο χρόνος επιβίωσης δεν είναι ανεξάρτητος του μηχανισμού αποκοπής. Για παράδειγμα, πολύ άρρωστοι ασθενείς μπορεί να τείνουν να εξέρχονται από τη μελέτη λίγο πριν το θάνατό τους και κατά συνέπεια ο θάνατός τους να μην παρατηρείται. Έτσι έχουμε μεροληψία του εκτιμώμενου χρόνου επιβίωσης προς τα πάνω. Επομένως, όταν έχουμε τυχαία αποκοπή στη μελέτη μας, είναι σημαντικό να εισάγουμε επεξηγηματικές μεταβλητές που πιθανά σχετίζονται με αμφότερες την αποκοπή και το χρόνο επιβίωσης (π.χ. σοβαρότητα της ασθένειας).

37 2. Ανάλυση επιβίωσης Δεδομένα επιβίωσης
Τα αποκομμένα από δεξιά δεδομένα επιβίωσης περιλαμβάνουν δύο ή τρία στοιχεία: Το χρόνο επιβίωσης κάθε υποκείμενου ή το χρόνο στον οποίο η παρατήρηση του υποκείμενου αποκόπτεται. Εάν ο χρόνος επιβίωσης του υποκείμενου αποκόπτεται ή όχι. Τις τιμές μιας ή περισσότερων επεξηγηματικών μεταβλητών που επηρεάζουν το χρόνο επιβίωσης. Καθυστερημένη είσοδος και πολλαπλοί περίοδοι παρατήρησης εισάγουν πολυπλοκότητες, αλλά μπορούν να αντιμετωπιστούν εστιάζοντας σε κάθε διάστημα χρόνου κατά τη διάρκεια που ένας υποκείμενος είναι υπό παρατήρηση και παρατηρώντας εάν το γεγονός που ενδιαφέρει συμβαίνει κατά τη διάρκεια του διαστήματος.

38 2. Ανάλυση επιβίωσης Πίνακας Ζωής (Life Table)
Ο Πίνακας Ζωής καταγράφει το υπόδειγμα θνησιμότητας με την ηλικία για κάποιον πληθυσμό και παρέχει μια βάση για τον υπολογισμό του προσδόκιμου ζωής σε διάφορες ηλικίες.

39 2. Ανάλυση επιβίωσης Πίνακας Ζωής (συν.) x είναι η ηλικία σε έτη
Ο ανωτέρω πίνακας κατασκευάστηκε για βήματα του 1 έτους. Ωστόσο, και άλλα διαστήματα μπορούν να χρησιμοποιηθούν, όπως 5 ή 10 έτη. lx είναι το πλήθος των ατόμων που επιζούν στα x-οστά γενέθλιά τους. Ο αρχικός αριθμός των ατόμων ονομάζεται ρίζα (radix) του Πίνακα Ζωής. dx είναι το πλήθος των ατόμων που πεθαίνουν μεταξύ των x-οστών και (x+1)-οστών γενεθλίων τους.

40 2. Ανάλυση επιβίωσης Πίνακας Ζωής (συν.)
px είναι το ποσοστό των ατόμων ηλικίας x που επιζούν στα (x+1)-οστά γενέθλιά τους. Με άλλα λόγια, είναι η υπό συνθήκη πιθανότητα επιβίωσης στην ηλικία x+1 δεδομένης της επιβίωσης στην ηλικία x. qx είναι ο ρυθμός θνησιμότητας σε συγκεκριμένη ηλικία. Είναι το ποσοστό των ατόμων ηλικίας x που πεθαίνουν κατά τη διάρκεια του επόμενου έτους. qx είναι το συμπλήρωμα του px : qx+px=1. Όλες οι άλλες στήλες του Πίνακα Ζωής μπορούν να υπολογιστούν από το qx και τη ρίζα (radix).

41 2. Ανάλυση επιβίωσης Πίνακας Ζωής (συν.)
Lx είναι το πλήθος των προσώπων/ετών που έζησαν μεταξύ των γενεθλίων x και x+1. Στις περισσότερες ηλικίες υποθέτουμε ότι οι θάνατοι είναι ισοκατανεμημένοι κατά τη διάρκεια του έτους. Επομένως : Ωστόσο, στη βρεφική ηλικία η θνησιμότητα φθίνει ταχύτατα με την ηλικία. Επομένως, κατά τη διάρκεια των δύο πρώτων ετών ζωής, υποθέτουμε ότι υπάρχει μεγαλύτερη θνησιμότητα στην αρχή του έτους.

42 2. Ανάλυση επιβίωσης Πίνακας Ζωής (συν.)
Tx είναι το πλήθος των προσώπων/ετών που έζησαν μετά τα x-οστά γενέθλια. Tx αθροίζει τα Lx από το έτος x και μετά. ex είναι το προσδόκιμο ζωής που απομένει στα γενέθλια x. Είναι το πλήθος των επιπρόσθετων ετών που ζουν κατά μέσο όρο εκείνοι που επέζησαν στα x-οστά γενέθλιά τους.

43 2. Ανάλυση επιβίωσης Πίνακας Ζωής (συν.)
Υπολογισμός του Πίνακα Ζωής με δεδομένους τους ρυθμούς θνησιμότητας σε συγκεκριμένη ηλικία qx : Υπολογισμός του αναμενόμενου αριθμού θανάτων : Ο αριθμός όσων επιβίωσαν στα επόμενα γενέθλια είναι : Το ποσοστό όσων επιβίωσαν είναι : Υπολογισμός των Lx, Tx και ex :

44 2. Ανάλυση επιβίωσης Υποθέσεις της Ανάλυσης Επιβίωσης
Οι πιθανότητες επιβίωσης υποτίθεται ότι παραμένουν οι ίδιες καθ’ όλη τη διάρκεια της μελέτης. Οι υποκείμενοι που αποκόπτονται από την παρακολούθηση έχουν την ίδια πρόγνωση με αυτούς που συνεχίζουν στη μελέτη. Η πιθανότητα ότι ένα άτομο αποκόπτεται είναι ασυσχέτιστη με την πιθανότητα ότι το άτομο υφίσταται ένα γεγονός. Οτιδήποτε επηρεάζει τον κίνδυνο, το πραγματοποιεί με την ίδια αναλογία σε κάθε χρονική στιγμή.

45 2. Ανάλυση επιβίωσης Η συνάρτηση επιβίωσης (survival function)
Το απλούστερο παραμετρικό μοντέλο για τα δεδομένα επιβίωσης είναι η εκθετική κατανομή με συνάρτηση πυκνότητας πιθανότητας: λ είναι η παράμετρος ρυθμού. Όσο πιο μεγάλο είναι το λ τόσο πιο πολύ η πυκνότητα συγκεντρώνεται γύρω από το 0. Ας σημειωθεί ότι E(T)=1/λ. Η αθροιστική συνάρτηση κατανομής είναι : Η συνάρτηση επιβίωσης S(t) δίνει την πιθανότητα επιβίωσης στο χρόνο t. Είναι το συμπλήρωμα της αθροιστικής συνάρτησης κατανομής :

46 2. Ανάλυση επιβίωσης Η συνάρτηση κινδύνου (hazard function)
Ο κίνδυνος (hazard) h(t) είναι το αναμενόμενο πλήθος γεγονότων ανά άτομο ανά μονάδα του χρόνου. Η συνάρτηση κινδύνου είναι συνάρτηση του χρόνου επιβίωσης και ορίζεται ως : Έστω ότι ο κίνδυνος σε μια συγκεκριμένη χρονική στιγμή t είναι h(t)=0.5 και ότι η μονάδα του χρόνου είναι ένας μήνας. Αυτό σημαίνει ότι κατά μέσο όρο 0.5 συμβάντα θα συμβούν ανά άτομο σε κίνδυνο ανά μήνα (κατά τη διάρκεια μιας περιόδου στην οποία ο κίνδυνος παραμένει σταθερός στην τιμή αυτή). Όταν ο κίνδυνος είναι σταθερός, ο χρόνος επιβίωσης περιγράφεται από την εκθετική συνάρτηση. Επομένως, ο κίνδυνος είναι : Γενικά, ο κίνδυνος δεν είναι σταθερός.

47 2. Ανάλυση επιβίωσης Η αθροιστική συνάρτηση κινδύνου (cumulative hazard function) Η αθροιστική συνάρτηση κινδύνου H(t) αναπαριστά τον αναμενόμενο αριθμό γεγονότων που έχουν συμβεί μέχρι το χρόνο t. Ισχύει ότι : Για την εκθετική συνάρτηση, η αθροιστική συνάρτηση κινδύνου είναι ανάλογη με το χρόνο :

48 2. Ανάλυση επιβίωσης Η κατανομή Weibul
Η εκθετική κατανομή δεν είναι ένα ρεαλιστικό μοντέλο για διαδικασίες στις οποίες το ποσοστό δεν είναι σταθερό με το χρόνο. Για παράδειγμα, ο κίνδυνος θανάτου στους ανθρώπινους πληθυσμούς είναι σχετικά υψηλός στη βρεφική ηλικία, φθίνει κατά τη διάρκεια της παιδικής ηλικίας, παραμένει σχετικά σταθερός στη νεαρή ηλικία και αυξάνει από την περίοδο της μέσης ηλικίας μέχρι την τρίτη ηλικία. Υπάρχουν άλλες κατανομές πιθανοτήτων που χρησιμοποιούνται για να μοντελοποιήσουν τα δεδομένα επιβίωσης και έχουν μεταβλητά ποσοστά κινδύνου. Για παράδειγμα, η κατανομή Weibul μπορεί να έχει φθίνοντες, αύξοντες ή σταθερούς κινδύνους, με βάση τις παραμέτρους της κατανομής. Η κατανομή Weibul γίνεται η εκθετική κατανομή για σταθερό κίνδυνο.

49 2. Ανάλυση επιβίωσης Εκτίμηση της συνάρτησης επιβίωσης
Ο Kaplan-Meier εκτιμητής είναι η πιο συνηθισμένη μέθοδος υπολογισμού της συνάρτησης επιβίωσης S(t)=P(T>t). Έστω ότι έχουμε n παρατηρήσεις και ότι υπάρχουν m μοναδικοί χρόνοι γεγονότος διατεταγμένοι κατ’ αύξουσα σειρά : t(1), t(2), …, t(m). Ο εκτιμητής Kaplan-Meier εφαρμόζεται ως εξής : Μεταξύ t=0 και t=t(1), η εκτίμηση της συνάρτησης επιβίωσης είναι S(t)=1. Έστω το ni αναπαριστά το πλήθος των ατόμων σε κίνδυνο για το γεγονός τη χρονική στιγμή t(i). Το πλήθος των ατόμων σε κίνδυνο περιλαμβάνει εκείνους για τους οποίους το γεγονός δεν έχει ακόμη συμβεί, συμπεριλαμβανομένων εκείνων για τους οποίους οι χρόνοι γεγονότος δεν έχουν ακόμη αποκοπεί. Έστω το di αναπαριστά το πλήθος των γεγονότων που παρατηρούνται στο χρόνο μεταξύ t(i) και t(i+1). Η υπό συνθήκη πιθανότητα επιβίωσης μετά το χρόνο t(i) δεδομένης της επιβίωσης μέχρι το χρόνο αυτό, είναι (ni-di)/ni.

50 2. Ανάλυση επιβίωσης Εκτίμηση της συνάρτησης επιβίωσης (συν.)
Επομένως, η πιθανότητα επιβίωσης μετά από οποιοδήποτε χρόνο t εκτιμάται ίση με : Αυτή είναι η εκτίμηση Kaplan-Meier. Επίσης, ισχύει ότι :

51 2. Ανάλυση επιβίωσης Εκτίμηση της συνάρτησης επιβίωσης (συν.)
Η εκτίμηση Kaplan-Meier έχει τα ακόλουθα χαρακτηριστικά : Εκτιμά τη συνάρτηση επιβίωσης από πραγματικά δεδομένα. Ο εκτιμητής είναι επίσης γνωστός ως εκτιμητής “product-limit”. Λαμβάνει υπ’ όψιν την αποκοπή. Παράγει τις χαρακτηριστικές σκαλωτές καμπύλες επιβίωσης. Είναι μια μη-παραμετρική διαδικασία. Απαιτεί τους ακριβείς χρόνους θανάτων (στη γενική περίπτωση τους ακριβείς χρόνους αποτυχίας).

52 Αποκομμένοι επόμενης περιόδου
2. Ανάλυση επιβίωσης Εκτίμηση της συνάρτησης επιβίωσης (συν.) Παράδειγμα 2.3 Έστω ότι διεξάγουμε μια μελέτη επιβίωσης. Τα αποτελέσματα της μελέτης παρουσιάζονται στον ακόλουθο πίνακα : Εκτιμείστε τη συνάρτηση επιβίωσης χρησιμοποιώντας τον εκτιμητή Kaplan-Meier. Χρονική περίοδος Σε κίνδυνο Πέθαναν Αποκομμένοι επόμενης περιόδου 1 100 2 5 3 92 10 4 79 15 61 20 6 38 25 13

53 Αποκομμένοι επόμενης περιόδου
2. Ανάλυση επιβίωσης Εκτίμηση της συνάρτησης επιβίωσης (συν.) Παράδειγμα 2.3 (συν.) Η εφαρμογή του εκτιμητή Kaplan-Meier παρουσιάζεται στον ακόλουθο πίνακα : Επειδή οι τελευταίες παρατηρήσεις είναι αποκομμένες, ο εκτιμητής δεν ορίζεται για t>6. Χρονική περίοδος Σε κίνδυνο ni Πέθαναν di Αποκομμένοι επόμενης περιόδου Επιβιώσαντες 1 100 1.00 2 5 3 95 0.95 92 10 82 0.89 0.85 4 79 15 64 0.81 0.69 61 20 41 0.67 0.46 6 38 25 13 0.34 0.16

54 2. Ανάλυση επιβίωσης Εκτίμηση της συνάρτησης επιβίωσης (συν.)
Παράδειγμα 2.3 (συν.) Το επόμενο σχήμα δείχνει την εκτίμηση Kaplan-Meier του παραδείγματος :

55 2. Ανάλυση επιβίωσης Περιγραφικά μεγέθη της επιβίωσης
Επιβίωση για 5 έτη Το πλήθος των ατόμων που εξακολουθούν να παραμένουν εν ζωή 5 έτη μετά τη διάγνωση. Διάμεσος επιβίωσης Η διάρκεια του χρόνου μέχρις ότου το 50% του πληθυσμού πεθάνει. Σχετική επιβίωση Ο λόγος της επιβίωσης για 5 έτη της ομάδας ενδιαφέροντος προς την επιβίωση για 5 έτη όλων των ανθρώπων της ίδιας ηλικίας.

56 2. Ανάλυση επιβίωσης Υπολογισμός της διαμέσου επιβίωσης
Έχοντας υπολογίσει τη συνάρτηση επιβίωσης, συχνά μας ενδιαφέρει ο υπολογισμός των εκατοστημορίων της κατανομής επιβίωσης. Το εκτιμώμενο p τάξης εκατοστημόριο του χρόνου επιβίωσης είναι: Επομένως, η εκτιμώμενη διάμεσος του χρόνου επιβίωσης είναι: Αυτό είναι ισοδύναμο με τη χάραξη μιας οριζόντιας γραμμής από τον κατακόρυφο άξονα προς την καμπύλη επιβίωσης από τη θέση S(t)=0.5. Το αριστερότερο σημείο τομής με την καμπύλη ορίζει τη διάμεσο.

57 2. Ανάλυση επιβίωσης Υπολογισμός της διαμέσου επιβίωσης (συν.)
Σημείωση 1 : Μερικές φορές δεν είναι δυνατός ο υπολογισμός της διαμέσου του χρόνου επιβίωσης για το πλήρες σύνολο των δεδομένων. Αυτό συμβαίνει όταν η εκτιμώμενη συνάρτηση επιβίωσης δεν φθάνει μέχρι την τιμή του 0.5 κατά τη διάρκεια της περιόδου της μελέτης. Σημείωση 2 : Εάν υπάρχουν κάποιες αποκομμένες παρατηρήσεις στο τέλος της μελέτης, δεν είναι δυνατός ο υπολογισμός του μέσου χρόνου επιβίωσης.

58 2. Ανάλυση επιβίωσης Σύγκριση συναρτήσεων επιβίωσης
Πολλές φορές χρειάζεται να συγκρίνουμε συναρτήσεις επιβίωσης μεταξύ δύο (ή περισσοτέρων) ομάδων. Για να συγκρίνουμε τις συναρτήσεις επιβίωσης εφαρμόζουμε τεστ χρησιμοποιώντας τους πίνακες συνάφειας για τους ευρισκόμενους σε κίνδυνο σε κάθε χρόνο γεγονότος. Έστω ότι έχουμε δύο ομάδες και έστω η t(i) αναπαριστά τον i-οστό διατεταγμένο χρόνο γεγονότος συνδυασμένα στις δύο ομάδες. Ο πίνακας συνάφειας σχηματίζεται ως εξής [υπάρχει ένας τέτοιος πίνακας για κάθε παρατηρούμενη χρονική στιγμή t(1), t(2), …, t(m)]: Ομάδα 1 Ομάδα 2 Σύνολο Γεγονός d1i d2i di Όχι γεγονός n1i-d1i n2i-d2i ni-di Σε κίνδυνο n1i n2i ni

59 2. Ανάλυση επιβίωσης Σύγκριση συναρτήσεων επιβίωσης (συν.)
Το απλούστερο και πιο σύνηθες τεστ για τη σύγκριση των συναρτήσεων επιβίωσης είναι το Mantel-Haenszel ή log-rank τεστ. Η στατιστική του log-rank τεστ είναι : όπου

60 2. Ανάλυση επιβίωσης Σύγκριση συναρτήσεων επιβίωσης (συν.)
Οι ελεγχόμενες υποθέσεις είναι : H0: οι δύο συναρτήσεις επιβίωσης είναι ίδιες H1: οι δύο συναρτήσεις επιβίωσης είναι διαφορετικές Η στατιστική Q ακολουθεί x-τετράγωνο κατανομή.

61 2. Ανάλυση επιβίωσης Παράδειγμα 2.4
Το ακόλουθο σχήμα παρουσιάζει τις εκτιμήσεις Kaplan-Meier χωριστά για δύο ομάδες απελευθερωμένων κρατούμενων* (αυτούς που έλαβαν και αυτούς που δεν έλαβαν οικονομική βοήθεια). Η στατιστική του log-rank υπολογίζεται σε Q=3.84, η οποία αντιστοιχεί σε μια p-τιμή περίπου Έτσι έχουμε οριακά μια σημαντική ένδειξη ύπαρξης διαφοράς μεταξύ των δύο ομάδων. * Δεδομένα μιας μελέτης των Rossi, Berk και Lenihan (1980) για την υποτροπή 432 κρατουμένων κατά τη διάρκεια του πρώτου χρόνου μετά την αποφυλάκισή τους από τις φυλακές του Maryland.

62 Ανάλυση Επιβίωσης Παραγοντική Ανάλυση / Γραμμική Διακριτική Ανάλυση (Επανάληψη) Ανάλυση Επιβίωσης Βιοστατιστική και έρευνα

63 3. Βιοστατιστική και έρευνα
Οι μέθοδοι που είδαμε στο μάθημα της Βιοστατιστικής (καθώς και άλλες πιο προχωρημένες) χρησιμοποιούνται ευρύτατα στην έρευνα της Ιατρικής και της Βιολογίας παγκοσμίως. Τα αποτελέσματα της εφαρμογής των μεθόδων αυτών δημοσιεύονται με τη μορφή άρθρων σε διεθνούς κύρους επιστημονικά περιοδικά και παρουσιάζονται σε παγκόσμιας εμβέλειας επιστημονικά συνέδρια. Παράδειγμα 3.1 Δύο ερευνητές υπέβαλαν σε τεχνητή δίαιτα για 14 γενεές έντομα Euscepes postfasciatus που δεν είναι άλλα από τα κοινώς ονομαζόμενα μαμούνια της γλυκοπατάτας. Οι ερευνητές σύγκριναν στη συνέχεια αυτά τα έντομα με έντομα που μεγάλωσαν σε γλυκοπατάτες, τη φυσική τροφή των εν λόγω εντόμων. Συγκεκριμένα, πολλαπλά θηλυκά του εντόμου αυτού που προέρχονταν είτε από τη σειρά των εντόμων της τεχνητής δίαιτας (σειρά ΤΔ) είτε από τη σειρά των εντόμων που μεγάλωσαν σε γλυκοπατάτες (σειρά ΓΠ), υποβλήθηκαν είτε σε τεχνητή δίαιτα είτε σε φυσιολογική διατροφή (ρίζες γλυκοπατάτας) και μετρήθηκε το πλήθος των αυγών που κάθε θηλυκό έντομο γέννησε σε διάστημα 28 ημερών.

64 3. Βιοστατιστική και έρευνα
Παράδειγμα 3.1 (συν.) Η μελέτη των δύο ερευνητών1 έδειξε ότι είναι σημαντικοί τόσο ο παράγοντας της σειράς από την οποία προέρχονταν τα θηλυκά έντομα όσο και το είδος της τροφής τους. Επίσης, η μελέτη έδειξε ότι είναι σημαντική και η αλληλεπίδραση μεταξύ του παράγοντα της σειράς από την οποία προέρχονταν τα θηλυκά έντομα και του είδους της τροφής τους. Τα έντομα και των δύο σειρών (σειρά ΤΔ και σειρά ΓΠ) γεννούν περισσότερα αυγά όταν τρέφονται με ρίζες γλυκοπατάτας, ωστόσο η διαφορά είναι μικρότερη για τα θηλυκά της σειράς ΤΔ. Περιγράψτε πώς νομίζετε ότι οργανώθηκε και πραγματοποιήθηκε η μελέτη; α. Ποιοι έλεγχοι υποθέσεων πραγματοποιήθηκαν από τους ερευνητές ; β. Ποιου τύπου δεδομένα έπρεπε να συλλεχθούν και να χρησιμοποιηθούν για τον έλεγχο καθεμιάς από τις ανωτέρω υποθέσεις; γ. Ποιοι μέθοδοι χρησιμοποιήθηκαν για τον έλεγχο καθεμιάς από τις ανωτέρω υποθέσεις; Αιτιολογείστε την απάντησή σας. δ. Ποιο νομίζετε ότι είναι το αποτέλεσμα που προέκυψε από την εφαρμογή καθεμιάς από τις ανωτέρω μεθόδους σύμφωνα με όσα αναφέρονται στην ανωτέρω περίληψη ; 1 Shimoji, Y., and T. Miyatake Adaptation to artificial rearing during successive generations in the West Indian sweetpotato weevil, Euscepes postfasciatus (Coleoptera: Curuculionidae). Annals of the Entomological Society of America 95:

65 3. Βιοστατιστική και έρευνα
Παράδειγμα 3.1 (συν.) Έχουμε δύο ανεξάρτητες μεταβλητές, τη σειρά από την οποία προέρχονται τα έντομα (παράγοντας Α) και το είδος της τροφής τους (παράγοντας Β) Πρώτη μεταβλητή : Παράγοντας A (σειρά) Επίπεδο A1 (ΤΔ: προέρχονται από τεχνητή δίαιτα) Επίπεδο A2 (ΓΠ: προέρχονται από διατροφή με γλυκοπατάτες) Δεύτερη μεταβλητή : Παράγοντας B (είδος διατροφής) Επίπεδο B1 (ΤΔ: υποβολή σε τεχνητή δίαιτα) Επίπεδο B2 (ΓΠ: υποβολή σε διατροφή με γλυκοπατάτες) Έχουμε ως εξαρτημένη μεταβλητή : το πλήθος των αυγών που κάθε θηλυκό έντομο γέννησε σε διάστημα 28 ημερών Παράγοντας A (σειρά) Επίπεδο A1 (ΤΔ) Επίπεδο A2 (ΓΠ) Παράγοντας B (διατροφή) Επίπεδο B1 (ΤΔ) A1B1 A2B1 Επίπεδο B2 (ΓΠ) A1B2 A2B2

66 3. Βιοστατιστική και έρευνα
Παράδειγμα 3.1 (συν.) Μεθοδολογία : 2-way ANOVA (παραμετρική ή μη-παραμετρική?) Οι ερευνητές πρέπει να εξέτασαν εάν οι μεταβλητές ικανοποιούν τις παραδοχές «κανονικότητας» και «ίδιας διασποράς» (σε συνδυασμό με την παραδοχή «ανεξαρτησίας»), ώστε να μπορούν να εφαρμόσουν την παραμετρική Two-way ANOVA. Για τον έλεγχο της κανονικότητας πρέπει να εφάρμοσαν ένα από τα τεστ κανονικότητας όπως είναι το Jarque-Berra test. Σε περίπτωση μη ικανοποίησης των παραδοχών πρέπει να εφάρμοσαν τη μη παραμετρική Two-way ANOVA. Οι μηδενικές υποθέσεις που έλεγξαν οι ερευνητές με την 2-way ANOVA είναι: H0A: Οι μέσες τιμές των παρατηρήσεων που ομαδοποιούνται από τον παράγοντα A είναι ίσες, δηλαδή το πλήθος των αυγών δεν εξαρτάται από τη σειρά από την οποία προέρχονται τα έντομα. Η0Β: Οι μέσες τιμές των παρατηρήσεων που ομαδοποιούνται από τον παράγοντα B είναι ίσες, δηλαδή το πλήθος των αυγών δεν εξαρτάται από τη διατροφή των εντόμων. Η0AxB : Δεν υπάρχει αλληλεπίδραση μεταξύ των δύο παραγόντων.

67 3. Βιοστατιστική και έρευνα
Παράδειγμα 3.1 (συν.) Σύμφωνα με τα συμπεράσματα στα οποία κατέληξαν οι ερευνητές συμπεραίνουμε ότι η p-τιμή και για τους τρεις ελέγχους ήταν μικρότερη από το επίπεδο σημαντικότητας. Άρα οι ερευνητές κατέληξαν σε απόρριψη και των τριών μηδενικών υποθέσεων. Συνεπώς: Το πλήθος των αυγών εξαρτάται από τη σειρά από την οποία προέρχονται τα έντομα. Το πλήθος των αυγών εξαρτάται από τη διατροφή των εντόμων. Υπάρχει αλληλεπίδραση μεταξύ των δύο παραγόντων. Προκειμένου να ελέγξουν ποια έντομα γεννούν περισσότερα αυγά στο διάστημα των 28 ημερών, οι ερευνητές πρέπει να πραγματοποίησαν ένα τεστ πολλαπλών συγκρίσεων (multcompare). Τα έντομα και των δύο σειρών (σειρά ΤΔ και σειρά ΓΠ) γεννούν περισσότερα αυγά όταν τρέφονται με ρίζες γλυκοπατάτας. H διαφορά αυτή είναι μικρότερη για τα θηλυκά της σειράς ΤΔ.

68 3. Βιοστατιστική και έρευνα
Παράδειγμα 3.2 Πρόσφατα δημοσιεύθηκε σε ειδησεογραφικό δικτυακό τόπο το ακόλουθο δημοσίευμα : «H λιακάδα προφυλάσσει τα παιδιά από την εμφάνιση μυωπίας Η παραμονή σε εξωτερικούς χώρους για τουλάχιστον δύο ώρες την ημέρα ίσως περιορίζει δραστικά την πιθανότητα εμφάνισης μυωπίας, εκτιμούν Αυστραλοί ερευνητές. Η περιορισμένη έκθεση στο ηλιακό φως φαίνεται ότι είναι βασική αιτία για την επιδημία μυωπίας στη Ασία. Η μελέτη δεν διαψεύδει τις υποψίες ότι το διάβασμα, η τηλεόραση και οι υπολογιστές αυξάνουν τον κίνδυνο μυωπίας, αναδεικνύει όμως το ηλιακό φως ως σημαντικό παράγοντα για την ομαλή ανάπτυξη των οφθαλμών (η μυωπία εμφανίζεται όταν το μάτι χάνει το φυσιολογικό σφαιρικό του σχήμα και γίνεται ωοειδές, με αποτέλεσμα η εικόνα να μην εστιάζεται ακριβώς πάνω στον αμφιβληστροειδή). Οι ερευνητές του Αυστραλιανού Συμβουλίου Έρευνας ήταν περίεργοι να μάθουν γιατί η μυωπία είναι τουλάχιστον τέσσερις φορές πιο σπάνια στα παιδιά της Αυστραλίας σε σχέση με τα παιδιά που ζουν στην ανατολική Ασία, όπου η ασθένεια έχει πάρει πλέον διαστάσεις επιδημίας. Στη Σιγκαπούρη, για παράδειγμα, εννέα στους δέκα απόφοιτους λυκείου φορούν γυαλιά, ενώ στην Αυστραλία, το αντίστοιχο ποσοστό είναι μόλις 20%. Η νέα συγκριτική μελέτη έδειξε ότι το 30% των παιδιών 6 και 7 ετών στη Σιγκαπούρη έχει ήδη εμφανίσει μυωπία, συγκριτικά με μόλις 1,3% για την ίδια ηλικιακή ομάδα στην Αυστραλία.

69 3. Βιοστατιστική και έρευνα
Παράδειγμα 3.2 (συν.) Η μυωπία είναι στατιστικά συχνότερη στα άτομα ανώτερης εκπαίδευσης, πιθανώς επειδή η εστίαση στα βιβλία από μικρή απόσταση επιβαρύνει τα μάτια. Όμως ο παράγοντας αυτός δεν αρκεί για να εξηγήσει τη διαφορά ανάμεσα στην Ασία και την Αυστραλία. Η εθνικότητα επίσης αποκλείστηκε ως σημαντικός παράγοντας, καθώς η μυωπία δεν βρέθηκε να είναι συχνότερη στα παιδιά κινεζικής καταγωγής που ζουν στην Αυστραλία. Όπως αναφέρει το Γαλλικό Πρακτορείο Ειδήσεων, η μόνη σημαντική διαφορά ανάμεσα στις δύο ομάδες ήταν ο χρόνος τον οποίο περνούν τα παιδιά σε εξωτερικούς χώρους: Το μέσο παιδί στην Αυστραλία περνά δύο ώρες την ημέρα παίζοντας στη λιακάδα, ενώ στη Σιγκαπούρη το αντίστοιχο χρονικό διάστημα είναι μόλις 20 λεπτά. Η εκπαίδευση φαίνεται να είναι σημαντικός παράγοντας που οδηγεί στη μυωπία, ωστόσο η έκθεση στο ηλιακό φως βάζει φρένο σε αυτή την τάση, δήλωσε ο καθηγητής Ίαν Μόργκαν, επικεφαλής των ερευνητών.» Περιγράψτε πώς νομίζετε ότι οργανώθηκε και πραγματοποιήθηκε η μελέτη: α. Ποιοι έλεγχοι υποθέσεων πραγματοποιήθηκαν από τους ερευνητές ; β. Ποιου τύπου δεδομένα έπρεπε να συλλεχθούν και να χρησιμοποιηθούν για τον έλεγχο καθεμιάς από τις ανωτέρω υποθέσεις; γ. Ποιοι μέθοδοι χρησιμοποιήθηκαν για τον έλεγχο καθεμιάς από τις ανωτέρω υποθέσεις; Αιτιολογείστε την απάντησή σας. δ. Ποιο νομίζετε ότι είναι το αποτέλεσμα που προέκυψε από την εφαρμογή καθεμιάς από τις ανωτέρω μεθόδους σύμφωνα με όσα αναφέρονται στην ανωτέρω περίληψη ;

70 3. Βιοστατιστική και έρευνα
Παράδειγμα 3.3 Πρόσφατα δημοσιεύθηκε σε ειδησεογραφικό δικτυακό τόπο το ακόλουθο δημοσίευμα : «Χάπι για την υπέρταση ίσως μπορεί να «σβήνει» τις άσχημες αναμνήσεις Ένα ευρέως διαδεδομένο φάρμακο που χρησιμοποιείται συνήθως για την υπέρταση και τις αρρυθμίες φαίνεται ότι μπορεί να σβήνει τις αναμνήσεις που συνοδεύονται από φόβο. Η παράξενη αυτή ιδιότητα ίσως θα μπορούσε να αξιοποιηθεί κατά των φοβικών διαταραχών και της διαταραχής μετατραυματικού στρες. Το φάρμακο προπρανολόλη, της κατηγορίας των βήτα μπλόκερ, μείωσε το φόβο σε εθελοντές που είχαν «διδαχθεί» να φοβούνται τις αράχνες, αναφέρουν Ολλανδοί ερευνητές στην επιθεώρηση Nature Neuroscience. Όπως αναφέρει το Reuters, 60 από τους εθελοντές της μελέτης στο Πανεπιστήμιο του Αμστερνταμ κλήθηκαν να κοιτάξουν φωτογραφίες αραχνών τη στιγμή που υποβάλλονταν σε ένα ακίνδυνο αλλά επώδυνο ηλεκτροσόκ. Η εμπειρία αυτή δημιούργησε φοβικές αναμνήσεις, αναφέρουν οι ερευνητές. Άλλοι εθελοντές, που ανήκαν στην ομάδα ελέγχου, κλήθηκαν να κοιτάξουν τις ίδιες φωτογραφίες χωρίς να τους γίνει ηλεκτροσόκ, οπότε η ανάμνησή τους από την εμπειρία ήταν ουδέτερη και δεν συνοδευόταν από φόβο. Την επόμενη ημέρα, ορισμένοι από τους εθελοντές στην ομάδα του ηλεκτροσόκ έλαβαν προπρανολόλη, ενώ οι υπόλοιποι έλαβαν ψευδοφάρμακο (placebo) για λόγους σύγκρισης.

71 3. Βιοστατιστική και έρευνα
Παράδειγμα 3.3 (συν.) Την τρίτη ημέρα του πειράματος, όλοι οι εθελοντές κλήθηκαν να κοιτάξουν ξανά τις ίδιες εικόνες ενώ μια ειδική συσκευή μετρούσε τα επίπεδα άγχους από τις ανεπαίσθητες συσπάσεις των μυών γύρω από τα μάτια. Οι εθελοντές που είχαν υποστεί ηλεκτροσόκ και δεν είχαν λάβει το φάρμακο παρουσίασαν φοβικές αντιδράσεις, ενώ όσοι είχαν πάρει το χάπι μετά το ηλεκτροσόκ παρέμειναν το ίδιο ουδέτεροι όσο οι εθελοντές που είχαν δει τις αράχνες αλλά χωρίς ηλεκτροσόκ. Το συμπέρασμα είναι ότι η προπρανολόλη καταπολεμά τη φοβική αντίδραση εξασθενίζοντας την επώδυνη ανάμνηση, αναφέρει η Μέρελ Κιντ, επικεφαλής των ερευνητών. Οι νευροεπιστήμονες γνωρίζουν σήμερα ότι οι αναμνήσεις είναι ανοιχτές σε ελαφρές τροποποιήσεις τη στιγμή που ανακαλούνται στη μνήμη, μια διαδικασία που ονομάζεται «επανεδραίωση» (reconsolidation). Προηγούμενες μελέτες σε πειραματόζωα είχαν δείξει ότι η προπρανολόλη επιδρά στις αναμνήσεις όχι κατά το στάδιο της αρχικής τους αποθήκευσης, αλλά στη διάρκεια της ανάκλησης και επανεδραίωσής τους. Η ερευνητική ομάδα της Κιντ σχεδιάζει τώρα να μελετήσει πόσο διαρκεί η δράση του φαρμάκου στη μνήμη και να δοκιμάσει την τεχνική σε άτομα που πράγματι υποφέρουν από φοβίες ή μετατραυματικό στρες.

72 3. Βιοστατιστική και έρευνα
Παράδειγμα 3.3 (συν.) Περιγράψτε πώς νομίζετε ότι οργανώθηκε και πραγματοποιήθηκε η μελέτη: α. Ποιοι έλεγχοι υποθέσεων πραγματοποιήθηκαν από τους ερευνητές ; β. Ποιου τύπου δεδομένα έπρεπε να συλλεχθούν και να χρησιμοποιηθούν για τον έλεγχο καθεμιάς από τις ανωτέρω υποθέσεις; γ. Ποιοι μέθοδοι χρησιμοποιήθηκαν για τον έλεγχο καθεμιάς από τις ανωτέρω υποθέσεις; Αιτιολογείστε την απάντησή σας. δ. Ποιο νομίζετε ότι είναι το αποτέλεσμα που προέκυψε από την εφαρμογή καθεμιάς από τις ανωτέρω μεθόδους σύμφωνα με όσα αναφέρονται στην ανωτέρω περίληψη ;


Κατέβασμα ppt "ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google