Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ"— Μεταγράφημα παρουσίασης:

1 ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ
ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΕΧΝΟΛΟΓΙΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗΝ ΙΑΤΡΙΚΗ ΚΑΙ ΤΗ ΒΙΟΛΟΓΙΑ ΜΑΘΗΜΑ : ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ ΔΙΟΝΥΣΗΣ ΛΙΝΑΡΔΑΤΟΣ 15 ΔΕΚΕΜΒΡΙΟΥ 2017

2 Ανάλυση Διασποράς Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Ανάλυση Διασποράς Κατά Ένα Παράγοντα (One-way ANOVA) Two-way ANOVA N-way ANOVA

3 1. Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Πώς δουλεύουμε με τα μη γραμμικά μοντέλα παλινδρόμησης; Συνήθως, εφαρμόζουμε αριθμητικούς αλγόριθμους βελτιστοποίησης για να προσδιορίσουμε τις παραμέτρους του μοντέλου. Ωστόσο, δεν υπάρχει έκφραση κλειστής μορφής για τις παραμέτρους, όπως στην περίπτωση της γραμμικής παλινδρόμησης. Επιπλέον, μπορεί να υπάρχουν πολλά τοπικά ελάχιστα της προς βελτιστοποίηση συνάρτησης. Στην πράξη, χρησιμοποιούνται αριθμητικοί αλγόριθμοι βελτιστοποίησης για την εύρεση του ολικού ελαχίστου του αθροίσματος τετραγώνων. Σε μερικές περιπτώσεις, μπορούμε να μετασχηματίσουμε το μη γραμμικό μοντέλο σε γραμμικό (γραμμικοποίηση). Στην περίπτωση αυτή, συνεχίζουμε πραγματοποιώντας μια γραμμική ανάλυση παλινδρόμησης.

4 1. Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Παράδειγμα 1.1 Τα δεδομένα από μια καμπύλη δόσης-αναλογίας απόκρισης παρουσιάζονται στον ακόλουθο πίνακα : Δόση Αναλογία απόκρισης 1 0.01 8 0.1 15 0.68 22 0.92 2 0.015 9 0.19 16 0.74 23 0.935 3 0.02 10 0.25 17 0.79 24 0.95 4 0.04 11 0.34 18 0.83 25 0.96 5 0.045 12 0.44 19 0.85 26 6 0.05 13 0.53 20 0.88 27 0.97 7 0.07 14 0.62 21 0.9 28 0.975

5 1. Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Παράδειγμα 1.1(συν.) Σχεδιάζουμε το διάγραμμα σκέδασης των μεταβλητών της αναλογίας απόκρισης και της δόσης: Προφανώς, δεν έχουμε γραμμική σχέση μεταξύ των δύο μεταβλητών.

6 1. Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Παράδειγμα 1.1(συν.) Μετασχηματίζουμε τη μεταβλητή «αναλογία απόκρισης» (y μεταβλητή) χρησιμοποιώντας το λογιστικό μετασχηματισμό : Τα μετασχηματισμένα δεδομένα παρουσιάζονται στον ακόλουθο πίνακα : Δόση Αναλογία απόκρισης 1 8 15 0.3274 22 1.0607 2 9 16 0.4543 23 1.1579 3 10 17 0.5754 24 1.2788 4 11 18 0.6886 25 1.3802 5 12 19 0.7533 26 6 13 0.0522 20 0.8653 27 1.5097 7 14 0.2126 21 0.9542 28 1.5911

7 1. Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Παράδειγμα 1.1(συν.) Σχεδιάζουμε το διάγραμμα σκέδασης της μεταβλητής της λογιστικής αναλογίας απόκρισης με τη μεταβλητή της δόσης: Τώρα έχουμε μια γραμμική σχέση μεταξύ των δύο μεταβλητών.

8 1. Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Παράδειγμα 1.1 (συν.) Υποθέτοντας ότι όλες οι υπόλοιπες συνθήκες που είναι απαραίτητες για την εφαρμογή της γραμμικής παλινδρόμησης ισχύουν, εφαρμόζουμε γραμμική παλινδρόμηση : x=[ ]’; logisticy=[ ]’; x=[ones(size(x)) x]; [b,bint,r,rint,Stats] = regress(logisticy,x); b =[ ] bint =[ ] Stats(1) = Stats(3) = 0 Συνεπώς, το R2 ισούται με και η p-τιμή ισούται με 0.

9 1. Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Παράδειγμα 1.1(συν.) logisticyest=x*b; figure(1);plot(x(:,2),logisticy,'.') hold on; plot(x(:,2),logisticyest) xlabel('dose') ylabel('logistic proportion response')

10 1. Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Παράδειγμα 1.2 Τα δεδομένα από μια καμπύλη δόσης-αναλογίας απόκρισης παρουσιάζονται στον ακόλουθο πίνακα : Δόση Αναλογία απόκρισης 1 0.01 8 0.1 15 0.68 22 0.92 2 0.015 9 0.19 16 0.74 23 0.935 3 0.02 10 0.25 17 0.79 24 0.95 4 0.04 11 0.34 18 0.83 25 0.96 5 0.045 12 0.44 19 0.85 26 6 0.05 13 0.53 20 0.88 27 0.97 7 0.07 14 0.62 21 0.9 28 0.975

11 1. Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Παράδειγμα 1.2 (συν.) Έστω ότι το υποκείμενο μοντέλο είναι το ακόλουθο μη γραμμικό μοντέλο : function yhat = nlmod(beta,x) b1 = beta(1); b2 = beta(2); yhat = 10.^(b1+b2.*x)./(1+10.^(b1+b2.*x)); Ποιες είναι οι εκτιμήσεις των παραμέτρων δεδομένου ότι όλες οι παραδοχές για τη μη γραμμική παλινδρόμηση ισχύουν;

12 1. Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Παράδειγμα 1.2 (συν.) beta0=[1 1]; [beta,r,J]=nlinfit(x,y,'nlmod',beta0); beta = [ ]; beta0=[-2 0]; beta0=[-3 3]; Τα ανωτέρω αποτελέσματα είναι πάρα πολύ κοντά στα αποτελέσματα του προηγούμενου παραδείγματος:

13 Ανάλυση Διασποράς Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Ανάλυση Διασποράς Κατά Ένα Παράγοντα (One-way ANOVA) Two-way ANOVA N-way ANOVA

14 2. One-way ANOVA Πολλές φορές χρειάζεται να συγκρίνουμε τις μέσες τιμές περισσότερων των δύο πληθυσμών. Για παράδειγμα, θέλουμε να συγκρίνουμε τα αποτελέσματα τεσσάρων διαφορετικών θεραπειών που μειώνουν τα επίπεδα της χοληστερόλης, συγκρίνοντας τις μέσες τιμές που λαμβάνουμε από τις τέσσερις διαφορετικές θεραπείες. Με άλλα λόγια, επιθυμούμε να εφαρμόσουμε τον έλεγχο της μηδενικής υπόθεσης ότι k (k>=2) ανεξάρτητοι πληθυσμοί έχουν ίσες μέσες τιμές. Η μέθοδος που χρησιμοποιούμε για το σκοπό αυτό ονομάζεται Ανάλυση Διασποράς (ANOVA - ANalysis Of Variance). Η μέθοδος εξετάζει τη μεταβλητότητα των τιμών των δειγμάτων εντός των ομάδων και μεταξύ των ομάδων και εξαγάγει συμπεράσματα για τις πληθυσμιακές μέσες τιμές.

15 2. One-way ANOVA Η Ανάλυση Διασποράς κατά ένα παράγοντα (One-way ANOVA) είναι η διαδικασία ANOVA που χρησιμοποιεί τις τιμές μιας μεταβλητής για το διαχωρισμό των ομάδων. Η μεταβλητή που χρησιμοποιείται για το διαχωρισμό των ομάδων ονομάζεται παράγοντας (factor). Με την One-way ANOVA συγκρίνουμε την παρατηρούμενη διασπορά ως προς την αναμενόμενη διασπορά κάτω από τη μηδενική υπόθεση ότι όλες οι k πληθυσμιακές μέσες τιμές είναι ίσες.

16 2. One-way ANOVA Παραδοχές για την εφαρμογή της One-way ANOVA
Ανεξαρτησία : Τα δείγματα κάθε πληθυσμού πρέπει να είναι ανεξάρτητα (Ανεξαρτησία σημαίνει ότι δεν υπάρχει σχέση ούτε μεταξύ των παρατηρήσεων των διαφορετικών ομάδων ούτε εντός κάθε ομάδας). Κανονικότητα : Οι πληθυσμοί πρέπει να ακολουθούν την κανονική κατανομή. Ισότητα διασπορών : Οι πληθυσμιακές διασπορές είναι ίσες.

17 2. One-way ANOVA Μοντέλο της One-way ANOVA
yij είναι ο πίνακας παρατηρήσεων κάθε στήλη του οποίου αναπαριστά μια διαφορετική ομάδα (με δείκτη γραμμών i, δείκτη στηλών j) a.j είναι ο πίνακας, του οποίου οι στήλες είναι οι μέσες τιμές των ομάδων εij είναι ο πίνακας των τυχαίων διαταραχών Δηλαδή, το μοντέλο υποθέτει ότι οι στήλες του y είναι μια σταθερά συν μια τυχαία διαταραχή. Θέλουμε να ελέγξουμε εάν οι σταθερές είναι όλες οι ίδιες.

18 2. One-way ANOVA Το Statistics Toolbox διαθέτει τη συνάρτηση anova1
Πραγματοποιεί την one-way ANOVA για τη σύγκριση των μέσων τιμών δύο ή περισσότερων δειγμάτων. Η συνάρτηση επιστρέφει την p-τιμή για τη μηδενική υπόθεση ότι όλα τα δείγματα προέρχονται από τον ίδιο πληθυσμό (ή από διαφορετικούς πληθυσμούς με την ίδια μέση τιμή). [p,table,stats]= anova1(X,group,'displayopt') Περιγραφή Τιμές Εξ’ ορισμού X m×n πίνακας, κάθε στήλη του οποίου αναπαριστά ένα ανεξάρτητο δείγμα που περιέχει m αμοιβαίες ανεξάρτητες παρατηρήσεις group ένας πίνακας χαρακτήρων ή πίνακας κελιών που περιέχει τις ετικέτες για το box plot των δειγμάτων του X ‘displayopt’ ενεργοποιεί τον πίνακα ANOVA και εμφανίζει τα box plots ‘on’ ή ‘off’ ‘on’ p η p-τιμή για τη μηδενική υπόθεση (ότι όλα τα δείγματα του X προέρχονται από τον ίδιο πληθυσμό) table ο πίνακας ANOVA (που περιλαμβάνει τις ετικέτες στηλών και γραμμών) stats δομή που χρησιμοποιείται για την εκτέλεση ενός επακόλουθου ελέγχου πολλαπλής σύγκρισης (συνάρτηση multcompare)

19 2. One-way ANOVA Η μη παραμετρική περίπτωση : Ο έλεγχος Kruskal-Wallis
Υποθέτουμε ότι οι ομάδες παρατηρήσεων προέρχονται από συνεχείς κατανομές που είναι ταυτόσημες (παρόμοια σχήματα) εκτός πιθανόν από μια ολίσθηση.

20 2. One-way ANOVA Η συνάρτηση kruskalwallis
Πραγματοποιεί τον έλεγχο Kruskal-Wallis για τη σύγκριση δύο ή περισσοτέρων δειγμάτων. Η συνάρτηση επιστρέφει την p-τιμή για τη μηδενική υπόθεση ότι όλα τα δείγματα προέρχονται από τον ίδιο πληθυσμό (ή από διαφορετικούς πληθυσμούς με την ίδια κατανομή). [p,table,stats]=kruskalwallis(X,group,'displayopt') Περιγραφή Τιμές Εξορισμού X m×n πίνακας, του οποίου κάθε στήλη αναπαριστά ένα ανεξάρτητο δείγμα που περιέχει m αμοιβαία ανεξάρτητες παρατηρήσεις group ένας πίνακας χαρακτήρων ή πίνακας κελιών που περιέχει τις ετικέτες για το box plot των δειγμάτων του X ‘displayopt’ ενεργοποιεί τον πίνακα ANOVA και εμφανίζει τα box plots ‘on’ ή ‘off’ ‘on’ p η p-τιμή για τη μηδενική υπόθεση (όλα τα δείγματα του X προέρχονται από τον ίδιο πληθυσμό) table ο πίνακας ANOVA (που περιλαμβάνει τις ετικέτες στηλών και γραμμών) υπολογισμένος χρησιμοποιώντας τις τάξεις των δεδομένων stats δομή που χρησιμοποιείται για την εκτέλεση ενός επακόλουθου ελέγχου πολλαπλής σύγκρισης (συνάρτηση multcompare)

21 Ανάλυση Διασποράς Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Ανάλυση Διασποράς Κατά Ένα Παράγοντα (One-way ANOVA) Two-way ANOVA N-way ANOVA

22 3. Two-way ANOVA Πολλές φορές χρειάζεται να εξετάσουμε ταυτόχρονα τις επιδράσεις δύο ανεξάρτητων μεταβλητών σε μία εξαρτημένη μεταβλητή με την ίδια ανάλυση. Έτσι χρειαζόμαστε μια κατάλληλη ANOVA. Η ισχυρή στατιστική ανάλυση που μας επιτρέπει τον έλεγχο της επίδρασης δύο ανεξάρτητων μεταβλητών ονομάζεται Ανάλυση Διασποράς κατά δύο παράγοντες (Two-way ANOVA ή Factorial ANOVA). Η Two-way ANOVA παρέχει την ίδια πληροφορία που θα έδιναν οι δύο One-way ANOVA αλλά σε μία ανάλυση. Η Two-way ANOVA επίσης μας επιτρέπει να προσδιορίσουμε πιθανές συνδυαστικές επιδράσεις των δύο ανεξάρτητων μεταβλητών. Δηλαδή, αποτιμά τους τρόπους με τους οποίους οι μεταβλητές αυτές αλληλεπιδρούν η μία με την άλλη και επηρεάζουν τις τιμές της εξαρτημένης μεταβλητής.

23 3. Two-way ANOVA Αν και η κατανόηση των αλληλεπιδράσεων αυτών μπορεί να είναι ένα σύνθετο και δύσκολο έργο, είναι αλήθεια ότι στον πραγματικό κόσμο πολλές μεταβλητές αλληλεπιδρούν η μία με την άλλη. Η έννοια της Two-way ANOVA είναι ουσιαστικά η ίδια με αυτή της One-way ANOVA. Η ερμηνεία των F-τιμών που προκύπτουν είναι επίσης στην ίδια λογική όπως στην περίπτωση της One-way ANOVA. Η διαφορά μεταξύ της One-way ANOVA και της Two-way ANOVA είναι ότι η One-way ANOVA παράγει μία F-τιμή ενώ η Two-way ANOVA παράγει τρεις F-τιμές : δύο που ελέγχουν τις κύριες επιδράσεις (main effects) καθενός από τους δύο παράγοντες συν μια τρίτη που ελέγχει τη συνδυασμένη επίδραση της αλληλεπίδρασης των δύο μεταβλητών.

24 3. Two-way ANOVA n x m Two-way ANOVA
Στην απλούστερη Two-way ANOVA, έχουμε 2 επίπεδα για καθεμία από τις δύο μεταβλητές. Στην περίπτωση αυτή έχουμε μία 2x2 ανάλυση (2 επίπεδα της πρώτης μεταβλητής x 2 επίπεδα της δεύτερης μεταβλητής). Στη γενική περίπτωση έχουμε μια n x m Two-way ANOVA, κάτι που σημαίνει ότι έχουμε n επίπεδα της πρώτης μεταβλητής και m επίπεδα της δεύτερης μεταβλητής. Κάθε μοναδικός συνδυασμός αναφέρεται ως κελί καθώς τα πειραματικά δεδομένα μπορούν να αναπαρασταθούν ως ένας n x m πίνακας.

25 3. Two-way ANOVA Βασική προϋπόθεση
Στην απλούστερη Two-way ANOVA (2x2), η ανωτέρω προϋπόθεση σημαίνει ότι απαιτούνται 4 διαφορετικές ομάδες συμμετεχόντων στη μελέτη.

26 3. Two-way ANOVA Η 2x2 Two-way ANOVA Πρώτη μεταβλητή : Παράγοντας A
Δεύτερη μεταβλητή : Παράγοντας B Επίπεδο B1 Επίπεδο B2 Επομένως, απαιτούνται 4 συνδυασμοί (κελιά) για την εκτέλεση της 2x2 Two-way ANOVA. Παράγοντας A Επίπεδο A1 Επίπεδο A2 Παράγοντας B Επίπεδο B1 A1B1 A2B1 Επίπεδο B2 A1B2 A2B2

27 3. Two-way ANOVA Η 2x2 Two-way ANOVA (συν.)
Έτσι, πρέπει να κατανείμουμε τους συμμετέχοντες στη μελέτη στις ακόλουθες τέσσερις ομάδες: A1B1 A1B2 A2B1 A2B2 Οι ομάδες αυτές μας επιτρέπουν να συγκρίνουμε τα αποτελέσματα (scores) του A1 ως προς το A2 και του B1 ως προς το B2 για μια δεδομένη εξαρτημένη μεταβλητή. Αυτό είναι το ίδιο με το να πραγματοποιούσαμε δύο ξεχωριστές μελέτες και να εφαρμόζαμε δύο t-test. Ωστόσο, όπως έχουμε ήδη αναφέρει, πραγματοποιώντας την Two-way ANOVA λαμβάνουμε την ίδια πληροφορία από μία μόνο ανάλυση. Επιπλέον, αποτιμούμε την πιθανή αλληλεπίδραση των δύο ανεξάρτητων μεταβλητών συνδυαστικά.

28 3. Two-way ANOVA Διασπορά μεταξύ ομάδων και εντός ομάδων
Παρομοίως με την περίπτωση της One-way ANOVA, η Two-way ANOVA βασίζεται στη σύγκριση μεταξύ : της διασποράς μεταξύ ομάδων της εξαρτημένης μεταβλητής, δηλαδή της διασποράς που αποδίδεται στις ανεξάρτητες μεταβλητές και της διασποράς εντός ομάδων της εξαρτημένης μεταβλητής, δηλαδή της διασποράς που οφείλεται σε τυχαίες διαταραχές.

29 3. Two-way ANOVA Διασπορά μεταξύ ομάδων και εντός ομάδων (συν.)
Η διασπορά μεταξύ ομάδων προέρχεται από τις ακόλουθες τρεις πηγές : Διασπορά λόγω της κύριας επίδρασης του παράγοντα A, δηλαδή λόγω των διαφορών μεταξύ των ομάδων των επιπέδων του παράγοντα A (δηλαδή των δύο ομάδων του επιπέδου A1 ως προς το επίπεδο A2 στη 2x2 περίπτωση). Διασπορά λόγω της κύριας επίδρασης του παράγοντα B, δηλαδή λόγω των διαφορών μεταξύ των ομάδων των επιπέδων του παράγοντα B (δηλαδή των δύο ομάδων του επιπέδου B1 ως προς το επίπεδο B2 στη 2x2 περίπτωση). Διασπορά λόγω της αλληλεπίδρασης A x B, δηλαδή λόγω των διαφορών μεταξύ των n x m ομάδων των συνδυασμών μεταξύ των n επιπέδων του παράγοντα A και των m επιπέδων του παράγοντα B.

30 3. Two-way ANOVA Διασπορά μεταξύ ομάδων και εντός ομάδων (συν.)
Η ανάλυση υπολογίζει τρεις διακριτούς F-λόγους για τον προσδιορισμό του μέρους της διασποράς της εξαρτημένης μεταβλητής που μπορεί να αποδοθεί σε κάθε μία από τις ανωτέρω επιδράσεις. Κάθε F-λόγος αναπαριστά το λόγο της διασποράς συγκεκριμένης επίδρασης ως προς τη διασπορά τυχαίου σφάλματος : Παρομοίως με την περίπτωση της One-way ANOVA, η σημαντικότητα κάθε επίδρασης εξαρτάται από την πιθανότητα που σχετίζεται με την αντίστοιχη τιμή του F-λόγου.

31 3. Two-way ANOVA Κατανοώντας τα αποτελέσματα (F-λόγος και p-τιμή)
Η ερμηνεία των κυρίων επιδράσεων είναι εύκολη : Εάν για ένα συγκεκριμένο παράγοντα, είναι p<0.05 (το επίπεδο σημαντικότητας a=0.05), τότε υπάρχει σημαντική επίδραση για αυτόν τον παράγοντα. Εξετάζουμε τις μέσες τιμές για τα επίπεδα του συγκεκριμένου παράγοντα για να προσδιορίσουμε ποια ομάδα είναι σημαντικά υψηλότερη από τις υπόλοιπες. Η ερμηνεία της αλληλεπίδρασης είναι πιο πολύπλοκη: Εάν p>0.05, δηλαδή η αλληλεπίδραση δεν είναι σημαντική, τότε το συμπέρασμά μας είναι ότι οι διαφορές στα αποτελέσματα της εξαρτημένης μεταβλητής για τον παράγοντα A δεν εξαρτώνται από το επίπεδο του παράγοντα B (δηλαδή, οι ίδιες διαφορές ως προς τον παράγοντα A παρατηρούνται για όλα τα επίπεδα του παράγοντα B).

32 3. Two-way ANOVA Κατανοώντας τα αποτελέσματα (F-λόγος και p-τιμή) (συν.) Η ερμηνεία της αλληλεπίδρασης είναι πιο πολύπλοκη (συν): Εάν p<0.05, δηλαδή η αλληλεπίδραση είναι σημαντική, τότε συμπεραίνουμε ότι οι διαφορές στα αποτελέσματα της εξαρτημένης μεταβλητής για τον παράγοντα Α εξαρτώνται από τα επίπεδα του παράγοντα Β. Για παράδειγμα, στην περίπτωση της 2x2 Two-way ANOVA, μπορεί να συμβεί, συγκρίνοντας το επίπεδο B1 για το A1 ως προς το επίπεδο B1 για το A2, να δούμε ότι το επίπεδο A1 έχει υψηλότερα αποτελέσματα για την εξαρτημένη μεταβλητή από ό,τι το επίπεδο A2, ενώ, συγκρίνοντας το επίπεδο B2 για το A1 ως προς το επίπεδο B2 για το A2, μπορεί να μη δούμε σημαντική διαφορά στα αποτελέσματα της εξαρτημένης μεταβλητής μεταξύ των δύο ομάδων. Το ανωτέρω παράδειγμα ερμηνείας μιας σημαντικής αλληλεπίδρασης απαιτεί τη σύγκριση κελιών, η οποία υλοποιείται με πολλαπλές συγκρίσεις (συνάρτηση multcompare). Οι συγκρίσεις αυτές μας επιτρέπουν την εξαγωγή συγκεκριμένων συμπερασμάτων σχετικά με τις αλληλεπιδράσεις.

33 3. Two-way ANOVA Παραδοχές για την εφαρμογή της Two-way ANOVA
Ανεξαρτησία Οι παρατηρήσεις είναι ανεξάρτητες (δηλαδή, δεν υπάρχει καμία σχέση ούτε μεταξύ των παρατηρήσεων των διαφόρων ομάδων ούτε εντός κάθε ομάδας). Κανονικότητα Οι παρατηρήσεις εντός κάθε κελιού ακολουθούν την κανονική κατανομή. Ισότητα διασπορών Οι παρατηρήσεις εντός κάθε κελιού έχουν ίσες διασπορές.

34 3. Two-way ANOVA Η Two-way ANOVA με ή χωρίς επανάληψη
χωρίς επανάληψη (replication), δηλαδή μόνο με μία παρατήρηση για κάθε συνδυασμό των ανεξάρτητων μεταβλητών ή με επανάληψη, δηλαδή με περισσότερες από μία παρατηρήσεις για κάθε συνδυασμό των ανεξάρτητων μεταβλητών.

35 3. Two-way ANOVA Μηδενικές Υποθέσεις της Two-way ANOVA με επανάληψη
Οι μέσες τιμές των παρατηρήσεων που ομαδοποιούνται με τον πρώτο παράγοντα είναι ίσες. Οι μέσες τιμές των παρατηρήσεων που ομαδοποιούνται με το δεύτερο παράγοντα είναι ίσες. Δεν υπάρχει αλληλεπίδραση μεταξύ των δύο παραγόντων. Ο έλεγχος αυτός μας λέει εάν η επίδραση του ενός παράγοντα εξαρτάται από τον άλλο παράγοντα.

36 3. Two-way ANOVA Μηδενικές υποθέσεις της Two-way ANOVA χωρίς επανάληψη
Οι μέσες τιμές των παρατηρήσεων που ομαδοποιούνται με τον πρώτο παράγοντα είναι ίσες. Οι μέσες τιμές των παρατηρήσεων που ομαδοποιούνται με το δεύτερο παράγοντα είναι ίσες. Στην περίπτωση αυτή, είναι αδύνατο να ελεγχθεί η μηδενική υπόθεση της μηδενικής αλληλεπίδρασης. Ο έλεγχος των ανωτέρω δύο μηδενικών υποθέσεων σχετικά με τις κύριες επιδράσεις απαιτεί την παραδοχή της μηδενικής αλληλεπίδρασης.

37 3. Two-way ANOVA Μοντέλο της Two-way ANOVA
yijk είναι ο πίνακας των παρατηρήσεων της εξαρτημένης μεταβλητής (με δείκτη γραμμής i, δείκτη στήλης j και δείκτη επανάληψης k) μ είναι ένας σταθερός πίνακας της συνολικής μέσης τιμής της εξαρτημένης μεταβλητής a.j είναι ο πίνακας του οποίου οι στήλες είναι οι αποκλίσεις κάθε παρατήρησης από την τιμή μ της εξαρτημένης μεταβλητής, οι οποίες αποδίδονται στον παράγοντα A. Όλες οι τιμές σε μια δεδομένη στήλη του a.j είναι ταυτόσημες ενώ οι τιμές σε κάθε γραμμή του a.j έχουν άθροισμα 0.

38 3. Two-way ANOVA Μοντέλο της Two-way ANOVA (συν.)
bi. είναι ο πίνακας του οποίου οι γραμμές είναι οι αποκλίσεις κάθε παρατήρησης από την τιμή μ της εξαρτημένης μεταβλητής που αποδίδονται στον παράγοντα B. Όλες οι τιμές σε μια δεδομένη γραμμή του bi. είναι ταυτόσημες ενώ οι τιμές σε κάθε στήλη του bi. έχουν άθροισμα 0. γij είναι ο πίνακας των αλληλεπιδράσεων. Οι τιμές σε κάθε γραμμή του γij έχουν άθροισμα 0 και οι τιμές σε κάθε στήλη του γij έχουν άθροισμα 0. εijk είναι ο πίνακας των τυχαίων διαταραχών.

39 3. Two-way ANOVA Matlab Το Statistics Toolbox διαθέτει την ακόλουθη συνάρτηση για την εκτέλεση της Two-way ANOVA για τους μέσους δύο ή περισσότερων στηλών και δύο ή περισσότερων γραμμών των παρατηρήσεων. Συνάρτηση Matlab Έλεγχος υπόθεσης anova2 Ανάλυση διασποράς (ANOVA) κατά δύο παράγοντες

40 3. Two-way ANOVA Η συνάρτηση anova2
Πραγματοποιεί την ANOVA κατά δύο παράγοντες. Η συνάρτηση επιστρέφει την p-τιμή για τις μηδενικές υποθέσεις υπό έλεγχο. [p,table,stats]= anova2(X,reps,'displayopt') Περιγραφή Τιμές Εξ’ ορισμού X Οι παρατηρήσεις. Τα δεδομένα σε διάφορες στήλες αντιστοιχούν σε μεταβολές στον παράγοντα A. Τα δεδομένα σε διάφορες γραμμές αντιστοιχούν σε μεταβολές στον παράγοντα B. reps Το πλήθος των επαναλήψεων (replicates) σε κάθε κελί, το οποίο πρέπει να είναι σταθερό. 1 ‘displayopt’ ενεργοποιεί τον πίνακα ANOVA και την παρουσίαση των box plot ‘on’ ή ‘off’ ‘on’ p Όταν reps= 1, το διάνυσμα p περιέχει δύο p-τιμές. Όταν reps> 1, το διάνυσμα p περιέχει τρεις p-τιμές. table Ο πίνακας ANOVA stats Δομή που χρησιμοποιείται για την εκτέλεση επακόλουθου ελέγχου πολλαπλών συγκρίσεων (συνάρτηση multcompare)

41 3. Two-way ANOVA Η συνάρτηση anova2 (συν.)
Ο ακόλουθος πίνακας παρουσιάζει τη δομή του πίνακα X των παρατηρήσεων όπου ο παράγοντας A (στήλες) έχει δύο επίπεδα, ο παράγοντας B (γραμμές) έχει τρία επίπεδα και υπάρχουν δύο επαναλήψεις (reps=2). Οι δείκτες δείχνουν γραμμή, στήλη και επανάληψη (replication), αντίστοιχα.

42 3. Two-way ANOVA Η συνάρτηση anova2 (συν.)
Όταν reps=1, η anova2 επιστρέφει δύο p-τιμές στο διάνυσμα p: Την p-τιμή για τη μηδενική υπόθεση H0A ότι όλα τα δείγματα από τον παράγοντα A (δηλαδή όλες οι στήλες-δείγματα του X) προέρχονται από τον ίδιο πληθυσμό. Την p-τιμή για τη μηδενική υπόθεση H0B ότι όλα τα δείγματα από τον παράγοντα B (δηλαδή όλες οι γραμμές-δείγματα του X) προέρχονται από τον ίδιο πληθυσμό. Όταν reps>1, η anova2 επιστρέφει και μια τρίτη p-τιμή στο διάνυσμα p: την p-τιμή για τη μηδενική υπόθεση H0AB ότι οι επιδράσεις των παραγόντων A και B είναι προσθετικές (δηλαδή ότι δεν υπάρχει αλληλεπίδραση μεταξύ των παραγόντων A και B).

43 3. Two-way ANOVA Η συνάρτηση anova2 (συν.)
Εάν κάποια p-τιμή είναι μικρότερη του a, αυτό εγείρει αμφιβολίες για την ισχύ της αντίστοιχης μηδενικής υπόθεσης: p-τιμή για την H0A μικρότερη του a δηλώνει ότι τουλάχιστον μία μέση τιμή στήλης-δείγματος είναι σημαντικά διαφορετική από τις άλλες μέσες τιμές στηλών-δειγμάτων, δηλαδή υπάρχει μία κύρια επίδραση από τον παράγοντα A. p-τιμή για την H0B μικρότερη του a δηλώνει ότι τουλάχιστον μία μέση τιμή γραμμής-δείγματος είναι σημαντικά διαφορετική από τις άλλες μέσες τιμές γραμμών-δειγμάτων, δηλαδή υπάρχει μία κύρια επίδραση από τον παράγοντα B. p-τιμή για την H0AB μικρότερη του a δηλώνει ότι υπάρχει αλληλεπίδραση μεταξύ των παραγόντων A και B. Είναι σύνηθες να θεωρείται ένα αποτέλεσμα σημαντικό όταν η p-τιμή είναι μικρότερη από 0.05 ή 0.01.

44 3. Two-way ANOVA Η συνάρτηση anova2 (συν.)
Η συνάρτηση anova2 παρουσιάζει τον τυπικό πίνακα ANOVA, ο οποίος διαιρεί τη μεταβλητότητα των δεδομένων του πίνακα X σε 3 ή 4 μέρη με βάση την τιμή του reps. Συγκεκριμένα παρουσιάζει: τη μεταβλητότητα λόγω των διαφορών μεταξύ των μέσων τιμών των στηλών. τη μεταβλητότητα λόγω των διαφορών μεταξύ των μέσων τιμών των γραμμών. τη μεταβλητότητα λόγω της επίδρασης μεταξύ γραμμών και στηλών (εάν reps >1). την απομένουσα μεταβλητότητα που δεν εξηγείται από οποιαδήποτε συστηματική πηγή.

45 3. Two-way ANOVA Η συνάρτηση anova2 (συν.)
Η πρώτη δείχνει την πηγή της μεταβλητότητας. Η δεύτερη δείχνει το άθροισμα τετραγώνων (SS) κάθε πηγής. Η τρίτη δείχνει τους βαθμούς ελευθερίας (df) που σχετίζονται με κάθε πηγή. Η τέταρτη δείχνει τα μέσα τετράγωνα (MS) κάθε πηγής, τα οποία είναι ο λόγος SS/df. Η πέμπτη δείχνει την F στατιστική, η οποία είναι ο λόγος των MS. Η έκτη δείχνει τις p-τιμές για την F-στατιστική.

46 3. Two-way ANOVA Η συνάρτηση anova2 (συν.)
Μερικές φορές επιθυμούμε να εκτελέσουμε ένα έλεγχο για τον προσδιορισμό των ζευγαριών των επιδράσεων που είναι σημαντικά διαφορετικές. Χρησιμοποιούμε τη συνάρτηση multcompare για την εκτέλεση του ελέγχου αυτού.

47 3. Two-way ANOVA Η συνάρτηση multcompare Σύγκριση στηλών:
c = multcompare(stats,alpha) c = multcompare(stats,aplha,'on','tukey-kramer',‘column’) Σύγκριση γραμμών : c1 = multcompare(stats,alpha,'on','tukey-kramer','row') Πραγματοποιεί έλεγχο πολλαπλών συγκρίσεων χρησιμοποιώντας τις πληροφορίες της δομής stats και επιστρέφει έναν πίνακα c με τα αποτελέσματα της σύγκρισης κατά ζεύγη. Επίσης, παρέχει ένα αλληλεπιδραστικό σχήμα που παρουσιάζει γραφικά τον έλεγχο. Το αποτέλεσμα c περιέχει τα αποτελέσματα του ελέγχου στη μορφή ενός πίνακα πέντε στηλών. Κάθε γραμμή του πίνακα παρουσιάζει ένα τεστ και υπάρχει μια γραμμή για κάθε ζεύγος ομάδων. Τα στοιχεία της γραμμής δείχνουν τις συγκριθείσες μέσες τιμές, την υπολογισθείσα διαφορά των μέσων τιμών και ένα διάστημα εμπιστοσύνης για τη διαφορά αυτή.

48 3. Two-way ANOVA Παράδειγμα 3.1
Η διοίκηση ενός νοσοκομείου μετρά το χρόνο που κάνουν συγκεκριμένοι οδηγοί ασθενοφόρων για τη μετακίνηση μεταξύ δύο συγκεκριμένων σημείων στο κέντρο της πόλης. Οι χρόνοι σε λεπτά τεσσάρων οδηγών μετρούνται κατά τη διάρκεια μιας εβδομάδας και καταγράφονται στον ακόλουθο πίνακα : Θεωρείστε ότι οι χρόνοι των οδηγών στις διάφορες ημέρες ακολουθούν την κανονική κατανομή με ίδιες διασπορές. Δευτέρα Τρίτη Τετάρτη Πέμπτη Παρασκευή Σάββατο Κυριακή Οδηγός 1 27 31 29 33 32 28 Οδηγός 2 25 23 30 26 Οδηγός 3 34 24 Οδηγός 4

49 3. Two-way ANOVA Παράδειγμα 3.1 (συν.)
Εξαρτάται ο μέσος χρόνος από τον οδηγό; Εξαρτάται ο μέσος χρόνος από την ημέρα; Δευτέρα Τρίτη Τετάρτη Πέμπτη Παρασκευή Σάββατο Κυριακή Οδηγός 1 27 31 29 33 32 28 Οδηγός 2 25 23 30 26 Οδηγός 3 34 24 Οδηγός 4

50 3. Two-way ANOVA Παράδειγμα 3.1 (συν.)
Επειδή έχουμε μόνο μία παρατήρηση για κάθε συνδυασμό επιπέδων των ανεξάρτητων μεταβλητών, πραγματοποιούμε την Two-way ANOVA χωρίς επανάληψη (reps=1). Ο παράγοντας A είναι η ημέρα. Ο παράγοντας B είναι ο οδηγός. Δευτέρα Τρίτη Τετάρτη Πέμπτη Παρασκευή Σάββατο Κυριακή Οδηγός 1 27 31 29 33 32 28 Οδηγός 2 25 23 30 26 Οδηγός 3 34 24 Οδηγός 4

51 3. Two-way ANOVA Παράδειγμα 3.1 (συν.)
Θα ελέγξουμε τις ακόλουθες δύο μηδενικές υποθέσεις : Οι μέσες τιμές των παρατηρήσεων που ομαδοποιούνται από τον παράγοντα A είναι ίσες, δηλαδή ο μέσος χρόνος είναι ανεξάρτητος της ημέρας. Οι μέσες τιμές των παρατηρήσεων που ομαδοποιούνται από τον παράγοντα B είναι ίσες, δηλαδή ο μέσος χρόνος είναι ανεξάρτητος του οδηγού. Σημειώνουμε ότι, αφού reps=1, είναι αδύνατο να ελέγξουμε τη μηδενική υπόθεση της μη αλληλεπίδρασης.

52 3. Two-way ANOVA Παράδειγμα 3.1 (συν.) X=[ 27 31 27 29 33 32 28
]; [p,table,stats]= anova2(X,1) p =

53 3. Two-way ANOVA Παράδειγμα 3.1 (συν.)
Για τον πρώτο έλεγχο, λαμβάνουμε F-τιμή ίση με και p-τιμή στηλών ίση με , μικρότερη του επιπέδου σημαντικότητας. Επομένως, απορρίπτουμε τη μηδενική υπόθεση ότι ο μέσος χρόνος είναι ανεξάρτητος της ημέρας. Άρα, ο μέσος χρόνος εξαρτάται από την ημέρα. Για το δεύτερο έλεγχο, λαμβάνουμε F-τιμή ίση με 2.74 και p-τιμή γραμμών ίση με , μεγαλύτερη του επιπέδου σημαντικότητας. Συνεπώς, δεν έχουμε σημαντική ένδειξη για την απόρριψη της μηδενικής υπόθεσης ότι ο μέσος χρόνος είναι ανεξάρτητος του οδηγού.

54 3. Two-way ANOVA Παράδειγμα 3.1 (συν.) table =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Columns‘ [ ] [ 6] [ ] [ ] [1.4078e-006] 'Rows' [ ] [ 3] [ ] [ ] [ ] 'Error' [ ] [18] [ ] [] [] 'Total' [ ] [27] [] [] [] stats = source: 'anova2' sigmasq: colmeans: [ ] coln: 4 rowmeans: [ ] rown: 7 inter: 0 pval: NaN df: 18

55 3. Two-way ANOVA Παράδειγμα 3.1 (συν.)
Εάν παρατηρήσουμε τις μέσες τιμές των γραμμών: , , και , φαίνεται πιθανόν ότι οι πληθυσμιακές μέσες τιμές κάθε οδηγού θα μπορούσε να είναι ταυτόσημες. Εάν παρατηρήσουμε τις μέσες τιμές των στηλών : 27, 30.25, 25.25, 29.5, 32.5, 32, 25.75, δεν φαίνεται πιθανόν ότι οι πληθυσμιακές μέσες τιμές κάθε ημέρας είναι ίσες. Ας σημειωθεί ότι εάν όντως οι οδηγοί είχαν τις ίδιες μέσες τιμές, υπάρχει πιθανότητα 7.33% οι δειγματικές μέσες τιμές των γραμμών να διαφέρουν όσο εδώ παρατηρήσαμε. Από την άλλη πλευρά, εάν όντως οι ημέρες είχαν τις ίδιες μέσες τιμές, τότε είναι σχεδόν μηδενική η πιθανότητα οι δειγματικές μέσες τιμές των στηλών να διαφέρουν όσο εδώ παρατηρήσαμε.

56 3. Two-way ANOVA Παράδειγμα 3.1 (συν.) c = multcompare(stats) c =

57 3. Two-way ANOVA Παράδειγμα 3.1 (συν.)

58 3. Two-way ANOVA Παράδειγμα 3.1 (συν.)

59 3. Two-way ANOVA Παράδειγμα 3.1 (συν.)
c1 = multcompare(stats,0.05,'on','tukey-kramer','row') c1 =

60 3. Two-way ANOVA Παράδειγμα 3.2
Ένας ερευνητής μελετά τον τρόπο που η κατανάλωση φαγητού από αρουραίους επηρεάζεται από ένα συγκεκριμένο φάρμακο. Υπάρχουν δύο επίπεδα: φάρμακο και placebo. Υπάρχουν τέσσερις τύποι αρουραίων: M, C, F και O. Επομένως, έχουμε 2x4=8 κελιά. Υπάρχουν 5 μετρήσεις ανά κελί. Η ποσότητα της καταναλισκόμενης τροφής σε γραμμάρια ανά ημέρα παρουσιάζεται στον ακόλουθο πίνακα :

61 3. Two-way ANOVA Παράδειγμα 3.2 (συν.)
Υποθέστε ότι η καταναλισκόμενη τροφή για φάρμακο/placebo και για τους τύπους των αρουραίων ακολουθούν την κανονική κατανομή με την ίδια διασπορά. Επιθυμούμε να χρησιμοποιήσουμε την Two-way ANOVA με επίπεδο σημαντικότητας 0,05 για την πραγματοποίηση των ακόλουθων ελέγχων: Είναι η μέση καταναλισκόμενη τροφή η ίδια για φάρμακο και placebo; Είναι η μέση καταναλισκόμενη τροφή η ίδια και για τους τέσσερις τύπους αρουραίων; Υπάρχει μηδενική αλληλεπίδραση μεταξύ του παράγοντα φάρμακο/ placebo και των τύπων των αρουραίων; Παράδειγμα 3.2 (συν.) M C F O Φάρμακο 22.56 16.54 18.58 18.20 25.02 24.64 15.44 14.56 23.66 24.62 16.12 15.54 17.22 19.06 16.88 16.82 22.58 20.12 17.58 Placebo 25.64 22.50 17.82 19.74 28.84 24.48 15.76 17.48 26.00 25.52 12.96 16.46 26.02 24.76 15.00 16.44 23.24 20.62 19.54 15.70

62 3. Two-way ANOVA Παράδειγμα 3.2 (συν.)
Αφού έχουμε 5 παρατηρήσεις για κάθε συνδυασμό των επιπέδων των ανεξάρτητων μεταβλητών, πραγματοποιούμε την Two-way ANOVA με επανάληψη (reps=5). Ο παράγοντας A είναι ο τύπος των αρουραίων. Ο παράγοντας Β είναι φάρμακο/placebo.

63 3. Two-way ANOVA Παράδειγμα 3.2 (συν.)
Θα ελέγξουμε τις ακόλουθες τρεις μηδενικές υποθέσεις : Οι μέσες τιμές των παρατηρήσεων που ομαδοποιούνται από τον παράγοντα A είναι ίσες, δηλαδή η μέση κατανάλωση τροφής είναι η ίδια και για τους τέσσερις τύπους αρουραίων. Οι μέσες τιμές των παρατηρήσεων που ομαδοποιούνται από τον παράγοντα B είναι ίσες, δηλαδή η μέση κατανάλωση τροφής είναι η ίδια για το φάρμακο και placebo. Δεν υπάρχει αλληλεπίδραση μεταξύ των δύο παραγόντων.

64 3. Two-way ANOVA Παράδειγμα 3.2 (συν.) X=[ 22.56 16.54 18.58 18.20
]; [p,table,stats]= anova2(X,5) p =[ ]

65 3. Two-way ANOVA Παράδειγμα 3.2 (συν.)
p =[ ] Για τον έλεγχο στηλών, λαμβάνουμε F-τιμή ίση με και p-τιμή στηλών ίση με που είναι μικρότερη από το επίπεδο σημαντικότητας. Επομένως, απορρίπτουμε τη μηδενική υπόθεση ότι κάθε τύπος αρουραίων έχει την ίδια μέση κατανάλωση τροφής. Επομένως, η μέση κατανάλωση τροφής εξαρτάται από τον τύπο των αρουραίων. Για τον έλεγχο γραμμών, λαμβάνουμε F-τιμή ίση με 5.53 και p-τιμή γραμμών ίση με που είναι μικρότερη από το επίπεδο σημαντικότητας. Επομένως, απορρίπτουμε τη μηδενική υπόθεση ότι το φάρμακο και το placebo έχουν την ίδια μέση κατανάλωση τροφής. Άρα, η μέση κατανάλωση τροφής εξαρτάται από τον παράγοντα φάρμακο / placebo. Για τον έλεγχο αλληλεπίδρασης, λαμβάνουμε F-τιμή ίση με 1.72 και p-τιμή ίση με που είναι μεγαλύτερη του επιπέδου σημαντικότητας. Άρα, δεν έχουμε σημαντική ένδειξη για την απόρριψη της μηδενικής υπόθεσης ότι δεν υπάρχει αλληλεπίδραση.

66 3. Two-way ANOVA Παράδειγμα 3.2 (συν.) table =
'Source' ‘SS' 'df' 'MS' 'F' 'Prob>F' 'Columns' [ ] [ 3] [ ] [ ] [3.4398e-09] 'Rows' [ ] [ 1] [ ] [ ] [ ] 'Interaction' [ ] [ 3] [ ] [ ] [ ] 'Error' [ ] [32] [ ] [] [] 'Total' [ ] [39] [] [] [] stats = source: 'anova2' sigmasq: colmeans: [ ] coln: 10 rowmeans: [ ] rown: 20 inter: 1 pval: df: 32

67 3. Two-way ANOVA Παράδειγμα 3.2 (συν.)
Εάν παρατηρήσουμε τις δειγματικές μέσες τιμές των γραμμών : και , δεν φαίνεται πιθανό ότι οι πληθυσμιακές μέσες τιμές για φάρμακο και placebo θα είναι ίσες. Εάν παρατηρήσουμε τις δειγματικές μέσες τιμές των στηλών : , , και , δεν φαίνεται πιθανό ότι οι πληθυσμιακές μέσες τιμές για κάθε τύπο αρουραίων θα είναι ίσες. c = multcompare(stats,0.05,'on','tukey-kramer','column') Note: Your model includes an interaction term. A test of main effects can be difficult to interpret when the model includes interactions. c =

68 3. Two-way ANOVA Παράδειγμα 3.2 (συν.)

69 3. Two-way ANOVA Παράδειγμα 3.2 (συν.)
c1 = multcompare(stats,0.05,'on','tukey-kramer','row') Note: Your model includes an interaction term. A test of main effects can be difficult to interpret when the model includes interactions. c1 =

70 Ανάλυση Διασποράς Επανάληψη της μη γραμμικής ανάλυσης παλινδρόμησης
Ανάλυση Διασποράς Κατά Ένα Παράγοντα (One-way ANOVA) Two-way ANOVA N-way ANOVA

71 4. N-way ANOVA Η Ανάλυση Διασποράς κατά Ν παράγοντες (N-way ANOVA) αποτελεί τη γενίκευση της One-way και της Two-way ANOVA. Η N-way ANOVA εφαρμόζεται σε n ανεξάρτητες μεταβλητές (παράγοντες). Η N-way ANOVA παρέχει την ίδια πληροφορία που θα έδιναν N One-way ANOVA αλλά σε μία μόνο ανάλυση. Η N-way ANOVA επίσης μας επιτρέπει τον υπολογισμό πιθανών συνδυασμένων επιδράσεων των ανεξάρτητων μεταβλητών. Δηλαδή, αποτιμά τους τρόπους με τους οποίους αυτές οι μεταβλητές αλληλεπιδρούν η μία με την άλλη και επηρεάζουν τις τιμές της εξαρτημένης μεταβλητής. Καθώς το πλήθος των ανεξάρτητων μεταβλητών αυξάνει, το πλήθος των πιθανών αλληλεπιδράσεων «εκρήγνυται».

72 4. N-way ANOVA Για παράδειγμα, στην 3-way ANOVA οι τρεις ανεξάρτητες μεταβλητές (παράγοντες A, B και C) έχουν τις ακόλουθες τέσσερις αλληλεπιδράσεις : τρεις αλληλεπιδράσεις πρώτης τάξης (AB, AC, BC) και μία αλληλεπίδραση δεύτερης τάξης (ABC). Στην 4-way ANOVA, οι τέσσερις ανεξάρτητες μεταβλητές (παράγοντες A, B, C και D) έχουν τις ακόλουθες δέκα αλληλεπιδράσεις : έξι αλληλεπιδράσεις πρώτης τάξης (AB, AC, AD, BC, BD, CD), τέσσερις αλληλεπιδράσεις δεύτερης τάξης (ABC, ABD, ACD, BCD), και μία αλληλεπίδραση τρίτης τάξης (ABCD).

73 4. N-way ANOVA Γενικά, το πλήθος των κυρίων επιδράσεων (main effects) και των αλληλεπιδράσεων της N-way ANOVA υπολογίζεται από την ακόλουθη έκφραση : Ο πρώτος όρος αφορά τη συνολική μέση τιμή και είναι πάντοτε 1. Ο δεύτερος όρος αφορά το πλήθος των κυρίων επιδράσεων. Ο τρίτος όρος αφορά το πλήθος αλληλεπιδράσεων δύο παραγόντων. …. Ο τελευταίος όρος αφορά την αλληλεπίδραση N-παραγόντων και είναι ίσος με 1. Καθώς το πλήθος των αλληλεπιδράσεων αυξάνει, αυξάνει η δυσκολία ερμηνείας του μοντέλου.

74 4. N-way ANOVA Η έννοια της N-way ANOVA είναι βασικά η ίδια με εκείνη της One-way ANOVA και της Two-way ANOVA. Η ερμηνεία των F-τιμών που προκύπτουν ακολουθεί την ίδια λογική όπως στην περίπτωση της One-way ANOVA και της Two-way ANOVA. Η N-way ANOVA παράγει δύο τύπους F-τιμών : N από τις F-τιμές ελέγχουν τις κύριες επιδράσεις καθενός από τους N παράγοντες και οι υπόλοιπες από τις F-τιμές ελέγχουν τη συνδυασμένη επίδραση της αλληλεπίδρασης των συνδυασμών των N μεταβλητών.

75 4. N-way ANOVA Βασική προϋπόθεση
Η προϋπόθεση της N-way ANOVA είναι ότι τα επίπεδα των N ανεξάρτητων μεταβλητών συνδυάζονται πλήρως μεταξύ τους. Δηλαδή, κάθε επίπεδο κάθε ανεξάρτητης μεταβλητής πρέπει να συνδυάζεται με κάθε επίπεδο των υπολοίπων ανεξάρτητων μεταβλητών. Στην απλούστερη περίπτωση της 3-way ANOVA (2x2x2), η ανωτέρω απαίτηση σημαίνει ότι απαιτούνται οκτώ διαφορετικές ομάδες συμμετεχόντων. Επίπεδο A1 Επίπεδο A2 Επίπεδο B1 Επίπεδο B2 Επίπεδο C1 A1B1C1 A1B2C1 A2B1C1 A2B2C1 Επίπεδο C2 A1B1C2 A1B2C2 A2B1C2 A2B2C2

76 4. N-way ANOVA Διασπορά μεταξύ ομάδων και εντός ομάδων
Παρόμοια με την περίπτωση της One-way ANOVA και της Two-way ANOVA, η N-way ANOVA βασίζεται στη σύγκριση μεταξύ : της διασποράς μεταξύ ομάδων της εξαρτημένης μεταβλητής, δηλαδή της διασποράς που αποδίδεται στις ανεξάρτητες μεταβλητές και της διασποράς εντός ομάδων της εξαρτημένης μεταβλητής, δηλαδή της διασποράς που οφείλεται σε τυχαίες διαταραχές.

77 4. N-way ANOVA Διασπορά μεταξύ ομάδων και εντός ομάδων (συν.)
Η διασπορά μεταξύ ομάδων προέρχεται από τους ακόλουθους δύο τύπους πηγών : Διασπορά λόγω των κυρίων επιδράσεων του παράγοντα A, B, C, … δηλαδή λόγω των διαφορών μεταξύ των ομάδων των επιπέδων του παράγοντα A, B, C, …, αντίστοιχα. Διασπορά λόγω των αλληλεπιδράσεων, δηλαδή λόγω των διαφορών μεταξύ των ομάδων των συνδυασμών των επιπέδων των παραγόντων A, B, C, …. Η ανάλυση υπολογίζει ξεχωριστούς F-λόγους για τον προσδιορισμό του μέρους της διασποράς της εξαρτημένης μεταβλητής που μπορεί να αποδοθεί σε κάθε μία από τις επιδράσεις. Η σημαντικότητα κάθε επίδρασης εξαρτάται από την πιθανότητα που σχετίζεται με την τιμή του αντίστοιχου F-λόγου.

78 4. N-way ANOVA Κατανοώντας τα αποτελέσματα (F-λόγος και p-τιμή)
Η ερμηνεία των κυρίων επιδράσεων είναι εύκολη : Εάν για ένα συγκεκριμένο παράγοντα p<0.05 (0.05 είναι το επίπεδο σημαντικότητας), τότε υπάρχει σημαντική επίδραση για τον παράγοντα αυτό. Εξετάζουμε τις μέσες τιμές για τα επίπεδα του συγκεκριμένου παράγοντα για να προσδιορίσουμε ποια ομάδα είναι σημαντικά υψηλότερη από τις υπόλοιπες (π.χ. χρησιμοποιώντας τη multcompare). Η ερμηνεία των αλληλεπιδράσεων είναι περισσότερο πολύπλοκη: Για παράδειγμα, εάν p>0.05 για την αλληλεπίδραση BC, δηλαδή η συγκεκριμένη αλληλεπίδραση δεν είναι σημαντική, τότε το συμπέρασμά μας είναι ότι ο οι διαφορές του παράγοντα B στα αποτελέσματα της εξαρτημένης μεταβλητής δεν εξαρτώνται από το επίπεδο του παράγοντα C (δηλαδή οι ίδιες διαφορές που οφείλονται στον παράγοντα B παρατηρούνται για τα επίπεδα του παράγοντα C).

79 4. N-way ANOVA Παραδοχές για την εφαρμογή της N-way ANOVA Ανεξαρτησία
Οι παρατηρήσεις είναι ανεξάρτητες (δηλαδή δεν υπάρχει σχέση ούτε μεταξύ των παρατηρήσεων των διαφόρων ομάδων ούτε μεταξύ των παρατηρήσεων εντός κάθε ομάδας). Κανονικότητα Οι παρατηρήσεις εντός κάθε κελιού ακολουθούν κανονική κατανομή. Ισότητα διασπορών Οι παρατηρήσεις εντός κάθε κελιού έχουν ίσες διασπορές.

80 4. N-way ANOVA Μηδενικές υποθέσεις της N-way ANOVA
Οι μέσες τιμές των παρατηρήσεων που ομαδοποιούνται από κάθε παράγοντα είναι ίσες. Δεν υπάρχει αλληλεπίδραση μεταξύ κάθε δυνατού συνδυασμού παραγόντων. Matlab Το Statistics Toolbox διαθέτει την ακόλουθη συνάρτηση για την πραγματοποίηση της N-way ANOVA. Συνάρτηση Matlab Έλεγχος υποθέσεων anovan Η N-way ανάλυση διασποράς (ANOVA)

81 4. N-way ANOVA Η συνάρτηση anovan
Πραγματοποιεί την N-way ANOVA. Η συνάρτηση επιστρέφει την p-τιμή για τις μηδενικές υποθέσεις υπό έλεγχο. [p,table,stats]= anovan(X,group,‘model',modeltype) Περιγραφή Τιμές Εξορισμού X διάνυσμα που περιέχει παρατηρήσεις group Αντιστοιχεί τους παράγοντες και τα επίπεδα παραγόντων στις παρατηρήσεις του X. Καθένα από τα N κελιά στην ομάδα περιέχει μια λίστα επιπέδων ενός παράγοντα που προσδιορίζει τις παρατηρήσεις του X ως προς έναν από τους N παράγοντες. Η λίστα εντός κάθε κελιού μπορεί να είναι ένα διάνυσμα, πίνακας χαρακτήρων ή πίνακας κελιών από strings και πρέπει να έχει τον ίδιο αριθμό στοιχείων όπως το X. modeltype προσδιορίζει τον τύπο του μοντέλου που η συνάρτηση χρησιμοποιεί ‘Linear’ p οι p-τιμές για τις μηδενικές υποθέσεις table ο πίνακας ANOVA stats δομή που χρησιμοποιείται για την εκτέλεση ενός επακόλουθου ελέγχου πολλαπλής σύγκρισης (συνάρτηση multcompare)

82 4. N-way ANOVA Η συνάρτηση anovan (συν.)
Το όρισμα modeltype μπορεί να είναι οποιοδήποτε από τα ακόλουθα: 'linear' : Υπολογισμός μόνο των p-τιμών για τις μηδενικές υποθέσεις των N κυρίων επιδράσεων. 'interaction' : Υπολογισμός των p-τιμών για τις μηδενικές υποθέσεις των N κυρίων επιδράσεων και των αλληλεπιδράσεων δύο παραγόντων. 'full’ : Υπολογισμός των p-τιμών για τις μηδενικές υποθέσεις των N κυρίων επιδράσεων και των αλληλεπιδράσεων όλων των επιπέδων. An integer (π.χ. k): Υπολογισμός όλων των επιπέδων των αλληλεπιδράσεων μέχρι το k-οστό επίπεδο. Ένας πίνακας με ορισμούς όρων (όλες οι είσοδοι του πίνακα πρέπει να είναι 0 ή 1).

83 4. N-way ANOVA Η συνάρτηση anovan (συν.)
Εάν η p-τιμή είναι μικρότερη του επιπέδου σημαντικότητας a, αυτό εγείρει αμφιβολίες για την ισχύ της σχετικής μηδενικής υποθέσεως. Για παράδειγμα, μία p-τιμή για την H0A μικρότερη του a δηλώνει ότι τουλάχιστον μία δειγματική μέση τιμή είναι σημαντικά διαφορετική από τις υπόλοιπες δειγματικές μέσες τιμές για τον παράγοντα A, δηλαδή υπάρχει μια κύρια επίδραση λόγω του παράγοντα A. Για παράδειγμα, μία p-τιμή για την H0AB μικρότερη του a δηλώνει ότι υπάρχει αλληλεπίδραση μεταξύ των παραγόντων A και B. Συνήθως ένα αποτέλεσμα είναι σημαντικό εάν η p-τιμή είναι μικρότερη από 0.05 ή 0.01.

84 4. N-way ANOVA Η συνάρτηση anovan (συν.)
Η πρώτη παρουσιάζει την πηγή της μεταβλητότητας. Η δεύτερη παρουσιάζει το άθροισμα τετραγώνων (SS) που οφείλεται σε κάθε πηγή. Η τρίτη παρουσιάζει τους βαθμούς ελευθερίας (df) που σχετίζεται με κάθε πηγή. Η τέταρτη παρουσιάζει τα μέσα τετράγωνα (MS) για κάθε πηγή, που είναι ο λόγος SS/df. Η πέμπτη παρουσιάζει την F στατιστική, που είναι ο λόγος των MS. Η έκτη παρουσιάζει τις p-τιμές για τις F στατιστικές.


Κατέβασμα ppt "ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google