Πειραματικές Μονάδες Ένα φυτό Ένα πειραματικό τεμάχιο (plot)
Ο Σκοπός του Πειράματος Να ελεγχθεί η επίδραση διαφορετικών «Επεμβάσεων» σε κάποιο χαρακτηριστικό (παραγωγή, βάρος, μήκος, συγκέντρωση σακχάρων, αριθμός φύλλων, κ.λ.π..) Επεμβάσεις μπορεί να είναι διαφορετικά λιπάσματα, μυκητοκτόνα, ορμόνες, θερμοκρασίες, υποστρώματα…)
Παράδειγμα Η επίδραση τριών ειδών λιπασμάτων A, B, C στην παραγωγή ντομάτας σε θερμοκήπια. ABC
Επαναλήψεις Εφαρμόζουμε την ίδια επέμβαση σε περισσότερες από μια πειραματικές μονάδες Εκτιμάμε το “Πειραματικό Σφάλμα”, αφού όλες οι επαναλήψεις δεν περιμένουμε να δώσουν το ίδιο αποτέλεσμα. AA AA A A n=6 επαναλήψεις
Παράδειγμα Μας ενδιαφέρει να μελετήσουμε την επίδραση 3 επεμβάσεων στα μήκη των φυτών Παίρνουμε 3 δείγματα (ένα για κάθε επέμβαση) και μετράμε τα μήκη ας πούμε σε 9 φυτά (επαναλήψεις) Συνήθως βρίσκουμε κάποιες διαφορές στις μέσες τιμές των δειγμάτων μας Έχουμε όμως ισχυρές ενδείξεις ότι υπάρχουν πράγματι διαφορές και στους πληθυσμούς ή οι διαφορές που βρήκαμε στα δείγματα είναι τυχαίες;
Η τιμή p Υπάρχει ένα μαγικό νούμερο που μας δίνει την πιθανότητα οι διαφορές που βρήκαμε στα δείγματα, να είναι τυχαίες! Δηλ. μας δίνει την πιθανότητα διαφορές να μην υπάρχουν στους π΄ληθυσμούς Λέγεται p-value (τιμή p) Στο SPSS, το p λέγεται SIG. (significance)
Ανάλυση Διακύμανσης (ANOVA) Η τιμή p, βρίσκεται από τον υπολογιστή και συνδέεται άμεσα με μια τιμή F που υπολογίζεται από την Ανάλυση Διακύμανσης (Analysis of Variance-ΑΝΟVA) F-distribution F P-value
H απόφαση μας FF Αν p>0.05, τότε μάλλον τα αποτελέσματα μας είναι τυχαία Οπότε δεν μπορούμε να αποδείξουμε Ότι οι πληθυσμοί διαφέρουν, δηλαδή. Οι επεμβάσεις ΔΕΝ επιδρούν στα αποτελέσματα P μεγάλο P μικρό Αν p<0.05, τότε τα αποτελέσματα μας δεν είναι τυχαία Οπότε μπορούμε να αποδείξουμε Ότι οι πληθυσμοί διαφέρουν, δηλαδή. Οι επεμβάσεις επιδρούν στα αποτελέσματα
Τρία παραδείγματα με τρία διαφορετικά δείγματα ABC Οι μέσες τιμές και στα τρία παραδείγματα Α,Β,C, για τις επεμβάσεις 1,2,3 είναι 7, 9.5 and 12 αντίστοιχα tr.1tr.2tr.3 6,759,3011,70 6,809,3011,80 6,809,4011,85 6,909,4011,90 7,009,5012,00 7,109,5012,00 7,109,5512,05 7,209,5512,10 7,309,6012,20 tr.1tr.2tr.3 5,807,509,80 6,107,7010,40 6,208,6010,50 6,609,4011,40 6,859,8011,70 7,1010,2012,40 7,5010,5013,00 8,1010,6014,50 8,3011,0014,60 tr.1tr.2tr.3 1,603,402,70 2,903,855,00 3,805,257,50 6,006,9010,10 6,909,1012,20 8,1011,2014,70 9,4014,0015,70 11,4015,2019,25 13,3016,3020,50
a b c Οι μέσες τιμές (κόκκινα) είναι Παντού και στα τρία παραδείγματα διαφορετικές. Ρωτάμε: έχουμε ισχυρή ένδειξη πως Και οι πληθυσμοί διαφέρουν;
Είναι οι μέσες τιμές των πληθυσμών ίδιες? Σε όλες τις περιπτώσεις βρήκαμε Άρα οι μέσες τιμές των δειγμάτων και στις τρεις περιπτώσεις ήταν διαφορετικές!!!!! Για την απάντηση χρειαζόμαστε την τιμή P Συνεπώς να κατασκευάσουμε το F.
O λόγος F Είναι η σύγκριση δύο ειδών μεταβλητότητας (διασποράς) 1) Between Group Variability (Treatment Variability) – μεταβλητότητα μεταξύ πληθυσμών 2) Within Group Variability (Error Variability) – μεταβλητότητα μέσα στους πληθυσμούς
Ο συνολικός μέσος όρος Στις τρείς επεμβάσεις (πληθυσμούς) έχουμε Οι μέσες τιμές παρουσιάζουν μια μεταβλητότητα γύρω από τη συνολική μέση τιμή τους που είναι
between group variability Μεταβλητότητα των μέσων τιμών (γύρω από το συνολικό μέσο όρο). Είναι ένα άθροισμα τετραγώνων SSB (sum of squares between) με k-1 βαθμούς ελευθερίας (df) MSB = SSB / k-1
Όμως μέσα σε κάθε δέιγμα υπάρχει και μια εσωτερική μεταβλητότητα Στην επέμβαση 1, οι τιμές ποικίλουν γύρω από τη μέση τιμή 7 (i.e. 6,75-7, 6,8-7, 6,9-7, 7-7, 7,1-7 ….) Στην επέμβαση 2, οι τιμές ποικίλουν γύρω από τη μέση τιμή 9.5 και Στην επέμβαση 3, οι τιμές ποικίλουν γύρω από τη μέση τιμή 12
within group variability Μεταβλητότητα μέσα σε κάθε δίγμα (διαφορές των τιμών από τη μέση τιμή τους) Είναι άθροισμα τετραγώνων SSW (sum of squares within) Με k(n-1) βαθμούς ελευθερίας MSW = SSW / k(n-1)
SS είναι “Sum of Squares ” Πάντα τετραγωνίζουμε τις διαφορές από τη μέση τιμή, γιατί αλλιώς το άθροισμα είναι 0. β.ε. Χρειάζονται για να βρούμε το μέσο άθροισμα τετραγώνων MS είναι “Mean Sum of Squares”. Διαιρούμε SS με β.ε..
Μεταβλητότητα = άθροισμα τετραγώνων Μέση μεταβλητότητα = άθροισμα τετραγώνων διαιρούμενο με β.ε.
Στο Α, η εσωτερική μεταβλητότητα είναι πολύ μικρή Στο Β, είναι πιο μεγάλη και Στο C, ακόμα πιο μεγάλη Αντίθετα επειδή οι μέσες τιμές και στα τρία παραδείγματα είναι ίδιες (7, 9.5 και 12), οι μεταβλητότητες μεταξύ πληθυσμών είναι περίπου ίδιες
Εχουμε: a) SSB=110.8SSW= 0.60 b) SSB=116.3SSW= c) SSB=108.8SSW= και a)MSB=55.4MSW= b)MSB=58.1 MSW= 1.82 c) MSB=54.4MSW= 26.02
F -λόγος σύγκριση της μεταβλητότητας μεταξύ πληθυσμών με την εσωτερική μεταβλητότητα
Ο F-λόγος Aν ο F-λόγος είναι μεγάλος, σημαίνει πως η μεταβλητότητα μεταξύ των μέσων τιμών των δειγμάτων είναι πολύ μεγάλη σε σχέση με την εσωτερική μεταβλητότητα των δειγμάτων Ο υπολογιστής χρησιμοποιεί την κατανομή F και υπολογίζει την τιμή p που αντιστοιχεί στον F- λόγο, που βρέθηκε (F-λόγος και p είναι αντιστρόφως ανάλογα!) Αν αυτό το p είναι πολύ μικρό, τότε η μεταβλητότητα που βρέθηκε μεταξύ των μέσων τιμών των δειγμάτων, δεν μπορεί να είναι τυχαία
Για τα τρία παραδείγματα: a) F = b) F = c) F = 2.09 Οι τιμές p a) p ≈ 0,0000…<< 0.05 b) p = << 0.05 c) p = 0.146> ,
Πίνακας ANOVA Για το C ο πίνακας γίνεται
Παράδειγμα 1 Η παραγωγή (σε pounds) πέντε διαφορετικών ποικιλιών πορτοκαλιών (Α,Β,C,D,E) Πήραμε 7 επαναλήψεις (πορτοκαλιές) από κάθε ποικιλία. k=5 και n=7, δηλ. είχαμε 35 πορτοκαλιές συνολικά.
Παράδειγμα 1 (δεδομένα) ABCDE
Παράδειγμα 1 (Αποτελέσματα) Άρα αφού F=3,73 και p=0,014<0,05, βλέπουμε ότι η παραγωγή διαφέρει από ποικιλία σε ποικιλία
Και μετά τι κάνουμε? Αν το p<0.05 τότε διαπιστώνουμε ότι υπάρχουν διαφορές ανάμεσα στις επεμβάσεις Αν είχαμε μόνο 2 επεμβάσεις θα λέγαμε λοιπόν ότι αυτές οι δύο δίνουν διαφορετικά αποτελέσματα Αν όμως έχουμε παραπάνω από 2, τότε πρέπει να εντοπίσουμε πιο αναλυτικά ποιες επεμβάσεις διαφέρουν από ποιες και ποιες πιθανόν να δίνουν ίδια αποτελέσματα.
Πολλαπλές Συγκρίσεις (Post Hoc Tests) Fisher’s LSD Tuckey’s HSD Scheffe Duncan …… Least Significant Difference Honest Significant Difference Βρίσκει πολλές διαφορές Πιο συντηρητικό τέστ
Κάποιες σημαντικές προϋποθέσεις 1.Τα δείγματα είναι παρμένα τυχαία (πλήρως τυχαιοποιημένος σχεδιασμός) 2.Το χαρακτηριστικό που μελετάμε ακολουθεί την κανονική κατανομή (συμμετρικό)
Άλλη μια πιο σημαντική προϋπόθεση 3.Όλες οι διακυμάνσεις μέσα στους πληθυσμούς πρέπει να είναι ίσες SPSS: Levene’s Test for Homogeneity of Variances Αν p>0.05 τότε οι διακυμάνσεις είναι ίσες
Exercise 1 In the table, the length of pea plants is presented. 5 experiments were made with the addition of different sugars. (Control = no sugar addition). 6 replications were used in each treatment. Analyze the data
Το t - test Ειδική περίπτωση της ANOVA, όταν συγκρίνουμε μόνο δύο επεμβάσεις Το t-test βασίζεται σε έναν αριθμό t και σε αυτόν αντιστοιχεί το p t 2 =F ή t=√F