Πειραματικές Μονάδες Ένα φυτό Ένα πειραματικό τεμάχιο (plot)
Ο Σκοπός του Πειράματος Να ελεγχθεί η επίδραση διαφορετικών «Επεμβάσεων» σε κάποιο χαρακτηριστικό (παραγωγή, βάρος, μήκος, συγκέντρωση σακχάρων, αριθμός φύλλων, κ.λ.π..) Επεμβάσεις μπορεί να είναι διαφορετικά λιπάσματα, μυκητοκτόνα, ορμόνες, θερμοκρασίες, υποστρώματα…)
Επεμβάσεις - Treatments (ΠΑΡΑΓΟΝΤΕΣ FACTORS, INDEPENDENT VARIABLES) Το χαρακτηριστικό που μελετάμε (DEPENDENT VARIABLE)
Παράδειγμα Η επίδραση τριών ειδών λιπασμάτων A, B, C στην παραγωγή ντομάτας σε θερμοκήπια. A B C
Επαναλήψεις Εφαρμόζουμε την ίδια επέμβαση σε περισσότερες από μια πειραματικές μονάδες Εκτιμάμε το “Πειραματικό Σφάλμα”, αφού όλες οι επαναλήψεις δεν περιμένουμε να δώσουν το ίδιο αποτέλεσμα. A A A A A A n=6 επαναλήψεις
Μέση Τιμή – mean (7,78 kg) 7.5 kg 6.8 kg 8 kg 8.2 kg 7.7 kg 8.5 kg Τυπική Απόκλιση (S.D.) = Πειραματικό Σφάλμα = 0,60 kg Τυπικό Σφάλμα της εκτίμησης της μέσης τιμής (S.E.) = 0,60/√6 = 0,245 kg
Παράδειγμα Μας ενδιαφέρει να μελετήσουμε την επίδραση 3 επεμβάσεων στα μήκη των φυτών Παίρνουμε 3 δείγματα (ένα για κάθε επέμβαση) και μετράμε τα μήκη ας πούμε σε 9 φυτά (επαναλήψεις) Συνήθως βρίσκουμε κάποιες διαφορές στις μέσες τιμές των δειγμάτων μας, π.χ. βρίσκουμε 10cm στην Α, 13cm στην Β και 13,5cm στην Γ. Έχουμε όμως ισχυρές ενδείξεις ότι υπάρχουν πράγματι διαφορές και στους πληθυσμούς ή οι διαφορές που βρήκαμε στα δείγματα είναι τυχαίες;
Η τιμή p Υπάρχει ένα μαγικό νούμερο που μας δίνει την πιθανότητα οι διαφορές που βρήκαμε στα δείγματα, να είναι τυχαίες! Δηλ. μας δίνει την πιθανότητα διαφορές να μην υπάρχουν στους π΄ληθυσμούς Λέγεται p-value (τιμή p) Στο SPSS, το p λέγεται SIG. (significance)
Ανάλυση Διακύμανσης (ANOVA) Η τιμή p, βρίσκεται από τον υπολογιστή και συνδέεται άμεσα με μια τιμή F που υπολογίζεται από την Ανάλυση Διακύμανσης (Analysis of Variance-ΑΝΟVA) F-distribution F P-value
H απόφαση μας F F P μεγάλο P μικρό Αν p<0.05, τότε τα αποτελέσματα αποτελέσματα μας είναι τυχαία Οπότε δεν μπορούμε να αποδείξουμε Ότι οι πληθυσμοί διαφέρουν, δηλαδή. Οι επεμβάσεις ΔΕΝ επιδρούν στα αποτελέσματα Αν p<0.05, τότε τα αποτελέσματα μας δεν είναι τυχαία Οπότε μπορούμε να αποδείξουμε Ότι οι πληθυσμοί διαφέρουν, δηλαδή. Οι επεμβάσεις επιδρούν στα αποτελέσματα
Τρία παραδείγματα με τρία διαφορετικά δείγματα tr.1 tr.2 tr.3 6,75 9,30 11,70 6,80 11,80 9,40 11,85 6,90 11,90 7,00 9,50 12,00 7,10 9,55 12,05 7,20 12,10 7,30 9,60 12,20 tr.1 tr.2 tr.3 5,80 7,50 9,80 6,10 7,70 10,40 6,20 8,60 10,50 6,60 9,40 11,40 6,85 11,70 7,10 10,20 12,40 13,00 8,10 10,60 14,50 8,30 11,00 14,60 tr.1 tr.2 tr.3 1,60 3,40 2,70 2,90 3,85 5,00 3,80 5,25 7,50 6,00 6,90 10,10 9,10 12,20 8,10 11,20 14,70 9,40 14,00 15,70 11,40 15,20 19,25 13,30 16,30 20,50 A B C Οι μέσες τιμές και στα τρία παραδείγματα Α,Β,C, για τις επεμβάσεις 1,2,3 είναι 7, 9.5 and 12 αντίστοιχα
a c b Οι μέσες τιμές (κόκκινα) είναι Παντού και στα τρία παραδείγματα διαφορετικές. Ρωτάμε: έχουμε ισχυρή ένδειξη πως Και οι πληθυσμοί διαφέρουν;
Είναι οι μέσες τιμές των πληθυσμών ίδιες? Σε όλες τις περιπτώσεις βρήκαμε Άρα οι μέσες τιμές των δειγμάτων και στις τρεις περιπτώσεις ήταν διαφορετικές!!!!! Για την απάντηση χρειαζόμαστε την τιμή P Συνεπώς να κατασκευάσουμε το F.
Οι τιμές p στα τρία παραδείγματα a) p ≈ 0,0000… << 0.05 b) p = 0.000000017 << 0.05 c) p = 0.146 > 0.05
O λόγος F Είναι η σύγκριση δύο ειδών μεταβλητότητας (διασποράς) 1) Between Group Variability (Treatment Variability) – μεταβλητότητα μεταξύ πληθυσμών 2) Within Group Variability (Error Variability) – μεταβλητότητα μέσα στους πληθυσμούς
Ο συνολικός μέσος όρος Στις τρείς επεμβάσεις (πληθυσμούς) έχουμε Οι μέσες τιμές παρουσιάζουν μια μεταβλητότητα γύρω από τη συνολική μέση τιμή τους που είναι
between group variability Μεταβλητότητα των μέσων τιμών (γύρω από το συνολικό μέσο όρο). Είναι ένα άθροισμα τετραγώνων SSB (sum of squares between) με k-1 βαθμούς ελευθερίας (df) MSB = SSB / k-1
Όμως μέσα σε κάθε δέιγμα υπάρχει και μια εσωτερική μεταβλητότητα Στην επέμβαση 1, οι τιμές ποικίλουν γύρω από τη μέση τιμή 7 (i.e. 6,75-7, 6,8-7, 6,9-7, 7-7, 7,1-7 ….) Στην επέμβαση 2, οι τιμές ποικίλουν γύρω από τη μέση τιμή 9.5 και Στην επέμβαση 3, οι τιμές ποικίλουν γύρω από τη μέση τιμή 12
within group variability Μεταβλητότητα μέσα σε κάθε δίγμα (διαφορές των τιμών από τη μέση τιμή τους) Είναι άθροισμα τετραγώνων SSW (sum of squares within) Με k(n-1) βαθμούς ελευθερίας MSW = SSW / k(n-1)
SS είναι “Sum of Squares” Πάντα τετραγωνίζουμε τις διαφορές από τη μέση τιμή, γιατί αλλιώς το άθροισμα είναι 0. β.ε. Χρειάζονται για να βρούμε το μέσο άθροισμα τετραγώνων MS είναι “Mean Sum of Squares”. Διαιρούμε SS με β.ε. .
Μεταβλητότητα = άθροισμα τετραγώνων Μέση μεταβλητότητα = άθροισμα τετραγώνων διαιρούμενο με β.ε.
Στο Α, η εσωτερική μεταβλητότητα είναι πολύ μικρή Στο Β, είναι πιο μεγάλη και Στο C, ακόμα πιο μεγάλη Αντίθετα επειδή οι μέσες τιμές και στα τρία παραδείγματα είναι ίδιες (7, 9.5 και 12), οι μεταβλητότητες μεταξύ πληθυσμών είναι περίπου ίδιες
Εχουμε: a) SSB=110.8 SSW= 0.60 b) SSB=116.3 SSW= 43.57 c) SSB=108.8 SSW=624.37 και MSB=55.4 MSW= 0.025 MSB=58.1 MSW= 1.82 c) MSB=54.4 MSW= 26.02
F -λόγος σύγκριση της μεταβλητότητας μεταξύ πληθυσμών με την εσωτερική μεταβλητότητα
Ο F-λόγος Aν ο F-λόγος είναι μεγάλος, σημαίνει πως η μεταβλητότητα μεταξύ των μέσων τιμών των δειγμάτων είναι πολύ μεγάλη σε σχέση με την εσωτερική μεταβλητότητα των δειγμάτων Ο υπολογιστής χρησιμοποιεί την κατανομή F και υπολογίζει την τιμή p που αντιστοιχεί στον F-λόγο, που βρέθηκε (F-λόγος και p είναι αντιστρόφως ανάλογα!) Αν αυτό το p είναι πολύ μικρό, τότε η μεταβλητότητα που βρέθηκε μεταξύ των μέσων τιμών των δειγμάτων, δεν μπορεί να είναι τυχαία
Για τα τρία παραδείγματα: a) F = 2227.60 b) F = 58.14 c) F = 2.09 Οι τιμές p a) p ≈ 0,0000… << 0.05 b) p = 0.000000017 << 0.05 c) p = 0.146 > 0.05 0,000000167971
Πίνακας ANOVA Για το C ο πίνακας γίνεται
Παράδειγμα 1 Η παραγωγή (σε pounds) πέντε διαφορετικών ποικιλιών πορτοκαλιών (Α,Β,C,D,E) Πήραμε 7 επαναλήψεις (πορτοκαλιές) από κάθε ποικιλία . k=5 και n=7, δηλ. είχαμε 35 πορτοκαλιές συνολικά.
Παράδειγμα 1 (δεδομένα) A B C D E 13 27 40 17 36 19 31 44 28 32 39 41 34 38 29 37 45 22 15 25 10 35 20 30
Παράδειγμα 1 (Αποτελέσματα) Άρα αφού F=3,73 και p=0,014<0,05, βλέπουμε ότι η παραγωγή διαφέρει από ποικιλία σε ποικιλία
Και μετά τι κάνουμε? Αν το p<0.05 τότε διαπιστώνουμε ότι υπάρχουν διαφορές ανάμεσα στις επεμβάσεις Αν είχαμε μόνο 2 επεμβάσεις θα λέγαμε λοιπόν ότι αυτές οι δύο δίνουν διαφορετικά αποτελέσματα Αν όμως έχουμε παραπάνω από 2, τότε πρέπει να εντοπίσουμε πιο αναλυτικά ποιες επεμβάσεις διαφέρουν από ποιες και ποιες πιθανόν να δίνουν ίδια αποτελέσματα.
Πολλαπλές Συγκρίσεις (Post Hoc Tests) Fisher’s LSD Tuckey’s HSD Scheffe Duncan …… Least Significant Difference Honest Significant Difference Βρίσκει πολλές διαφορές Πιο συντηρητικό τέστ
Κάποιες σημαντικές προϋποθέσεις Τα δείγματα είναι παρμένα τυχαία (πλήρως τυχαιοποιημένος σχεδιασμός) Το χαρακτηριστικό που μελετάμε ακολουθεί την κανονική κατανομή (συμμετρικό)
Άλλη μια πιο σημαντική προϋπόθεση Όλες οι διακυμάνσεις μέσα στους πληθυσμούς πρέπει να είναι ίσες SPSS: Levene’s Test for Homogeneity of Variances Αν p>0.05 τότε οι διακυμάνσεις είναι ίσες
Exercise 1 In the table, the length of pea plants is presented. 5 experiments were made with the addition of different sugars. (Control = no sugar addition). 6 replications were used in each treatment. Analyze the data
Το t - test Ειδική περίπτωση της ANOVA, όταν συγκρίνουμε μόνο δύο επεμβάσεις Το t-test βασίζεται σε έναν αριθμό t και σε αυτόν αντιστοιχεί το p t2=F ή t=√F