SAM Significance analysis of Microarrays ΕΦΑΡΜΟΓΗ ΣΤΗΝ ΑΝΤΙΔΡΑΣΗ ΛΕΜΦΟΒΛΑΣΤΟΕΙΔΩΝ ΚΥΤΤΑΡΩΝ ΣΕ ΑΚΤΙΝΟΒΟΛΙΑ ΙΟΝΙΣΜΟΥ
ΕΙΣΑΓΩΓΗ Οι μικροσυστοιχείες (μ/σ) μπορούν να υπολογίσουν την έκφραση χιλιάδων γονιδίων για προσδιορισμό των αλλαγών μεταξύ διαφορετικών βιολογικών παραμέτρων. Οι αλλαγές αυτές επειδή είναι πάρα πολλές είναι απαραίτητο να προσδιοριστούν ποιες απ ’ αυτές είναι σημαντικές και γι ’ αυτό το λόγο απαιτούνται κάποιες μέθοδοι για κάνουν τον προσδιορισμό αυτό. Μια μέθοδος είναι αυτή της SAM, η οποία ορίζει ένα score σε κάθε γονίδιο με βάση την αλλαγή στην έκφραση γονιδίων σε σχέση με τη σταθερή απόκλιση των επαναλαμβανόμενων μετρήσεων. Όταν τα γονίδια εχουν score μεγαλύτερο από ένα προκαθορισμένο κατώτατο όριο (threshold),το SAM για να υπολογίσει το ποσοστό των γονιδίων που προσδιορίζονται τυχαία και το ρυθμό σφάλματος, χρησιμο- ποιεί τις μεταθέσεις από τις επαναλαμβανόμενες μετρήσεις 1/2
ΕΦΑΡΜΟΓΗ Όταν η μεταγραφική αντίδραση των ανθρώπινων κυττάρων στην ακτινοβολία ιονισμού μετρήθηκε με μ/σ, το SAM προσδιόρισε 34 γονίδια που άλλαξαν τουλάχιστον τις 1.5-πτυχές τους, μ ’ ένα κατ ’ εκτίμηση ποσοστό σφάλματος 12% έναντι 60-84% των άλ- λων συμβατικών μεθόδων ανάλυσης Δημιουργήθηκαν 4 νουκλεοτιδικά γονίδια επισκευής δείχνοντας έτσι ότι υπάρχει ένα μονοπάτι επισκευής του DNA που καταστρά- φηκε από την ακτινοβολία ιονισμού 2/2
Πώς εξελίχθηκε η μέθοδος SAM Οι DNA μ/σ περιέχουν ολιγονουκλεοτίδια ή cDNA ανιχνευτές Για τη μέτρηση χιλιάδων γονιδίων σ ’ ένα μόνο πείραμα υβριδοποιή- σης. Αν και παράγεται ένας μεγάλος αριθμός δεδομένων, είναι απα- ραίτητες κάποιες μέθοδοι για τον καθορισμό, ποιες αλλαγές στην έκ- ραση γονιδίων είναι πειραματικά σημαντικές. Mέθοδοι Η cluster analysis των δεδομένων των μ/σ μπορεί να ανιχνεύσει συναφή ‘ σχέδια ’ (patterns) για έκφραση γονιδίων αλλά παρέχει λίγες πληροφορίες όσον αφορά τη στατιστική σημασία των αλλαγών. Μέθοδοι βασισμένες στις συμβατικές δοκιμές t tests, παρέχουν την πιθανότητα (Ρ) ότι μια διαφορά στην έκφραση γονιδίων προκλήθηκε τυχαία.
Αν και η Ρ=0,01 είναι σημαντική στα πλαίσια των πειραμάτων με σκοπό να αξιολογήσουν μικρούς αριθμούς γονιδίων, ένα πείρα- μα μ/σ σε 1000 γονίδια θα προσδιόριζε 100 γονίδια τυχαία. Το πρόβλημα αυτό οδήγησε στο να αναπτύχθεί μια στατιστική μέθοδος που προσαρμόστηκε συγκεκριμένα για τις μ/σ SAM Το SAM προσδιορίζει τα γονίδια με τις στατιστικά σημαντικές αλ- λαγές στην έκφραση με την αφομοίωση ενός συνόλου ‘ γονίδιο- συ- γκεκριμένα t tests ’. Σε κάθε γονίδιο ορίζεται ένα score με βάση την αλλαγή του στην έκφραση γονιδίων σχετικά με τη σταθερή από- κλιση των επαναλαμβανόμενων μετρήσεων για το συγκεκριμένο γο- νίδιο. Τα γονίδια με score μεγαλύτερο από το προκαθορισμένο κα- τώτατο όριο, κρίνονται ενδεχομένως σημαντικά. Το ποσοστό τέτοιων γονιδίων που προσδιορίζονται κατά τύχη είναι το ψεύτικο ποσοστό ανακαλύψεων ή ρυθμός σφάλματος.(False Discovery Rate- FDR).
Για να υπολογιστεί το FDR, τα nonsense γονίδια προσδιορίζο- νται με την ανάλυση των μεταθέσεων. Το προκαθορισμένο κατώ- τατο όριο μπορεί να ρυθμιστεί για να προσδιορίσει μικρά ή μεγά- λα ζεύγη γονιδίων και τα FDR υπολογίζονται για κάθε ζεύγος. Για να άποδειχθεί η χρησιμότητα του προγράμματος SAM, χρησι- μοποιήθκε για την ανάλυση ενός σημαντικού βιολογικού προβλή- ματος : την μεταγραφική αντίδραση των λεμφοβλαστοειδών κυτ- τάρων στην ακτινοβολία ιονισμού. Τα κύτταρα αυτά δέχτηκαν ακτινοβολία ιονισμού και μετά πραγμα- τοποιήθηκαν 2 υβριδοποιήσεις : με μικροσυστοιχείες και κατα Northern
Αποτελέσματα Ένα μέρος του RNA των ανθρώπινων λεμφοβλαστοειδών κυττάρων αγρίου τύπου εκτέθηκε σε μέτρια δόση ακτινοβολίας ιονισμού(5Gy) για 4h (κύτταρα I)και το υπόλοιπο δεν εκτέθηκε καθόλου(κύτταρα U. Τα δείγματα του RNA ονομάσθηκαν και χωρίστηκαν σε 2 ίσα υ- ποπολλαπλάσια για ανεξάρτητες υβριδοποιήσεις, Α και Β αντίστοιχα. Έτσι,δεδομένα για γονίδια που βρίσκονταν στις μ/σ, παρήχθη- καν από 8 υβριδοποιήσεις (U1A, U1B, U2A, U2B, I1A, I1B, I2A, I2B). Η επεξεργασία των αποτελεσμάτων των υβριδοποιήσεων έγινε στατιστικά.
Μέτρηση της έκφρασης γονιδίων με μικροσυστοιχείες Γραμμική διασπορά της έκφρασης γονιδίων. Κάθε γονίδιο στην μ/σ αντιπροσωπεύεται από ένα σημείο με συντεταγμένες το μέσο όρο της έκφρασης γονιδίων από τις 4 υβριδοποιήσεις (Χ Α ) Και το μέσο όρο της έκφρασης γονιδίων απο τις 4 άλλες υβριδο- ποιήσεις (Χ Β )
Μέτρηση της έκφρασης γονιδίων με μικροσυστοιχείες Διασπορά τετραγωνικής ρίζας της έκφρασης γονιδίων Ο μέσος όρος της έκφρασης γονιδίων από τις Α και Β υβριδο- ποιήσεις έχει σχεδιαστεί σε μια κλίμακα τετραγωνικής ρίζας για να μπορούν να εκφραστούν τα γονίδια που βρίσκονται σε χαμη- λά επίπεδα
Μέτρηση της έκφρασης γονιδίων με μικροσυστοιχείες Διασπορά τετραγωνικής ρίζας του μέσου όρου της έκφρασης γονιδίων των 4 υβριδοποιήσεων με κύτταρα μη εκτηθεμένα σε ακτινοβολία (avg X U ) και των εκτηθεμένων σε 5Gy ακτ. ιονι- σμού για 4h (avg X I ). Μερικά από τα γονίδια που αντέδρασαν στην ακτινοβολία φαίνονται με βελακια
Μέτρηση της έκφρασης γονιδίων με μικροσυστοιχείες Διασπορά των σχετικών διαφορών d(i) στην έκφραση εναντίον της gene-specific διασποράς s(i)
Για τον προσδιορισμό των ενδεχόμενων σημαντικών αλλαγών d(i)στην έκφραση χρησιμοποιήθηκε η διασπορά της παρατηρηθεί- σας σχετικής διαφοράς εναντίον της αναμενόμενης σχετικής διαφοράς d E (i)
To SAM αποδείχθηκε ανώτερο από τις υπόλοιπες μεθόδους για ανάλυση μ/σ. Συγκρίθηκε με την προσέγγιση του προσδιο- ρισμού των γονιδίων ως σημαντικά αλλαγμένα εφόσον έχει παρα- τηθεί μαι αλλαγή ρ-πτυχής ΄και η προσέγγιση αυτή έδωσε απαρά- δεκχτα υψηλό FDR 73-84%.
Η αποτυχία των μεθόδων αλλαγής πτυχής αποτυγχάνουν γιατί η πλειοψηφία των γονιδίων εκφράζεται σε χαμηλά επίπεδα όπου το αναλογικό σήμα είναι χαμηλό και κατά συνέπεια οι αλλαγές 2-fold στην έκφραση γονίδιων εμφανίζονται τυχαία για έναν μεγάλο αριθμό γονιδίων. Αντιθέτως, για τα πιο υψηλά επίπεδα έκφρασης, οι μικρότερες αλλαγές στην έκφραση γονιδίων μπορούν να είναι πραγματικές, αλλά αυτές οι αλλαγές απορρί-πτονται με τις μεθόδους foldchange. Υπάρχει και μια άλλη μέθοδος που προσδιορίζει τις αλλαγές στις πτυχές αλλά κατά ζεύγη γονιδίων (pairwise), αλλά παραμένει κατώτερη από το SAM.
Συζήτηση Το SΑΜ είναι μια μέθοδος για προσδιορισμό γονιδίων σε μ/σ με στατιστικά σημαντικά αλλαγές στην έκφραση ανεπτυγμένη σε ένα πλαίσιο πραγματικού βιολογικού πειράματος. Το SAM είχε επιτυχία στην ανάλυση των αποτελασμάτων του πει- ράματος αυτού καθώς επίσης και σε διάφορα άλλα πειράματα με ολιγονουκλεοτίδια και cDNA μ/σ. Το SAM παρέχει μια εκτίμηση του FDR για κάθε αξία της παρα- μέτρου συντονισμού. Το κατ ’ εκτίμηση FDR υπολογίζεται από τις μεταθέσεις των στοιχείων και ως εκ τούτου υποθέτει ότι όλες οι ά- κυρες υποθέσεις είναι αληθινές, επιτρέποντας τη δυνατότητα των ε- ξαρτωμένων δοκιμών. Το SAM μπορεί να προσαρμοστεί για άλλους τύπους πειραματικών δεδομένων. Για να προσδιορίσει παραδείγματος χάριν τα γονίδια των
οποίων η έκφραση συσχετίζεται με τον χρόνο επιβίωσης, με μια ποσοτική παράμετρο, όπως το στάδιο όγκων. Ένα άλλο παρά-δειγμα είναι η έκφραση γονιδίων στους όγκους πριν και μετά τη χημειοθεραπεία. Κατά συνέπεια το SAM είναι μια γερή και απλή μέθοδος που μπορεί να προσαρμοστεί σε σε μια ευρεία σειρά πειραματικών καταστάσεων.