Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Φυλογενετικά δέντρα. Φυλογενετική ανάλυση, γιατί;  έχω οικογένεια πρωτεϊνών/ή α/α Πως προέκυψε εξελικτικά;  Οι ακολουθίες τοποθετούνται στο χαμηλότερο.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Φυλογενετικά δέντρα. Φυλογενετική ανάλυση, γιατί;  έχω οικογένεια πρωτεϊνών/ή α/α Πως προέκυψε εξελικτικά;  Οι ακολουθίες τοποθετούνται στο χαμηλότερο."— Μεταγράφημα παρουσίασης:

1 Φυλογενετικά δέντρα

2 Φυλογενετική ανάλυση, γιατί;  έχω οικογένεια πρωτεϊνών/ή α/α Πως προέκυψε εξελικτικά;  Οι ακολουθίες τοποθετούνται στο χαμηλότερο επίπεδο του δέντρου  Οι εσωτερικοί κόμβοι απεικονίζουν το βαθμό συσχέτισης των ακολουθιών  Δύο σχετιζόμενες ακολουθίες θα βρίσκονται σε κοντινά κλαδιά  Φυλογενετική ανάλυση  εύρεση κατασκευή του δένδρου & εύρεση βαρών συσχετίσεων

3 Φυλογενετική ανάλυση, πως χρησιμοποιείται  σε οικογένεια γονιδίων, ποια έχουν παρόμοια δράση; Στη συνέχεια ελέγχονται με πειραματικές μεθόδους.  Χρήση για παρακολούθηση αλλαγών σε ένα είδος που αλλάζει ταχύτατα (π.χ. Ιος) Εφαρμογή στην επιδημιολογία  Μεγάλη συνάφεια με μεθόδους ευθυγράμμισης ακολουθιών

4 Σχέση γονιδιώματος και φυλογενετική πρόβλεψη  Το γονιδίωμα προέρχεται Από κάθετη μεταφορά γενετικού υλικού (αναμένεται) Οριζόντια μεταφορά μεταξύ ειδών (λόγω ιού, συμβίωσης κτλ.)  Αρχική υπόθεση (Woese, 1987) Με tRNA Αρχικά η ζωή διαιρέθηκε στα  Αρχαία, Βακτήρια, Ευκαριωτικούς οργανισμούς  Νεώτερες έρευνες δίνουν πολυπλοκότερα δέντρα

5 Φυλογενετική ανάλυση

6 Μέθοδοι φυλογενετικής πρόβλεψης  Κάθε μέθοδος εισάγει σφάλματα  Πρέπει να γνωρίζουμε τις προϋποθέσεις κάθε μεθόδου  Πηγές προβλημάτων: Διαφορετικός ρυθμός μεταβολής στις ακολουθίες Ανάλυση μακρινών (εξελικτικά) ακολουθιών Gene duplication: δημιουργία δύο πανομοιότυπων αντιγράφων  Τα αντίγραφα έχουν διαφορετική εξελικτική πορεία

7 Το φυλογενετικό δέντρο  Γράφος  Εξελικτική σχέση μεταξύ οργανισμών  Σχέση γονιδίων μεταξύ διαφορετικών οργανισμών.  A/B κόμβος ισαπέχει από Α και Β  ίδιος ρυθμός μετάλλαξης  Μετά από κάθε κόμβο η εξέλιξη είναι ανεξάρτητη  Δεν είναι γνωστός ο χρόνος για τον πρόγονο, μόνο ο αριθμός μεταλλάξεων Sequence A Sequence B Sequence C Sequence D

8 Τρόποι κατασκευής φυλογενετικών δέντρων  Βάσει απόστασης (phenetic approach) Ιεραρχική ομαδοποίηση (hierarchical clustering)  Βάσει εξελικτικού μοντέλου (cladistic approach) Maximum parsimony (μέγιστης συντήρησης) Maximum likelihood (μέγιστη πιθανοφάνεια)

9 Ιεραρχική ομαδοποίηση, παράδειγμα α΄  Έστω οι ακολουθίες ATCC, ΑTGC, TTGC και ΤCGG  Λαμβάνουμε τις αποστάσεις για την κατασκευή δέντρου  Αρχικά πίνακας αποστάσεων: ATCCATGCTTCGTCGG ATCC 0124 ATGC 033 TTCG 02 TCGG 0

10 Ιεραρχική ομαδοποίηση, παράδειγμα β΄  Οι κοντινότερες είναι οι {ATCC, ATGC}. ATCCATGC  Ο Πίνακας γειτνίασης γίνεται (ATCC,ATGC)TTCGTCGG (ATCC,ATGC)0½ (2+3)=2.5½(4+3)=3.5 TTCG02 TCGG0 Κοντινότερες (TCGG, TTCG)

11 Ιεραρχική ομαδοποίηση, παράδειγμα γ΄ (ATCC,ATGC)(TTCG,TCGG) (ATCC,ATGC)0½ ( )=3 (TTCG,TTCG)0 Ενώνουμε τα δύο εναπομείναντα clusters

12 Ιεραρχική ομαδοποίηση, παράδειγμα γ΄ ATCCATGCTTCGTCGG To δέντρο προκύπτει ανάλογα με τη σειρά ομαδοποιήσεων Οι αριθμοί στα κλαδιά, είναι ο μέσος όρος των αποστάσεων που αντιστοιχούν στα παιδιά τους Υπόθεση, ίση απόσταση από πατέρα

13 Ιεραρχική ομαδοποίηση  Η μέθοδος είναι γνωστή ως UPGMA (Unweighted Pair Group Method with Arithmetic mean)  Χρησιμοποιείται από το πρόγραμμα CLUSTALW ως πρώτο βήμα για multiple sequence alignment.  Υπάρχει παραλλαγή, γνωστή ως Neighbour Joining που λαμβάνει υπ’όψιν διαφορετικούς ρυθμούς εξέλιξης και συνεπώς διαφοροποιεί τα βάρη στο δέντρο.

14 Ιεραρχική ομαδοποίηση  Σημαντικό ρόλο παίζουν οι αποστάσεις ανάμεσα στα clusters  dist(a, cluster) min{dist(a, cluster_members)} max{dist(a, cluster_members)} average{dist(a,cluster_members)}  Αν μεταβάλλουμε τον τρόπο μέτρησης απόστασης, μεταβάλλεται το δέντρο;

15 Cladistic Methods  Κατασκευή δέντρου, βάσει εξελικτικού μοντέλου  Γνωστότερες: maximum parsimony, maximum likelihood

16 Maximum parsimony  Φυλογενετικό δέντρο  Ελαχιστοποίηση των βημάτων για να φτάσουμε στις παρατηρούμενες ακολουθίες  Μέθοδος: Αρχικά ξεκινούμε με msa των ακολουθιών  Ποιες θέσεις είναι αντίστοιχες  Για κάθε θέση παράγεται φυλογενετικό δέντρο  Παράγει όλα τα δέντρα μέχρι να καταλήξει στο βέλτιστο (υψηλό κόστος)

17 Maximum parsimony  Κατασκευή βέλτιστου δέντρου  Βέλτιστο= ελάχιστες μεταλλάξεις  Έστω οι ATCG, ATGG, TCCA, TTCA  3 πιθανά φυλογενετικά δέντρα  ((1,2),(3,4)), ((1,3),(2,4)), ((1,4),(2,3)) ATCG 2ATGG 3TCCA 4TTCA Βάσει ευθυγράμμισης η 1 και 2 είναι κοντά, όπως και 3 και η 4

18 Cladistic Methods| maximum parsimony  Κατασκευή βέλτιστου δέντρου  Βέλτιστο= ελάχιστες μεταλλάξεις  Έστω οι ATCG, ATGG, TCCA, TTCA ATCGTTCA ATCG ATGG TCCA TTCA ATCA A  T A  G C  G T  C

19 Cladistic Methods| maximum parsimony ATCA TTCG ATCG TCCA ATGG TTCA ATCG A  T G  A A  T, T  C T  A C  G A  G G  A Δεν είναι το βέλτιστο, έχει περισσότερες μεταλλάξεις από το προηγούμενο

20 Cladistic methods/maximum likelihood  αναθέτει πιθανότητες στις μεταλλάξεις  τα βάρη των κλαδιών απεικονίζουν αυτές τις πιθανότητες  Παρόμοια μέθοδος με την maximum parsimony  Κατασκευάζονται όλα τα δέντρα  δαπανηρή υπολογιστικά  Προϋποθέτει την ύπαρξη εξελικτικού μοντέλου (Jukes-Cantor, Kimura) Δυνατότητα εύρεσης σχέσεων μεταξύ μακρινών ακολουθιών

21 Maximum parsimony aagagtgca 2agccgtgcg 3agagagcca 4agagatccg Οι περιοχές με μπλε ευνοούν κάποιο δέντρο σε σχέση με άλλο  μεταφέρουν πληροφορία  προτιμητέες

22 Maximum parsimony  Από τη θέση 5  Έχω ((1,2), (3,4))  ((1,3),(2,4))  ((1,4),(2,1))  Παρόμοια φτιάχνω δέντρα για τις άλλες θέσεις.

23 Αλγόριθμος εφαρμογής φυλογενετικών μεθόδων Επιλογή των σχετιζομένων ακολουθιών Ευθυγράμμιση των ακολουθιών (MSA) Υπάρχει σημαντική ομοιότητα; Υπάρχει αναγνωρίσιμη ομοιότητα; Μέθοδοι Μέγιστης Πιθανοφάνειας Ναι Όχι Ναι Όχι Maximum parsimony methods Ιεραρχική ομαδοποίη ση Έλεγχος δεδομένων

24 Προβλήματα με διαφορετικούς ρυθμούς εξέλιξης α’ abcd a0323 b022 c01 40 a b c d

25 Προβλήματα με διαφορετικούς ρυθμούς εξέλιξης β’  Aς υποθέσουμε ότι το είδος D αλλάζει γρήγορα, αν και η εξελικτική σχέση παραμένει η ίδια abcd a03220 b c0 40 a b c d Το οποίο δεν είναι σωστό

26 Aξιολόγηση φυλογενετικών μεθόδων  Όλες οι μέθοδοι παρουσιάζουν τέτοια προβλήματα  Πιθανή λύση για έλεγχο διαφορετικών ρυθμών εξέλιξης: Σύγκριση των ακολουθιών με μία διαφορετική (αρκετά μακρινή εξελικτικά). Παράδειγμα: αν έχουμε ακολουθίες από πρωτεύοντα, ένα μη πρωτεύων είδος θα συγκριθεί. Αν έχουμε το ίδιο βαθμό διαφοράς από την ξένη ακολουθία, τότε δεν έχουμε διαφορετικούς βαθμούς απόκλισης.

27 Υπολογιστική πολυπλοκότητα  Cladistic methods Ακριβέστερες Υπολογιστικά πολύπλοκες Μπορούν να δώσουν προσεγγιστικές απαντήσεις  Απαραίτητη η αξιολόγηση:

28 Αξιολόγηση 2  1. Σύγκριση διαφορετικών φυλογενετικών μεθόδων (έχουν κοινό υπο-δέντρο)  πιθανώς καλή πρόβλεψη  Στατιστικός έλεγχος (jackknifing/ bootstrapping)  jackknifing Επιλογή διαφορετικών υποσυνόλων από τα αρχικά δεδομένα Διαφορετικά υποσύνολα των θέσεων ευθυγράμμισης Αν όλα τα υποσύνολα  ίδιο δένδρο  αξιόπιστη μέθοδος  Bootstrapping Ίδιο με jackknifing, αλλά με πολλά αντίγραφα της ίδιας θέσης, για τη διατήρηση στατιστ. ιδιοτήτων

29 Web  Phylogeny Inference Package (PHYLIP)  phylip.html


Κατέβασμα ppt "Φυλογενετικά δέντρα. Φυλογενετική ανάλυση, γιατί;  έχω οικογένεια πρωτεϊνών/ή α/α Πως προέκυψε εξελικτικά;  Οι ακολουθίες τοποθετούνται στο χαμηλότερο."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google