Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Φυλογενετικά δέντρα.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Φυλογενετικά δέντρα."— Μεταγράφημα παρουσίασης:

1 Φυλογενετικά δέντρα

2 Φυλογενετική ανάλυση, γιατί;
έχω οικογένεια πρωτεϊνών/ή α/α Πως προέκυψε εξελικτικά; Οι ακολουθίες τοποθετούνται στο χαμηλότερο επίπεδο του δέντρου Οι εσωτερικοί κόμβοι απεικονίζουν το βαθμό συσχέτισης των ακολουθιών Δύο σχετιζόμενες ακολουθίες θα βρίσκονται σε κοντινά κλαδιά Φυλογενετική ανάλυση εύρεση κατασκευή του δένδρου & εύρεση βαρών συσχετίσεων

3 Φυλογενετική ανάλυση, πως χρησιμοποιείται
σε οικογένεια γονιδίων, ποια έχουν παρόμοια δράση; Στη συνέχεια ελέγχονται με πειραματικές μεθόδους. Χρήση για παρακολούθηση αλλαγών σε ένα είδος που αλλάζει ταχύτατα (π.χ. Ιος) Εφαρμογή στην επιδημιολογία Μεγάλη συνάφεια με μεθόδους ευθυγράμμισης ακολουθιών

4 Σχέση γονιδιώματος και φυλογενετική πρόβλεψη
Το γονιδίωμα προέρχεται Από κάθετη μεταφορά γενετικού υλικού (αναμένεται) Οριζόντια μεταφορά μεταξύ ειδών (λόγω ιού, συμβίωσης κτλ.) Αρχική υπόθεση (Woese, 1987) Με tRNA Αρχικά η ζωή διαιρέθηκε στα Αρχαία, Βακτήρια, Ευκαριωτικούς οργανισμούς Νεώτερες έρευνες δίνουν πολυπλοκότερα δέντρα

5 Φυλογενετική ανάλυση

6 Μέθοδοι φυλογενετικής πρόβλεψης
Κάθε μέθοδος εισάγει σφάλματα Πρέπει να γνωρίζουμε τις προϋποθέσεις κάθε μεθόδου Πηγές προβλημάτων: Διαφορετικός ρυθμός μεταβολής στις ακολουθίες Ανάλυση μακρινών (εξελικτικά) ακολουθιών Gene duplication: δημιουργία δύο πανομοιότυπων αντιγράφων Τα αντίγραφα έχουν διαφορετική εξελικτική πορεία

7 Το φυλογενετικό δέντρο
Γράφος Εξελικτική σχέση μεταξύ οργανισμών Σχέση γονιδίων μεταξύ διαφορετικών οργανισμών. A/B κόμβος ισαπέχει από Α και Β ίδιος ρυθμός μετάλλαξης Μετά από κάθε κόμβο η εξέλιξη είναι ανεξάρτητη Δεν είναι γνωστός ο χρόνος για τον πρόγονο, μόνο ο αριθμός μεταλλάξεων Sequence A Sequence B Sequence C Sequence D

8 Τρόποι κατασκευής φυλογενετικών δέντρων
Βάσει απόστασης (phenetic approach) Ιεραρχική ομαδοποίηση (hierarchical clustering) Βάσει εξελικτικού μοντέλου (cladistic approach) Maximum parsimony (μέγιστης συντήρησης) Maximum likelihood (μέγιστη πιθανοφάνεια)

9 Ιεραρχική ομαδοποίηση, παράδειγμα α΄
Έστω οι ακολουθίες ATCC, ΑTGC, TTGC και ΤCGG Λαμβάνουμε τις αποστάσεις για την κατασκευή δέντρου Αρχικά πίνακας αποστάσεων: ATCC ATGC TTCG TCGG 1 2 4 3

10 Ιεραρχική ομαδοποίηση, παράδειγμα β΄
Οι κοντινότερες είναι οι {ATCC, ATGC}. ATCC ATGC Ο Πίνακας γειτνίασης γίνεται (ATCC,ATGC) TTCG TCGG ½ (2+3)=2.5 ½(4+3)=3.5 2 Κοντινότερες (TCGG, TTCG)

11 Ιεραρχική ομαδοποίηση, παράδειγμα γ΄
(ATCC,ATGC) (TTCG,TCGG) ½ ( )=3 (TTCG,TTCG) Ενώνουμε τα δύο εναπομείναντα clusters

12 Ιεραρχική ομαδοποίηση, παράδειγμα γ΄
1 1 ATCC ATGC TTCG TCGG To δέντρο προκύπτει ανάλογα με τη σειρά ομαδοποιήσεων Οι αριθμοί στα κλαδιά, είναι ο μέσος όρος των αποστάσεων που αντιστοιχούν στα παιδιά τους Υπόθεση, ίση απόσταση από πατέρα

13 Ιεραρχική ομαδοποίηση
Η μέθοδος είναι γνωστή ως UPGMA (Unweighted Pair Group Method with Arithmetic mean) Χρησιμοποιείται από το πρόγραμμα CLUSTALW ως πρώτο βήμα για multiple sequence alignment. Υπάρχει παραλλαγή, γνωστή ως Neighbour Joining που λαμβάνει υπ’όψιν διαφορετικούς ρυθμούς εξέλιξης και συνεπώς διαφοροποιεί τα βάρη στο δέντρο.

14 Ιεραρχική ομαδοποίηση
Σημαντικό ρόλο παίζουν οι αποστάσεις ανάμεσα στα clusters dist(a, cluster) min{dist(a, cluster_members)} max{dist(a, cluster_members)} average{dist(a,cluster_members)} Αν μεταβάλλουμε τον τρόπο μέτρησης απόστασης, μεταβάλλεται το δέντρο;

15 Cladistic Methods Κατασκευή δέντρου, βάσει εξελικτικού μοντέλου
Γνωστότερες: maximum parsimony, maximum likelihood

16 Maximum parsimony Φυλογενετικό δέντρο
Ελαχιστοποίηση των βημάτων για να φτάσουμε στις παρατηρούμενες ακολουθίες Μέθοδος: Αρχικά ξεκινούμε με msa των ακολουθιών Ποιες θέσεις είναι αντίστοιχες Για κάθε θέση παράγεται φυλογενετικό δέντρο Παράγει όλα τα δέντρα μέχρι να καταλήξει στο βέλτιστο (υψηλό κόστος)

17 Maximum parsimony Κατασκευή βέλτιστου δέντρου
Βέλτιστο= ελάχιστες μεταλλάξεις Έστω οι ATCG, ATGG, TCCA, TTCA 3 πιθανά φυλογενετικά δέντρα ((1,2),(3,4)), ((1,3),(2,4)), ((1,4),(2,3)) 1 2 3 4 A T C G Βάσει ευθυγράμμισης η 1 και 2 είναι κοντά, όπως και 3 και η 4

18 Cladistic Methods| maximum parsimony
Κατασκευή βέλτιστου δέντρου Βέλτιστο= ελάχιστες μεταλλάξεις Έστω οι ATCG, ATGG, TCCA, TTCA ATCA A  T A  G ATCG TTCA C  G T C ATCG ATGG TCCA TTCA

19 Cladistic Methods| maximum parsimony
Δεν είναι το βέλτιστο, έχει περισσότερες μεταλλάξεις από το προηγούμενο ATCG A  T G  A ATCA TTCG T A CG G A A  G AT, TC ATCG TCCA ATGG TTCA

20 Cladistic methods/maximum likelihood
αναθέτει πιθανότητες στις μεταλλάξεις τα βάρη των κλαδιών απεικονίζουν αυτές τις πιθανότητες Παρόμοια μέθοδος με την maximum parsimony Κατασκευάζονται όλα τα δέντρα  δαπανηρή υπολογιστικά Προϋποθέτει την ύπαρξη εξελικτικού μοντέλου (Jukes-Cantor, Kimura) Δυνατότητα εύρεσης σχέσεων μεταξύ μακρινών ακολουθιών

21 Maximum parsimony 1 2 3 4 5 6 7 8 9 a g t c
Οι περιοχές με μπλε ευνοούν κάποιο δέντρο σε σχέση με άλλο  μεταφέρουν πληροφορία  προτιμητέες

22 Maximum parsimony Από τη θέση 5 Έχω ((1,2), (3,4)) ((1,3),(2,4))
((1,4),(2,1)) Παρόμοια φτιάχνω δέντρα για τις άλλες θέσεις.

23 Αλγόριθμος εφαρμογής φυλογενετικών μεθόδων
Ευθυγράμμιση των ακολουθιών (MSA) Υπάρχει σημαντική ομοιότητα; Maximum parsimony methods Επιλογή των σχετιζομένων ακολουθιών Ναι Όχι Υπάρχει αναγνωρίσιμη ομοιότητα; Ναι Ιεραρχική ομαδοποίηση Όχι Μέθοδοι Μέγιστης Πιθανοφάνειας Έλεγχος δεδομένων

24 Προβλήματα με διαφορετικούς ρυθμούς εξέλιξης α’
a b c d 3 2 1 4 a b c d

25 Προβλήματα με διαφορετικούς ρυθμούς εξέλιξης β’
Aς υποθέσουμε ότι το είδος D αλλάζει γρήγορα, αν και η εξελικτική σχέση παραμένει η ίδια a b c d 3 2 20 4 Το οποίο δεν είναι σωστό a b c d

26 Aξιολόγηση φυλογενετικών μεθόδων
Όλες οι μέθοδοι παρουσιάζουν τέτοια προβλήματα Πιθανή λύση για έλεγχο διαφορετικών ρυθμών εξέλιξης: Σύγκριση των ακολουθιών με μία διαφορετική (αρκετά μακρινή εξελικτικά). Παράδειγμα: αν έχουμε ακολουθίες από πρωτεύοντα, ένα μη πρωτεύων είδος θα συγκριθεί. Αν έχουμε το ίδιο βαθμό διαφοράς από την ξένη ακολουθία, τότε δεν έχουμε διαφορετικούς βαθμούς απόκλισης.

27 Υπολογιστική πολυπλοκότητα
Cladistic methods Ακριβέστερες Υπολογιστικά πολύπλοκες Μπορούν να δώσουν προσεγγιστικές απαντήσεις Απαραίτητη η αξιολόγηση:

28 Αξιολόγηση 2 1. Σύγκριση διαφορετικών φυλογενετικών μεθόδων (έχουν κοινό υπο-δέντρο)  πιθανώς καλή πρόβλεψη Στατιστικός έλεγχος (jackknifing/ bootstrapping) jackknifing Επιλογή διαφορετικών υποσυνόλων από τα αρχικά δεδομένα Διαφορετικά υποσύνολα των θέσεων ευθυγράμμισης Αν όλα τα υποσύνολα  ίδιο δένδρο  αξιόπιστη μέθοδος Bootstrapping Ίδιο με jackknifing, αλλά με πολλά αντίγραφα της ίδιας θέσης, για τη διατήρηση στατιστ. ιδιοτήτων

29 Web Phylogeny Inference Package (PHYLIP)


Κατέβασμα ppt "Φυλογενετικά δέντρα."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google