Φυλογενετικά δέντρα.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Αλγόριθμοι σχεδίασης βασικών 2D σχημάτων (ευθεία)
Advertisements

Δομές Δεδομένων και Αλγόριθμοι
Πιθανοκρατικοί Αλγόριθμοι
Επίπεδα Γραφήματα : Προβλήματα και Υπολογιστική Πολυπλοκότητα TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A AA.
Θεωρία Γράφων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές
Θεωρία Γράφων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές
Μια Μπεϋζιανή Μέθοδος για την Επαγωγή Πιθανοτικών Δικτύων από Δεδομένα ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧ/ΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ B. Μεγαλοοικονόμου, Χ. Μακρής.
Εισαγωγικές Έννοιες Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
Μικροσυστοιχίες και ανάλυση δεδομένων
Αναγνώριση Προτύπων.
Γραφήματα & Επίπεδα Γραφήματα
Independent Component Analysis (ICA) Ιανουάριος 2012.
Κ. Μόδη: Γεωστατιστική και Εφαρμογές της (Κεφάλαιο 5) 1 Τυχαία συνάρτηση Μία τυχαία συνάρτηση (ΤΣ) είναι ένας κανόνας με τον οποίο σε κάθε αποτέλεσμα ζ.
Κοντινότεροι Κοινοί Πρόγονοι α βγ θ δεζ η π ν ι κλμ ρσ τ κκπ(λ,ι)=α, κκπ(τ,σ)=ν, κκπ(λ,π)=η κκπ(π,σ)=γ, κκπ(ξ,ο)=κ ξο κκπ(ι,ξ)=β, κκπ(τ,θ)=θ, κκπ(ο,μ)=α.
ΓΕΝΕΤΙΚΗ ΣΥΝΔΕΣΗ ΠΑΡΟΥΣΙΑΣΗ ΑΡΘΡΟΥ ΑΠΟ ΤΗΝ ΒΙΚΙΠΑΙΔΕΙΑ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΤΗΣ ΙΑΤΡΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ Βουλγάρογλου Γρηγόριος.
Προσεγγιστικοί Αλγόριθμοι
Πτυχιακή εργασία: «Ανάπτυξη αλγορίθμου Γενετικού Προγραμματισμού (Genetic Programming) με δυνατότητα διαχείρισης δενδροειδών δομών και εφαρμογή του στην.
ΕΥΡΕΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΕΚΤΟΠΩΝ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
ΜΑΘΗΜΑ: ΣΧΕΔΙΑΣΗ ΑΛΓΟΡΙΘΜΩΝ ΔΙΔΑΣΚΩΝ: Π. ΚΑΤΣΑΡΟΣ Δευτέρα, 12 Ιανουαρίου 2015Δευτέρα, 12 Ιανουαρίου 2015Δευτέρα, 12 Ιανουαρίου 2015Δευτέρα, 12 Ιανουαρίου.
Θεωρία Γράφων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
Βασικές Αρχές Μέτρησης
Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης
ΒΕΣ 06: Προσαρμοστικά Συστήματα στις Τηλεπικοινωνίες © 2007 Nicolas Tsapatsoulis Προσαρμοστικοί Αλγόριθμοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων: Ο αναδρομικός.
ΜΑΘΗΜΑ: ΣΧΕΔΙΑΣΗ ΑΛΓΟΡΙΘΜΩΝ ΔΙΔΑΣΚΩΝ: Π. ΚΑΤΣΑΡΟΣ Πέμπτη, 2 Απριλίου 2015Πέμπτη, 2 Απριλίου 2015Πέμπτη, 2 Απριλίου 2015Πέμπτη, 2 Απριλίου 2015Τμ. Πληροφορικής,
Τμήμα Πληροφορικής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Στέλιος Κρηνίδης, Χριστόφορος Νίκου και Ιωάννης Πήτας 3D Volume Reconstruction by Serially Acquired.
Δομές Αναζήτησης TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A Θέλουμε να υποστηρίξουμε δύο βασικές λειτουργίες:
Θεωρία Γράφων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές Κεφάλαιο 4: Συνδεσμικότητα Data Engineering Lab 1.
Θεωρία Γράφων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές
Κοινωνικοοικονομική Αξιολόγηση Επενδύσεων Διάλεξη 1η
ΚΕΦΑΛΑΙΟ 6 ΓΕΩΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ: ΣΗΜΕΙΑ
Θεωρία Γραφημάτων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων.
Θεωρία Γραφημάτων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές Ενότητα 4 Δ ΕΝΔΡΑ Σταύρος Δ. Νικολόπουλος 1.
ΕΠΛ 231 – Δομές Δεδομένων και Αλγόριθμοι13-1 Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Ο αλγόριθμος Dijkstra για εύρεση βραχυτέρων μονοπατιών.
Μαρία Λιάζη Βασίλης Ζησιμόπουλος Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστημίου Αθηνών Μαρία Λιάζη Βασίλης Ζησιμόπουλος Τμήμα Πληροφορικής και Τηλεπικοινωνιών.
Θεωρία Γράφων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές TSP, Μέτρα κεντρικότητας, Dijkstra Data Engineering Lab.
Αποδοτική Ισοστάθμιση Ασύρματων Τηλεπικοινωνιακών Διαύλων Βασισμένη σε Ομαδοποίηση Αποδοτική Ισοστάθμιση Ασύρματων Τηλεπικοινωνιακών Διαύλων Βασισμένη.
TO ΓΕΝΕΤΙΚΟ ΥΛΙΚΟ ΟΡΓΑΝΩΝΕΤΑΙ ΣΕ ΧΡΩΜΟΣΩΜΑΤΑ
Συνδεσμικότητα ΘΕΩΡΙΑ ΓΡΑΦΩΝ Εργαστήριο Τεχνολογίας & Επεξεργασίας Δεδομένων Θεωρία Γράφων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές Κεφάλαιο 4: Συνδεσμικότητα.
ΑΡΙΘΜΗΤΙΚΗ ΕΠΙΛΥΣΗ ΤΩΝ ΔΙΑΦΟΡΙΚΩΝ ΕΞΙΣΩΣΕΩΝ ΜΕ ΜΕΡΙΚΕΣ ΠΑΡΑΓΩΓΟΥΣ Ακαδημαϊκό Έτος Πέμπτη, 25 Ιουνίου η Εβδομάδα ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ.
Θεωρία Γραφημάτων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές
Μοριακή Ταξινόμηση βακτηρίων
Διάλεξη  Μέτρηση: Είναι μια διαδικασία κατά την οποία προσδίδουμε αριθμητικά δεδομένα σε κάποιο αντικείμενο, σύμφωνα με κάποια προκαθορισμένα.
Συνδετικότητα γραφήματος (graph connectivity). α β Υπάρχει μονοπάτι μεταξύ α και β; Παραδείγματα: υπολογιστές ενός δικτύου ιστοσελίδες ισοδύναμες μεταβλητές.
Απομόνωση DNA Mια πλήρης σειρά όλης της γενετικής πληροφορίας ενός ιού ή ενός κυττάρου αποτελεί το γονιδίωμα. Στα σωματικά κύτταρα ενός ευκαρυωτικού οργανισμού.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
1.4 Καθορισμός απαιτήσεων Είναι η διαδικασία κατά την οποία πρέπει να κάνουμε: ✗ τον επακριβή προσδιορισμό των δεδομένων που παρέχει το πρόβλημα ✗ την.
ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΥΡΕΤΙΚΕΣ ΜΕΘΟΔΟΥΣ Άπληστη Αναζήτηση και Αναζήτηση Α* ΣΠΥΡΟΣ ΛΥΚΟΘΑΝΑΣΗΣ, ΚΑΘΗΓΗΤΗΣ.
Ηλεκτρική Οικονομία Σταμάτης Νικολόπουλος ΑΜ: 868 ΑΣΠΑΙΤΕ, 2015.
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Προγραμματισμός έργων
ΟΜΑΔΕΣ Δημιουργία Ομάδων
Επίλυση Προβλημάτων με Αναζήτηση
ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΕΞΕΛΙΚΤΙΚΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ
Δένδρα Δένδρο είναι ένα συνεκτικό άκυκλο γράφημα. Δένδρο Δένδρο Δένδρο
Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
Άσκηση 2-Περιγραφικής Στατιστικής
Έλεγχος υποθέσεων με την χ2 «χι -τετράγωνο» κατανομή
Αναζήτηση με Αντιπαλότητα
ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΕΞΕΛΙΚΤΙΚΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ
Θεωρία & Αλγόριθμοι Γράφων Αποστάσεις
Πως φτιάχνουμε γραφική παράσταση
ΚΕΦΑΛΑΙΟ 1 Ανάλυση προβλήματος.
Εισαγωγή στα Προσαρμοστικά Συστήματα
Σκοπός Η συνοπτική παρουσίαση
Προβλήματα Μεταφοράς: Παραδείγματα και Εφαρμογές
Μεταγράφημα παρουσίασης:

Φυλογενετικά δέντρα

Φυλογενετική ανάλυση, γιατί; έχω οικογένεια πρωτεϊνών/ή α/α Πως προέκυψε εξελικτικά; Οι ακολουθίες τοποθετούνται στο χαμηλότερο επίπεδο του δέντρου Οι εσωτερικοί κόμβοι απεικονίζουν το βαθμό συσχέτισης των ακολουθιών Δύο σχετιζόμενες ακολουθίες θα βρίσκονται σε κοντινά κλαδιά Φυλογενετική ανάλυση εύρεση κατασκευή του δένδρου & εύρεση βαρών συσχετίσεων

Φυλογενετική ανάλυση, πως χρησιμοποιείται σε οικογένεια γονιδίων, ποια έχουν παρόμοια δράση; Στη συνέχεια ελέγχονται με πειραματικές μεθόδους. Χρήση για παρακολούθηση αλλαγών σε ένα είδος που αλλάζει ταχύτατα (π.χ. Ιος) Εφαρμογή στην επιδημιολογία Μεγάλη συνάφεια με μεθόδους ευθυγράμμισης ακολουθιών

Σχέση γονιδιώματος και φυλογενετική πρόβλεψη Το γονιδίωμα προέρχεται Από κάθετη μεταφορά γενετικού υλικού (αναμένεται) Οριζόντια μεταφορά μεταξύ ειδών (λόγω ιού, συμβίωσης κτλ.) Αρχική υπόθεση (Woese, 1987) Με tRNA Αρχικά η ζωή διαιρέθηκε στα Αρχαία, Βακτήρια, Ευκαριωτικούς οργανισμούς Νεώτερες έρευνες δίνουν πολυπλοκότερα δέντρα

Φυλογενετική ανάλυση

Μέθοδοι φυλογενετικής πρόβλεψης Κάθε μέθοδος εισάγει σφάλματα Πρέπει να γνωρίζουμε τις προϋποθέσεις κάθε μεθόδου Πηγές προβλημάτων: Διαφορετικός ρυθμός μεταβολής στις ακολουθίες Ανάλυση μακρινών (εξελικτικά) ακολουθιών Gene duplication: δημιουργία δύο πανομοιότυπων αντιγράφων Τα αντίγραφα έχουν διαφορετική εξελικτική πορεία

Το φυλογενετικό δέντρο Γράφος Εξελικτική σχέση μεταξύ οργανισμών Σχέση γονιδίων μεταξύ διαφορετικών οργανισμών. A/B κόμβος ισαπέχει από Α και Β ίδιος ρυθμός μετάλλαξης Μετά από κάθε κόμβο η εξέλιξη είναι ανεξάρτητη Δεν είναι γνωστός ο χρόνος για τον πρόγονο, μόνο ο αριθμός μεταλλάξεων Sequence A Sequence B Sequence C Sequence D

Τρόποι κατασκευής φυλογενετικών δέντρων Βάσει απόστασης (phenetic approach) Ιεραρχική ομαδοποίηση (hierarchical clustering) Βάσει εξελικτικού μοντέλου (cladistic approach) Maximum parsimony (μέγιστης συντήρησης) Maximum likelihood (μέγιστη πιθανοφάνεια)

Ιεραρχική ομαδοποίηση, παράδειγμα α΄ Έστω οι ακολουθίες ATCC, ΑTGC, TTGC και ΤCGG Λαμβάνουμε τις αποστάσεις για την κατασκευή δέντρου Αρχικά πίνακας αποστάσεων: ATCC ATGC TTCG TCGG 1 2 4 3

Ιεραρχική ομαδοποίηση, παράδειγμα β΄ Οι κοντινότερες είναι οι {ATCC, ATGC}. ATCC ATGC Ο Πίνακας γειτνίασης γίνεται (ATCC,ATGC) TTCG TCGG ½ (2+3)=2.5 ½(4+3)=3.5 2 Κοντινότερες (TCGG, TTCG)

Ιεραρχική ομαδοποίηση, παράδειγμα γ΄ (ATCC,ATGC) (TTCG,TCGG) ½ (2.5+3.5)=3 (TTCG,TTCG) Ενώνουμε τα δύο εναπομείναντα clusters

Ιεραρχική ομαδοποίηση, παράδειγμα γ΄ 1.5 1.5 0.5 0.5 1 1 ATCC ATGC TTCG TCGG To δέντρο προκύπτει ανάλογα με τη σειρά ομαδοποιήσεων Οι αριθμοί στα κλαδιά, είναι ο μέσος όρος των αποστάσεων που αντιστοιχούν στα παιδιά τους Υπόθεση, ίση απόσταση από πατέρα

Ιεραρχική ομαδοποίηση Η μέθοδος είναι γνωστή ως UPGMA (Unweighted Pair Group Method with Arithmetic mean) Χρησιμοποιείται από το πρόγραμμα CLUSTALW ως πρώτο βήμα για multiple sequence alignment. Υπάρχει παραλλαγή, γνωστή ως Neighbour Joining που λαμβάνει υπ’όψιν διαφορετικούς ρυθμούς εξέλιξης και συνεπώς διαφοροποιεί τα βάρη στο δέντρο.

Ιεραρχική ομαδοποίηση Σημαντικό ρόλο παίζουν οι αποστάσεις ανάμεσα στα clusters dist(a, cluster) min{dist(a, cluster_members)} max{dist(a, cluster_members)} average{dist(a,cluster_members)} Αν μεταβάλλουμε τον τρόπο μέτρησης απόστασης, μεταβάλλεται το δέντρο;

Cladistic Methods Κατασκευή δέντρου, βάσει εξελικτικού μοντέλου Γνωστότερες: maximum parsimony, maximum likelihood

Maximum parsimony Φυλογενετικό δέντρο Ελαχιστοποίηση των βημάτων για να φτάσουμε στις παρατηρούμενες ακολουθίες Μέθοδος: Αρχικά ξεκινούμε με msa των ακολουθιών Ποιες θέσεις είναι αντίστοιχες Για κάθε θέση παράγεται φυλογενετικό δέντρο Παράγει όλα τα δέντρα μέχρι να καταλήξει στο βέλτιστο (υψηλό κόστος)

Maximum parsimony Κατασκευή βέλτιστου δέντρου Βέλτιστο= ελάχιστες μεταλλάξεις Έστω οι ATCG, ATGG, TCCA, TTCA 3 πιθανά φυλογενετικά δέντρα ((1,2),(3,4)), ((1,3),(2,4)), ((1,4),(2,3)) 1 2 3 4 A T C G Βάσει ευθυγράμμισης η 1 και 2 είναι κοντά, όπως και 3 και η 4

Cladistic Methods| maximum parsimony Κατασκευή βέλτιστου δέντρου Βέλτιστο= ελάχιστες μεταλλάξεις Έστω οι ATCG, ATGG, TCCA, TTCA ATCA A  T A  G ATCG TTCA C  G T C ATCG ATGG TCCA TTCA

Cladistic Methods| maximum parsimony Δεν είναι το βέλτιστο, έχει περισσότερες μεταλλάξεις από το προηγούμενο ATCG A  T G  A ATCA TTCG T A CG G A A  G AT, TC ATCG TCCA ATGG TTCA

Cladistic methods/maximum likelihood αναθέτει πιθανότητες στις μεταλλάξεις τα βάρη των κλαδιών απεικονίζουν αυτές τις πιθανότητες Παρόμοια μέθοδος με την maximum parsimony Κατασκευάζονται όλα τα δέντρα  δαπανηρή υπολογιστικά Προϋποθέτει την ύπαρξη εξελικτικού μοντέλου (Jukes-Cantor, Kimura) Δυνατότητα εύρεσης σχέσεων μεταξύ μακρινών ακολουθιών

Maximum parsimony 1 2 3 4 5 6 7 8 9 a g t c Οι περιοχές με μπλε ευνοούν κάποιο δέντρο σε σχέση με άλλο  μεταφέρουν πληροφορία  προτιμητέες

Maximum parsimony Από τη θέση 5 Έχω ((1,2), (3,4)) ((1,3),(2,4)) ((1,4),(2,1)) Παρόμοια φτιάχνω δέντρα για τις άλλες θέσεις.

Αλγόριθμος εφαρμογής φυλογενετικών μεθόδων Ευθυγράμμιση των ακολουθιών (MSA) Υπάρχει σημαντική ομοιότητα; Maximum parsimony methods Επιλογή των σχετιζομένων ακολουθιών Ναι Όχι Υπάρχει αναγνωρίσιμη ομοιότητα; Ναι Ιεραρχική ομαδοποίηση Όχι Μέθοδοι Μέγιστης Πιθανοφάνειας Έλεγχος δεδομένων

Προβλήματα με διαφορετικούς ρυθμούς εξέλιξης α’ a b c d 3 2 1 4 a b c d

Προβλήματα με διαφορετικούς ρυθμούς εξέλιξης β’ Aς υποθέσουμε ότι το είδος D αλλάζει γρήγορα, αν και η εξελικτική σχέση παραμένει η ίδια a b c d 3 2 20 4 Το οποίο δεν είναι σωστό a b c d

Aξιολόγηση φυλογενετικών μεθόδων Όλες οι μέθοδοι παρουσιάζουν τέτοια προβλήματα Πιθανή λύση για έλεγχο διαφορετικών ρυθμών εξέλιξης: Σύγκριση των ακολουθιών με μία διαφορετική (αρκετά μακρινή εξελικτικά). Παράδειγμα: αν έχουμε ακολουθίες από πρωτεύοντα, ένα μη πρωτεύων είδος θα συγκριθεί. Αν έχουμε το ίδιο βαθμό διαφοράς από την ξένη ακολουθία, τότε δεν έχουμε διαφορετικούς βαθμούς απόκλισης.

Υπολογιστική πολυπλοκότητα Cladistic methods Ακριβέστερες Υπολογιστικά πολύπλοκες Μπορούν να δώσουν προσεγγιστικές απαντήσεις Απαραίτητη η αξιολόγηση:

Αξιολόγηση 2 1. Σύγκριση διαφορετικών φυλογενετικών μεθόδων (έχουν κοινό υπο-δέντρο)  πιθανώς καλή πρόβλεψη Στατιστικός έλεγχος (jackknifing/ bootstrapping) jackknifing Επιλογή διαφορετικών υποσυνόλων από τα αρχικά δεδομένα Διαφορετικά υποσύνολα των θέσεων ευθυγράμμισης Αν όλα τα υποσύνολα  ίδιο δένδρο  αξιόπιστη μέθοδος Bootstrapping Ίδιο με jackknifing, αλλά με πολλά αντίγραφα της ίδιας θέσης, για τη διατήρηση στατιστ. ιδιοτήτων

Web Phylogeny Inference Package (PHYLIP) http://evolution.genetics.washington.edu/phylip.html