Ευθυγράμμιση πολλαπλών ακολουθιών

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Καταδίωξη / Διαφυγή. Οι κανόνες • Ένας «φυγάς», ένας ή περισσότεροι «κυνηγοί» • Κινούνται πάνω σε ένα γράφημα • Στην πιο απλή περίπτωση, μία κίνηση ο.
Advertisements

Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Συνδυαστικα κυκλωματα με MSI και LSI
Παράδειγμα 2: Υπολογισμός αθροίσματος με επαναληπτική εντολή: για...από...μέχρι... με βήμα Να βρεθεί και να εκτυπωθεί το άθροισμα των άρτιων αριθμών από.
ΓΡΑΜΜΑΤΙΚΕΣ ΧΩΡΙΣ ΣΥΜΦΡΑΖΟΜΕΝΑ I
Πιθανοκρατικοί Αλγόριθμοι
Δοκιμή και σύγκριση των λογισμικών DALI, CE, MATRAS, VAST για εύρεση και υπέρθεση της 3d δομής. Εφαρμογή τους σε πρωτεΐνες από την PDB Παρουσίαση από:
ΣΤΟΙΧΕΙΑ ΨΕΥΔΟΚΩΔΙΚΑ ΒΑΣΙΚΕΣ ΔΟΜΕΣ ΒΑΣΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΩΝ
ΑΝΑΔΗΜΙΟΥΡΓΙΑ ΕΝΟΣ ΤΡΙΣΔΙΑΣΤΑΤΟΥ ΠΡΟΤΥΠΟΥ ΜΕ ΑΥΘΑΙΡΕΤΑ ΛΑΘΗ ΣΙΑΚΑΒΕΛΗ ΑΡΓΥΡΩ ΑΜ:1229.
Ανακτηση Πληροφοριασ σε νεφη Υπολογιστων
Ισορροπημένα Δένδρα TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A Μπορούμε να επιτύχουμε χρόνο εκτέλεσης για.
Δομές Αναζήτησης TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A εισαγωγή αναζήτησηεπιλογή διατεταγμένος πίνακας.
ΠΕΡΙΒΑΛΛΟΝΤΙΚΟΣ ΘΟΡΥΒΟΣ
Αλγόριθμοι και Πολυπλοκότητα
Μικροσυστοιχίες και ανάλυση δεδομένων
Φυλογενετικά δέντρα.
Αναγνώριση Προτύπων.
Κεφάλαιο 2ο Πεπερασμένα αυτόματα.
Γραφήματα & Επίπεδα Γραφήματα
Κοντινότεροι Κοινοί Πρόγονοι α βγ θ δεζ η π ν ι κλμ ρσ τ κκπ(λ,ι)=α, κκπ(τ,σ)=ν, κκπ(λ,π)=η κκπ(π,σ)=γ, κκπ(ξ,ο)=κ ξο κκπ(ι,ξ)=β, κκπ(τ,θ)=θ, κκπ(ο,μ)=α.
Δυναμική Διατήρηση Γραμμικής Διάταξης Διατηρεί μια γραμμική διάταξη δυναμικά μεταβαλλόμενης συλλογής στοιχείων. Υποστηρίζει τις λειτουργίες: Έλεγχος της.
HY 120 ΨΗΦΙΑΚΗ ΣΧΕΔΙΑΣΗ Ασυγχρονα ακολουθιακα κυκλωματα.
Εργαστήριο Δασικής Διαχειριστικής & Τηλεπισκόπησης ΠΑΡΟΥΣΙΑΣΗ ΔΥΝΑΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ Διδάσκων Δημήτριος Καραμανώλης, Επίκουρος Καθηγητής ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ.
Πτυχιακή εργασία: «Ανάπτυξη αλγορίθμου Γενετικού Προγραμματισμού (Genetic Programming) με δυνατότητα διαχείρισης δενδροειδών δομών και εφαρμογή του στην.
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Τεχνικές Προσομοίωσης Γιώργος Γιαγλής Τμήμα Διοικητικής Επιστήμης και Τεχνολογίας Οικονομικό Πανεπιστήμιο Αθηνών.
Δομές Αναζήτησης TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A Χειριζόμαστε ένα σύνολο στοιχείων όπου το κάθε.
1 Χαρακτηριστικά ενός Μ/Μ/1 συστήματος : Αφίξεις κατανεμημένες κατά Poisson Εκθετικά κατανεμημένοι χρόνοι εξυπηρέτησης Οι χρόνοι εξυπηρέτησης είναι αμοιβαία.
Ανάλυση Πολλαπλής Παλινδρόμησης
Εισαγωγή στη Βιοπληροφορική
Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2013 Διδάσκων: Δημήτριος Ι. Φωτιάδης Υπολογιστική Μοντελοποίηση στη Βιοϊατρική Τεχνολογία.
Θεωρία Γράφων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
Συντομότερες Διαδρομές
2-1 Ανάλυση Αλγορίθμων Αλγόριθμος Πεπερασμένο σύνολο εντολών που, όταν εκτελεστούν, επιτυγχάνουν κάποιο επιθυμητό αποτέλεσμα –Δεδομένα εισόδου και εξόδου.
Διάλεξη 9η: Εφαρμογή της μεθόδου Simplex στο γραμμικό προγραμματισμό κατά τη μεγιστοποίηση Μέθοδος Simplex 1.Όταν υπάρχουν μέχρι πέντε κλάδοι παραγωγής.
Χωρικοί-χρονικοί συμβιβασμοί
ΜΑΘΗΜΑ: ΣΧΕΔΙΑΣΗ ΑΛΓΟΡΙΘΜΩΝ ΔΙΔΑΣΚΩΝ: Π. ΚΑΤΣΑΡΟΣ Πέμπτη, 2 Απριλίου 2015Πέμπτη, 2 Απριλίου 2015Πέμπτη, 2 Απριλίου 2015Πέμπτη, 2 Απριλίου 2015Τμ. Πληροφορικής,
INTERACTIVE PHYSICS Χρήση για την υποστήριξη «δύσκολων σημείων» της Φυσικής του Λυκείου Καλφαγιάννης Θανάσης.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεσιακό Μοντέλο.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεσιακό Μοντέλο.
ΜΑΘΗΜΑ: ΣΧΕΔΙΑΣΗ ΑΛΓΟΡΙΘΜΩΝ ΔΙΔΑΣΚΩΝ: Π. ΚΑΤΣΑΡΟΣ Παρασκευή, 3 Απριλίου 2015Παρασκευή, 3 Απριλίου 2015Παρασκευή, 3 Απριλίου 2015Παρασκευή, 3 Απριλίου 2015Τμ.
Δομές Αναζήτησης TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A Θέλουμε να υποστηρίξουμε δύο βασικές λειτουργίες:
Λεξικό, Union – Find Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
Advanced Data Indexing (Προηγμένη ευρετηρίαση δεδομένων) Κατακερματισμός – Hashing (1 ο Μέρος)
ΚΕΦΑΛΑΙΟ Τι είναι αλγόριθμος
Πηγή: Βιοστατιστική [Β.Γ. Σταυρινός, Δ.Β. Παναγιωτάκος]
Μηχανική Μάθηση σε Συστήματα Πολλαπλών Πρακτόρων Παπαλιάς Κωνσταντίνος Τμήμα Πληροφορικής.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
Σχεδιασμός των Μεταφορών Ενότητα #6: Μοντέλα κατανομής μετακινήσεων – Distribution models. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
1 ΒΙΟΧΗΜΕΙΑ ΤΟΥ ΜΕΤΑΒΟΛΙΣΜΟΥ ΑΣΚΗΣΗ ΠΡΑΞΗΣ 10η ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΠΡΩΤΕΪΝΕΣ.
Για μτ από ατ μέχρι ττ [με_βήμα β] εντολές Τέλος_επανάληψης : περιοχή εντολών μτ : η μεταβλητή της οποίας η τιμή θα περάσει από την αρχική.
Παρουσίαση πτυχιακής εργασίας Σαλιάρη Αικατερίνη Επιβλέπων καθηγητής: Αθανάσιος Νικολαΐδης.
شیمی آلی 3.
Στοιχεία από τη θεωρία απαραίτητα για την επίλυση ασκήσεων
Δυναμικός Κατακερματισμός
Επίλυση Προβλημάτων με Αναζήτηση
Προβλήματα Ικανοποίησης Περιορισμών
Πληροφορημένη Αναζήτηση και Εξερεύνηση
Έλεγχος υποθέσεων με την χ2 «χι -τετράγωνο» κατανομή
Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας
Μορφές κατανομών Αθανάσιος Βέρδης.
מצגת " חומצות אמיניות" ערכה : מרגולין אירנה..
بنام خدا اسید های آمینه و پروتئین ها
مركبات الغذاء مركبات الغذاء الأساسية فيتامينات ومعادن
Εξωτερική Αναζήτηση Ιεραρχία Μνήμης Υπολογιστή Εξωτερική Μνήμη
Δυναμικός Κατακερματισμός
Μεταγράφημα παρουσίασης:

Ευθυγράμμιση πολλαπλών ακολουθιών

Σκοπός Ευθυγράμμισης πολλών ακολουθιών Αποκαλύπτει περιοχές πρωτεϊνών που διατηρούνται  κοινός πρόγονος. Συνέπεια του ανωτέρω  μακρινές (εξελικτικά) σχέσεις μεταξύ πρωτεϊνών εντοπίζονται ευκολότερα.

Παράδειγμα Π.χ. ακολουθίες industry interesting important Ευθυγράμμιση Αυτό δεν είναι ευθυγράμμιση (γιατί;) in-du--stry- intere-sting im-por--tant

Αλγόριθμοι ευθυγράμμισης πολλών ακολουθιών Δυναμικός προγραμματισμός Σταδιακές μέθοδοι (Progressive Methods) Επαναληπτικές μέθοδοι (Iterative Methods)

Παράδειγμα με δυναμικό προγραμματισμό

Ευθυγράμμιση πολλών ακολουθιών. Απαιτείται χρόνος Ο(2^k*n^k) για k ακολουθίες μεγέθους n Aπαιτείται χώρος O(n^k) Πχ. 5 ακολουθίες μέσου μήκους 250, απαιτείται Χώρος: 975 Gbytes Βήματα: 31Χ1012 Ενώ για 2 ακολουθίες μέσου μήκους 250, απαιτείται Χώρος: 60kbytes Βήματα:240X103 Συνεπώς χρήσιμος ο αλγόριθμος για μικρές ακολουθίες και για λίγες.

Σταδιακές μέθοδοι βέλτιστης ευθυγράμμισης (progressive methods of msa) Η μέθοδος Δυναμικού προγραμματισμού περιορίζεται σε μικρές ακολουθίες ή σε λίγες .... Σταδιακές μέθοδοι: ξεκίνα από τις κοντινότερες ακολουθίες και σταδιακά βάζε τις μακρινότερες.

Παράδειγμα σταδιακής ευθυγράμμισης Π.χ. NYLS, NKYLS, NFS, NFLS NYLS NKYLS NFS NFLS +K -L N F L /- S Y to F N K /- Y/F L /-S

Παράδειγμα σταδιακής ευθυγράμμισης Π.χ. NYLS, NKYLS, NFS, NFLS NYLS NKYLS NFS NFLS N K / - Y L S N F L /- S seqA: N _ F L S seqB: N _ F _ S seqC: N K Y L S seqD: N _ Y L S N K /- Y/F L /-S

Εμπορικά προγράμματα σταδιακής ευθυγράμμισης CLUSTALW (http://www.ebi.ac.uk/clustalw/) PILEUP

Clustal W Ευθυγράμμιση ακολουθιών (ανά δύο). Κατασκευή φυλογενετικού δέντρου, βάσει των scores. Ευθυγράμμιση βάσει φυλογενετικού δέντρου.

Πως προκύπτει το δένδρο; Συγκρίνω τις ακολουθίες ανά δύο Έστω s1,s2,s3,s4,s5 Με τον ακόλουθο πίνακα (ευθυγραμμίσεις ανά δύο) Έστω μικροί αριθμοί δηλώνουν μεγάλη ομοιότητα s1 s2 s3 s4 s5 2 6 10 9 5 8 4

Πως προκύπτει το δένδρο; Κοντινότερες s1,s2 τις ομαδοποιώ s1,s2 s3 s4 s5 5 9 8 4 3

Πως προκύπτει το δένδρο; Ομαδοποιώ τις s4,s5 s1,s2 s3 s4,s5 5 8 4

Πως προκύπτει το δένδρο; Ομαδοποιώ τις (s4,s5), s3 s1,s2 s3,(s4,s5) 5 s3, (s4,s5)

Δέντρο 1 2 3 4 5

Βαθμολόγηση ευθυγράμμισης, μέθοδος SP, βαθμολογώ ανά 2, και παίρνω το άθροισμα IN-DU-STRY- INTERESTING IM-POR-TANT IN-DU-STRY- INTERESTING Σκορ 3 INTERESTING IM-POR-TANT Σκορ 5 IN-DU-STRY- IM-POR-TANT Σκορ 7 15

Προβλήματα με την προοδευτική ευθυγράμμιση Η τελική ευθυγράμμιση εξαρτάται από τις αρχικές ευθυγραμμίσεις ζευγών Αν οι αρχικές ευθυγραμμίσεις δεν είναι καλές, θα προκύψει MSA με χαμηλό σκορ Σημαντικό ρόλο παίζουν και οι πίνακες αντικατάστασης.

Επαναληπτικές μέθοδοι ευθυγράμμισης (Iterative Methods of MSA) Διαρκής επαναευθυγράμμιση υποσυνόλων των ακολουθιών Στόχος: Βελτίωση του συνολικού σκορ ευθυγράμμισης Μέθοδος: Γενετικοί αλγόριθμοι.

Γενετικοί αλγόριθμοι α’ Μηχανική μάθηση Ενισχυτική μάθηση Βασισμένος στην θεωρία της εξέλιξης. Δημιουργία πολλών δυνατών MSAs Δηλαδή Πολλές διαφορετικές θέσεις εισαγωγής κενών Πολλές διαφορετικές αντικαταστάσεις. Π.χ.

Γενετικοί αλγόριθμοι β’ Αρχικοποίηση αλγορίθμου: δημιουργία πολλών τυχαίων ευθυγραμμίσεων. Αποτιμάται κάθε μία με τη μέθοδο του αθροίσματος των διαφορών. Οι περισσότερες δεν είναι καλές. Βήμα 2: Οι μισές καλύτερες ακολουθίες πάνε στην επόμενη γενιά. Οι χειρότερες πάνε ανάλογα με την βαθμολογία τους. Υποβάλλονται σε μετάλλαξη Όλες υποβάλλονται σε επανασυνδυασμό για την επόμενη γενιά

Γενετικοί αλγόριθμοι δ’, μεταλλάξεις XXXXXXXX XXX---XXX—XX XXXXXXXX X—XXX---XXXX Δηλαδή στις μεταλλάξεις βάζω σε τυχαίες θέσεις κενά, με μικρή πιθανότητα

Γενετικοί αλγόριθμοι δ’, επανασυνδυασμός Γονέας 1 Γονέας 2 M G K V N - - V D E - G E A L - Μ Α Κ V Ν V A D – D E - G E A L M K K V G - - D H A – - G E A L - M G K V N - - V D E G E A L Μ Α Κ V Ν V A D – D E G E A L M K K V G - - - D H A G E A L Παιδί 1 Παιδί 2 M G K V - N - - V D E G E A L Μ Α Κ V Ν V A D – D E G E A L M K K V G - - - D H A G E A L M G K V N - - V D E - G E A L - Μ Α Κ V - Ν V A D – D E - G E A L M K K V - G - - D H A – - G E A L

Τοπικές Ευθυγραμμίσεις Πολλών ακολουθιών (Local msa) Μέθοδοι : Ανάλυση profiles Ανάλυση των blocks Αναζήτηση προτύπων,pattern searching (eMotif)

Profiles, γιατί; Μεγαλύτερη ακρίβεια στις ευθυγραμμίσεις Εντοπίζονται ευκολότερα άλλες ομόλογες ακολουθίες Τα α/α που έχουν χαμηλό βαθμό διατήρησης  πιθανώς περιοχές που έλκουν αντισώματα  σχεδιασμός αντιβιοτικών.

Παράδειγμα profile O πίνακας έχει 23 στήλες 20 για τα 20 αμινοξέα 1 στήλη για ένα άγνωστο αμινοξύ z 2 στήλες για εισαγωγή κενού και ποινή προέκτασης του.

Παράδειγμα profile Υπάρχει μία γραμμή για κάθε στήλη της msa. Οι τιμές κάθε γραμμής δείχνουν τον αριθμό εμφάνισης κάθε αμινοξέως στις ακολουθίες. Για παράδειγμα στην πρώτη γραμμή τα αμινοξέα I,T,V παρουσιάστηκαν με το I να έχει την πλειοψηφία εμφανίσεων. Αν θέλουμε να ψάξουμε για ακολουθία μήκους π.χ. 100, και έχω profile 10, χρησιμοποιώ παράθυρο. Η μεγαλύτερη θετική τιμή κάθε στήλης είναι η στήλη που αντιστοιχεί στο αμινοξύ της consensus ακολουθίας Υπάρχουν δύο μέθοδοι κατασκευής profile: Average και Evolutionary

Μέθοδος κατασκευής Average Π.χ. Αν στην στήλη 1 της MSA έχει 5 Ι 3 Τ 2 V  (ισοπίθανα) 0.5, 0.3, 0.2 συχνότητες Ι-Ι, Ι-Τ, Ι-V 5 0 4 (Pam250) 0.5x5+0.3x0+0.2x4=3.3

Χρήση πίνακα profile Ψάξε βάσεις δεδομένων για ακολουθίες πρωτεϊνών με το ίδιο pattern Χρησιμοποίησέ το ως πίνακα ταιριάσματος σε msa.

Ανάλυση των blocks Αντιπροσωπεύουν μια διατηρημένη περιοχή της msa. Διαφέρουν από τα profiles στο ότι δεν έχουν κενά παρά μόνο θέσεις που ταυτίζονται ή που δεν ταυτίζονται. Blocks μπορούν να εξαχθούν από μια Ευθυγράμμιση Πολλών ακολουθιών(msa) χρησιμοποιώντας τον αλγόριθμο BLOCKS

Blocks Blocks database: www.blocks.fhcrc.org Προέρχονται από την βάση interpro

Αναζήτηση προτύπων(eMOTIF) Έχουν βρεθεί από τις βάσεις Δεδομένων BLOCKS και HSSP σετ ομάδων αντικατάστασης αμινοξέων για κάθε στήλη Ευθυγραμμίσων Πολλών Ακολουθιών. Στο msa μιας ομάδας πρωτεϊνών, εξετάζεται κάθε στήλη για να δούμε αν αυτά τα σετ που έχουν βρεθεί βρίσκονται στη στήλη της ευθυγράμμισης. Ακολουθεί παράδειγμα :

Αναζήτηση προτύπων (eMOTIF) Δύο ομάδες, βάσει R/L στην 4η θέση, και Y στο τέλος Στήλη 1, έχουμε την ομάδα Μ γιατί το Μ υπάρχει πάντα στη στήλη. Στήλη 2, το Y και το F του σετ FYW βρέθηκε σε αυτή τη στήλη άρα το σετ FYW χρησιμοποιείται για αυτή τη στήλη κ.ο.κ FWY: aromatic group

eMOTIF P(motif)=p(M)x[p(F)+p(W)+p(y)]x[p(k)+p(r)) P(i), συχνότητες των αμινοξέων στην SwissProt Εκτίμηση της ποιότητας του motif eMOTIF δημιουργεί πολλά motifs Επιλέγουμε τα πλέον ευαίσθητα (p(motif)) Δηλαδή αυτά που βρίσκουν πολλές ακολουθίες. Identify: βάση motifs dna.stanford.edu/emotif

Hidden Markov Models α HMM στατιστικό μοντέλο για ευθυγράμμιση ακολουθιών. Αρχικοποίηση μοντέλο κατασκευάζεται με εκτιμήσεις για τις ακολουθίες που έχουμε Στη συνέχεια «εκπαίδευση» του μοντέλου με 20-100 ακολουθίες Χρήση μοντέλου Παραγωγή της καλύτερης MSA Έρευνα για εύρεση παρόμοιων ακολουθιών

Hidden Markov Models β Πρακτικά Το ίδιο καλή (ως προς MSA) με άλλες μεθόδους. Βάσεις σε θεωρία πιθανοτήτων Δεν απαιτείται ειδική διάταξη των ακολουθιών που ευθυγραμμίζουμε Sequence Alignment and Modeling System (SAM) http://www.cse.ucsc.edu/research/compbio/sam.html

Hidden Markov Models γ Είσοδος: Ο χρήστης παρέχει την πρωτεΐνη στόχο ή ένα καλό MSA Έξοδος: το μοντέλο O ρόμβος αντιστοιχεί στη εισαγωγή αμινοξέως/βάσης, ο κύκλος στην διαγραφή αμινοξέως/βάσης το τετράγωνο στο ταίριασμα

Hidden Markov Models δ

Hidden Markov Models P(TAC)=0.7*0.5*0.7*0.4*0.7*0.4*0.9=0.025

Ηidden markov models P(TAC)=0.025 Μετατροπή της πιθανότητας σε log odds (δες αποτέλεσμα σε επόμενη διαφάνεια Για κάθε βάση ισχύει log2 (p(βάσης) /(1/αριθμό βάσεων), π.χ. Για το πρώτο τετράγωνο για Α, -1.32=log2(0.1/0.25) Για τις μεταβάσεις log2(p(μετάβασης)/(1/αριθμό μεταβάσεων), π.χ. Για την πρώτη μετάβαση -1.72=log2(0.7/0.333) Αρα το log odds score για την ακολουθία TAC είναι: >1.09+1+1.09+0.68+1.09+0.68+0.85=6.4800 Ίδια λογική και με το score ευθυγράμμισης πρωτεϊνών

Hidden markov model with log odd scores

Συμπεράσματα από τη χρήση ευθυγραμμίσεων για πρόβλεψη δομής Οι Thierodoxines είναι ένζυμα, (η εικόνα είναι από το E.coli).

Συμπεράσματα από τη χρήση ευθυγραμμίσεων για τη δομή β’ Οι περισσότερο διατηρημένες περιοχές αντιστοιχούν στην ενεργό περιοχή. H «γέφυρα» στις περιοχές 32 και 35 του E.coli. Περιοχές με πολλές εισαγωγές και διαγραφές αντιστοιχούν σε surface loops. Περιοχές με διατήρηση Gly ή Pro αντιστοιχούν σε “turn” Turns 9,20,60,95 Διατηρημένη περιοχή με υδρόφοβα α/α υποδεικνύει έλικα (40-49)

Χρωματισμός/ομαδοποίηση Αμινοξέων Χρώμα Τύπος Αμινοξέα Κίτρινο Μικρά μη πολικά Gly (G), Ala (A), Ser (S), Thr (T) Πράσινο Υδρόφοβα Cys (C), Val (V), Ile (I), Leu (L), Pro (P), Phe (F), Tyr (Y), Met (M), Trp (W) Ιώδες Πολωμένα Asn (N) , Gln (Q), His (H) Κόκκινο Αρνητικό φορτίο Asp (D) , Glu (E) Μπλέ Θετικό φορτίο Lys (K), Arg (R)