Υπεύθυνος Μπάγκος Παντελής Επίκουρος Καθηγητής ΠΑΝΕΠΙΣΤΗΜΙΟ ΣΤΕΡΕΑΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΤΗ ΒΙΟΙΑΤΡΙΚΗ Πρόγνωση σηματοδοτικών αλληλουχιών βακτηριακών πρωτεϊνών που εκκρίνονται με το σύστημα των δίδυμων αργινινών (twin arginine – ΤΑT) Ελισάνθη Νικολάου Υπεύθυνος Μπάγκος Παντελής Επίκουρος Καθηγητής ΛΑΜΙΑ 2010
Το 1999 ο Μπλόμπελ, Γερμανός επιστήμονας πήρε το Νόμπελ γιατί κατάφερε να αποδείξει πόσο σημαντικό ρόλο διαδραματίζουν οι πρωτεΐνες σε όλες τις βιοχημικές διαδικασίες των κυττάρων. Διαπίστωσε ότι οι πρωτεΐνες περιέχουν ενδογενή σήματα, τα οποία καθορίζουν την μετακίνηση και την τοποθέτηση τους μέσα στο κύτταρο. Η μεταφορά των πρωτεϊνών στις βιολογικές μεμβράνες των μικροοργανισμών (βακτήρια, ευκάρυα, αρχαία) είναι μια θεμελιώδης διαδικασία. Σε όλες σχεδόν τις περιπτώσεις, οι πρωτεΐνες που βγαίνουν πέρα από την κυτταρική μεμβράνη έχουν στη δομή τους ένα αμινοτελικό πεπτίδιο οδηγητή. Στους ευκαριωτικούς οργανισμούς, η μεταφορά των περισσοτέρων εξωκυττάριων πρωτεϊνών που φέρουν στη δομή τους αυτό το αμινοτελικό πεπτίδιο οδηγητή, πραγματοποιείται από το γενικό σύστημα έκκριση SEC. Σε πολλά βακτήρια εκτός από την οδό Sec έχουν και την Tat οδό, όπου αυτή παρέχει την δυνατότητα διακίνησης μέσω της δίδυμης αργινίνης.
Οι διαφορές των πεπτιδίων οδηγητών στους διάφορους οργανισμούς. Το πεπτίδιο οδηγητή των Gram Positive βακτηρίων παρατηρούμε ότι στη h-περιοχή του, δηλαδή από το -20 μέχρι το -8 έχει μεγαλύτερο μήκος σε σχέση με τις αντοίστιχες h-περιοχές του Gram negative βακτηρίου και στους ευκαριωτικούς οργανισμούς. Η h- περιοχή στους προκαρυωτικούς οργανισμούς βλέπουμε να έχει περισσότερα αμινοξέα λευκίνης (L) και αλανίνης (Α). Όσον αφορά την περιοχή αποκοπής που βρίσκεται από το (-3,-1), και στα τρία είδη των μικροοργανισμών υπερισχύει η παρουσία της Αλανίνης. (Nielsen, Engelbrecht et al. 1997)
Σύστημα μεταφοράς πρωτεϊνών με πεπτίδιο οδηγητή Εσωτερική περιοχή μεμβράνης Ξεδίπλωτη πρωτεΐνη Διπλωμένη πρωτεΐνη Τα δυο συστήματα μεταφοράς των πρωτεϊνών που φέρουν το αμινοτελικό πεπτίδιο οδηγητή. Από την Sec οδός μεταφέρονται η πρωτεΐνες στην εσωτερική μεμβράνη σε ξεδιπλωμένη μορφή, ενώ από την Tat οδό σε διπλωμένη.
Σύστημα μεταφοράς πρωτεϊνών με Sec πεπτίδιο οδηγητή Περιλαμβάνει SecA σύστημα μεταφοράς (πράσινο) Πρωτεϊνικό κανάλι SecYeG (Πορτοκαλί) Βοηθητικές πρωτεΐνες Yidc & SecDF. Το πεπτίδιο οδηγητή SPase είναι το πεπτίδιο που διασπά την ακολουθία του αμινοτελικού πεπτιδίου οδηγητή από τις προπρωτεΐνες στην περιοχή του περιπλασματικού χώρου. Οι εκκριτικές πρωτεΐνες (κίτρινο) κινούνται προς την οδό SEC, αναγνωρίζοντας την από: το SecA το σωματίδιο αναγνώρισης SRP και ένα μοριακό συνοδό SECΒ Το σύστημα μεταφοράς ΤΑΤ δεν είναι ακόμη τόσο γνωστό. (Driessen and Nouwen 2008)
Εργαλεία αναγνώρισης Sec και Tat πεπτιδίου οδηγητή TATFIND1 http://signalfind.org/tatfind.html (Rose, Bruser et al. 2002) TatP 1 http://www.cbs.dtu.dk/services/TatP/ (Bendtsen, Nielsen et al. 2005) PF105181 http://pfam.sanger.ac.uk/family?acc=PF10518#tabview=tab0 TIGR014091 http://cmr.jcvi.org/cgi-bin/CMR/HmmReport.cgi?hmm_acc=TIGR01409 (Haft, Selengut et al. 2003) SignalPv32 http://www.cbs.dtu.dk/services/SignalP/ (Bendtsen, Nielsen et al. 2004) Phobius2 http://phobius.sbc.su.se/ (Kall, Krogh et al. 2004) Philius2 http://www.yeastrc.org/philius/ (Reynolds, Kall et al. 2008) RPSP2 http://rpsp.bioinfo.pl/ (Plewczynski, Tkacz et al. 2008) PrediSi2 http://www.predisi.de/ (Hiller, Grote et al. 2004) PRED-SIGNAL2 http://biophysics.biol.uoa.gr/PRED-SIGNAL/ (Bagos, Tsirigos et al. 2009) PSORTb2 http://db.psort.org/ (Gardy, Laird et al. 2005) LipoP 3 http://www.cbs.dtu.dk/services/LipoP/ (Juncker, Willenbrock et al. 2003) PRED-LIPO 3 http://biophysics.biol.uoa.gr/PRED-LIPO/ (Bagos, Tsirigos et al. 2008) 1 Εργαλεία αναγνώρισης Tat πεπτιδίου οδηγητή, 2 Εργαλεία αναγνώρισης Sec πεπτιδίου οδηγητή, 3 Εργαλεία αναγνώρισης πεπτιδίου οδηγητή στις λιποπρωτεΐνες Για την αναγνώριση του πεπτιδίου οδηγητή SEC & TAT, έχουν αναπτυχθεί πολλά εργαλεία.
SignalPv3 ΝΝ TatP ΝΝ >Q02J64 length = 68 >Q02J64 length = 68 # Measure Position Value Cutoff Tat signal peptide? max. C 34 0.776 0.51 YES max. Y 34 0.525 0.35 YES max. S 3 0.871 0.75 YES mean S 1-33 0.532 0.30 YES max. D 1-33 0.528 0.36 YES # Most likely cleavage site between pos. 33 and 34: AAA-AD περιοχή αποκοπής # Found RRHFL as Tat motif starting at pos. 2 # Used regex: RR.[FGAVML][LITMVF]// >Q02J64 length = 68 # Measure Position Value Cutoff signal peptide? max. C 34 0.167 0.32 NO max. Y 34 0.209 0.33 NO max. S 12 0.979 0.87 YES mean S 1-33 0.466 0.48 NO D 1-33 0.338 0.43 NO # Most likely cleavage site between pos. 33 and 34: AAA-AD περιοχή αποκοπής Παραδείγματα από την έξοδο χρησιμοποιώντας τα εργαλεία..
Profiles HMMs PF105181 & TIGR014091 Περιοχή με το χαρακτηριστικό μοτίβο δίδυμης αργινίνης h-περιοχή λιγότερο υδροφοβική c-περιοχή πολική μοτίβο ΑΧΑ Logo των στοιχίσεων που εκπαίδευσαν τα profiles PFAM & TIGR.
Σκοπός της εργασίας ένα αξιόπιστο σύνολο δεδομένων να δημιουργηθεί ένα καινούργιο Hidden Markov Model (HMM) για την αναγνώριση Τat και Sec πεπτιδίου οδηγητή διαθέσιμο για την ερευνητική κοινότητα
Hidden Markov Model (HMM) Δομή ένα σύνολο κρυφών καταστάσεων ένα σύνολο παρατηρούμενων συμβόλων δύο σύνολα πιθανοτήτων δύο καταστάσεις που συμβολίζουν την έναρξη και τον τερματισμό του μοντέλου Β(Begin) και Ε(End) Ρόλος αναπαραστήσουν στατιστικές παραστάσεις των πρωτεϊνικών οικογενειών που προέρχονται από τα μοντέλα πολλαπλών στοιχίσεων των ακολουθιών να χρησιμοποιηθεί για τον εντοπισμό ομόλογων πρωτεϊνών HΜMER ένα λογισμικό πακέτο, αναπτύχθηκε από τον Eddy (1998) ελεύθερα διαθέσιμο σκοπό έχει να πραγματοποιεί ανάλυση πρωτεϊνικής ακολουθίας χρησιμοποιείται για την αναζήτηση των ομόλογων πρωτεϊνικών ακολουθιών κατασκευή στοίχισης ακολουθίας πρωτεϊνών Υλοποιεί μεθόδους που χρησιμοποιούν πιθανολογίες μοντέλων που ονομάζεται "profiles hidden Markov model» (pHMMs).
Profiles Hidden Markov Models (pHMMs) Χαρακτηριστικά χρησιμοποιεί συγκεκριμένες παραμέτρους ανά θέση (πιθανότητες εκπομπής και μετάβασης) κατάλληλο για την μοντελοποίηση πρωτεϊνικών οικογενειών εύκολο στη χρήση
Οι καταστάσεις που παρατηρούνται σε ένα τέτοιο μοντέλο (εκτός αυτών της εκκίνησης και του τερματισμού) χωρίζονται σε 3 κατηγορίες: Καταστάσεις Σύμπτωσης (Match states) Mk τετράγωνα, Καταστάσεις Εισαγωγής (Insertion states) Ik ρόμβοι, Καταστάσεις Απαλοιφής (Deletion states) Dk κύκλοι. Συνδέονται με τις αντίστοιχες πιθανότητες μεταβάσεως, που συμβολίζονται με βέλη. Εικόνα 1: Σχηματική αναπαράσταση ενός τυπικού profile Hidden Markov Model.
Δεδομένα Εκπαίδευσης Δεδομένα Δοκιμής 328 ακολουθίες πρωτεϊνών με Sec πεπτίδιο οδηγητή (Nielsen, Engelbrecht et al. 1997; Nielsen, Brunak et al. 1999) 216 Gram-negative 112 Gram-positive 150 ακολουθίες πρωτεϊνών με Τat πεπτίδιο οδηγητή 119 Gram-negative 31 Gram-positive 140 ακολουθίες διαμεμβρανικών πρωτεϊνών, με την χαρακτηριστική Ν-περιοχή (Dilks, Rose et al.) 90 Gram-negative 50 Gram-positive 288 κυτταροπλασματικές πρωτεΐνες (Menne, Hermjakob et al. 2000) 183 Gram-negative 105 Gram-positive 273 ακολουθίες με το Sec πεπτίδιο οδηγητή (Menne, Hermjakob et al. 2000) 193 Gram-negative 80 Gram-positive 75 ακολουθίες με το Τat πεπτίδιο οδηγητή 18 Gram-negative 45 Gram-positive 12 αρχαία 192 ακολουθίες διαμεμβρανικών πρωτεϊνών (Gardy, Laird et al. 2005) 136 Gram-negative 56 Gram-positive 601 κυτταροπλασματικές πρωτεΐνες 407 Gram-negative 194 Gram-positive
Στοίχιση πεπτιδίου οδηγητή Tat θετικά φορτισμένη n-περιοχή ενδιάμεση περιοχή με το χαρακτηριστικό μοτίβο της δίδυμης αργινίνης RR μια h-περιοχή λιγότερο υδρόφοβη μια συνήθως μικρού μήκους πολική c-περιοχή με το χαρακτηριστικό μοτίβο πεπτίδιο αποκοπής AXA Πίνακας 1: Ακολουθίες με Tat πεπτίδιο οδηγητή P76342 MKKNQFLKESDVTAESVFF MKRRQVLK ALGISATALSL PHAAHA Q57366 MTKLSGQELHAE LSRRAFLS YTAAVGALGLCGTSLLA QGARA P39185 MK ISRRDFIK QTAITATASVAGVTL PAGA Q9RK81 MSQTPA VSRRLLLG SAAATGALATGIGSAA PVAAA Q9RI72 MQQDGTQQDRIKQSPAPLNG MSRRGFLG GAGTLALATASGLLL PGTAHA AXA, το Α αντιπροσωπεύει Αλανίνη και το X οποιοδήποτε άλλο αμινοξί. Αναφορά στο zhang to xei kanei gia ανθρωπινα πεπτίδια
Στοίχιση πεπτιδίου οδηγητή Sec μια θετικά φορτισμένη n-περιοχή μια υδροφοβική h-περιοχή που εκτείνεται στη μεμβράνη μια συνήθως μικρού μήκους πολική c-περιοχή με το χαρακτηριστικό μοτίβο πεπτίδιο αποκοπής AXA Πίνακας 2: Ακολουθίες με Sec πεπτίδιο οδηγητή P0AEB2 MNTIFSARIMKR LALTTALCTAFI SAAHA P31716 MLKNK ILATTLSVSLLAPLANPLL ENAKA P20041 MNHRYT LLALAAAAL SAGAHA P11278 MKKR ALLLSMSVLAML YIPAGQA P31133 MTALNKK WLSGLVAGALMAV SVGTLA
Εικόνα 1: Το πάνω logo παρουσιάζεται η στοίχιση του Tat πεπτιδίου οδηγητή. Στο κάτω logo παρουσιάζεται το Sec πεπτίδιο οδηγητή. Α αλανινη λιγοτερο υδροφοβη R αργινίνη L λυσίνη Η h-περιοχή του ΤΑΤ πεπτίδιο οδηγητή είναι λιγότερο υδροφοβική λόγο της παρουσίας γλυκίνης(G) και θρεονίνης(T), σε σύγκριση με την αντίστοιχη περιοχή της SEC οδού.
Cross validation Τα αποτελέσματα που αναφέρονται για τα δεδομένα των πρωτεϊνών με Τat και Sec πεπτιδίων οδηγητών αντιστοιχούν σε μια διαδικασία cross validation 25 ακολουθιών, όπου κάθε σύνολο περιέχει έναν εξίσου ισορροπημένο αριθμό Τat πεπτιδίων οδηγητών, Sec πεπτιδίων οδηγητών, των διαμεμβρανικών πρωτεϊνών (ΤΜ) και πρωτεϊνών κυτταροπλασματικής μεμβράνης (cyto). η διαδικασία εκπαίδευσης του μοντέλου αποτελείτο από όλα τα δεδομένα μας αφαιρώντας κάθε φορά από 25 ακολουθίες, οι υπόλοιπες αποτελούσαν σύνολο εκπαίδευσης, και εκτέλεση της δοκιμής έγινε με τις 25 πρωτεΐνες του συνόλου που αφαιρούνταν κάθε φορά η τελική ακρίβεια πρόβλεψης συνοψίζει όλα τα αποτελέσματα από τις ανεξάρτητες δοκιμές Στην συνέχεια λαμβάνοντας υπόψη αν το score που πάρθηκε από το cross validation, για κάθε συγκεκριμένη πρωτεΐνη ήταν μεγαλύτερο του μηδενός τότε ανήκει όντως στο σύνολο που κάναμε την διαδικασία, αν όχι δεν ανήκει. Αυτή η διαδικασία επαναλαμβάνεται αφαιρώντας από το αρχικό σύνολο δεδομένων κάθε φορά 25 πρωτεΐνες, για όλα τα υποσύνολα στο σύνολο εκπαίδευσης
PRED-TAT Σκοπός η αναζήτηση Τat και Sec πεπτιδίων οδηγητών στο σύνολο των πρωτεϊνών Το ΗΜΜ του PRED-TAT, έχει μια δομή αρχιτεκτονικής αρκετά παρόμοια με αυτές που χρησιμοποιούνται σε άλλα εργαλεία όπως το PRED-LIPO, το CW-PRED και το PRED-SIGNAL Αποτελείται από τέσσερα διαφορετικά υπομοντέλα: το υπομοντέλο Τat το υπομοντέλο πεπτιδίων οδηγητών Sec το υπομοντέλο διαμεμβρανικών πρωτεϊνών ένα υπομοντέλο σφαιρικές πρωτεΐνες (Bagos, Nikolaou et al. 2010)
PRED-TAT VS PRED-TATHMMER Πλεονέκτημα Πιο ακριβές έχει λιγότερες παραμέτρους και μπορεί να μοντελοποίηση ακριβώς την περιοχή που θέλουμε Μειονέκτημα Θα πρέπει να σχεδιαστεί από την αρχή, με την βοήθεια ειδικού λογισμικού Πλεονέκτημα Είναι πολύ εύκολο και γρήγορο στο σχεδιασμό, χάρη στο πακέτο HMMER Μειονέκτημα Έχει πολλές παραμέτρους για κάθε θέση, λιγότερο ακριβές
Δεδομένα Εκπαίδευσης – Αποτελέσματα 1 Λόγω του ότι είχα δυο μοντέλα να συγκρίνω τα δεδομένα μου, ένα για το Sec πεπτίδιο οδηγητή και ένα για το Tat , δημιούργησα τις γραφικές παραστάσεις με τα score που πήρα για κάθε μέτρηση, σε διαφορετικά cutoff. Σύμφωνα με αποτελέσματα που πήρα από τις γραφικές, λέμε ότι σε γενικές γραμμές το ικανοποιητικό cutoff θα είναι γύρο στο μηδέν. Θα δεχόμαστε δηλαδή την πρωτεΐνη αν είναι πάνω από το μηδέν το score της στο θετικό σύνολο του Profile που χρησιμοποιήσαμε για να κάνουμε αναγνώριση. Γράφημα 1.1: Είναι η γραφική παράσταση που αντλούμε από τις ευαισθησίες και τις ειδικότητες, κάνοντας αναζήτηση το pHMM, Sec.hmm με τα δεδομένα εκπαίδευσης.
Δεδομένα Εκπαίδευσης – Αποτελέσματα 2 Γράφημα 1.2: Είναι η γραφική παράσταση που αντλούμε από τις ευαισθησίες και τις ειδικότητες, κάνοντας αναζήτηση το pHMM, Tat.hmm με τα δεδομένα εκπαίδευσης.
Δεδομένα Δοκιμής – Αποτελέσματα 3 Γράφημα 1.3: Είναι η γραφική παράσταση που αντλούμε από τις ευαισθησίες και τις ειδικότητες, κάνοντας αναζήτηση το pHMM, Signal.hmm με τα δεδομένα δοκιμής.
Δεδομένα Δοκιμής – Αποτελέσματα 4 Γράφημα 1.4: Είναι η γραφική παράσταση που αντλούμε από τις ευαισθησίες και τις ειδικότητες, κάνοντας αναζήτηση το pHMM, Tat.hmm με τα δεδομένα δοκιμής.
Δεδομένα Εκπαίδευσης – Αποτελέσματα 5 Πίνακας 3: Σύγκριση του PRED-TATHMMER (pHMM ΤΑΤ.hmm), με άλλα εργαλεία, για την εύρεση της πρωτεΐνης με το TAT πεπτίδιο οδηγητή. Method Tat SPs Sec Sps Cyto TMs MCC PRED-TAT 148/150 (98.67%) 319/328 (97.26%) 288/288 (100.00%) 140/140 0.96 PRED-TATHMMER 148/150* 312/328 (95.12%) 139/140 (99.3%) 0.93 TATFIND 134/150 (89.33%) 326/328 (99.39%) 287/288 (99.65%) 0.92 TatP 130/150 284/328 (86.59%) 283/288 (98.26%) 133/140 (95.00%) 0.73 PF10518 15/150 (10.00%) 328/328 0.29 TIGR01409 105/150 (70.00%) 327/328 (99.70%) 0.81 *Αποτελέσματα που πάρθηκαν με cross validation ανά 25 ακολουθίες. Σύγκριση του PRED-TAThmmer με άλλα εργαλεία αναγνώρισης πεπτιδίου οδηγητή.
Δεδομένα Εκπαίδευσης – Αποτελέσματα 6 Πίνακας 4: Σύγκριση του PRED-TATHMMER (pHMM SEC.hmm) με άλλα εργαλεία, για την εύρεση της πρωτεΐνης με το Sec πεπτίδιο οδηγητή. Method Sec Sps Cyto TMs MCC PRED-TAT 315/328 (96.04%) 265/288 (92.01%) 130/140 (92.86%) 0.88 PRED-TATHMMER 285/328 * (86.89%) 285/288 (98.96%) RPSP 303/328 (92.38%) 287/288 (99.65%) 116/140 (82.86%) 0.87 PrediSi 317/328 (96.65%) 280/288 (97.22%) 108/140 (77.14%) SignalPv3 (NN) 323/328 (98.48%) 117/140 (83.57%) 0.91 SignalPv3 (HMM) 325/328 (99.09%) 283/288 (98.26%) 114/140 (81.43%) Phobius 318/328 (96.95%) 281/288 (97.57%) 129/140 (92.14%) 0.93 Philius 274/288 (95.14%) 132/140 (94.29%) *Αποτελέσματα που πάρθηκαν με cross validation ανά 25 ακολουθίες.
Δεδομένα Δοκιμής – Αποτελέσματα 7 Πίνακας 5: Σύγκριση PRED-TATHMMER (pHMM ΤΑΤ.hmm,) με τα άλλα εργαλεία, για την εύρεση της πρωτεΐνης με το Tat πεπτίδιο οδηγητή. Δεδομένα δοκιμής Method Tat SPs Sec Sps Cyto TMs MCC PRED-TAT 71/75 (94.67%) 265/273 (97.07%) 596/601 (99.50%) 190/192 (98.96%) 0.89 PRED-TATHMMER 72/75 (96.00%) 259/273 (94.87%) 601/601 (100.00%) 0.88 TATFIND 60/75 (80.00%) 270/273 (98.90%) 599/601 (99.67%) 192/1192 0.85 TatP 62/75 (82.67%) 231/273 (84.62%) 594/601 (98.84%) 177/192 (92.19%) 0.61 PF10518 9/75 (12.00%) 273/273 192/192 0.34 TIGR01409 47/75 (62.67%) 272/273 (99.63%) 0.77
Δεδομένα Δοκιμής – Αποτελέσματα 8 Πίνακας 6: Σύγκριση PRED-TATHMMER (pHMM SEC.hmm), με τα άλλα εργαλεία, για την εύρεση της πρωτεΐνης με το Sec πεπτίδιο οδηγητή. Δεδομένα δοκιμής Method Sec Sps Cyto TMs MCC PRED-TAT 252/273 (92.31%) 570/601 (94.84%) 167/192 (86.98%) 0.82 PRED-TATHMMER 238/273 (87.18%) 597/601 (99.33%) 174/192 (90.62%) 0.86 RPSP 249/273 (91.21%) 601/601 (100.00%) 146/192 (76.04%) 0.83 PrediSi 260/273 (95.24%) 579/601 (96.34%) 114/192 (59.38%) 0.76 SignalPv3 (NN) 599/601 (99.67%) 150/192 (78.12%) 0.85 SignalPv3 (HMM) 264/273 (96.70%) 593/601 (98.67%) 134/192 (69.79%) Phobius 594/601 (98.84%) 154/192 (80.21%) 0.84 Philius 253/273 (92.67%) 582/601 (96.84%) 181/192 (94.27%) 0.88
Πίνακας 7:HMMER 3X3 (προτεραιότητα στο score) Predicted Tat Non-signal Signal Peptide Total 148 (98.66%) 2 (1.33%) (0.00%) 150 (100%) 1 (0.24%) 414 (96.73%) 13 (3.03%) 428 3 (0.92%) 41 (12.5%) 284 (86.59%) 328 Πίνακας 8:HMMER 3X3 (προτεραιότητα στο Tat.hmm) Predicted Tat Non-signal Signal Peptide Total 150 (100.00%) (0.00%) (100%) 1 (0.24%) 414 (96.73%) 13 (3.03%) 428 14 (4.27%) 41 (12.5%) 271 (82.62%) 328 Πίνακας 9: Συνολικά αποτελέσματα για τις 44 πρωτεΐνες που περιέχουν στο μοτίβο τους το RR, αλλά επαληθεύονται πειραματικά ότι δεν είναι πρωτεΐνες με Tat πεπτίδιο οδηγητή. Uniprot PRED-TAT TatP TatFind TIGR01409 PF10518 PRED-TATHMMER Συνολικά 39/44 (86.64%) 22/44 (50%) 44/44 (100%) 42/44 (95.45%) 37/44 (84.1%)
PRED-ΤΑΤhmmer
PRED-TAT Γράφημα : Παρουσιάζεται το αποτέλεσμα που μας δίνει η μέθοδος PRED-TAT τρέχοντας τις ακολουθίες πρωτεϊνών A9CH43, Q02J64.
Συμπεράσματα Σκοπός της εργασίας αυτής είναι να αναπτυχθεί ένα καινούργιο Hidden Markov Model (HMM) για την αναγνώριση Τat και Sec πεπτιδίων οδηγητών. Σύμφωνα με τα αποτελέσματα που πάρθηκαν από την χρήση του Tat.hmm με τα δεδομένα μας, το μοντέλο μας είναι καλύτερο. Με την χρήση του Sec.hmm, παρατηρήσαμε ότι και αυτό κάνει πάρα πολύ καλές προγνώσεις πεπτιδίων οδηγητών Sec, εντούτοις βλέπουμε να υστερεί λίγο από τα υπόλοιπα εργαλεία πρόγνωσης Το ΗΜΜ εκπαιδεύτηκε με τον συνδυασμό Gram-positive και Gram-negative βακτηριακών ακολουθιών. Δεν λάβαμε υπόψη τις αλλαγές που πρόκειται να γίνουν στο μέλλον στα δεδομένα μας ή ακόμη και τις σπάνιες περιπτώσεις που υπάρχουν (συντηρητικότητα αργινίνης). Η όλη δουλεία δημοσιεύτηκε στο περιοδικό Bioinformatics (Bagos, Nikolaou et al. 2010).
Ευχαριστώ για την προσοχή σας