Υπεύθυνος Μπάγκος Παντελής Επίκουρος Καθηγητής

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Δομές Δεδομένων και Αλγόριθμοι
Advertisements

ΜΑΘΗΜΑΤΙΚΑ ΚΑΤΕΥΘΥΝΣΗΣ
ΤΡΟΠΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΤΩΝ ΔΡΑΣΤΗΡΙΟΤΗΤΩΝ
ΤΡΟΠΟΣ ΑΞΙΟΛΟΓΗΣΗΣ ΕΝΟΣ ΠΡΟΓΡΑΜΜΑΤΟΣ ΚΙΝΗΤΙΚΟΤΗΤΑΣ
Ανάλυση Πολλαπλής Παλινδρόμησης
ΤΡΟΠΟΣ ΑΝΑΠΤΥΞΗΣ ΤΗΣ ΙΔΕΑΣ ΤΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ  Εκπαιδευτικό Κεφάλαιο 2.2 Ορισμός των στόχων στην πράξη.
ΕΡΓΑΣΙΑ: ΛΕΙΤΟΥΡΓΙΑ ΤΟΥ ΣΚΛΗΡΟΥ ΔΙΣΚΟΥ
ΤΑΞΗ Γ ΓΥΜΝΑΣΙΟΥ Βασικές Έννοιες Επανάληψη (1).
Διαδικασία ανάπτυξης Προσδιορισμός απαιτήσεων Αρχιτεκτονικός Σχεδιασμός Λεπτομερής Σχεδιασμός Κωδικοποίηση Έλεγχος Παράδοση Συστήματος Λειτουργία - Συντήρηση.
ΠΡΟΤΥΠΑ ΜΑΘΗΣΙΑΚΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΠΑΡΟΥΣΙΑΣΗ ΚΑΙ ΔΙΔΑΚΤΙΚΑ ΟΦΕΛΗ Ενότητα 3.7 – Β’ Μέρος.
ΠΕΡΙΒΑΛΛΟΝΤΙΚΟΣ ΘΟΡΥΒΟΣ
ΕΡΓΑΛΕΙΟ ΠΑΡΑΓΩΓΗΣ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΕ WEB SITE (CONTENT MANAGEMENT TOOL)
Εισαγωγικές Έννοιες Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
DNA μικροσυστοιχίες: βήμα προς βήμα
Η ΕΚΤΕΛΕΣΗ ΠΡΟΓΡΑΜΜΑΤΟΣ ΧΡΗΣΤΗ ΑΠ’ ΤΟΝ Η/Υ ΤΟΜΕΑΣ ΤΕΧΝΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Δ.ΙΕΚ ΠΑΤΡΑΣ.
Μοντέλο Διδασκαλίας Φυσικών Επιστήμων, για την Υποχρεωτική Εκπαίδευση, στην Κατεύθυνση της Ανάπτυξης Γνώσεων και Ικανοτήτων. Π. Κουμαράς.
1 Χαρακτηριστικά ενός Μ/Μ/1 συστήματος : Αφίξεις κατανεμημένες κατά Poisson Εκθετικά κατανεμημένοι χρόνοι εξυπηρέτησης Οι χρόνοι εξυπηρέτησης είναι αμοιβαία.
ΤΟ ΓΕΝΕΤΙΚΟ ΥΛΙΚΟ ΟΡΓΑΝΩΝΕΤΑΙ ΣΕ ΧΡΩΜΟΣΩΜΑΤΑ
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
ΣΥΓΚΡΙΣΗ ΜΕΜΒΡΑΝΙΚΩΝ ΠΡΩΤΕΪΝΩΝ ΣΤΑ ΓΟΝΙΔΙΩΜΑΤΑ ΤΩΝ ΘΕΤΙΚΩΝ ΚΑΙ ΑΡΝΗΤΙΚΩΝ ΚΑΤΑ GRAM ΒΑΚΤΗΡΙΩΝ Παπανικολοπούλου, Β.Π., Τσιρίγος, Κ.Δ., Μπάγκος, Π.Γ. και.
Βασικές Αρχές Μέτρησης
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Learning to Learn: Algorithmic Inspirations from Human Problem Solving.
Στατιστική I Χειμερινό Γ. Παπαγεωργίου
ΜΕΤΑΦΡΑΣΗ Μετάφραση του m- RNA
ΠΡΩΤΕΪΝΕΣ Από: ΒΕΡΩΝΗ ΕΙΡΗΝΗ.
Δίνονται το ονοματεπώνυμο κάθε μαθητή μιας τάξης και η βαθμολογία του σε κάθε μάθημά του και θέλουμε να υπολογίσουμε το μέσο όρο της βαθμολογίας όλων των.
1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Ανακάλυψη Γνώσης από Βιολογικές Αλληλουχίες Αλεξανδρίδου Αναστασία.
TO ΓΕΝΕΤΙΚΟ ΥΛΙΚΟ ΟΡΓΑΝΩΝΕΤΑΙ ΣΕ ΧΡΩΜΟΣΩΜΑΤΑ
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΤΟΜΕΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΔΙΚΤΥΩΝ.
ΤΕΧΝΟΛΟΓΙΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΙΑΚΩΝ ΔΙΑΔΙΚΑΣΙΩΝ Mοντέλα Επιχειρησιακών Διαδικασιών Mέρος B.
Η ροή της γενετικής πληροφορίας
Αρχές επαγωγικής στατιστικής
Διάλεξη  Μέτρηση: Είναι μια διαδικασία κατά την οποία προσδίδουμε αριθμητικά δεδομένα σε κάποιο αντικείμενο, σύμφωνα με κάποια προκαθορισμένα.
ΠΑΡΑΔΕΙΓΜΑ: ΤΑ ΕΠΙΠΕΔΑ ΥΛΙΚΟΥ – ΛΟΓΙΣΜΙΚΟΥ ΣΕ ΕΝΑΝ ΥΠΟΛΟΓΙΣΤΗ.
Ποια τα χαρακτηριστικά του γενετικού κώδικα; 1.Κώδικας τριπλέτας = μια τριάδα νουκλεοτιδίων, το κωδικόνιο, κωδικοποιεί ένα αμινοξύ. Επειδή : – Αριθμός.
Μελέτη Πρωτεινών Τρούγκος Κ. Αν. Καθ. Βιοχημείας Εργ. Βιολογικής Χημείας Ιατρικής ΕΚΠΑ.
ΥΝ Ι: ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ 1 ΥΠΟΛΟΓΙΣΤΙΚΗ ΝΟΗΜΟΣΥΝΗ (Τεχνητά Νευρωνικά Δίκτυα και Γενετικοί Αλγόριθμοι) ΣΠΥΡΟΣ ΛΥΚΟΘΑΝΑΣΗΣ, ΚΑΘΗΓΗΤΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ.
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΕΠΙΒΛΕΠΟΝΤΕΣ: Καθ. ΙΩΑΝΝΗΣ ΜΠΑΚΟΥΡΟΣ Δρ. ΕΛΠΙΔΑ ΣΑΜΑΡΑ ‘‘ΣΥΓΚΡΙΣΗ ΠΡΟΓΡΑΜΜΑΤΩΝ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΗ ΝΟΤΙΟ-ΑΝΑΤΟΛΙΚΗ ΕΥΡΩΠΗ & ΣΤΑΤΙΣΤΙΚΗ.
Η ροή της γενετικής πληροφορίας. Στo DNA βρίσκονται αποθηκευμένες οι πληροφορίες που αφορούν : στον αυτοδιπλασιασμό του →εξασφαλίζοντας έτσι τη μεταβίβαση.
ΒΑΡΟΣ – ΜΑΖΑ – ΠΥΚΝΟΤΗΤΑ
Ένα εννοιολογικό πλαίσιο για τη Διδακτική της Πληροφορικής.
ΔΙΑΛΕΞΗ 11η Ποσοτική έρευνα υγείας
Ασκήσεις WEKA Δέντρα αποφάσεων.
Δραματική Τέχνη στην εκπαίδευση: Ερευνητικό Σχέδιο ΙΙ
Ανάλυση Εισόδου και Εξόδου Προσομοίωσης
Στατιστικές Υποθέσεις
Πανεπιστήμιο Θεσσαλίας Παιδαγωγικό Τμήμα Ειδικής Αγωγής
Προγραμματισμός έργων
Ασκήσεις WEKA Νευρωνικά δίκτυα.
Προσομοίωση και Μοντέλα Συστημάτων (Μέρος B)
Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης
Συστήματα CAD Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών
2ο εργαστήριο βιοπληροφορικής
Ανάπτυξη Μοντέλων Διακριτών Συστημάτων Μέρος Β
ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε.
Έξι τρόποι θέασης αντικειμένου
Έλεγχος υποθέσεων με την χ2 «χι -τετράγωνο» κατανομή
ΧΡΩΜΑΤΟΓΡΑΦΙΑ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΓΕΘΩΝ
Παράδειγμα a Έστω ότι θέλουμε να υπολογίσουμε το μήκος της λωρίδας αριστερών στροφών σε μια διασταύρωση, ωστε να περιέχει με πιθανότητα 96%, τα οχήματα.
ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Μηχανικών Πληροφορικής ΤΕ
ΠΡΟΓΝΩΣΗ GPI-ΑΓΚΥΡΟΒΟΛΗΜΕΝΩΝ ΠΡΩΤΕΪΝΩΝ
ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ Ανάπτυξη Εφαρμογών για Φορητές Συσκευές
Σύγχρονες μεθοδολογίες ανάπτυξης και διαχείρισης Πληροφοριακών Συστημάτων 2ο Κεφάλαιο.
ΑΝΑΛΥΣΗ ΚΡΙΣΙΜΟΥ ΣΥΜΒΑΝΤΟΣ
ΔΙΟΙΚΗΣΗ ΟΛΙΚΗΣ ΠΟΙΟΤΗΤΑΣ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΒΑΛΛΟΝΤΟΣ
Εννοιολογική Χαρτογράφηση
Διδάσκοντας με στόχο την κατανόηση ΄ Δρ. Μ. Λάτση – ΠΕ 70
Διδάσκοντας με στόχο την κατανόηση ΄ Δρ. Μ. Λάτση – ΠΕ 70
ΕΝΟΤΗΤΑ 5 Αναλογικά σήματα.
Μεταγράφημα παρουσίασης:

Υπεύθυνος Μπάγκος Παντελής Επίκουρος Καθηγητής ΠΑΝΕΠΙΣΤΗΜΙΟ ΣΤΕΡΕΑΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΤΗ ΒΙΟΙΑΤΡΙΚΗ Πρόγνωση σηματοδοτικών αλληλουχιών βακτηριακών πρωτεϊνών που εκκρίνονται με το σύστημα των δίδυμων αργινινών (twin arginine – ΤΑT) Ελισάνθη Νικολάου Υπεύθυνος Μπάγκος Παντελής Επίκουρος Καθηγητής ΛΑΜΙΑ 2010

Το 1999 ο Μπλόμπελ, Γερμανός επιστήμονας πήρε το Νόμπελ γιατί κατάφερε να αποδείξει πόσο σημαντικό ρόλο διαδραματίζουν οι πρωτεΐνες σε όλες τις βιοχημικές διαδικασίες των κυττάρων. Διαπίστωσε ότι οι πρωτεΐνες περιέχουν ενδογενή σήματα, τα οποία καθορίζουν την μετακίνηση και την τοποθέτηση τους μέσα στο κύτταρο. Η μεταφορά των πρωτεϊνών στις βιολογικές μεμβράνες των μικροοργανισμών (βακτήρια, ευκάρυα, αρχαία) είναι μια θεμελιώδης διαδικασία. Σε όλες σχεδόν τις περιπτώσεις, οι πρωτεΐνες που βγαίνουν πέρα από την κυτταρική μεμβράνη έχουν στη δομή τους ένα αμινοτελικό πεπτίδιο οδηγητή. Στους ευκαριωτικούς οργανισμούς, η μεταφορά των περισσοτέρων εξωκυττάριων πρωτεϊνών που φέρουν στη δομή τους αυτό το αμινοτελικό πεπτίδιο οδηγητή, πραγματοποιείται από το γενικό σύστημα έκκριση SEC. Σε πολλά βακτήρια εκτός από την οδό Sec έχουν και την Tat οδό, όπου αυτή παρέχει την δυνατότητα διακίνησης μέσω της δίδυμης αργινίνης.

Οι διαφορές των πεπτιδίων οδηγητών στους διάφορους οργανισμούς. Το πεπτίδιο οδηγητή των Gram Positive βακτηρίων παρατηρούμε ότι στη h-περιοχή του, δηλαδή από το -20 μέχρι το -8 έχει μεγαλύτερο μήκος σε σχέση με τις αντοίστιχες h-περιοχές του Gram negative βακτηρίου και στους ευκαριωτικούς οργανισμούς. Η h- περιοχή στους προκαρυωτικούς οργανισμούς βλέπουμε να έχει περισσότερα αμινοξέα λευκίνης (L) και αλανίνης (Α). Όσον αφορά την περιοχή αποκοπής που βρίσκεται από το (-3,-1), και στα τρία είδη των μικροοργανισμών υπερισχύει η παρουσία της Αλανίνης. (Nielsen, Engelbrecht et al. 1997)

Σύστημα μεταφοράς πρωτεϊνών με πεπτίδιο οδηγητή Εσωτερική περιοχή μεμβράνης Ξεδίπλωτη πρωτεΐνη Διπλωμένη πρωτεΐνη Τα δυο συστήματα μεταφοράς των πρωτεϊνών που φέρουν το αμινοτελικό πεπτίδιο οδηγητή. Από την Sec οδός μεταφέρονται η πρωτεΐνες στην εσωτερική μεμβράνη σε ξεδιπλωμένη μορφή, ενώ από την Tat οδό σε διπλωμένη.

Σύστημα μεταφοράς πρωτεϊνών με Sec πεπτίδιο οδηγητή Περιλαμβάνει SecA σύστημα μεταφοράς (πράσινο) Πρωτεϊνικό κανάλι SecYeG (Πορτοκαλί) Βοηθητικές πρωτεΐνες Yidc & SecDF. Το πεπτίδιο οδηγητή SPase είναι το πεπτίδιο που διασπά την ακολουθία του αμινοτελικού πεπτιδίου οδηγητή από τις προπρωτεΐνες στην περιοχή του περιπλασματικού χώρου. Οι εκκριτικές πρωτεΐνες (κίτρινο) κινούνται προς την οδό SEC, αναγνωρίζοντας την από: το SecA το σωματίδιο αναγνώρισης SRP και ένα μοριακό συνοδό SECΒ Το σύστημα μεταφοράς ΤΑΤ δεν είναι ακόμη τόσο γνωστό. (Driessen and Nouwen 2008)

Εργαλεία αναγνώρισης Sec και Tat πεπτιδίου οδηγητή TATFIND1 http://signalfind.org/tatfind.html (Rose, Bruser et al. 2002) TatP 1 http://www.cbs.dtu.dk/services/TatP/ (Bendtsen, Nielsen et al. 2005) PF105181 http://pfam.sanger.ac.uk/family?acc=PF10518#tabview=tab0 TIGR014091 http://cmr.jcvi.org/cgi-bin/CMR/HmmReport.cgi?hmm_acc=TIGR01409 (Haft, Selengut et al. 2003) SignalPv32 http://www.cbs.dtu.dk/services/SignalP/ (Bendtsen, Nielsen et al. 2004) Phobius2 http://phobius.sbc.su.se/ (Kall, Krogh et al. 2004) Philius2 http://www.yeastrc.org/philius/ (Reynolds, Kall et al. 2008) RPSP2 http://rpsp.bioinfo.pl/ (Plewczynski, Tkacz et al. 2008) PrediSi2 http://www.predisi.de/ (Hiller, Grote et al. 2004) PRED-SIGNAL2 http://biophysics.biol.uoa.gr/PRED-SIGNAL/ (Bagos, Tsirigos et al. 2009) PSORTb2 http://db.psort.org/ (Gardy, Laird et al. 2005) LipoP 3 http://www.cbs.dtu.dk/services/LipoP/ (Juncker, Willenbrock et al. 2003) PRED-LIPO 3 http://biophysics.biol.uoa.gr/PRED-LIPO/ (Bagos, Tsirigos et al. 2008) 1 Εργαλεία αναγνώρισης Tat πεπτιδίου οδηγητή, 2 Εργαλεία αναγνώρισης Sec πεπτιδίου οδηγητή, 3 Εργαλεία αναγνώρισης πεπτιδίου οδηγητή στις λιποπρωτεΐνες Για την αναγνώριση του πεπτιδίου οδηγητή SEC & TAT, έχουν αναπτυχθεί πολλά εργαλεία.

SignalPv3 ΝΝ TatP ΝΝ >Q02J64 length = 68 >Q02J64 length = 68 # Measure Position Value Cutoff Tat signal peptide? max. C 34 0.776 0.51 YES max. Y 34 0.525 0.35 YES max. S 3 0.871 0.75 YES mean S 1-33 0.532 0.30 YES max. D 1-33 0.528 0.36 YES # Most likely cleavage site between pos. 33 and 34: AAA-AD  περιοχή αποκοπής # Found RRHFL as Tat motif starting at pos. 2 # Used regex: RR.[FGAVML][LITMVF]// >Q02J64 length = 68 # Measure Position Value Cutoff signal peptide? max. C 34 0.167 0.32 NO max. Y 34 0.209 0.33 NO max. S 12 0.979 0.87 YES mean S 1-33 0.466 0.48 NO D 1-33 0.338 0.43 NO # Most likely cleavage site between pos. 33 and 34: AAA-AD  περιοχή αποκοπής Παραδείγματα από την έξοδο χρησιμοποιώντας τα εργαλεία..

Profiles HMMs PF105181 & TIGR014091 Περιοχή με το χαρακτηριστικό μοτίβο δίδυμης αργινίνης h-περιοχή  λιγότερο υδροφοβική c-περιοχή  πολική μοτίβο ΑΧΑ Logo των στοιχίσεων που εκπαίδευσαν τα profiles PFAM & TIGR.

Σκοπός της εργασίας ένα αξιόπιστο σύνολο δεδομένων να δημιουργηθεί ένα καινούργιο Hidden Markov Model (HMM) για την αναγνώριση Τat και Sec πεπτιδίου οδηγητή διαθέσιμο για την ερευνητική κοινότητα

Hidden Markov Model (HMM) Δομή ένα σύνολο κρυφών καταστάσεων ένα σύνολο παρατηρούμενων συμβόλων δύο σύνολα πιθανοτήτων δύο καταστάσεις που συμβολίζουν την έναρξη και τον τερματισμό του μοντέλου Β(Begin) και Ε(End) Ρόλος αναπαραστήσουν στατιστικές παραστάσεις των πρωτεϊνικών οικογενειών που προέρχονται από τα μοντέλα πολλαπλών στοιχίσεων των ακολουθιών να χρησιμοποιηθεί για τον εντοπισμό ομόλογων πρωτεϊνών HΜMER ένα λογισμικό πακέτο, αναπτύχθηκε από τον Eddy (1998) ελεύθερα διαθέσιμο σκοπό έχει να πραγματοποιεί ανάλυση πρωτεϊνικής ακολουθίας χρησιμοποιείται για την αναζήτηση των ομόλογων πρωτεϊνικών ακολουθιών κατασκευή στοίχισης ακολουθίας πρωτεϊνών Υλοποιεί μεθόδους που χρησιμοποιούν πιθανολογίες μοντέλων που ονομάζεται "profiles hidden Markov model» (pHMMs).

Profiles Hidden Markov Models (pHMMs) Χαρακτηριστικά χρησιμοποιεί συγκεκριμένες παραμέτρους ανά θέση (πιθανότητες εκπομπής και μετάβασης) κατάλληλο για την μοντελοποίηση πρωτεϊνικών οικογενειών εύκολο στη χρήση

Οι καταστάσεις που παρατηρούνται σε ένα τέτοιο μοντέλο (εκτός αυτών της εκκίνησης και του τερματισμού) χωρίζονται σε 3 κατηγορίες: Καταστάσεις Σύμπτωσης (Match states) Mk τετράγωνα, Καταστάσεις Εισαγωγής (Insertion states) Ik  ρόμβοι, Καταστάσεις Απαλοιφής (Deletion states) Dk  κύκλοι. Συνδέονται με τις αντίστοιχες πιθανότητες μεταβάσεως, που συμβολίζονται με βέλη. Εικόνα 1: Σχηματική αναπαράσταση ενός τυπικού profile Hidden Markov Model.

Δεδομένα Εκπαίδευσης Δεδομένα Δοκιμής 328 ακολουθίες πρωτεϊνών με Sec πεπτίδιο οδηγητή (Nielsen, Engelbrecht et al. 1997; Nielsen, Brunak et al. 1999) 216 Gram-negative 112 Gram-positive 150 ακολουθίες πρωτεϊνών με Τat πεπτίδιο οδηγητή 119 Gram-negative 31 Gram-positive 140 ακολουθίες διαμεμβρανικών πρωτεϊνών, με την χαρακτηριστική Ν-περιοχή (Dilks, Rose et al.) 90 Gram-negative 50 Gram-positive 288 κυτταροπλασματικές πρωτεΐνες (Menne, Hermjakob et al. 2000) 183 Gram-negative 105 Gram-positive 273 ακολουθίες με το Sec πεπτίδιο οδηγητή (Menne, Hermjakob et al. 2000) 193 Gram-negative 80 Gram-positive 75 ακολουθίες με το Τat πεπτίδιο οδηγητή 18 Gram-negative 45 Gram-positive 12 αρχαία 192 ακολουθίες διαμεμβρανικών πρωτεϊνών (Gardy, Laird et al. 2005) 136 Gram-negative 56 Gram-positive 601 κυτταροπλασματικές πρωτεΐνες 407 Gram-negative 194 Gram-positive

Στοίχιση πεπτιδίου οδηγητή Tat θετικά φορτισμένη n-περιοχή ενδιάμεση περιοχή με το χαρακτηριστικό μοτίβο της δίδυμης αργινίνης RR μια h-περιοχή λιγότερο υδρόφοβη μια συνήθως μικρού μήκους πολική c-περιοχή με το χαρακτηριστικό μοτίβο πεπτίδιο αποκοπής AXA Πίνακας 1: Ακολουθίες με Tat πεπτίδιο οδηγητή P76342 MKKNQFLKESDVTAESVFF MKRRQVLK ALGISATALSL PHAAHA Q57366 MTKLSGQELHAE LSRRAFLS YTAAVGALGLCGTSLLA QGARA P39185 MK ISRRDFIK QTAITATASVAGVTL PAGA Q9RK81 MSQTPA VSRRLLLG SAAATGALATGIGSAA PVAAA Q9RI72 MQQDGTQQDRIKQSPAPLNG MSRRGFLG GAGTLALATASGLLL PGTAHA AXA, το Α αντιπροσωπεύει Αλανίνη και το X οποιοδήποτε άλλο αμινοξί. Αναφορά στο zhang to xei kanei gia ανθρωπινα πεπτίδια

Στοίχιση πεπτιδίου οδηγητή Sec μια θετικά φορτισμένη n-περιοχή μια υδροφοβική h-περιοχή που εκτείνεται στη μεμβράνη μια συνήθως μικρού μήκους πολική c-περιοχή με το χαρακτηριστικό μοτίβο πεπτίδιο αποκοπής AXA Πίνακας 2: Ακολουθίες με Sec πεπτίδιο οδηγητή P0AEB2 MNTIFSARIMKR LALTTALCTAFI SAAHA P31716 MLKNK ILATTLSVSLLAPLANPLL ENAKA P20041 MNHRYT LLALAAAAL SAGAHA P11278 MKKR ALLLSMSVLAML YIPAGQA P31133 MTALNKK WLSGLVAGALMAV SVGTLA

Εικόνα 1: Το πάνω logo παρουσιάζεται η στοίχιση του Tat πεπτιδίου οδηγητή. Στο κάτω logo παρουσιάζεται το Sec πεπτίδιο οδηγητή. Α αλανινη λιγοτερο υδροφοβη R αργινίνη L λυσίνη Η h-περιοχή του ΤΑΤ πεπτίδιο οδηγητή είναι λιγότερο υδροφοβική λόγο της παρουσίας γλυκίνης(G) και θρεονίνης(T), σε σύγκριση με την αντίστοιχη περιοχή της SEC οδού.

Cross validation Τα αποτελέσματα που αναφέρονται για τα δεδομένα των πρωτεϊνών με Τat και Sec πεπτιδίων οδηγητών αντιστοιχούν σε μια διαδικασία cross validation 25 ακολουθιών, όπου κάθε σύνολο περιέχει έναν εξίσου ισορροπημένο αριθμό Τat πεπτιδίων οδηγητών, Sec πεπτιδίων οδηγητών, των διαμεμβρανικών πρωτεϊνών (ΤΜ) και πρωτεϊνών κυτταροπλασματικής μεμβράνης (cyto). η διαδικασία εκπαίδευσης του μοντέλου αποτελείτο από όλα τα δεδομένα μας αφαιρώντας κάθε φορά από 25 ακολουθίες, οι υπόλοιπες αποτελούσαν σύνολο εκπαίδευσης, και εκτέλεση της δοκιμής έγινε με τις 25 πρωτεΐνες του συνόλου που αφαιρούνταν κάθε φορά η τελική ακρίβεια πρόβλεψης συνοψίζει όλα τα αποτελέσματα από τις ανεξάρτητες δοκιμές Στην συνέχεια λαμβάνοντας υπόψη αν το score που πάρθηκε από το cross validation, για κάθε συγκεκριμένη πρωτεΐνη ήταν μεγαλύτερο του μηδενός τότε ανήκει όντως στο σύνολο που κάναμε την διαδικασία, αν όχι δεν ανήκει. Αυτή η διαδικασία επαναλαμβάνεται αφαιρώντας από το αρχικό σύνολο δεδομένων κάθε φορά 25 πρωτεΐνες, για όλα τα υποσύνολα στο σύνολο εκπαίδευσης

PRED-TAT Σκοπός η αναζήτηση Τat και Sec πεπτιδίων οδηγητών στο σύνολο των πρωτεϊνών Το ΗΜΜ του PRED-TAT, έχει μια δομή αρχιτεκτονικής αρκετά παρόμοια με αυτές που χρησιμοποιούνται σε άλλα εργαλεία όπως το PRED-LIPO, το CW-PRED και το PRED-SIGNAL Αποτελείται από τέσσερα διαφορετικά υπομοντέλα: το υπομοντέλο Τat το υπομοντέλο πεπτιδίων οδηγητών Sec το υπομοντέλο διαμεμβρανικών πρωτεϊνών ένα υπομοντέλο σφαιρικές πρωτεΐνες (Bagos, Nikolaou et al. 2010)

PRED-TAT VS PRED-TATHMMER Πλεονέκτημα Πιο ακριβές  έχει λιγότερες παραμέτρους και μπορεί να μοντελοποίηση ακριβώς την περιοχή που θέλουμε Μειονέκτημα Θα πρέπει να σχεδιαστεί από την αρχή, με την βοήθεια ειδικού λογισμικού Πλεονέκτημα Είναι πολύ εύκολο και γρήγορο στο σχεδιασμό, χάρη στο πακέτο HMMER Μειονέκτημα Έχει πολλές παραμέτρους για κάθε θέση, λιγότερο ακριβές

Δεδομένα Εκπαίδευσης – Αποτελέσματα 1 Λόγω του ότι είχα δυο μοντέλα να συγκρίνω τα δεδομένα μου, ένα για το Sec πεπτίδιο οδηγητή και ένα για το Tat , δημιούργησα τις γραφικές παραστάσεις με τα score που πήρα για κάθε μέτρηση, σε διαφορετικά cutoff. Σύμφωνα με αποτελέσματα που πήρα από τις γραφικές, λέμε ότι σε γενικές γραμμές το ικανοποιητικό cutoff θα είναι γύρο στο μηδέν. Θα δεχόμαστε δηλαδή την πρωτεΐνη αν είναι πάνω από το μηδέν το score της στο θετικό σύνολο του Profile που χρησιμοποιήσαμε για να κάνουμε αναγνώριση. Γράφημα 1.1: Είναι η γραφική παράσταση που αντλούμε από τις ευαισθησίες και τις ειδικότητες, κάνοντας αναζήτηση το pHMM, Sec.hmm με τα δεδομένα εκπαίδευσης.

Δεδομένα Εκπαίδευσης – Αποτελέσματα 2 Γράφημα 1.2: Είναι η γραφική παράσταση που αντλούμε από τις ευαισθησίες και τις ειδικότητες, κάνοντας αναζήτηση το pHMM, Tat.hmm με τα δεδομένα εκπαίδευσης.

Δεδομένα Δοκιμής – Αποτελέσματα 3 Γράφημα 1.3: Είναι η γραφική παράσταση που αντλούμε από τις ευαισθησίες και τις ειδικότητες, κάνοντας αναζήτηση το pHMM, Signal.hmm με τα δεδομένα δοκιμής.

Δεδομένα Δοκιμής – Αποτελέσματα 4 Γράφημα 1.4: Είναι η γραφική παράσταση που αντλούμε από τις ευαισθησίες και τις ειδικότητες, κάνοντας αναζήτηση το pHMM, Tat.hmm με τα δεδομένα δοκιμής.

Δεδομένα Εκπαίδευσης – Αποτελέσματα 5 Πίνακας 3: Σύγκριση του PRED-TATHMMER (pHMM ΤΑΤ.hmm), με άλλα εργαλεία, για την εύρεση της πρωτεΐνης με το TAT πεπτίδιο οδηγητή. Method Tat SPs Sec Sps Cyto TMs MCC PRED-TAT 148/150 (98.67%) 319/328 (97.26%) 288/288 (100.00%) 140/140 0.96 PRED-TATHMMER 148/150* 312/328 (95.12%) 139/140 (99.3%) 0.93 TATFIND 134/150 (89.33%) 326/328 (99.39%) 287/288 (99.65%) 0.92 TatP 130/150 284/328 (86.59%) 283/288 (98.26%) 133/140 (95.00%) 0.73 PF10518 15/150 (10.00%) 328/328 0.29 TIGR01409 105/150 (70.00%) 327/328 (99.70%) 0.81 *Αποτελέσματα που πάρθηκαν με cross validation ανά 25 ακολουθίες. Σύγκριση του PRED-TAThmmer με άλλα εργαλεία αναγνώρισης πεπτιδίου οδηγητή.

Δεδομένα Εκπαίδευσης – Αποτελέσματα 6 Πίνακας 4: Σύγκριση του PRED-TATHMMER (pHMM SEC.hmm) με άλλα εργαλεία, για την εύρεση της πρωτεΐνης με το Sec πεπτίδιο οδηγητή. Method Sec Sps Cyto TMs MCC PRED-TAT 315/328 (96.04%) 265/288 (92.01%) 130/140 (92.86%) 0.88 PRED-TATHMMER 285/328 * (86.89%) 285/288 (98.96%) RPSP 303/328 (92.38%) 287/288 (99.65%) 116/140 (82.86%) 0.87 PrediSi 317/328 (96.65%) 280/288 (97.22%) 108/140 (77.14%) SignalPv3 (NN) 323/328 (98.48%) 117/140 (83.57%) 0.91 SignalPv3 (HMM) 325/328 (99.09%) 283/288 (98.26%) 114/140 (81.43%) Phobius 318/328 (96.95%) 281/288 (97.57%) 129/140 (92.14%) 0.93 Philius 274/288 (95.14%) 132/140 (94.29%) *Αποτελέσματα που πάρθηκαν με cross validation ανά 25 ακολουθίες.

Δεδομένα Δοκιμής – Αποτελέσματα 7 Πίνακας 5: Σύγκριση PRED-TATHMMER (pHMM ΤΑΤ.hmm,) με τα άλλα εργαλεία, για την εύρεση της πρωτεΐνης με το Tat πεπτίδιο οδηγητή. Δεδομένα δοκιμής Method Tat SPs Sec Sps Cyto TMs MCC PRED-TAT 71/75 (94.67%) 265/273 (97.07%) 596/601 (99.50%) 190/192 (98.96%) 0.89 PRED-TATHMMER 72/75 (96.00%) 259/273 (94.87%) 601/601 (100.00%) 0.88 TATFIND 60/75 (80.00%) 270/273 (98.90%) 599/601 (99.67%) 192/1192 0.85 TatP 62/75 (82.67%) 231/273 (84.62%) 594/601 (98.84%) 177/192 (92.19%) 0.61 PF10518 9/75 (12.00%) 273/273 192/192 0.34 TIGR01409 47/75 (62.67%) 272/273 (99.63%) 0.77

Δεδομένα Δοκιμής – Αποτελέσματα 8 Πίνακας 6: Σύγκριση PRED-TATHMMER (pHMM SEC.hmm), με τα άλλα εργαλεία, για την εύρεση της πρωτεΐνης με το Sec πεπτίδιο οδηγητή. Δεδομένα δοκιμής Method Sec Sps Cyto TMs MCC PRED-TAT 252/273 (92.31%) 570/601 (94.84%) 167/192 (86.98%) 0.82 PRED-TATHMMER 238/273 (87.18%) 597/601 (99.33%) 174/192 (90.62%) 0.86 RPSP 249/273 (91.21%) 601/601 (100.00%) 146/192 (76.04%) 0.83 PrediSi 260/273 (95.24%) 579/601 (96.34%) 114/192 (59.38%) 0.76 SignalPv3 (NN) 599/601 (99.67%) 150/192 (78.12%) 0.85 SignalPv3 (HMM) 264/273 (96.70%) 593/601 (98.67%) 134/192 (69.79%) Phobius 594/601 (98.84%) 154/192 (80.21%) 0.84 Philius 253/273 (92.67%) 582/601 (96.84%) 181/192 (94.27%) 0.88

Πίνακας 7:HMMER 3X3 (προτεραιότητα στο score) Predicted Tat Non-signal Signal Peptide Total 148 (98.66%) 2 (1.33%) (0.00%) 150 (100%) 1 (0.24%) 414 (96.73%) 13 (3.03%) 428 3 (0.92%) 41 (12.5%) 284 (86.59%) 328 Πίνακας 8:HMMER 3X3 (προτεραιότητα στο Tat.hmm) Predicted Tat Non-signal Signal Peptide Total 150 (100.00%) (0.00%) (100%) 1 (0.24%) 414 (96.73%) 13 (3.03%) 428 14 (4.27%) 41 (12.5%) 271 (82.62%) 328 Πίνακας 9: Συνολικά αποτελέσματα για τις 44 πρωτεΐνες που περιέχουν στο μοτίβο τους το RR, αλλά επαληθεύονται πειραματικά ότι δεν είναι πρωτεΐνες με Tat πεπτίδιο οδηγητή. Uniprot PRED-TAT TatP TatFind TIGR01409 PF10518 PRED-TATHMMER Συνολικά 39/44 (86.64%) 22/44 (50%) 44/44 (100%) 42/44 (95.45%) 37/44 (84.1%)

PRED-ΤΑΤhmmer

PRED-TAT Γράφημα : Παρουσιάζεται το αποτέλεσμα που μας δίνει η μέθοδος PRED-TAT τρέχοντας τις ακολουθίες πρωτεϊνών A9CH43, Q02J64.

Συμπεράσματα Σκοπός της εργασίας αυτής είναι να αναπτυχθεί ένα καινούργιο Hidden Markov Model (HMM) για την αναγνώριση Τat και Sec πεπτιδίων οδηγητών. Σύμφωνα με τα αποτελέσματα που πάρθηκαν από την χρήση του Tat.hmm με τα δεδομένα μας, το μοντέλο μας είναι καλύτερο. Με την χρήση του Sec.hmm, παρατηρήσαμε ότι και αυτό κάνει πάρα πολύ καλές προγνώσεις πεπτιδίων οδηγητών Sec, εντούτοις βλέπουμε να υστερεί λίγο από τα υπόλοιπα εργαλεία πρόγνωσης Το ΗΜΜ εκπαιδεύτηκε με τον συνδυασμό Gram-positive και Gram-negative βακτηριακών ακολουθιών. Δεν λάβαμε υπόψη τις αλλαγές που πρόκειται να γίνουν στο μέλλον στα δεδομένα μας ή ακόμη και τις σπάνιες περιπτώσεις που υπάρχουν (συντηρητικότητα αργινίνης). Η όλη δουλεία δημοσιεύτηκε στο περιοδικό Bioinformatics (Bagos, Nikolaou et al. 2010).

Ευχαριστώ για την προσοχή σας