Ε ΘΝΙΚΟ Μ ΕΤΣΟΒΙΟ Π ΟΛΥΤΕΧΝΕΙΟ Σ χολή Η λεκτρολόγων Μ ηχανικών και Μ ηχανικών Υ πολογιστών Τ ομέας Τ εχνολογίας Π ληροφορικής και Υ πολογιστών Διπλωματική Εργασία DIANA 2.0: Προηγμένη Εφαρμογή Ιστού Διαχείρισης Δεδομένων Βιοεπιστημών Φωτοπούλου Χ. Γεωργία Επίβλεψη: Τιμολέων Σελλής 12 Ιουλίου 2010
Φωτοπούλου Γεωργία1 Υπόβαρθο DNA
Φωτοπούλου Γεωργία 1 Υπόβαρθο DNA mRNA
Φωτοπούλου Γεωργία1 Υπόβαρθο DNA mRNA πρωτεϊνη
Φωτοπούλου Γεωργία1 Υπόβαρθο DNA mRNA πρωτεϊνη γονίδιο ↔ mRNA
Φωτοπούλου Γεωργία2 Υπόβαρθο microRNA στόχοι πειραματικές και υπολογιστές τεχνικές Ε.Κ. Βιοϊατρικών Επιστημών “Αλέξανδρος Φλέμινγκ”
Φωτοπούλου Γεωργία3 Αρχιτεκτονική
Φωτοπούλου Γεωργία4 Αποφάσεις Ανάλυση απαιτήσεων → Περιπτώσεις χρήσης Σχεδιασμός → Model-View-Controller (MVC) Yλοποίηση → Apache+MySQL+PHP+Yii Αξιολόγηση/Έλεγχος → Σενάρια εκτέλεσης
Φωτοπούλου Γεωργία5 Χαρακτηριστικά DIANA 2.0 Αναζήτηση βιολογικών στόχων Παροχή προτάσεων σε λανθασμένους όρους Προβολή στόχων με βάση άλλους αλγορίθμους Περιβάλλον διαχείρισης χρηστών
Φωτοπούλου Γεωργία6 Αναζήτηση βιολογικών στόχων Υποστήριξη όρων διαφόρων τύπων - όνομα microRNA πχ “hsa-let-7e” - κωδικός ΜΙΜΑ microRNA πχ “ΜΙΜΑΤ ” ή “MI ” - όνομα γονιδίου πχ “FIGN” - κωδικός ENSEMBL γονιδίου πχ ENSG ή ENSMUSG κωδικός TRANSCRIPT γονιδίου πχ ENST ή ENSMUST κωδικός Refseq γονιδίου πχ XM_ ή XR_ ή NM_ ή NR_ Απλοποίηση
Φωτοπούλου Γεωργία7 Παροχή προτάσεων Εξοικονομεί μνήμη και χρόνο Μαντεύει Εκμεταλλεύεται τη δομή των όρων Χρησιμοποιεί συντακτική απόσταση Levenshtein L(seq1,seq2) = #delete + #insert + #substitution πχ L (foo, fo) = 1 → 1 delete L (hat, cat) = 1 → 1 substitution L (beta, res) = 3 → 1 insert, 2 substitutions
Φωτοπούλου Γεωργία8 tokenization πχ hsa-let-100g → 4 tokens db-tokens hsa → Ναιlet → Ναι 100 → Ναιg → Όχι Παροχή προτάσεων – microRNA ονόματα
Φωτοπούλου Γεωργία8 tokenization πχ hsa-let-100g → 4 tokens db-tokens hsa → Ναιlet → Ναι 100 → Ναιg → Όχι Παροχή προτάσεων – microRNA ονόματα
Φωτοπούλου Γεωργία9 ranking Λίστα “Ναι”: σκορ εμφάνισης [(hsa-let-7i → 2), (hsa-mir-95 → 1), (mmu-mir-100 → 1)] Λίστα “Όχι”: απόσταση levenshtein [(hsa-let-7i → 1)] normalization Λίστα “Ναι” : (item / #tokens)*0.5 [(hsa-let-7i → 0.25), (hsa-mir-95 → 0.125), (mmu-mir-100 → 0.125)] Λίστα “Όχι”: (item / min_levenshtein) * 0.5] [(hsa-let-7i → 0.5)] Παροχή προτάσεων – microRNA ονόματα
Φωτοπούλου Γεωργία10 merge merged_list = [(hsa-let-7i → 0.75),(hsa-mir-95 → 0.125),(mmu-mir-100 → 0.125)] suggest top-k terms για k=2: - hsa-let-7i - hsa-mir-95 Παροχή προτάσεων – microRNA ονόματα
Φωτοπούλου Γεωργία11 βασική μορφή - Κωδικός ΜΙΜΑ: ΜΙΜΑΤ ή ΜΙ + 7 ψηφία - Κωδικός ENSEMBL:ΕNSG ή ENSMUSG + 11 ψηφία - Κωδικός TRANSCRIPT: ENST ή ENSMUST + 11 ψηφία - Κωδικός Refseq: XM_ ή XR_ ή ΝΜ_ ή NR_ + ψηφία tokenization - πχ ΜΙΜΑΤ0087 → MIMAT και 0087 σταθεροποίηση αριθμού ψηφίων - πχ 0087 → πχ → levenshtein -πχ → , , κοκ concatenation 0087 → ΜΙΜΑΤ , ΜΙΜΑΤ , ΜΙΜΑΤ Παροχή προτάσεων – κωδικοί
Φωτοπούλου Γεωργία 12 τελική περίπτωση levenshtein Παροχή προτάσεων – όνομα γονιδίου
Φωτοπούλου Γεωργία13 Εμφάνιση κατάλληλου συνδέσμου στη λίστα αποτελεσμάτων Δεν υποστηριζόταν στην προηγούμενη έκδοση Προβολή στόχων άλλων αλγορίθμων
Φωτοπούλου Γεωργία14 Προβολή λίστας χρηστών Τροποποίηση στοιχείων χρήστη Διαγραφή χρήστη Πρόσθεση νέου χρήστη Ανέβασμα αρχείων στόχων Περιβάλλον διαχείρισης
Φωτοπούλου Γεωργία15 Εύχρηστο περιβάλλον διαχείρισης Απλοποιημένος μηχανισμός αναζητήσεων Βελτιωμένος μηχανισμός παροχής προτάσεων Συγκριτική παρουσίαση προβλέψεων με βάση άλλους αλγορίθμους Διευκόλυνση μελλοντικών επεκτάσεων λόγω τεκμηρίωσης Συνεισφορά
Φωτοπούλου Γεωργία16 Ακολουθεί επίδειξη της εφαρμογής DIANA
Φωτοπούλου Γεωργία17 Ερωτήσεις;
Φωτοπούλου Γεωργία18 Ευχαριστώ!