Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Ε ΘΝΙΚΟ Μ ΕΤΣΟΒΙΟ Π ΟΛΥΤΕΧΝΕΙΟ Σ χολή Η λεκτρολόγων Μ ηχανικών και Μ ηχανικών Υ πολογιστών Τ ομέας Τ εχνολογίας Π ληροφορικής και Υ πολογιστών Διπλωματική.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Ε ΘΝΙΚΟ Μ ΕΤΣΟΒΙΟ Π ΟΛΥΤΕΧΝΕΙΟ Σ χολή Η λεκτρολόγων Μ ηχανικών και Μ ηχανικών Υ πολογιστών Τ ομέας Τ εχνολογίας Π ληροφορικής και Υ πολογιστών Διπλωματική."— Μεταγράφημα παρουσίασης:

1 Ε ΘΝΙΚΟ Μ ΕΤΣΟΒΙΟ Π ΟΛΥΤΕΧΝΕΙΟ Σ χολή Η λεκτρολόγων Μ ηχανικών και Μ ηχανικών Υ πολογιστών Τ ομέας Τ εχνολογίας Π ληροφορικής και Υ πολογιστών Διπλωματική Εργασία DIANA 2.0: Προηγμένη Εφαρμογή Ιστού Διαχείρισης Δεδομένων Βιοεπιστημών Φωτοπούλου Χ. Γεωργία Επίβλεψη: Τιμολέων Σελλής 12 Ιουλίου 2010

2 Φωτοπούλου Γεωργία1 Υπόβαρθο DNA

3 Φωτοπούλου Γεωργία 1 Υπόβαρθο DNA mRNA

4 Φωτοπούλου Γεωργία1 Υπόβαρθο DNA mRNA πρωτεϊνη

5 Φωτοπούλου Γεωργία1 Υπόβαρθο DNA mRNA πρωτεϊνη γονίδιο ↔ mRNA

6 Φωτοπούλου Γεωργία2 Υπόβαρθο microRNA στόχοι πειραματικές και υπολογιστές τεχνικές Ε.Κ. Βιοϊατρικών Επιστημών “Αλέξανδρος Φλέμινγκ”

7 Φωτοπούλου Γεωργία3 Αρχιτεκτονική

8 Φωτοπούλου Γεωργία4 Αποφάσεις Ανάλυση απαιτήσεων → Περιπτώσεις χρήσης Σχεδιασμός → Model-View-Controller (MVC) Yλοποίηση → Apache+MySQL+PHP+Yii Αξιολόγηση/Έλεγχος → Σενάρια εκτέλεσης

9 Φωτοπούλου Γεωργία5 Χαρακτηριστικά DIANA 2.0 Αναζήτηση βιολογικών στόχων Παροχή προτάσεων σε λανθασμένους όρους Προβολή στόχων με βάση άλλους αλγορίθμους Περιβάλλον διαχείρισης χρηστών

10 Φωτοπούλου Γεωργία6 Αναζήτηση βιολογικών στόχων Υποστήριξη όρων διαφόρων τύπων - όνομα microRNA πχ “hsa-let-7e” - κωδικός ΜΙΜΑ microRNA πχ “ΜΙΜΑΤ0000062” ή “MI0000401” - όνομα γονιδίου πχ “FIGN” - κωδικός ENSEMBL γονιδίου πχ ENSG00000000005 ή ENSMUSG00000070000 - κωδικός TRANSCRIPT γονιδίου πχ ENST00000400000 ή ENSMUST00000020000 - κωδικός Refseq γονιδίου πχ XM_905004 ή XR_002000 ή NM_012001 ή NR_000003 Απλοποίηση

11 Φωτοπούλου Γεωργία7 Παροχή προτάσεων Εξοικονομεί μνήμη και χρόνο Μαντεύει Εκμεταλλεύεται τη δομή των όρων Χρησιμοποιεί συντακτική απόσταση Levenshtein L(seq1,seq2) = #delete + #insert + #substitution πχ L (foo, fo) = 1 → 1 delete L (hat, cat) = 1 → 1 substitution L (beta, res) = 3 → 1 insert, 2 substitutions

12 Φωτοπούλου Γεωργία8 tokenization πχ hsa-let-100g → 4 tokens db-tokens hsa → Ναιlet → Ναι 100 → Ναιg → Όχι Παροχή προτάσεων – microRNA ονόματα

13 Φωτοπούλου Γεωργία8 tokenization πχ hsa-let-100g → 4 tokens db-tokens hsa → Ναιlet → Ναι 100 → Ναιg → Όχι Παροχή προτάσεων – microRNA ονόματα

14 Φωτοπούλου Γεωργία9 ranking Λίστα “Ναι”: σκορ εμφάνισης [(hsa-let-7i → 2), (hsa-mir-95 → 1), (mmu-mir-100 → 1)] Λίστα “Όχι”: απόσταση levenshtein [(hsa-let-7i → 1)] normalization Λίστα “Ναι” : (item / #tokens)*0.5 [(hsa-let-7i → 0.25), (hsa-mir-95 → 0.125), (mmu-mir-100 → 0.125)] Λίστα “Όχι”: (item / min_levenshtein) * 0.5] [(hsa-let-7i → 0.5)] Παροχή προτάσεων – microRNA ονόματα

15 Φωτοπούλου Γεωργία10 merge merged_list = [(hsa-let-7i → 0.75),(hsa-mir-95 → 0.125),(mmu-mir-100 → 0.125)] suggest top-k terms για k=2: - hsa-let-7i - hsa-mir-95 Παροχή προτάσεων – microRNA ονόματα

16 Φωτοπούλου Γεωργία11 βασική μορφή - Κωδικός ΜΙΜΑ: ΜΙΜΑΤ ή ΜΙ + 7 ψηφία - Κωδικός ENSEMBL:ΕNSG ή ENSMUSG + 11 ψηφία - Κωδικός TRANSCRIPT: ENST ή ENSMUST + 11 ψηφία - Κωδικός Refseq: XM_ ή XR_ ή ΝΜ_ ή NR_ + ψηφία tokenization - πχ ΜΙΜΑΤ0087 → MIMAT και 0087 σταθεροποίηση αριθμού ψηφίων - πχ 0087 → 0000087 - πχ 00000000087 → 0000087 levenshtein -πχ 0000087 → 0000097, 0000017, 0000117 κοκ concatenation 0087 → ΜΙΜΑΤ0000097, ΜΙΜΑΤ0000017, ΜΙΜΑΤ0000117 Παροχή προτάσεων – κωδικοί

17 Φωτοπούλου Γεωργία 12 τελική περίπτωση levenshtein Παροχή προτάσεων – όνομα γονιδίου

18 Φωτοπούλου Γεωργία13 Εμφάνιση κατάλληλου συνδέσμου στη λίστα αποτελεσμάτων Δεν υποστηριζόταν στην προηγούμενη έκδοση Προβολή στόχων άλλων αλγορίθμων

19 Φωτοπούλου Γεωργία14 Προβολή λίστας χρηστών Τροποποίηση στοιχείων χρήστη Διαγραφή χρήστη Πρόσθεση νέου χρήστη Ανέβασμα αρχείων στόχων Περιβάλλον διαχείρισης

20 Φωτοπούλου Γεωργία15 Εύχρηστο περιβάλλον διαχείρισης Απλοποιημένος μηχανισμός αναζητήσεων Βελτιωμένος μηχανισμός παροχής προτάσεων Συγκριτική παρουσίαση προβλέψεων με βάση άλλους αλγορίθμους Διευκόλυνση μελλοντικών επεκτάσεων λόγω τεκμηρίωσης Συνεισφορά

21 Φωτοπούλου Γεωργία16 Ακολουθεί επίδειξη της εφαρμογής DIANA 2.0...

22 Φωτοπούλου Γεωργία17 Ερωτήσεις;

23 Φωτοπούλου Γεωργία18 Ευχαριστώ!


Κατέβασμα ppt "Ε ΘΝΙΚΟ Μ ΕΤΣΟΒΙΟ Π ΟΛΥΤΕΧΝΕΙΟ Σ χολή Η λεκτρολόγων Μ ηχανικών και Μ ηχανικών Υ πολογιστών Τ ομέας Τ εχνολογίας Π ληροφορικής και Υ πολογιστών Διπλωματική."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google