1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Ανακάλυψη Γνώσης από Βιολογικές Αλληλουχίες Αλεξανδρίδου Αναστασία.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Ταξινόμηση Κειμένων με Νευρωνικά Δίκτυα. Γ. Ταμπουρατζής Ινστιτούτο Επεξεργασίας του Λόγου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ10/12/2002 INSTITUTE FOR LANGUAGE.
Advertisements

ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΕΙΚΟΝΕΣ
Α. Αναλυτικό Α’ Γυμνασίου
ΠΜΣ ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Κατεύθυνση ΤΕΔΑ Τεχνολογίες Διαχείρισης Ασφάλειας Security Management Engineering Τμήμα Πληροφορικής ΠΑΝΕΠΙΣΤΗΜΙΟ.
Στόχοι, μεθοδολογία, διαδικασίες Μιχάλης Μεταξάς Innovatia ΕΠΕ, Σύμβουλος Διαχείρισης Έργου.
ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΙΑ ΤΑ ΝΕΑ ΑΝΑΛΥΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΓΝΩΡΙΜΙΑ ΚΑΙ ΕΞΟΙΚΕΙΩΣΗ ΜΕ ΤΙΣ ΒΑΣΙΚΕΣ ΑΡΧΕΣ, ΤΟΥΣ ΣΤΟΧΟΥΣ ΚΑΙ ΤΟ ΠΕΡΙΕΧΟΜΕΝΟ.
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
Πτυχιακή εργασία των Κωνσταντίνου Κουρμούση (1604)
ΕΙΣΑΓΩΓΗ ΣΤΑ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ
Μηχανική Μάθηση και Εξόρυξη Γνώσης
Ανάπτυξη του λογισμικού «Η χημεία της Πληροφορικής και της Χημείας»
του TANCIC NENAD (Α.Ε.Μ.: 3800)
Περιβάλλον Προσομοίωσης & Τεχνικές Σχεδίασης
ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΚΑΙ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ
Μικροσυστοιχίες και ανάλυση δεδομένων
8/4/2002Α.Τσάκωνας, Γ.Δούνιας, SETN-02 Hybrid Computational Intelligence Schemes in Complex Domains: An Extended Review Athanasios Tsakonas and George.
Αναγνώριση Προτύπων.
Proteomics and Genomics for Drug Discovery / Personalized Medicine
1 Το έργο «Προηγμένες υπηρεσίες ηλεκτρονικής μάθησης στο ΤΕΙ Λάρισας» Ημερίδα παρουσίασης του έργου «Προηγμένες υπηρεσίες ηλεκτρονικής μάθησης στο ΤΕΙ.
Διαίρει-και-Βασίλευε
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ
ΕΞΌΡΥΞΗ ΔΕΔΟΜΈΝΩΝ ΚΑΙ ΑΛΓΌΡΙΘΜΟΙ ΜΆΘΗΣΗΣ Κατηγοριοποίηση 4 ο Φροντιστήριο Σκούρα Αγγελική
ΕΥΡΕΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΕΚΤΟΠΩΝ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ
H ΕΚΠΑΙΔΕΥΣΗ ΣΤΗΝ ΨΗΦΙΑΚΗ ΕΠΟΧΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ ΑΘΑΝΑΣΟΠΟΥΛΟΥ ΧΑΡΑ (Α.Μ.:1022) ΠΑΠΟΥΤΣΙΔΗΣ ΒΑΓΓΕΛΗΣ (Α.Μ.:1062) ΔΙΔΑΚΤΙΚΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΡΟΓΡΑΜΜΑΤΑ.
Ανάπτυξη και εκπαίδευση ιεραρχίας ταξινομητών για την κατηγοριοποίηση κειμένων Αβραμίδη Γεωργία 719.
1 Οργάνωση και Αρχιτεκτονική Υπολογιστών Πρόγραμμα Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Οργάνωση και Αρχιτεκτονική.
Προηγμένη Εφαρμογή Ιστού Διαχείρισης Δεδομένων Βιοεπιστημών Διπλωματική Εργασία του Γεωργίου Πρέκα ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ.
EXCEL – λογιστικά φύλλα. Χρήση επεξεργασία, αναπαράσταση και επικοινωνία αριθμητικών (η γενικότερα ποσοτικών) δεδομένων Ειδικότερα Εφαρμογή εκπαιδευτικών.
Γραφικό Περιβάλλον Συγγραφής Κανόνων στο Σημασιολογικό Διαδίκτυο Διπλωματική Εργασία της Βασιλικής Ζερβάκη Επιβλέπων Καθηγητής: Νικόλαος Βασιλειάδης Θεσσαλονίκη.
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ
ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΟΠΤΙΚΩΝ ΣΗΜΑΤΩΝ
Εισαγωγή στην Επιστήμη των Υπολογιστών και Επικοινωνιών Οι απαιτούμενες γνώσεις και δεξιότητες του μηχανικού Σπύρος Κοκολάκης ΠΑΝΕΠΙΣΤΗΜΙΟ.
ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΣΩΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ.
ΠΑΚΕ Δυτικής Ελλάδας – Πελοποννήσου Πανεπιστήμιο Πατρών, Τμήμα Επιστημών της Εκπαίδευσης & της Αγωγής στην Προσχολική Ηλικία Πανεπιστήμιο Πελοποννήσου.
ΣΕΜΙΝΑΡΙΟ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΙΚΑ ΘΕΜΑΤΑ ΠΩΛΗΣΕΩΝ ΚΑΙ ΠΡΟΔΙΑΓΡΑΦΕΣ ΥΛΙΚΟΥ & ΛΟΓΙΣΜΙΚΟΥ Β’ ΕΠΑΛ Οδυσσέας Λεβαντής-Μέλος Ομάδας Συγγραφής.
ΣΕΜΙΝΑΡΙΟ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΙΚΑ ΘΕΜΑΤΑ ΠΩΛΗΣΕΩΝ ΚΑΙ ΠΡΟΔΙΑΓΡΑΦΕΣ ΥΛΙΚΟΥ & ΛΟΓΙΣΜΙΚΟΥ Β’ ΕΠΑΛ Οδυσσέας Λεβαντής-Μέλος Ομάδας Συγγραφής.
TEΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ T.E. ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΗΣ ΓΙΑ ΗΛΕΚΤΡΟΝΙΚΕΣ.
Πρόγραμμα Προπτυχιακών Σπουδών Ροή Λ: Λογισμικό Κώστας Κοντογιάννης Αναπλ. Καθηγητής Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Ε.Μ.Π.
ΤΡΟΠΟΣ ΣΥΓΓΡΑΦΗΣ ΕΠΙΣΤΗΜΟΝΙΚΩΝ ΕΡΓΑΣΙΩΝ
ΘΕΑΤΡΟΠΑΙΔΑΓΩΓΙΚΟ ΠΡΟΓΡΑΜΜΑ ΣΕ ΣΥΝΕΡΓΑΣΙΑ ΜΕ ΤΟ ΣΥΛΛΟΓΟ ΑΜΕΑ ΑΡΓΟΛΙΔΑΣ.
Ασκήσεις WEKA Δέντρα αποφάσεων.
ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ ΜΕ ΧΡΗΣΗ JAVA: ΤΟ ΛΟΓΙΣΜΙΚΟ WEKA
Ασκήσεις WEKA.
Προγραμματισμός έργων
Ασκήσεις WEKA Νευρωνικά δίκτυα.
Αντωνιάδου Σοφία Ζυγούρης Φώτης Καπουλίτσας Θανάσης
Πρόγραμμα Προπτυχιακών Σπουδών Ροή Λ: Λογισμικό
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ
Σχολή Διοίκησης & Οικονομίας Τμήμα Διοίκησης Επιχειρήσεων
Ανάπτυξη τηλεματικών υπηρεσιών από το Παν
ΣΕΜΙΝΑΡΙΟ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΙΚΑ ΘΕΜΑΤΑ ΠΩΛΗΣΕΩΝ ΚΑΙ ΠΡΟΔΙΑΓΡΑΦΕΣ ΥΛΙΚΟΥ & ΛΟΓΙΣΜΙΚΟΥ Β’ ΕΠΑΛ Οδυσσέας Λεβαντής-Μέλος Ομάδας Συγγραφής.
Παρουσίαση της ύλης του μαθήματος «Εφαρμογές Υπολογιστών»
Το μέγεθος και η κλίμακα της νανοκλίμακας
ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Μηχανικών Πληροφορικής ΤΕ
ΑΝΑΔΡΟΜΙΚΕΣ ΕΡΕΥΝΕΣ ‘ΤΑ ΕΡΕΥΝΗΤΙΚΑ ΔΕΔΟΜΕΝΑ ΑΣΘΕΝΩΝ ΚΑΙ ΜΑΡΤΥΡΩΝ
Πτυχιακή εργασία της Νικολαῒδου Μαρίας (ΑΜ: 3573)
ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ
Εφαρμογή Μεθοδολογίας ICONIX
Πάτρα, Μάρτιος 2010 Νέα Βάση Δεδομένων και Γραμμικές Συσχετίσεις Κύριων Παραμέτρων για τον Προκαταρκτικό Σχεδιασμό Πολιτικών Αεροχημάτων Συμπεριλαμβάνοντας.
Πείθουμε τους εαυτούς μας ότι η ζωή μας θα είναι καλύτερη όταν θα παντρευτούμε, θα αποκτήσουμε ένα μωρό, μετά ένα ακόμα. Μετά αγχωνόμαστε διότι τα παιδιά.
Η ΔΙΑΧΥΣΗ ΤΩΝ ΠΛΗΡΟΦΟΡΙΩΝ ΜΕΣΩ ΔΙΑΔΙΚΤΥΟΥ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΔΙΚΤΥΩΝ ΣΤΟΝ ΚΛΑΔΟ ΤΗΣ ΥΓΕΙΑΣ 1. Τσώνη Αλεξία, Μετ. Φοιτήτρια , Πανεπιστήμιο Πελοποννήσου, Τμήμα.
Αξιολόγηση της επίδοσης ενός οργανισμού σε θέματα ασφάλειας
«Βιβλιοθήκη ανοικτού εκπαιδευτικού λογισμικού ΠΣΔ:
Σκοπός Η συνοπτική παρουσίαση
Πείθουμε τους εαυτούς μας ότι η ζωή μας θα είναι καλύτερη όταν θα παντρευτούμε, θα αποκτήσουμε ένα μωρό, μετά ένα ακόμα. Μετά αγχωνόμαστε διότι τα παιδιά.
Πείθουμε τους εαυτούς μας ότι η ζωή μας θα είναι καλύτερη όταν θα παντρευτούμε, θα αποκτήσουμε ένα μωρό, μετά ένα ακόμα. Μετά αγχωνόμαστε διότι τα παιδιά.
Οι Κατευθύνσεις στο τμήμα Μηχανικών Πληροφορικής
ΠΑΚΕ Δυτικής Ελλάδας – Πελοποννήσου
Μεταγράφημα παρουσίασης:

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Ανακάλυψη Γνώσης από Βιολογικές Αλληλουχίες Αλεξανδρίδου Αναστασία Επιβλέπων Καθηγητής: Βλαχάβας Ιωάννης

2 Θέματα Παρουσίασης  Ανακάλυψη Γνώσης από Βάσεις Δεδομένων  Βιοπληροφορική  Σημείο Έναρξης Μετάφρασης  Υλοποίηση  Συγκρίσεις - Συμπεράσματα

3 Ανακάλυψη Γνώσης από Βάσεις Δεδομένων  Πρότυπα Πληροφόρησης από μάθηση χωρίς επίβλεψη.  Κανόνες Συσχέτισης  Ομαδοποίηση  Πρότυπα Πρόβλεψης από μάθηση με επίβλεψη  Κατηγοριοποίηση  Παλινδρόμηση (Γραμμική - Νευρωνικά Δίκτυα)  Bayes

4 Βιοπληροφορική Είναι η νέα επιστημονική περιοχή, αφοσιωμένη στη διαχείριση, ανάλυση, οργάνωση και ερμηνεία των βιολογικών δεδομένων με τη χρήση προηγμένων υπολογιστικών τεχνικών.  Γενωμική  Πρωτεωμική  Μικροσυστοιχίες  Τεχνική SAGE  Τράπεζες Δεδομένων

5 Σημείο Έναρξης Μετάφρασης (TIS)

6

7 Πρόβλεψη των TIS  Με Νευρωνικά Δίκτυα  Pedersen και Nielsen  Χατζηγεωργίου  Με Μηχανές Διανυσμάτων Υποστήριξης  Zien et al.  Με Δημιουργία και Επιλογή Χαρακτηριστικών  Zeng et al.  Liu et al.

8 Δημιουργία Χαρακτηριστικών Εφαρμόζεται σε κάθε υποψήφιο TIS ένα παράθυρο 203 θέσεων κεντραρισμένο στο TIS και αριθμούνται οι βάσεις. A C C G T A C ATG G G C A T  Θέσεις νουκλεοτιδικών βάσεων  k-grams (k=1…5)  In-frame 3-grams

9 Επιλογή Χαρακτηριστικών Επιλογή χαρακτηριστικών βασισμένη στη συσχέτιση (CFS) με 3-fold cross validation. Κρίνονται σημαντικά 9 χαρακτηριστικά. pos –3 in-frame upstream ATG in-frame downstream TAA, TAG, TGA, CTG, GAC,GAG, GCC  Ακολουθία Kozak GCC[A/G]CCATGG

10 Εκπαίδευση-Δοκιμή Ακολουθιών Μετά την επιλογή των χαρακτηριστικών, γίνεται η κατηγοριοποίηση με NB, SVM και C4.5 και υπολογισμός των  Ευαισθησία (sensitivity)  Ειδικότητα (specificity)  Ορθότητα (precision)  Ακρίβεια (accuracy)

11 Υλοποίηση Ακολουθήθηκε η προσέγγιση των Zeng et al. Χρησιμοποιήθηκαν 3312 ακολουθίες με ATGs. Στα δεδομένα εφαρμόζεται παράθυρο των 21, 33, 69, 201 θέσεων.  Δημιουργία Χαρακτηριστικών  Διαφορές μεταξύ των βάσεων  Θέση μιας βάσης σε ένα κωδικόνιο  Ύπαρξη Α ή G στη θέση –3  Απόσταση ATG από την αρχή της ακολουθίας και αύξουσα σειρά του ΑTG  Απόσταση κωδικονίου λήξης από το ATG  Συνολικά 524 χαρακτηριστικά

12 Υλοποίηση Για την επιλογή των χαρακτηριστικών εφαρμόζεται ο εκτιμητής Information Gain με αναζήτηση ταξινόμησης. Η πρόβλεψη γίνεται με κατηγοριοποίηση (C4.5) και 10- fold cross validation. Τα αποτελέσματα της ακρίβειας των προβλέψεων σε παράθυρο των 33 είναι 78,22%, των 69 είναι 80,99% και των 201 θέσεων είναι 89,98%.

13 Υλοποίηση Η προσθήκη του χαρακτηριστικού της απόστασης, της σειράς του ATG στην ακολουθία και η ύπαρξη κωδικονίου λήξης βελτιώνει τα αποτελέσματα. down 1G up ATG in down TGA pos –3 up down A-G difference down 2T up down C-T difference pos –1 down 3C a.Ευαισθησία (Sensitivity)= 0,944. b.Ειδικότητα (Specificity)= 0,738. c.Ορθότητα (Precision)= 0,917. d.Ακρίβεια (Accuracy)= 0,894.

14 Συγκρίσεις-Συμπεράσματα

15 Μελλοντική Εργασία  Μεγαλύτερα παράθυρα  Περισσότερα σύνολα δεδομένων  Περισσότερα χαρακτηριστικά που δε μελετήθηκαν

16 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Ανακάλυψη Γνώσης από Βιολογικές Αλληλουχίες Ευχαριστώ