Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Οντολογίες στην Βιοπληροφορική

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Οντολογίες στην Βιοπληροφορική"— Μεταγράφημα παρουσίασης:

1 Οντολογίες στην Βιοπληροφορική

2 ΠΕΡΙΕΧΟΜΕΝΑ Τι είναι βιοπληροφορική.
Γιατί οντολογίες στην βιοπληροφορική. Επισκόπηση της οντολογίας. Ορισμοί και απαιτήσεις. Πως χτίζεται μια οντολογία. Δυσκολίες στην οικοδόμηση μιας οντολογίας Εφαρμογές Resources για οντολογίες

3 ΤΙ ΕΙΝΑΙ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ;

4 Τι είναι Βιοπληροφορική
Βιο μοριακή βιολογία Πληροφορική επιστήμη των υπολογιστών Βιοπληροφορική επιλύει προβλήματα που προκύπτουν από τη βιολογία χρησιμοποιώντας μεθοδολογία από την επιστήμη υπολογιστών

5 Βιοπληροφορική και συναφείς επιστήμες
Επιστήμη των υπολογιστών Μαθηματικά και Στατιστική Βιολογία Ιατρική Χημεία Φυσική

6 Η Βιοπληροφορική σχετίζεται με:
Εξαγωγή ακολουθιών DNA από το γενετικό υλικό Σχολιασμός ακολουθιών (π.χ. με πληροφορίες από πειράματα) Κατανόηση του ελέγχου της έκφρασης των γονιδίων (δηλαδή κάτω από ποιες συνθήκες δημιουργούνται οι πρωτεΐνες από το DNA Τη σχέση μεταξύ την αλληλουχία αμινοξέων των πρωτεϊνών και τη δομή τους

7 Στόχος της έρευνας στη Βιοπληροφορική
Η κατανόηση της λειτουργίας των ζωντανών όντων Σχεδιασμός φαρμάκων Αναγνώριση γενετικών παραγόντων κινδύνου Γονιδιακή θεραπεία Γενετική τροποποίηση φυτών και ζώων Βελτίωση μέσων βιολογικού πολέμου

8 Βασικά ζητήματα Πώς θα ωφεληθεί η ανθρωπότητα
Γενετικά μεταλλαγμένα σπαρτά - αποφυγή μόλυνσης Γενετικά μεταλλαγμένη τροφή και επιπτώσεις Γονίδια και επιπτώσεις στη συμπεριφορά Όρια στις δοκιμές στα ζώα Γενετική θεραπεία – ξεπερνούν τα πλεονεκτήματα τους κινδύνους ;

9 ΓΙΑΤΙ ΟΝΤΟΛΟΓΙΕΣ ΣΤΗΝ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

10 Ιστορική αναδρομή Περίπου οκτώ έτη πριν, η οντολογίες ήταν σχεδόν άγνωστες έννοιες στη βιοπληροφορική, και ακόμα περισσότερο στη μοριακή βιολογία. Σήμερα, πολλά άρθρα βιοπληροφορικής τις αναφέρουν σχετικά με εφαρμογές text mining, data integration ή ως λύση σε προβλήματα ονοματολογίας και άλλων εφαρμογών.

11 Γιατί οντολογίες στην βιοπληροφορική;
Υπάρχει ένα πλήθος δεδομένων προσιτών μέσω του Διαδικτύου που καλύπτουν ένα μεγάλο εύρος από βιολογικές πληροφορίες. Το πλήθος των δεδομένων είναι αυτό που δημιουργεί προβλήματα στην έρευνα των βιολογικών φαινομένων και καθιστά απαραίτητη την χρήση οντολογιών.

12 Γιατί οντολογίες στην βιοπληροφορική;
Υπάρχουν διαφορές ανάμεσα στις υπάρχουσες βάσεις βιολογικών δεδομένων. διαφορές ορολογίας σημασιολογικές διαφορές

13 Γιατί οντολογίες στην βιοπληροφορική;
Οι ονομασίες των βιολογικών αντικειμένων, διαφέρουν μεταξύ των βάσεων δεδομένων και δεν ακολουθούν ένα ενοποιημένο σχέδιο. Οι σημαντικές βιολογικές έννοιες που είναι θεμελιώδεις στη μοριακή βιολογία είναι διφορούμενες.

14 Γιατί οντολογίες στην βιοπληροφορική;
Ένα παράδειγμα είναι η έννοια του γονιδίου. Για την GDB, ένα γονίδιο είναι ένα «κομμάτι DNA που μπορεί να μεταγραφεί και να μεταφραστεί σε μια πρωτεΐνη». Για τις Genbank και GSDB, ένα γονίδιο είναι «μια περιοχή DNA βιολογικού ενδιαφέροντος με ένα όνομα, που φέρει ένα γενετικό γνώρισμα» Υπάρχει μια σαφής σημασιολογική διάκριση μεταξύ των δύο εννοιών του γονιδίου αλλά και οι δύο συνεχίζουν να χρησιμοποιούνται με αποτέλεσμα να προσθέτουν πολυπλοκότητας στην ολοκληρωμένη έρευνα.

15 Γιατί οντολογίες στην βιοπληροφορική;
Η εμφάνιση της microarray τεχνολογίας για την ανάλυση της έκφρασης του mRNA απαιτεί ενιαία ορολογία, ώστε να μπορεί να γίνει η σύγκριση μεταξύ διαφορετικών πειραμάτων.

16 Γιατί οντολογίες στην βιοπληροφορική;
Ένας άλλος λόγος που απαιτεί την ενοποιημένη ονοματολογία στη βιολογία είναι η συγχώνευση των διαφορετικών επιμέρους ερευνητικών πεδίων που άρχισαν παλιότερα ανεξάρτητα, αλλά τώρα με μια πιο ολοκληρωμένη προσέγγιση ενσωματώθηκαν στη βιολογία. (π.χ. τη γενετική, τη βιοχημεία, τη φαρμακολογία).

17 ΕΠΙΣΚΟΠΗΣΗ ΤΗΣ ΟΝΤΟΛΟΓΙΑΣ

18 Επισκόπηση της οντολογίας
Υπάρχει διάκριση μεταξύ της οντολογίας, η οποία έχει να κάνει με μελέτη της ύπαρξης ως κλάδος της φιλοσοφίας και των μεμονωμένων οντολογιών, οι οποίες είναι το αποτέλεσμα της ανάλυσης μιας ιδιαίτερης περιοχής ενδιαφέροντος.

19 Επισκόπηση της οντολογίας
Οι οντολογίες μπορούν να ποικίλουν ανάλογα με το πεδίο και το περιεχόμενο. Διακρίνονται σε: upper-level οντολογίες που ενδιαφέρονται πρώτιστα για τις γενικές έννοιες υψηλού επιπέδου που είναι η βάση στην κατανόησή μιας ιδιαίτερης περιοχής. οντολογίες εφαρμογής, οι οποίες είναι εντοπισμένες γύρω από μια περιοχή εφαρμογής. οντολογίες εργασιών που δημιουργούνται για την επίλυση ενός συγκεκριμένου προβλήματος.

20 Επισκόπηση της οντολογίας
Βεβαίως, οι οντολογίες δεν μπορούν να παραμένουν σταθερές αλλά θα πρέπει να ενημερώνονται λαμβάνοντας υπόψη τα νέα πειραματικά δεδομένα, την καινούργια γνώσης και τις αλλαγές της ορολογίας.

21 Επισκόπηση της οντολογίας

22 Upper-level οντολογίες
Το πρώτο παράδειγμα οντολογίας ήταν του Αριστοτέλης ( π.Χ.) όπου «κατηγοριοποίησε» αυτά που μπορούμε να μάθουμε ως εξής: Ουσία Ποσότητα Ποιότητα Σχέση Θέση Χρόνος Κατάσταση Όρος Δράση Αγάπη

23 Upper-level οντολογίες
Μια από τις πρώτες υπολογιστικές οντολογίες είναι Cyc. Η Cyc είναι μια οντολογία που αναπτύχθηκε για να καλύψει την καθημερινή γνώση κοινής λογικής. Η Cyc περιέχει μια μεγάλη και λεπτομερή συλλογή καλά τεκμηριωμένων εννοιών αλλά είναι περιορισμένης χρήσης για τη μοριακή βιολογία. Η Cyc δεν περιλαμβάνει σημαντική ποσότητα εννοιών σχετικών με τη μοριακή βιολογία δεδομένου ότι είχε ως σκοπό να είναι μια καθολική οντολογία και μόνο η πολύ βασική γνώση για τη χημεία και τη βιολογία έχει προστεθεί.

24 Upper-level οντολογίες

25 Upper-level οντολογίες
Μια άλλη φιλοσοφικά παρακινημένη upper-level οντολογία είναι η MBO (Molecular Biology Ontology). Αυτή αρχίζει από έναν κόμβο και επεκτείνεται στις έννοιες που είναι σχετικές για τη βιολογία και τη βιοπληροφορική.

26 Upper-level οντολογίες

27 ΟΡΙΣΜΟΙ ΚΑΙ ΑΠΑΙΤΗΣΕΙΣ

28 Ορισμοί Υπάρχουν τρεις ορισμοί των οντολογιών:
Σύστημα κατηγοριών που αποτελούν ένα μεμονωμένο «κομμάτι» του κόσμου. Λεπτομερείς περιγραφή μιας αντίληψης. Συνοπτική και σαφής περιγραφή των σχετικών οντοτήτων με τις πιθανές σχέσεις της μία με την άλλη.

29 Απαιτήσεις Κάθε έννοια στην οντολογία πρέπει να οριστεί ακριβώς. Οι ορισμοί είναι η βάση για τις σχέσεις μεταξύ των εννοιών και για τη σημασιολογική αποσαφήνιση τους.

30 Απαιτήσεις Τα πιο κοινά προβλήματα κατά τον καθορισμό των εννοιών είναι: Ο ορισμός να έχει δημιουργηθεί μόνο από αρνήσεις, π.χ. «η πρωτεΐνη δεν αποτελείται από DNA». Αυτό αφήνει τον καθορισμό ακόμα ευρύς και ανοικτό. Ο ορισμός να είναι πολύ γενικός, π.χ. «οι πρωτεΐνες είναι χημικές ουσίες». Ο ορισμός να είναι πολύ στενός, π.χ. "πρωτεΐνες είναι ομοιοπολικές σειρές αμινοξέων". Η έννοια να χρησιμοποιείται μέσα στον ορισμό, π.χ. "η πρωτεΐνη αποτελείται από την πρωτεϊνική αλυσίδα".

31 Απαιτήσεις Το σύνολο εννοιών που υπάρχουν σε μια οντολογία πρέπει να περιλαμβάνει τη μεγάλη πλειοψηφία των σχετικών εννοιών του πεδίου εφαρμογής. Διαφορετικά, το υπολογιστικό συμπέρασμα θα σταματά σε απροσδιόριστες έννοιες.

32 Απαιτήσεις Πρέπει να υπάρχει μια συγκεκριμένη δομής της οντολογίας.
Τυποποιημένες διαδικασίες που να προσθέσουν, να τροποποιήσουν ή να κινήσουν έννοιες στην οντολογία. Κανόνες για το πώς η οντολογία και οι έννοιές τους μπορούν να χρησιμοποιηθούν.

33 ΠΩΣ ΧΤΙΖΕΤΑΙ ΜΙΑ ΟΝΤΟΛΟΓΙΑ

34 Δομικές Μονάδες Οι δομικές μονάδες μιας οντολογίας είναι οι ακόλουθες: Έννοιες. Μαζί με τους ορισμούς τους, οι έννοιες είναι τα σημασιολογικά "άτομα" σε μια οντολογία. Προτάσεις: Αυτές χρησιμοποιούνται στους ορισμούς των εννοιών. Αξιώματα. Αυτές οι δηλώσεις υποθέτουμε ότι είναι αληθινές και δεν μπορούν να αποδειχθούν. Το σύνολο αξιωμάτων πρέπει να είναι λογικά συνεπές.

35 Πως χτίζεται μια οντολογία
Λόγω των διάφορων πεδίων και των χρήσεων των οντολογιών υπάρχουν διάφοροι τρόποι με τους οποίους μπορεί να χτιστεί μία οντολογία.

36 Πως χτίζεται μια οντολογία
Ανακαλύπτουμε και γράφουμε έναν μοναδικό ορισμό για κάθε έννοια. Αυτός ο ορισμός πρέπει να είναι αρκετά ακριβής ώστε να κάνει διακριτή την κάθε έννοια από όλες τις άλλες έννοιες στην οντολογία, και πρέπει να είναι αρκετά λεπτομερείς ώστε να παρέχει μια σαφή κατανόηση της έννοιάς του.

37 Πως χτίζεται μια οντολογία
Πρέπει να είμαστε κατηγορηματικοί όταν οι υποκατηγορίες δεν συνδέονται. Αυτό βοηθά πολύ κατά την έρευνα μέσω της ιεραρχίας των υποκατηγοριών.

38 Πως χτίζεται μια οντολογία
Πρέπει να καθορίζουμε την πλήρη συνδετικότητα των εννοιών. Με αυτό τον τρόπο όλες οι έννοιες καθορίζονται με συνέπεια σε σχέση με την αναφερόμενη οντολογία ενώ το αντίθετο θα μπορούσε να προκαλέσει συγκρουόμενες ή επικαλυπτόμενες έννοιες.

39 Πως χτίζεται μια οντολογία
Χρησιμοποιείται στην αρχή της οντολογίας μία έννοια μόνο. Αυτή η έννοια μπορεί να είναι επιλεγμένη αρκετά γενικά ώστε να περιλάβει την ποικιλία των σχετικών εννοιών.

40 Πως χτίζεται μια οντολογία
Προστίθεται γνώση υποβάθρου για κάθε έννοια για να εκφραστούν οι σχετικές ιδιότητες. Προστίθενται links, λέξεις κλειδιά, βάσεις δεδομένων, ώστε με αυτόν τον τρόπο να γίνεται η σύνδεση της οντολογία με μια εφαρμογή.

41 ΔΥΣΚΟΛΙΕΣ ΣΤΗΝ ΟΙΚΟΔΟΜΗΣΗ ΜΙΑΣ ΟΝΤΟΛΟΓΙΑΣ

42 Δυσκολίες Υπάρχουν διάφορες δυσκολίες που συναντάμε κατά το οικοδόμηση μιας οντολογίας. Μερικές δυσκολίες είναι έμφυτες στη διαδικασία οικοδόμησης της οντολογίας, ενώ άλλες προκύπτουν από το πεδίο εφαρμογής.

43 Δυσκολίες Ελλιπή οντολογικά στοιχεία Στις σχέσεις μεταξύ των εννοιών
ελλιπείς κατηγορίες ελλιπείς ιδιότητες/σχέσεις Στις σχέσεις μεταξύ των εννοιών 1:1 εναντίον 1:Many 1:Many εναντίον Many:Many Υπέρ-ορισμένα περιττά οντολογικά στοιχεία Λεπτομέρειες που δεν είναι σχετικές με την έννοια

44 ΕΦΑΡΜΟΓΕΣ ΤΩΝ ΒΙΟ-ΟΝΤΟΛΟΓΙΩΝ

45 Εφαρμογές Οι οντολογίες μπορούν να παρέχουν στα προγράμματα υπολογιστών ένα μεγάλο μέρος της γνώσης που οι βιολόγοι χρησιμοποιούν. Δύο βασικές εφαρμογές είναι ,οι Data integration και Data annotation

46 Εφαρμογές Η ολοκλήρωση δεδομένων (Data Integration) αντιμετωπίζει τo πρόβλημα της συντακτικής και σημασιολογικής ετερογένειας. Δεδομένων Ν βάσεων, κάθε βάση πρέπει να συμφωνεί με κάθε άλλη βάση. Έτσι πρέπει να γίνουν ΝxΝ προσπάθειες για την ολοκλήρωση των δεδομένων. Αντίθετα εάν υπάρχει μια οντολογία με την οποία θα «ευθυγραμμιστούν» όλες οι βάσεις οι προσπάθειες μειώνονται σε Ν.

47 Εφαρμογές Για το Data annotation δεν είναι απαραίτητη μία ολόκληρη οντολογία όπως την περιγράψαμε ανωτέρω αλλά μόνο ένα ελεγχόμενο λεξιλόγιο σαν αυτό που δημιουργηθεί για το πρόγραμμα GeneOntology (GO).

48 Resources on Bio-ontologies
Protégé 2000, an ontology editing software from Stanford medical Informatics is at GKB Editor, the Generic Knowledge Base Editor of Peter Karp and SRI can be found at OilEd, a simple ontology editor resides at The Semantic Web Community Portal at has lot's of ontology related information and pointers. Ongoing KBS/Ontology Projects and Groups are listed at

49 Resources on Bio-ontologies
OntoWeb is a European funded network on ontology-based information exchange for knowledge management and electronic commerce at On-To-Knowledge: Content-driven Knowledge-Management through Evolving Ontologies is a European funded research project at The previous Bio-Ontologies Workshop's webpage is at Cycorp has ist own webpage at Formal Ontology in Information Systems is an international conference series on ontologies with a webpage at Ontologies for eCommerce can be found at

50 Αναφορές Fasman, K. H., Letovsky, S. I., Cottingham, R. W. and Kingsbury, D. T. (1996). Improvements to the GDB Human Genome Data Base. Nucleic Acids Res. 24, Bernstein, F. C., Koetzle, T. F., Williams, G. J. B., Meyer, E. F., Brice, M. D., Rodgers, J. R., Shimanouchi, O. K. T. and Tasumi, M. (1977). The Protein Data Bank: a computer-based archival file for macromolecular structures. J. Mol. Biol. 112, McKusick, V. A. (1994). Mendelian Inheritance in Man. Catalogs of Human Genes and Genetic Disorders. Baltimore, MD: Johns Hopkins University Press, 11 ed.

51 Αναφορές Bairoch, A. (1993). The ENZYME data bank. Nucleic Acids Res. 21, Benson, D. A., Boguski, M. S., Lipman, D. J. and Ostell, J. (1997). GenBank. Nucleic Acids Res. 25, 1-6. Mahesh, K. and Nirenburg, S. (1995). A Situated Ontology for Practical NLP. In: Proc. Workshop on Basic Ontological Issues in Knowledge Sharing, International Joint Conference on Artificial Intelligence (IJCAI-95), Aug , Montreal, Canada. Guarino, N. (1998). Some Ontological Principles for Designing Upper Level Lexical Resources. In: Proceedings of First International Conference on Language Resources and Evaluation. Granada, Spain.

52 Αναφορές Lenat, D. B. (1995). Cyc: A Large-Scale Investment in Knowledge Infrastructure. Communications of the ACM 38, Schulze-Kremer, S. (1998). Ontologies for Molecular Biology. Pac. Symp. Biocomput. 3, Uschold, M. and Gruninger, M. (1996). Ontologies: Principles, methods and applications. Knowledge Engineering Review, 11(2). Köhler, J. and Schulze-Kremer, S. (2002). The Semantic Metadatabase (SEMEDA): Ontology Based Integration of Federated Molecular Biological Data Sources. In Silico Biology 2, 0021.


Κατέβασμα ppt "Οντολογίες στην Βιοπληροφορική"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google