Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Σημασιολογική πρόσβαση στην πληροφορία

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Σημασιολογική πρόσβαση στην πληροφορία"— Μεταγράφημα παρουσίασης:

1 Σημασιολογική πρόσβαση στην πληροφορία
Πάνος Κωνσταντόπουλος Πανεπιστήμιο Κρήτης και ΙΤΕ ΙΕΛ,

2 Ο όγκος των ψηφιακών δεδομένων
Ένα βιβλίο (κείμενο) ή μία φωτογραφία: ~ 1 Megabyte Τα βιβλία της Βιβλιοθήκης του Κογκρέσου (κείμενο): ~ 25 Terabytes Εκτιμώμενη ετήσια παγκόσμια παραγωγή δεδομένων: μερικά Exa(1018)bytes, εκ των οποίων: κείμενο: μερικά Tera(1012)bytes εικόνες, ήχος, αριθμητικά δεδομένα: τα υπόλοιπα >90% του συνόλου αποθηκεύονται ψηφιακώς Βλ.: Lyman & Varian, “How much information”, Τα περισσότερα δεν θα προσπελασθούν και χρησιμοποιηθούν ποτέ Ή, θα χαθούν στη λήθη Π. Κωνσταντόπουλος

3 Όψεις της ποσότητας πληροφορίας
Bytes Χώρος φυσικής μνήμης Μορφότυποι δεδομένων ASCII, PDF, HTML, XML, Word, JPEG, … Παραστάσεις δομής Σχεσιακοί πίνακες, DTD, XMLSchema, … Παραστάσεις διαδικασιών Γλώσσες προγραμματισμού, γλώσσες χειρισμού δεδομένων Αντικείμενα της υπό παράσταση «πραγματικότητας» πράγματα, ιδιότητες, γεγονότα, διαδικασίες,... Είδη αντικειμένων Εννοιολογικές κατηγορίες: η βάση των συλλογισμών Π. Κωνσταντόπουλος

4 Αυτόνομες πηγές πληροφοριών
Ένας μεγάλος αριθμός αυτόνομων πηγών παρέχουν τεράστιες ποσότητες ετερογενών πληροφοριών κατ’ εξοχήν, ο Παγκόσμιος Ιστός Ετερογένεια: Συντακτική διαφορετικές διεπαφές διαφορετικές παραστάσεις δεδομένων και λειτουργιών Σημασιολογική Ορολογική: διαφορετικές τιμές δεδομένων, ενδεχομένως από διαφορετικά σύνολα δεδομένων, ή φυσικές γλώσσες, αναφέρονται στα ίδια αντικείμενα Εννοιολογική: διαφορετικές εννοιοποιήσεις της πραγματικότητας Προβλήματα: Πρόσβαση στην πληροφορία και συλλογισμός Διαλειτουργικότητα Κλιμάκωση Κατ’ όγκον: νέα δεδομένα, νέες πηγές Θεματική: νέα θέματα Π. Κωνσταντόπουλος

5 Σημασιολογία Τα δεδομένα αποτελούν παραστάσεις των υπαρκτικών γεγονότων (φυσικών, νοητικών) Ως τέτοια, είναι συμβολικές δομές εκπεφρασμένες σε κάποια γλώσσα Μία γλώσσα περιλαμβάνει ένα σύνολο πρωτογενών συμβόλων: αλφάβητο ένα σύνολο κανόνων για την παραγωγή δομών (λέξεων, προτάσεων) από τα σύμβολα: συντακτικό ένα σύνολο απεικονίσεων από τις συμβολικές δομές στα υπαρκτικά γεγονότα που παριστάνουν: σημασία Η σημασία δεν είναι καθολική: Η σημασία δεν είναι μοναδική Η σημασία μεταβάλλεται στον χρόνο Π. Κωνσταντόπουλος

6 Ορισμοί της σημασίας Τί είναι «φις»; Έμμεσος Άμεσος, άτυπος
Κοινή αντίληψη μεταξύ προσώπων, που εμπλέκονται σε μία συζήτηση Έμμεσος Μεγαλύτερη σαφήνεια Περισσότερη διαλειτουργικότητα Μεγαλύτερη δυσκολία Φις: “εξάρτημα για την σύνδεση ηλεκτρικής συσκευής σε πρίζα” Άμεσος, άτυπος Τυπικός, ανθρωποκεντρικός Σχέδια και τεχνικά στοιχεία Τυπικός, μηχανοκεντρικός Τυπική λογική Π. Κωνσταντόπουλος

7 Αντιμετώπιση της ετερογένειας
Η ετερογένεια πρέπει να αντιμετωπισθεί διότι έτσι καθίσταται δυνατή η κοινωνία πληροφοριών και η ολοκλήρωση συστημάτων, η ανάκτηση πληροφορίας είναι συχνά επαναληπτική διεργασία. Συντακτική ετερογένεια: Πλατφόρμες και λειτουργικά συστήματα Παραστάσεις δεδομένων και συμβάσεις πρόσβασης Σημασιολογική ετερογένεια: η δυσχερέστερη στην αντιμετώπιση Προσέγγιση: Διατήρηση της ποικιλίας και της τοπικότητας Προώθηση συμφωνιών και σημασιολογικής συμβατότητας Μέσα: Παράσταση γνώσεων Οντολογίες και διαχείριση ορολογίας Πλαίσια αναφοράς / συμφραζόμενα Π. Κωνσταντόπουλος

8 Ανάκτηση πληροφορίας Παραδοσιακές εφαρμογές βάσεων δεδομένων:
Γνωστή δομή πληροφοριακού χώρου (σχήμα) Γνωστές πληροφοριακές ανάγκες Δίτιμες επερωτήσεις σε δομημένα δεδομένα στη στάθμη ατομικών υπάρξεων Παραδοσιακές εφαρμογές βιβλιοθηκών: Γνωστός πληροφοριακός χώρος(συχνά με τη βοήθεια βιβλιοθηκαρίου) Επερωτήσεις βάσει βιβλιογραφικών στοιχείων Επερωτήσεις κειμένου: δίτιμο, διανυσματικό, πιθανοκρατικό, κλπ. μοντέλα Η έννοια της συνάφειας Μέτρα επιδόσεων ανάκτησης πληροφορίας Ανάκληση: #(συναφών & ευρεθέντων) / #(συναφών) Ακρίβεια: #(συναφών & ευρεθέντων) / #(ευρεθέντων) Άλλα Η σπουδαιότητα της ακρίβειας αυξάνει με την ποσότητα των δεδομένων Π. Κωνσταντόπουλος

9 Ανάκτηση πληροφορίας – χαλάρωση των υποθέσεων
Μη οικείος πληροφοριακός χώρος Άγνωστο σχήμα ή δεδομένα καταλόγου Άγνωστα περιεχόμενα Άγνωστε πηγές πληροφοριών Κατά το πλείστον άγνωστες πληροφοριακές ανάγκες Ανάγκες μερικώς γνωστές Η μεταφορά του εμπορικού καταστήματος Διερευνητική, επαναληπτική διεργασία Κατανόηση του πληροφοριακού χώρου Προσδιορισμός των πληροφοριακών αναγκών Ανακάλυψη συναφών πηγών πληροφοριών Εκλέπτυνση ή αναθεώρηση των επερωτήσεων Καθοδήγηση του χρήστη Π. Κωνσταντόπουλος

10 Στόχος: ολοκληρωμένη πρόσβαση
χρήστης Σύστημα ολοκλήρωσης WWW Ψηφιακές βιβλιοθήκες Εταιρικές βάσεις δεδομένων Προσωπικές βάσεις δεδομένων Ενιαία πρόσβαση (view, ui) Συλλογή και συνδυασμός πληροφοριών Προσεγγίσεις: Διαμεσολαβητές Αποθήκες δεδομένων Π. Κωνσταντόπουλος

11 Ο Σημασιολογικός Ιστός
Σκοπός: να καταστούν τα δεδομένα του Παγκόσμιου Ιστού μηχανικώς επεξεργάσιμα. Για την ορθή επεξεργασία των δεδομένων απαιτείται τα προγράμματα να κατανοούν την σημασία αυτών Πώς επιτυγχάνουν τα προγράμματα αυτή την κατανόηση; Υφίσταται εξωτερικώς: τα δεδομένα χρησιμοποιούν ένα λεξιλόγιο (με τη σχετική σημασία), συμφωνημένη μέσα σε μια κοινότητα, και τα προγράμματα γράφονται έτσι ώστε να χρησιμοποιούν το λεξιλόγιο αυτό – η περίπτωση των περισσοτέρων εφαρμογών βάσεων δεδομένων. Η σημασία ορίζεται ρητώς μέσω μεταδεδομένων (όπως οι οντολογίες), με τη χρήση γλωσσών ικανών να αποδώσουν πλούσιο «νόημα» στα δεδομένα. Ιδιαιτερότητες του Ιστού:  Κλίμακα και ανοικτότητα Δυσχερής η δημιουργία μοντέλων κλειστού κόσμου, τόσο ως προς τα άτομα όσο και ως προς τους ορισμούς Υπάρχουν πολλές αυτόνομες πηγές και καθιερωμένα λεξιλόγια. Ταχεία και συνεχής αλλαγή. Π. Κωνσταντόπουλος

12 Χρήση μεταδεδομένων στον Ιστό: παραδείγματα βλ. http://www. ics. forth
Χρήση μεταδεδομένων στον Ιστό: παραδείγματα βλ. Κατάλογοι αντικειμένων και συλλογών Περιγραφή μεμονωμένων πόρων έγγραφα, σελίδες, εικόνες, ηχητικές εγγραφές, κλπ. Περιγραφή του περιεχομένου συλλογών Ιστότοποι, βάσεις δεδομένων, κατάλογοι, κλπ. Σχέσεις μεταξύ πόρων πίνακες περιεχομένων, κεφάλαια, εικόνες,... χάρτες ιστοτόπων Ανακάλυψη πόρων Βελτιωμένη ακρίβεια Οι μηχανές αναζήτησης μπορούν να «καταλάβουν» καλύτερα το περιεχόμενο μιας συγκεκριμένης σελίδας. Μεγαλύτερος αυτοματισμός στην αναζήτηση Π. Κωνσταντόπουλος

13 Χρήση μεταδεδομένων στον Ιστό: παραδείγματα ο.π.
Ηλεκτρονικό εμπόριο Εντοπισμός πωλητών, αγοραστών και προϊόντων έρευνα «χρυσού οδηγού» Συμφωνία επί των όρων πωλήσεως τιμές, όροι πληρωμής, πληροφορίες συμβολαίου Δοσοληψίες μηχανισμοί παρουσίασης, ημερομηνίες, όροι Πνευματικά δικαιώματα Συμβατικοί όροι σχετικοί με τα διακαιώματα χρήσης και διανομής ενός εγγράφου Έχει αναπτυχθεί μεγάλος αριθμός προτύπων μεταδεδομένων Π. Κωνσταντόπουλος

14 Κοινοτικοί ιστοί Ένας κοινοτικός ιστός είναι μία ομάδα ανθρώπων που έχουν κοινό πεδίο ενδιαφέροντος / εργασίας και πρόσβαση σε κοινό σύνολο πληροφοριακών πόρων. Π.χ., εμπόριο, εκπαίδευση, υγεία Στόχος: να δημιουργηθεί ένα μοναδικό σημείο ενιαίας, ολοκληρωμένης πρόσβασης σε ποικίλους πληροφοριακούς πόρους. Προσέγγιση: Προσιδιάζοντα στην κοινότητα μεταδεδομένα για την δημιουργία, διαχείριση και πρόσβαση στους πόρους. κοινές σημασιολογικές, δομικές και συντακτικές συμβάσεις για την ανταλλαγή περιγραφών πόρων. σημαντικά μεγέθη: UNSPSC:16506κλάσεις, Getty AAT: όροι, ODP: θέματα, 700M περιγραφών για 3,339,355 ιστότοπους. Π. Κωνσταντόπουλος

15 σημασιολογικές περιγραφές
Πύλες κοινοτικών ιστών προσαρμογή από: V. Christophides, “Community Webs (C-Web): Functionality and Architecture Issues” γνωσιακά σχήματα (οντολογίες, θησαυροί) σημασιολογικές περιγραφές πόρων <tag1> <tag2> <tag3> </tag1> ποικίλοι πληροφοριακοί πόροι Π. Κωνσταντόπουλος

16 Μία ψηφιακή βιβλιοθήκη ιστορικών εγγράφων από: P. Constantopoulos, M
Μία ψηφιακή βιβλιοθήκη ιστορικών εγγράφων από: P. Constantopoulos, M. Doerr, M. Theodoridou, M. Tzobanakis, “Historical documents as monuments and as sources”, CAA2002 Τα ιστορικά έγγραφα υπό διττή θεώρηση: ως μνημεία δημιουργία ψηφιακού αρχείου διαχείριση του φυσικού αρχείου ως πηγές περιγραφές περιεχομένου, μεταγραφές, μεταφράσεις θεματικός ευρετηριασμός Πλαίσιο εργασίας Τουρκικό Αρχείο Χανίων Σύστημα ταξινόμησης, τεκμηρίωσης και μικροφωτογράφισης του Τουρκικού Αρχείου Χανίων Έργο «ΑΡΧΟΝ» Πολυμεσικό σύστημα αρχειοθέτησης, υπομνηματισμού και ανάκτησης για τα ιστορικά αρχεία της Βικελαίας Δημοτικής Βιβλιοθήκης Τουρκικό Αρχείο Ηρακλείου Δημοτικό Αρχείο Ηρακλείου Ενετικό Αρχείο Π. Κωνσταντόπουλος

17 Στοιχεία αρχειακού καταλόγου
Item Document Entry Place Document Type Description Actor Archival Unit Date Translation Transcription kept in has translation has transcription has place of publishing has date of publishing has publisher has recipient quotes has type has date of entry Π. Κωνσταντόπουλος

18 Πολυεδρική θεματική περιγραφή
Place Activity Object Actor Time Description Activity Type refers to object invokes took place at refers to activity has type took place during Π. Κωνσταντόπουλος

19 Παράδειγμα ψηφιοποιημένου εγγράφου
Τουρκικό Αρχείο Ηρακλείου Α’ Ιεροδικαστικοί Κώδικες Βιβλίο 3, σελίδες Μετάφραση Τουρκικών Ιστορικών Εγγράφων Ν. Σταυρινίδη, Τόμος Α’, μετάφραση 499 Π. Κωνσταντόπουλος

20 Παράδειγμα περιγραφής εγγράφου
Publisher: Ιεροδικείο Place of publishing : Χάνδακας Date of publishing: 29 Recep 1082 1 Δεκ. 1671 has translation: Μετάφραση 499 kept in: ΚΑ 1.1 ΑΑ 3-106 refers to activity: Ανανέωση γάμου refers to object: Δωρεά γαμήλια μη προκαταβαλλόμενη 2000 άσπρα took place at: Χάνδακα invokes: Ιμπραχίμ Μπεσέ Μουσταφά Μπέης Π. Κωνσταντόπουλος

21 Βάση υπαρκτικών γεγονότων
Συλλογισμός Δράστες (πρόσωπα, οργανισμοί) Δραστηριότητες Αντικείμενα Πολυεδρικό σχήμα ενεργεί αφορά σε πασάς αγορά οικία πυρκαϊά Βάση υπαρκτικών γεγονότων Οικία Βελή Ομέρ Πασάς Πυρκαϊά 1658 Πράξη αγοράς43 Ψηφιακή βιβλιοθήκη εγγράφων

22 ΒΔ περιγραφών βάσει όρων της ιεραρχίας
Διαμεσολάβηση βάσει ταξινομικών ιεραρχιών από: Y. Tzitzikas, N. Spyratos, P. Constantopoulos: Mediators over Ontology-based Information Sources, WISE2001 Ταξινομική ιεραρχία ΒΔ περιγραφών βάσει όρων της ιεραρχίας Πηγή πληροφοριών Παραδείγματα Κατάλογοι Ιστού (π.χ., Yahoo!, Open Directory) Προσωπικοί «βιβλιοδείκτες» Ιεραρχικά σχήματα ταξινόμησης Π. Κωνσταντόπουλος

23 Artificial Intelligence
Ταξινομική ιεραρχία Ένα απλό είδος οντολογίας: Η ταξινομική ιεραρχία ορίζεται ως ένα ζεύγος (T,) όπου T : ένα σύνολο όρων  : μία σχέση υπαλληλίας επί του Τ, ανακλαστική και μεταβατική Η ισοδυναμία όρων ορίζεται ως: a  b  a  b  b  a Computer Science Databases Artificial Intelligence AI ConferenceArt Article JournalArt Παράδειγμα: Π. Κωνσταντόπουλος

24 Ερμηνεία και περιγραφή
Computer Science Databases Artificial Intelligence AI ConferenceArt Article JournalArt 1 2 Ερμηνεία όρων: Κάθε όρος σχετίζεται μ’ ένα σύνολο αντικειμένων I : T  2O Π.χ., Databases  {1}, ConferenceArt  {1,2} Περιγραφή αντικειμένων: Κάθε αντικειμένο σχετίζεται με μία σύζευξη όρων Π.χ., , Description(2) = AI  ConferenceArt Π. Κωνσταντόπουλος

25 Διαμεσολάβηση διαμεσολαβητής ταξινομική ιεραρχία αρθρώσεις
πηγές πληροφοριών Π. Κωνσταντόπουλος

26 Αρθρώσεις S1 PhotoCameras Miniature Instant Reflex S2 Products VideoCams SLRcams MobilePhones M Electronics Still Cameras Moving Picture a1 a2 Άρθρωση ai: μία σχέση υπαλληλίας μεταξύ όρων του [M] και όρων του [Si] ai  (TM  Ti)  (TM  Ti) Π. Κωνσταντόπουλος

27 Απάντηση επερωτήσεων [M] [S2] [S1] Μεταφράσεις της επερώτησης:
PhotoCameras Miniature Instant Reflex [M] Electronics Still Cameras Moving Picture [S2] Products VideoCams SLRcams MobilePhones Μεταφράσεις της επερώτησης: q1(Cameras)  PhotoCameras  Miniature  Instant  Reflex q2(Cameras)  VideoCams  SLRCams Π. Κωνσταντόπουλος

28 Πλεονεκτήματα των αρθρωμένων ιεραρχιών
Μέθοδος ολοκλήρωσης για την ενιαία πρόσβαση πηγών πληροφοριών που υποστηρίζονται από ταξινομικές ιεραρχίες, όπως οι κατάλογοι Ιστού (π.χ., Yahoo!, ODP) Π.χ., για τον ορισμό όψεων Ποικιλία λειτουργικών δυνατοτήτων των πηγών και των διαμεσολαβητών, ως προς την ικανοποίηση απαιτήσεων ακρίβειας και ανάκλησης άνω και κάτω προσέγγιση της επερώτησης κατά την μετάφραση ελάχιστο(βέβαιο) και μέγιστο (πιθανό) σύνολο απάντησης Η άρθρωση επιτρέπει την κατά βήματα ανάπτυξη και την φυσική εξέλιξη ενός δικτύου πληροφοριακών πόρων. Π. Κωνσταντόπουλος

29 Ευχαριστώ για την προσοχή σας ! Π. Κωνσταντόπουλος


Κατέβασμα ppt "Σημασιολογική πρόσβαση στην πληροφορία"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google