Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Σημασιολογική πρόσβαση στην πληροφορία Πάνος Κωνσταντόπουλος Πανεπιστήμιο Κρήτης και ΙΤΕ ΙΕΛ, 10.12.2002.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Σημασιολογική πρόσβαση στην πληροφορία Πάνος Κωνσταντόπουλος Πανεπιστήμιο Κρήτης και ΙΤΕ ΙΕΛ, 10.12.2002."— Μεταγράφημα παρουσίασης:

1 Σημασιολογική πρόσβαση στην πληροφορία Πάνος Κωνσταντόπουλος Πανεπιστήμιο Κρήτης και ΙΤΕ ΙΕΛ,

2 Π. Κωνσταντόπουλος2 Ο όγκος των ψηφιακών δεδομένων Ένα βιβλίο (κείμενο) ή μία φωτογραφία: ~ 1 Megabyte Τα βιβλία της Βιβλιοθήκης του Κογκρέσου (κείμενο): ~ 25 Terabytes Εκτιμώμενη ετήσια παγκόσμια παραγωγή δεδομένων: μερικά Exa(10 18 )bytes, εκ των οποίων: κείμενο: μερικά Tera(10 12 )bytes εικόνες, ήχος, αριθμητικά δεδομένα: τα υπόλοιπα >90% του συνόλου αποθηκεύονται ψηφιακώς Βλ.: Lyman & Varian, “How much information”, •Τα περισσότερα δεν θα προσπελασθούν και χρησιμοποιηθούν ποτέ •Ή, θα χαθούν στη λήθη

3 Π. Κωνσταντόπουλος3 Όψεις της ποσότητας πληροφορίας •Bytes –Χώρος φυσικής μνήμης •Μορφότυποι δεδομένων –ASCII, PDF, HTML, XML, Word, JPEG, … •Παραστάσεις δομής –Σχεσιακοί πίνακες, DTD, XMLSchema, … •Παραστάσεις διαδικασιών –Γλώσσες προγραμματισμού, γλώσσες χειρισμού δεδομένων •Αντικείμενα της υπό παράσταση «πραγματικότητας» –πράγματα, ιδιότητες, γεγονότα, διαδικασίες,... •Είδη αντικειμένων –Εννοιολογικές κατηγορίες: η βάση των συλλογισμών

4 Π. Κωνσταντόπουλος4 Αυτόνομες πηγές πληροφοριών •Ένας μεγάλος αριθμός αυτόνομων πηγών παρέχουν τεράστιες ποσότητες ετερογενών πληροφοριών –κατ’ εξοχήν, ο Παγκόσμιος Ιστός •Ετερογένεια: –Συντακτική •διαφορετικές διεπαφές •διαφορετικές παραστάσεις δεδομένων και λειτουργιών –Σημασιολογική •Ορολογική: διαφορετικές τιμές δεδομένων, ενδεχομένως από διαφορετικά σύνολα δεδομένων, ή φυσικές γλώσσες, αναφέρονται στα ίδια αντικείμενα •Εννοιολογική: διαφορετικές εννοιοποιήσεις της πραγματικότητας •Προβλήματα: –Πρόσβαση στην πληροφορία και συλλογισμός –Διαλειτουργικότητα –Κλιμάκωση •Κατ’ όγκον: νέα δεδομένα, νέες πηγές • Θεματική: νέα θέματα

5 Π. Κωνσταντόπουλος5 Σημασιολογία •Τα δεδομένα αποτελούν παραστάσεις των υπαρκτικών γεγονότων (φυσικών, νοητικών) •Ως τέτοια, είναι συμβολικές δομές εκπεφρασμένες σε κάποια γλώσσα •Μία γλώσσα περιλαμβάνει –ένα σύνολο πρωτογενών συμβόλων: αλφάβητο –ένα σύνολο κανόνων για την παραγωγή δομών (λέξεων, προτάσεων) από τα σύμβολα: συντακτικό –ένα σύνολο απεικονίσεων από τις συμβολικές δομές στα υπαρκτικά γεγονότα που παριστάνουν: σημασία •Η σημασία δεν είναι καθολική: –Η σημασία δεν είναι μοναδική –Η σημασία μεταβάλλεται στον χρόνο

6 Π. Κωνσταντόπουλος6 •Μεγαλύτερη σαφήνεια •Περισσότερη διαλειτουργικότητα •Μεγαλύτερη δυσκολία Ορισμοί της σημασίας Φις: “εξάρτημα για την σύνδεση ηλεκτρικής συσκευής σε πρίζα” Τυπικός, ανθρωποκεντρικός Άμεσος, άτυπος Έμμεσος Τυπικός, μηχανοκεντρικός Κοινή αντίληψη μεταξύ προσώπων, που εμπλέκονται σε μία συζήτηση Σχέδια και τεχνικά στοιχεία Τυπική λογική Τί είναι «φις»;

7 Π. Κωνσταντόπουλος7 Αντιμετώπιση της ετερογένειας •Η ετερογένεια πρέπει να αντιμετωπισθεί διότι –έτσι καθίσταται δυνατή η κοινωνία πληροφοριών και η ολοκλήρωση συστημάτων, –η ανάκτηση πληροφορίας είναι συχνά επαναληπτική διεργασία. Συντακτική ετερογένεια: •Πλατφόρμες και λειτουργικά συστήματα •Παραστάσεις δεδομένων και συμβάσεις πρόσβασης Σημασιολογική ετερογένεια: η δυσχερέστερη στην αντιμετώπιση •Προσέγγιση: –Διατήρηση της ποικιλίας και της τοπικότητας –Προώθηση συμφωνιών και σημασιολογικής συμβατότητας •Μέσα: –Παράσταση γνώσεων –Οντολογίες και διαχείριση ορολογίας –Πλαίσια αναφοράς / συμφραζόμενα

8 Π. Κωνσταντόπουλος8 Ανάκτηση πληροφορίας •Παραδοσιακές εφαρμογές βάσεων δεδομένων: –Γνωστή δομή πληροφοριακού χώρου (σχήμα) –Γνωστές πληροφοριακές ανάγκες –Δίτιμες επερωτήσεις σε δομημένα δεδομένα στη στάθμη ατομικών υπάρξεων •Παραδοσιακές εφαρμογές βιβλιοθηκών: –Γνωστός πληροφοριακός χώρος(συχνά με τη βοήθεια βιβλιοθηκαρίου) –Γνωστές πληροφοριακές ανάγκες –Επερωτήσεις βάσει βιβλιογραφικών στοιχείων –Επερωτήσεις κειμένου: δίτιμο, διανυσματικό, πιθανοκρατικό, κλπ. μοντέλα •Η έννοια της συνάφειας •Μέτρα επιδόσεων ανάκτησης πληροφορίας –Ανάκληση: #(συναφών & ευρεθέντων) / #(συναφών) –Ακρίβεια: #(συναφών & ευρεθέντων) / #(ευρεθέντων) –Άλλα •Η σπουδαιότητα της ακρίβειας αυξάνει με την ποσότητα των δεδομένων

9 Π. Κωνσταντόπουλος9 Ανάκτηση πληροφορίας – χαλάρωση των υποθέσεων •Μη οικείος πληροφοριακός χώρος –Άγνωστο σχήμα ή δεδομένα καταλόγου –Άγνωστα περιεχόμενα –Άγνωστε πηγές πληροφοριών •Κατά το πλείστον άγνωστες πληροφοριακές ανάγκες –Ανάγκες μερικώς γνωστές –Η μεταφορά του εμπορικού καταστήματος •Διερευνητική, επαναληπτική διεργασία –Κατανόηση του πληροφοριακού χώρου –Προσδιορισμός των πληροφοριακών αναγκών –Ανακάλυψη συναφών πηγών πληροφοριών –Εκλέπτυνση ή αναθεώρηση των επερωτήσεων –Καθοδήγηση του χρήστη

10 Π. Κωνσταντόπουλος10 Στόχος: ολοκληρωμένη πρόσβαση •Ενιαία πρόσβαση (view, ui) •Συλλογή και συνδυασμός πληροφοριών Προσεγγίσεις: •Διαμεσολαβητές •Αποθήκες δεδομένων Σύστημα ολοκλήρωσης WWW Ψηφιακές βιβλιοθήκες Εταιρικές βάσεις δεδομένων Προσωπικές βάσεις δεδομένων χρήστης

11 Π. Κωνσταντόπουλος11 Ο Σημασιολογικός Ιστός Σκοπός: να καταστούν τα δεδομένα του Παγκόσμιου Ιστού μηχανικώς επεξεργάσιμα. •Για την ορθή επεξεργασία των δεδομένων απαιτείται τα προγράμματα να κατανοούν την σημασία αυτών •Πώς επιτυγχάνουν τα προγράμματα αυτή την κατανόηση; –Υφίσταται εξωτερικώς: τα δεδομένα χρησιμοποιούν ένα λεξιλόγιο (με τη σχετική σημασία), συμφωνημένη μέσα σε μια κοινότητα, και τα προγράμματα γράφονται έτσι ώστε να χρησιμοποιούν το λεξιλόγιο αυτό – η περίπτωση των περισσοτέρων εφαρμογών βάσεων δεδομένων. –Η σημασία ορίζεται ρητώς μέσω μεταδεδομένων (όπως οι οντολογίες), με τη χρήση γλωσσών ικανών να αποδώσουν πλούσιο «νόημα» στα δεδομένα. •Ιδιαιτερότητες του Ιστού: –Κλίμακα και ανοικτότητα •Δυσχερής η δημιουργία μοντέλων κλειστού κόσμου, τόσο ως προς τα άτομα όσο και ως προς τους ορισμούς •Υπάρχουν πολλές αυτόνομες πηγές και καθιερωμένα λεξιλόγια. –Ταχεία και συνεχής αλλαγή.

12 Π. Κωνσταντόπουλος12 Χρήση μεταδεδομένων στον Ιστό: παραδείγματα βλ. Κατάλογοι αντικειμένων και συλλογών •Περιγραφή μεμονωμένων πόρων –έγγραφα, σελίδες, εικόνες, ηχητικές εγγραφές, κλπ. •Περιγραφή του περιεχομένου συλλογών –Ιστότοποι, βάσεις δεδομένων, κατάλογοι, κλπ. •Σχέσεις μεταξύ πόρων –πίνακες περιεχομένων, κεφάλαια, εικόνες,... –χάρτες ιστοτόπων Ανακάλυψη πόρων •Βελτιωμένη ακρίβεια –Οι μηχανές αναζήτησης μπορούν να «καταλάβουν» καλύτερα το περιεχόμενο μιας συγκεκριμένης σελίδας. •Μεγαλύτερος αυτοματισμός στην αναζήτηση

13 Π. Κωνσταντόπουλος13 Χρήση μεταδεδομένων στον Ιστό: παραδείγματα ο.π. Ηλεκτρονικό εμπόριο •Εντοπισμός πωλητών, αγοραστών και προϊόντων –έρευνα «χρυσού οδηγού» •Συμφωνία επί των όρων πωλήσεως –τιμές, όροι πληρωμής, πληροφορίες συμβολαίου •Δοσοληψίες –μηχανισμοί παρουσίασης, ημερομηνίες, όροι Πνευματικά δικαιώματα •Συμβατικοί όροι σχετικοί με τα διακαιώματα χρήσης και διανομής ενός εγγράφου Έχει αναπτυχθεί μεγάλος αριθμός προτύπων μεταδεδομένων

14 Π. Κωνσταντόπουλος14 Κοινοτικοί ιστοί Ένας κοινοτικός ιστός είναι μία ομάδα ανθρώπων που έχουν κοινό πεδίο ενδιαφέροντος / εργασίας και πρόσβαση σε κοινό σύνολο πληροφοριακών πόρων. Π.χ., εμπόριο, εκπαίδευση, υγεία Στόχος: να δημιουργηθεί ένα μοναδικό σημείο ενιαίας, ολοκληρωμένης πρόσβασης σε ποικίλους πληροφοριακούς πόρους. Προσέγγιση: •Προσιδιάζοντα στην κοινότητα μεταδεδομένα για την δημιουργία, διαχείριση και πρόσβαση στους πόρους. –κοινές σημασιολογικές, δομικές και συντακτικές συμβάσεις για την ανταλλαγή περιγραφών πόρων. – σημαντικά μεγέθη: UNSPSC:16506κλάσεις, Getty AAT: όροι, ODP: θέματα, 700M περιγραφών για 3,339,355 ιστότοπους.

15 Π. Κωνσταντόπουλος15 γνωσιακά σχήματα (οντολογίες, θησαυροί ) ποικίλοι πληροφοριακοί πόροι σημασιολογικές περιγραφές πόρων Πύλες κοινοτικών ιστών προσαρμογή από: V. Christophides, “Community Webs (C-Web): Functionality and Architecture Issues”

16 Π. Κωνσταντόπουλος16 Μία ψηφιακή βιβλιοθήκη ιστορικών εγγράφων από: P. Constantopoulos, M. Doerr, M. Theodoridou, M. Tzobanakis, “Historical documents as monuments and as sources”, CAA2002 Τα ιστορικά έγγραφα υπό διττή θεώρηση: •ως μνημεία –δημιουργία ψηφιακού αρχείου –διαχείριση του φυσικού αρχείου •ως πηγές –περιγραφές περιεχομένου, μεταγραφές, μεταφράσεις –θεματικός ευρετηριασμός Πλαίσιο εργασίας •Τουρκικό Αρχείο Χανίων Σύστημα ταξινόμησης, τεκμηρίωσης και μικροφωτογράφισης του Τουρκικού Αρχείου Χανίων •Έργο «ΑΡΧΟΝ» Πολυμεσικό σύστημα αρχειοθέτησης, υπομνηματισμού και ανάκτησης για τα ιστορικά αρχεία της Βικελαίας Δημοτικής Βιβλιοθήκης –Τουρκικό Αρχείο Ηρακλείου –Δημοτικό Αρχείο Ηρακλείου –Ενετικό Αρχείο

17 Π. Κωνσταντόπουλος17 Στοιχεία αρχειακού καταλόγου Item Document Entry Place Document Type Description Actor Archival Unit Actor Date Translation Transcription kept in has translation has transcription has place of publishing has date of publishing has publisher has recipient quotes has type Date has date of entry

18 Π. Κωνσταντόπουλος18 Πολυεδρική θεματική περιγραφή Place Activity Object Actor Time Activity Description Actor Object Time Place Activity Type refers to object invokes took place at refers to activity has type took place during

19 Π. Κωνσταντόπουλος19 Παράδειγμα ψηφιοποιημένου εγγράφου Μετάφραση Τουρκικών Ιστορικών Εγγράφων Ν. Σταυρινίδη, Τόμος Α’, μετάφραση 499 Τουρκικό Αρχείο Ηρακλείου Α’ Ιεροδικαστικοί Κώδικες Βιβλίο 3, σελίδες

20 Π. Κωνσταντόπουλος20 Publisher: Ιεροδικείο Place of publishing : Χάνδακας Date of publishing: 29 Recep Δεκ has translation: Μετάφραση 499 kept in: ΚΑ 1.1 ΑΑ refers to activity: Ανανέωση γάμου refers to object: Δωρεά γαμήλια μη προκαταβαλλόμενη 2000 άσπρα took place at: Χάνδακα invokes: Ιμπραχίμ Μπεσέ Μουσταφά Μπέης Παράδειγμα περιγραφής εγγράφου

21 Βάση υπαρκτικών γεγονότων Συλλογισμός Δράστες (πρόσωπα, οργανισμοί) Ομέρ Πασάς αγορά Αντικείμενα Πράξη αγοράς43 Πολυεδρικό σχήμα Ψηφιακή βιβλιοθήκη εγγράφων Δραστηριότητες πασάς Οικία Βελή οικία Πυρκαϊά 1658 πυρκαϊά αφορά σεενεργεί

22 Π. Κωνσταντόπουλος22 Διαμεσολάβηση βάσει ταξινομικών ιεραρχιών από: Y. Tzitzikas, N. Spyratos, P. Constantopoulos: Mediators over Ontology-based Information Sources, WISE2001 Ταξινομική ιεραρχία ΒΔ περιγραφών βάσει όρων της ιεραρχίας Πηγή πληροφοριών Παραδείγματα –Κατάλογοι Ιστού (π.χ., Yahoo!, Open Directory) –Προσωπικοί «βιβλιοδείκτες» –Ιεραρχικά σχήματα ταξινόμησης

23 Π. Κωνσταντόπουλος23 Ταξινομική ιεραρχία Ένα απλό είδος οντολογίας: Η ταξινομική ιεραρχία ορίζεται ως ένα ζεύγος (T,  ) όπου T : ένα σύνολο όρων  : μία σχέση υπαλληλίας επί του Τ, ανακλαστική και μεταβατική Η ισοδυναμία όρων ορίζεται ως: a  b  a  b  b  a Computer Science DatabasesArtificial Intelligence AI ConferenceArt Article JournalArt Παράδειγμα:

24 Π. Κωνσταντόπουλος24 Ερμηνεία και περιγραφή Computer Science DatabasesArtificial Intelligence AI ConferenceArt Article JournalArt 1 2 Ερμηνεία όρων: Κάθε όρος σχετίζεται μ’ ένα σύνολο αντικειμένων I : T  2 O Π.χ., Databases  {1}, ConferenceArt  {1,2} Περιγραφή αντικειμένων: Κάθε αντικειμένο σχετίζεται με μία σύζευξη όρων Π.χ.,, Description(2) = AI  ConferenceArt

25 Π. Κωνσταντόπουλος25 Διαμεσολάβηση διαμεσολαβητής ταξινομική ιεραρχία πηγές πληροφοριών αρθρώσεις

26 Π. Κωνσταντόπουλος26 Αρθρώσεις S1 PhotoCameras Miniature Instant Reflex S2 Products VideoCams SLRcams MobilePhones M Electronics Still Cameras Moving Picture Reflex a1a2 Άρθρωση a i : μία σχέση υπαλληλίας μεταξύ όρων του [M] και όρων του [S i ] a i  (T M  T i )  (T M  T i )

27 Π. Κωνσταντόπουλος27 Απάντηση επερωτήσεων [S1] PhotoCameras Miniature Instant Reflex [M] Electronics Still Cameras Moving Picture Reflex [S2] Products VideoCams SLRcams MobilePhones Μεταφράσεις της επερώτησης: q 1 (Cameras)  PhotoCameras  Miniature  Instant  Reflex q 2 (Cameras)  VideoCams  SLRCams

28 Π. Κωνσταντόπουλος28 Πλεονεκτήματα των αρθρωμένων ιεραρχιών •Μέθοδος ολοκλήρωσης για την ενιαία πρόσβαση πηγών πληροφοριών που υποστηρίζονται από ταξινομικές ιεραρχίες, όπως οι κατάλογοι Ιστού (π.χ., Yahoo!, ODP) –Π.χ., για τον ορισμό όψεων •Ποικιλία λειτουργικών δυνατοτήτων των πηγών και των διαμεσολαβητών, ως προς την ικανοποίηση απαιτήσεων ακρίβειας και ανάκλησης –άνω και κάτω προσέγγιση της επερώτησης κατά την μετάφραση –ελάχιστο(βέβαιο) και μέγιστο (πιθανό) σύνολο απάντησης •Η άρθρωση επιτρέπει την κατά βήματα ανάπτυξη και την φυσική εξέλιξη ενός δικτύου πληροφοριακών πόρων.

29 Π. Κωνσταντόπουλος29 Ευχαριστώ για την προσοχή σας !


Κατέβασμα ppt "Σημασιολογική πρόσβαση στην πληροφορία Πάνος Κωνσταντόπουλος Πανεπιστήμιο Κρήτης και ΙΤΕ ΙΕΛ, 10.12.2002."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google