Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Διασυνδεδεμένα Δεδομένα για τον Σημασιολογικό Ιστό

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Διασυνδεδεμένα Δεδομένα για τον Σημασιολογικό Ιστό"— Μεταγράφημα παρουσίασης:

1 Διασυνδεδεμένα Δεδομένα για τον Σημασιολογικό Ιστό
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ Ακαδημαϊκό έτος: Τίτλος Εργασίας: Διασυνδεδεμένα Δεδομένα για τον Σημασιολογικό Ιστό Ονοματεπώνυμο: Σουπιώνης Ευριπίδης Επόπτης: Παπαδάκης Ιωάννης

2 Διασυνδεδεμένα Δεδομένα
Ορισμοί Δεδομένο: Γεγονός ή αρχή ανεπίδεκτη αμφισβητήσεως, ή γεγονός το οποίο αποτελεί αφορμή κάποιας σκέψης από τον άνθρωπο. (Δημητράκος, 1950) Δεδομένα: Σύνολο γεγονότων από τα οποία μπορούν να εξαχθούν συμπεράσματα. (Webster's Online Dictionary) Δεδομένα: Θεμελιώδη, πρωταρχικά στοιχεία αποτύπωσης, αναπαράστασης ή οικοδόμησης της πληροφορίας και κατ' επέκταση γνώσης. «Διασυνδεδεμένα Δεδομένα» (Linked Data): Σύνολο βέλτιστων πρακτικών για την δημοσίευση και διασύνδεση δομημένων δεδομένων στον Ιστό. (Bizer & Heath & Berners Lee)

3 Διασυνδεδεμένα Δεδομένα στο Ψηφιακό Τοπίο
Σημασιολογικός Ιστός (Semantic Web): Ένα οικοσύστημα αλληλεπίδρασης ανάμεσα σε συστήματα υπολογιστών, το οποίο διέπεται από κανόνες για τις υπηρεσίες διαδοχικών επιπέδων και για την ανταλλαγή των δεδομένων, και περιλαμβάνει περιεχόμενο δημιουργημένο από ανθρώπους που διαβαθμίζεται από μηχαναγνώσιμα δεδομένα. (Gruber, 2006) Σημασιολογικός Ιστός → Όραμα του Tim Berners Lee (Berners Lee T, Hendler J,Lassila O. The Semantic Web. Scientific American (5):28– Dec 31) Διασυνδεδεμένα Δεδομένα→ Πυρήνας του Σημασιολογικού Ιστού Υιοθέτηση πρακτικών Διασυνδεδεμένων Δεδομένων → Δημιουργία Ιστού Δεδομένων Ιστός Δεδομένων (Web of Data): Παγκόσμιος χώρος δεδομένων που περιλαμβάνει δισεκατομμύρια δηλώσεις (RDF).

4 Αρχές Διασυνδεδεμένων Δεδομένων
O Berners-Lee (2006), διατύπωσε τους παρακάτω κανόνες για τη δημοσίευση δεδομένων στον Ιστό: 1. Χρησιμοποιείτε URIs ως ονόματα για τα πράγματα (Οντότητες). 2. Χρησιμοποιείτε HTTP URIs, ώστε οι άλλοι χρήστες να μπορούν να αναζητήσουν αυτά τα ονόματα. 3. Όταν κάποιος αναζητά ένα URI, να παρέχετε χρήσιμες πληροφορίες, χρησιμοποιώντας τα πρότυπα (RDF, SPARQL). 4. Συμπεριλάβετε συνδέσμους προς άλλα URIs, ώστε οι άλλοι χρήστες να μπορούν να ανακαλύψουν και άλλα πράγματα.

5 Τεχνολογικά Πρότυπα Διασυνδεδεμένων Δεδομένων
UNICODE→ Διεθνές Πρότυπο Κωδικοποίησης Χαρακτήρων. URI→ Ονοματοδοσία-Αναγνώριση Ψηφιακών Οντοτήτων XML→Γλώσσα Σημειοθέτησης Ηλεκτρονικών Εγγράφων XML Schema→Ορισμός Χώρων Ονομάτων & Ενσωμάτωση Ορισμών RDF→ Εννοιολογική Περιγραφή & Μοντελοποίηση της Πληροφορίας RDF Schema→ Δημιουργία Δηλώσεων & Ορισμός Λεξιλογίων OWL→ Ορισμός Οντολογιών N3→ Βελτιστοποίηση Έκφρασης Δηλώσεων RDF SPARQL→ Γλώσσα Ερωτημάτων προς RDF Γράφους.

6 Διαστρωμάτωση του Ιστού

7 Linking Open Data Project
Έναρξη: Ιανουάριος 2007 – Πρωτοβουλία του Open Data Movement Υποστήριξη: Semantic Web Education and Outreach Group της W3C Στόχος→ Επέκταση του Ιστού Δεδομένων Έργο→ Αναγνώριση των υπαρχόντων συνόλων δεδομένων που διατίθενται υπό ανοιχτές άδειες χρήσης. → Μετατροπή τους σε μορφή RDF και διασύνδεση σύμφωνα με τις αρχές των Διασυνδεδεμένων Δεδομένων. → Δημοσίευση τους στον Ιστό. Συμμετέχοντες: Βιβλιοθήκη του Κογκρέσου, Thomson Reuters, BBC κ.α

8 Το Σύννεφο των Συνόλων Διασυνδεδεμένων Δεδομένων του LOD

9 DBpedia Έναρξη: 23 Ιανουαρίου 2007
Συμμετοχή-Υποστήριξη: Πανεπιστήμιο του Βερολίνου (Freie Universitat Berlin) & Πανεπιστήμιο της Λειψίας (Universitat Leipzig) & εταιρεία OpenLink Software. Στόχοι: 1. Η εξαγωγή δομημένων πληροφοριών από την Wikipedia 2. Η διασύνδεση των δεδομένων της Wikipedia με σχετιζόμενα άλλων συνόλων δεδομένων 3. Να αποτελέσει πεδίο δοκιμών για εφαρμογές Ιστού 4. Να αναπτύξει διεπαφές πρόσβασης στο σύνολο Δεδομένων της Εργασία→ Αυτοματοποιημένη εξαγωγή των δομημένων δεδομένων από την Wikipedia, ενσωμάτωση τους σε σύνολα Διασυνδεδεμένων Δεδομένων και δημοσίευση τους. Μέγεθος Βάσης Γνώσης DBpedia= 3,4 εκατομμύρια οντότητες (Things)

10 Πρόσβαση στη Βάση Γνώσης της DBpedia
Το πρόγραμμα της DBpedia παρέχει τη δυνατότητα λήψης αλλά και υποβολής ερωτημάτων προς τα υποσύνολα δεδομένων της μέσω ενός δημοσίου ακραίου σημείου SPARQL. < Οι χρήστες έχουν την δυνατότητα να υποβάλλουν τα ερωτήματα τους μέσω των ακόλουθων υπηρεσιών: Το δημιουργό ερωτημάτων Leipzig Query Builder:< Τον αλληλεπιδραστικό δημιουργό ερωτημάτων της OpenLink (iSPARQL): < Τον εξερευνητή ερωτημάτων SPARQL: <

11 Υποβολή Ενδεικτικών Ερωτημάτων προς τον Εξερευνητή Ερωτημάτων SPARQL
Προκειμένου να διαπιστώσουμε τις δυνατότητες ανάκτησης πληροφορίας που προσφέρει η DBpedia στα υποσύνολα δεδομένων της αποφασίσαμε στο πλαίσιο αυτής της εργασίας την υποβολή έντεκα ενδεικτικών ερωτημάτων προς αυτά. Ως εργαλείο υποβολής των ερωτημάτων χρησιμοποιήθηκε ο εξερευνητής ερωτημάτων SPARQL. Τα ερωτήματα που υποβλήθηκαν διέφεραν μεταξύ τους ως προς τον βαθμό πολυπλοκότητας.

12 Πρώτο Ερώτημα Να βρεθεί η τιμή τις ετικέτας του πόρου της DBpedia που αφορά στην έννοια του «Αυτισμού».

13 Τα αποτελέσματα του πρώτου ερωτήματος

14 Πέμπτο Ερώτημα Να βρεθεί η τιμή του κλειδιού “Genre” του πόρου της DBpedia που αφορά στο συγκρότημα “The Beatles”.

15 Τα αποτελέσματα του πέμπτου ερωτήματος

16 Ένατο Ερώτημα Να βρεθούν οι τιμές των ονομάτων των ανθρώπων οι οποίοι ανήκουν στο καλλιτεχνικό κίνημα του Rococo και το πεδίο της τέχνης στο οποίο δραστηριοποιούνται είναι η ζωγραφική.

17 Τα αποτελέσματα του ένατου ερωτήματος

18 Να βρεθούν οι τιμές των ονομάτων και των χρονολογιών γέννησης
Ενδέκατο Ερώτημα Να βρεθούν οι τιμές των ονομάτων και των χρονολογιών γέννησης των ανθρώπων, οι οποίοι γεννήθηκαν στην Γαλλία πριν από το έτος 1830 και ανήκουν στην κατηγορία των Γάλλων ιστορικών μυθιστοριογράφων της DBpedia.

19 Τα αποτελέσματα του ενδέκατου ερωτήματος

20 Συμπεράσματα (1) Η διασύνδεση των δεδομένων είναι η προστιθέμενη αξία που τους προσφέρει η δημοσίευση στον Ιστό. Τα Διασυνδεδεμένα Δεδομένα βρίσκονται στον πυρήνα του Σημασιολογικού Ιστού. Οι Αρχές των Διασυνδεδεμένων Δεδομένων υιοθετούνται από έναν συνεχώς αυξανόμενο αριθμό παροχέων δεδομένων επεκτείνοντας τα όρια του Σημασιολογικού Ιστού. Το πρόγραμμα Linking Open Data έχει σημαντική συμβολή στην ανάπτυξη του Ιστού Δεδομένων. Το σύνολο δεδομένων της DBpedia τοποθετείται στο κέντρο του Ιστού Δεδομένων λόγω του μεγέθους και της διαθεματικότητας των δεδομένων του.

21 Συμπεράσματα (2) Η DBpedia παρέχει πρόσβαση στο σύνολο δεδομένων της μέσω ενός δημόσιου ακραίου σημείου SPARQL και των υπηρεσιών που οικοδομούνται πάνω σε αυτό. Το σύνολο δεδομένων της DBpedia προερχόμενο από αυτοματοποιημένη εξαγωγή δεδομένων από την Wikipedia παρουσιάζει αδυναμίες όπως δομικά κενά στο σύνολο των κλειδιών των πληροφοριακών κουτιών, παραλήψεις τιμών, διπλότυπα ίδιων κλάσεων και ετερονυμία ομοειδών ιδιοτήτων που δυσχεραίνουν την αποτελεσματική ανάκτηση πληροφορίας. Προϋπόθεση σχηματισμού αποτελεσματικών ερωτημάτων SPARQL προς το σύνολο δεδομένων της DBpedia είναι η γνώση των σχημάτων και λεξιλογίων περιγραφής των ιδιοτήτων των πόρων των RDF γράφων.

22 Τέλος Παρουσίασης Σας ευχαριστώ για την προσοχή σας! Ερωτήσεις;


Κατέβασμα ppt "Διασυνδεδεμένα Δεδομένα για τον Σημασιολογικό Ιστό"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google