Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ: ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ: ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ."— Μεταγράφημα παρουσίασης:

1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ: ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ «Τεχνικές Σημασιολογικού Ιστού για πολλαπλές προβολές σε ετερογενείς συλλογές Ινστιτούτων Πολιτιστικής Κληρονομιάς» Σοφία Καρδαμύλα Εργασία στο μάθημα: Ηλεκτρονική Δημοσίευση Διδάσκον καθηγητής: Σαράντος Καπιδάκης Αθήνα 2007

2 Επισκόπηση Θεμάτων  Συλλογή Illuminated Manuscript  Συλλογή ARIA Masterpieces  Μεθοδολογία πρόσβασης στις συλλογές χρησιμοποιώντας τις δυνατότητες & τα όρια της τρέχουσας τεχνολογίας του Σημασιολογικού Ιστού  Αποτελέσματα  Συμπεράσματα  Προβληματισμοί

3  Τα Ινστιτούτα Πολιτιστικής Κληρονομιάς (CH) φέρουν σημαντικές πληροφορίες για την ανάπτυξη του πολιτισμού.  Οι συλλογές των Ινστιτούτων Πολιτιστικής Κληρονομιάς ( CH) είναι ετερογενείς: Περιέχουν διαφορετικά είδη αντικειμένων, με διαφορετική θεματολογία, περιγράφονται με την χρήση διαφορετικών σχημάτων περιγραφής και ελεγχόμενων λεξιλογίων και μπορεί να έχουν αποθηκευτεί και είναι προσιτές μέσω διαφορετικών πληροφοριακών συστημάτων.  Πρότυπα, πρωτόκολλα και κοινά σχήματα μεταδεδομένων Ενοποίηση συλλογών  Δημιουργία πύλης Πρόσβαση στις ενοποιημένες συλλογές  Τα Ινστιτούτα Πολιτιστικής Κληρονομιάς (CH) φέρουν σημαντικές πληροφορίες για την ανάπτυξη του πολιτισμού.  Οι συλλογές των Ινστιτούτων Πολιτιστικής Κληρονομιάς ( CH) είναι ετερογενείς: Περιέχουν διαφορετικά είδη αντικειμένων, με διαφορετική θεματολογία, περιγράφονται με την χρήση διαφορετικών σχημάτων περιγραφής και ελεγχόμενων λεξιλογίων και μπορεί να έχουν αποθηκευτεί και είναι προσιτές μέσω διαφορετικών πληροφοριακών συστημάτων.  Πρότυπα, πρωτόκολλα και κοινά σχήματα μεταδεδομένων Ενοποίηση συλλογών  Δημιουργία πύλης Πρόσβαση στις ενοποιημένες συλλογές

4 Illuminated Manuscript  Συλλογή Εθνικής Ολλανδικής Βιβλιοθήκη (KB)  Περιέχει: 10.000 μεσαιωνικές εικονογραφήσεις οι οποίες εκτός από τις πρότυπες βιβλιογραφικές πληροφορίες σχολιάζονται και από θεματικά ευρετήρια που περιγράφουν το περιεχόμενο της εικόνας  Τα ευρετήρια ακολουθούν το Σχήμα Ταξινόμησης Iconclass  Iconclass: Λεξιλόγιο 25.000 στοιχείων με κύριο σκοπό την εικονογραφική ανάλυση  Ένα αντικείμενο στο Iconclass αποτελείται από:  Μία Υποσημείωση (25F9)  Μία συσχέτιση κειμένου (=παραμορφωμένα ζώα: τέρατα)  Συνδέσμους θεματικών παραπομπών (cross-reference)  Μηχανισμούς εξειδίκευσης θέματος (keys)  Λέξεις κλειδιά (keywords)  Τα θέματα είναι οργανωμένα σε 9 ιεραρχικά επίπεδα

5 Δομή Iconclass

6 Αποτελέσματα αναζήτησης στη συλλογή «Illuminated Manuscript» της KB

7 ARIA Masterpieces  Συλλογή Μουσείου Rijks στο Άμστερνταμ  Περιέχει: 700 αντικείμενα (πίνακες & γλυπτά)  Τα θέματα στα ευρετήρια δημιουργούνται με βάση τον κατάλογο Aria  Aria: ελεγχόμενο λεξιλόγιο, αποτελούμενο από 500 όρους και 3 υπολεξιλόγια, θεωρούμενο κυρίως ως πηγή αναζήτησης 1 ο Υπολεξιλόγιο: προορίζεται για μη ειδικούς. Περιέχει θέματα όπως π.χ. ο Άντρας 2 ο Υπολεξιλόγιο: προορίζεται για πιο εξειδικευμένους χρήστες. Περιέχει παρόμοια αλλά πιο υψηλής ποιότητας θέματα π.χ. Αντρικά πορτραίτα 3 ο Υπολεξιλόγιο: Περιέχει μία πιο μικρή λίστα με 6 κατηγορίες αντικειμένων όπως π.χ. Γλυπτική Η μοναδική σημασιολογική πληροφορία που υπάρχει στον κατάλογο είναι κάποιοι εξειδικευμένοι σύνδεσμοι μεταξύ των δύο πρώτων λεξιλογίων (σχέσεις ευρύτερης έννοιας) Οι ιεραρχίες είναι δύο επιπέδων

8 Βήμα 1ο Τυποποίηση συλλογής Βήμα 2ο Ενοποίηση συλλογής Βήμα 3ο Πρόσβαση στη συλλογή Μεθοδολογία

9 1 ο βήμα: Τυποποίηση συλλογής  Μετατροπή ελεγχόμενων λεξιλογίων  Μετατροπή στοιχείων συλλογών Αρχικά Λεξιλόγια Iconclass ARIA Αρχικά Λεξιλόγια Iconclass ARIA Πρότυπη SW απεικόνιση λεξιλογίων Πρότυπη SW απεικόνιση συλλογών 1. Τυποποίηση συλλογής Συντακτική διαλειτουργικότητα λεξιλογίων Συντακτική και σημασιολογική διαλειτουργικότητα δομής μεταδεδομένων Αρχικές συλλογές ARIA Masterpieces KB Manuscripts Αρχικές συλλογές ARIA Masterpieces KB Manuscripts

10 Μετατροπή ελεγχόμενων λεξιλογίων  Ανάλυση στοιχείων  Τυποποίηση γνώσης που περιέχουν  Πρότυπη τυποποίηση:  Επιλογή πρότυπου μοντέλου κωδικοποίησης λεξιλογίων σε γλώσσες SW  Πρωτοβουλία SKOS (Simple Knowledge Organization System): Παρέχει ένα πρότυπο μοντέλο κωδικοποίησης των πιο διαδεδομένων πλάνων οργάνωσης της γνώσης (θησαυροί, ταξ. Συστήματα) σε γλώσσες SW. SKOS: rdf λεξιλόγιο (W3C SW)

11 Μετατροπή στοιχείων συλλογών  Διατήρηση αρχικών δομών συλλογών  Μη χρησιμοποίηση κοινού σχήματος περιγραφής μεταδεδομένων  Κατασκευή μικρών οντολογιών μεταδεδομένων σε σχήμα rdf Title: Mary Magdalene Year: 1487 Artist: Carlo Crivelli

12 2 ο βήμα: Ενοποίηση συλλογής  Προβλήματα  Η σύνθετη φύση της γραφικής παράστασης RDF  Η ετερογένεια στις δομές και την γλωσσολογία (ετικέτες)  Λύση  Εφαρμογή χαρτογράφων οντολογιών Γνώση Χαρτογράφησης 2. Ενοποίηση συλλογής Σημασιολογική διαλειτουργικότητα των λεξιλογίων Αποθήκευση SW περιγραφής σε ένα κοινό interface και αναζήτηση πληροφοριών μέσω αυτού 1.Τυποποίηση συλλογής

13 Χαρτογράφος Falcon  Εργαλείο ευθυγράμμισης πολύπλοκων rdf/owl οντολογιών  Αναπτύχθηκε από το South East University of China  Ενσωματώνει δύο χαρτογράφους: τους LMO & GMO  LMO: Η ευθυγράμμιση στηρίζεται στο γλωσσικό ταίριασμα (σύγκριση συνώνυμων όρων κ.ά)  GMO: Η ευθυγράμμιση στηρίζεται στο δομικό ταίριασμα των γραφικών παραστάσεων.  Ο χαρτογράφος Falcon ενσωματώνει τις ευθυγραμμίσεις των LMO και GMO για να εξάγει αποτελέσματα Προσδοκούμενα αποτελέσματα: Δημιουργία ισοδύναμων συνδέσμων μεταξύ των εννοιών και των σχέσεων των οντολογιών που συγκρίνονται

14 Χαρτογράφος S-Match  Γενικός χαρτογράφος ο οποίος χρησιμοποιείται για ευθυγράμμιση λεξιλογίων με δενδροειδή δομή  Αναπτύχθηκε από το University of Trento (Italy)  Χρησιμοποιεί το πλήρες μονοπάτι ενός δενδροειδές λεξιλογίου για την χαρτογράφησή του. ‘Έτσι η απόδοση σχεδόν πάντα αποτελείται από συνδέσμους εξειδίκευση από τις Iconclass έννοιες στις aria έννοιες  Οι χαρτογραφήσεις υπολογίζονται με την επιλογή της ισχυρότερης σημασιολογικής σχέσης, η οποία ανακαλύπτεται με έναν αλγόριθμο μεταξύ των εννοιών μίας οντολογίας  Δεν παρέχει ένα βαθμό ομοιότητας μεταξύ των εννοιών της οντολογίας αλλά τις σημασιολογικές τους σχέσεις (ισοδυναμία, πιο γενικός, λιγότερο γενικός, επικάλυψη κ.α) IC NotationΛεξική συσχέτιση IconclassΣχέσηΕτικέτα ARIA 23 Η“seasons of the year represented by concepts other than […] landscapes […]” Λιγότερο γενική“Landscapes” Χαρτογράφηση με S-Match

15 3 ο βήμα: Πρόσβαση στη συλλογή  Χρήση multi-faceted browsing  Η mfb περιλαμβάνει τον προσδιορισμό των τμημάτων μίας συλλογής  Για αναζήτηση στις ενοποιημένες συλλογές, χρησιμοποιούνται 3 όψεις: απλή, συνδυασμένη και ενοποιημένη Ορισμός προσδιοριστικών τμημάτων (φασέτες) Ορισμός προσδιοριστικών τμημάτων (φασέτες) 3. Πρόσβαση στη συλλογή Εκτίμηση προδιαγραφών 2. Ενοποίηση συλλογής Αναζήτηση

16 Απλή όψη αναζήτησης  Παρουσιάζει τις ενοποιημένες συλλογές από την πλευρά της μίας συλλογής  Τα στοιχεία της άλλης συλλογής είναι προσβάσιμα μέσω την αντιστοίχησης των θεματικών τους σχολιασμών και των εννοιών με την τρέχουσα συλλογή Αναζήτηση στις ενοποιημένες συλλογές με την χρησιμοποίηση του καταλόγου ARIA Ευθυγράμμιση έννοιας «Animal Pieces» του ARIA και έννοιας «25F:animals» του Iconclass

17 Συνδυασμένη όψη αναζήτησης  Παρέχει ταυτόχρονη πρόσβαση στις συλλογές μέσω της αντιστοίχησης των λεξιλογίων τους αναζητάμε στις ενοποιημένες συλλογές σαν να είναι μία συλλογή χρησιμοποιώντας δύο ευρετήρια Αναζήτηση στις ενοποιημένες συλλογές με την χρησιμοποίηση των καταλόγων ARIA και Iconclass Αναζήτηση στον ARIA με την έννοια «Animal Pieces» και περιορισμός αναζήτησης στο θέμα από τον Iconclass με «Classical Mythology and Ancient History» (βιολογικό & μυθολογικό κριτήριο)

18 Ενοποιημένη όψη αναζήτησης  Παρέχει πρόσβαση στις ενοποιημένες συλλογές μέσω ενός συγχωνευμένου λεξιλογίου  Η αυτόματη διαδικασία χαρτογράφησης δημιουργεί συνδέσμους μεταξύ των δύο λεξιλογίων Η ενοποιημένη όψη παρέχει και Aria έννοιες όπως “Birds” και μία έννοια Iconclass “29A: animals acting as human beings” για την περαιτέρω βελτίωση της αναζήτησης

19 Λεπτομέρειες Browser  Το σχέδιο του browser εμπνεύστηκε από το περιβάλλον αναζήτησης Flamenco  Δοκιμή στον brow ser: http://stitch.cs.vu.nl/demo.html http://stitch.cs.vu.nl/demo.html  STITCH (SemanTic Interoperability To access Cultural Heritage)  Ερευνητικό πρόγραμμα  Χρηματοδοτείται από τον Ολλανδικό Οργανισμό για την Επιστημονική Έρευνα (Netherlands Organisation for Scientific Research )  Στόχος: Η αξιολόγηση της εφαρμογής τεχνικών και εργαλείων του Σημασιολογικού Ιστού για την ενοποίηση ετερογενών συλλογών CH

20 Αποτελέσματα Αποτελέσματα Χαρτογράφησης S-Match 46% Falcon 16% Αποτελέσματα Αποτελέσματα πρότυπης τυποποίησης ARIA ARIA SKOS Iconclass SKOS γραφική αναπαράσταση κλειδιών ακρίβεια Σχεδόν πλήρως συμβατή Εν μέρει συμβατή

21 Συμπεράσματα  Η μετατροπή λεξιλογίων χρησιμοποιώντας τυποποιημένα πρότυπα είναι δυνατή και βοηθά στην ανάπτυξή τους  Αν όλες οι συλλογές και τα λεξιλόγιά τους ήταν διαθέσιμα σε τυποποιημένη μορφή π.χ. skos,rdf, το περιβάλλον θα μας παρείχε έναν πολύ πιο εύκολο τρόπο ενοποίησης ετερογενών συλλογών  Προβλήματα τυποποίησης (απώλεια πληροφοριών)  Βασιζόμενοι σε τέτοιες απεικονίσεις και σε αυτόματες χαρτογραφήσεις, μπορούμε να εκτελέσουμε αναζήτηση μέσω ενός κοινού interface σε ετερογενείς συλλογές  Δύσκολη χαρτογράφηση και όχι πάντα ακριβής  Για την εκτέλεση σημασιολογικής ενοποίησης CH συλλογών με τον τρόπο που αναφέραμε στο πείραμα, οι αυτόματες τεχνικές χαρτογράφησης είναι απαραίτητες, αλλά πρέπει οπωσδήποτε να προσαρμοστούν  Η χρήση του Multi-Faceted Browsing παρέχει πολλαπλές προβολές ή σημεία πρόσβασης για το ίδιο σετ μεταδεδομένων. Έτσι οι χρήστες μπορούν να επιλέξουν το λεξιλόγιο με το οποίο είναι περισσότερο άνετοι και έτσι η ολοκληρωμένη πρόσβαση είναι δεδομένη

22 Προβληματισμοί  Τελικά αξίζει να χρησιμοποιήσουμε τις αυτόματες τεχνικές χαρτογράφησης για τα CH λεξιλόγια;  Κατά πόσο είναι εύκολο να χρησιμοποιηθεί η ίδια μεθοδολογία για ενοποίηση περισσότερων των δύο συλλογών; Τι αποτελέσματα θα έχουμε;

23


Κατέβασμα ppt "ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ: ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google