Εντοπισμός και ομαδοποίηση βιβλιογραφικών εγγραφών οι οποίες περιγράφουν ίδια ή παρόμοια τεκμήρια deduplication και clustering Εκπαιδευτικό Ίδρυμα: Ιόνιο.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Επιμέλεια: Τίκβα Χριστίνα
Advertisements

Η Γλώσσα Προγραμματισμού LOGO
Απαντήσεις Προόδου II.
Πανεπιστήμιο Δυτικής Μακεδονίας Πανεπιστήμιο Δυτικής Μακεδονίας Παιδαγωγικό Τμήμα Νηπιαγωγών Τίτλος Μαθήματος Ενότητα # (bold): Τίτλος Ενότητας (normal)
Ασκήσεις Συνδυαστικής
Σελ. 1 Ε.2.2 Υπηρεσίες – Λειτουργία Helpdesk Καταχώρηση και παρακολούθηση αιτημάτων μέσω web Ε Καταχώρηση αιτημάτων υποστήριξης.
Ηλεκτρονικός Κατάλογος Βιβλιοθήκης (OPAC). ΤΕΙ ΗΠΕΙΡΟΥ. Βιβλιοθήκη Από την αρχική σελίδα της βιβλιοθήκης (
ΣΤΟΙΧΕΙΑ ΨΕΥΔΟΚΩΔΙΚΑ ΒΑΣΙΚΕΣ ΔΟΜΕΣ ΒΑΣΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΩΝ
Σύστημα ηλεκτρονικής δημοσίευσης DiVA Μάθημα: «Ηλεκτρονική Δημοσίευση» Χαρίκλεια Μπρίντεζη.
Κεφάλαιο 6 Υλοποίηση Γλωσσών Προγραμματισμού
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ.
Δρ. Παναγιώτης Συμεωνίδης
Σελίδα 1 ΕΚΠΑ. «Διαμόρφωση υπηρεσίας καταλόγου Active Directory σε Windows 2003» Τηλέμαχος Ράπτης Εθνικό και Καποδιστριακό.
1 Συλλογικοί Κατάλογοι & Διαδίκτυο Μιχάλης Σφακάκης.
1 iPac Μια πρώτη γνωριμία Κώστας Βίγλας ΥΚΒ. 26/6/2002 Ενημέρωση πάνω στις νέες ψηφιακές υπηρεσίες 2 Περιεχόμενα 1 iPac  Τί είναι το iPac  Δυνατότητες.
ΕΡΓΑΛΕΙΟ ΠΑΡΑΓΩΓΗΣ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΕ WEB SITE (CONTENT MANAGEMENT TOOL)
Κεφάλαιο 2ο Πεπερασμένα αυτόματα.
Γραφήματα & Επίπεδα Γραφήματα
ΕΠΙΜΕΛΕΙΑ ΕΡΓΑΣΙΑΣ: ΧΡΙΣΤΙΝΑ ΜΠΛΑΝΑ ΔΙΔΑΣΚΩΝ: ΣΑΡΑΝΤΟΣ ΚΑΠΙΔΑΚΗΣ ΕΞΑΜΗΝΟ: ΕΑΡΙΝΟ ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ- ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ.
© 2002 Thomson / South-Western Slide 4A-1 Κεφάλαιο 4, Μέρος A Πιθανότητες.
1 ΕΝΤΟΛΕΣ ΠΛΗΡΟΦΟΡΙΩΝ ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ ΘΕΣΗ ΣΗΜΕΙΟΥΘΕΣΗ ΣΗΜΕΙΟΥ ΑΠΟΣΤΑΣΗΑΠΟΣΤΑΣΗ ΕΜΒΑΔΟΝΕΜΒΑΔΟΝ.
Heal Link Η HEAL Link (Hellenic Academic Libraries Link) είναι ο Σύνδεσμος Ελληνικών Ακαδημαϊκών Βιβλιοθηκών και λειτουργεί υπό.
ΈΝΑ ΗΛΕΚΤΡΟΝΙΚΟ ΕΚΘΕΤΗΡΙΟ ΓΙΑ ΤΙΣ ΝΕΕΣ ΠΡΟΣΚΤΗΣΕΙΣ ΒΙΒΛΙΩΝ ΤΗΣ ΒΙΒΛΙΟΘΗΚΗΣ ΤΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕΔΟΝΙΑΣ Κολοβός Φίλιππος Τσανακτσίδου ΕλισάβετΠαπαργύρη.
Ψηφιακή Βιβλιοθήκη ΤΕΕ
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΘΕΜΑ «ΤΟ ΕΘΝΙΚΟ ΚΕΝΤΡΟ ΤΕΚΜΗΡΙΩΣΗΣ» ΚΑΝΤΑΡΕΛΗ ΑΙΚΑΤΕΡΙΝΗ.
Διαδικτυακή εφαρμογή ανάλυσης και επεξεργασίας δεδομένων κυβερνητικών διαβουλεύσεωνgov.insight Η. Ζαβιτσάνος, Γ. Γιαννακόπουλος, Γ. Παλιούρας Ινστιτούτο.
Πρότυπα κωδικοποίησης βιβλιογραφικών δεδομένων
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Τρίτο Συστήματα.
21/11/2001 Καταστάσεις και Στατιστικές Αναφορές Κώστας Βίγλας Υπολογιστικό Κέντρο Βιβλιοθηκών.
Δημιουργία Διαφανειών
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΟΘΗΚΟΝΟΜΙΑΣ Αναζητώντας πρότυπα αλληλεπίδρασης χρηστών για ψηφιακές βιβλιοθήκες Εργασία στο Μάθημα: Ψηφιακές.
Οργάνωση πληροφοριών Ευρετηρίαση Γ Εξάμηνο Τετάρτη 12-3μμ, αίθουσα Β13 Καθηγητής: Δάφνη Κυριάκη-Μάνεση, δρ.
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
Ανάπτυξη Πρωτοτύπου Λογισμικού
E X a M p L e Αξιοποιώντας την τεχνολογία XML στη διαχείριση της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών.
Ενότητα Α.4. Δομημένος Προγραμματισμός
ΠΛΗΡΟΦΟΡΙΑΚΑ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΑ ΣΥΣΤΗΜΑΤΑ 2η Εργασία Μαθήματος Γιώργος Γιαγλής Οικονομικό Πανεπιστήμιο Αθηνών Τμήμα Διοικητικής Επιστήμης & Τεχνολογίας.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ " Διοίκηση και Οργάνωση Βιβλιοθηκών.
Αυτόματη Ανάλυση & Οργάνωση Μουσικών Αρχείων Διδάσκων Καθηγητής: Καπιδάκης Σαράντος Σπουδαστής: Σιδέρης Νίκος Αθήνα2008.
Εθνικό Κέντρο Τεκμηρίωσης Προβλήματα διαλειτουργικότητας κατά την ταυτόχρονη πρόσβαση σε πηγές μέσω του πρωτοκόλλου Z39.50 & Το περιβάλλον πρόσβασης "Η.
HY340 : ΓΛΩΣΣΕΣ ΚΑΙ ΜΕΤΑΦΡΑΣΤΕΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ, ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ, ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ ΔΙΔΑΣΚΩΝ Αντώνιος Σαββίδης.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ: «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΜΑΘΗΜΑ: ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΕΡΓΑΣΙΑ: MULTI-DOCUMENT SUMMARIZATIONS.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεδιασμός Σχεσιακών Σχημάτων.
Βάσεις Δεδομένων Εργαστήριο ΙΙI Τμήμα Πληροφορικής ΑΠΘ
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεσιακό Μοντέλο.
ΠΜΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ The Digital Library and Computational Philology: The BAMBI Project Γόντικα Ειρήνη.
MELVYL the catalog of the universities of California Digital Libraries MELVYL ο κατάλογος των ψηφιακών βιβλιοθηκών των πανεπιστημίων της Καλιφόρνια.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΠΣ: «Επιστήμη Της Πληροφορίας: Διοίκηση Και Οργάνωση Βιβλιοθηκών Με Έμφαση Στις Νέες Τεχνολογίες.
1 Βάσεις Δεδομένων ΙI Επιμέλεια: ΘΟΔΩΡΗΣ ΜΑΝΑΒΗΣ SQL (3 από 3) T Manavis.
Εισαγωγή στο Blackboard
«Πρόγραμμα Αναμόρφωσης Προπτυχιακών Προγραμμάτων Σπουδών Γ.Π.Α» Σεμινάριο Ενημέρωσης Διδακτικού Προσωπικού Οι τεχνολογίες της Πληροφορικής και των Επικοινωνιών.
Το σύστημα υποστήριξης συνεργασίας AGORA Δημόπουλος Σταύρος Α.Μ. 402 Μεταπτυχιακό Μάθημα: «Τεχνολογίες Υποστήριξης Συνεργασίας» Διδάσκων: Νίκος Καρακαπιλίδης.
Οδηγός Αναζήτησης Ιδρυματικού Αποθετηρίου
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ- ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ Υπεύθυνος καθηγητής: κος. Σ. Καπιδάκης Επιμελήτρια: Παπαγιάννη Ανδρονίκη.
Οργάνωση πληροφοριών Ταξινόμηση (Θ) Ενότητα 1: Εισαγωγή (α μέρος) Δάφνη Κυριάκη-Μάνεση Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης Το περιεχόμενο.
Οργάνωση πληροφοριών Ταξινόμηση (Θ) Ενότητα 4: Αρχιτεκτονική της Ευρετηρίασης (β μέρος) Δάφνη Κυριάκη-Μάνεση Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης.
Σύστημα θεματικής πρόσβασης 1
ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ: ΠΑΡΑΠΟΜΠΕΣ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΤΣΙΦΛΙΔΟΥ ΕΥΘΥΜΙΑ ΥΔΡΑΙΟΥ ΙΩΑΝΝΑ.
ΣΚΟΠΟΣ ΤΟΥ ΕΡΓΑΣΤΗΡΙΟΥ “Επιστημονική εργασία” Εύρεση πηγών Άξονες δομής επιστημονικού άρθρου (αναγνώριση) Κανόνες γραφής επιστημονικού άρθρου (αναγνώριση)
1 Apothesis : Νέο Ακαδημαϊκό Αποθετήριο ΕΑΠ Βιβλιοθήκη & Κέντρο Πληροφόρησης.
Βιβλιογραφική Αναζήτηση: αναλυτική παρουσίαση και εφαρμογή της Υπηρεσίας Διαδανεισμού Ελληνικό Ανοικτό Πανεπιστήμιο Βιβλιοθήκη και Κέντρο.
 Στόχος της παρουσίασης αυτής είναι η εξοικείωση με τον Ηλεκτρονικό Κατάλογο της Βιβλιοθήκης προκειμένου να αναζητήσουμε ένα τεκμήριο από τη συλλογή.
ΑΛΓΟΡΙΘΜΟΣ ΠΡΟΒΛΗΜΑ ΑΛΓΟΡΙΘΜΟΣ ΛΥΣΗ
Δημιουργία Ανοιχτού Ακαδημαϊκού Μαθήματος στην πλατφόρμα openeclass
Κανονικοποίηση ΤΙ ΕΙΝΑΙ ; Τεχνική Διαδικασία
Βιβλιογράφηση.
ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ
ΣΥΓΓΡΑΦΗ ΕΠΙΣΤΗΜΟΝΙΚΗΣ ΕΡΓΑΣΙΑΣ
Μεταγράφημα παρουσίασης:

Εντοπισμός και ομαδοποίηση βιβλιογραφικών εγγραφών οι οποίες περιγράφουν ίδια ή παρόμοια τεκμήρια deduplication και clustering Εκπαιδευτικό Ίδρυμα: Ιόνιο Πανεπιστήμιο / ΤΑΒ Π.Μ.Σ.: Επιστήμη της Πληροφορίας (Αθήνα) Σχ. Έτος: Μάθημα: Ηλεκτρονική Δημοσίευση Καθηγητής: Σαράντος Καπιδάκης Φοιτητής: Μανόλης Πεπονάκης

23/6/ Τι είναι διπλές εγγραφές  Δεν πρόκειται για εγγραφές που είναι ίδιες μεταξύ τους  ούτε για εγγραφές που μοιάζουν μεταξύ τους  Διπλές εγγραφές είναι οι εγγραφές που περιγράφουν ίδια τεκμήρια  Όχι κατ’ ανάγκη με τον ίδιο τρόπο

23/6/ Ποια τεκμήρια είναι ίδια μεταξύ τους;  Αυτά που έχουν ίδιο περιεχόμενο;  Προφανώς όχι…  Η παραδοσιακή βιβλιοθηκονομία θεωρεί ίδια όσα ανήκουν στην ίδια έκδοση  Έκδοση: all copies of a resource produced from substantially the same original input and issued by the same agency or group of agencies or a person. For older monographic resources, all copies of a resource at any time from substantially the same type-pages (ISBD)  Τι γίνεται με τις ανατυπώσεις / κυκλοφορίες;

23/6/ Για ποιο λόγο αναζητούνται “διπλοεγγραφές”;  Στόχος: το ξεκαθάρισμα στο πλαίσιο μιας βάσης;  Ποιοτική αναβάθμιση της βάσης  Στόχος: η συγκρότηση ενός Συλλογικού Καταλόγου;  Στόχος: η συγκρότηση ενός δυναμικού εικονικού καταλόγου;  Στόχος: η απορρόφηση της (ευρωπαϊκής κατά κανόνα) χρηματοδότησης;(!)

23/6/ Αλγόριθμοι εντοπισμού “διπλοεγγραφών”  Ενός περάσματος  Η λήψη της “απόφασης” για το ποιες εγγραφές είναι διπλές εγγραφές γίνεται σε ένα μόνο βήμα με τη χρήση ενός κλειδιού ταύτισης  Δύο περασμάτων  Η λήψη της “απόφασης” για το ποιες εγγραφές είναι διπλές γίνεται σε δύο βήματα  Πρώτο βήμα: χρήση κλειδιού ταύτισης για ανεύρεση πιθανών διπλών  Δεύτερο βήμα: αξιολόγηση και τελική κρίση

23/6/ Δημιουργία κλειδιού ταύτισης  Επιλέγεται το τμήμα του πεδίου που θα χρησιμοποιηθεί  μπορεί να είναι όλο το πεδίο, ένα συγκεκριμένο υποπεδίο, συνδυασμός κτλ  Εφαρμόζονται κανόνες κανονικοποίησης  οι κανόνες αυτοί μπορεί να αφορούν στην αφαίρεση στίξης, στη μεταγραφή όλων των γραμμάτων σε κεφαλαία, κτλ  μπορεί να εφαρμόζονται κανόνες που προσπαθούν να ξεπεράσουν το πρόβλημα των λαθών πληκτρολόγησης κατά την καταλογογράφηση ή πίνακες με stopwords

23/6/ Παράδειγμα κλειδιού ταύτισης  Από τον τίτλο αντλείται  Πρώτη λέξη: ο πρώτος και ο τρίτος χαρακτήρας  Δεύτερη λέξη: ο πρώτος χαρακτήρας  Τρίτη λέξη: ο πρώτος χαρακτήρας  Πρώτη λέξη από το τέλος: ο πρώτος χαρακτήρας  Δεύτερη λέξη από το τέλος: ο πρώτος χαρακτήρας.  Τρίτη λέξη από το τέλος: ο τέταρτος χαρακτήρας από την αρχή και ο δεύτερος χαρακτήρας από το τέλος της λέξης  Από τη χρονολογία αντλούνται  τα 2 τελευταία ψηφία της χρονολογίας  Από το συγγραφέα αντλείται  Το επίθετο του συγγραφέα  Το παραπάνω κλειδί θα μπορούσε να αποτελεί το κριτήριο αν δύο εγγραφές είναι διπλοεγγραφές σε έναν αλγόριθμο ενός περάσματος

23/6/ Αλγόριθμοι δύο περασμάτων  1 ο βήμα: δημιουργία κλειδιού ταύτισης (ομαδοποίησης)  Χαλαρό κλειδί ώστε να συμπεριληφθούν όλες οι πιθανές διπλές  2 ο βήμα: σύγκριση των πιθανών διπλών  Αυστηρότερα κριτήρια ώστε να αποφευχθούν λαθεμένες ταυτίσεις

23/6/ Παράδειγμα αλγορίθμου δύο περασμάτων  Με βάση ένα κλειδί «Συγγραφέας / Τίτλος» (με κανονικοποίηση) συλλέγονται πιθανές διπλές  Με μια διαδικασία παρόμοια με αυτή που περιγράφηκε στις προηγούμενες διαφάνειες  Δημιουργείται μια ομάδα πιθανών διπλών όπου:  Εξετάζονται λεπτομερέστερα συγκεκριμένα πεδία  (π.χ. για το προηγούμενο παράδειγμα ο αριθμός των σελίδων είναι ίδιος;)  Ορίζεται ένας βαθμός ομοιότητας (threshold)  Όσες εγγραφές βρίσκονται πάνω από το προαποφασισμένο όριο θεωρούνται διπλές

23/6/ Το πρόβλημα των διατάξεων  Οι περισσότεροι αλγόριθμοι ταύτισης αφορούν στο MARC 21  Όλοι τους βασίζονται (στον ένα ή τον άλλο βαθμό) στα στοιχεία Τίτλος και Συγγραφέας  Ως συγγραφέας λογίζεται η Κύρια Αναγραφή που είναι υποχρεωτική στο MARC 21  Πολύ λιγότερη (σχεδόν ανύπαρκτη δημοσιευμένη) έρευνα για UNIMARC  Προβλήματα κατά την αντιστοίχηση του MARC 21 σε UNIMARC  ειδικά αν δεν ακολουθείται η κύρια αναγραφή

23/6/ Διαφορές σε on line και off line  Στο on line περιβάλλον δεν υπάρχει διαθέσιμος χρόνος (ο χρήστης περιμένει μπροστά στην οθόνη)  Σε τέτοιες διαδικασίες μπορούν να βοηθήσουν οι web 2 τεχνολογίες (π.χ. ajax) όπου το σύστημα μπορεί να δουλεύει στo background και ο χρήστης να βλέπει αποτελέσματα (τα οποία ενδεχομένως να αλλάζουν)  Στο off line υπάρχει χρόνος και μπορεί να γίνουν πολλοί έλεγχοι  Όμως, πάντα, η πληροφορία που δίνεται είναι “μπαγιάτικη”

23/6/ Ενοποίηση εγγραφών Αφού εντοπίστηκε ότι υπάρχουν εγγραφές που περιγράφουν το ίδιο τεκμήριο τι γίνεται;  Μια εγγραφή επιλέγεται ως η κύρια (master record) και οι άλλες διαγράφονται  Μια εγγραφή επιλέγεται ως η κύρια και τα πεδία των υπολοίπων εγγραφών προστίθενται σ’ αυτή (συγχώνευση)  Διατηρούνται όλες οι εγγραφές αλλά ομαδοποιούνται (clustered) με μια κύρια εγγραφή  Κατά κανόνα μια εγγραφή επιλέγεται (ή δημιουργείται από συγχώνευση) ως εκπρόσωπος του cluster

23/6/ Work Με κριτήριο για την ομαδοποίηση τους FRBR Expression Manifestation Item is realized through is embodied in is exemplified by Οι υπάρχοντες κατάλογοι διαθέτουν εγγραφές για αυτό το επίπεδο Κατά κανόνα δεν δημιουργούνται βιβλιογραφικές εγγραφές για Items παρά μόνο σε επίπεδο Holdings Είναι εφικτή η δημιουργία ομαδοποίησης συγκεντρώνοντας όλες τις εγγραφές που αποτελούν μια Έκφραση; Μπορούν να συγκεντρωθούν όλες οι πιθανές Εκφράσεις ή τα Manifestations που ανήκουν σε ένα Έργο;

23/6/ OCLC: αλγόριθμος για FRBR  Δημιουργία ενός κλειδιού Συγγραφέα/Τίτλου για κάθε βιβλιογραφική εγγραφή  Αυτά τα κλειδιά δημιουργούν σύνολα από Works  Το επίπεδο είναι πάνω από το Work διότι δεν λαμβάνεται υπόψη η μορφή του έργου (τα ονομάζουν Work sets)  Για το όνομα του Συγγραφέα γίνεται κανονικοποίηση και ελέγχονται τα αρχεία καθιερωμένων τύπων της LC  Εφαρμόζονται οι κανόνες NACO ( Name Authority Cooperative )  Για τον τίτλο εφαρμόζονται κανόνες κανονικοποίησης  Ελέγχονται τόσο οι ομοιόμορφοι τίτλοι (καθιερωμένοι) όσο και οι κύριοι (περιγραφικοί από το τεκμήριο)

23/6/ Ένα παράδειγμα από OCLC Διαφορετικοί τύποι Η σημασία της κανονικοποίησης των τίτλων και της χρήσης ομοιόμορφων τίτλων Απουσία επιπέδου Expression

23/6/ Ο αλγόριθμος LC (για τη δημιουργία της ομαδοποίησης)  Επίπεδο Work  Ταύτιση Τίτλου και Συγγραφέα (επιλεγμένα υποπεδία)  Επίπεδο Expression  Ταύτιση τύπου εγγραφής (γλωσσικό υλικό έντυπο, ηχογράφηση μουσική παράσταση, κτλ) και γλώσσα  κωδικοποιημένες τιμές και στα δύο  Επίπεδο Manifestation  Δεν γίνεται καμία ταύτιση

23/6/ LC: FRBR Display Tool  Μετατρέπονται τα ISO2709 σε MARCXML  Τα MARCXML κωδικοποιούνται σε δομή FRBR χρησιμοποιώντας κάποια επιλεγμένα στοιχεία του MODS  Γίνεται η τελική εμφάνιση σε HTML όπου ομαδοποιούνται οι οντότητες "Work, "Expression" and "Manifestation"  Οι οντότητες ταξιθετούνται με βάση κάποια κριτήρια  Αλφαβητικά (συγγραφέας, τίτλος) και μετά χρονολογικά  Όλα γίνονται με stylesheets οπότε είναι δυνατή η παραμετροποίηση του εργαλείου για να εξυπηρετηθούν τοπικές ανάγκες

23/6/ Συμπεράσματα  Η δυνατότητα εντοπισμού διπλών (ή όμοιων) εγγραφών μπορεί να έχει πολλές χρήσεις  Συλλογικοί κατάλογοι κτλ  Η συγχώνευση (merging) εγγραφών (προϋποθέτει το προηγούμενο βήμα) και μπορεί να γίνει:  Στο ίδιο επίπεδο (π.χ. Manifestation)  Σε διαφορετικό επίπεδο με τη δημιουργία ομάδων (π.χ. τα Manifestations που αποτελούν ένα Expression)  Η μέχρι τώρα έρευνα δείχνει πως μάλλον μοιάζει ευκολότερη η παραγωγή εγγραφών σε επίπεδο Work παρά σε επίπεδο Expression με βάση τις υπάρχουσες εγγραφές  Άρα αναγκαστική αναγωγή των Manifestation στο Work (επιτρέπεται από τους FRBR)  ή λίγα στοιχεία για Expression

23/6/ Μια αναγωγή στην ελληνική πραγματικότητα  Μεγάλο μέρος εγγραφών σε UNIMARC  Πολλές εξ αυτών χωρίς κύρια αναγραφή  Προβληματική ακόμη και η απλή ολοκλήρωση δεδομένων  Πόσο μάλλον η ταύτιση σε υψηλότερο επίπεδο  Ενδιαφέρουσα προοπτική για συλλογικούς καταλόγους (Δημοσίων & Ακαδημαϊκών)  Ακόμη πιο ενδιαφέρουσα η προοπτική για on line σύστημα