Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Μεταδεδομένα στο ψηφιακό περιβάλλον

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Μεταδεδομένα στο ψηφιακό περιβάλλον"— Μεταγράφημα παρουσίασης:

1 Μεταδεδομένα στο ψηφιακό περιβάλλον
Εισαγωγή Κατερίνα Τοράκη – Χρήστος Παπαθεοδώρου Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας

2 Πρόγραμμα μαθήματος Μάθημα Διδάσκων Ημ/νία
Εισαγωγή, Ηλεκτρονικά Τεκμήρια, Βιβλιογραφικά Μεταδεδομένα Χ 10/3 XML, DTDs 17/3 Dublin Core Κ 24/3 EAD 31/3 METS, MODS 7/4 TEI 14/4 Κυβερνητικά Μεταδεδομένα 5/5 Θεματικά Μεταδεδομένα 12/5 Πολιτιστικά μεταδεδομένα 19/5 Γεωγραφικά μεταδεδομένα, άλλα, ανακεφαλαίωση 26/5 Διαλειτουργικότητα Μεταδεδομένων 2/6 Εργασίες Κ, X 16/6 23/6

3 Θέματα εργασίας Αρχεία δημόσιων κτιρίων (γεωγραφικό σύστημα πληροφοριών) Αρχείο επιχείρησης/οργανισμού Αρχείο προσωπικότητας Ειδικές συλλογές (π.χ. αφίσες, γραμματόσημα, καρτ-ποστάλ, φωτογραφίες, επιστολές κ.ά.)  Ηλεκτρονικά τεκμήρια (βιβλία – περιοδικά) Ιστορικό αρχείο Ιστοσελίδες Λογοτεχνικά και άλλα κείμενα Μουσειακή συλλογή Πολεοδομικοί χάρτες Σεισμολογικά δεδομένα Στοιχεία αρχαιολογικών ανασκαφών Συλλογή ταινιοθήκης Τουριστικοί οδηγοί Χάρτες (τουριστικοί, γεωγραφικοί) ……………………….

4 Θέματα εργασίας Επιλέξτε το κατάλληλο πρότυπο μεταδεδομένων για την περιγραφή και διαχείριση της συλλογής σας. Αιτιολογήστε την επιλογή σας και αξιολογήστε την περίπτωση επιλογής και εναλλακτικού(ών) προτύπου(ων) Δημιουργήστε περιγραφές σύμφωνα με το πρότυπο που επιλέξατε Συντάξτε τα αντίστοιχα XML αρχεία, χρησιμοποιώντας ανάλογο λογισμικό Παρουσιάστε την εφαρμογή

5 Ψηφιακά τεκμήρια Οτιδήποτε υπάρχει σε ψηφιακή μορφή και προσπελαύνεται με τη βοήθεια υπολογιστή κείμενα εικόνες, κινούμενες εικόνες ήχος, βίντεο ιστοσελίδες, προγράμματα

6 Τύποι δεδομένων Ηλεκτρονικών τεκμηρίων (1)
Κείμενο .DOC .TXT .RTF .PDF Εικόνες .BMP .GIF .JPEG .TIFF .EPS Κινούμενες εικόνες .ANI .FLI .FLC .GIF Ηχος .WAV .MID .SND .AUD

7 Τύποι δεδομένων Ηλεκτρονικών τεκμηρίων (2)
Βίντεο .AVI .MOV .MPG .QT Ιστοσελίδες .HTM .HTML .XML Προγράμματα .COM .EXE

8 Πώς εντοπίζουμε και ανακτούμε τα ψηφιακά τεκμήρια;

9 Μεταδεδομένα Τα μεταδεδομένα είναι δομημένη πληροφορία που περιγράφει, εξηγεί, εντοπίζει ή διευκολύνει την ανάκτηση, τη χρήση ή την διαχείριση ενός ψηφιακού τεκμηρίου Συχνά καλούνται («δομημένα») «δεδομένα για άλλα δεδομένα» ή «πληροφορία για άλλη πληροφορία» "Metadata is machine understandable information about web resources or other things." (Tim Berners-Lee) Περιγραφή της δομής και του περιεχομένου που αναφέρεται σε ένα ηλεκτρονικό τεκμήριο/ψηφιακό αντικείμενο ή σε συλλογή τεκμηρίων/αντικειμένων

10 Μεταδεδομένα Στόχος είναι η διερεύνηση των τρόπων με τους οποίους επιτυγχάνεται Αναζήτηση (find) Ανακάλυψη (discovery) Πλοήγηση (navigation) Συνεύρεση (collocation) Αναγνώριση (identify, DOI, URI) Επιλογή (select) Απόκτηση (obtain access) Οργάνωση (portals) ψηφιακών πόρων που βρίσκονται στο διαδίκτυο

11 Που Βρίσκονται τα Μεταδεδομένα
Στην ετικέτα ενός CD (ορατά) Στη σελίδα τίλου ενός τεκμηρίου (ορατά) Στην κορυφή μιας ιστοσελίδας (ορατά) Σε διαφορετική εγγραφή, π.χ. στον κατάλογο μιας βιβλιοθήκης (ορατά) Στην ηλεκτρονική μορφή μέσα στον πόρο (ορατά) Ενσωματωμένα στο ηλεκτρονικό δημοσίευμα (μέρος της κωδικοποίησης, μη ορατά)

12 Παράδειγμα: Ιστοσελίδα σε HTML
<BODY> <p> Fiction:</p> <UL><LI>Author: Milan Kundera</LI> <LI>Title: Identity</LI> <LI>Published: 1998</LI> </UL> <p> Science: </p> <UL><LI>Author: Richard Feynman</LI> <LI>Title: The Character of Physical Law</LI> <LI>Hardcover</LI> </BODY> </HTML>

13

14 <HTML><HEAD><TITLE>Seated woman</TITLE>
<META NAME="description" CONTENT="Seated woman by Bock, Thomas, "> <META NAME="keywords" CONTENT="Women -- Portraits. Men -- Portraits."> <META NAME="DC.Creator" SCHEME="LCNA" CONTENT="Bock, Thomas, "> <META NAME="DC.Title" CONTENT="Seated woman"> <META NAME="DC.Subject" SCHEME="LCSH" CONTENT="Women -- Portraits."> <META NAME="DC.Subject" SCHEME="LCSH" CONTENT="Men -- Portraits."> <META NAME="DC.Description" CONTENT="Image of item held in Allport Library and Museum of Fine Arts, State Library of Tasmania. 1 drawing : pencil, pen and ink on paper ; 13 x 12 cm. (irregular)."> <META NAME="DC.Publisher" CONTENT="State Library of Tasmania"> <META NAME="DC.Type" CONTENT="text/image"> <META NAME="DC.Format" CONTENT="text/html"> <META NAME="DC.Format" CONTENT="image/jpeg"> <META NAME="DC.Date" SCHEME="ISO8601" CONTENT=" "> <META NAME="DC.Identifier" SCHEME="URL" CONTENT=" <META NAME="DC.Language" SCHEME="RFC 1766" CONTENT="en"> <META NAME="DC.Relation" CONTENT="IsFormatOf Item held in Allport Library and Museum of Fine Arts, State Library of Tasmania"> <META NAME="DC.Coverage" CONTENT="Tasmania"> <META NAME="DC.Rights" CONTENT=" <META NAME="DC.identifier.URL.thumbnail" CONTENT="

15 Πώς θα κάνουμε «ορατά» τα μεταδεδομένα από τους υπολογιστές (μηχαναγνώσιμη πληροφορία);

16 XML: κωδικοποίηση μεταδεδομένων
Η HTML ελέγχει τον τρόπο εμφάνισης των ηλεκτρονικών τεκμηρίων, δεν ασχολείται με τη φύση τους, την περιγραφή τους, τη σημασία τους eXtensible Markup Language (XML) αποτελεί μια εξαιρετικά απλή διάλεκτο της γλώσσας Standard Generalized Markup Language (SGML), η οποία αναπτύχθηκε με στόχο να διευκολύνει το χειρισμό, επεξεργασία, διακίνηση και αποθήκευση τεκμηρίων στον Παγκόσμιο Ιστό (web)

17 Αναγκαιότητα Προτύπων Μεταδεδομένων
Χρειάζονται για να έχουμε κοινή αντίληψη των δεδομένων που περιγράφονται με αυτά Μας προσφέρουν μεγαλύτερη δομή Μας περιορίζουν στην ευελιξία Επεξεργάζονται ευκολότερα μηχανικά Είναι αναγκαιότερα σε ψηφιακά αντικείμενα Αφού στα συμβατικά έχουμε αισθητήρια αντίληψη για αναγνώριση, θέση, θέματος, …

18 Πόσα Πρότυπα Μεταδεδομένων
Δεν υπάρχει ένα μοναδικό διεθνές πρότυπο για μεταδεδομένα, γιατί: Χρειαζόμαστε διαφορετικά επίπεδα πολυπλοκότητας, από πλούσιες μέχρι απλές περιγραφές Υπάρχουν κάμποσα σχήματα μεταδεδομένων, για διαφορετικά επίπεδα και απαιτήσεις Επεκτείνουμε τα υπάρχοντα πρότυπα Geographers > Area-related fields information retrieval > minimum to area related fields, AACR has given author,

19 Πρότυπα Μεταδεδομένων
AACR2 MARC Text Encoding Initiative - TEI Header (1990) Dublin Core - DC (1995) Encoded Archival Description – EAD (1996) Open Archives Initiative - OAI Visual Resources Association Core– VRA (1997) Federal Geographic Data Committee for Digital Geospatial Metadata – FGDC Data Documentation Initiative – DDI (1997) Gateway to Educational Materials – GEM (1999) Government (Global) Information Locator Service - GILS Metadata Encoding and Transmission Standard – METS Metadata Object Description Schema – MODS Computer Interchange of Museum Information – CIMI Interoperability of Data in E-Commerce Systems – INDECS Online Information Exchange – ONIX (2000) Extended Markup Language – XML, MARCXML Australian Recordkeeping Metadata Schema (RKMS)

20 Κόστος και Λειτουργικότητα Αναζήτησης και Μεταδεδομένων
AACR2/MARC Dublin Core Qualified Dublin Core Simple Λειτουργικότητα κατά την χρήση Μέτα-μηχανές αναζήτησης Google (με τεχνικές συνδέσμων) Απλές μηχανές αναζήτησης Κόστος δημιουργίας και χρήσης

21 Τα Μεταδεδομένα είναι Γλώσσα
Τα σχήματα μεταδεδομένων είναι γλώσσες για να γίνονται δηλώσεις για τους πόρους: «Το βιβλίο» έχει Title "Gone with the Wind" «Η ιστοσελίδα» έχει Publisher "Springer Verlag" Οι όροι των λεξιλογίων (στοιχεία) ορίζονται με πρότυπα – όπως το Dublin Core Οι γραμματικές των μεταδεδομένων περιορίζουν τις δηλώσεις και τα μοντέλα δεδομένων που μπορεί να χρησιμοποιηθούν – κάνοντας όμως τη σημασία τους πιο έκδηλη και σαφή

22 Τα Μεταδεδομένα ως Γλώσσα
Διαφορετικές κοινωνίες (περιγραφής πόρων) μιλούν διαφορετικές γλώσσες Π.χ. Τι γλώσσες περιγράφουν Ιατρική σε Ελλάδα και Αγγλία; Η Ιατρική ορολογία είναι κοινή. Και οι φυσικοί ομιλητές των διαφορετικών γλωσσών πρέπει να επικοινωνήσουν … Και οι τουρίστες (και οι ομιλητές των διαφορετικών γλωσσών) μαθαίνουν να «μιλούν πρωτόγονα» για να επικοινωνήσουν

23 Κανόνες Γραμματικής DC
υπονοούμενο ρήμα Τιμή ιδιότητας (κατάλληλη περιγραφή) μία από 15 ιδιότητες υπονοούμενο υποκείμενο DC:Creator DC:Title DC:Subject DC:Date... Ο πόρος έχει ιδιότητα X εξειδικευτές (επίθετα) [προαιρετικός εξειδικευτής] [προαιρετικός εξειδικευτής]

24 Παραδείγματα Γραμματικής DC
Ο πόρος έχει Subject "Languages -- Grammar" LCSH Ο πόρος έχει Date " " ISO8601 Revised

25 Οι Γλώσσες Μεταδεδομένων είναι Πολυγλωσσικές
Τα μεταδεδομένα δεν είναι ομιλούμενη γλώσσα Τα ουσιαστικά των μεταδεδομένων – τα «στοιχεία» - είναι σύμβολα που αντιπροσωπεύουν έννοιες εκφράσιμες σε πολλαπλές φυσικές γλώσσες Τα πρότυπα μπορεί να έχουν δεκάδες μεταφράσεις Οι έννοιες όπως "title", "author" ή "subject", χρησιμοποιούνται με τον ίδιο τρόπο στα Ελληνικά, τα Αγγλικά και τα Ιαπωνικά;

26 Οι Γλώσσες Εξελίσσονται με τη Χρήση
Αναπόφευκτα, οι γλώσσες αντιστέκονται στην σταθερότητα Οι άνθρωποι «επεκτείνουν» τους αυθεντικούς ορισμούς Οι υλοποιητές παρεξηγούν την επιδιωκόμενη σημασία ή χρήση των στοιχείων Οι υλοποιητές χρησιμοποιούν τοπικούς όρους και εκφράσεις Αν η εφαρμογή δεν ταιριάζει με το πρότυπο, το πρότυπο συχνά «προσαρμόζεται» να ταιριάζει στην εφαρμογή Stretch misunderstand

27 Σύνταξη Μεταδεδομένων
Κάθε γλώσσα έχει ένα (ή περισσότερους) τρόπους γραφής της γλώσσας, για ανταλλαγή (ή αποθήκευση) πληροφοριών ISO2709, για MARC HTML – “meta” RDF, βασιζόμενο σε XML, για DC, MODS … Z39.50

28 Διαλειτουργικότητα με Μεταδεδομένα
Κύριες προσεγγίσεις διαλειτουργικότητας Αναζήτηση σε διαφορετικά συστήματα Δεν έχουν τα ίδια μεταδεδομένα, αλλά αντιστοιχούν τις δυνατότητες αναζήτησης σε ένα κοινό σύνολο Π.χ. Z39.50 Συγκομιδή μεταδεδομένων Μεταφράζουν τα δικά τους μεταδεδομένα σε ένα κοινό βασικό σύνολο στοιχείων, που διαθέτουν για συγκομιδή Π.χ. OAI

29 Προκλήσεις και Τάσεις στα Μεταδεδομένα
«Απλού και ευρύ» και «πλούσιου αλλά συγκεκριμένου» (απλότητα  λειτουργικότητα) «Γενικού» και «προσαρμοσμένου» (διαλειτουργικότητα  επεκτασιμότητα ) «Αναγνώσιμου από ανθρώπους» και «επεξεργάσιμου από μηχανές» (σε δημιουργία και χρήση) «Κατανομή» και «Συγκέντρωση» σε ένα μέρος Αυτόματη παραγωγή ή με ανθρώπινη παρέμβαση Παραγωγή = generation

30 Παρανοήσεις για Μεταδεδομένα
Η πιο λεπτομερής περιγραφή μεταδεδομένων είναι πάντα καλύτερη; Συνήθως ισχύει για συμβατικά τεκμήρια Που δεν διαθέτουμε άλλη πληροφορία για αυτά Αλλά θα γίνουν και περισσότερα λάθη στην περιγραφή – θέλει ειδική εκπαίδευση και μεγάλο κόστος επένδυσης Δυσκολεύει τη διαλειτουργικότητα

31 Κατηγορίες Μεταδεδομένων
Διαχειριστικά (administrative) Με πληροφορίες για τη διαχείριση και διατήρηση της εγγραφής, όπως δημιουργία, μετατροπή και σχέσεις με άλλες εγγραφές, π.χ. κάτοχος, ημερομηνίες δημιουργίας ή/και μεταβολής, γλώσσα εγγραφής, διαχείρισης δικαιωμάτων κλπ.  Δομικά (structural) Με πληροφορίες για την αποθήκευση και παρουσίαση  Περιγραφικά (descriptive) Με πληροφορίες που περιγράφουν ιδιότητες και περιεχόμενο του αντικειμένου στο οποίο αναφέρεται η εγγραφή και συμβάλλουν στην ανάκτηση (ανακάλυψη), π.χ. τίτλος, συγγραφέας, θεματικοί όροι, περίληψη

32 Φακοί και Όψεις Όλες οι κατηγοριοποιήσεις παρέχουν και πρέπει να παρέχουν μια μεροληπτική όψη της πραγματικότητας Κάθε όψη τονίζει συγκεκριμένα χαρακτηριστικά και κρύβει άλλα Geospatial Rights Museum

33 Κατηγορίες Μεταδεδομένων (2)
Κατηγορίες Μεταδεδομένων (2) Σύμφωνα με το Getty Institute: Administrative Descriptive Preservation Technical Use

34 Getty Institute

35 Getty Institute …

36 Getty Institute …

37 Getty Institute …

38 Getty Institute …

39 Στοιχεία δεδομένων Στοιχείο δεδομένων (data element)
είναι μία ενότητα δεδομένων για την οποία ο ορισμός (definition), η αναγνώριση (identification), η αναπαράσταση (representation) και οι επιτρεπτές τιμές (values) καθορίζονται μέσω ενός συνόλου ιδιοτήτων (attributes). Τα στοιχεία δεδομένων εφαρμόζονται στα πληροφοριακά μοντέλα επιχειρήσεων, στα μοντέλα δεδομένων, στα διαγράμματα ροής δεδομένων, στο σχεδιασμό βάσεων δεδομένων, στις προδιαγραφές διεπαφών και στα προγράμματα υπολογιστών. Για παράδειγμα, σε ένα μοντέλο δεδομένων, στην οντότητα υπάλληλος, με τις ιδιότητες όνομα, κωδικός, διεύθυνση που πρέπει να προσδιοριστούν, τα στοιχεία δεδομένων είναι: όνομα υπαλλήλου, κωδικός υπαλλήλου, διεύθυνση υπαλλήλου. Αντίστοιχα, στις σχεσιακές βάσεις δεδομένων, στοιχεία δεδομένων είναι οι ετικέτες των πεδίων, όπως και στα πληροφοριακά συστήματα. Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

40 Στοιχεία δεδομένων Το παρακάτω διεθνές πρότυπο περιγράφει τους ορισμούς, τις ιδιότητες και τις χρήσεις των στοιχείων δεδομένων. ISO/IEC 11179: Information technology – Specification and standardization of data elements Part 1: Framework for the specification of data elements Part 2: Classification for data elements Part 3: Basic attributes of data elements Part 4: Rules and guidelines for the formulation of data definitions Part 5: Naming and identification principles for data elements Part 6: Registration of data elements Τα στοιχεία δεδομένων που σχετίζονται με τα δεδομένα χρόνου, καλύπτονται από το παρακάτω πρότυπο: ISO/FDIS 8601: Data elements and interchange formats – Information interchange – Representation of dates and times. Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

41 Βασικά στοιχεία δεδομένων –IFLA (1)
Σύμφωνα με τις λειτουργικές προδιαγραφές για τις βιβλιογραφικές εγγραφές (FRBR) της IFLA, οι κύριες εργασίες που κάνουν οι χρήστες είναι: Εύρεση (Find) δεδομένων που αντιστοιχούν σε συγκεκριμένα κριτήρια αναζήτησης (π.χ. θέμα) Αναγνώριση (Identify) μίας οντότητας (π.χ. από μία άλλη με ίδιο τίτλο κλπ) Επιλογή (Select) οντότητας που ανταποκρίνεται στις ανάγκες τους (π.χ. γλώσσα, έκδοση) Απόκτηση (Obtain Access) της οντότητας που περιγράφεται (π.χ. παραγγελία, κράτηση για δανεισμό, πρόσβαση) Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

42 Βασικά στοιχεία δεδομένων –IFLA (2)
• Subject • Date • Conditions of use • Publisher • Name assigned to the resource • Language/mode of expression • Resource identifier • Resource type (i.e., what the resource is, rather than what it is about) • Author/creator • Version Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

43 Κατηγορίες Μεταδεδομένων
Σύμφωνα με την IFLA: Administrative Descriptive Analytical (subject) Rights management Technical Other, as determined

44 Στοιχεία δεδομένων – IFLA (1)
Administrative o Record number o Date of record creation o Date of last modification o Identification of creator/reviser of record o Language of record o Notes o Relationship of this record to other(s) Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

45 Στοιχεία δεδομένων - IFLA (2)
Descriptive o Title (also alternative and parallel titles; subtitles; short titles; etc.) o Creator (author; composer; cartographer; artist; etc.) o Date o Publisher o Unique identifiers (ISBN; ISSN; etc.) o Dynamic links (URI; URL; etc.) o Summary; descriptive note; review; etc. o Audience level o Physical media; format; etc. o Language of the item or object o Version Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

46 Στοιχεία δεδομένων - IFLA (3)
Analytical o Controlled subject terms, e.g., subject headings, descriptors o Subject/topic keywords o Abstract; Table of Contents (TOC) o Codes derived from classification systems or categorization schemes o Other elements of local importance, e.g., department affiliation; links to other related e-content Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

47 Στοιχεία δεδομένων - IFLA (4)
Rights Management o Restrictions on use o Permission statements o Subscriber/licensing/pay-per-use fees o Acknowledgements o Copyright notice o Retention schedules o Quality ratings o Use disclaimers Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

48 Στοιχεία δεδομένων - IFLA (5)
Technical o Digitizing equipment specifications o Camera positions o Shooting conditions o Coding parameters o Voice recognition and/or read-back hardware and software o Optical scanner specifications o Image rendering equipment o Type of file and conversion software requirements Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

49 Στοιχεία δεδομένων – LC (1)
Χαρακτηριστικά κάθε στοιχείου: Ονομασία (π.χ. access_category) Ορισμός Λειτουργία (access management, administration, discovery, persistent identifier, presentation, digital preservation and preservation reformatting) Τύπος (Administrative, Structural, Descriptive) Χρήση (frequency, requirement) Επίπεδο Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

50 Στοιχεία δεδομένων - LC (2)

51 Επίπεδα Μεταδεδομένων
Σύμφωνα με την Library of Congress, εφαρμόζονται τα παρακάτω επίπεδα, με ιεραρχική σειρά: Set (ψηφιακή συλλογή αντικειμένων) Aggregate (κατηγορία ψηφιακών αντικειμένων, π.χ. εικόνες) Primary Object (πρωτογενές αντικείμενο, ισοδύναμο του φυσικού, π.χ. βιβλίο) Intermediate Object (άποψη ή συστατικό του πρωτογενούς αντικειμένου, π.χ. παρουσίαση των σελίδων του βιβλίου ως εικόνες ή ως κείμενο) Terminal Object (το αρχείο ή τα αρχεία με το ψηφιακό περιεχόμενο του αντικειμένου) Σημ. 1: Τα μεταδεδομένα κάθε επιπέδου εφαρμόζονται σε όλα τα συστατικά του στο παρακάτω επίπεδο. Για το τελευταίο επίπεδο, αυτά είναι κυρίως δομικά μεταδεδομένα (μέγεθος αρχείων κλπ). Σημ. 2: Οι τιμές για τα μεταδεδομένα τα σχετικά με δικαιώματα πρόσβασης μπορεί να είναι διαφορετικές στα επί μέρους επίπεδα.

52 Επιλογή μεταδεδομένων
Είναι σημαντικό να καθοριστούν το πεδίο εφαρμογής τα κριτήρια οι μορφές των ψηφιακών αντικειμένων και συλλογών ο βαθμός λεπτομέρειας στην περιγραφή και παρουσίαση προκειμένου να αξιολογηθούν τα πρότυπα μεταδεδομένων και επιλεγεί το κατάλληλο. Ερώτηση: Ποια μπορεί να είναι τα βασικά στοιχεία που θα περιγράφουν μια δεδομένη ψηφιακή συλλογή; Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

53 Απάντηση (παράδειγμα)
Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα …………………………. Ερώτηση: Υποχρεωτικά Τίτλος Συγγραφέας Θέμα Ηλεκτρονική διεύθυνση Επιθυμητά Εκδότης Ημερομηνία Κατηγορία Σχόλια Αλλα σχετικά με συλλογή Αναγνωριστικά Γλώσσα Έκδοση Πνευματικά δικαιώματα ………………………….

54 Προσαρμογή Μεταδεδομένων
Τα μεταδεδομένα προσαρμόζονται σε πολλαπλές παραλλαγές / ποικιλίες Αποτυπώνοντας την ανομοιομορφία των δημιουργών και διατηρητών μεταδεδομένων Προσφέροντας για κάθε κοινότητα (συγκεκριμένο χώρο) εξειδικευμένη λειτουργικότητα, δημιουργία, διαχείριση, πρόσβαση, … Τηρώντας τα αντίστοιχα πρότυπα … Μεγαλύτερη εξειδίκευση = μεγαλύτερη λειτουργικότητα = λιγότερη διαλειτουργικότητα!

55 Τι είναι το Προφίλ Εφαρμογής
Ένα σχήμα μεταδεδομένων που ενσωματώνει ένα σύνολο στοιχείων από ένα ή περισσότερα σύνολα στοιχείων μεταδεδομένων (ή λεξιλογίων ή χώρους ονομάτων – namespaces) Ένα σύνολο από πολιτικές που ορίζουν πώς τα στοιχεία πρέπει να εφαρμόζονται στο πεδίο της εφαρμογής Ένα σύνολο οδηγιών που ξεκαθαρίζουν τις πολιτικές που αφορούν τα στοιχεία Make explicit

56 Λεξιλόγια και Προφίλ Εφαρμογών
Το Λεξιλόγιο δηλώνει όρους και ορισμούς Λεξιλόγιο Dublin Core = Πρότυπο Dublin Core Το Προφίλ Εφαρμογής επανα-χρησιμοποιεί όρους από ένα ή περισσότερα λεξιλόγια Μπορεί να συνδυάζει όρους από πολλαπλά λεξιλόγια Μπορεί να προσαρμόζει (εξειδικεύει) ορισμούς για τοπικούς σκοπούς ή εξειδικευμένους τομείς (domain-specific) Όλοι οι όροι πρέπει να ορίζονται στα λεξιλόγια Μπορεί να περιλαμβάνει τοπικά ορισμένα λεξιλόγια

57 Συμπεράσματα Χρήση προτύπων και καθιερωμένων κανόνων
Όχι αυτοσχεδιασμοί στην περιγραφή των δεδομένων Έστω και να φαινομενικά επαρκούν για την εφαρμογή Δεν φτάνει να δουλεύει μια εφαρμογή Πρέπει να μπορεί να δια-λειτουργεί στο μέλλον

58 Marc Διάταξη δεδομένων (format) : σύνολο κανόνων για τη δομή και το περιεχόμενο των δεδομένων

59 Η Μέθοδος των MARC 10/1000 κατηγορίες/πεδία Με υποπεδία
Με σαφή μονοσήμαντη σημασία Με υποχρεωτικά και προαιρετικά πεδία, Με πεδία (αδόμητων) σημειώσεων Επεκτείνονται πεπερασμένα για νέα πληροφορία Λειτουργούν σαν ένα σύνολο γραμματοκιβωτίων Επαρκές για αυτόνομες συλλογές Συστήνουν ανταλλαγή τους με ISO2709

60 Μειονεκτήματα του MARC
Τα μεταδεδομένα συνδέονται με μόνο ένα αντικείμενο ανά εγγραφή Δύσκολοι χαρακτηρισμοί συχνά καταγράφονται σε λάθος θέση Μη σχεσιακό, δόμηση με περιορισμούς Επεκτείνεται, αλλά τοπικά, περιορισμένα και αδόμητα Χρειάζεται αλλαγές στα δεδομένα για να παρακολουθεί την εξέλιξη Π.χ. CDROM  μεγάλο ή μικρό! Κοστίζει $50 / πλήρη εγγραφή

61 4#$uhttp://www.ionio.gr$zΙόνιο Πανεπιστήμιο
Πεδίο (1) 4#$uhttp:// Πανεπιστήμιο Electronic Location and Access Επαναλαμβανόμενο πεδίο, εάν βρίσκεται σε παραπάνω από μία θέση ή χρησιμοποιείται παραπάνω από μία μέθοδος πρόσβασης, για τους παρακάτω λόγους: Διαφορετικοί τρόποι πρόσβασης (π.χ. με HTTP, FTP, TELNET) Διαφορετικά μέρη ενός τεκμηρίου είναι ηλεκτρονικά, οπότε χρησιμοποιείται το υποπεδίο $3 για να δηλωθεί το μέρος Πολλές θέσεις στο διαδίκτυο (mirror sites) για λόγους ασφάλειας και διευκόλυνσης της πρόσβασης διεθνώς Εμφάνιση σε διαφορετικές μορφές (π.χ. κείμενα σε html, pdf κλπ, εικόνες με διαφορετική ανάλυση) Υπαρξη σχετικών τεκμηρίων που χρειάζεται να οριστούν

62 Πεδίο 856 (2) 1ος Δείκτης: Μέθοδος πρόσβασης
Πεδίο (2) 1ος Δείκτης: Μέθοδος πρόσβασης # Δεν παρέχονται πληροφορίες 0 Ηλεκτρονικό ταχυδρομείο  1 ftp (πρωτόκολλο μεταφοράς αρχείων) 2 remote login (telnet) απομακρυσμένη πρόσβαση 3 dial-up επιλεγόμενο τηλεφωνικό δίκτυο 4 http Διαδίκτυο 5 Η μέθοδος δηλώνεται στο υποπεδίο $2

63 Πεδίο 856 (3) 2ος Δείκτης: Σχέση
Πεδίο (3) 2ος Δείκτης: Σχέση  (ανάμεσα στην ηλεκτρονική πηγή που περιγράφεται στο πεδίο 856 και στις πληροφορίες της βιβλιογραφικής εγγραφής) # Δεν παρέχονται πληροφορίες 1 Πηγή (όταν αναφέρεται σε όλο το τεκμήριο που περιγράφεται στην εγγραφή, διαφορετικά για μέρος αυτού χρησιμοποιείται το υποπεδίο $3) 2 Εκδοση της πηγής (στο 856 τίθεται η διεύθυνση της ηλεκτρονικής έκδοσης του τεκμηρίου που περιγράφεται στην εγγραφή) 3 Σχετική πηγή (η θέση που δίνεται στο 856 αφορά ηλεκτρονική πηγή που σχετίζεται με το περιγραφόμενο στην εγγραφή τεκμήριο.) 4 Δεν δημιουργείται σταθερή εμφάνιση

64 Πεδίο (4) $a – Ονομασία διαθέτη – π.χ. όταν ο 1ος δείκτης είναι 0, 1 ή (Ε) $b – Αριθμός πρόσβασης στο διαθέτη (π.χ. IP, αριθμός τηλεφώνου) (ΔΕ) $c – Πληροφορίες συμπίεσης (Ε) $d – Διαδρομή– π.χ. όταν ο 1ος δείκτης είναι 1 (ftp) (Ε) $f – Ηλεκτρονική ονομασία - π.χ. όταν ο 1ος δείκτης είναι 0 ή 1 (Ε) $g - Uniform Resource Name (π.χ. DOI) (Ε) $h – Επεξεργαστής αιτήματος (κωδικός χρήστη πριν από το σύμβολο @) (ΔΕ) $i – Οδηγίες (στον απομακρυσμένο διαθέτη να επεξεργαστεί ένα αίτημα) (Ε) $j - Bits per second (ΔΕ)

65 Πεδίο 856 (5) $k – Κλειδάριθμός (Password) (ΔΕ)
Πεδίο (5) $k – Κλειδάριθμός (Password) (ΔΕ) $l - Logon (login) (ΔΕ) $m – Επαφή για βοήθεια στην πρόσβαση (Ε) $n – Ονομασία της θέσης του διαθέτη (γεωγραφική κλπ) (ΔΕ) $o – Λειτουργικό σύστημα (ΔΕ) $p - Πόρτα   (ΔΕ) $q – Ηλεκτρονικός τύπος διάταξης δεδομένων (text/HTML, ASCII, Postscript file, εκτελέσιμο αρχείο, JPEG) (ΔΕ) $r – Ρυθμίσεις (ΔΕ) $s – Μέγεθος αρχείου (Ε) $t - Terminal emulation (Ε) $u - Uniform Resource Locator (URL) (ΔΕ)

66 Πεδίο 856 (6) $v – Ωρες που είναι διαθέσιμος ο τρόπος πρόσβασης (Ε)
Πεδίο (6) $v – Ωρες που είναι διαθέσιμος ο τρόπος πρόσβασης (Ε) $w – Αριθμός ελέγχου εγγραφής   (Ε) $x – Μη δημόσια σημείωση (Ε) $z – Δημόσια σημείωση (Ε) $2 – Μέθοδος πρόσβασης (όταν ο πρώτος δείκτης είναι 7) (ΔΕ) $3 – Υλικά που προσδιορίζονται (πληροφορίες που προσδιορίζουν το μέρος του βιβλιογραφικού τεμαχίου στο οποίο εφαρμόζεται το πεδίο ) (ΔΕ) $6 – Σύνδεση (βλέπε υποπεδία ελέγχου) (ΔΕ) $8 – Αριθμός σύνδεσης και σειράς του πεδίου (Ε)

67 Πεδίο 856 (7) Τα πιο συχνά χρησιμοποιούμενα στοιχεία είναι :
Πεδίο (7) Τα πιο συχνά χρησιμοποιούμενα στοιχεία είναι : 1ος δείκτης = 4 για HTTP (μπορεί να μείνει κενός) υποπεδίο $u = [HTTP URL] υποπεδίο $3 = δηλώνεται σε ποιο URL αναφέρεται (π.χ. συγκεκριμένο κεφάλαιο, περίληψη, πίνακας περιεχομένων κλπ) υποπεδίο $z = σημειώσεις Ζήτημα: Ξεχωριστά αντίτυπα και ηλεκτρονικές συνδέσεις (;)

68 Πεδίο (8) Παραδείγματα $iejap subscription 1#$u ftp://path.net/pub/docs/urn2urc.ps 2#$utelnet://pucc.princeton.edu $nPrinceton University, Princeton, N.J.   3#$alocis.loc.gov $b $t3270 $tline mode (e.g., vt100) $vM-F 06:00-21:30 USA EST, Sat. 08:30-17:00 USA EST, Sun. 13:00-17:00 USA 40$uhttp://jefferson.village.virginia.edu/pmc/contents.html 4#$uhttp://hdl.handle.net/loc.test/gotthome$gurn:hdl.loc.test/ gotthome

69 Στοιχεία δεδομένων και Unimarc (1)
Τίτλος Παράλληλος τίτλος 510 Συγγραφείς 200$f $g, και/ή 700, 701, 710, 711 Διεύθυνση συγγραφέα 700$p, 701$p, 710$p, 711$p Δήλωση έκδοσης 205 Δημοσίευση, διάθεση 210 Φυσική περιγραφή 215 Συνοδευτικό υλικό 215, 307 Σειρά , 410

70 Κατάλογος υπερσυνδέσμων
Gill, Tony. "Metadata and the World Wide Web." In Introduction to Metadata: Pathways to Digital Information. Version 2.0. Edited by Murtha Baca. (J. Paul Getty Trust, 1998). Gilliland-Swetland, Anne J. "Setting the Stage." In Introduction to Metadata: Pathways to Digital Information. Version 2.0. Edited by Murtha Baca. (J. Paul Getty Trust, 1998).. Metadata Demystified: A guide for publishers. NISO Press, July 2003. Arms, Caroline R. “Some Observations on Metadata and Digital Libraries”. In: Conference on Bibliographic Control for the New Millennium, September Caplan, Priscilla. “International Metadata Initiatives: Lessons in Bibliographic Control. In: Conference on Bibliographic Control for the New Millennium, September 2003 Dublin Core Conference: Supporting Communities of Discourse and Practice-Metadata Research and Application, 28 Sept. – 2 Oct. 2003, Washington USA. Guidance on the Structure, Content, and Application of Metadata Records for Digital Resources and Collections. Report of the IFLA Cataloguing Section Working Group on the Use of Metadata Schemas. Draft – for Worldwide Review 27 October,

71 Κατάλογος υπερσυνδέσμων
Dublin Core Metadata Initiative (DCMI). The Dublin Core Metadata Element Set. ANSI/NISO Z  Metadata Encoding and Transmission Standard  Metadata Object Description Schema" (MODS)  MARC Standards Website.  OCLC, Bibliographic formats and standards.  UKOLN's metadata site  IFLA IFLA Functional Requirements for Bibliographic Records. Consortium for the Computer Interchange of Museum Information (CIMI) "The Value of Metadata".

72 Κατάλογος υπερσυνδέσμων
Bishoff, Liz, and William A. Garrison. "Metadata, Cataloging, Digitization and Retrieval: Who's Doing What to Whom: The Colorado Digitization Project Experience." Discussion paper presented at the Library of Congress Bicentennial Conference on Bibliographic Control for the New Millen74nium, November 15-17, 2000.  Online: "Dublin Core/MARC/GILS Crosswalk." Gilliland-Swetland, Anne J. "Setting the Stage." In Introduction to Metadata: Pathways to Digital Information. Version 2.0. Edited by Murtha Baca. (J. Paul Getty Trust, 1998).. Guenther, Rebecca, and Sally McCallum.  "New Metadata Standards for Digital Resources: MODS and METS." Bulletin of the American Society for Information Science and Technology (Dec/Jan. 2003):   Lee-Smeltzer, Kuang-Hwei. "Finding the Needle: Controlled Vocabularies, Resource Discovery, and the Dublin Core." Library Collections, Acquisitions, & Technical Services 24 (2000) Stringer-Hye, Suellen.  " Introduction to the Semantic Web, Organizing the Web for Better Information Retrieval or Can Librarians really save the Web?"  In Knowledge Technologies Seattle, March


Κατέβασμα ppt "Μεταδεδομένα στο ψηφιακό περιβάλλον"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google