ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ ΜΕ ΕΙΔΙΚΕΣ ΣΥΛΛΟΓΕΣ Ψηφιακές Βιβλιοθήκες για Εφημερίδες Παρουσίαση Ελένη Μαμμά Κέρκυρα, 2004
Περιεχόμενα Παρουσίασης (1/2) n Σημαντικότητα Εφημερίδων n Βιβλιοθήκες και Εφημερίδες n Χρησιμότητα Ψηφιακής Βιβλιοθήκης Εφημερίδων n Γνώση Ψηφιακής Βιβλιοθήκης Εφημερίδων n Στάδια δημιουργίας μίας ψηφιακής βιβλιοθήκης εφημερίδων n Τρέχουσες εφαρμογές και χρήσεις n Διαθεσιμότητα λογισμικού n Utah Digital Newspapers Project - Ιστορικό του προγράμματος - Χρήση λογισμικού
Περιεχόμενα Παρουσίασης (2/2) - Εμπλεκόμενοι εμπορικοί συνεργάτες - Δημιουργία της Ψ.Β. των εφημερίδων του Πανεπιστημίου της Utah - Οργάνωση ιστοσελίδας για On-Line πρόσβαση στις συλλογές των εφημερίδων - Μελλοντικές κατευθύνσεις - Συμπεράσματα - Σχόλια - Προβληματισμοί - Συνδέσεις
ΣΗΜΑΝΤΙΚΟΤΗΤΑ ΕΦΗΜΕΡΙΔΩΝ n Πρωταρχικής σημασίας πηγή ιστορικής πληροφόρησης (ιστορικοί, μελετητές, ερευνητές......) n Τεκμήρια πληροφόρησης με πολλαπλή διάσταση (κοινωνική, πολιτική, οικονομική, επιστημονική, πολιτιστική, αθλητική…….) n Έγκυρη και άμεση πληροφόρηση
ΒΙΒΛΙΟΘΗΚΕΣ ΚΑΙ ΕΦΗΜΕΡΙΔΕΣ n Α)Πλούσιο και πολυποίκιλο υλικό εφημερίδων μέσα στις Βιβλιοθήκες σε ολόκληρο τον κόσμο n Β)Τεράστιο πρόβλημα διατήρησης και πρόσβασης στο έντυπο υλικό (μεγάλο μέγεθος, εκτενής παραγωγή φύλλων ημερησίως, πολιτικές πρόσβασης & διάθεσης του υλικού) n Γ)Έντυπο τυπωμένο σε όξινο χαρτί (καταστρέφεται εύκολα) n Δ)Μικροφίλμ που δεν έχει παραχθεί και αποθηκευτεί σύμφωνα με διεθνή πρότυπα n Ε)Μεγάλο κόστος για αποθήκευση και χρηματοδότηση παραγωγής μικροφίλμ n ΣΤ)Απομόνωση περιεχομένου ενός άρθρου από ένα σύνολο κειμένων που δεν ενδιαφέρουν (δύσκολο επίτευγμα)
n Ζ)Ανυπαρξία δομημένης πληροφορίας (έλλειψη ευρετηρίων φύλλων, καταλόγων άρθρων, συγγραφέων, αποδελτίωσης αρθρογραφίας,…..)
ΨΗΦΙΑΚΗ ΒΙΒΛΙΟΘΗΚΗ ΕΦΗΜΕΡΙΔΩΝ n Δυνατότητα διατήρησης της πληροφορίας μέσω του ψηφιακού αντικειμένου n Εύκολη και έγκαιρη πρόσβαση στην ψηφιακή συλλογή n Γρήγορη ανάκτηση πληροφοριών n Αποτελεσματικοί μέθοδοι έρευνας για απόκτηση πληροφοριών n Δυνατότητα πολλαπλής χρήσης από πολλούς και διαφορετικούς χρήστες συγχρόνως μέσω της ηλεκτρονικής πρόσβασης n Καλύτερες και περισσότερο ευέλικτες συλλογές n Δομημένη και οργανωμένη πληροφορία
n Καλύτερη διαχείριση του περιεχομένου των συλλογών των εφημερίδων n Κατάλληλα εργαλεία δόμησης του υλικού των εφημερίδων (ευρετήρια φύλλων, κατάλογοι άρθρων, υπευθύνων συγγραφής,….)
ΤΙ ΠΡΕΠΕΙ ΝΑ ΓΝΩΡΙΖΟΥΜΕ ΓΙΑ ΤΙΣ Ψ.Β. n Στάδια και τρόπους δημιουργίας μίας ψηφιακής βιβλιοθήκης εφημερίδων n Πηγές υλικού που μπορούμε να χρησιμοποιήσουμε (έντυπο, μικροφίλμ, CD-ROM) n Διαδικασίες – βήματα που γίνονται n Τεχνολογίες που χρησιμοποιούνται n Τρόπους πρόσβασης στο περιεχόμενο του υλικού της εφημερίδας n Συνεργασία - διαλειτουργικότητα
ΒΑΣΙΚΑ ΣΤΑΔΙΑ ΔΗΜΙΟΥΡΓΙΑΣ ΜΙΑΣ ΨΗΦΙΑΚΗΣ ΒΙΒΛΙΟΘΗΚΗΣ ΕΦΗΜΕΡΙΔΩΝ n Δημιουργία συλλογών εφημερίδων ποιοτικά και ποσοτικά (πλήρης συλλογή σε χρονική έκταση αλλά και σε ποιότητα των φύλλων) n Συντήρηση των συλλογών n Δημιουργία ευρετηρίου φύλλων n Ψηφιοποίηση των συλλογών n Αποδελτίωση περιεχομένου των συλλογών n Επεξεργασία των δεδομένων που προκύπτουν από την όλη διαδικασία
n Δημιουργία βάσης των δεδομένων n Δημιουργία συστήματος αναζήτησης και ανάκτησης των δομημένων πληροφοριών
ΤΡΕΧΟΥΣΕΣ ΕΦΑΡΜΟΓΕΣ ΚΑΙ ΧΡΗΣΕΙΣ n Digital Newspapers Project (University of Utah) n Digital Collection and Preservation for Newspapers (OCLC) n Newspapers Digital Libraries – E preserve (Lambrakis Press Archive) n The British Library Newspapers Pilot Program
ΔΙΑΘΕΣΙΜΟΤΗΤΑ ΛΟΓΙΣΜΙΚΟΥ n Έτοιμα για χρήση και διαθέσιμα - CONTENT dm digital collections software (DiMeMa Inc.), Olive software technologies, OCLC – Digital Collection and Preservation, n Πιλοτικές εφαρμογές - E preserve (LPA),
n Δημιουργία Ψηφιακής Βιβλιοθήκης από τη βιβλιοθήκη Marriott του Πανεπιστημίου της Utah σε συνεργασία με 2 εμπορικούς συνεργάτες, iArchives Inc. & DiMeMa Inc. n iArchives Inc. - κόψιμο άρθρων - μεταδεδομένα - διαδικασία OCR - διαδικασία XML tagging - επαναπληκτρολόγηση τιτλοφορίας UTAH DIGITAL NEWSPAPERS PROJECT
n DiMeMa Inc. - λογισμικό CONTENT dm - Ανοικτή αρχιτεκτονική - Λειτουργικό σύστημα Windows, Linux, Unix n Ξεκίνημα και ανάπτυξη του project τη δεκαετία Συνεχίζεται έως και τις μέρες μας (2004), περνώντας από διάφορες φάσεις και διαδικασίες. n Περιλαμβάνει πάνω από 15 τίτλους τοπικών εφημερίδων που συλλέχθηκαν, δημιουργήθηκαν οι συλλογές και ψηφιοποιήθηκαν.
n Διαδικασία ψηφιοποίησης των συλλογών - Περιέχει 7 υψηλού επιπέδου βήματα που διαδραματίζονται μέσα από έλεγχο ποιότητας και ασφάλειας δεδομένων: Βήμα 1ο ΣΚΑΝΑΡΙΣΜΑ n Δημιουργία συλλογών από έντυπο υλικό και μικροφίλμ - Δημιουργία tiff & jpeg αρχείων εικόνων μέσα από ψηφιακή ανάλυση τουλάχιστον 300 dpi Διαδικασία δημιουργίας Ψ.Β. Εφημερίδων του Πανεπιστημίου της Utah
Βήμα 2ο ΚΟΨΙΜΟ - Δημιουργία κομμένων άρθρων σε ξεχωριστές εικόνες με σκοπό την μεμονωμένη ανάκτησή τους από όλη την σελίδα. - Κατηγοριοποίηση άρθρων με βάση το θέμα και την τιτλοφορία Βήμα 3ο ΜΕΤΑΔΕΔΟΜΕΝΑ - Συλλογή των μεταδεδομένων Βήμα 4ο OCR - Το λογισμικό της οπτικής αναγνώρισης χαρακτήρων τρέχει πάνω στις εικόνες και παράγει πλήρες κείμενο για κάθε άρθρο.
n Βήμα 5ο Αρχεία PDF - Το πλήρες κείμενο από το OCR συνδυάζεται με την εικόνα και σχηματίζει ένα αρχείο PDF για κάθε σελίδα και άρθρο. Έχουμε και την ενεργοποίηση αρχείων μεταδεδομένων XML. n Βήμα 6ο ΕΙΣΑΓΩΓΗ ΑΡΧΕΙΩΝ - Τα αρχεία PDF& XML εισάγονται στο λογισμικό και ενεργοποιείται αυτόματα η σύνδεση των σελίδων με τα απομονωμένα άρθρα των εφημερίδων.
n Βήμα 7ο Διακομιστής Ιστοσελίδας (Website Server) - Φόρτωση των αρχείων στον διακομιστή του Πανεπιστημίου και σύνδεσή τους με την ιστοσελίδα.
n Αναζήτηση όλων των θεμάτων της εφημερίδας με βάση: - λέξεις – κλειδιά - ημερομηνία - τίτλο άρθρου - τύπο άρθρου - χρονολογία - ημερομηνία θέματος n Δεύτερη διαθέσιμη αναζήτηση γίνεται και μέσω του Acrobat λόγω των εικόνων PDF που περιέχουν κρυμμένο κείμενο. ΟΡΓΑΝΩΣΗ ΤΗΣ ΙΣΤΟΣΕΛΙΔΑΣ ΓΙΑ ON-LINE ΠΡΟΣΒΑΣΗ ΣΤΙΣ ΣΥΛΛΟΓΕΣ
ΜΕΛΛΟΝΤΙΚΕΣ ΚΑΤΕΥΘΥΝΣΕΙΣ Βασικοί στόχοι σχετικά με το πρόγραμμα: n Επέκταση του αριθμού των συλλογών n Χρήση νέων τεχνολογιών n Συγκομιδή μεταδεδομένων από 4 κέντρα που αφορούν το πρόγραμμα n Συνδυασμός όλων των συλλογών για ταυτόχρονες αναζητήσεις n Εκπαίδευση προσωπικού ακαδημαϊκών και ιστορικών ιδρυμάτων για το πρόγραμμα των ψηφιακών βιβλιοθηκών για εφημερίδες
ΣΥΜΠΕΡΑΣΜΑΤΑ - ΣΧΟΛΙΑ n Αποτελεσματική μέθοδος ψηφιοποίησης του υλικού n Χρήση ανοικτών πρωτοκόλλων n Λογισμικό ευρείας αποδοχής και χρήσης n Πρόγραμμα το οποίο δεν έχει ακόμα επίσημα δημοσιευθεί n Σύστημα αναζήτησης και πρόσβασης στις ψηφιακές συλλογές των εφημερίδων: αποτελεσματικό, εύκολο και φιλικό προς τους χρήστες.
ΠΡΟΒΛΗΜΑΤΙΣΜΟΙ n Κατά πόσο είναι εφικτό οι υπηρεσίες πληροφόρησης, δημοσίου και ιδιωτικού χαρακτήρα, να πεισθούν σε μεγάλο ποσοστό για να δομήσουν και να οργανώσουν το υλικό τους μέσα από τη δημιουργία ψηφιακών βιβλιοθηκών και αρχείων; n Σε επίπεδο επιλογής μοντέλου δημιουργίας ψηφιακών βιβλιοθηκών με βάση ποια κριτήρια καταλήγουμε σε ένα ήδη υπάρχον ή σε δικό μας;
ΣΥΝΔΕΣΕΙΣ n D-Lib Magazine, March 2003, volume 9, number 3 Kenning Arlitsch, L. Yapp, Karen Edge, The Utah Digital Newspapers Project n RLG DigiNews, August 2002, volume 6, number 4 Marilyn Deegan, Emil Steinvel, Edmund King, Digitizing Historic Newspapers : Progress and Prospects n University of Utah, Marriott Library, November 2003, volume 47, number 1 and 2, John Herbert, Kenning Arlitsch, The Digital Newspapers Program at the University of Utah
n OCLC Organization, CONTENTdm Digital Collection Management Software n LPA (Lambrakis Press Archive)