Αρχειοθέτηση του Ιστού Nordic Web Archive Toolset Ηλεκτρονική δημοσίευση Διδάσκοντες : Σ. Καπιδάκης, Μ. Γεργατσούλης Μαρίνα Κομπολύτη Εαρινό εξάμηνο 2003/2004 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας "Διοίκηση & Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας"
Περιεχόμενα Web archiving στις Σκανδιναβικές χώρες Nordic Web Archive NWA project NWA Toolset
Web archiving στις Σκανδιναβικές χώρες (1) Διαφύλαξη της πολιτιστικής κληρονομιάς Εθνικές Βιβλιοθήκες (Δανία, Σουηδία, Φινλανδία, Νορβηγία, Ισλανδία) Προγράμματα Συνεργατικά : NORDINFO Nordic Web Index Εθνικά: Kulturarw-project (Σουηδία) Paradigma project (Νορβηγία)
Web archiving στις Σκανδιναβικές χώρες (2) Harvesting : Δύο προγράμματα συγκομιδής (NEDLIB, Combine) Κάθε χώρα αρχειοθετεί και αποθηκεύει το υλικό που την αφορά Δεν είναι δυνατή η διαχείριση αρχείων όπως π.χ. χάρτες Οι συλλογές περιορίζονται στα πρωτόκολλα http και ftp
Nordic web archive(1) 1997 Forum ανταλλαγής εμπειριών και συνεργασίας 1998 Πρόγραμμα: Καθορισμός ειδικών λειτουργικών και τεχνικών προδιαγραφών για την αρχειοθέτηση και την πρόσβαση. Συνεργασία βασιζόμενη στα ήδη υπάρχοντα εθνικά προγράμματα. Να ενταχθεί η συνεργασία των Σκανδιναβικών χωρών σε μία ευρύτερη Ευρωπαϊκή συνεργασία
Nordic web archive(1) Στόχοι : Συγκομιδή Αρχειοθέτηση Πρόσβαση στα αρχεία
NWA project(1) Σκοπός : Κοινό εργαλείο αναζήτησης και πλοήγησης στο αρχειοθετημένο υλικό Λόγοι : Οι βάσεις μεταδεδομένων της συγκομιδής δεν καλύπτουν ανάγκες αναζήτησης χρηστών Δεν είναι δυνατή η αναζήτηση σε πλήρες κείμενο Εργαλεία ευρετηρίασης για οποιοδήποτε πρόγραμμα συγκομιδής Χρονική πλοήγηση του χρήστη Αναζήτηση με το URL
NWA project(2) Αποτέλεσμα: το NWA toolset Χρήση : Εθνικές Βιβλιοθήκες Ιδρύματα / Οργανισμοί Ιδιώτες Προυποθέσεις Ύπαρξη αρχειοθετημένου υλικού Μεταδεδομένα (URL, χρονική στιγμή) Μηχανή αναζήτησης
NWA project2(2) Στόχοι: Βελτίωση των εργαλείων Ενσωμάτωση διαφορετικών λογισμικών ευρετηρίασης Να γίνει το NWA Toolset ανοιχτό λογισμικό Προσθήκη νέων λειτουργιών Αξιολόγηση χρηστών
NWA Toolset Document Retriever Διεπαφή του Web αρχείου Exporter Προετοιμάζει τα αντικείμενα για ευρετηρίαση Access Module Δυνατότητα διεπαφής για αναζήτηση και πλοήγηση
Exporter
Μεταδεδομένα url> <![CDATA[ HTTP/ OK Date: Thu, 05 Sep :35:53 GMT Server: Apache/ (Unix) PHP/4.1.2 Last-Modified: Wed, 08 Aug :25:01 GMT ETag: "17fb4-b38a-3b70f75d" Accept-Ranges: bytes Content-Length: Connection: close Content-Type: text/html]]>
NWA Document Format <nwaDocumentCollection xmlns=" xmlns:dc=" no /var/hepp/ _1_539210b1c4b0ce5e9b9fd76d296b91ba Oslo SU støtter Streik på Aker Streik på D/S Louise text/html <![CDATA[Oslo SU støtter Streik på Aker Brygge Hei alle dere der ute Selv i disse krigs og postvalgstider går klassekampen videre. Som mange av dere kanskje vet er det for tida streik på Aker Brygge. Arbeidera på D/S Louise streiker. Dette har'em holdt på med i tre uker nå, og dem b'ynner å bli slitne.]]> >
Access module
Δομή του NWA Toolset XML COMMON FORMAT INDEXES WEB INTERFACE ARCHIVE ACCESS SEARCH ENGINE INDEXER ARCHIVE FIND_DOCUMENT(URN) DOCUMENT FIND_ID (URL,TIME) URN
Web browser(1) Η αναζήτηση μπορεί να γίνει είτε με λέξεις είτε με το αυθεντικό URL
Web browser(2) Οι εγγραφές που επιστρέφουν αναφέρουν τον τίτλο της σελίδας, το URI του αρχείου, τις διαθέσιμες εκδόσεις και δίνουν δύο δυνατότητες προσέγγισης : timeline ή overview.
Web browser(3) Timeline
Web browser(4) Overview