Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Αρχειοθέτηση του Ιστού: το έργο Pandora Χαρά Γιούλη Μάιος 2004

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Αρχειοθέτηση του Ιστού: το έργο Pandora Χαρά Γιούλη Μάιος 2004"— Μεταγράφημα παρουσίασης:

1 Αρχειοθέτηση του Ιστού: το έργο Pandora Χαρά Γιούλη Μάιος 2004
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ -Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας «Διοίκηση & Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας»   Εργασία στο πλαίσιο του μαθήματος ‘Ηλεκτρονική Δημοσίευση’ Διδάσκοντες: Σ. Καπιδάκης, Μ. Γεργατσούλης   Αρχειοθέτηση του Ιστού: το έργο Pandora Χαρά Γιούλη Μάιος 2004

2 Περιεχόμενα παρουσίασης
Η σημασία του Παγκόσμιου Ιστού (World Wide Web) Γιατί πρέπει να αρχειοθετηθεί ο Παγκόσμιος Ιστός; Προκλήσεις και προβλήματα της συντήρησης του Ιστού Πρωτοβουλίες για την αρχειοθέτηση του Ιστού Tο έργο “Pandora” - Εθνική Βιβλιοθήκη της Αυστραλίας Επιλογή του υλικού προς αρχειοθέτηση Θέματα προσκτήσεων και το σύστημα PANDAS Πρόσβαση στο αρχείο PANDORA Διατήρηση Μελλοντικές εξελίξεις

3 Η σημασία του Παγκόσμιου Ιστού (World Wide Web)
Διαδίκτυο - κυρίαρχο μέσο επικοινωνίας Παγκόσμιος Ιστός (WWW)-μία από τις προσφερόμενες υπηρεσίες του Διαδικτύου Ο Ιστός διαδραματίζει σημαντικό ρόλο: Έρευνα Πρόσβαση σε βάσεις δεδομένων Προσωπική επικοινωνία Ηλεκτρονικό εμπόριο Εκδόσεις Έκφραση προσωπικών ιδεών Η αξία του Ιστού συνεχώς αυξάνεται και αποτελεί πληροφοριακή πηγή για εκατομμύρια χρήστες Ο Ιστός έχει καθιερωθεί ως ένα βασικό μέσο επικοινωνίας μεταξύ των ανθρώπων

4 Γιατί πρέπει να αρχειοθετηθεί ο Παγκόσμιος Ιστός;
Γιατί πρέπει να αρχειοθετηθεί ο Παγκόσμιος Ιστός; Η σημασία του είναι προφανής εάν αναλογιστούμε ότι ένας σημαντικός αριθμός χρηστών του Διαδικτύου χρησιμοποιεί σχεδόν καθημερινά τον Ιστό για την άντληση πληροφοριών και την ενημέρωσή του Η ταχεία ανάπτυξη του Ιστού είναι κατά ένα μεγάλο μέρος χαοτική Η φύση του Ιστού είναι δυναμική Χωρίς τη συλλογή και συντήρηση του διατιθέμενου περιεχομένου υπάρχει ο κίνδυνος ανεκτίμητοι μορφωτικοί, πολιτιστικοί και επιστημονικοί πόροι να μην είναι διαθέσιμοι στις μελλοντικές γενιές Η μέση διάρκεια ζωής μιας ιστοσελίδας είναι μόνο 44 ημέρες, και 44% των δικτυακών τόπων που ήταν προσβάσιμοι το 1998, δεν ήταν διαθέσιμοι το 1999

5 Προκλήσεις και προβλήματα της συντήρησης του Ιστού
Αποκεντρωμένη οργάνωση Δυναμική φύση Τεχνολογίες υπό συνεχή εξέλιξη Νομικές προκλήσεις

6 Πρωτοβουλίες για την αρχειοθέτηση του Ιστού
Αρχεία Εθνικές Βιβλιοθήκες (Αυστραλίας, Σουηδίας Αυστρίας, Δανίας, Φινλανδίας, Γαλλίας, Γερμανίας κ.α.) Ιδιοκτήτες δικτυακών τόπων (π.χ. BBC) Πανεπιστήμια και πολιτιστικοί φορείς - υλοποιούν αρχειοθέτηση του Ιστού αλλά σε μικρότερη κλίμακα και με στενότερο θεματικό πεδίο ενδιαφέροντος

7 Μέθοδοι και προσεγγίσεις για τη συλλογή δικτυακών τόπων
Αυτόματη συγκομιδή (automatic harvesting) Επιλεκτική επιλογή (selective capture) Υποβολή/παράδοση περιεχομένου (deposit approaches) Συνδυασμός προσεγγίσεων

8 Tο έργο “Pandora” (Εθνική Βιβλιοθήκη της Αυστραλίας)
(“Preserving and Accessing Networked DOcumentary Resources of Australia”) Συλλέγει υλικό επιλεκτικά (σημαντικών, αυστραλιανών δικτυακών τόπων καθώς και άλλου υλικού π.χ. κυβερνητικές δημοσιεύσεις, πρακτικά, ηλεκτρονικά περιοδικά του Ιστού) Συνεργάζεται με 9 άλλους φορείς (βιβλιοθήκες) της Αυστραλίας Το αρχείο “Pandora” είναι προσβάσιμο από τη διεύθυνση

9 Η κεντρική ιστοσελίδα πρόσβασης στο “Pandora”

10 Το αρχείο “Pandora” Aντιπροσωπευτικό δείγμα του αυστραλιανού μέρους του Ιστού, με υλικό από τον ακαδημαϊκό τομέα, την κυβέρνηση, τις εμπορικές και κοινοτικές οργανώσεις καθώς και από ιδιώτες χρήστες Αρκετό από το αρχειοθετημένο υλικό έχει πλέον εξαφανιστεί από τον Ιστό και δεν είναι πια διαθέσιμο με άλλο τρόπο πέρα από τη χρήση του αρχείου Το μέγεθος του αρχείου: πάνω από μισό terabyte (ΤΒ) 5.000 τίτλους (ιστοσελίδες, έγγραφα, δημοσιεύσεις, πρακτικά, περιοδικά κα.) "εκδόσεις" (instances) που αναφέρονται στους παραπάνω τίτλους

11 Ο επίσημος δικτυακός τόπος της Ολυμπιάδας του Σύδνεϋ το 2000
Ενδεικτικό παράδειγμα δικτυακού τόπου που έχει εξαφανιστεί από το Διαδίκτυο Ο επίσημος δικτυακός τόπος της Ολυμπιάδας του Σύδνεϋ το 2000

12 Επιλογή του υλικού προς αρχειοθέτηση
Οδηγίες για την επιλογή των δικτυακών τόπων Το περιεχόμενο πρέπει να έχει σχέση με την Αυστραλία Ο δημιουργός του περιεχομένου να είναι Αυστραλός Η αξία του δημιουργού & η ερευνητική αξία του περιεχομένου Το εάν το υλικό είναι διαθέσιμο και σε έντυπη μορφή ή όχι Το εάν η διάθεση του υλικού στον Ιστό υπόκειται σε κάποιο έλεγχο ποιότητας Το δημόσιο ενδιαφέρον για το συγκεκριμένο υλικό, και Εάν το υλικό ευρετηριάζεται από κάποια αναγνωρισμένη υπηρεσία

13 Το σύστημα PANDAS PANDAS - ψηφιακό σύστημα αρχειοθέτησης
Διαχειρίζεται τα μεταδεδομένα για τους τίτλους Αρχίζει τη συλλογή των τίτλων που θα αρχειοθετηθούν Διαχειρίζεται τον ποιοτικό έλεγχο Προετοιμάζει το υλικό για δημόσια διάθεση Διαχειρίζεται τους περιορισμούς πρόσβασης, και Δημιουργεί αναφορές χρήσης, στατιστικών κτλ.

14 Συλλογή των δικτυακών τόπων
Η πλειοψηφία του υλικού συλλέγεται από τη Βιβλιοθήκη, ελαχιστοποιώντας έτσι την ανάγκη της αρχειοθέτησης από την πλευρά των εκδοτών Καθορίζει το κατάλληλο χρονοδιάγραμμα για τη συλλογή του υλικού Από τεχνικής άποψης, για τη συλλογή του υλικού χρησιμοποιείται το πρόγραμμα (harvesting robot) HTTrack To HTTrack πηγαίνει στο συγκεκριμένο URL στην ιστοσελίδα του εκδότη και φέρνει πίσω τα συνδεμένα αρχεία που αποτελούν την έκδοση ή το δικτυακό τόπο που έχει επιλεγεί για αρχειοθέτηση Έλεγχος των συλλεχθέντων ιστοσελίδων (αυτόματα & χειροκίνητα)

15 Προετοιμασία των ιστοσελίδων για διάθεση στο κοινό
Αφαιρούνται οι εξωτερικές συνδέσεις, οι φόρμες καθώς και οι παραπομπές προς διευθύνσεις ηλεκτρονικού ταχυδρομείου Ο χρήστης ενημερώνεται ότι για να επισκεφθεί αυτές τις πληροφορίες θα πρέπει να αφήσει την αρχειοθετημένη έκδοση και να επισκεφθεί τον αυθεντικό δικτυακό τόπο Μια κατάλληλα διαμορφωμένη ιστοσελίδα παράγεται για κάθε καινούριο τίτλο: Συχνότητα συλλογής του τίτλου Παροχή σύνδεσης με τον αυθεντικό δικτυακό τόπο του εκδότη Αρχειοθετημένες εκδόσεις του τίτλου Περιορισμούς πρόσβασης Δήλωση πνευματικών δικαιωμάτων του εκδότη και της Βιβλιοθήκης Ενημέρωση των αλφαβητικών & θεματικών καταλόγων

16 Η ιστοσελίδα πρόσβασης σε συγκεκριμένο αρχειοθετημένο δικτυακό τόπο (title entry page)

17 Πρόσβαση στο αρχείο PANDORA
Δημιουργία μόνιμου προσδιοριστικού (persistent identifier) PANDORA Persistent Identifier Standard <collection id>-<work identifier>-<archive date>-<publisher’s URI>-<generation code> Έλεγχος πρόσβασης στο αρχείο H πρόσβαση δεν είναι ελεύθερη στο σύνολο του αρχείου Πρόσβαση μέσω κωδικού σε συγκεκριμένο μέρος του υλικού και για συγκεκριμένο χρονικό διάστημα Υλικό ευαίσθητης φύσης Υλικό με συνδρομή από τον εκδότη Υλικό ειδικού περιεχομένου Σε σπάνιες περιπτώσεις δεν επιτρέπεται καθόλου η πρόσβαση σε κάποιο τίτλο

18 Διατήρηση Το πρώτο βήμα στην εξασφάλιση βιώσιμης πρόσβασης περιλαμβάνει τη δημιουργία ενός ασφαλούς τόπου όπου τα ψηφιακά δεδομένα θα μπορούν να αντιμετωπίζονται ως αξιόλογοι πόροι και θα αποθηκεύονται με ασφάλεια Η Βιβλιοθήκη βρίσκεται όμως στα πρώτα στάδια της μελέτης και υλοποίησης κάποιας λύσης που αφορά στην μακροπρόθεσμη διατήρησή του Η βιβλιοθήκη είναι αντιμέτωπη με το πρόβλημα της πολύπλοκης τεχνικής φύσης του υλικού που αρχειοθετεί Θέσπιση στρατηγικών: στη διατήρηση της υπάρχουσας τεχνολογίας στη συνεργασία με τους εκδότες του υλικού για την σταθερή παροχή του προς το αρχείο στη μετάπτωση (migration) από κάποιο τύπο αρχείου σε ένα νεότερο, που να είναι όμως συμβατός με τον προηγούμενο στη δημιουργία εξομοιωτών (emulators) για τη χρήση κάποιων τύπων αρχείων

19 Μελλοντικές εξελίξεις
Η προσέγγιση της επιλεκτικής επιλογής του υλικού προς αρχειοθέτηση είναι πολύ επίπονη και προϋποθέτει τη συνεχή ανθρώπινη παρέμβαση Η εξέλιξη του λογισμικού PANDAS προσφέρει ένα βαθμό αυτοματοποίησης σε κάποια μέρη της διαδικασίας Οι ανάγκες που πρέπει να αντιμετωπισθούν είναι: Αυτοματοποίηση της επεξεργασίας του μεγάλου όγκου του υλικού και διαχείρισης των μεταδεδομένων Βελτιστοποίηση της αναζήτησης υλικού στο αρχείο Δυνατότητα συλλογής υλικού και με άλλες μεθόδους (deep web) Συνεργασία μεταξύ των φορέων

20 Συμπεράσματα Η αρχειοθέτηση του Ιστού παρουσιάζει διάφορες δυσκολίες και προκλήσεις που έρχονται να αντιμετωπίσουν οι διάφορες προσεγγίσεις για την αρχειοθέτησή του Η Εθνική Βιβλιοθήκη της Αυστραλίας έχει πρωτοπορήσει με την ανάπτυξη του έργου PANDORA και τη δημιουργία του αντίστοιχου αρχείου Ο ρόλος του αρχείου είναι σημαντικός στη διασφάλιση της πρόσβασης των μελλοντικών γενιών στο σημερινό περιεχόμενο του Αυστραλιανού Ιστού διατηρώντας έτσι μέρος της “κληρονομιάς” της χώρας


Κατέβασμα ppt "Αρχειοθέτηση του Ιστού: το έργο Pandora Χαρά Γιούλη Μάιος 2004"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google