Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

“Preserving the Fabric of Our Lives: a survey of Web Preservation Initiatives” «Διατηρώντας το νήμα της ζωής μας: Μια έρευνα για πρότυπα διατήρησης του.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "“Preserving the Fabric of Our Lives: a survey of Web Preservation Initiatives” «Διατηρώντας το νήμα της ζωής μας: Μια έρευνα για πρότυπα διατήρησης του."— Μεταγράφημα παρουσίασης:

1 “Preserving the Fabric of Our Lives: a survey of Web Preservation Initiatives” «Διατηρώντας το νήμα της ζωής μας: Μια έρευνα για πρότυπα διατήρησης του Ιστού» Εργασία για το μάθημα: «Ηλεκτρονική Δημοσίευση» Παρουσίαση: Πουλημένου Αλίκη Σύλβια

2 Preserving the Fabric of Our Lives2 Preserving the Fabric of our Lives: A Survey of Web Preservation Initiatives Συγγραφέας: Michael Day. Στα πρακτικά του 7ου Ευρωπαϊκού συνεδρίου “Research and Advanced Technology for Digital Libraries”, το 2003 στο Trondheim της Νορβηγίας. Παρουσίαση κυρίων αποτελεσμάτων της feasibility study “Collecting and preserving the World Wide Web” UKOLN, JISC, Library of the Welcome Trust.

3 Preserving the Fabric of Our Lives3 UKOLN, JISC και Library of the Welcome Trust. UKOLN: UK Office for Library Networking.  Έδρα το Πανεπιστήμιο του Bath.  Διαχείριση ψηφιακής πληροφορίας.  Παρέχει συμβουλές και υπηρεσίες σε βιβλιοθήκες και γενικότερα σε κοινότητες πληροφορίας, εκπαίδευσης και πολιτιστικής κληρονομιάς. JISC: Joint Information Systems Committee of the Higher and Further Education Funding Councils.  Χρηματοδότηση προγραμμάτων έρευνας.  Στοχεύουν σε 8 θεματικές, μεταξύ αυτών και το περιβάλλον της πληροφορίας και πιο συγκεκριμένα, η εύκολη πρόσβαση σε πόρους. Library of the Welcome Trust.  Συλλέγει υλικό το οποίο αφορά την ιατρική και τον ρόλο της στη κοινωνία.  Λονδίνο  Ελεύθερη στο κοινό.

4 Preserving the Fabric of Our Lives4 Ο Ιστός (Web) Περισσότερο διαδεδομένο και χρησιμοποιούμενο εργαλείο του διαδικτύου – φιλικό περιβάλλον. Διευκόλυνση του επιστημονικού και μη επιστημονικού κοινού (έρευνα, e-commerce, marketing). Το υλικό που διατίθεται στο Web προέρχεται από:  Οργανισμούς.  Φυσικά πρόσωπα.  Εταιρείες (εμπόριο).

5 Preserving the Fabric of Our Lives5 Τα προβλήματα (1/3) Τεχνικής φύσεως  Μέγεθος του Web Surface Web 25-50 Tb /2000 Surface Web 167 Tb - Deep Web σε 91,850 Tb/ 2002  Κρυμμένες σελίδες (Invisible/ Hidden/ Deep Web). Δυναμικές σελίδες, με προβλήματα format, σελίδες που έχουν διάφορους περιορισμούς, όπως προσωπικό κωδικό (password).  Δυναμική φύση των ιστοσελίδων (εκλογές, αθλητικά γεγονότα - σελίδες υψηλής επικινδυνότητας).  Τεχνολογία - αλλαγές με τρομακτικά γρήγορους ρυθμούς Ορισμένα πρότυπα και πρωτόκολλα τα οποία παραμένουν σταθερά Τρομερές αλλαγές στο τρόπο διαχείρισης των ιστοσελίδων “Semantic Web”.

6 Preserving the Fabric of Our Lives6 Τα προβλήματα (2/3) Νομικής φύσεως  Πνευματικά δικαιώματα (copyright).  Ευθύνη (liability) του περιεχομένου το οποίο παρέχεται μέσω των αρχείων. Προστασία δεδομένων και δυσφήμηση. Ανάγκη συλλογής τέτοιου είδους πηγών με πολύ μεγάλη προσοχή. Ανάπτυξη πολιτικών σχετικά με την διαχείριση των δικαιωμάτων, σε συνδιασμό με τον περιορισμό πρόσβασης σε συγκεκριμένο υλικό.

7 Preserving the Fabric of Our Lives7 Τα προβλήματα (3/3) Οργανωτικής φύσεως  Αποκεντρωμένη φύση του Web  Επιλογή με βάση τα ενδιαφέροντα – εξαίρεση οι Εθνικές Βιβλιοθήκες.  Ποιότητα των πληροφοριών που διατίθενται στο Web

8 Preserving the Fabric of Our Lives8 Web Archiving Initiatives US-based Internet Archive  Ιδιωτική χρηματοδότηση.  Συλλέγει ιστοσελίδες -1996.  Τεράστια βάση δεδομένων.  Ανάκτηση από την Wayback Machine. Εθνικές βιβλιοθήκες  Σουηδίας και Αυστραλίας.  Αυστρίας, Φιλανδίας, Γαλλίας.  15 στις 25 βιβλιοθήκες ασχολούνταν με κάποιο σχετικό πρότυπο, είχαν ενσωματώσει την αρχειοθέτηση του Web ως νομική υποχρέωση τους.

9 Preserving the Fabric of Our Lives9 Web Archiving Initiatives Εθνικά Αρχεία  Συλλέγουν κυρίως ιστοσελίδες οι οποίες έχουν αποδεικτική αξία.  Οδηγίες (guidelines) – ώστε να πληρούν τις προδιαγραφές για συλλογή και διατήρηση. NARA (US. National Archives and Records Administration)  Ομοσπονδιακές αρχές (federal agencies)  Στιγμιότυπο (snapshot) των ιστοτόπων τους στο τέλος της Clinton Administration για κατάθεση. Πανεπιστήμια  Archipol project, Occasio Archive.

10 Preserving the Fabric of Our Lives10 Παρουσίαση βασικών projects (1/2) Kulturarw3 project  Royal Library of Sweden (KB)/1996, συλλογή Σουηδικό υλικού που βρίσκεται στον Ιστό. Internet Archive  Μη κερδοσκοπικός οργανισμός και βρίσκεται στο Presidio of San Francisco (1996).  Στόχος: Internet Library, θα παρέχει πρόσβαση σε ιστορικές συλλογές που βρίσκονται σε ψηφιακή μορφή (κείμενα, ήχο, κινούμενες εικόνες, λογισμικό και ιστοσελίδες). Biblioteque National de France ( BnF)  Εθνική βιβλιοθήκη της Γαλλίας  Droit d’auteur et droits voisins dans la société de l’information Austrian OnLine Archive AOLA project  Austrian National Library (OeNB) και το Department of Software Technology IFS at the Technical University of Vienna  Αρχείο - Austrian Webspace.

11 Preserving the Fabric of Our Lives11 Παρουσίαση βασικών projects (2/2) Preserving and Accessing Networked Documentary Resources of Australia ( PANDORA)  Australia’s Web Archive από Εθνική Βιβλιοθήκη της Αυστραλίας  Επιλεγμένες εκδόσεις του διαδικτύου και ιστοσελίδες Helsinki University Library  Εθνική Βιβλιοθήκη της Φιλανδίας Britain on the Web (Domain UK)  Διάρκεια ενός έτους με σκοπό την συλλογή 100 ιστοτόπων από το Ηνωμένο Βασίλειο (UK)/ 2001 για εξερεύνηση ζητημάτων σχετικών με επιλογή, αλλαγές και τεχνικά θέματα. Mapping the INternet Electronic Resources Virtual Archive / LC (Minerva Prototype)  Στόχος: συλλογή και οργάνωση συγκεκριμένων ιστοτόπων και στη συνέχεια εφαρμογή προγράμματος διατήρησης τους/ 2000.

12 Preserving the Fabric of Our Lives12 Τεχνικές συλλογής Αυτόματη συγκομιδή (Automatic harvesting).  Internet Archive, Kulturarw3 project, Helsinki University Library, AOLA.  Crawlers  Πρωτόκολλο robot.txt (SRE) Συλλογή με συλλογή (Selection and capture).  NLA-PANDORA Archive/1997 - PANDAS (διαδικασία συλλογής, δημιουργίας και διαχείρισης μεταδεδομένων – έλεγχοι ποιότητας - πρόσβαση).  Επιλογή ιστοτόπων βάση οδηγιών.  Διαπραγμάτευση δικαιωμάτων με ιδιοκτήτες.  Συλλογή ιστοτόπων Μέσω gathering και mirroring tools. Αποστολή – παράδοση αρχείων από ιδιοκτήτες μέσω ftp/email.  Minerva Project  Britain on the Web Παραδοσιακό μοντέλο κατάθεσης (Traditional deposit model).  Ιδιοκτήτες/ διαχειριστές.  Κατάθεση αντιγράφου ή snapshot του ιστοτόπου στο αποθετήριο του οργανισμού.  NARA, Die Deutche Bibliothek Επικρατούσα τάση: συνδυασμός τεχνικών – π.χ. BnF

13 Preserving the Fabric of Our Lives13 Περαιτέρω θέματα που θέτει ο συγγραφέας (1/3) Πολιτικές συλλογής και κάλυψης.  Domain, robots.txt, guidelines, ιστότοποι οι οποίοι ανανεώνονται συχνά, 404 Error, broken links Πολιτικές πρόσβασης.  Wayback Machine, ευρετήρια, μεταδεδομένα, NWA Toolset Λογισμικό  Automatic harvesting και selective  Μείωση κόστους – αυτοματοποίηση εργασίας.

14 Preserving the Fabric of Our Lives14 Περαιτέρω θέματα που θέτει ο συγγραφέας (2/3) Λογισμικό – παραδείγματα  Web harvesting Combine Crawler, χρησιμοποιείται από το Kulturarw3 project της Swedish Royal Library. NEDLIB harvester από την Finnish CSC. Xyleme Crawler, δοκιμασμένος στην BnF. Alexa Crawler, χρησιμοποιείται από το Internet Archive.  Selective Harvest, χρησιμοποιήθηκε από το PANDORA. HTTrack, χρησιμοποιείται από το PANDORA. Teleport Pro/ Exec, χρησιμοποιείται από το PANDORA. PANDAS, έχει αναπτυχθεί από την NLA, για διαχείριση αρχείων (συλλογή, μεταδεδομένα και έλεγχοι ποιότητας, διαχείριση πρόσβασης).

15 Preserving the Fabric of Our Lives15 Περαιτέρω θέματα που θέτει ο συγγραφέας (3/3) Κόστος.  Η τεχνική selective στην LC - Minerva Project στοίχισε 100 φορές περισσότερο σε σχέση με την τεχνική που ακολούθησε το Internet Archive (harvesting).  Selective: προσθήκη κόστους σχετικά με τα πνευματικά δικαιώματα. Μακροπρόθεσμη διατήρηση.  Έμφαση στη συλλογή.  Μετανάστευση και εξομοίωση  Trusted repositories και προϋποθέσεις που πρέπει να πληρούν Αξιόπιστη, μακροπρόθεσμη πρόσβαση σε διαχειριζόμενες ψηφιακές πηγές, προς την αντίστοιχη κοινότητα, τώρα και στο μέλλον.

16 Preserving the Fabric of Our Lives16 Feasibility study: Γιατί υπάρχουν προβλήματα στην διατήρηση; Ο ρυθμός των αλλαγών στο Web. Πολύ μεγάλη ποσότητα νέου υλικού που προστίθεται σε αυτό. Τι πρέπει να θεωρηθεί τελικά ως άξια προς διατήρηση πληροφορία; Η γνώση γύρω από τον ψηφιακό χώρο βρίσκεται σε ανώριμο στάδιο. Ποίος είναι υπεύθυνος για την διατήρηση του Web; Προστασία δεδομένων και τα πνευματικά δικαιώματα.

17 Preserving the Fabric of Our Lives17 Σύνοψη του άρθρου O συγγραφέας υπενθυμίζει:  Τρεις τεχνικές συλλογής ιστοσελίδων από το Web.  Η καταλληλότητα χρήσης της καθεμιάς εξ αυτών έγκειται κυρίως στην κάθε περίπτωση.  Η επικρατούσα τάση είναι αυτή του συνδυασμού χρήσης των τεχνικών.

18 Preserving the Fabric of Our Lives18 Επίλογος Ενότητα του άρθρου  Ψηφιακή διατήρηση (;)  Το άρθρο είναι επικεντρωμένο στην συλλογή  Συλλέγοντας ένα αρχείο η διατήρηση του συνεπάγεται; Σημαντικότητα του άρθρου  Μείζον θέμα – συλλογή του Ιστού  Γενική αλλά πλήρης κατάρτιση  Πηγή πληροφοριών για δισεκατομμύρια ανθρώπους

19 Preserving the Fabric of Our Lives19 Επίλογος Ενδιαφέρον  Ειδικά στην Επιστήμη της Πληροφόρησης Μέλλον των τεκμηρίων είναι η ψηφιακή μορφή Πρόκληση για τον επιστήμονα της πληροφόρησης είναι να βρει ικανοποιητικούς και αποδοτικούς τρόπους συλλογής και διατήρησης ψηφιακού υλικού Τρόπους με τους οποίους γίνεται η συλλογή και τα πιθανά μέσα που χρησιμοποιούνται για την υλοποίηση τους όπως αναφέρονται στο άρθρο Γενική κατάρτιση πάνω στους οργανισμούς που ασχολούνται με τα θέματα – εμπειρία, συμβουλές.

20 Preserving the Fabric of Our Lives20 Επίλογος Κριτική και σχόλια  Αρκετά ικανοποιητική κατάρτιση γύρω από το θέμα της συλλογής ιστοτόπων  Δεν είναι ιδιαίτερα αναλυτικό – δεν εξειδικεύει - αιτία  Παραδείγματα λογισμικού  Θέματα για συζήτηση – προβληματισμός, προετοιμασία  Καθαρή εικόνα – χρήσιμες πληροφορίες

21 Preserving the Fabric of Our Lives21 Βιβλιογραφία (1/4) “UKOLN” (3/4/07). [Πρόσβαση στις 10/4/07] http://www.ukoln.ac.uk/ World Wide Web – Wikipedia, the free encyclopedia (9/4/07). [Πρόσβαση στις 10/4/07] http://en.wikipedia.org/wiki/World_Wide_Web Lyman, P.: Archiving the World Wide Web. In: Building a national strategy for digital preservation. Council on Library and Information Resources and Library of Congress, Washington, D.C. (2002) 38–51. [Πρόσβασης τις 10/4/07] http://www.clir.org/pubs/abstract/pub106abst.html Murray, B., Moore, “A.: Sizing the Internet”. Cyveillance White Paper. Cyveillance, Inc. (10/7/2000). [Πρόσβαση στις 10/4/07] http://www.cyveillance.com/web/downloads/Sizing_the_Internet.pdf Lyman, P., Varian, H.R.: How much information? University of California at Berkeley, School of Information Management and Systems, Berkeley, Calif. (2000). “Executive Summary” (27/10/03). [Πρόσβαση στις 10/4/07] http://www2.sims.berkeley.edu/research/projects/how-much-info- 2003/execsum.htm#summary Surface Web – Wikipedia, the free encyclopedia (14/3/07). [Πρόσβαση στις 10/4/07] http://en.wikipedia.org/wiki/Surface_Web

22 Preserving the Fabric of Our Lives22 Βιβλιογραφία (2/4) Deep Web – Wikipedia, the free encyclopedia (9/4/07). [Πρόσβαση στις 10/4/07] http://en.wikipedia.org/wiki/Deep_web Lawrence, S., Pennock, D.M., Flake, G.W., Krovetz, R., Coetzee, F.M., Glover, E., Nielsen, F.Å, Kruger, A., Giles, C.L.: Persistence of Web references in scientific research.Computer 34 (February 2001) 26–31 [Πρόσβαση στις 12/3/07] http://ieeexplore.ieee.org/iel5/2/19496/00901164.pdf?arnumber=901164 “Internet Archive: Wayback Engine” (10/4/07). [Πρόσβαση στις 10/4/07] http://www.archive.org/web/web.php “Snapshot (Computer Storage – Wikipedia, the free encyclopedia) (13/3/07). [Πρόσβαση στις 10/4/07] http://en.wikipedia.org/wiki/Snapshot_%28computer_storage%29 Directory – Wikipedia, the free encyclopedia (22/3/07). [Πρόσβαση στις 11/4/07] http://en.wikipedia.org/wiki/Directory Web Crawler – Wikipedia, the free encyclopedia (8/4/07). [Πρόσβαση στις 11/4/07] Uploading and downloading – Wikipedia, the free encyclopedia (5/4/07). [Πρόσβαση στις 11/4/07] http://en.wikipedia.org/wiki/Download

23 Preserving the Fabric of Our Lives23 Βιβλιογραφία (3/4) Day, M.: Collecting and preserving the World Wide Web: a feasibility study undertaken for the JISC and Wellcome Trust (February 2003). [Πρόσβασης τις 11/4/07] NWA. [Πρόσβαση στις 11/4/07] Arms, W.Y., Adkins, R., Ammen, C., Hayes, A.: Collecting and preserving the Web: the Minerva prototype. RLG DigiNews, 5 (April 2001). [Πρόσβαση στις 11/4/07 ] http://www.rlg.org/preserv/diginews/diginews5-2.html#feature1 Hallgrímsson, T.: Survey of Web archiving in Europe. E-mail sent to list webarchive@cru.fr (3 February 2003) “Mirror (computing) – Wikipedia, the free encyclopaedia” (21/4/07) [Πρόσβαση στις 25/4/07] http://en.wikipedia.org/wiki/Mirror_%28computing%29 Hirtle, Peter B. “Authenticity in a digital environment.” [Πρόσβασης τις 25/4/07] http://www.clir.org/pubs/reports/pub92/hirtle.html Arvidson, A., Persson, K., Mannerheim, J.: The Royal Swedish Web Archive: a "complete" collection of Web pages. International Preservation News 26 (December 2001) 10–12 [Πρόσβαση στις 6/5/07] http://www.ifla.org/IV/ifla66/papers/154-157e.htm

24 Preserving the Fabric of Our Lives24 Βιβλιογραφία (4/4) “Internet Archive: About IA”, [Πρόσβαση στις 6/5/07] http://www.archive.org/about/about.php “BnF-English-Legal deposit: five questions about Web Archiving at BnF” [Πρόσβαση στις 8/5/07] http://www.bnf.fr/PAGES/version_anglaise/depotleg/dl- internet_quest_eng.htm “AOLA – Austrian On-Line Archive” [Πρόσβαση στις 8/5/07] http://www.ifs.tuwien.ac.at/~aola/ “Pandora Archive - Overview” (9/02/07) [Πρόσβαση στις 6/5/07] http://pandora.nla.gov.au/overview.html#purposearchive Woodyard, Deborah, “Domain Uk”, Britain on the Web, The British Library. [Πρόσβαση στις 6/5/07] http://bibnum.bnf.fr/ecdl/2002/uk/uk.html Collecting and Preserving the Web: The Minerva Prototype in “RLG DigiNews”, vol. 5 no2. 15/4/2001, ISSN 1093-5371. [Πρόσβαση στις 5/5/07] http://www.rlg.org/preserv/diginews/diginews5-2.html#web-site “Plugin – Wikipedia, the free encyclopedia” (9/5/07) [Πρόσβαση στις 9/5/07] http://en.wikipedia.org/wiki/Plugin Abiteboul, S., Cobéna, G., Masanès, J., Sedrati, G.: A first experience in archiving the French Web. In: Agosti, M., Thanos, C. (eds.): Research and advanced technology for digital libraries: 6th European conference, ECDL 2002, Rome, Italy, September 16– 18,2002. Lecture Notes in Computer Science, Vol. 2458. Springer-Verlag, Berlin (2002) 1–15 [Πρόσβαση στις 4/4/07] ftp://ftp.inria.fr/INRIA/Projects/verso/gemo/GemoReport- 229.pdf Brin, S., Page, L.: The anatomy of a large-scale hypertextual Web search engine. Computer Networks and ISDN Systems 30 (1998) 107–117. [Πρόσβαση στις 4/4/07]<http://infolab.stanford.edu/pub/papers/google.pdfhttp://infolab.stanford.edu/pub/papers/google.pdf

25 Ευχαριστώ πολύ για την προσοχή σας!


Κατέβασμα ppt "“Preserving the Fabric of Our Lives: a survey of Web Preservation Initiatives” «Διατηρώντας το νήμα της ζωής μας: Μια έρευνα για πρότυπα διατήρησης του."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google