Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας (ΠΜΣ) Εργασία στο Μάθημα «Ηλεκτρονική Δημοσίευση» Διδάσκοντες: Μ. Γεργατσούλης, Σ. Καπιδάκης Opening.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Advertisements

ΔΙΑΧΕΙΡΙΣΗ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
Επιμορφωτής: Ονομ/νυμο Επιμορφωτή
Πανεπιστήμιο Δυτικής Μακεδονίας Πανεπιστήμιο Δυτικής Μακεδονίας Παιδαγωγικό Τμήμα Νηπιαγωγών Τίτλος Μαθήματος Ενότητα # (bold): Τίτλος Ενότητας (normal)
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΜΑΘΗΜΑ : ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ.
Οδηγός δημιουργίας ιστολογίου στο blogger.com
Διαχείριση Έργου Οργάνωση, σχεδιασμός και προγραμματισμός έργων ανάπτυξης λογισμικού.
Σχεδιαστικά εργαλεία Διαχείριση σελίδων Βιβλιοθήκες αντικειμένων Διαχείριση αντικειμένων Επιφάνεια ψηφιακής μελάνης Πληκτρολόγιο οθόνης ΟΦΕΛΗ Αναγνώριση.
Τι είναι ο υπολογιστής; Τι είναι ο προγραμματισμός
Χαρακτηριστικά συνθετικής κίνησης 1 Ελληνογαλλική Σχολή Καλαμαρί - Τίκβα Χριστίνα.
ΚΕΝΤΡΟ ΠΟΛΙΤΙΣΜΙΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΚΗΣ ΙΤΕ 21,23/2/2005Πληροφοριακή σχεδίαση για πολιτισμική τεκμηρίωση και διαλειτουργικότητα1 Τεκμηρίωση.
Η Θεματική Ταξινόμηση και η Συμβολή της στην Αναζήτηση Ευρωπαϊκών Κοινωνικών Δεδομένων.
Σύστημα ηλεκτρονικής δημοσίευσης DiVA Μάθημα: «Ηλεκτρονική Δημοσίευση» Χαρίκλεια Μπρίντεζη.
Κεφάλαιο 6 Υλοποίηση Γλωσσών Προγραμματισμού
Μια Σύγκριση στα Πλαίσια των Αναγκών του Εκπαιδευτικού.
ΗΥ-566 Διαχείρηση Γνώσης στο Διαδίκτυο1 SWRC Ontology Κτιστάκης Γιώργος Μπούτσικα Κατερίνα Παπαδάκης Μύρων.
Εκτέλεση Αλγορίθμων σε ψευδογλώσσα
OpenOffice Απο τον: Ανδρέα Μπουράκη Msc in Distributed Systems Engineering
Δ.Π.Θ. Συνδέοντας έγγραφα - 1 Συνδέοντας έγγραφα Μια σύνδεση στο Web (link) αποτελείται από δύο μέρη : Aυτό που βλέπουμε στη σελίδα και λέγεται άγκυρα.
Διατηρώντας Ψηφιακά Τεκμήρια Κατερίνα Τζάλη Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Βιβλιοθήκη.
1 Συλλογικοί Κατάλογοι & Διαδίκτυο Μιχάλης Σφακάκης.
Σχεδιασμός ηλεκτρονικών υπηρεσιών μεγάλης κλίμακας και πολυπλοκότητας 24/10/2002.
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
Πολυμέσα – Δίκτυα (μαθ. επιλογής Γ’ Λυκείου)
ΑΠΕΙΚΟΝΙΣΗ ΕΝΝΟΙΩΝ 1. 2 Χρήστης Στόχος Ταμίας διενέργεια πώλησης διενέργεια ενοικίασης εισαγωγή ταμείου εξαγωγή ταμείου * 1 Μοντέλο Πεδίου Προβλήματος.
Δεδομένα, Πληροφορίες και Ηλεκτρονικοί Υπολογιστές
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας: Διοίκηση & Οργάνωση Βιβλιοθηκών.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ –ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ : ΥΠΗΡΕΣΙΕΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΕ ΨΗΦΙΑΚΟ ΠΕΡΙΒΑΛΛΟΝ ΠΡΟΤΥΠΟ MPEG-4 ΕΠΙΒΛΕΠΩΝ.
Ηλεκτρονική Ενότητα 5: DC λειτουργία – Πόλωση του διπολικού τρανζίστορ
Δημιουργία Διαφανειών
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΟΘΗΚΟΝΟΜΙΑΣ Αναζητώντας πρότυπα αλληλεπίδρασης χρηστών για ψηφιακές βιβλιοθήκες Εργασία στο Μάθημα: Ψηφιακές.
Ενιαίο Πλαίσιο Προγράμματος Σπουδών Πληροφορικής.
ΕΛΕΥΘΕΡΟ ΛΟΓΙΣΜΙΚΟ GNU FSF GNU/Linux Knoppel
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
Δημιουργία Παρουσίασης
1 Ενότητα 5.3.1: Ερωτηματολόγια με τη χρήση του Διαδικτύου Διδάσκων: Χρήστος Κατσάνος - Πανεπιστημιακό κέντρο εκπαίδευσης επιμορφωτών.
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
Ανάπτυξη Πρωτοτύπου Λογισμικού
ΧΡΗΜΑΤΟΔΟΤΗΣΗ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΕΠΕΝΔΥΣΕΩΝ ΣΤΗ ΓΕΩΡΓΙΑ
Ενότητα Α.4. Δομημένος Προγραμματισμός
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Π. ΚΑΤΣΑΡΟΣ Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τμ. Πληροφορικής,
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ " Διοίκηση και Οργάνωση Βιβλιοθηκών.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ: «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΜΑΘΗΜΑ: ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΕΡΓΑΣΙΑ: MULTI-DOCUMENT SUMMARIZATIONS.
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Π. ΚΑΤΣΑΡΟΣ Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τμ. Πληροφορικής,
Διδακτική της Πληροφορικής ΗΥ302 Εργασία :Παρουσίαση σχολικού βιβλίου Γ’ Λυκείου Τεχνολογικής Κατεύθυνσης «Ανάπτυξη εφαρμογών σε προγραμματιστικό περιβάλλον»
Οριζόντιο Έργο Υποστήριξης Σχολείων, Εκπαιδευτικών και Μαθητών στο Δρόμο για το ΨΗΦΙΑΚΟ ΣΧΟΛΕΙΟ, νέες υπηρεσίες Πανελλήνιου Σχολικού Δικτύου και Στήριξη.
Διαχείριση Ψηφιακών Πνευματικών Δικαιωμάτων Ηλεκτρονική Δημοσίευση Στέλλα Λάμπουρα Ιούνιος 2004.
ΠΜΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ The Digital Library and Computational Philology: The BAMBI Project Γόντικα Ειρήνη.
Μελέτη για την Επίδραση των Προγραμμάτων Ψηφιοποίησης στη Διαχείριση και στη Σταθερότητα των Συλλογών με Ιστορικές Φωτογραφίες. Φοιτήτρια: Παγώνη Αποστολία.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΜΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ» ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΔΙΔΑΣΚΟΝΤΕΣ: ΚΑΠΙΔΑΚΗΣ ΣΑΡΑΝΤΟΣ ΓΕΡΓΑΤΣΟΥΛΗΣ ΕΜΜΑΝΟΥΗΛ Το DSpace ως ένα Ανοικτό.
Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Μεταπτυχιακό Πρόγραμμα στην Επιστήμη της Πληροφορίας Ψηφιακές Βιβλιοθήκες Διδάσκων: Σαράντος.
Τεχνολογία ΛογισμικούSlide 1 Τεχνολογία Απαιτήσεων u Καθορίζει τι θέλει ο πελάτης από ένα σύστημα λογισμικού.
ΕΙΣΑΓΩΓΉ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΉ ΝΊΚΟΣ ΠΑΠΑΔΆΚΗΣ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΗΛΕΚΤΡΟΝΙΚΟΥ ΥΠΟΛΟΓΙΣΤΗ.
ΚΑΤΑΝΟΩ ΤΙΣ ΜΕΤΑΒΛΗΤΕΣ ΜΕ ΤΗ ΒΟΗΘΕΙΑ ΤΟΥ SCRATCH Χρήστος Μανώλης, Πληροφορικός ΠΕ 19 ΘΕΣΣΑΛΟΝΙΚΗ / ΑΥΓΟΥΣΤΟΣ 2015 Ομάδα ανάπτυξης 6 ο εσπερινό ΕΠΑΛ Θεσσαλονίκης.
ΗΛΕΚΤΡΙΚΕΣ ΜΕΤΡΗΣΕΙΣ ΣΦΑΛΜΑΤΑ ΜΕΤΡΗΣΗΣ.
ΜΑΘΗΜΑ: ΣΥΓΧΡΟΝΟ ΛΟΓΙΣΜΙΚΟ ΟΡΓΑΝΩΣΗ ΓΡΑΦΕΙΟΥ 5 ο ΕΡΓΑΣΤΗΡΙΟ: ΕΓΚΑΤΑΣΤΑΣΗ ΕΚΤΥΠΩΤΩΝ ΚΑΘΗΓΗΤΗΣ: ΓΡΗΓΟΡΙΟΣ Ν. ΚΑΡΑΤΑΣΙΟΣ.
ΔΙΑΛΕΞΗ 11η Ποσοτική έρευνα υγείας
Δραματική Τέχνη στην εκπαίδευση: Ερευνητικό Σχέδιο ΙΙ
Αρχές Πληροφορικής Ενότητα # 13: Επεξεργασία κειμένου – LibreOffice #3
Κατηγορίες και Προδιαγραφές Λογισμικού Η/Υ (Software)
Ανάπτυξη Εκπαιδευτικού Λογισμικού
Αρχές Πληροφορικής Ενότητα # 11: Επεξεργασία κειμένου - LibreOffice
ΣΥΣΤΗΜΑ ΠΟΙΟΤΗΤΑΣ ΛΟΓΙΣΜΙΚΟΥ (QUALITY SYSTEM)
Κατηγορίες και είδη Λογισμικού Αυτοματισμού Γραφείου
ΕΛΕΥΘΕΡΟ ΛΟΓΙΣΜΙΚΟ GNU FSF GNU/Linux Knoppel
Αρχές Πληροφορικής Ενότητα # 10: Ιστολόγια. Η υπηρεσία Blogger
Αρχές Πληροφορικής Ενότητα # 3: Το εσωτερικό του υπολογιστή
Msc in Distributed Systems Engineering
Εφαρμογή Μεθοδολογίας ICONIX
Οδηγός δημιουργίας ιστολογίου στο blogger.com
Μεταγράφημα παρουσίασης:

Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας (ΠΜΣ) Εργασία στο Μάθημα «Ηλεκτρονική Δημοσίευση» Διδάσκοντες: Μ. Γεργατσούλης, Σ. Καπιδάκης Opening Schrödingers Library: Semi-automatic QA Reduces Uncertainty in Object Transformation Φοιτήτρια: Αθηνά Παντή-Παντούδη Κέρκυρα, 4/6/2008

2 Περιεχόμενα Βασικοί ορισμοί OpenOffice.org Σχετική έρευνα Κριτήρια (aspects) PLANETS Project Ημι-αυτοματοποιημένο Σύστημα Διασφάλισης της Ποιότητας Διαβάζοντας αρχεία κειμένου στο Open Office: Ένα παράδειγμα (5 μετρήσεις) Συμπεράσματα & προβληματισμοί

3 Βασικοί ορισμοί Μορφότυπο διατήρησης (preservation format): Κατάλληλο για την αποθήκευση ενός εγγράφου σε ηλεκτρονικό αρχείο για μεγάλο χρονικό διάστημα Μετανάστευση (migration): Διαδικασία μεταφοράς των δεδομένων από μια πλατφόρμα που κινδυνεύει να ξεπεραστεί σε μια σύγχρονη  Στόχος: Αλλαγή του αντικειμένου κατά τέτοιο τρόπο, ώστε οι εξελίξεις λογισμικού & υλικού να μην έχουν επιπτώσεις στη διαθεσιμότητα του Διασφάλιση ποιότητας (quality assurance): Τμήμα «κριτικό/περιέχει κριτικά σχόλια» της μετανάστευσης των Ψ.Α. από ένα μορφότυπο αρχείου σε ένα άλλο ή σε νεώτερη/μεταγενέστερη έκδοση με το ίδιο μορφότυπο

4 OpenOffice.org Ανοιχτού/πηγαίου κώδικα λογισμικό για εφαρμογές γραφείου (office) Λειτουργεί σε όλες τις πλατφόρμες (MS Windows/Solaris/Linux/Mac OS)  Σκοπός: Να αποτελέσει μια συμβατή & ελεύθερη εναλλακτική του ‘Microsoft Office’. Υποστηρίζει την επικοινωνία, την τεκμηρίωση (documentation) & τη μεταφορά αρχείου (file transfer) Αποτελείται από 4 κύρια μέρη: 1. Επεξεργαστής κειμένου (Writer) 2. Υπολογιστικό φύλλο (Calc) 3. Πρόγραμμα σχεδίασης (Draw) 4. Πρόγραμμα Παρουσιάσεων (Impress) Υποστηρίζει το πρότυπο ‘OpenDocument’ & ο πηγαίος κώδικας της εφαρμογής διατίθενται με την άδεια GNU Lesser General Public License (LGPL)

5 Σχετική έρευνα/Rothenberg Υποστηρικτής της εξομοίωσης Βασικά χαρακτηριστικά: Ανάπτυξη τεχνικών που θα υποβοηθήσουν τους εξομοιωτές να τρέξουν τους υπολογιστές του μέλλοντος & να συλλάβουν τις ιδιότητες (απαραίτητες για την αναδημιουργία συμπεριφοράς των ψηφιακών τεκμηρίων) Ανάπτυξη τεχνικών για τη διάσωση των μεταδεδομένων, με σκοπό την πρόσβαση & αναδημιουργία των ψηφιακών τεκμηρίων Ανάπτυξη τεχνικών ενθυλάκωσης (encapsulation) των τεκμηρίων + μεταδεδομένων + λογισμικού + εξομοιωτών τους, με σκοπό τη διασφάλιση ποιότητας & την αποφυγή καταστροφής τους

6 Σχετική έρευνα/Rauber & Rauch Utility Analysis (Ανάλυση Χρησιμότητας) Αποφασίζει ποια είναι η καλύτερη στρατηγική διατήρησης. Ποσοτική μέθοδος για την ανάλυση των μορφών αρχείων + στόχους διατήρησης 1 η προσέγγιση: γενικά πλαίσια εργασίας (generic frameworks). Περιγράφουν μορφότυπα & περιεχόμενα αρχείων (file contents) - Σύστημα XCEL/XCDL 2 η προσέγγιση: επίμονα αντικείμενα (persistent objects) Εξέλιξη συστήματος αποθήκευσης (storage system evolution). Περιλαμβάνει την ικανότητα για μετανάστευση σε νέα μέσα (media) & σε νέα αποθετήρια Εξέλιξη πληροφοριακού αποθετηρίου (information repository evolution). Περιλαμβάνει την ικανότητα να χρησιμοποιούνται νέοι πληροφοριακοί κατάλογοι για τη διαχείριση των περιγραφικών μεταδεδομένων & την ικανότητα να προστίθενται νέα χαρακτηριστικά & ιδιότητες Εξέλιξη περιβάλλοντος παρουσίασης (presentation environment evolution). Περιλαμβάνει την ικανότητα να εφαρμόζονται νέα εργαλεία εμφάνισης για τις σχέσεις που παρουσιάζονται μέσα από την ψηφιακή οντότητα

7 Factor analysis (ανάλυση σταθερών όρων/παραγόντων) Χρησιμοποιούνται πολλαπλοί μετρήσιμοι παράγοντες, για να διερευνηθεί το τι μπορεί να υπάρχει ως μοναδική μη μετρήσιμη αιτία που αφορά την ποιότητα από την μετανάστευση Στατιστική μέθοδος που χρησιμοποιείται για να εξηγήσει τη μεταβλητότητα μεταξύ τυχαίων μεταβλητών (random variables) Οι μεταβλητές που αξιολογούνται, έχουν μοντελοποιηθεί ως γραμμικοί συνδυασμοί (linear combinations) των σταθερών όρων, μαζί με τους όρους «σφάλματα» Οι αιτίες είναι λάθη από τη διαδικασία μετανάστευσης που, είτε οφείλονται από προβλήματα που προέρχονται από το σύστημα μετανάστευσης ή εξαιτίας των σφαλμάτων που υπάρχουν στα πρωτότυπα τεκμήρια

8 Κριτήρια (aspects) «αφηρημένη (abstraction) έννοια της πληροφορίας, αποθηκευμένη στα ψηφιακά αντικείμενα»  Στόχος: Tα διατηρημένα έγγραφα συνεχίζουν να διατηρούν την πρωτότυπη (original) συμπεριφορά, την εμφάνιση, το περιεχόμενο, τη δομή και το περιβάλλον τους Υπονοούμενα “έμμεσα” κριτήρια (implicit aspects): Απαιτούν κάποια επεξεργασία των δεδομένων στα αντικείμενα που έχουν βρεθεί (πχ. η καταμέτρηση λέξεων (word counts) σε αρχεία κειμένου, τα ιστογράμματα (histograms) από έγχρωμες εικόνες)  Χρήσιμα για τον έλεγχο ποιότητας + περισσότερες συγκρίσεις Κατηγορηματικά “άμεσα” κριτήρια (explicit aspects): Πρέπει να αναφέρονται & στην πηγή αλλά & στα αρχεία που έχουν μετασχηματισθεί (πχ. ένας ξεχωριστός κατάλογος από διαχωριστικές σελίδες, ή ένας πίνακας χρωμάτων σε ένα ευρετηριασμένο εργαλείο)

9 PLANETS Project Διατήρηση & Μακροπρόθεσμη Πρόσβαση μέσα από Δικτυακές Υπηρεσίες (Preservation and Long-term Access through NETworked Services) 4ετές έργο, χρηματοδοτούμενο από την Ε.Ε.  Σκοπός: Αντιμετώπιση των βασικών προκλήσεων που σχετίζονται με την ψηφιακή διατήρηση & προσφέρει: 1. Υπηρεσίες για τον προγραμματισμό διατήρησης (preservation planning) 2. Μεθοδολογίες, εργαλεία & υπηρεσίες για τον χαρακτηρισμό (characterization) των ψηφιακών αντικειμένων 3. Καινοτόμες λύσεις για εργαλεία που αφορούν τις ενέργειες διατήρησης, τα οποία θα μετασχηματίσουν & θα εξομοιώσουν παλιότερες ψηφιακές πηγές 4. Ένα πλαίσιο διαλειτουργικότητας (interoperability framework), το οποίο θα ολοκληρώνει & θα ενώνει τις υπηρεσίες σε μία κατανεμημένη υπηρεσία δικτύου 5. Testbed: Πλατφόρμα για την δοκιμή μεγάλων έργων ανάπτυξης 6. Ένα σύντομο πρόγραμμα διάχυσης και αφομοίωσης (dissemination and takeup) για την αποτελεσματική & λειτουργική εκπαίδευση του χρήστη

10

11 Ημι-αυτοματοποιημένο Σύστημα Διασφάλισης της Ποιότητας (Semi-automatic QA) Αναζήτηση εργαλείων: Έλεγχος συμφωνίας (checking conformity). Μέθοδος στο προκαθορισμένο πρότυπο της αντιπροσωπευτικής μονάδας (module), μέσα από πρωτόκολλα επικοινωνίας Εξαγωγή πληροφορίας για εμφάνιση ή αποφυγή λαθών (debugging) Αυτόματη καταλογογράφηση (automatic cataloguing), κλπ. Τα εργαλεία είναι χρήσιμα για την εξαγωγή ή σύγκριση των κριτηρίων μεταξύ τους τα εργαλεία που μπορούν να διαβάσουν ένα μορφότυπο & να γράψουν ένα διαφορετικό, επιτρέπουν διαφορετικά είδη συγκρίσεων τα μηνύματα λαθών αποδίδουν προβλήματα κωδικοποίησης ή σημασιολογικά λάθη (semantic errors) Unix grep: Εντολή αναζήτησης, η οποία βασίζεται σε μια ποικιλία από ‘Unix’ λειτουργικά συστήματα. Βοηθάει στην αναζήτηση αρχείων, μέσω οποιασδήποτε ποσότητας του κειμένου

12 Ημι-αυτοματοποιημένο Σύστημα Διασφάλισης της Ποιότητας Δημιουργία εργαλείων: Να χρησιμοποιηθεί ένα αφηρημένο πλαίσιο εργασίας για την περιγραφή διαφόρων μορφών αρχείου (πχ. XCEL/XCDL) ή επίμονα αντικείμενα. Επιτρέπουν ένα ανεξάρτητο σύστημα περιγραφής από τη διάταξη (layout) του αρχείου & έναν τρόπο για να εξάγεται αυτόματα η πληροφορία Δημιουργώντας μια πλήρη αναγνώσιμη μηχανή περιγραφής από σύνθετα μορφότυπα (πχ. PDF) θα πρέπει να είναι εφικτό να εξάγονται τα μεταδεδομένα ή μια λίστα από εμφωλευμένους υπερσυνδέσμους (embedded hyperlinks) Αν ο πηγαίος κώδικας είναι διαθέσιμος για ένα πρόγραμμα που μπορεί να διαβάσει το μορφότυπο, δημιουργείται ένα εργαλείο, το οποίο οδηγεί ένα σταθερό κριτήριο σε μια μορφή που υπάγεται στη σύγκριση Η ποικιλία στον έλεγχο των λαθών οδηγεί σε υψηλότερη ποιότητα

13 Ημι-αυτοματοποιημένο Σύστημα Διασφάλισης της Ποιότητας Συγκρίνοντας τις μετρήσεις  Κάθε σύγκριση χρειάζεται να αποφέρει έναν μοναδικό αριθμό ποιότητας στη δεδομένη κλίμακα  Το μέτρο σύγκρισης θα ενωθεί με τις μετρήσεις για να σημειωθούν με ακρίβεια οι «κακές» μεταναστεύσεις  Αν τα διαφορετικά μέτρα σύγκρισης γίνουν η αιτία να δώσουν υψηλούς βαθμούς σε μια «κακή» μετανάστευση ή αντίστροφα, αυτό δεν αποτελεί κίνδυνο, επειδή συνδυάζοντάς το με τις μετρήσεις, θα υπολογισθεί τελικά το τυχαίο λάθος  Μόλις οι μετρήσεις αναλάβουν το συγκεκριμένο αντικείμενο, θα μπορέσουν να κανονικοποιηθούν (normalized) σε μια ομοιόμορφη κλίμακα

14 Ημι-αυτοματοποιημένο Σύστημα Διασφάλισης της Ποιότητας Συγκρίνοντας τις μετρήσεις  Να υπολογισθεί ο μέσος όρος των λαθών από το σημείο του μέσου (midpoint) της κλίμακας και να χρησιμοποιηθεί η τυπική απόκλιση (standard deviation) για τον προσδιορισμό των τελικών σημείων (endpoints)  Αν η ποιότητα για τη μέτρηση m του αντικειμένου o είναι Qm (o) + ΜΟ + τυπικές αποκλίσεις μέτρου σύγκρισης για όλα τα αντικείμενα είναι Em & σm  η κανονικοποιημένη ποιότητα του αντικειμένου για το συγκεκριμένο μέτρο είναι: Qm (o) – max (O, Em – σm) 2σm εύρος τιμών από [0,1] Η κανονικοποιημένη ποιότητα από τη διαδικασία μετανάστευσης είναι ο ΜΟ των κανονικοποιημένων ποιοτήτων του αντικειμένου για όλες τις μετρήσεις

15 Ημι-αυτοματοποιημένο Σύστημα Διασφάλισης της Ποιότητας Συγκρίνοντας τις μετρήσεις  Tα αντικείμενα με την υψηλότερη αλλά & χαμηλότερη κανονικοποιημένη ποιότητα, θα αποδώσουν μια ένδειξη του εύρους (range) ποιότητας από τη διαδικασία μετανάστευσης  Καταγράφοντας τους υπολογισμούς + ΜΟ, θα ξέρουμε τη συνολική κατανομή ποιότητας  Όταν η μετανάστευση έχει εκτελεστεί σε έναν μεγάλο αριθμό αντικειμένων, οι απόμακρες τιμές στη μέτρηση (outliers) θα πρέπει να έχουν ελεγχθεί χειρωνακτικά, για να φανεί αν είναι ακόμη μέσα στα όρια της αποδεκτής ποιότητας  Τα αντικείμενα που δεν έχουν κανονικοποιημένες μετρήσεις πρέπει να εξετασθούν, έτσι ώστε να διαπιστωθεί η αιτία που προκάλεσε αυτές τις αποκλίσεις/παρεκκλίσεις (aberrations)

16 Διαβάζοντας αρχεία κειμένου στο Open Office: Ένα παράδειγμα Έρευνα από 46 αρχεία του Word (Danish archive site) για το πόσο καλά το OpenOffice 2.0 μπόρεσε να τα κατανοήσει Εξαγωγή εγγράφων σε PDF, χρησιμοποιώντας το πρόγραμμα Adobe Acrobat του Word & τον απλό εξαγωγέα PDF του OpenOffice Τα χαρακτηριστικά που προέκυψαν από τα αρχεία PDF συγκρίθηκαν μεταξύ τους Εγκατάσταση (Setup) Φορτώθηκαν 50 αρχεία του ‘Microsoft Office’ από το δημόσιο αρχείο της Δανίας (Danish public archive) 2 μετατράπηκαν σε αρχεία ‘Excel’, αντί αρχεία ‘Word’, 1 μετακινήθηκε, από τη στιγμή που το ‘OpenOffice’ δεν κατάφερε να το μετατρέψει & 2 αρχεία μετακινήθηκαν αργότερα, όταν ένα από τα εργαλεία απέτυχε κατά την επεξεργασία του. Παρέμειναν τα υπόλοιπα 45 Μετατράπηκαν μέσω του προγράμματος ‘Adobe Acrobat 7.0 Professional (Danish version) σε μια ομάδα από PDFs (οι μετατροπές της Acrobat) & φορτώθηκε ένα κάθε φορά στο ‘OpenOffice Η εργασία εκτελέσθηκε σε ‘Windows XP’

17 1 ο μέτρο σύγκρισης: Αριθμός σελίδων Αριθμός σελίδων στα ‘PDFs’. Το εργαλείο ‘pdftodsc’ χρησιμοποιήθηκε για να προχωρήσει στην εξαγωγή & από τα δύο σύνολα των ‘PDFs’ Μόνο τα 25 αρχεία είχαν ακριβώς τον ίδιο αριθμό σελίδων Τα υπόλοιπα είχαν διαφορές, κυρίως μικρότερη του 5% με ορισμένα να φτάνουν το 10%

18 2 ο μέτρο σύγκρισης: Ομοιότητα μεταξύ των Μεταδεδομένων Μεταδεδομένα που υπάρχουν σε αρχεία ‘PDF’ Χρησιμοποιώντας το εργαλείο ‘pdfinfo’, διάφορα πεδία θα μπορούσαν να εξαχθούν (πχ. τίτλος, συγγραφέας, μέγεθος σελίδας) Μετρήθηκαν πόσα ήταν όμοια Βρέθηκαν 12 διαφορές & μονάχα για ένα αρχείο έκανε δύο από τα τρία πεδία να διαφέρουν Οι περισσότερες διαφορές σημειώθηκαν από τα κωδικοποιημένα λάθη ή πεδία, τα οποία είχαν αποκοπεί

19 3 ο μέτρο σύγκρισης: Αντικαταστάσεις Γραμματοσειράς Το 58% από τις γραμματοσειρές ήταν όμοιες στα πρωτότυπα & ‘PDFs’ που έχουν μετατραπεί Μόνο 6 αρχεία έχουν ακριβώς το ίδιο σύνολο γραμματοσειρών

20 4 ο μέτρο σύγκρισης: Ομοιότητα στο Κείμενο Το εργαλείο ‘pdftotext’ υποστηρίζει το σύνολο χαρακτήρων Unicode UTF-8 Ταξινομούνται οι λέξεις, τρέχουν την εντολή‘diff’, για να φανεί ο αριθμός των λέξεων που έχουν προστεθεί ή μετακινηθεί, με αποτέλεσμα το 5,5% των λέξεων να έχουν αλλάξει Οι περισσότερες αλλαγές γίνονται εξαιτίας των διαφορών στο διαχωρισμό λέξεων με παύλα/συλλαβισμό (hyphenation) ή τη διαφορετική διάταξη τίτλων, πίνακα περιεχομένων ή ευρετηρίου

21 5 ο μέτρο σύγκρισης: Ομοιότητα στη Διάταξη Οι σελίδες συγκρίνονται, χρησιμοποιώντας την εντολή ‘compare’ του ‘Mean Average Error metric’ Δύο αρχεία από το σύνολο του ‘OpenOffice’ δεν μετατράπηκαν, αλλά προκάλεσαν το «θάνατο» του προγράμματος ‘convert’ με ανεπανόρθωτο σφάλμα Από τα υπόλοιπα, κανένα δεν είναι ακριβώς το ίδιο & σε ορισμένα παρουσιάζονται σημαντικές διαφορές Κύριος λόγος για αλλαγές της διάταξης: Οι γραμμές & οι παράγραφοι σπάνε με διαφορετικούς τρόπους Αν αυτό συμβαίνει κοντά στο τέλος της ενότητας, περισσότερες σελίδες είναι πιθανόν να προστεθούν ή να μετακινηθούν

22 Συνδυασμός των μέτρων σύγκρισης Οι μετρήσεις ποιότητας βασίζονται στην τυπική απόκλιση Η μεγαλύτερη συσχέτιση μεταξύ των μετρήσεων είναι ανάμεσα στη μέτρηση της διάταξης + καταμέτρησης της σελίδας

23 Αποτέλεσμα Η χειρωνακτική έρευνα που έγινε, δεν απέφερε το τέλειο αποτέλεσμα για τον υπολογισμό της ποιότητας Όμως, τα 5 υψηλότερης ποιότητας έγγραφα αποδείχθηκαν να δέχονται μετατροπές υψηλής ποιότητας, έχοντας μόνο δύο κύριες αλλαγές θέσης/μεταβολές στη διαχωριστική σελίδα (shift in page breaks), υποσημειώσεις (footnotes), πίνακα περιεχομένων, κλπ. Ανάμεσα στις 5 μετατροπές με τη χαμηλότερη ποιότητα, είχαν όλα τα έγγραφα σημαντικές μεταβολές στη διάταξη & το καθένα από αυτά εμφάνιζε ένα ή περισσότερα σφάλματα (πχ. γραφικά που τοποθετούνται πάνω στο κείμενο, συγχωνεύσεις στον πίνακα περιεχομένων, εικόνες που λείπουν, εμφανίζοντας στοιχεία ή μεγαλύτερες προσθήκες στον πίνακα περιεχομένων)

24 Αποτέλεσμα Οι διαφορές στο διαχωρισμό της λέξης & σελίδας είχαν τη μεγαλύτερη βαρύτητα σε ολόκληρη τη μέτρηση ποιότητας Η παρουσία της συσχέτισης πάνω από 0.5 υποδηλώνει ότι δύο από τα μέτρα σύγκρισης μετρούν το ίδιο λάθος σε κάποιο βαθμό Παραπάνω εργαλεία εξάγουν διαγράμματα, πίνακα περιεχομένων και άλλα χαρακτηριστικά, που θα μπορούσαν να έχουν σημειώσει με απόλυτη ακρίβεια τα σφάλματα (πχ. εξαγωγή του κειμένου με τέτοιο τρόπο που θα παρέβλεπε τον συλλαβισμό)  Μπορούμε να χρησιμοποιήσουμε πληθώρα εργαλείων για να εκτελεστούν οι διάφορες μετρήσεις, χωρίς να υπάρχει έντονη ανησυχία για το αν & κατά πόσον τα συγκεκριμένα εργαλεία υλοποιούν την τέλεια μετανάστευση

25 Συμπεράσματα & προβληματισμοί  Η διαδικασία διασφάλισης της ποιότητας δεν θεωρείται εύκολη, ειδικά όταν επιχειρείται χειρωνακτική έρευνα στα ψηφιακά αντικείμενα, τα οποία έχουν μετασχηματισθεί Η μέθοδος της ημι-αυτοματοποιημένης διασφάλισης της ποιότητας :  Μειώνει την αβεβαιότητα στη μετανάστευση των αντικειμένων  Δεν βγάζει συμπεράσματα για το μορφότυπο των ψηφιακών αντικειμένων, παρά μόνο για το περιεχόμενο της πληροφορίας  Αρκετά έμπιστη, όσον αφορά την ποιότητα των μεταναστεύσεων των ψηφιακών αντικειμένων, επιτρέποντας τον χρήσιμο και έγκαιρο εντοπισμό λαθών (early pin-pointing of errors)  Τα αποτελέσματα συνδυάζονται, έτσι ώστε να δώσουν μια συνολική αποτίμηση της ποιότητας  Επικεντρώνεται στην αρχή των κριτηρίων, στα οποία τα ψηφιακά αντικείμενα δεν διακρίνονται ως συγκεκριμένα μορφότυπα αρχείών, αλλά μέσα από το πρίσμα μικρότερων τμημάτων

26 Συμπεράσματα & προβληματισμοί  Γίνεται έρευνα μόνο σε μικρό αριθμό αντικειμένων, προσφέροντας αρκετές ενδείξεις λαθών για τη διαδικασία μετανάστευσης, στοχεύοντας στη διόρθωσή τους  Απαιτείται περισσότερη έρευνα στο ημι-αυτοματοποιημένο σύστημα διασφάλισης της ποιότητας  Ανάγκη να βρεθούν νέοι τρόποι που θα αναγνωρίζουν τα κριτήρια & θα αναλύουν αν (ή όχι) οι μετρήσεις καλύπτουν τα επιθυμητά κριτήρια, με επαρκή επικάλυψη και με ανεξάρτητο τρόπο  Μέθοδοι (πχ. ανάλυση παραγόντων), μπορούν να εφαρμοστούν σε τέτοιου είδους προβλήματα  Εφαρμογή ελαχιστοποίησης των αρχών, έτσι ώστε να καθοριστεί ότι έχουν χαρακτηριστεί όλες οι μετρήσιμες (quantifiable) πληροφορίες. Αν αυτό είναι εφικτό, τότε τα κριτήρια καλύπτουν τα πάντα

27 Συμπεράσματα & προβληματισμοί Κάθε μέτρηση που γίνεται καταρρίπτει μία ή περισσότερες διαστάσεις της αβεβαιότητας, προειδοποιώντας για τυχόν αποτυχίες από τη διαδικασία μετανάστευσης, επιτρέποντας να πραγματοποιηθεί η επόμενη προσπάθεια Συνδυάζοντας την ποιότητα των μετρήσεων από τον αριθμό μικρότερων εργαλείων & χωρίς να επιχειρείται μεγάλος & σύνθετος έλεγχος, υπολογίζονται οι αδυναμίες του κάθε εργαλείου ξεχωριστά  Επιτυγχάνεται μεγαλύτερη ακρίβεια και αξιοπιστία από την ποιότητα της μετανάστευσης

28 ΤΕΛΟΣ!