Εργασία στο μάθημα «Ψηφιακές Βιβλιοθήκες» με θέμα: της Γιώτας Παυλίδου ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Μεταπτυχιακό Πρόγραμμα.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Δίκτυα υπολογιστών.
Advertisements

Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
7.3.8 Μεταφραστές Ελληνογαλλική Σχολή Καλαμαρί - Τίκβα Χριστίνα.
Ηλεκτρονική Δημοσίευση
Πανελλήνιο Ψηφιακό Αποθετήριο Μαθησιακών Αντικειμένων
Αλέξανδρος Σαχινίδης, ΜΒΑ, Ph.D. ΙΟΥΝΙΟΣ 2009
Next Generation Networking
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΜΑΘΗΜΑ : ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ.
Διαχείριση Έργου Οργάνωση, σχεδιασμός και προγραμματισμός έργων ανάπτυξης λογισμικού.
ΠΜΣ ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Κατεύθυνση ΤΕΔΑ Τεχνολογίες Διαχείρισης Ασφάλειας Security Management Engineering Τμήμα Πληροφορικής ΠΑΝΕΠΙΣΤΗΜΙΟ.
Κεφάλαιο 1ο: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΤΩΝ ΛΕΙΤΟΥΡΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
Λογισμικο συστηματοσ Κεφάλαιο 4ο
ΤΟΜΕΑΣ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΚΑΙ ΕΦΑΡΜΟΓΩΝ
 Αυδίκου Χριστίνα  Γιουμούκης Παναγιώτης  Κιντσάκης Θάνος  Πάπιστας Γιάννης.
ΘΕΜΑ : A Comparison of On- line Computer Science Citation Databases ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ:Υπηρεσίες Πληροφόρησης σε Ψηφιακό Περιβάλλον ΜΑΘΗΜΑ.
Αρχειοθέτηση του Ιστού Nordic Web Archive Toolset Ηλεκτρονική δημοσίευση Διδάσκοντες : Σ. Καπιδάκης, Μ. Γεργατσούλης Μαρίνα Κομπολύτη Εαρινό εξάμηνο 2003/2004.
1 Συλλογικοί Κατάλογοι & Διαδίκτυο Μιχάλης Σφακάκης.
ΠΛΗΡΟΦΟΡΙΑΚΟ ΣΥΣΤΗΜΑ ΓΙΑ ΤΗΝ ΔΙΑΣΦΑΛΙΣΗ ΠΟΙΟΤΗΤΑΣ Γραφείο Ποιότητας Αλεξάνδρειο ΤΕΙ Θεσσαλονίκης.
Η ποιότητα της πληροφορίας στο εκπαιδευτικό υλικό που χρησιμοποιείται ή διανέμεται μέσω του Internet Χρήστος Σαβρανίδης Πανεπιστήμιο Ιωαννίνων Τμήμα ΦΠΨ.
1 Εισαγωγή στις Βάσεις Δεδομένων  Ανάγκη Αποθήκευσης και Διαχείρισης Δεδομένων  Συστήματα Αρχείων  Συστήματα Βάσεων Δεδομένων  Παραδοσιακές και Σύγχρονες.
ΕΠΙΜΕΛΕΙΑ ΕΡΓΑΣΙΑΣ: ΧΡΙΣΤΙΝΑ ΜΠΛΑΝΑ ΔΙΔΑΣΚΩΝ: ΣΑΡΑΝΤΟΣ ΚΑΠΙΔΑΚΗΣ ΕΞΑΜΗΝΟ: ΕΑΡΙΝΟ ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ- ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ.
Καθιστώντας μια υπηρεσία θεματικής πλοήγησης στο διαδίκτυο συμβατή με τις τεχνολογίες των συνδεδεμένων δεδομένων Συγγραφείς: Κωνσταντίνος Κυπριανός, Ιωάννης.
Βασίλης Κόμης Αναπληρωτής Καθηγητής
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ
ΚΕΦΑΛΑΙΟ 3 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΤΩΝ Γ.Σ.Π.. ΟΡΙΣΜΟΙ Ένα σύστημα για τακτικό και συνηθισμένο τρόπο επεξεργασίας δεδομένων και για απάντηση προκαθορισμένων και.
Δημήτρης Γαβρίλης, Κωνσταντία Κακάλη Βιβλιοθήκη & Υπηρεσία Πληροφόρησης, Πάντειο Πανεπιστήμιο.
2. Μορφή και οργάνωση του μαθήματος
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας: Διοίκηση & Οργάνωση Βιβλιοθηκών.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ –ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ : ΥΠΗΡΕΣΙΕΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΕ ΨΗΦΙΑΚΟ ΠΕΡΙΒΑΛΛΟΝ ΠΡΟΤΥΠΟ MPEG-4 ΕΠΙΒΛΕΠΩΝ.
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΘΕΜΑ «ΤΟ ΕΘΝΙΚΟ ΚΕΝΤΡΟ ΤΕΚΜΗΡΙΩΣΗΣ» ΚΑΝΤΑΡΕΛΗ ΑΙΚΑΤΕΡΙΝΗ.
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΟΘΗΚΟΝΟΜΙΑΣ Αναζητώντας πρότυπα αλληλεπίδρασης χρηστών για ψηφιακές βιβλιοθήκες Εργασία στο Μάθημα: Ψηφιακές.
Σχεδίαση, ανάπτυξη, υλοποίηση και αξιολόγηση ενός συστήματος εξ αποστάσεως εκπαίδευσης: Μελέτη περίπτωσης του συστήματος Moodle, για την υποστήριξη της.
Ενιαίο Πλαίσιο Προγράμματος Σπουδών Πληροφορικής.
Ανάκτηση Πληροφορίας (Information Retrieval – IR) Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχ. Η/Υ, Τηλ/νιών & Δικτύων Ακαδημαϊκό Έτος
…………………………………………………………. ΠΛΗΡΟΦΟΡΙΑΚΗ ΠΑΙΔΕΙΑ Το κλειδί για τη δια βίου μάθηση 14 – 16 Ιουνίου 2006 Goethe-Institut Athen Μαθαίνοντας δια βίου Βιβλιοθήκες.
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
Ανάπτυξη Πρωτοτύπου Λογισμικού
Οριζόντιο Έργο Υποστήριξης Σχολείων, Εκπαιδευτικών και Μαθητών στο Δρόμο για το ΨΗΦΙΑΚΟ ΣΧΟΛΕΙΟ, νέες υπηρεσίες Πανελλήνιου Σχολικού Δικτύου και Στήριξη.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ " Διοίκηση και Οργάνωση Βιβλιοθηκών.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΠΣ: «Επιστήμη Της Πληροφορίας: Διοίκηση Και Οργάνωση Βιβλιοθηκών Με Έμφαση Στις Νέες Τεχνολογίες.
Φεβρουάριος 2004OpenDLib Αρχιτεκτονική ενός συστήματος για επεκτάσιμες Ψηφιακές Βιβλιοθήκες Ιόνιο Πανεπιστήμιο, Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας ΠΜΣ.
Μετατροπή Μουσικών Συλλογών σε Ψηφιακές Βιβλιοθήκες Το Πρόγραμμα MUSESCAPE Ιόνιο Πανεπιστήμιο Ιανουάριος 2005 Χριστιανούδης Ιωάννης.
Μελέτη για την Επίδραση των Προγραμμάτων Ψηφιοποίησης στη Διαχείριση και στη Σταθερότητα των Συλλογών με Ιστορικές Φωτογραφίες. Φοιτήτρια: Παγώνη Αποστολία.
Προηγμένη Εφαρμογή Ιστού Διαχείρισης Δεδομένων Βιοεπιστημών Διπλωματική Εργασία του Γεωργίου Πρέκα ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ.
ΣΥΓΚΟΜΙΔΗ ΜΕΤΑΔΕΔΟΜΕΝΩΝ (METADATA HARVESTING) ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ - ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ "Διοίκηση & Οργάνωση Βιβλιοθηκών με έμφαση στις.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ - ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ – ΔΙΟΙΚΗΣΗ.
Διαχείριση Εκπαιδευτικού Περιεχομένου
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΤΕΥΘΥΝΣΗ «Υπηρεσίες Πληροφόρησης σε Ψηφιακό Περιβάλλον» ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ « Ηλεκτρονική Δημοσίευση.
Network Inference Μπαλάφα Κασιανή - Αδριανή Πλασταρά Κατερίνα.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Βρίσκοντας κατάλληλα αντικείμενα μάθησης:
DSpace:ένα ψηφιακό αποθετήριο ανοικτής πρόσβασης Φοιτήτρια : Νικολέττα Μπίζου Μάθημα: Ηλεκτρονική δημοσίευση Διδάσκοντες: Σαράντος Καπιδάκης Μανώλης Γεργατσούλης.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΜΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ» ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΔΙΔΑΣΚΟΝΤΕΣ: ΚΑΠΙΔΑΚΗΣ ΣΑΡΑΝΤΟΣ ΓΕΡΓΑΤΣΟΥΛΗΣ ΕΜΜΑΝΟΥΗΛ Το DSpace ως ένα Ανοικτό.
Μάθημα: «Ψηφιακές Βιβλιοθήκες» Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας Ιόνιο Πανεπιστήμιο Κωνσταντόπουλος Παναγιώτης
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Εργασία στο υποχρεωτικό μάθημα του ΣΤ’εξαμήνου Θέμα: Oxford Digital Library.
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας «Διοίκηση & Οργάνωση Βιβλιοθηκών.
FEDORA ARCHITECTURE1 Αρχιτεκτονικές Ψηφιακών Βιβλιοθηκών FEDORA.
Κριτήρια επιλογής και αξιολόγησης ψηφιακού υλικού Ενότητα «Δημιουργία και διαχείριση ψηφιακών συλλογών»
6/3/2015 OCLC Connexion Εργασία στο μάθημα ψηφιακές βιβλιοθήκες Μαρινοπούλου Μαρία.
Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Μεταπτυχιακό Πρόγραμμα στην Επιστήμη της Πληροφορίας Ψηφιακές Βιβλιοθήκες Διδάσκων: Σαράντος.
ΕΙΣΑΓΩΓΉ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΉ ΝΊΚΟΣ ΠΑΠΑΔΆΚΗΣ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΗΛΕΚΤΡΟΝΙΚΟΥ ΥΠΟΛΟΓΙΣΤΗ.
Πληροφορική Μάθημα Κατεύθυνσης. Σκοπός Μαθήματος Οι μαθητές που θα ακολουθήσουν το μάθημα αυτό θα είναι ικανοί να λύνουν προβλήματα με αλγοριθμικό τρόπο,
Πρόγραμμα Προπτυχιακών Σπουδών Ροή Λ: Λογισμικό
Αρχές Διοίκησης και Διαχείρισης Έργων
Πληροφοριακό σύστημα Πληροφοριακό Σύστημα μιας επιχείρησης/οργανισμού είναι ένα σύστημα που αποτελείται από ανθρώπους, διαδικασίες και εξοπλισμό (Υλικό,
Συγγραφέας: Ζαγκότας Στεφανος Επιβλέπων Καθηγητής: Ούτσιος Ευάγγελος
Εισαγωγή Για σχεδόν τέσσερις δεκαετίες, οι προσωπικοί υπολογιστές αποτελούνταν από ένα desktop system και ένα folder system metaphors για τη διαχείριση.
Πληροφορική Μάθημα Κατεύθυνσης. Σκοπός Μαθήματος Οι μαθητές που θα ακολουθήσουν το μάθημα αυτό θα είναι ικανοί να λύνουν προβλήματα με αλγοριθμικό τρόπο,
Μεταγράφημα παρουσίασης:

εργασία στο μάθημα «Ψηφιακές Βιβλιοθήκες» με θέμα: της Γιώτας Παυλίδου ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας «Διοίκηση και Οργάνωση Βιβλιοθηκών με Έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» Υπεύθυνος καθηγητής: Σ. Καπιδάκης

2 Τι είναι η CiteSeer Η CiteSeer είναι μια ψηφιακή βιβλιοθήκη επιστημονικής λογοτεχνίας και μια μηχανή αναζήτησης που εστιάζει κυρίως στην επιστήμη της πληροφορικής και των υπολογιστών  Έχει στόχο να βελτιώσει:  τη διάχυση (dissemination) και την ανατροφοδότηση (feedback) της επιστημονικής λογοτεχνίας  τη λειτουργικότητα, χρηστικότητα, διαθεσιμότητα, κόστος, περιεκτικότητα, και επικαιρότητα της πρόσβασης στην επιστημονική γνώση  Δημιουργήθηκε από τους K. Bollacker, L. Giles, και S. Lawrence, τη διετία , στο Ερευνητικό Κέντρο NEC (NEC Research Institute) στο Πανεπιστήμιο Πρίνστον, ΗΠΑ  Σήμερα φιλοξενείται στο Penn State’s School of Information and Technology (

3 Από τι αποτελείται η CiteSeer Η CiteSeer αποτελείται από 3 βασικά συστατικά: 1. Έναν εστιασμένο crawler (focused crawler)  σαρώνει τον Ιστό για ντοκουμέντα σε μορφή PDF και PostScript 2. Το αρχείο των ντοκουμέντων (document archive) και ειδικευμένο ευρετήριο (specialized index) 3. Τη διεπαφή ερωτήσεων (query interface)  Η CiteSeer είναι μηχανή αναζήτησης πλήρους κειμένου (full text) με μια διεπαφή που επιτρέπει έρευνα με τεκμήριο ή αριθμό αναφορών (citations) ή έρευνα σε πεδία, κάτι που δεν είναι δυνατό σήμερα με τις γενικού προσανατολισμού μηχανές αναζήτησης

4 Χρήση και διαθεσιμότητα της CiteSeer Η CiteSeer περιλαμβάνει 767,558 ντοκουμέντα, λαμβάνει πάνω από ένα εκατομμύριο αιτήσεις και εξυπηρετεί πάνω από 25 GB πληροφορίας καθημερινά Πρόσφατα έγινε περισσότερο διαθέσιμη στην παγκόσμια κοινότητα με τη δημιουργία καθρεπτών (mirrors) που φιλοξενούνται:  στο MIT  στη Σουηδία  στον Καναδά  στην Αγγλία  στην Ιταλία  στη Σιγκαπούρη

5 Ευρετηρίαση Αναφορών (Citations Indexing) Κοινό χαρακτηριστικό σε εφαρμογές προχωρημένης επιστημονικής αναζήτησης είναι η ευρετηρίαση αναφορών (Citation Indexing) Citations για ένα συγκεκριμένο άρθρο είναι οι αναφορές που γίνονται από άλλες, μεταγενέστερες εργασίες,προς το άρθρο αυτό  Πολλές δημοφιλείς εμπορικές υπηρεσίες αναζήτησης στηρίζονται στη χειρονακτική εξαγωγή της πληροφορίας για να κατασκευάσουν ευρετήρια αναφορών κόστος  Η Αυτόνομη Ευρετηρίαση Αναφορών (Autonomous citation indexing - ACI) είναι η εναλλακτική λύση στη χειρονακτική εξαγωγή της πληροφορίας και αποδείχτηκε επιτυχημένη παρά την μερική απώλεια στην ακρίβεια της πληροφορίας Η CiteSeer είναι το πρώτο παράδειγμα ενός εφαρμοσμένου ACI συστήματος

6 Στόχοι της CiteSeer Plus Η CiteSeer plus βασίζεται σε μια νέα αρχιτεκτονική, σχεδιασμένη να είναι ευέλικτη (flexible), αρθρωτή (modular), και επεκτάσιμη (scalable) Στόχοι της CiteSeer Plus:  Ευελιξία (flexibility)  Το module κάθε υπηρεσίας θα πρέπει να φέρει το δικό του Application Programming Interface (API)  Απόδοση (Performance)  Να διαχειρίζεται, τουλάχιστον, 30 ταυτόχρονα ερωτήματα χωρίς σημαντικές απώλειες στην απόδοση  Να διαχειρίζεται τις ανανεώσεις του περιεχομένου γρήγορα, με επαναληπτική διαδικασία, έτσι ώστε το νέο περιεχόμενο να είναι διαθέσιμο αμέσως μετά την απόκτησή του  Κατανεμημένη λειτουργία (Distributed Operation)  Να είναι εύκολα επεκτάσιμο για να υποστηρίξει προσαυξημένες ανανεώσεις σε μια ανάπτυξη δικτύου εκτεταμένης εμβέλειας (Wide Area Network - WAN)

7 Αρχιτεκτονική της CiteSeer Plus Η αρχιτεκτονική του συστήματος της CiteSeer Plus είναι εξαιρετικά αρθρωτή - είναι οργανωμένη σε 4 λογικά επίπεδα (logical levels):  Επίπεδο Πηγών (Source Level)  Περιλαμβάνει τα αρχεία των ντοκουμέντων και σχετικές πληροφορίες  Κεντρικό Επίπεδο (Core Level)  Περιλαμβάνει το κεντρικό κομμάτι του συστήματος όπου γίνεται η επεξεργασία των ντοκουμέντων και των ερωτήσεων  Επίπεδο Διεπαφής (Interface Level)  προσφέρει λειτουργίες διεπαφής για να επιτρέψει την επικοινωνία μεταξύ του Core Level και των υπηρεσιών που μπορούν να αναπτυχθούν χρησιμοποιώντας τη CiteSeer Plus  Επίπεδο Υπηρεσιών (Service Level)  περιλαμβάνει κάθε υπηρεσία που τρέχει στην κορυφή του συστήματος της CiteSeer Plus

8 Αρχιτεκτονική της CiteSeer Plus

9 Δομή Κόμβου Ευρετηρίασης CiteSeer Plus

10 Ανάπτυξη του Συστήματος CiteSeer Plus

11 Επίπεδο Διεπαφής (Interface Level) Στο Interface Level υπάρχει το Ενδιάμεσο Λογισμικό (Middleware) που είναι το ενεργό κομμάτι του εξωτερικού SOAP API  χρησιμοποιεί διάφορες μεθόδους για να ελέγξει την αυθεντικότητα του χρήστη, και να αποφασίσει αν ένας χρήστης του συστήματος είναι εξουσιοδοτημένος να εκτελέσει τις ζητούμενες λειτουργίες  διαχειρίζεται τα νήματα (threads) του controller  εκτελεί την αναζήτηση (query) και δρομολόγηση του paper, με στόχο να διατηρήσει την σταθερότητα στα κατανεμημένα και πολλαπλασιασμένα σύνολα των Master και Slave nodes Κάθε λειτουργία που αφορά στον καταμερισμό και πολλαπλασιασμό πόρων εκτελείται σε αυτό το module

12 Επίπεδο Υπηρεσιών (Service Level) Το Service Level χρησιμοποιεί το Application Programming Interface (API) για να ορίσει καθορισμένα σενάρια χρήσης για το σύστημα και interfaces για τον έλεγχο των χρηστών,περιλαμβάνει:  HTML φόρμες και παρουσιάσεις για αλληλεπίδραση χρήστη και διαχειριστή  Μερικές πρότυπες υπηρεσίες που περιλαμβάνουν εργαλεία για :  πρόσθεση ή αφαίρεση ντοκουμέντων  διόρθωση ντοκουμέντων μεταδεδομένων  Ανάπτυξη εργαλείων διαμόρφωσης  Ανάπτυξη διεπαφών έρευνας για τους χρήστες (μια εφαρμογή web)ή τα προγράμματα (μέσω SOAP)

13 Γραφική Παράσταση Παραπομπών (Citation Graph) Η Γραφική Παράσταση Παραπομπών ενός ντοκουμέντου είναι χρήσιμη για:  Βιβλιομετρικές αναλύσεις  Σπουδαιότητα του συγγραφέα Για να κατασκευαστεί πρέπει:  Να ταυτιστούν και να αναλυθούν συντακτικά όλες οι παραπομπές που περιλαμβάνονται σε κάθε ντοκουμέντο  Να ταιριάξουν με τα σχετικά αρχεία του ντοκουμέντου  Οι παραπομπές ενός paper μπορεί να έχουν ευρέως ποικίλα μορφότυπα, για αυτό η ανάπτυξη κανόνων για τον προσδιορισμό των πεδίων των παραπομπών μπορεί να είναι πολύ χρονοβόρα διαδικασία και να παρουσιάζει σφάλματα  Η προσέγγιση της CiteSeer βασίζεται κατά πολύ σε of-line υπολογισμούς για να κτίσει τη γραφική παράσταση των παραπομπών του κάθε ντοκουμέντου

14 Γραφική Παράσταση Παραπομπών (Citation Graph) Η διαδικασία κατασκευής της γραφικής παράστασης των παραπομπών στη CiteSeer Plus είναι βασισμένη στα ερωτήματα  Οι παραπομπές λύνονται (solved) χρησιμοποιώντας τα ερωτήματα που εκτελούνται στο module των ερωτημάτων  Ο ευρετηριαστής (indexer) επιτρέπει στα μεταδεδομένα να αποθηκεύονται σε διαφορετικά υποευρετήρια (slices)  Τα στατιστικά του αποθετηρίου φτιάχνονται χρησιμοποιώντας τα slave nodes ενώ οι ερωτήσεις των χρηστών εκτελούνται στο master node  Όταν ένας χρήστης προσπαθεί να ακολουθήσει μια παραπομπή, παράγετε ένα αντίστοιχο ερώτημα στο master node και ο χρήστης θα ανακτήσει ένα ή περισσότερα ντοκουμέντα που φαίνεται ότι ταιριάζουν στην παραπομπή  Αυτό το πλαίσιο μεταφέρει το φόρτο εργασίας σε δυναμικά συστατικά που χειρίζονται τα ερωτήματα των χρηστών  Παράλληλα επιτρέπουν τον online χειρισμό στατιστικών λεπτομερειών και γραφημάτων διαχείρισης μέσα σε ξεχωριστά συστατικά

15 Εξαγωγή Μεταδεδομένων Στην επιστημονική λογοτεχνία, υπάρχουν δύο βασικές μέθοδοι για την εξαγωγή πληροφορίας:  η Τεχνολογία της Γνώσης (Knowledge Engineering)  Χειρονακτική κατασκευή κανόνων εξόρυξης  Οι κανόνες είναι «εύθραυστοι», δεν αποδίδουν καλά όταν αντιμετωπίζουν ποικιλία στα δεδομένα ή νέου περιεχομένου domains  Κοπιαστική διαδικασία ανάπτυξης  Απαιτούμενη εξειδίκευση  η Μηχανική Μάθηση (Machine Learning)  Απαιτείται λιγότερη εξειδίκευση, όσον αφορά στους τύπους των templates, όταν προσαρμόζουμε το σύστημα σε ένα νέο domain  Κάποιος με επαρκή γνώση του domain και της εργασίας αυτής χαρακτηρίζει χειρονακτικά ένα σύνολο κατευθυντήριων ντοκουμέντων  Τα χαρακτηρισμένα δεδομένα χρησιμοποιούνται για να κατευθύνουν έναν αλγόριθμο Μηχανικής Μάθησης  Πιο ευέλικτη μέθοδος από την προσέγγιση της Τεχνολογίας της Γνώσης, αλλά απαιτεί να είναι διαθέσιμος ένας όγκος κατευθυντήριων ντοκουμέντων

16 Εξαγωγή Μεταδεδομένων Υπάρχουν δύο κύρια σύνολα τεχνικών Μηχανικής Μάθησης για την εξόρυξη μεταδεδομένων:  Τα generative models, όπως είναι τα Hidden Markov Models (HMM)  μαθαίνουν ένα προβλέψιμο μοντέλο πάνω σε χαρακτηρισμένες αλληλουχίες εισαγωγών  Οι διακριτοί ταξινομητές (classifiers) όπως είναι οι Support Vector Machines (SVM)  μπορούν να χειριστούν μεγάλα σύνολα μη ανεξάρτητων δεδομένων  πρώτα ταξινομούν κάθε γραμμή κειμένου ανεξάρτητα, για να της δώσουν μια ετικέτα  μετά προσαρμόζουν αυτές τις ετικέτες σύμφωνα με έναν επιπρόσθετο ταξινομητή που εξετάζει μεγαλύτερα παράθυρα ετικετών

17 Εξαγωγή Μεταδεδομένων Το σύστημα εξόρυξης μεταδεδομένων της CiteSeer Plus έχει κτιστεί για να μεγιστοποιήσει την ευελιξία έτσι ώστε να είναι απλό να προσθέσεις καινούργιους κανόνες εξόρυξης ή μοντέλα εξόρυξης στην ροή επεξεργασίας του ντοκουμέντου Μπορούν να χρησιμοποιηθούν διαφορετικοί τύποι modules που έχουν «εκπαιδευτεί» για διαφορετικές ή ίδιες εργασίες εξόρυξης, χρησιμοποιώντας διάφορες τεχνικές, που περιλαμβάνουν, μεταξύ άλλων:  Hidden Markov Models (HMM)  κανονικές εκφράσεις (regular expressions)  Ταξινομητές Support Vector Machines (SVM) Βασίζεται σε μια Αρχιτεκτονική Μαυροπίνακα (Blackboard Architecture), έτσι ώστε τα modules εξόρυξης να μπορούν να σχεδιαστούν σαν ξεχωριστές διαδικασίες ή μέσα σε ομάδες modules με εξαρτήσεις

18 Αρχιτεκτονική Μαυροπίνακα (Blackboard Architecture) Ένα σύστημα μαυροπίνακα αποτελείται από 3 βασικά συστατικά: 1. Knowledge Sources (στο πλαίσιο της CiteSeer Plus ονομάζονται Experts): ανεξάρτητα modules που ειδικεύονται σε κάποια μέρη του προς λύση προβλήματος, μπορεί να διαφέρουν κατά πολύ στις τεχνικές τους για εξαγωγή αποτελεσμάτων και στην παρουσίαση της γνώσης 2. BlackBoard: μια γενική βάση δεδομένων που περιλαμβάνει τα εισαχθέντα δεδομένα, επιμέρους λύσεις και πολλά πληροφοριακά στοιχεία που παράγονται από τους experts για να υποστηρίξουν το προς λύση πρόβλημα 3. Control Component: ένας ελεγκτής ροής, παίρνει αποφάσεις για διαδικασίες επαλήθευσης σχετικά με την πορεία του υπό λύση προβλήματος. Τα συστατικά ελέγχου αποτελούνται από μία ομάδα ειδικών experts που λέγονται scheduling experts, και είναι ικανοί να σχεδιάσουν τις knowledge sources που καταγράφονται στο πλαίσιο

19 Συμπεράσματα  Η CiteSeer Plus παρουσιάζει σημαντικές βελτιώσεις σχεδίασης σε σχέση με την υπάρχουσα CiteSeer  Αναπαράγει κάθε κεντρικό χαρακτηριστικό της προηγούμενης εκδοχής μέσα σε μία αρθρωτή και ευέλικτη αρχιτεκτονική που μπορεί να διαμορφωθεί εύκολα και να επεκταθεί σε domains νέου περιεχομένου  Αυτό το πετυχαίνει με τη χρήση plug-in συστατικών και την εκτεταμένη χρήση της τεχνολογίας Υπηρεσιών Ιστού (Web Services)  Καθώς η συλλογή της CiteSeer μεγαλώνει, και οι χρήστες της αυξάνονται προοδευτικά, η προτεινόμενη αρχιτεκτονική είναι αναγκαία για να βελτιωθεί η ποιότητα των υπηρεσιών της, να μπορεί να προσφέρει εύκολα καινούργιες υπηρεσίες, και να εξασφαλιστεί ότι θα συνεχίσει να είναι μια πολύτιμη και ενημερωμένη πηγή που προσαρμόζεται στις τεχνολογικές και επιστημονικές εξελίξεις

20 Ευχαριστώ!