ΘΕΜΑ : A Comparison of On- line Computer Science Citation Databases ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ:Υπηρεσίες Πληροφόρησης σε Ψηφιακό Περιβάλλον ΜΑΘΗΜΑ.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
«Πρόγραμμα Αναμόρφωσης Προπτυχιακών Προγραμμάτων Σπουδών Γ.Π.Α.» Σεμινάριο Επιμόρφωσης Διδακτικού Προσωπικού Οι τεχνολογίες της Πληροφορικής και των Επικοινωνιών.
Advertisements

Τεχνολογίες Internet Υπηρεσίες & Εφαρμογές Τμήμα 1I-ΙΝΠ01 – Web Design / Development Κωνσταντίνος Σαπουντζής.
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΜΑΘΗΜΑ : ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ.
EPublishing 6/ Βικτωρία Τσουκαλά, PhD Ιούνιος 2013 Η Πράξη “Εθνικό Πληροφοριακό Σύστημα Έρευνας και Τεχνολογίας/Κοινωνικά Δίκτυα – Περιεχόμενο Παραγόμενο.
1 Μηχανές αναζήτησης στον Παγκόσμιο Ιστό Search Engines.
Ειδικά & Υβριδικά Εργαλεία Αναζήτησης. Εισαγωγή  Υπάρχει μια πλειάδα από ειδικά και υβριδικά εργαλεία αναζήτησης που αξίζουν ιδιαίτερης αναφοράς.  Αυτά.
Δευτέρα 25/9/2006 ΤΕΙ Λάρισας Παρουσίαση Web-site – Θεματικής Πύλης (Elektra.teilar.gr) και Λογισμικού Ασύγχρονης και Σύγχρονης Τηλε-εκπαίδευσης (E-Presence.
Εργασία στο μάθημα «Ψηφιακές Βιβλιοθήκες» με θέμα: της Γιώτας Παυλίδου ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Μεταπτυχιακό Πρόγραμμα.
ΠΡΟΤΥΠΑ ΜΑΘΗΣΙΑΚΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΠΑΡΟΥΣΙΑΣΗ ΚΑΙ ΔΙΔΑΚΤΙΚΑ ΟΦΕΛΗ Ενότητα 3.7 – Β’ Μέρος.
“A Comparison of On-Line Science Citation Databases” Vaclav Petricek, Ingemar J. Cox, Hui Han, Isaac G. Councill,C. Lee Giles «Σύγκριση on-line επιστημονικών.
Αρχειοθέτηση του Ιστού Nordic Web Archive Toolset Ηλεκτρονική δημοσίευση Διδάσκοντες : Σ. Καπιδάκης, Μ. Γεργατσούλης Μαρίνα Κομπολύτη Εαρινό εξάμηνο 2003/2004.
1 Συλλογικοί Κατάλογοι & Διαδίκτυο Μιχάλης Σφακάκης.
Εποπτεύων καθηγητής: Κος Σαράντος Καπιδάκης
Μηχανική Μάθηση και Εξόρυξη Γνώσης
Εφαρμογές των νέων Τεχνολογιών στη διδασκαλία και μάθηση
ΚΕΝΤΡΟ ΠΟΛΙΤΙΣΜΙΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ I ΔΡΥΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΡΕΥΝΑΣ IΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΚΗΣ Σύστημα Τεκμηρίωσης, Διαχείρισης και.
Εφαρμογές Πληροφορικής
ΕΠΙΜΕΛΕΙΑ ΕΡΓΑΣΙΑΣ: ΧΡΙΣΤΙΝΑ ΜΠΛΑΝΑ ΔΙΔΑΣΚΩΝ: ΣΑΡΑΝΤΟΣ ΚΑΠΙΔΑΚΗΣ ΕΞΑΜΗΝΟ: ΕΑΡΙΝΟ ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ- ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ.
ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΈΝΑ ΦΑΣΜΑ ΤΗΣ ΔΙΑΛΕΙΤΟΥΡΓΙΚΟΤΗΤΑΣ (A SPECTUM OF INTEROPERABILITY) Βαρειά Βασιλική (Β ) Βαρειά Βασιλική (Β )
Ψηφιακές Βιβλιοθήκες Θέμα εργασίας: Υπηρεσίες Ψηφιακών Βιβλιοθηκών προς τους χρήστες (Συγκριτική προσέγγιση) Ασκητή Βασιλική Αθήνα, 12/12/2005.
2. Μορφή και οργάνωση του μαθήματος
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ –ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ : ΥΠΗΡΕΣΙΕΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΕ ΨΗΦΙΑΚΟ ΠΕΡΙΒΑΛΛΟΝ ΠΡΟΤΥΠΟ MPEG-4 ΕΠΙΒΛΕΠΩΝ.
Ψηφιακή Βιβλιοθήκη ΤΕΕ
21/11/2001 Καταστάσεις και Στατιστικές Αναφορές Κώστας Βίγλας Υπολογιστικό Κέντρο Βιβλιοθηκών.
η σημασία & ο ρόλος τους»
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΟΘΗΚΟΝΟΜΙΑΣ Αναζητώντας πρότυπα αλληλεπίδρασης χρηστών για ψηφιακές βιβλιοθήκες Εργασία στο Μάθημα: Ψηφιακές.
…………………………………………………………. ΠΛΗΡΟΦΟΡΙΑΚΗ ΠΑΙΔΕΙΑ Το κλειδί για τη δια βίου μάθηση 14 – 16 Ιουνίου 2006 Goethe-Institut Athen Μαθαίνοντας δια βίου Βιβλιοθήκες.
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
Αλλαγή του τρόπου επιστημονικής πληροφόρησης με τη χρήση δημοσιευμάτων ανοιχτής πρόσβασης και ιδρυματικών αποθετηριών Γεωργία Κατσαρού Διεθνές Κέντρο Ελληνικών.
Πλαίσιο ανάπτυξης ΕΠΣΕ+Τ Διεθνείς τάσεις για την ανοικτή πρόσβαση Διεθνείς πρωτοβουλίες και δράσεις για ανοικτή πρόσβαση Νέες πρακτικές για επιστημονικές.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ –ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ : ΥΠΗΡΕΣΙΕΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΕ ΨΗΦΙΑΚΟ ΠΕΡΙΒΑΛΛΟΝ ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ.
Ακαδημαϊκή Ηλεκτρονική Δημοσίευση: η σημερινή κατάσταση και μια αναφορά των project που ασχολούνται με αυτή Κάτση Εγλεντίνα (Β )
Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας «Διοίκηση & Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας» «Ψηφιακός.
Τίτλος: "Μια έρευνα σχετικά με την αποτελεσματικότητα των ηλεκτρονικών υπηρεσιών πληροφορίας στην ελληνική τριτοβάθμια εκπαίδευση: Μελέτη περίπτωσης" Ιουλία.
CALIS (China Academic Library and Information System) Κοινοπραξία ακαδημαϊκών βιβλιοθηκών της Κίνας Σύστημα παροχής πληροφοριών 1998.
Ψηφιακές Βιβλιοθήκες Παρουσίαση:Πιτσιλλίδου Σόφη Α.Μ:Β
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ " Διοίκηση και Οργάνωση Βιβλιοθηκών.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ- ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ «ΥΠΗΡΕΣΙΕΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΕ ΨΗΦΙΑΚΟ ΠΕΡΙΒΒΑΛΟΝ» ΕΡΓΑΣΙΑ ΓΙΑ ΤΟ ΜΑΘΗΜΑ.
ΟΡΓΑΝΩΣΗ ΔΙΟΙΚΗΣΗ & ΑΞΙΟΛΟΓΗΣΗ ΤΩΝ ΨΗΦΙΑΚΩΝ ΒΙΒΛΙΟΘΗΚΩΝ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΥΠΗΡΕΣΙΕΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΕ.
Μετατροπή Μουσικών Συλλογών σε Ψηφιακές Βιβλιοθήκες Το Πρόγραμμα MUSESCAPE Ιόνιο Πανεπιστήμιο Ιανουάριος 2005 Χριστιανούδης Ιωάννης.
Υπουργείο Εθνικής Παιδείας και Θρησκευμάτων Γενικά Αρχεία του Κράτους Ιστορικό Αρχείο Μακεδονίας.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΝΟΜΙΑΣ - ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Πρόγραμμα Μεταπτυχιακών Σπουδών: Διοίκηση & Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες.
T OPICAL CRAWLING FOR BUSINESS INTELLIGENCE Θ ΕΜΑΤΙΚΟ C RAWLING ΓΙΑ ΤΙΣ ΕΠΙΧΕΙΡΗΣΙΑΚΕΣ ΟΝΤΟΤΗΤΕΣ Μάθημα: Ηλεκτρονική Δημοσίευση Διδάσκων: Καπιδάκης Σαράντος.
Χρήστες και Χρήση των Online Ψηφιακών Βιβλιοθηκών της Γαλλίας
ΣΥΓΚΟΜΙΔΗ ΜΕΤΑΔΕΔΟΜΕΝΩΝ (METADATA HARVESTING) ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ - ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ "Διοίκηση & Οργάνωση Βιβλιοθηκών με έμφαση στις.
ΟΙ ΤΠΕ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ ΜΙΑ ΠΡΩΤΗ ΘΕΩΡΗΣΗ ΣΑΡΑΝΤΟΣ ΨΥΧΑΡΗΣ
Εισαγωγή-Πρώτα στάδια των ψηφιακών βιβλιοθηκών  Υπάρχουν βιβλιοθήκες εικόνων, ήχου, ψηφιακού βίντεο και συλλογές αποθηκευμένες σε βάσεις δεδομένων, βάσεις.
Οδηγός Αναζήτησης Ιδρυματικού Αποθετηρίου
Διαχείριση Εκπαιδευτικού Περιεχομένου
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΤΕΥΘΥΝΣΗ «Υπηρεσίες Πληροφόρησης σε Ψηφιακό Περιβάλλον» ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ « Ηλεκτρονική Δημοσίευση.
ΠΑΡΟΥΣΙΑΣΗ ΤΟΥ COLLATE PROJECT COLLATE:Collaboratory for Annotaton,Indexing and Retrieval of Digitized Historical Archive Material(συνεργασία για σχολιασμό,
Οργάνωση πληροφοριών Ταξινόμηση (Θ) Ενότητα 1: Εισαγωγή (α μέρος) Δάφνη Κυριάκη-Μάνεση Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης Το περιεχόμενο.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Βρίσκοντας κατάλληλα αντικείμενα μάθησης:
DSpace:ένα ψηφιακό αποθετήριο ανοικτής πρόσβασης Φοιτήτρια : Νικολέττα Μπίζου Μάθημα: Ηλεκτρονική δημοσίευση Διδάσκοντες: Σαράντος Καπιδάκης Μανώλης Γεργατσούλης.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΜΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ» ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΔΙΔΑΣΚΟΝΤΕΣ: ΚΑΠΙΔΑΚΗΣ ΣΑΡΑΝΤΟΣ ΓΕΡΓΑΤΣΟΥΛΗΣ ΕΜΜΑΝΟΥΗΛ Το DSpace ως ένα Ανοικτό.
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Εργασία στο υποχρεωτικό μάθημα του ΣΤ’εξαμήνου Θέμα: Oxford Digital Library.
CALIFORNIA DIGITAL LIBRARY CALIFORNIA DIGITAL LIBRARY ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΣΤ΄ ΕΞΑΜΗΝΟ ΣΤ΄ ΕΞΑΜΗΝΟ Μαρία Καραδήμα Μαρία Καραδήμα.
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας «Διοίκηση & Οργάνωση Βιβλιοθηκών.
Ηλεκτρονική Δημοσίευση The Goddard Library Web Capture Project Χριστιανούδης Ιωάννης Π.Μ.Σ. Κέρκυρας Μάιος 2005.
FEDORA ARCHITECTURE1 Αρχιτεκτονικές Ψηφιακών Βιβλιοθηκών FEDORA.
Κριτήρια επιλογής και αξιολόγησης ψηφιακού υλικού Ενότητα «Δημιουργία και διαχείριση ψηφιακών συλλογών»
ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ: ΠΑΡΑΠΟΜΠΕΣ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΤΣΙΦΛΙΔΟΥ ΕΥΘΥΜΙΑ ΥΔΡΑΙΟΥ ΙΩΑΝΝΑ.
Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Μεταπτυχιακό Πρόγραμμα στην Επιστήμη της Πληροφορίας Ψηφιακές Βιβλιοθήκες Διδάσκων: Σαράντος.
Τεχνολογία ΛογισμικούSlide 1 Τεχνολογία Απαιτήσεων u Καθορίζει τι θέλει ο πελάτης από ένα σύστημα λογισμικού.
Εκμετάλλευση υπηρεσιών Web 2.0 σε σχολικούς ιστοτόπους Παλάζης Βασίλης 3o Γυμνάσιο Μυτιλήνης.
Η βιβλιογραφική έρευνα πηγές. Πρωτογενείς πηγές: άρθρα περιοδικών και συνεδρίων, αναφορές, επίσημες εκδόσεις ευρεσιτεχνίας, προδιαγραφές Δευτερογενείς.
Τζένη Παγγέ Πανεπιστήμιο Ιωαννίνων
Εννοιολογική Χαρτογράφηση
Εισαγωγή Για σχεδόν τέσσερις δεκαετίες, οι προσωπικοί υπολογιστές αποτελούνταν από ένα desktop system και ένα folder system metaphors για τη διαχείριση.
Μεταγράφημα παρουσίασης:

ΘΕΜΑ : A Comparison of On- line Computer Science Citation Databases ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ:Υπηρεσίες Πληροφόρησης σε Ψηφιακό Περιβάλλον ΜΑΘΗΜΑ :Ψηφιακές Βιβλιοθήκες Επιμέλεια:Μπαλαλή Κυριακή

6/2/2008 Μπαλαλή Κυριακή2 Εισαγωγή(1) Υπάρχουν διάφορες δωρεάν on-line βιβλιογραφικές βάσεις δεδομένων για την επιστήμη των υπολογιστών. Παρουσιάζουν τις αναφορές που έχουν γίνει για ένα συγκεκριμένο άρθρο από άλλες μεταγενέστερες εργασίες. Μπορεί να είναι είτε αυτοαναφορές του συγγραφέα είτε αναφορές τρίτων. συλλέγουν άρθρα, τα ευρετηριάζουν και τα εμπλουτίζουν με μεταδεδομένα(metadata).

6/2/2008 Μπαλαλή Κυριακή3 Εισαγωγή(2) Δυο δημοφιλείς on-line βιβλιογραφικές βάσεις είναι η CiteSeer και η DBLP. Στη CiteSeer οι καταχωρήσεις γίνονται αυτόματα μέσω ενός crawler που ψάχνει στον Παγκόσμιο Ιστό. Στη DBLP τα δεδομένα καταχωρούνται διά χειρός από διάφορα γκρουπ εθελοντών ή από προσλαμβανομένους μαθητές Οι εισαγωγές λαμβάνονται από πρακτικά συνεδρίων και εφημερίδες/ περιοδικά

6/2/2008 Μπαλαλή Κυριακή4 Η βάση δεδομένων DBLP DataBase systems and Logic Programming ή Digital Bibliography & Library Project Δημιουργήθηκε από τον Michael Ley το Σήμερα ευρετηριάζει πάνω άρθρα της επιστήμης των υπολογιστών από περίπου συγγραφείς. Παρέχει χιλιάδες links σε αρχικές σελίδες επιστημόνων της πληροφορικής. Είναι ένας βιβλιογραφικός server και δεν αποτελεί αποθετήριο τεκμηρίων.

6/2/2008 Μπαλαλή Κυριακή5 Η βάση δεδομένων CiteSeer Δημιουργήθηκε το από τους K. Bollacker, L. Giles, και S. Lawrence στο Ερευνητικό Κέντρο NEC στο Πανεπιστήμιο Πρίνστον των ΗΠΑ. Είναι ψηφιακή βιβλιοθήκη και μηχανή αναζήτησης που εστιάζει στην επιστήμη των πληροφοριών και των υπολογιστών. Στόχος της είναι να βελτιώσει τη διάχυση και την ανατροφοδότηση της επιστημονικής λογοτεχνίας καθώς και να επιφέρει βελτιώσεις στη λειτουργικότητα, χρηστικότητα, διαθεσιμότητα, το κόστος, την περιεκτικότητα, και την επικαιρότητα της πρόσβασης στην επιστημονική γνώση.

6/2/2008 Μπαλαλή Κυριακή6 Η βάση δεδομένων CiteSeer Είναι η πρώτη βάση δεδομένων που εφάρμοσε την αυτόνομη ευρετηρίαση αναφορών ACI(Autonomous citation indexing) Η CiteSeer αποτελείται από τρία βασικά συστατικά: 1. από έναν εστιασμένο crawler (focused crawler) 2. από το αρχείο των ντοκουμέντων (document archive) 3. και από ένα ειδικευμένο ευρετήριο (specialized index) και την διεπαφή ερωτήσεων (query interface).

6/2/2008 Μπαλαλή Κυριακή7 Η βάση δεδομένων CiteSeer Ο εστιασμένος crawler ψάχνει στον Ιστό για σχετικά ντοκουμέντα σε μορφή PDF και PostScript. Μετά το φιλτράρισμα γίνεται η ευρετηρίαση χρησιμοποιώντας το Autonomous Citation Indexing (ACI), το οποίο συνδέει αυτόματα τις παραπομπές με τα άρθρα διευκολύνοντας την πλοήγηση και την αξιολόγηση. Περιλαμβάνει πάνω από ντοκουμέντα λαμβάνοντας πάνω από ένα εκατομμύριο αιτήσεις και εξυπηρετώντας πάνω από 25 GB πληροφορίας καθημερινά.

6/2/2008 Μπαλαλή Κυριακή8 Οι διαφορές στο σύστημα λήψης δεδομένων(1) Οι εγγραφές στη DBLP εξασφαλίζονται από εθελοντές. Οι διορθώσεις, επίσης, ελέγχονται με το χέρι. Η DBLP προσπαθεί να εγγυηθεί περιεκτική και απόλυτη κάλυψη των περιεχομένων της. Παρόλο που υπάρχει η πιθανότητα ανθρώπινου λάθος στη δια χειρός διαδικασία εισαγωγής των εγγραφών της βάσης, τα μεταδεδομένα της είναι γενικώς υψηλής ποιότητας σε σύγκριση με τα μεταδεδομένα που συλλέγονται αυτόματα.

6/2/2008 Μπαλαλή Κυριακή9 Οι διαφορές στο σύστημα λήψης δεδομένων(2) Η CiteSeer έχει αυτόματους crawlers που επιτυγχάνουν υψηλότερη κάλυψη καθώς το κόστος της αυτόματης ευρετηρίασης είναι πολύ μικρότερο. Μπορεί να θεωρηθεί μία φόρμα αυτοεπιλογής με on- line αναζήτηση. Ένα πλήρως αυτόματο επιστημονικά συμμετρικό σύστημα, που όμως επηρεάζεται εύκολα από κακόβουλες επιθέσεις, πχ: συγγραφείς προσπαθούν να διαφοροποιήσουν το δικό τους citation ranking προσθέτοντας ψευδή άρθρα που υποτίθεται ότι αναφέρονται στη δική τους εργασία.

6/2/2008 Μπαλαλή Κυριακή10 Εξαγωγή Μεταδεδομένων Υπάρχουν δύο βασικές μέθοδοι για την εξαγωγή πληροφορίας:  η Τεχνολογία της Γνώσης (Knowledge Engineering)  και η Μηχανική Μάθηση (Machine Learning). Στην πρώτη μέθοδο, οι κανόνες εξόρυξης που χρησιμοποιεί το σύστημα κατασκευάζονται χειρονακτικά χρησιμοποιώντας γνώση σχετική με το domain της εφαρμογής. Στη δεύτερη μέθοδο, απαιτείται λιγότερη εξειδίκευση όταν προσαρμόζουμε το σύστημα σε ένα νέο domain. Κάποιος με επαρκή γνώση του domain και της εργασίας αυτής χαρακτηρίζει χειρονακτικά ένα σύνολο κατευθυντήριων ντοκουμέντων και τα χαρακτηρισμένα δεδομένα χρησιμοποιούνται για να κατευθύνουν έναν αλγόριθμο Μηχανικής Μάθησης. Αυτή η μέθοδος είναι πιο ευέλικτη από την προσέγγιση της Τεχνολογίας της Γνώσης, αλλά απαιτεί να είναι διαθέσιμος ένας όγκος κατευθυντήριων ντοκουμέντων.

6/2/2008 Μπαλαλή Κυριακή11 Σύγκριση στον αριθμό εκδόσεων Συγκρίθηκε ο αριθμός των εκδόσεων των άρθρων για τα έτη Η αύξηση της DBLP οφείλεται στην μεγαλύτερη κάλυψη που παρείχε η μείωση στον αριθμό των άρθρων της CiteSeer οφείλεται στη μείωση της κάλυψης, στις πνευματικές ανησυχίες και στις μαύρες θεματικές επιδράσεις.

6/2/2008 Μπαλαλή Κυριακή12 Μοντέλα απόκτησης δεδομένων Στη CiteSeer αναπτύχθηκαν δύο πιθανά μοντέλα για την απόκτηση των άρθρων.  Το πρώτο είναι βασισμένο σε συγγραφείς που παραδίδουν τα άρθρα τους κατευθείαν στη βάση.  Το δεύτερο δείχνει ότι τα άρθρα αποκτώνται αυτόματα από έναν crawler που ψάχνει στο web. Για τη DBLP, υποθέτουμε ένα απλό μοντέλο απόκτησης άρθρων όπως να υπάρχει η πιθανότητα α σύμφωνα με την οποία το άρθρο να περιλαμβάνεται στην DBLP ή ακόμα και να είναι ανεξάρτητο από τον αριθμό των συγγραφέων.

6/2/2008 Μπαλαλή Κυριακή13 Μοντέλο Παράδοσης της CiteSeer Ας υποθέσουμε ότι β Є (0,1) και δηλώνει την πιθανότητα όπου ένας συγγραφέας παραδίδει ένα άρθρο κατευθείαν στη CiteSeer δηλ. p(i)= 1- (1-β) i όπου (1-β) i είναι η πιθανότητα κανένας από τους i συγγραφείς να παραδώσουν κάποιο άρθρο στη βάση. r(i) = dblp(i) = α citeseer (i) (1-(1-β)i ) Είναι προφανές από το σχήμα ότι όσο ο αριθμός των συγγραφέων i αυξάνεται τόσο η αναλογία r(i) τείνει στο α. Για τη CiteSeer υποθέτουμε ότι η μέθοδος απόκτησης παράγει μία επιρροή όπως την πιθανότητα p(i) όπου το άρθρο περιλαμβάνεται στη CiteSeer και είναι μία λειτουργία του αριθμού των συγγραφέων από ένα συγκεκριμένο άρθρο.

6/2/2008 Μπαλαλή Κυριακή14 Κατανομές αναφορών ( Citation Distributions ) Συγκρίνει τις κατανομές των αναφορών μεταξύ των δύο βάσεων και βλέπουμε ότι η DBLP περιέχει περισσότερα low cited papers απ’ ότι η Citeseer. Προς το παρόν δεν υπάρχει εξήγηση γι’ αυτό το φαινόμενο. Αντίθετα, ίσως να σχετίζεται με την παρατήρηση του Lawrence σύμφωνα με την οποία τα άρθρα που είναι on-line ελεύθερα διαθέσιμα έχουν περισσότερες αναφορές.

6/2/2008 Μπαλαλή Κυριακή15 Νέα μοντέλα της Citeseer CiteseerPlus βασίζεται σε μια νέα αρχιτεκτονική σχεδιασμένη να είναι ευέλικτη, αρθρωτή, και επεκτάσιμη. Citeseer x beta είναι ανερχόμενο μοντέλο που σχετίζεται με την αναγνώριση της αναζήτησης. Καθώς η CiteSeer για την ώρα λειτουργεί μέσα σε ένα ακαδημαϊκό περιβάλλον, εστιάζοντας στην έρευνα και στην παραγωγή, αναπτύχθηκε ένα πλαίσιο που επιτρέπει επεκτάσιμη, κατανεμημένη έρευνα και αποθήκευση, ενώ διευκολύνει την ανάπτυξη νέων και βελτιωμένων αλγόριθμων για την εξόρυξη της πληροφορίας. Η τρέχουσα CiteSeer δεν ευρετηριάζει περισσότερα από 3-4 papers ανά λεπτό, καταλήγοντας σε ανεπαρκή ταχύτητα για την απόκτηση νέου περιεχόμενου.

6/2/2008 Μπαλαλή Κυριακή16 Διάφορες βάσεις δεδομένων Scopus ( Bibfinder ( Googlescholar ( Vldb ( ACM ( Sciencedirect (

6/2/2008 Μπαλαλή Κυριακή17 Συμπεράσματα Και οι δύο βάσεις είναι φιλικές και προσιτές στους χρήστες προσφέροντας σημαντικά εργαλεία για την έρευνα. Η Citeseer προσπαθεί συνεχώς να βελτιώνει τις υπηρεσίες της δημιουργώντας νέα μοντέλα για να μπορέσει να αντεπεξέλθει στις απαιτήσεις. Έχουν πολύ διαφορετικές μεθόδους στην απόκτηση των δεδομένων. Όσον αφορά τις κατανομές των αναφορών (citation distributions) και για τις δύο βάσεις η Citeseer έχει μικρότερο αριθμό low-cited papers. η κάλυψη της DBLP φτάνει περίπου το 24% ολόκληρης της επιστήμης των υπολογιστών.

6/2/2008 Μπαλαλή Κυριακή18 Προβληματισμοί Η CiteSeer είναι αργό και off-line σύστημα που σημαίνει ότι τα αποτελέσματα δεν επιστρέφονται αμέσως αλλά μετά από μέρες έτσι οι ερευνητές δυσκολεύονται στην έρευνα τους. Τα αποτελέσματα μπορεί να είναι έγκυρα αλλά υπάρχουν πολλές διπλοεγγραφές, γεγονός που πρέπει να μεριμνήσουν για να διορθωθεί. Και το GoogleScholar και η CiteSeer δεν κάνουν διάκριση ανάμεσα στις αυτοαναφορές των συγγραφέων και τις αναφορές τρίτων, γεγονός που δημιουργεί σύγχυση και λανθασμένες εντυπώσεις.

6/2/2008Μπαλαλή Κυριακή19