Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ.ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΤΕΥΘΥΝΣΗ «ΟΡΓΑΝΩΣΗ ΚΑΙ ΔΙΟΙΚΗΣΗ.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ.ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΤΕΥΘΥΝΣΗ «ΟΡΓΑΝΩΣΗ ΚΑΙ ΔΙΟΙΚΗΣΗ."— Μεταγράφημα παρουσίασης:

1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ.ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΤΕΥΘΥΝΣΗ «ΟΡΓΑΝΩΣΗ ΚΑΙ ΔΙΟΙΚΗΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» Μάθημα: Ηλεκτρονική δημοσίευση Παραπομπές στο Διαδίκτυο: Η περίπτωση του ResearchIndex Παναγιωτοπούλου Δανάη Διδάσκων: Σ. Καπιδάκης M. Γεργατσούλης Αθήνα 2006

2 Περιεχόμενα 1. Συστήματα ανάλυσης παραπομπών -Βιβλιογραφική Επισκόπηση 2. Σύστημα Αυτόνομης Ανάλυσης Παραπομπών 3. ResearchIndex-CiteSeer 4. CiteSeer x 5. Συστήματα που υιοθέτησαν το μοντέλο CiteSeer 6. Συμπέρασμα 7. Χρήσιμες ιστοσελίδες 8. Βιβλιογραφία

3 ΕΡΕΥΝΑ Αναζήτηση βιβλιογραφίας Δημοσίευση Ερευνητής

4 Συστήματα ανάλυσης παραπομπών - Βιβλιογραφική Επισκόπηση (1/2) 1954: Πρώτη μέθοδος ανάλυσης παραπομπών – Eugene Garfield  Ανάλυση παραπομπών vs. συμβατική ευρετηρίαση Πλεονεκτήματα: Αντικειμενική πρόσβαση Μείωση χρόνου & κόπου που απαιτούνταν για τη δημιουργία ευρετηρίου Δυνατότητα επισήμανσης περισσοτέρων άρθρων Μείωση μη σχετικών άρθρων 1964: Υλοποίηση της μεθόδου – ISI Science Citation Index

5 Συστήματα ανάλυσης παραπομπών - Βιβλιογραφική Επισκόπηση (2/2) (Ενδεικτικά) Web of Science JSTOR PsychInfo High Wire Press CiteBase

6 Σύστημα Αυτόνομης Ανάλυσης Παραπομπών Αυτόνομο σύστημα που κατατάσσει τις παραπομπές που γίνονται σε άρθρα και τις συνδέει με τα τεκμήρια προς τα οποία έγινε η παραπομπή (χωρίς ανθρώπινο ενδιάμεσο) Εντοπίζει επιστημονική βιβλιογραφία Εξάγει παραπομπές από άρθρα, τεχνικές εκθέσεις, προσχέδια δημοσιεύσεων κ.λ.π. Αναγνωρίζει παραπομπές που αναφέρονται στο ίδιο άρθρο Αναγνωρίζει το περιεχόμενο των παραπομπών μέσα στο σώμα κειμένων Υλοποίηση ΣΑΑΠ: Research Index - CiteSeer

7

8

9 CiteSeer: Εντοπισμός τεκμηρίων Εντοπισμός άρθρων με αναζήτηση στο Διαδίκτυο: Μηχανές αναζήτησης (Altavista, HotBot, Excite) Ηλεκτρονικές λίστες Ομάδες συζητήσεων Ιστοσελίδες εκδοτών (Περιορισμός λόγω πνευματικών δικαιωμάτων) Αναζήτηση σε ιστοσελίδες που περιέχουν τις λέξεις: publications, papers, postscript. Το σύστημα αναγνωρίζει postscript αρχεία λόγω των επεκτάσεών τους:.ps, ps.Z, ps.gz

10 CiteSeer: Επεξεργασία τεκμηρίων «Κατεβάζει» αρχεία PS και PDF, τα μετατρέπει σε κείμενο ASCII (με τη χρήση του Prescript) Πιστοποιεί την επιστημονική φύση των κειμένων (με την ύπαρξη βιβλιογραφίας ή αναφορών) Πληροφορίες που αντλούνται από τα τεκμήρια:  URL  Επικεφαλίδα  Περίληψη  Εισαγωγή  Παραπομπές  Περιεχόμενο παραπομπής  Πλήρες κείμενο

11 CiteSeer: Εντοπισμός διαφορετικών παραπομπών για το ίδιο άρθρο Παράδειγμα: [7] L. Brieman, J.H. Friedman, R.A. Olshen, and C.J. Stone. Classification and Regression Trees. Wadsworth, Pacific Grove, California, L. Brieman, J. Friedman, R. Olshen, and C. Stone, Classification and Regression Trees, Wadsworth and Brooks, [1] L. Brieman, et al. Classification and Regression Trees. Wadsworth, Κανονικοποίηση: Απομάκρυνση  διακριτικών παύλας (-)  ετικετών παραπομπών (π.χ. το 6 στην αρχή της παραπομπής)  λέξεων (π.χ. p.p., pages, in press, vol., volume, et al.)  χαρακτήρων (π.χ. -, &, :, ( ), [ ])  Ανάλυση διάφορων συντομεύσεων (π.χ. η λέξη conf. γίνεται Conference)

12 CiteSeer: Αναζήτηση και ανάκτηση Αναζήτηση παραπομπών (Citation search) Αναζήτηση ευρετηριασμένου άρθρου (Indexed article search)

13 CiteSeer: Δυνατότητες συστήματος Περιεχόμενο Διόρθωσης στοιχείων άρθρων Υποβολής άρθρων Στατιστικά στοιχεία:  Συγγραφείς  Δημοσιεύσεις  Παραπομπές  Impact Rating περιοδικών  Αναμενόμενος χρόνος δημοσίευσης

14 Παράδειγμα αναζήτησης με λέξη-κλειδί στο τεκμήριο

15 Παράδειγμα αναζήτησης συγγραφέα (πριν από το άρθρο δίνεται ο αριθμός παραπομπών ενώ στην παρένθεση οι εκτιμώμενες παραπομπές που κάνει ο συγγραφέας στον εαυτό του)

16 Παράδειγμα αναζήτησης με συγγραφέα – Στατιστικά στοιχεία παραπομπών

17 Παράδειγμα καταμέτρησης παραπομπών

18 Παράδειγμα ανάκτησης άρθρου

19 Παράδειγμα κατάταξης συγγραφέα ανάλογα με τον αριθμό των παραπομπών που του έχουν γίνει (εξαιρούνται οι παραπομπές που έχει κάνει ο ίδιος ο συγγραφέας προς τα άρθρα του)

20 Παράδειγμα παραπομπής άρθρου μέσα στο σώμα κειμένου

21 Παράδειγμα διόρθωσης στοιχείων δημοσίευσης 1

22 Παράδειγμα διόρθωσης στοιχείων δημοσίευσης 2

23 Αρχιτεκτονική του CiteSeer

24 Document Repository pdf/ps/txt Download Status & Checksum DB Pub Filter Parser Doc ParserCite Parser Doc Adder Document Index Citation Index Meta-data Database Web-application Crawler Downloader Converter Query Daemon Rank cache Resp. cache Index cache

25 Ανακάλυψη εργασιών με URLs Παράλληλα «κατέβασμα» των εργασιών Μετατροπή των εργασιών σε κείμενο ASCII Απόσυρση μη επιστημονικών δημοσιεύσεων Διατήρηση του download και αποφυγή διπλοκαταχωρήσεων τεκμηρίων Αποθετήριο τεκμηρίων

26 Διαδικασία εισαγωγής τεκμηρίου: αναγνωρίζει όσα «κατεβασμένα» τεκμήρια βρίσκονται στο αποθετήριο τεκμηρίων και είναι πλέον έτοιμα για εισαγωγή εφόσον προηγουμένως έχουν μετατραπεί σε ASCII κείμενο Αποδόμηση του τεκμηρίου σε σώμα κειμένου και τμήμα αναφορών του τεκμηρίου Αποδόμηση τεκμηρίου: εξάγει τα μεταδεδομένα από τον τίτλο του τεκμηρίου και το περιεχόμενο των παραπομπών Αποδόμηση παραπομπών: εξάγει μεταδεδομένα για κάθε παραπομπή που βρίσκεται στο τμήμα των αναφορών Ευρετήρια τεκμηρίων και παραπομπών: ευρετηριάζουν το σώμα του τεκμηρίου και τα κείμενα των παραπομπών. Διατηρούν το id του αντικειμένου. Αποθήκευση όλων των εξαγομένων και παραγόμενων μεταδεδομένων: τεκμήριο/παραπομπή …

27 Διαχειρίζεται τα ερωτήματα που υποβάλλει ο χρήστης, τα οποία ευρετηριάζονται σε id καταλόγους τεκμηρίων/παραπομπών. Χρησιμοποιεί μεταδεδομένα για την κατάταξη των παραπομπών Αποκρυπτογραφεί πλήρεις απαντήσεις σε HTML. Η ευρετηρίαση βασίζεται στο ζητούμενο URL Χρησιμοποιείται για αναζήτηση κειμένων τεκμηρίων (Booleans ή Relevance) Χρησιμοποιείται για αναζήτηση σε κείμενο παραπομπών (μόνο με Booleans) Αποκρυπτογραφεί τις απαντήσεις από τα ευρετήρια, π.χ. Id τεκμηρίων /παραπομπών Αποκρυπτογραφεί τα μεταδεδομένα των τεκμηρίων/παραπομπών που βρίσκονται στη ΒΔ με σειρά κατάταξης

28 CiteSeer: Μεταδεδομένα ΟΑΙ (Open Archives Initiative) Παρέχονται αυτόματα από το σύστημα

29 Εξέλιξη: CiteSeer x (Beta Version) Νέα χαρακτηριστικά:  Εκτεταμένα μοντέλα δεδομένων  Εικονικά τεκμήρια  Ψηφιακά αντικείμενα Αρχιτεκτονική:  Επίπεδο αποθήκευσης  Επίπεδο εφαρμογής  Επίπεδο διεπαφής με το χρήστη (MyCiteSeer)

30 Συστήματα που υιοθέτησαν το μοντέλο CiteSeer SmealSearch eBizSearch RePec

31 Συμπέρασμα (1/2) Είναι κοινώς αποδεκτό ότι οι ερευνητές συχνά αγνοούν πολύτιμη για την έρευνά τους βιβλιογραφία λόγου της ανεπαρκούς ευρετηρίασης άρθρων. Η βιβλιογραφική κάλυψη από εμπορικές υπηρεσίες πληροφόρησης (π.χ. ISI Citation Index) επικεντρώνεται σε συγκεκριμένα ηλεκτρονικά περιοδικά. Συστήματα Αυτόματης Ευρετηρίασης, όπως το ResearchIndex, ενισχύουν τη χρήση περιοδικών στα οποία δεν γίνονται συχνά παραπομπές (π.χ. στα δωρεάν περιοδικά) καθώς και σχετικής βιβλιογραφίας άλλης φύσεως (π.χ. γκρίζας, πρακτικά συνεδρίων). Για τους ερευνητές, η γκρίζα βιβλιογραφία είναι εξαιρετικά πολύτιμη καθώς η έρευνα εξελίσσεται με γοργούς ρυθμούς και ο χρόνος δημοσίευσης των τεκμηρίων δεν είναι ανάλογος με την πρόοδό της.

32 Συμπέρασμα (2/2) Παράλληλα με την αναζήτηση, η εξοικείωση με ένα ΣΑΑΠ, δίνει τη δυνατότητα στον ερευνητή να ενημερώνει το σύστημα απευθείας για νέες εκδόσεις οι οποίες ευρετηριάζονται αμέσως. Ως εκ τούτου, η διάχυση και διάδοση των πληροφοριών διευρύνεται αυτόματα και γίνεται περισσότερο αποτελεσματική. Η υπηρεσία του ResearchIndex αναφέρεται σε τεκμήρια του τομέα της πληροφορικής. Ανάλογες προσπάθειες θα μπορούσαν να εφαρμοστούν και σε άλλους τομείς όπως της δασολογίας, της βιολογίας κ.λ.π.

33 Χρήσιμες ιστοσελίδες

34 Βιβλιογραφία (1/2) Barrueco Cruz, José Manuel and Krichel, Thomas (2004) Building an autonomous citation index for grey literature : the economics working papers case. In Proceedings GL6 : Sixth International Conference on Grey Literature, New York (USA). Bollacker, K., Lawrence, S. and C. L. Giles. “CiteSeer: An autonomous web agent for automatic retrieval and identification of interesting publications”. In Proceedings of the Second International Conference on Autonomous Agents, pages , New York, ACM Press. Cronin, B., Snyder, H. “Comparative citation rankings of authors in monographic and journal literature: A study of sociology”, Journal of Documentation 53, 3, pp Feitelson, Dror, Yovel, Uri. “Predictive ranking of computer scientists using CiteSeer data”, Journal of Documentation 60, 1, (2004): Fong, A, Hui, S., Vu, H. “Effective techniques for automatic extraction of Web publications”, Online Information Review 26, 1, (2002): Garfield, E Citation indexes for science: A new dimension in documentation through association of ideas. Science, 122 (3159): Available at: Garfield, E. (1979/1983). “Citation Indexing: Its theory and Application in Science, Technology and Humanities”. New York: Wiley & Sons. (Reprinted by ISI Press, 1983). Available at: Garfield, E. “Science Citation Index: A new dimension in indexing”, Science 144, 3619, (1964):

35 Βιβλιογραφία (2/2) Giles, Lee C., Bollacker, Kurt and Steve, Lawrence. “CiteSeer: An Automatic Citation Indexing System”, Digital Libraries 98 – Third ACM Conference on Digital Libraries, edited by I. Witten, R. Akseyn, F. Shipman III, ACM Press, New York, pp , Hui, S., Fong, A. “Document retrieval from a citation database using conceptual clustering and co- word analysis”, Online Information Review 28, 1, (2004): Hitchcock, Steve et al. “Open Citation Linking:The Way forward”, D-Lib Magazine 8, 10, (2002). Jacso, Peter. “Options for presenting search results: Part 2: options for citation searching”, Online Information Review 20, 4, (2005): Lawrence, Steve. “Access to scientific literature”, The Nature Yearbook of Science and Technology, edited by Declan Butler, Macmillan, London, England, (2001): Lawrence, Steve, Giles, C. et al. “Digital Libraries and Autonomous Citation Indexing”, IEE Computer 32, 6, (1999): Lawrence, Steve. “Online or invisible?”, Nature 411, 6837, (2001): 521. McKiernan, Gerry. “ResearchIndex: autonomous citation indexing on the Web”, The International Journal on Grey Literature 1, 1, (2000): OpCit-The Open Citation Project (2001) [Available at: Petinot, Yves et al. “A Service-Oriented Architecture for Digital Libraries” [Available at: Thelwall, Mike. “Research dissemination and invocation on the Web”, Online Information Review 26, 6, (2002):

36 Σας ευχαριστώ για την προσοχή σας!!!


Κατέβασμα ppt "ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ.ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΤΕΥΘΥΝΣΗ «ΟΡΓΑΝΩΣΗ ΚΑΙ ΔΙΟΙΚΗΣΗ."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google