XMLibrary Search: An XML Search Engine Oriented to Digital Libraries

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Βασικές έννοιες αλγορίθμων
Advertisements

Δημιουργία Ιστοσελίδων σε HTML και FrontPage Πρόγραμμα Αναμόρφωσης Προπτυχιακών Σπουδών Κεντρικό Γραφείο Υποστήριξης Εκπαιδευτικού Έργου Αλέξανδρος Λεκατσάς.
ΑΠΟΤΙΜΗΣΗ ΑΠΟΔΟΣΗΣ ΔΙΚΤΥΩΝ ΠΟΥ ΧΡΗΣΙΜΟΠΟΙΟΥΝ ΑΞΙΟΠΙΣΤΑ ΠΡΩΤΟΚΟΛΛΑ ΜΕΤΑΦΟΡΑΣ ΚΑΙ ΑΞΙΟΠΙΣΤΑ ΠΡΩΤΟΚΟΛΛΑ ΣΥΝΔΕΣΗΣ Ιωάννης Κόμνιος Μεταπτυχιακή Διατριβή Τμήμα.
Ένα απαραίτητο στοιχείο στην ζωή μας. Εργασία Α’ εξαμήνου (Internet)  Τμήμα:1Ι-ΙΝΠ01  Έτος:  Ονοματεπώνυμο : Αντώνης Δημητριάδης  Μάθημα: Τεχν.
5 Οργάνωση υπολογιστών Εισαγωγή στην Επιστήμη των Υπολογιστών ã Εκδόσεις Κλειδάριθμος.
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Παρουσίαση λειτουργίας εφαρμογής extra Διαχείριση Ταμείου
Next Generation Networking
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΘΕΜΑ: ΧΡΗΣΗ ΦΟΡΗΤΩΝ ΣΥΣΚΕΥΩΝ ΣΤΙΣ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ.
Διαχείριση Έργου Οργάνωση, σχεδιασμός και προγραμματισμός έργων ανάπτυξης λογισμικού.
JToNic H φυσική λύση για το πρόβλημα της ψηφιοποίησης και της τεκμηρίωσης στην εταιρεία σας... (εισάγεται από την Ιταλία)
Σχεδιαστικά εργαλεία Διαχείριση σελίδων Βιβλιοθήκες αντικειμένων Διαχείριση αντικειμένων Επιφάνεια ψηφιακής μελάνης Πληκτρολόγιο οθόνης ΟΦΕΛΗ Αναγνώριση.
-Στοίβα-Ουρά - Πλεονεκτήματα πινάκων -Δομές δεδομένων δευτερεύουσας μνήμης -Πληροφορική και δεδομένα -Παραδείγματα-Προβλήματα ψευδοκώδικα.
Οι “multi-Διαστασεις” Των Multimedia
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας «Υπηρεσίες Πληροφόρησης σε Ψηφιακό.
1 Μηχανές αναζήτησης στον Παγκόσμιο Ιστό Search Engines.
Διαδικασία ανάπτυξης Προσδιορισμός απαιτήσεων Αρχιτεκτονικός Σχεδιασμός Λεπτομερής Σχεδιασμός Κωδικοποίηση Έλεγχος Παράδοση Συστήματος Λειτουργία - Συντήρηση.
Ειδικά & Υβριδικά Εργαλεία Αναζήτησης. Εισαγωγή  Υπάρχει μια πλειάδα από ειδικά και υβριδικά εργαλεία αναζήτησης που αξίζουν ιδιαίτερης αναφοράς.  Αυτά.
ΣΤΟΙΧΕΙΑ ΨΕΥΔΟΚΩΔΙΚΑ ΒΑΣΙΚΕΣ ΔΟΜΕΣ ΒΑΣΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΩΝ
Κεφάλαιο 6 Υλοποίηση Γλωσσών Προγραμματισμού
Λογισμικο συστηματοσ Κεφάλαιο 4ο
 Αυδίκου Χριστίνα  Γιουμούκης Παναγιώτης  Κιντσάκης Θάνος  Πάπιστας Γιάννης.
Σελίδα 1 ΕΚΠΑ. «Διαμόρφωση υπηρεσίας καταλόγου Active Directory σε Windows 2003» Τηλέμαχος Ράπτης Εθνικό και Καποδιστριακό.
1 Συλλογικοί Κατάλογοι & Διαδίκτυο Μιχάλης Σφακάκης.
1 iPac Μια πρώτη γνωριμία Κώστας Βίγλας ΥΚΒ. 26/6/2002 Ενημέρωση πάνω στις νέες ψηφιακές υπηρεσίες 2 Περιεχόμενα 1 iPac  Τί είναι το iPac  Δυνατότητες.
Εποπτεύων καθηγητής: Κος Σαράντος Καπιδάκης
ΕΡΓΑΛΕΙΟ ΠΑΡΑΓΩΓΗΣ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΕ WEB SITE (CONTENT MANAGEMENT TOOL)
Η ποιότητα της πληροφορίας στο εκπαιδευτικό υλικό που χρησιμοποιείται ή διανέμεται μέσω του Internet Χρήστος Σαβρανίδης Πανεπιστήμιο Ιωαννίνων Τμήμα ΦΠΨ.
Heal Link Η HEAL Link (Hellenic Academic Libraries Link) είναι ο Σύνδεσμος Ελληνικών Ακαδημαϊκών Βιβλιοθηκών και λειτουργεί υπό.
Πολυμέσα – Δίκτυα (μαθ. επιλογής Γ’ Λυκείου)
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας: Διοίκηση & Οργάνωση Βιβλιοθηκών.
Εισαγωγή στις Βασικές Έννοιες Πληροφορικής
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΟΘΗΚΟΝΟΜΙΑΣ Αναζητώντας πρότυπα αλληλεπίδρασης χρηστών για ψηφιακές βιβλιοθήκες Εργασία στο Μάθημα: Ψηφιακές.
ΟΔΗΓΟΣ ΨΗΦΙΟΠΟΙΗΣΗΣ ΔΙΣΔΙΑΣΤΑΤΩΝ ΕΙΚΟΝΩΝ ΚΑΙ ΤΡΙΣΔΙΑΣΤΑΤΩΝ ΚΙΝΗΤΩΝ ΚΑΙ ΑΚΙΝΗΤΩΝ ΑΝΤΙΚΕΙΜΕΝΩΝ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ: ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ ΡΟΚΙΔΗ ΧΡΥΣΟΥΛΑ-ΔΙΟΝΥΣΙΑ.
Ανάκτηση Πληροφορίας (Information Retrieval – IR) Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχ. Η/Υ, Τηλ/νιών & Δικτύων Ακαδημαϊκό Έτος
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
Δημιουργία Παρουσίασης
1 Ιόνιο πανεπιστήμιο Τμήμα Αρχειονομίας-Βιβλιοθηκονομίας.  Δημιουργία Ψηφιακής βιβλιοθήκης των αρχείων του Κέντρου Επιστημονικών Ερευνών (ΚΕΕ) από τη.
1 Ενότητα 5.3.1: Ερωτηματολόγια με τη χρήση του Διαδικτύου Διδάσκων: Χρήστος Κατσάνος - Πανεπιστημιακό κέντρο εκπαίδευσης επιμορφωτών.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας Υπηρεσίες Πληροφόρησης σε Ψηφιακό.
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
Ανάπτυξη Πρωτοτύπου Λογισμικού
1 MedioVis- Ένας φυλλομετρητής μεταδεδομένων MedioVis – A user-centred Library Metadata Browser Μάθημα: Ψηφιακές Βιβλιοθήκες Διδάσκων: Καπιδάκης Σαράντος.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ " Διοίκηση και Οργάνωση Βιβλιοθηκών.
Για τη διεκπεραίωση ενός προβλήματος πρέπει να ακολουθηθεί η εξής διαδικασία:  να γραφεί ο αλγόριθμος να συνταχθεί το πρόγραμμα σε γλώσσα υψηλού επιπέδου.
Βάσεις Δεδομένων Εργαστήριο ΙΙ Τμήμα Πληροφορικής ΑΠΘ
ΠΜΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ The Digital Library and Computational Philology: The BAMBI Project Γόντικα Ειρήνη.
Μελέτη για την Επίδραση των Προγραμμάτων Ψηφιοποίησης στη Διαχείριση και στη Σταθερότητα των Συλλογών με Ιστορικές Φωτογραφίες. Φοιτήτρια: Παγώνη Αποστολία.
Δομικά στοιχεία πολυμέσων
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΤΕΥΘΥΝΣΗ «Υπηρεσίες Πληροφόρησης σε Ψηφιακό Περιβάλλον» ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ « Ηλεκτρονική Δημοσίευση.
ΠΑΡΟΥΣΙΑΣΗ ΤΟΥ COLLATE PROJECT COLLATE:Collaboratory for Annotaton,Indexing and Retrieval of Digitized Historical Archive Material(συνεργασία για σχολιασμό,
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Βρίσκοντας κατάλληλα αντικείμενα μάθησης:
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ- ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΚΕΡΚΥΡΑ2004.
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΠΣ: «Υπηρεσίες Πληροφόρησης σε Ψηφιακό Περιβάλλον» Εργασία στο Μάθημα «ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ»
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΜΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ» ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΔΙΔΑΣΚΟΝΤΕΣ: ΚΑΠΙΔΑΚΗΣ ΣΑΡΑΝΤΟΣ ΓΕΡΓΑΤΣΟΥΛΗΣ ΕΜΜΑΝΟΥΗΛ Το DSpace ως ένα Ανοικτό.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ “ USING MILOS TO BUILD A MULTIMEDIA.
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Εργασία στο υποχρεωτικό μάθημα του ΣΤ’εξαμήνου Θέμα: Oxford Digital Library.
Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Μεταπτυχιακό Πρόγραμμα στην Επιστήμη της Πληροφορίας Ψηφιακές Βιβλιοθήκες Διδάσκων: Σαράντος.
ΕΝΟΤΗΤΑ 2 – Κεφάλαιο 5: Γνωριμία με το Λογισμικό
Μπόλαρη Αγγελικη(1451) Επιβλέπων Βολογιαννίδης Σταύρος ΑΤΕΙ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ Σέρρες 2013.
 Ηλεκτρονικό κείμενο ονομάζουμε ένα κείμενο που έχει ψηφιοποιηθεί.  Η νέα τεχνολογία επιτρέπει την ψηφιοποίηση του ήχου, της εικόνας και της οπτικο-ακουστικής.
ΕΙΣΑΓΩΓΉ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΉ ΝΊΚΟΣ ΠΑΠΑΔΆΚΗΣ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΗΛΕΚΤΡΟΝΙΚΟΥ ΥΠΟΛΟΓΙΣΤΗ.
ΠΑΡΑΔΕΙΓΜΑ: ΤΑ ΕΠΙΠΕΔΑ ΥΛΙΚΟΥ – ΛΟΓΙΣΜΙΚΟΥ ΣΕ ΕΝΑΝ ΥΠΟΛΟΓΙΣΤΗ.
 Στόχος της παρουσίασης αυτής είναι η εξοικείωση με τον Ηλεκτρονικό Κατάλογο της Βιβλιοθήκης προκειμένου να αναζητήσουμε ένα τεκμήριο από τη συλλογή.
Kiosk & Retail.
Λύσεις Ασφάλειας στο Επίπεδο Διασύνδεσης
Συγγραφέας: Ζαγκότας Στεφανος Επιβλέπων Καθηγητής: Ούτσιος Ευάγγελος
DIGITAL FILM LIBRARIES
Ηλεκτρονικά Περιοδικά
Εξωτερική Αναζήτηση Ιεραρχία Μνήμης Υπολογιστή Εξωτερική Μνήμη
Μεταγράφημα παρουσίασης:

XMLibrary Search: An XML Search Engine Oriented to Digital Libraries ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΥΠΗΡΕΣΙΕΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΕ ΨΗΦΙΑΚΟ ΠΕΡΙΒΑΛΛΟΝ XMLibrary Search: An XML Search Engine Oriented to Digital Libraries Μάθημα: Ψηφιακές βιβλιοθήκες Εισηγητής: κ. Σαράντος Καπιδάκης Φοιτήτρια: Πάζα Ευθυμία Κέρκυρα 24-01-2007

Περιεχόμενο θέματος Περιγραφή των προϋποθέσεων που πρέπει να πληρεί μια μηχανή αναζήτησης μιας ψηφιακής βιβλιοθήκης και παρουσίαση μια συγκεκριμένης δομής μηχανών αναζήτησης σε γλώσσα XML Σκοπός σχεδίασης αυτής της δομή είναι για να καταχωρεί μεγάλο πλήθος κειμένων χρησιμοποιώντας ετικέτες δομής και για να είναι διαθέσιμη στο Internet Η αρχιτεκτονική αυτή έχει δημιουργηθεί και έχει δοκιμαστεί επιτυχώς στην ψηφιακή βιβλιοθήκη Miguel de Cervantes www.cervantesvirtual.com

Πως εντάσσεται το θέμα στην ενότητα; Εφόσον οι πληροφορίες έχουν πλέον ψηφιοποιηθεί οι δυνατότητες εκμετάλλευσής που διαθέτουμε είναι ευρύτατες Το αμέσως επόμενο στάδιο ως προς την προσβασιμότητα είναι η δημιουργία μηχανών αναζήτησης που να επιτρέπουν την ανεύρεση πληροφοριών μέσα από τα αρχεία (περιεχόμενο και δομή) ώστε ο χρήστης να μην είναι αναγκασμένος να βρει τις πληροφορίες που χρειάζεται ψάχνοντας μόνος του Επομένως είναι σκόπιμο να εκμεταλλευτούμε τη δομή των ψηφιακών αρχείων όπου κατά την ψηφιοποίηση τους, είναι ενδιαφέρον να αποθηκεύεται εκτός από το κείμενο και κάποια περιγραφή της δομής του Γι’ αυτό το λόγω χρησιμοποιείται το «tagging» δηλ. το XML, όπου η «δενδροειδής» δομή των τεκμηρίων XML επιτρέπει να γίνουν αναζητήσεις υψηλότερου επιπέδου

Προϋποθέσεις σχεδιασμού μηχανής αναζήτησης Κατά τη διάρκεια του σχεδιασμού μιας μηχανής αναζήτησης, κάποια χαρακτηριστικά - παράμετροι πρέπει να προσαρμοστούν ώστε να επιτευχθούν οι απαιτούμενες προϋποθέσεις. Τα επιθυμητά αυτά χαρακτηριστικά θα μπορούσαν να ταξινομηθούν σε δύο κατηγορίες: χαρακτηριστικά λειτουργίας (που εισάγουν περιορισμούς στο σύνολο των τεκμηρίων, που ταξινομεί τα αποτελέσματα με βάση τη σχετικότητά τους, που παρουσιάζουν θέματα σχετικά με την αναζήτηση…) και χαρακτηριστικά του συστήματος (όπως η ταχύτητα, η ακρίβεια, ,η ασφάλεια…)

Προϋποθέσεις για την δημιουργία μιας μηχανής αναζήτησης Αποτελεσματικότητα: μπορεί να επιτευχθεί μόνο από ένα κατάλληλα σχεδιασμένο περιβάλλον διεπαφής του χρήστη. Έτσι πρέπει η διεπαφή να είναι αρκετά πολύπλοκη ώστε να επιτρέπει απλές και σύνθετες αναζητήσεις άλλα συγχρόνως και αρκετά εύκολη ώστε να μπορεί να χρησιμοποιηθεί ακόμη και από άπειρους χρήστες. Ταχύτητα: ο χρήστης πρέπει να μπορεί να δει τα αποτελέσματα πολύ γρήγορα ακόμα κι αν πολλοί χρήστες χρησιμοποιούν ταυτόχρονα το σύστημα κάνοντας απλές ή συνθέτες αναζητήσεις. Συνεπώς, η ταχύτητα πρέπει να μην μειώνεται σημαντικά όταν αυξάνεται το μέγεθος της συλλογής των κειμένων

Προϋποθέσεις για την δημιουργία μιας μηχανής αναζήτησης Ανάκτηση πληροφοριών: το σύστημα πρέπει όχι μόνο να οδηγεί το χρήστη στις πληροφορίες αλλά και να διαβλέπει τι αναζητά ο χρήστης. Εάν ο χρήστης αναζητά μια φράση δεν θα είναι αρκετό να εμφανιστεί σε ποιο έργο βρίσκεται η φράση. Το σύστημα θα πρέπει να εμφανίσει και το συγκείμενο αυτής της φράσης αλλά και να οδηγήσει το χρήστη στο ακριβές σημείο του αρχείου όπου αυτή βρέθηκε Ασφάλεια: η μηχανή αναζήτησης χρησιμοποιεί κάποιες απόρρητες πληροφορίες που πρέπει να προστατευθούν. Η ασφάλεια σχετίζεται άμεσα με την ανάκτηση πληροφοριών επειδή οποιαδήποτε μηχανή αναζήτησης απαιτεί πλήρη πρόσβαση στα αρχεία

Προϋποθέσεις για την δημιουργία μιας μηχανής αναζήτησης Διεύρυνση αναζήτησης: η διεύρυνση της αναζήτησης συνίσταται στην δημιουργία παραλλαγών αυτής από τον χρήστη. Αυτές οι παραλλαγές μπορούν να εμφανιστούν μετά την αναζήτηση, σαν μια πρόταση για σχετικές αναζητήσεις, ή πριν από την αναζήτηση για να προσφερθούν αποτελέσματα με μεγαλύτερη ποιοτικά κάλυψη. Αυτές οι διευρύνσεις βασίζονται συνήθως σε θησαυρούς λέξεων και σε δοκιμαστικές προσεγγίσεις της φυσικής γλώσσας Πολυμέσα: τα πολυμέσα των ψηφιακών βιβλιοθηκών έχουν επιπλέον απαιτήσεις, λόγω του ότι τα δεδομένα που χειρίζονται έχουν πολύ μεγαλύτερο μέγεθος, και ο χρόνος που απαιτείται για την επεξεργασία τους είναι επίσης μεγαλύτερος

Δομή της μηχανής αναζήτησης Η δομή της συγκεκριμένης μηχανής αναζήτησης είναι ένα σύστημα με τρία διαφορετικά επίπεδα Τα τρία αυτά επίπεδα είναι πλήρως ανεξάρτητα μεταξύ τους και αλληλεπικοινωνούν με την χρήση πρωτοκόλλων επικοινωνίας TCP/IP Για την μεγιστοποίηση της απόδοσης του συστήματος προτείνεται κάθε επίπεδο να εκτελεστεί σε διαφορετικούς υπολογιστές Η απόδοση του συστήματος υπολογίζεται από το μέγιστο αριθμό αναζητήσεων που το σύστημα μπορεί να επεξεργαστεί ανά δευτερόλεπτο

Δομή της μηχανής αναζήτησης

Δομή της μηχανής αναζήτησης (ειδικότερα) Οι χρήστες έχουν πρόσβαση στη μηχανή αναζήτησης μέσω του κεντρικού εξυπηρετητή (web server) ο οποίος επιτρέπει στον πελάτη (client) του να στείλει τις αναζητήσεις στον user server (εξυπηρετητή χρηστών) Ο user server είναι αυτός που διανέμει τις αναζητήσεις στους διαθέσιμους query servers (εξυπηρετητές αναζητήσεων) Μόλις ο query server βρει αποτελέσματα για μία αναζήτηση ο user server στέλνει τα αποτελέσματα στον αντίστοιχο client

Αναλυτικότερα τα δομικά μέρη της μηχανής αναζήτησης Η μηχανή αναζήτησης που παρουσιάζεται αποτελείται από τα εξής μέρη: τους clients (πελάτες) τον user server (εξυπηρετητής πελατών) query server (εξυπηρετητής αναζητήσεων)

1. Οι client των μηχανών αναζήτησης Ο client μιας μηχανής αναζήτησης είναι ο μεταβλητός παράγοντας της δομής της, αν θεωρηθεί ότι κάθε client πραγματοποιεί μία μόνο αναζήτηση. Η λειτουργικότητα του client περιορίζεται από την διεπαφή που έχει σχεδιαστεί Ο client δημιουργεί ένα πακέτο / ομάδα δεδομένων που αποτελείται από την αναζήτηση και τις σχετικές πληροφορίες για τον χρήστη και το στέλνει στον user server Οι κανόνες με τους οποίους πρέπει να συνταχθεί η αναζήτηση διευκρινίζονται από μία γραμματική που είναι σχεδιασμένη ώστε τα αποτελέσματα των αναζητήσεων να μπορούν να βρεθούν γρήγορα από το ευρετήριο. Το αποτέλεσμα αποτελείται από ένα απόσπασμα ιστοσελίδας, που ο client προσθέτει την κεφαλίδα και το υποσέλιδο, και επιτρέπει στο μηχανισμό ή στην λειτουργία της μηχανή αναζήτησης να είναι απολύτως ανεξάρτητη από το σχεδιασμό της ιστοσελίδας Μόλις το αποτέλεσμα παραληφθεί, ο client δημιουργεί την ιστοσελίδα που θα παρουσιάσει στο χρήστη και ο ρόλος του ολοκληρώνεται.

Η διεπαφή της μηχανής αναζήτησης

Αποτέλεσμα αναζήτησης

2. User server (εξυπηρετητής πελατών) Ο user server συντονίζει ολόκληρο το σύστημα γιατί λαμβάνει τις αναζητήσεις από όλους τους clients και τις διανέμει στους διαθέσιμους query servers και το αντίστροφο Έχει την δυνατότητα κάποιες αναζητήσεις να μπορούν να απαντηθούν κατευθείαν από τον ίδιο, αυτό οφείλεται στο ότι διαχειρίζεται τα αιτήματα σ’ ένα προσωρινό χώρο αποθήκευσης για γρηγορότερη πρόσβαση (cache),και τα δεδομένα των αναζητήσεων αποθηκεύονται για κάποιο χρονικό διάστημα Το σύστημα συντονίζεται από μια ετερογενή βάση δεδομένων, η οποία περιέχει δεδομένα διαφόρων ειδών: εξυπηρετητής αναζητήσεων (query server), χρήστες, αναζητήσεις, στατιστικά στοιχεία Τα δεδομένα των χρηστών δεν χρησιμοποιούνται μόνο για την ανακατανομή των αποτελεσμάτων των αναζητήσεων, αλλά και για την ελεγχόμενη πρόσβαση σε αυτά Η μηχανή αναζήτησης ελέγχεται μόνο από έναν user server που συγκεντρώνει την παραγωγή των στατιστικών δεδομένων και των δεδομένων του ευρετηρίου

3. Query server (εξυπηρετητής αναζητήσεων) (1) O query server ανταποκρίνεται στα αιτήματα αναζήτησης που λαμβάνονται από τον user server τα οποία μπαίνουν σε μια σειρά και απαντιούνται κάθε ένα χωριστά Η διαδικασία που εκτελείται για να απαντηθούν οι αναζητήσεις διαιρείται σε δύο φάσεις - 1η φάση: η αναζήτηση υποβάλλεται σε επεξεργασία για να παραχθεί ένας κατάλογος ευρημάτων - 2η φάση: γίνεται πρόσβαση στα XML αρχεία, σύμφωνα με τον κατάλογο που δημιουργήθηκε στην 1η φάση, για να εξαχθεί το συγκείμενο και έτσι να δοθούν τα αποτελέσματα της κάθε αναζήτησης Ο αριθμός των ευρημάτων που προβάλλονται είναι προκαθορισμένος Η μηχανή αναζήτησης εφαρμόζει ένα σύστημα ανάκτησης πληροφοριών αποσπασμάτων

3.Query server (εξυπηρετητής αναζητήσεων) (2) Δηλαδή λόγω της δομής των XML αρχείων το περιεχόμενο που προβάλλεται είναι το ίδιο απόσπασμα στο οποίο υπάρχουν τα ευρήματα, λαμβάνοντας υπόψη κάποια στοιχεία του ΤΕΙ όπως παραγράφους, στίχους κτλ Η διαίρεση σε αυτές τις δύο φάσεις επιτρέπει στον query server να αποθηκεύει τα αποτελέσματα της πρώτης φάσης σ’ ένα προσωρινό χώρο αποθήκευσης για γρηγορότερη πρόσβαση Επομένως, όταν ξαναγίνει η ίδια αναζήτηση αλλά ζητηθεί διαφορετικός αριθμός ευρημάτων, να εκτελεστεί ξανά μόνο η δεύτερη φάση. Η δεύτερη φάση απαιτεί αρκετά σημαντικό χρόνο, διότι τα XML αρχεία είναι αποθηκευμένα στον σκληρό δίσκο Τέλος αφού τα περιεχόμενα έχουν ανακτηθεί, εκτελείται η παραγωγή διεύρυνσης της αναζήτησης

Τα δομικά συστατικά στοιχεία της μηχανής αναζήτησης Το σύστημα της μηχανής αναζήτησης, που είναι ενσωματωμένο στον query server, είναι το αρμόδιο για να ανταποκρίνεται στα αιτήματα αναζήτησης Η απόδοσή του στηρίζεται σε ένα ευρετήριο που έχει ήδη δημιουργηθεί από τη συλλογή των XML αρχείων το οποίο παρέχει άμεση πρόσβαση στις λέξεις, ετικέτες και τα γνωρίσματα που περιλαμβάνονται στη συλλογή Η μηχανή αναζήτησης αναλύει κάθε αίτημα αναζήτησης ώστε να δημιουργήσει ένα σχέδιο εκτέλεσης Μόλις δημιουργηθεί το σχέδιο, οι αναζητήσεις υποβάλλονται σε επεξεργασία και οι διευρύνσεις/ προεκτάσεις τους αναλύονται για να προταθούν στο χρήστη Τα δομικά συστατικά στοιχεία ακολουθούν αναλυτικότερα παρακάτω:

1. Σύστημα δημιουργίας ευρετηρίου και διαχείρισης ευρετηρίου Σύστημα δημιουργίας ευρετηρίου: είναι το δομικό στοιχείο που είναι αρμόδιο για την καταχώρηση των πληροφοριών από την συλλογή των XML αρχείων Η δομή των δεδομένων ευρετηρίων, περιέχει έναν αθροιστικό πίνακα για καθέναν από τους διαφορετικούς τύπους στοιχείων καθώς επίσης και ένα ευρετήριο αρχείων για όλα τα στοιχεία Το συνολικό μέγεθος του ευρετηρίου μπορεί να συγκριθεί με το μέγεθος ολόκληρων των συλλογών των XML αρχείων καθώς δεν χρησιμοποιείται κανένας αλγόριθμος συμπίεσης και για αυτό το λόγω δεν είναι δυνατό να διατηρηθεί ολόκληρο το ευρετήριο στη μνήμη παρά μόνο οι αθροιστικοί πίνακες Η διαχείριση ευρετηρίου παρέχει μια διεπαφή για την αναζήτηση λέξεων, ετικετών ή γνωρισμάτων, προσφέροντας επίσης, μηχανισμούς για την εκτέλεση επάλληλων αναζητήσεων χάρη στην δενδροειδή δομή της XML

2. Αναλυτής αναζητήσεων Αυτό το δομικό στοιχείο είναι αρμόδιο για την μελέτη των αιτημάτων αναζήτησης που στέλνονται από τον client Η πρόσβαση στο ευρετήριο και στα XML αρχεία είναι απαραίτητα για να παράγει τα αποτελέσματα που απαιτεί η αναζήτηση Για να παράγει τα αποτελέσματα πρέπει να έχει πρόσβαση στη συλλογή των XML αρχείων και αυτό αυξάνει το χρόνο απάντησης Αξιοσημείωτο είναι η δυνατότητα που έχουν οι ψηφιακές βιβλιοθήκες της απευθείας σύνδεσης - link με το ακριβές σημείο του αρχείου για κάθε ένα από τα αποτελέσματα της αναζήτησης

3. Διεύρυνση αναζήτησης Ο ρόλος αυτού του δομικού στοιχείου είναι να προτείνει περαιτέρω αναζητήσεις, παρόμοιες με αυτές που έχουν ήδη σταλεί. Στηρίζεται σε τρία στοιχεία: στην παραγωγή μορφολογικής διεύρυνσης: παρέχει πρόσβαση στη μορφολογική ανάλυση των λέξεων στα XML τεκμήρια αφού έχει πρώτα παραχθεί ευρετήριο και χρησιμοποιώντας τη μηχανική μετάφραση interNOSTRUM στην διαχείριση παρόμοιων λέξεων: εκθέτει ένα κατάλογο παρόμοιων λέξεων, δηλαδή λέξεων που συγγενεύουν ορθογραφικά. Οι πληροφορίες για όλες τις παρόμοιες λέξεις που βρίσκονται στα XML αρχεία, παράγονται αυτόματα μετά την δημιουργία του ευρετηρίου στη διαχείριση συνώνυμων λέξεων: κατέχει τα συνώνυμα των πιο κοινών λέξεων που περιέχονται στα XML τεκμήρια. Αυτά τα συνώνυμα αποθηκεύονται χειροκίνητα σε βάση δεδομένων, στην οποία υπάρχει πρόσβαση κατά τη φάση της απάντησης σε μία αναζήτηση

Εσωτερική δομή της μηχανής αναζήτησης

Πειράματα Έγινε προσπάθεια να υπολογιστεί η ταχύτητα του συστήματος σε πραγματικές συνθήκες. Έτσι δημιουργήθηκε, ένα δοκιμαστικό σύνολο 10.000 αναζητήσεων που περιέχουν τους ακόλουθους τύπους αναζητήσεων: - 2.500 αναζητήσεις μεμονωμένων λέξεων αποθηκευμένων σε κρυφή μνήμη με μεγάλα σύνολα αποτελέσματος - 2.500 σύνθετες αναζητήσεις αποθηκευμένες σε κρυφή μνήμη με κενά σύνολα αποτελέσματος, τα οποία δεν είναι αποθηκευμένα σε κρυφή μνήμη - 2.500 σύνθετες αναζητήσεις με μικρά σύνολα αποτελέσματος - 2.500 αναζητήσεις μεμονωμένων λέξεων, που δεν είναι αποθηκευμένες σε κρυφή μνήμη, με μεγάλα σύνολα αποτελέσματος Τα πειράματα εκτελέστηκαν σε όλους τους servers στον ίδιο υπολογιστή και το σύστημα ήταν σε θέση να απαντά σε περίπου 5,5 αναζητήσεις το δευτερόλεπτο χρησιμοποιώντας μια συλλογή XML αρχείων 300 ΜΒ σε υπολογιστή Pentium IV-1.5GHz με μνήμη 1GByte.

Συμπεράσματα (1) Η αποτελεσματικότητα εξαρτάται πολύ από τη δικτυακή διεπαφή που έχει η εφαρμογή. Έτσι, εάν οι χρήστες δεν μπορούν να εκφράσουν ακριβώς αυτό που θέλουν, η αποτελεσματικότητα μειώνεται Το συγκείμενο των ευρημάτων των λέξεων που αναζητήθηκαν αποκτάται με την χρήση ενός συστήματος βασισμένου σε αποσπάσματα κειμένου, ικανοποιώντας την προϋπόθεση για την ανάκτηση πληροφοριών Αντίθετα από άλλες XML μηχανές αναζήτησης, οι άμεσες links - συνδέσεις εμφανίζονται στις ακριβείς θέσεις μέσα στα δημοσιευμένα τεκμήρια, το οποίο επιτρέπει στο χρήστη την άμεση πρόσβαση σε όλες τις σχετικές με την αναζήτηση πληροφορίες Ο χρόνος εκτέλεσης, είναι πολύ χαμηλός, δεδομένου ότι οι νέοι query server μπορούν να προστεθούν εύκολα στο σύστημα

Συμπεράσματα (2) Ο χρόνος διαδικασίας που απαιτείται από τον user server είναι ελάχιστος επομένως, σπάνια θα υπάρξει υπερφόρτωση ανεξάρτητα με τον αριθμό χρηστών που τον χρησιμοποιούν Η ταχύτητα των δικτύων είναι πολύ πιο σημαντική καθώς καθορίζει το μέγιστο αριθμό αιτημάτων που μπορούν να ληφθούν ανά δευτερόλεπτο Η ασφάλεια των πληροφοριών είναι αρκετά υψηλή καθώς ο query server έχει πρόσβαση στη XML συλλογή και εμφανίζει μόνο το απλό κείμενο για να διατηρήσει τα αρχικά XML αρχεία Η διεύρυνση αναζήτησης, βασισμένη στα γραμματικά κριτήρια, στις παρόμοιες, και στις συνώνυμες λέξεις, βελτιώνει την αλληλεπίδραση των χρηστών με το σύστημα Η προτεινόμενη δομή είναι έτοιμη να ενσωματώσει με ευκολία τις νέες υπηρεσίες που θα απαιτούνται στο μέλλον, π.χ. να εργαστεί με τα στοιχεία πολυμέσων που είναι συνήθη στα επόμενα έτη

Μελλοντικές εργασίες Είναι μια έκδοση ανοικτής πηγής η οποία είναι εύκολο να εγκατασταθεί και να ενσωματωθεί σε οποιαδήποτε ψηφιακή βιβλιοθήκη Κύριως στόχος είναι να επιτραπεί στους διαχειριστές των webservers να εγκαταστήσoυν επιτυχώς την XMLibrary Search, επιτρέποντας τους πάντα να την προσαρμόζουν για να ανταποκρίνεται στις ανάγκες τους Γίνονται έρευνες σχετικά με τους αλγορίθμους συμπίεσης ευρετηρίων που θα επέτρεπαν στη μηχανή αναζήτησης να είναι ταχύτερη, αφού μικρότερα ευρετήρια διαβάζονται γρηγορότερα από το σκληρό δίσκο και ο χρόνος αποσυμπίεσης που χρειάζονται είναι ελάχιστος Μελετάμε τις νέες υπηρεσίες που θα επέτρεπαν ένα ευρετήριο βασισμένο σε διάταξη επιθημάτων Η ενσωμάτωση διάφορων εργαλείων επεξεργασίας της φυσικής γλώσσας όπως τα «tag» που ορίζει μέρη του λόγου και εργαλεία μηχανικής μετάφρασης θα βελτίωνε το σύστημα

Ευχαριστώ για την προσοχή σας!