Εφαρμογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήματα Αναζήτησης των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών Άννα Μάστορα 1, Μανόλης Πεπονάκης 2, Σαράντος.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
1 “Ανάπτυξη και Εφαρμογή Ολοκληρωμένου Συστήματος για τον Έλεγχο και την Παρακολούθηση των Μονάδων Επεξεργασίας Αστικών Λυμάτων στην Κύπρο, COMWATER” (Δεκέμβριος.
Advertisements

Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Γ ΛΩΣΣΙΚΟΙ Π ΟΡΟΙ & Τ ΕΧΝΟΛΟΓΙΕΣ : Η ΣΗΜΕΡΙΝΗ ΕΛΛΗΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ Πένυ Λαμπροπούλου Ινστιτούτο Επεξεργασίας Λόγου / Ε.Κ. "Αθηνά" Ημερίδα παρουσίασης.
Τεχνολογίες ανάκτησης και εξαγωγής δεδομένων με γλωσσική υποστήριξη - Εφαρμογές στο e-government και e-business - Εφαρμογές στο e-government και e-business.
Υποδομές Ανοικτής Πρόσβασης: Το μέλλον της επιστημονικής επικοινωνίας, ΕΚΤ, Αθήνα, Δεκεμβρίου 2008 Πρωτοβουλίες Ανοικτής Πρόσβασης στη Βιβλιοθήκη.
Οι Ακαδημαϊκές Βιβλιοθήκες της Περιφέρειας: Φορείς γνώσης και πολιτιστικής ανάπτυξης Βιβλιοθήκη Τ.Ε.Ι. Καλαμάτας 18 Δεκεμβρίου 2008 ΑΒΕΚΤ 5.6 Νέα έκδοση.
Πανελλήνιο Ψηφιακό Αποθετήριο Μαθησιακών Αντικειμένων
EPublishing 6/ Βικτωρία Τσουκαλά, PhD Ιούνιος 2013 Η Πράξη “Εθνικό Πληροφοριακό Σύστημα Έρευνας και Τεχνολογίας/Κοινωνικά Δίκτυα – Περιεχόμενο Παραγόμενο.
Ανάκτηση και Εξαγωγή Πληροφορίας από Πολυμεσικές και Πολυγλωσσικές
Ημερίδα Χαροκοπείου Πανεπιστημίου με θέμα:
Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
Η Θεματική Ταξινόμηση και η Συμβολή της στην Αναζήτηση Ευρωπαϊκών Κοινωνικών Δεδομένων.
14. ΠΡΟΚΑΤΑΡΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΠΡΟΓΡΑΜΜΑΤΟΣ ΜΕ ΤΙΤΛΟ: «ΕΠΑΝΑΧΡΗΣΙΜΟΠΟΙΗΣΗ ΑΠΟΒΛΗΤΩΝ – ΑΝΑΠΤΥΞΗ ΜΟΝΤΕΛΟΥ ΕΚΤΙΜΗΣΗΣ ΚΙΝΔΥΝΟΥ ΓΙΑ ΤΗ ΔΗΜΟΣΙΑ ΥΓΕΙΑ» Χριστοπούλου.
Πνευματικό κέντρο Ερμουπόλεως Σύρου
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας «Διοίκηση & Οργάνωση Βιβλιοθηκών.
Εποπτεύων καθηγητής: Κος Σαράντος Καπιδάκης
Έρευνα για το Εθνικό Φορολογικό Σύστημα Αθήνα 9 Νοεμβρίου ο Πανελλήνιο Επιστημονικό Συνέδριο Ι.Ο.Φο.Μ. Ι.Ο.Φο.Μ. – Π.Μ.Σ. Φορολογία και Ελεγκτική.
Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Μεταπτυχιακό Πρόγραμμα στην Επιστήμη της Πληροφορίας Διοίκηση Βιβλιοθηκών με έμφαση στις Νέες.
Η μηχανική μάθηση στην αντιμετώπιση της Υπερπληροφόρησης
ΣΤΑΔΙΟΔΡΟΜΙΕΣ ΓΥΝΑΙΚΩΝ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ: ΚΟΙΝΩΝΙΚΟΙ ΕΠΙΚΑΘΟΡΙΣΜΟΙ ΚΑΙ ΠΡΟΣΩΠΙΚΕΣ ΣΤΡΑΤΗΓΙΚΕΣ Η έρευνα αυτή συγχρηματοδοτήθηκε από την Ευρωπαϊκή Ένωση, στα.
19ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών, 3-5 Νοεμβρίου 2010, Αθήνα Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη.
Heal Link Η HEAL Link (Hellenic Academic Libraries Link) είναι ο Σύνδεσμος Ελληνικών Ακαδημαϊκών Βιβλιοθηκών και λειτουργεί υπό.
Ο αυτοματισμός στις εργασίες διαχείρισης περιοδικών : έρευνα σε βιβλιοθήκες της Αθήνας Αναστασία Διαγγελάκη Χριστίνα Κανάκη (Ιωάννινα, Σεπτέμβριος 2008)
Title of the presentation | Date |1 Καταγραφή απαιτήσεων ερευνητών ανθρωπιστικών επιστημών για γλωσσικούς πόρους και εργαλεία Δρ Νίκος Χούσος Εθνικό Κέντρο.
Ψηφιακές Βιβλιοθήκες Θέμα εργασίας: Υπηρεσίες Ψηφιακών Βιβλιοθηκών προς τους χρήστες (Συγκριτική προσέγγιση) Ασκητή Βασιλική Αθήνα, 12/12/2005.
Δημήτρης Γαβρίλης, Κωνσταντία Κακάλη Βιβλιοθήκη & Υπηρεσία Πληροφόρησης, Πάντειο Πανεπιστήμιο.
Επιστημονικά υπεύθυνος: Καθηγητής Μ. Μεϊμάρης, Διευθυντής Εργαστηρίου Ομάδα διαχείρισης έργου: Δρ. Α. Γιαννακουλόπουλος, Σ. Κοδέλλας, Ν. Παπασταύρου Έκθεση.
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας: Διοίκηση & Οργάνωση Βιβλιοθηκών.
Ενίσχυση της έρευνας στο “ΕΠ. Εκπαίδευση και δια βίου μάθηση ” Νίκος Μαρούλης, Logotech AE Καρδίτσα 18 Σεπτεμβρίου 2008.
19 ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών Αθήνα, 3-5 Νοεμβρίου 2010, Πάντειον Πανεπιστήμιο. Βιβλιοθήκη-Υπηρεσία Πληροφόρησης Οι υπηρεσίες διαδανεισμού.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΘΕΜΑ «ΤΟ ΕΘΝΙΚΟ ΚΕΝΤΡΟ ΤΕΚΜΗΡΙΩΣΗΣ» ΚΑΝΤΑΡΕΛΗ ΑΙΚΑΤΕΡΙΝΗ.
ΨΗΦΙΑΚΗ ΒΙΒΛΙΟΘΗΚΗ ΕΚΤ
Έργα Ψηφιοποίησης στη Βιβλιοθήκη του Πανεπιστημίου Μακεδονίας Άννα Φράγκου Πρ. Δ/σης Βιβλιοθήκης Παν/μίου Μακεδονίας Digitization Projects at the Library.
Ηλεκτρονική Ενότητα 5: DC λειτουργία – Πόλωση του διπολικού τρανζίστορ
HEAL-Legal Υπηρεσία Νομικής Συμβουλευτικής σε Θέματα Πνευματικής Ιδιοκτησίας που αφορούν στα Ελληνικά Ακαδημαϊκά Ιδρύματα Άννα Φράγκου Πανεπιστήμιο Μακεδονίας.
Διαδικτυακή εφαρμογή ανάλυσης και επεξεργασίας δεδομένων κυβερνητικών διαβουλεύσεωνgov.insight Η. Ζαβιτσάνος, Γ. Γιαννακόπουλος, Γ. Παλιούρας Ινστιτούτο.
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΟΘΗΚΟΝΟΜΙΑΣ Αναζητώντας πρότυπα αλληλεπίδρασης χρηστών για ψηφιακές βιβλιοθήκες Εργασία στο Μάθημα: Ψηφιακές.
Ενιαίο Πλαίσιο Προγράμματος Σπουδών Πληροφορικής.
Ανάκτηση Πληροφορίας (Information Retrieval – IR) Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχ. Η/Υ, Τηλ/νιών & Δικτύων Ακαδημαϊκό Έτος
Πλαίσιο ανάπτυξης ΕΠΣΕ+Τ Διεθνείς τάσεις για την ανοικτή πρόσβαση Διεθνείς πρωτοβουλίες και δράσεις για ανοικτή πρόσβαση Νέες πρακτικές για επιστημονικές.
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
ΜΕΘΟΔΟΙ ΔΙΔΑΣΚΑΛΙΑΣ Δομιστική προσέγγιση (Ι)
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
ΕΥΡΩΠΑΪΚΗ ΒΙΒΛΙΟΘΗΚΗ TEL. ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» n Του καθηγητή Σαράντου Καπιδάκη n των φοιτητών: Βάμβα Ματίνα, Μόσχου Δημητρίου, Βρασταμινού.
«…Έτσι είναι αν έτσι νομίζετε…: Αξιολόγηση των εκπαιδευτικών σεμιναρίων της Βιβλιοθήκης και Κέντρου Πληροφόρησης του Χαροκοπείου Πανεπιστημίου» 17 ο Πανελλήνιο.
CALIS (China Academic Library and Information System) Κοινοπραξία ακαδημαϊκών βιβλιοθηκών της Κίνας Σύστημα παροχής πληροφοριών 1998.
Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Λίνα Μπουντούρη - Μανόλης Γεργατσούλης Ιόνιο Πανεπιστήμιο 15ο Πανελλήνιο Συνέδριο Ακαδημαϊκών.
Εθνικό Κέντρο Τεκμηρίωσης Προβλήματα διαλειτουργικότητας κατά την ταυτόχρονη πρόσβαση σε πηγές μέσω του πρωτοκόλλου Z39.50 & Το περιβάλλον πρόσβασης "Η.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
EContent Στέλιος Πιπερίδης Εθνικός Εκπρόσωπος eContent
Μάθημα 1ο: Εισαγωγή στη Γλωσσική Τεχνολογία
Μελέτη για την Επίδραση των Προγραμμάτων Ψηφιοποίησης στη Διαχείριση και στη Σταθερότητα των Συλλογών με Ιστορικές Φωτογραφίες. Φοιτήτρια: Παγώνη Αποστολία.
ΣΥΓΚΟΜΙΔΗ ΜΕΤΑΔΕΔΟΜΕΝΩΝ (METADATA HARVESTING) ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ - ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ "Διοίκηση & Οργάνωση Βιβλιοθηκών με έμφαση στις.
Οδηγός Αναζήτησης Ιδρυματικού Αποθετηρίου
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΗΣ ΕΙΔΙΚΕΥΣΗΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» «Διοίκηση και Οργάνωση Βιβλιοθηκών.
Οργάνωση πληροφοριών Ταξινόμηση (Θ) Ενότητα 1: Εισαγωγή (α μέρος) Δάφνη Κυριάκη-Μάνεση Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης Το περιεχόμενο.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Βρίσκοντας κατάλληλα αντικείμενα μάθησης:
Οργάνωση πληροφοριών Ταξινόμηση (Θ) Ενότητα 4: Αρχιτεκτονική της Ευρετηρίασης (β μέρος) Δάφνη Κυριάκη-Μάνεση Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης.
ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΕΡΓΑΣΙΑ ΤΑΒ 322: ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ * Πλιατσικούρας Ιωάννης - Β * Πλιατσικούρας Ιωάννης - Β * Κατούνα.
DSpace:ένα ψηφιακό αποθετήριο ανοικτής πρόσβασης Φοιτήτρια : Νικολέττα Μπίζου Μάθημα: Ηλεκτρονική δημοσίευση Διδάσκοντες: Σαράντος Καπιδάκης Μανώλης Γεργατσούλης.
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας «Διοίκηση & Οργάνωση Βιβλιοθηκών.
ΑΣΤΙΚΗ ΙΑΤΡΙΚΗ ΕΥΘΥΝΗ ΕΡΕΥΝΗΤΙΚΑ ΕΥΡΗΜΑΤΑ & ΣΥΣΤΗΜΑ ΑΝΙΧΝΕΥΣΗΣ-ΚΑΤΑΓΡΑΦΗΣ (ICU-MERIS) Αθανάσιος Βοζίκης, Επ. Καθηγ. Οικονομ. & Πληροφορ. Συστημ. Υγείας.
Διεργασίες ψηφιακής επιμέλειας και το πρόγραμμα δράσης της Μονάδας Ψηφιακής Επιμέλειας Πάνος Κωνσταντόπουλος Μονάδα Ψηφιακής Επιμέλειας, Ερευνητικό Κέντρο.
Διοίκηση Τεχνολογίας Εργασία: «Εργαλειακή Προσέγγιση Τεχνολογίας» Πρόγραμμα:MBA Part-Time.
Υπηρεσίες Πληροφόρησης Ενότητα 7: Είδη υπηρεσιών πληροφόρησης – Εξυπηρέτηση (β’ μέρος) Δρ. Ευγενία Βασιλακάκη Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης.
Διοίκηση ολοκληρωμένης επικοινωνιακής στρατηγικής
Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Αθηνών
Συστήματα Θεματικής Πρόσβασης (Θ)
Ηλεκτρονικός κατάλογος ΒΚΠ
Μεταγράφημα παρουσίασης:

Εφαρμογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήματα Αναζήτησης των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών Άννα Μάστορα 1, Μανόλης Πεπονάκης 2, Σαράντος Καπιδάκης 1 1 Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής Δημοσίευσης, Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας, Ιόνιο Πανεπιστήμιο {mastora, 2 Εθνικό Κέντρο Τεκμηρίωσης, Εθνικό Ίδρυμα Ερευνών 21 ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών Οκτωβρίου 2012, Πειραιάς

2 Κίνητρο της έρευνας Έντονη μορφολογία ελληνικής γλώσσας Αυξημένη χρήση της φυσικής γλώσσας στη διατύπωση ερωτημάτων Περιορισμένη χρήση ελεγχόμενου λεξιλογίου Ποικιλομορφία στη διατύπωση του ερωτήματος από τους χρήστες Ερώτημα χρήστη ΕΘΝΙΚΟΙ ΔΡΥΜΟΙ ΕΘΝΙΚΟΣ ΔΡΥΜΜΟΣ ΕΘΝΙΚΟΣ ΔΡΥΜΟΣ εθνικος δρυμος Εθνικός Δρυμός εθνικός δρυμός Εθνικούς Δρυμούς Εθνικούς δρυμούς Εθνικοί δρυμοί Ερώτημα χρήστη ΕΘΝΙΚΟΙ ΔΡΥΜΟΙ ΕΘΝΙΚΟΣ ΔΡΥΜΜΟΣ ΕΘΝΙΚΟΣ ΔΡΥΜΟΣ εθνικος δρυμος Εθνικός Δρυμός εθνικός δρυμός Εθνικούς Δρυμούς Εθνικούς δρυμούς Εθνικοί δρυμοί Ευρετήριο Εθνικοί δρυμοί Εθνικών δρυμών Ευρετήριο Εθνικοί δρυμοί Εθνικών δρυμών

3 Γλωσσικές τεχνολογίες Στοχεύουν ▫Αυτόματη ανάλυση (και ίσως κατανόηση;) & παραγωγή γραπτών ή προφορικών εκφράσεων της φυσικής γλώσσας Πεδία εφαρμογής ▫Διόρθωση ορθογραφικών λαθών, ▫Εκμάθηση γλώσσας υποβοηθούμενη από Η/Υ, ▫Εξαγωγή πληροφορίας, ▫Αυτόματη περίληψη κειμένου, ▫Ανάκτηση πληροφορίας ▫κτλ.

4 Γλωσσικές τεχνολογίες: Ανάκτηση πληροφορίας Αποκατάληξη (stemming) Λημματοποίηση (lemmatisation) Διαχωρισμός λέξεων (tokenisation) Διαχείριση σημείων στίξης & ανεπιθύμητων λέξεων Ορθογραφικός έλεγχος Εντοπισμός συνωνύμων Μορφολογική & συντακτική ανάλυση Αναγνώριση ονοματικών οντοτήτων (Named Entity Recognition) Διαχείριση χαρακτήρων: κεφαλαίων – πεζών, τονούμενων – άτονων

5 Στόχος έρευνας Ανάδειξη πλεονεκτημάτων εφαρμογής γλωσσικών τεχνολογιών ▫Με έμφαση στην ελληνική γλώσσα Καταγραφή της υφιστάμενης κατάστασης αλλά και των προβλημάτων που προκύπτουν από την έλλειψη διαλειτουργικότητας στις εφαρμογές ▫Με έμφαση στα συστήματα αναζήτησης των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών

6 Αντικειμενικοί σκοποί Ανάδειξη αποτελεσμάτων από πειραματικά δεδομένα με εφαρμογή γλωσσικών τεχνολογιών Έρευνα σε Ελληνικές Ακαδημαϊκές Βιβλιοθήκες και Ιδρυματικά Αποθετήρια ▫Συγκριτική προσέγγιση ώστε να διαπιστωθεί η διαλειτουργικότητα

7 Δ εδομένα & εργαλεία πειράματος Διαπιστώθηκε η χρήση διαφορετικών μορφολογικών τύπων της ελληνικής γλώσσας στην υποβολή των ερωτημάτων Διαπιστώθηκε αναντιστοιχία μεταξύ όρων ερωτήματος και όρων ευρετηρίου Αναπτύχθηκε σουίτα εργαλείων ▫Εφαρμογή ad-hoc τεχνολογιών γλωσσικής επεξεργασίας  Διαχείριση τονούμενων-άτονων, διαχείριση σημείων στίξης, μετατροπή χαρακτήρων σε πεζούς ή κεφαλαίους, κτλ ▫Δυνατότητα χρήσης εξωτερικών εργαλείων  Ορθογραφικός έλεγχος (ASpell) -> Βελτίωση* 9,75%  Λημματοποίηση (ilsp_nlp, από το ΙΕΛ) -> Βελτίωση* 16,7% * Βελτίωση θεωρήθηκε η δυνατότητα ανάκτησης αποτελεσμάτων σε ερωτήματα που αρχικά είχαν μηδενικά αποτελέσματα

8 Ερώτημα Εθνικός δρυμός Εθνικος δρυμος ΕΘΝΙΚΟΣ ΔΡΥΜΟΣ ΕΘΝΙΚΟΣ ΔΡΥΜΜΟΣ Εθνικοί δρυμοί Εθνικούς δρυμούς Ερώτημα Εθνικός δρυμός Εθνικος δρυμος ΕΘΝΙΚΟΣ ΔΡΥΜΟΣ ΕΘΝΙΚΟΣ ΔΡΥΜΜΟΣ Εθνικοί δρυμοί Εθνικούς δρυμούς Ορθογραφικός έλεγχος Εθνικός δρυμός ΕΘΝΙΚΌΣ ΔΡΥΜΌΣ Εθνικοί δρυμοί Εθνικούς δρυμούς Ορθογραφικός έλεγχος Εθνικός δρυμός ΕΘΝΙΚΌΣ ΔΡΥΜΌΣ Εθνικοί δρυμοί Εθνικούς δρυμούς Λημματοποίηση ΕΘΝΙΚΌΣ ΔΡΥΜΌΣ Εθνικός δρυμός Λημματοποίηση ΕΘΝΙΚΌΣ ΔΡΥΜΌΣ Εθνικός δρυμός Κεφαλαία Άτονα ΕΘΝΙΚΟΣ ΔΡΥΜΟΣ Κεφαλαία Άτονα ΕΘΝΙΚΟΣ ΔΡΥΜΟΣ Κεφαλαία Άτονα ΕΘΝΙΚΟΣ ΔΡΥΜΟΣ Κεφαλαία Άτονα ΕΘΝΙΚΟΣ ΔΡΥΜΟΣ Όροι ευρετηρίου Εθνικοί δρυμοί Εθνικών δρυμών Όροι ευρετηρίου Εθνικοί δρυμοί Εθνικών δρυμών Λημματοποίηση Εθνικός δρυμός Λημματοποίηση Εθνικός δρυμός Αντιστοιχία ερωτήματος με όρους ευρετηρίου Μη εφαρμογή ΤΓΕ Αντιστοιχία ερωτήματος με όρους ευρετηρίου Λημματοποίηση είναι η αναγωγή ενός όρου στον πρώτο κλιτικό του τύπο. Πρόκειται, επί της ουσίας, για τη μορφή του όρου όπως συναντάται στα ερμηνευτικά λεξικά.

9 Συμπεράσματα εφαρμογής ΤΓΕ Οι διαφορετικοί κλιτικοί τύποι ενός όρου μπορεί να επηρεάσουν σημαντικά την απόδοση της ανάκτησης πληροφορίας Εκ πρώτης όψης οι ΕΤΓΕ φαίνεται να είναι κάτι που μπορεί να βοηθήσει πολύ, ωστόσο, δεν υπάρχει ουσιαστική χρήση τους από τα συστήματα αναζήτησης ελληνικού περιεχομένου Δεδομένης της ύπαρξης εργαλείων και τεχνικών που θα μπορούσαν να συμβάλουν αποφασιστικά στην ανάπτυξη των υπηρεσιών αναζήτησης είναι σημαντικό να διερευνηθούν οι δυνατότητες συνέργιας στο πλαίσιο διεπιστημονικής προσέγγισης του θέματος

10 Οι γλωσσικές τεχνολογίες στα συστήματα αναζήτησης των Ακαδημαϊκών Βιβλιοθηκών Επιλέξαμε: εκείνα τα ιδρύματα που είχαν δημόσιο κατάλογο (OPAC) και διέθεταν επίσης Ιδρυματικό Αποθετήριο Εξετάσαμε: τα συστήματα αναζήτησης των παραπάνω ιδρυμάτων ώστε να καταγραφεί η κατάσταση σχετικά με την εφαρμογή Τεχνολογιών Γλωσσικής Επεξεργασίας

11 Κατανομή συστημάτων που εξετάστηκαν

12 OPACs και Εφαρμογές Τεχνολογιών Γλωσσικής Επεξεργασίας

13 Ιδρυματικά Αποθετήρια και Εφαρμογές Τεχνολογιών Γλωσσικής Επεξεργασίας

14 Συμπεράσματα ΕΓΤΕ σε συστήματα Ελληνικών Ακαδημαϊκών Βιβλιοθηκών Τα συστήματα αναζήτησης των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών εφαρμόζουν σε περιορισμένη έκταση γλωσσικές τεχνολογίες ▫τονούμενα-άτονα  διαφορετικές πολιτικές τόσο μεταξύ των συστημάτων κάθε ιδρύματος όσο και των ιδρυμάτων μεταξύ τους ▫κεφαλαία-πεζά  όλα τα συστήματα αναζήτησης (OPACs & Αποθετήρια) εξισώνουν κεφαλαία-πεζά  Εξαίρεση: το τελικό σίγμα «ς»: μη εξίσωση τού «ς» με το «Σ» ή το «σ» για τους OPACs των βιβλιοθηκών Α, Δ, ΣΤ, Η και στο Αποθετήριο Ε

Επισήμανση! Η εξίσωση κεφαλαίων-πεζών ή τονούμενων- άτονων χαρακτήρων δεν αποτελεί (πάντοτε) ζητούμενο (τονικά παρώνυμα κτλ.) ▫Αθήνα – Αθηνά ▫τσίπουρα – τσιπούρα ▫γέρος – γερός ▫νόμος - νομός ▫Μαργαρίτα – μαργαρίτα 15

16 Συμπεράσματα: σύνοψη Οι γλωσσικές τεχνολογίες μπορούν να έχουν θετικά αποτελέσματα για την ανάκτηση πληροφοριών από τα συστήματα αναζήτησης ▫Ώστε να διευκολύνουν το χρήστη στην αναζήτηση  Όπως έδειξαν τα αποτελέσματα της έρευνάς μας, η λημματοποίηση μπορεί να παίξει καθοριστικό ρόλο στην ανάκτηση ελληνικού περιεχομένου Είναι πολύ σημαντική η χρήση κοινών πολιτικών ώστε να επιτυγχάνεται διαλειτουργικότητα ▫Διαφορετικά, ο χρήστης βρίσκεται στην ίδια (δύσκολη) θέση όπως και χωρίς την εφαρμογή ΤΓΕ

17 Μελλοντική έρευνα Είναι αναγκαία η χρήση (δοκιμή) των εργαλείων και τεχνικών ΕΤΓΕ σε μεγάλο όγκο δεδομένων ελληνικού περιεχομένου  Ανάγκη απόκτησης δεδομένων και από ελληνικούς φορείς για επιβεβαίωση των πειραματικών δεδομένων Δοκιμή περισσότερων εργαλείων και πιο εκλεπτυσμένων τεχνικών για πιο στοχευμένη ερμηνεία της πρόθεσης του χρήστη (query intent) ▫Μορφοσυντακτική ανάλυση ▫Αναγνώριση ονοματικών οντοτήτων ▫Εντοπισμός συνωνύμων, κτλ. Μελέτες συμπεριφοράς χρηστών για εξαγωγή- επιβεβαίωση μοντέλων αναζήτησης πληροφορίας

18 H παρούσα έρευνα έχει συγχρηματοδοτηθεί από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο - ΕΚΤ) και από εθνικούς πόρους μέσω του Επιχειρησιακού Προγράμματος Εκπαίδευση και Δια Βίου Μάθηση» του Εθνικού Στρατηγικού Πλαισίου Αναφοράς (ΕΣΠΑ) – Ερευνητικό Χρηματοδοτούμενο Έργο: Ηράκλειτος ΙΙ. Επένδυση στην κοινωνία της γνώσης μέσω του Ευρωπαϊκού Κοινωνικού Ταμείου.