Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεUlysses Pappas Τροποποιήθηκε πριν 9 χρόνια
1
Γλωσσική Τεχνολογία Μάθημα 5 ο Επεξεργασία Κειμένου και Δεικτοδότηση Σοφία Στάμου Άκ.Έτος 2009-10
2
28/3/2015 Γλωσσική Τεχνολογία2 Ευρετηρίαση με Χρήση Θησαυρών Θησαυρός: ιεραρχική λίστα ελεγχόμενου λεξιλογίου που χρησιμοποιείται για την περιγραφή και την αναζήτηση δεδομένων κειμένου Προτυποποιεί τη μορφή και τη σημασία των όρων ευρετηρίασης ώστε να διασφαλίσει πως μια έννοια ή κατηγορία θα χρησιμοποιείται πάντα με ενιαίο τρόπο στο ευρετήριο
3
28/3/2015 Γλωσσική Τεχνολογία3 Παράδειγμα Ελεγχόμενου Λεξιλογίου KingdomPhylumClassOrderFamilyGenusSpecies Animalia Chordata Mammalia Carnivora Canidae Canis C. familiari Linnaeus … Ιεραρχική δομή σημασιολογικής οργάνωσης όρων SegmentFamilyClassCommodity 44-Office Equipment and Accessories and Supplies.12-Office Supplies.17-Writing Instruments.05-Mechanical pencils.06-Wooden pencils.07-Colored pencils UNSPSC …
4
28/3/2015 Γλωσσική Τεχνολογία4 Βασικές Αρχές Ελεγχόμενων Λεξιλογίων 1. Επίλυση αμφισημίας 2. Έλεγχος συνωνύμων 3. Καθορισμός σημασιολογικών συσχετίσεων μεταξύ των περιεχόμενων όρων 4. Έλεγχος και αξιολόγηση όρων
5
28/3/2015 Γλωσσική Τεχνολογία5 Τύποι Συσχετίσεων Ισοδυναμίας Ιεραρχικές Συσχετισμού Διευκρινιστικές σημειώσεις (για το εύρος κάλυψης)
6
28/3/2015 Γλωσσική Τεχνολογία6 Χρησιμότητα Θησαυρών Ευρετηρίαση κειμένων με κοινά αποδεκτούς όρους Οργάνωση δομής και περιεχομένου κειμένων Αναζήτηση με λέξεις-κλειδιά αυτόματα ή διαδραστικά Ανάκτηση δεδομένων Φυλλομέτρηση δεδομένων Διαχειριστές Απλοί χρήστες Εφαρμογή σε προσυνδυασμένα ευρετήρια, ταξινομικά συστήματα και ιεραρχικούς καταλόγους
7
28/3/2015 Γλωσσική Τεχνολογία7 Τύποι Λεξιλογίου Τύπος Λεξιλογίου πολ/τα ΠεριγραφήΤύπος Συσχέτισης Λίστα όρων1 Απλή λίστα όρων χωρίς εσωτερική δομή ή συσχετίσεις Κανείς Κύκλοι συνωνύμων 2 Λίστες με σύνολα όρων που θεωρούνται ισοδύναμοι. Χρησιμοποιούνται ευρέως σε λογισμικό αναζήτησης Ισοδυναμία Authority Files3 Λίστες ονομάτων για γνωστές οντότητες– άνθρωποι, οργανισμοί, βιβλία, κτλ. Αναφορά Ιεραρχικά Σχήματα 4 Ιεραρχική οργάνωση εννοιώνΧαλαρή ιεραρχία Θησαυροί5 Ιεραρχική οργάνωση εννοιών και υποστήριξη πληροφορίας για πρόσθετους, μη-ιεραρχικούς όρους. Συσχετίσεις όρων “Is-a” Ιεραρχία και χαλαρές συσχετίσεις Στην πράξη σπάνια διαχωρίζονται
8
28/3/2015 Γλωσσική Τεχνολογία8 Έλεγχος Λεξιλογίου Μη ελεγχόμενο – ο καθένας μπορεί να προσθέσει όρους. Απουσία συνοχής. Πολλαπλές λίστες όρων με πλεονασμό Διαχειρίσιμο – το λογισμικό διασφαλίζει τη συνοχή στους όρους των λιστών. Ο καθένας μπορεί να προσθέσει όρους αρκεί να υπόκεινται στην αρχή της διατήρησης συνοχής. (π.χ. File System Hierarchy) Ελεγχόμενο – σαφώς περιγεγραμμένη διαδικασία για την ανανέωση του θησαυρού. Λίγοι έχουν την εξουσιοδότηση να τροποποιήσουν τη λίστα των όρων. Συνδομή λογισμικού όμως την κύρια ευθύνη έχει ο άνθρωπος
9
28/3/2015 Γλωσσική Τεχνολογία9 Ποιος ο αναγκαίος βαθμός ελέγχου; Τα ελεγχόμενα λεξιλόγια Δεν είναι πάντα αναγκαία Ο έλεγχος έχει κόστος, όμως μειώνοντας την ποικιλία αυξάνουμε την ποιότητα Είναι ένα καλά ελεγχόμενο λεξιλόγιο; Όχι! είναι μη ελεγχόμενη, αλλά καλά διαχειρίσιμη λίστα όρων Source: http://del.icio.us/tag/
10
28/3/2015 Γλωσσική Τεχνολογία10 Κύκλοι Συνωνύμων Λίστα ακριβώς ή σχεδόν συνώνυμων όρων που ο ένας μπορεί να αντικαταστήσει τον άλλο κατά την ανάκτηση
11
28/3/2015 Γλωσσική Τεχνολογία11 Κύκλοι Συνωνύμων - Παράδειγμα Συνήθως έχουν τη μορφή συνόλου από λίστα όρων που επιτρέπουν στους χρήστες να προσπελάσουν το περιεχόμενο των κειμένων που περιλαμβάνουν οποιονδήποτε από τους όρους της λίστας Π.χ., cholesterol: Cholesterol Blood Cholesterol Serum Cholesterol Good Cholesterol Bad Cholesterol LDL. Χρησιμοποιούνται από συστήματα που δεν ευρετηριοποιούν το περιεχόμενο ή δεν υποστηρίζουν ευρετηρίαση ελεγχόμενου λεξιλογίου
12
28/3/2015 Γλωσσική Τεχνολογία12 Χρησιμότητα κύκλων συνωνύμων Χρησιμοποιούνται για τη διεύρυνση ερωτημάτων Χρησιμοποιούνται από συστήματα που διατηρούν το περιεχόμενο ευρετηρίασης σε μη- δομημένη μορφή φυσικής γλώσσας Χρησιμοποιούνται σε μηχανές αναζήτησης και παρέχουν ένα ελάχιστο σημείο ελέγχου της ποικιλίας του λεξιλογίου των φυσικών γλωσσών
13
28/3/2015 Γλωσσική Τεχνολογία13 Μέθοδοι Δημιουργίας Θησαυρού Απαγωγική: Επεξεργασία των όρων που υπάρχουν στα κείμενα από υπάρχοντα ευρετήρια, λεξικά, ταξινομίες και καταρτίζοντας λίστες όρων από ειδικούς στο γνωστικό αντικείμενο Επαγωγική: Εξαγωγή όρων από σώματα κειμένων με τη σειρά εμφάνισής τους. Δημιουργία θησαυρού από τους στενότερους προς τον ευρύτερους όρους Συνήθως χρησιμοποιούμε συνδυασμό και των δύο
14
28/3/2015 Γλωσσική Τεχνολογία14 Κανόνες επιλογής λεξιλογίου Αυξητική και επεκτάσιμη διαδικασία όπου καθορίζονται οι δημιουργοί και οι χρήστες Εύκολη υλοποίηση με δυνατότητα μέτρησης και αξιολόγησης των αποτελεσμάτων Όχι μονολιθικό – να διατηρεί facets (οπτικές γωνίες) Να ενημερώνεται και να ανανεώνεται τακτικά Γιατί να υποστηρίζει facets;
15
28/3/2015 Γλωσσική Τεχνολογία15 Πλεονεκτήματα Faceted Θησαυρών Εύκολη δημιουργία Χρησιμοποιούνται υπάρχουσες ταξινομίες Μειωμένο κόστος συντήρησης Επαναχρησιμοποιήση δεδομένων Διευκολύνεται η πλοήγηση στους όρους του μέσω κατάλληλης διεπαφής 60 κόμβοι 24.000 συνδυασμοί
16
Η νέα γενιά συστημάτων θεματικής πρόσβασης Πρόσβαση σε ηχητικά δεδομένα (αρχεία μουσικής)
17
28/3/2015 Γλωσσική Τεχνολογία17 Video για οδηγίες και ανάλυση Μουσικών Ψηφιακών Αρχείων
18
28/3/2015 Γλωσσική Τεχνολογία18 Εργαλείο συντήρησης ελεγχόμενου λεξιλογίου
19
28/3/2015 Γλωσσική Τεχνολογία19 Εργαλείο επισημείωσης
20
28/3/2015 Γλωσσική Τεχνολογία20 IN Harmony (Faceted Browse)
21
28/3/2015 Γλωσσική Τεχνολογία21 IN Harmony (Indiana Item Display)
22
28/3/2015 Γλωσσική Τεχνολογία22 Ποικιλία λεξιλογίων
23
28/3/2015 Γλωσσική Τεχνολογία23 Ο ρόλος του ελεγχόμενου λεξιλογίου Υποβοηθά την ευρετηρίαση Παρέχει γειτνίαση παρόμοιων κειμένων Διευκολύνει την πλοήγηση Διευρύνει τα ερωτήματα των χρηστών
24
28/3/2015 Γλωσσική Τεχνολογία24..... http://www.dblab.upatras.gr/gr/GlwssikiTexnologia.html
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.