Γλωσσική Τεχνολογία Μάθημα 8 ο Γλώσσα και Ανάκτηση Πληροφορίας Σοφία Στάμου Άκ.Έτος 2009-10.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Μάθημα 3ο Επεξεργασία Κειμένου και Δεικτοδότηση
Advertisements

Βασικές έννοιες αλγορίθμων
Τ.Ε.Ι ΜΕΣΟΛΛΟΓΓΙΟΥ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΑ ΘΕΜΑ:«ΣΥΣΤΗΜΑ ΗΜΙ-ΑΥΤΟΜΑΤΗΣ ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗΣ ΠΕΡΙΕΧΟΜΕΝΟΥ.
Copyright ©: SAMSUNG & Samsung Hope for Youth. Με επιφύλαξη κάθε νόμιμου δικαιώματος Εκπαιδευτικό υλικό Το Internet: Αναζητήσεις στο διαδικτύο.
Οδηγίες Χρήσης της Δυνατότητας Σύνθετης Αναζήτησης στην Βάση Δεδομένων Νομοθεσίας του ΣΑΤΕ.
Συλλογές, Στοίβες και Ουρές Σε πολλές εφαρμογές μας αρκεί η αναπαράσταση ενός δυναμικού συνόλου με μια δομή δεδομένων η οποία δεν υποστηρίζει την αναζήτηση.
ΚΕΙΜΕΝΟ  Ο πρώτος τρόπος απεικόνισης πληροφορίας (και βασικός ως σήμερα).  Αδυναμία πρώτων υπολογιστών να χειριστούν άλλη μορφή πληροφορίας.  Πρόβλημα.
Επιμέλεια: Δέγγλερη Σοφία
Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.
1 Μηχανές αναζήτησης στον Παγκόσμιο Ιστό Search Engines.
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
Support.ebsco.com Εισαγωγή στο EBSCOhost Εκπαιδευτικό μάθημα.
Σελ. 1 Ε.2.2 Υπηρεσίες – Λειτουργία Helpdesk Καταχώρηση και παρακολούθηση αιτημάτων μέσω web Ε Καταχώρηση αιτημάτων υποστήριξης.
Η Θεματική Ταξινόμηση και η Συμβολή της στην Αναζήτηση Ευρωπαϊκών Κοινωνικών Δεδομένων.
 Αυδίκου Χριστίνα  Γιουμούκης Παναγιώτης  Κιντσάκης Θάνος  Πάπιστας Γιάννης.
Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας.
Ανάκτηση Πληροφορίας Το Boolean μοντέλο.
Resource Description Framework
Μηχανική Μάθηση και Εξόρυξη Γνώσης
Εφαρμογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήματα Αναζήτησης των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών Άννα Μάστορα 1, Μανόλης Πεπονάκης 2, Σαράντος.
Αναγνώριση Προτύπων.
Μοντέλο Διδασκαλίας Φυσικών Επιστήμων, για την Υποχρεωτική Εκπαίδευση, στην Κατεύθυνση της Ανάπτυξης Γνώσεων και Ικανοτήτων. Π. Κουμαράς.
Μάθημα 2ο Επεξεργασία Κειμένου και Δεικτοδότηση
ΑΠΕΙΚΟΝΙΣΗ ΕΝΝΟΙΩΝ 1. 2 Χρήστης Στόχος Ταμίας διενέργεια πώλησης διενέργεια ενοικίασης εισαγωγή ταμείου εξαγωγή ταμείου * 1 Μοντέλο Πεδίου Προβλήματος.
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr
Οργάνωση πληροφοριών Ευρετηρίαση Μέρος Β Σχεδιασμός ευρετηρίων.
Κεφ.1 Εισαγωγη στην εννοια του Αλγοριθμου και στον Προγραμματισμο
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
Γλωσσική Τεχνολογία Μάθημα 4 ο Επεξεργασία Κειμένου και Δεικτοδότηση Σοφία Στάμου Άκ.Έτος
ΗΥ302 Διδακτική της Πληροφορικής Η γλώσσα προγραμματισμού LOGO Writer Ομάδα Εργασία: Αλεβίζου Βασιλική (Α.Μ.:1029) Κοφφινά Ιωάννα (Α.Μ.:1035) Τριανταφυλλίδου.
Λεξικολογία-Λεξικογραφία
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
Γλωσσική Τεχνολογία Μάθημα 5 ο Επεξεργασία Κειμένου και Δεικτοδότηση Σοφία Στάμου Άκ.Έτος
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΜΕ ΘΕΜΑ: A Comparison of Methodic Segmentation Techniques for.
E X a M p L e Αξιοποιώντας την τεχνολογία XML στη διαχείριση της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών.
Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Λίνα Μπουντούρη - Μανόλης Γεργατσούλης Ιόνιο Πανεπιστήμιο 15ο Πανελλήνιο Συνέδριο Ακαδημαϊκών.
Σχεδίαση Αλγορίθμων. Διεργασίες (1/2) Μία διεργασία αλληλεπιδρά με το περιβάλλον της δεχόμενη είσοδο και παράγοντας έξοδο.
ΣΥΣΤΗΜΑΤΑ ΠΟΛΥΜΕΣΩΝ Εισηγητής: Δρ. Αθανάσιος Νικολαΐδης.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
Ειδική Ημερίδα για Ανάκτηση και Εξαγωγή Πληροφορίας Ειδική Ημερίδα για Ανάκτηση και Εξαγωγή Πληροφορίας Συζήτηση στρογγυλής τραπέζης.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΝΟΜΙΑΣ - ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Πρόγραμμα Μεταπτυχιακών Σπουδών: Διοίκηση & Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες.
6/12/2012 Παρουσίαση: Μιμηγιάννης Δημήτρης
Επικοινωνία (communicating) Δεξιότητες Επιστημονικής Μεθόδου.
Δομές Αναζήτησης TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A Θέλουμε να υποστηρίξουμε δύο βασικές λειτουργίες:
Κλασσικά Μοντέλα Ανάκτησης Πληροφορίας Βασική πηγη το βιβλίο και οι διαφάνειες R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval, Addison Wesley,
RSS FEEDS Εισαγωγικά θέματα WWW ΠΑΝΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΜΣ:ΔΥΝΗΤΙΚΕΣ ΚΟΙΝΟΤΗΤΕΣ, ΚΟΙΝΩΝΙΟΨΥΧΟΛΟΓΙΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ ΚΑΙ ΤΕΧΝΙΚΕΣ ΕΦΑΡΜΟΓΕΣ ΕΞΑΜΗΝΟ: Α΄
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΑΛΓΟΡΙΘΜΩΝ
Οργάνωση πληροφοριών Ταξινόμηση (Θ) Ενότητα 11: Τύποι Ευρετηρίων Δάφνη Κυριάκη-Μάνεση Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης Το περιεχόμενο.
Δομές Δεδομένων 1 Θέματα Απόδοσης. Δομές Δεδομένων 2 Οργανώνοντας τα Δεδομένα  Η επιλογή της δομής δεδομένων και του αλγορίθμου επηρεάζουν το χρόνο εκτέλεσης.
Ανάκτηση Πληροφορίας 1 Multimedia IR Multimedia IR Δεικτοδότηση και Αναζήτηση.
1Κεφάλαιο 4 Κανόνες Σύνταξης HTML Όλες οι ετικέτες εσωκλείονται μεταξύ των χαρακτήρων “ “. Κάθε τι που βρίσκεται μεταξύ των χαρακτήρων “ ”, αποτελεί σχόλιο.
Τεχνολογία ΛογισμικούSlide 1 Εξειδίκευση Βασισμένη σε Μοντέλο u Τυπική εξειδίκευση λογισμικού με ανάπτυξη μαθηματικού μοντέλου για το σύστημα.
Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 1 Βάσεις Διαδικτύου.
Τεχνολογία ΛογισμικούSlide 1 Τεχνολογία Απαιτήσεων u Καθορίζει τι θέλει ο πελάτης από ένα σύστημα λογισμικού.
Εισαγωγή στην Έννοια του Αλγορίθμου και στον Προγραμματισμό
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
 Στόχος της παρουσίασης αυτής είναι η εξοικείωση με τον Ηλεκτρονικό Κατάλογο της Βιβλιοθήκης προκειμένου να αναζητήσουμε ένα τεκμήριο από τη συλλογή.
ΑΛΓΟΡΙΘΜΟΣ ΠΡΟΒΛΗΜΑ ΑΛΓΟΡΙΘΜΟΣ ΛΥΣΗ
Μεθοδολογία Έρευνας Διάλεξη 5η: Δειγματοληψία
Μεθοδολογία Έρευνας Διάλεξη 5η: Δειγματοληψία
ΦΑΣΕΙΣ ΕΠΙΛΥΣΗΣ ΠΡΟΒΛΗΜΑΤΟΣ – ΑΝΑΠΤΥΞΗΣ ΠΡΟΓΡΑΜΜΑΤΟΣ
Βασικές έννοιες αλγορίθμων
Β.ΕΠΑΛ-Γενικής Παιδείας  ΜΑΘΗΜΑ: Εισαγωγή στης αρχές Επιστήμης των Η/Υ  ΚΕΦΑΛΑΙΟ 4: Γλώσσες Αναπαράστασης Αλγορίθμων  ΕΝΟΤΗΤΑ 4.2: Δομή Ακολουθίας 
Μεθοδολογία Έρευνας Διάλεξη 5η: Δειγματοληψία
ΠΛΗΡΟΦΟΡΙΚΗ Γ΄ Γυμνασίου Α΄ Τρίμηνο
Εννοιολογική Χαρτογράφηση
Μάθημα 6ο Ανάλυση Κειμένου και Δεικτοδότηση
Μάθημα 9ο Επεξεργασία Κειμένου
ΟΜΟΙΟΠΤΩΤΟΙ ΟΝΟΜΑΤΙΚΟΙ ΠΡΟΣΔΙΟΡΙΣΜΟΙ
Μεταγράφημα παρουσίασης:

Γλωσσική Τεχνολογία Μάθημα 8 ο Γλώσσα και Ανάκτηση Πληροφορίας Σοφία Στάμου Άκ.Έτος

15/4/2015 Γλωσσική Τεχνολογία2 Ανάκτηση Πληροφορίας Μελέτη μη δομημένων δεδομένων κείμενο, εικόνες, ήχος, video Τα δεδομένα δεν έχουν δομή όταν: η δομή είναι άγνωστη η σημασία του κάθε στοιχείου είναι άγνωστη Τα συστήματα ανάκτησης πληροφορίας επεξεργάζονται στατιστικά τα δεδομένα

15/4/2015 Γλωσσική Τεχνολογία3 Συστήματα Ανάκτησης vs. RDBMS RDBMS Καλά ορισμένη σημασιολογία των αντικειμένων Σύνθετη γλώσσα ερωτημάτων Ακρίβεια ανάκτησης της πληροφορίας που αναζητείται Έμφαση στην απόδοση ΣΥΣΤΗΜΑ ΑΝΑΚΤΗΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Όχι καλά ορισμένη η σημασιολογία αντικειμένων Απλή γλώσσα ερωτημάτων Αναγκαία η ακρίβεια στην ανάκτηση ακόμη κι αν το ερώτημα δεν είναι σαφές Έμφαση στην αποτελεσματικότητα

15/4/2015 Γλωσσική Τεχνολογία4 Ορολογία Ανάκτησης ΚΕΙΜΕΝΟ Αντικείμενο πληροφορίας με άγνωστη δομή Tο format μπορεί να είναι γνωστό, αλλά η σύνταξη και η σημασιολογία όχι ΣΩΜΑ ΚΕΙΜΕΝΩΝ Ένα ή περισσότερα κείμενα σε τυχαία σειρά Oνομάζεται και συλλογή κειμένων ή βάση δεδομένων με κείμενα ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ Παραπάνω του ενός σώματα κειμένων

15/4/2015 Γλωσσική Τεχνολογία5 Ανάκτηση Πληροφορίας Αναζήτηση σε μια συλλογή των κειμένων που ικανοποιούν μια πληροφοριακή ανάγκη (σχετικά κείμενα)

15/4/2015 Γλωσσική Τεχνολογία6 Ανάκτηση Πληροφορίας στο Web Web: “high Precision/low Recall” Τα περισσότερα ερωτήματα αναζητούν μία απάντηση Ένα μόνο σχετικό κείμενο ή ελάχιστα αρκούν (low Recall) Από όλα τα κείμενα που σχετίζονται με ένα ερώτημα, αυτά που επιστρέφονται πρώτα πρέπει να το ικανοποιούν με τη μέγιστη ακίβεια (high Precision) Μια απλή ταύτιση των όρων του ερωτήματος με τους όρους του κειμένου μπορεί να έχει καλή απόδοση

15/4/2015 Γλωσσική Τεχνολογία7 Διεργασίες Ανάκτησης

15/4/2015 Γλωσσική Τεχνολογία8 Αναπαράσταση Κειμένου Δεικτοδότηση κειμένου με χρήση λέξεων- κλειδιών Οι λέξεις-κλειδιά αναπαριστούν το περιεχόμενα του κειμένου Για κάθε λέξη-κλειδί επιστρέφονται τα κείμενα που την περιέχουν (ένα ή περισσότερα) Ορολογία: δεικτοδότηση, αναπαράσταση

15/4/2015 Γλωσσική Τεχνολογία9 Αναπαράσταση Κειμένου Τι βλέπει ο χρήστης

15/4/2015 Γλωσσική Τεχνολογία10 Αναπαράσταση Κειμένου Τι βλέπει η εφαρμογή

15/4/2015 Γλωσσική Τεχνολογία11 Tokenization Η διαδικασία διαχωρισμού μιας ακολουθίας χαρακτήρων σε μια ακολουθία συμβόλων Κάθε σύμβολο τις περισσότερες φορές αντιπροσωπεύει μια λέξη Η αναγνώριση συμβόλων είναι μια σχετικά απλή διαδικασία (εξετάζει τα κενά, tabs, line breaks, etc.)

15/4/2015 Γλωσσική Τεχνολογία12 Επεξεργασία Markup Markup: μετα-δεδομένα που υποδεικνύουν τη δομή και την παρουσίαση ενός κειμένου HMTL example:,,, … Latex example: \section, \subsebction, \... Markup: μας πληροφορεί για την ερμηνεία κάθε συμβόλου John Smith April 18, 1006

15/4/2015 Γλωσσική Τεχνολογία13 Επεξεργασία Markup Markup: δε θεωρείται μέρος του κειμένου Το ίδιο κείμενο μπορεί να περιγράφεται από διαφορετικά μετα-δεδομένα χωρίς αυτά να αλλάζουν το σημασιολογικό του περιεχόμενο

15/4/2015 Γλωσσική Τεχνολογία14 Επεξεργασία Markup

15/4/2015 Γλωσσική Τεχνολογία15 Αναπαράσταση Κειμένου Αφού αφαιρέσουμε τα μετα-δεδομένα (markup), απομένει καθαρό κείμενο

15/4/2015 Γλωσσική Τεχνολογία16 Αναπαράσταση Κειμένου Το καθαρό κείμενο δεν είναι χρήσιμο στις περισσότερες εφαρμογές Επόμενο βήμα: αναπαράσταση κειμένου Στόχος: αναπαράσταση της δομής Στόχος: αναπαράσταση του περιεχομένου

15/4/2015 Γλωσσική Τεχνολογία17 Αναπαράσταση Δομής Bag of Words: η πιο απλή μορφή αναπαράστασης Κείμενο = Bag: περιλαμβάνει τα σύμβολα (λέξεις) Η ίδια λέξη μπορεί να περιέχεται πολλές φορές στο ίδιο bag Η σειρά εμφάνισης των λέξεων αγνοείται Μοντέλο Διανυσματικού χώρου Κείμενο = διάνυσμα Κάθε διάσταση αναπαριστά μια λέξη-κλειδί Η τιμή μιας διάστασης αντιπροσωπεύει τη σχετικότητα

15/4/2015 Γλωσσική Τεχνολογία18 Αναπαράσταση Περιεχομένου Χρησιμοποιούμε ένα σύνολο προσδιοριστών από μια προ-καθορισμένη λίστα Δεικτοδότηση ελεγχόμενου λεξιολογίου Χρησιμοποιούμε μερικές λέξεις ή φράσεις που επιλέγουμε από το κείμενο Δεικτοδότηση ελεύθερου κειμένου Χρησιμοποιούμε όλες τις λέξεις και τις φράσεις του κειμένου Δεικτοδότηση πλήρους κειμένου

15/4/2015 Γλωσσική Τεχνολογία19 Ελεγχόμενο Λεξιλόγιο

15/4/2015 Γλωσσική Τεχνολογία20 Παράδειγμα κειμένου

15/4/2015 Γλωσσική Τεχνολογία21 Δεικτοδότηση Ελεγχόμενου Λεξιλογίου

15/4/2015 Γλωσσική Τεχνολογία22 Δεικτοδότηση Πλήρους Κειμένου

15/4/2015 Γλωσσική Τεχνολογία23 Δεικτοδότηση Πλήρους Κειμένου Οι λέξεις του κειμένου είναι οι καταλληλότεροι όροι δεικτοδότησης με διαφορετικό βαθμό καταλληλότητας η καθεμιά Μερικές λέξεις μπορεί να είναι μορφολογικοί τύποι άλλων

15/4/2015 Γλωσσική Τεχνολογία24 Δεικτοδότηση Πλήρους Κειμένου

15/4/2015 Γλωσσική Τεχνολογία25 Τερματικοί Όροι Δε χρησιμεύουν για την αναπαράσταση κειμένου Σύνδεσμοι, μόρια, άρθρα,.... Λέξεις με μεγάλη συχνότητα εμφάνισης Γιατί να τους αγνοήσουμε; Μειώνεται το μέγεθος του ευρετηρίου Βελτιωμένη απόδοση των αλγορίθμων ανάκτησης Η απαλοιφή τερματικών όρων μπορεί να δυσκολέψει την απάντηση ορισμένων ερωτημάτων (to be or not to be)

15/4/2015 Γλωσσική Τεχνολογία26 Δεικτοδότηση Πλήρους Κειμένου (χωρίς τερματικούς όρους)

15/4/2015 Γλωσσική Τεχνολογία27 Δεικτοδότηση Πλήρους Κειμένου (μορφολογία)

15/4/2015 Γλωσσική Τεχνολογία28 Μορφολογία Οι μορφολογικοί τύποι των λέξεων συνοψίζονται σε μια ενιαία αναπαράσταση Λήμμα Μορφολογική ρίζα Λήμμα: Κανονικοποίηση Μορφολογική ρίζα: αποκατάληξη

15/4/2015 Γλωσσική Τεχνολογία29 Αποκατάληξη Ομαδοποίηση μορφολογικών τύπων Καλύτερη απόδοση ανάκτησης από την ταυτοποίηση αλφαριθμητικών Η αυτόματη αποκατάληξη μπορεί να δώσει λάθη “police”, “policy”  “polic”

15/4/2015 Γλωσσική Τεχνολογία30 Ο αλγόριθμος αποτακάληξης Porter Στηρίζεται στην ακολουθία φωνηέντων - συμφώνων Το μέτρο m για μια μορφολογική ρίζα είναι: [C](VC) m [V] C είναι η ακολουθία συμφώνων V είναι η ακολουθία φωνηέντων [ ] υποδηλώνει το προαιρετικό m=0 TR, EE, TREE, Y, BY m=1 TROUBLE, OATS, TREES, IVY m=2 TROUBLES, PRIVATE, OATEN, ORRERY

15/4/2015 Γλωσσική Τεχνολογία31 Ο αλγόριθμος αποτακάληξης Porter Στηρίζεται σε ένα σύνολο κανόνων Οι κανόνες αποτελούνται από διαδοχικά βήματα Step 1a: sses  ss, ies  i, s  NULL caresses  caress, ponies  poni, cats  cat Step 1b: if m>0, eed  ee agreed  agree

15/4/2015 Γλωσσική Τεχνολογία32 Παράδειγμα Αποκατάληξης Αρχικό κείμενο Marketing strategies carried out by the US companies for their agricultural chemicals, report predictions…. Porter stemmer (χωρίς τερματικούς όρους) market stateg carr compan agricultur chemic report predic….

15/4/2015 Γλωσσική Τεχνολογία33 Δεικτοδότηση πλήρους κειμένου (αποκατάληξη)

15/4/2015 Γλωσσική Τεχνολογία34 Θέματα δεικτοδότησης Κόστος επιλογής όρων δεικτοδότησης Αναπαράσταση ελεγχόμενου λεξιλογίου = μεγάλο κόστος Αναπαράσταση πλήρους κειμένου = μικρό κόστος Αμφισημία των όρων δεικτοδότησης Οι όροι του ελεγχόμενου λεξιλογίου δεν είναι αμφίσημοι Οι λέξεις χαρακτηρίζονται από αμφισημία Λεπτομερής αναπαράσταση Η δεικτοδότηση ελεγχόμενου λεξιλογίου δεν είναι λεπτομερής Η δεικτοδότηση πλήρους κειμένου είναι λεπτομερής

15/4/2015 Γλωσσική Τεχνολογία35 Τύποι αναπαράστασης περιεχομένου Όταν το κόστος είναι καθοριστικός παράγοντας Η δεικτοδότηση πλήρους κειμένου έχει το μικρότερο κόστος Όταν το κόστος ΔΕΝ είναι καθοριστικός παράγοντας Η δεικτοδότηση ελεγχόμενου λεξιλογίου επιτρέπει τη σημασιολογική δεικτοδότηση Αναξέρτητα από τους όρους του κειμένου που επιλέγονται Η δεικτοδότηση πλήρους κειμένου είναι λεπτομερής και καλύπτει πλήρως το σύνολο του κειμένου

15/4/2015 Γλωσσική Τεχνολογία