Ανάκτηση και Εξαγωγή Πληροφορίας από Πολυμεσικές και Πολυγλωσσικές

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING Τεχνολογία Στενοτυπικής Μεταγραφής Προφορικού Λόγου σε Ηλεκτρονικό Κείμενο.
Advertisements

ΛΟΓΙΣΜΙΚΟ ΔΙΑΧΕΙΡΙΣΗΣ DATA, ΤΟΠΟΘΕΣΙΩΝ ΚΑΙ ΠΟΡΩΝ.
Νέες τεχνολογίες επεξεργασίας της πληροφορίας στη δημόσια διοίκηση1 Τεχνολογίες για ΑΜΕΑ Καθολική πρόσβαση Αθανάσιος Πρωτόπαπας Ινστιτούτο Επεξεργασίας.
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Γ ΛΩΣΣΙΚΟΙ Π ΟΡΟΙ & Τ ΕΧΝΟΛΟΓΙΕΣ : Η ΣΗΜΕΡΙΝΗ ΕΛΛΗΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ Πένυ Λαμπροπούλου Ινστιτούτο Επεξεργασίας Λόγου / Ε.Κ. "Αθηνά" Ημερίδα παρουσίασης.
Τεχνολογίες ανάκτησης και εξαγωγής δεδομένων με γλωσσική υποστήριξη - Εφαρμογές στο e-government και e-business - Εφαρμογές στο e-government και e-business.
Ινστιτούτο Επεξεργασίας του Λόγου Βέλτιστες Πρακτικές στη Γλωσσική Τεχνολογία Βέλτιστες Πρακτικές στη Γλωσσική Τεχνολογία Εβδομάδα Επιστήμης & Τεχνολογίας.
ΙΕΛΕναρκτήρια συνάντηση για το πρόγραμμα "ΚΛΕΙΩ" 7η Νοεμβρίου Οντολογίες & εργαλείο συγγραφής για το "ΚΛΕΙΩ" Ινστιτούτο Επεξεργασίας του Λόγου (ΙΕΛ)
Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.
Τμήμα Εκπαιδευτικής Τεχνολογίας (ΤΕΤ) Ινστιτούτο Επεξεργασίας του Λόγου Φιλογλωσσία Διδασκαλία της Ελληνικής ως ξένης γλώσσας (2η Δράση του ΙΕΛ στην Γλωσσική.
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
Οδηγίες Σχεδίασης Διαδραστικών Συστημάτων
Η διδασκαλία ως διαδικασία διαμόρφωσης εγγράμματων ταυτοτήτων
Η Θεματική Ταξινόμηση και η Συμβολή της στην Αναζήτηση Ευρωπαϊκών Κοινωνικών Δεδομένων.
Κεφάλαιο 6 Υλοποίηση Γλωσσών Προγραμματισμού
«Γραμματική Ε΄ και Στ΄ Δημοτικού»
Πνευματικό κέντρο Ερμουπόλεως Σύρου
MUltilingual Subtitling of multimediA content
Κατεύθυνση Τεχνολογιών Ηλεκτρονικών και Κινητών Υπηρεσιών
Εικονική πραγματικότητα ένας τρισδιάστατος κόσμος!!!
Μηχανική Μάθηση και Εξόρυξη Γνώσης
Η μηχανική μάθηση στην αντιμετώπιση της Υπερπληροφόρησης
Ανάκτηση & Εξαγωγή Πληροφορίας στο Διαδίκτυο Γιώργος Παλιούρας Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Ε.Κ.Ε.Φ.Ε.
Εφαρμογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήματα Αναζήτησης των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών Άννα Μάστορα 1, Μανόλης Πεπονάκης 2, Σαράντος.
1 Εισαγωγή στις Βάσεις Δεδομένων  Ανάγκη Αποθήκευσης και Διαχείρισης Δεδομένων  Συστήματα Αρχείων  Συστήματα Βάσεων Δεδομένων  Παραδοσιακές και Σύγχρονες.
Πολυμέσα – Δίκτυα (μαθ. επιλογής Γ’ Λυκείου)
ΑΠΕΙΚΟΝΙΣΗ ΕΝΝΟΙΩΝ 1. 2 Χρήστης Στόχος Ταμίας διενέργεια πώλησης διενέργεια ενοικίασης εισαγωγή ταμείου εξαγωγή ταμείου * 1 Μοντέλο Πεδίου Προβλήματος.
ΚΕΦΑΛΑΙΟ 3 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΤΩΝ Γ.Σ.Π.. ΟΡΙΣΜΟΙ Ένα σύστημα για τακτικό και συνηθισμένο τρόπο επεξεργασίας δεδομένων και για απάντηση προκαθορισμένων και.
ΈΝΑ ΗΛΕΚΤΡΟΝΙΚΟ ΕΚΘΕΤΗΡΙΟ ΓΙΑ ΤΙΣ ΝΕΕΣ ΠΡΟΣΚΤΗΣΕΙΣ ΒΙΒΛΙΩΝ ΤΗΣ ΒΙΒΛΙΟΘΗΚΗΣ ΤΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕΔΟΝΙΑΣ Κολοβός Φίλιππος Τσανακτσίδου ΕλισάβετΠαπαργύρη.
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr
Διαδικτυακή εφαρμογή ανάλυσης και επεξεργασίας δεδομένων κυβερνητικών διαβουλεύσεωνgov.insight Η. Ζαβιτσάνος, Γ. Γιαννακόπουλος, Γ. Παλιούρας Ινστιτούτο.
ΕΚΕΦΕ «Δημόκριτος» Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Κοινωνία της Πληροφορίας & Τεχνητή Νοημοσύνη Δρ. Κωνσταντίνος Δ. Σπυρόπουλος Δντής Έρευνας.
Οργάνωση πληροφοριών Ευρετηρίαση Μέρος Β Σχεδιασμός ευρετηρίων.
Ανάκτηση Πληροφορίας (Information Retrieval – IR) Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχ. Η/Υ, Τηλ/νιών & Δικτύων Ακαδημαϊκό Έτος
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
Ανάπτυξη και εκπαίδευση ιεραρχίας ταξινομητών για την κατηγοριοποίηση κειμένων Αβραμίδη Γεωργία 719.
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
Κατάρτιση Στελεχών ΟΤΑ σε θέματα ΤΠΕ: Ηλεκτρονική Μάθηση Λάζαρος Μεράκος Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Αθηνών.
E X a M p L e Αξιοποιώντας την τεχνολογία XML στη διαχείριση της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών.
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Π. ΚΑΤΣΑΡΟΣ Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τμ. Πληροφορικής,
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Information Extraction.
ΕΠΛ 223 Θεωρία και Πρακτική Μεταγλωττιστών7-1 Πίνακας Συμβόλων Πίνακας συμβόλων: δομή δεδομένων που χρησιμοποιείται για την αποθήκευση διαφόρων πληροφοριών.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 – 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 – 2013 Μάθημα 1 ο : Εισαγωγή.
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Π. ΚΑΤΣΑΡΟΣ Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τμ. Πληροφορικής,
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
EContent Στέλιος Πιπερίδης Εθνικός Εκπρόσωπος eContent
Μάθημα 1ο: Εισαγωγή στη Γλωσσική Τεχνολογία
6/12/2012 Παρουσίαση: Μιμηγιάννης Δημήτρης
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ - ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ – ΔΙΟΙΚΗΣΗ.
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Κ. ΛΑΖΟΣ - Π. ΚΑΤΣΑΡΟΣ Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τμ.
ΠΑΡΟΥΣΙΑΣΗ ΤΟΥ COLLATE PROJECT COLLATE:Collaboratory for Annotaton,Indexing and Retrieval of Digitized Historical Archive Material(συνεργασία για σχολιασμό,
Τι άλλαξε στα νέα αναλυτικά προγράμματα;. Βασικοί άξονες του νέου Αναλυτικού Προγράμματος Βασικοί άξονες του νέου Αναλυτικού Προγράμματος Ένα συνεκτικό.
Γλώσσα και σκέψη Με τον όρο σκέψη εννοούμε ένα μεγάλο φάσμα νοητικών διεργασιών: Επεξεργασία εννοιών, επίλυση προβλημάτων, ονειροπόληση, προγραμματισμό.
1 Διαχείριση Γνώσης Μ. Γεργατσούλης Χ. Παπαθεοδώρου.
ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΣΩΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ.
Υποτιτλισμός παράθυρο σε μα ξένη κουλτούρα Υποερώτημα Η ελληνική πραγματικότητα στο χώρο του υποτιτλισμού. Όνομα ομάδας: Άντε γειά Μέλη ομάδας : Αθανασοπούλου.
1 Διδασκαλία του γραμματισμού
Διοίκηση Τεχνολογίας Εργασία: «Εργαλειακή Προσέγγιση Τεχνολογίας» Πρόγραμμα:MBA Part-Time.
Διαδίκτυο και Διδακτική της Γλώσσας Δυνατότητες Αξιοποίησης στη Διδασκαλία του Γλωσσικού Μαθήματος Διονύσης Αρκαδιανός.
Εκπαιδευτική Τεχνολογία και Διδασκαλία (Roblyer) Ε. Αλεξοπούλου, Ε.Π.ΠΑΙ.Κ., Α.Σ.ΠΑΙ.Τ.Ε. Ενσωμάτωση εργαλείων.
4 Μαίου 2012 Ομάδα 7 Βολιανίτη Γεωργία-Βαλεντίνα Καμπόλη Μαρίνα Κοντογιώργη Ιωάννα Τρίκολα Μαρίνα.
ΤΙΤΛΟΣ ΕΡΓΑΣΙΑΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ανδρέου Βασίλης.
Η διδασκαλία, εκμάθηση, πιστοποίηση της ελληνικής σε ΑμεΑ
Τπε και γλώσσα.
Επεξεργασία Κειμένου Διδακτική προσέγγιση των λογισμικών γενικής χρήσης Ζωγραφική Λογιστικά φύλλα Βάσεις δεδομένων.
Τεχνολογία Πολυμέσων Ενότητα # 2: Εφαρμογές πολυμέσων
Σχεσιακεσ βασεισ δεδομενων
Μάθημα 6ο Ανάλυση Κειμένου και Δεικτοδότηση
Μεταγράφημα παρουσίασης:

Ανάκτηση και Εξαγωγή Πληροφορίας από Πολυμεσικές και Πολυγλωσσικές Βάσεις Δεδομένων Στέλιος Πιπερίδης Ινστιτούτο Επεξεργασίας Λόγου spip@ilsp.gr

Περιεχόμενα Διαχείριση Περιεχομένου Γλωσσική Τεχνολογία στην Ανάκτηση Πληροφορίας Εξαγωγή Πληροφορίας Πολυγλωσσική Εξαγωγή Πληροφορίας

... Where is the Life we have lost in living? Where is the wisdom we have lost in knowledge? Where is the knowledge we have lost in information? -- T.S. Eliot, 1934, “The Rock”, I:14-16

Ιεραρχία ; ... Γνώση ….. Knowledge Πληροφορία Information Data Δεδομένα

Ιεραρχία Πληροφορίας ... Γνώση πληροφορία που έχουμε αντιληφθεί (ανάγνωση[κείμενο] / ακοή[φωνή] / όραση[εικόνα, κίνηση]) και ‘κατανοήσει’ Πληροφορία δεδομένα οργανωμένα και παρουσιασμένα με συγκεκριμένο τρόπο Δεδομένα ανεπεξέργαστο υλικό

Ανάκτηση πολυμεσικών πληροφοριών κείμενο, φωνή, εικόνες δρουν συνεργατικά για τη δημιουργία και μεταφορά πληροφορίας και γνώσης η επεξεργασία πολυμεσικών πληροφοριών φαίνεται ότι είναι το σκηνικό στο οποίο θα λειτουργούμε στο μέλλον, τη στιγμή που αναπαριστά ότι είναι πλησιέστερο σε πραγματικά σενάρια επικοινωνίας (φυσικοί διάλογοι άνθρωπος-με-άνθρωπο/ άνθρωπος-με-μηχανή, αλληλοδραστική/ψηφιακή τηλεόραση, κλπ) η επεξεργασία πολυμεσικών δεδομένων απαιτεί τη συνεργασία τεχνολογιών μετατροπής μέσου σε μέσο (π.χ. φωνή σε κείμενο) με τις τεχνολογίες επεξεργασίας γραπτού λόγου

Διαχείριση Περιεχομένου Γιατί χρησιμοποιείται κυρίως η γλώσσα επειδή η γλώσσα είναι ένα λειτουργικό σύστημα που βασίζεται σε αυτο-ρυθμιζόμενες μονάδες, δηλ. έκτυπα που χωρίζονται μεταξύ τους από κενά Τεχνικές διαχείρισης περιεχομένου μετατροπή όλων των μέσων περιεχομένου σε κείμενο ισχυρή απαίτηση ευρωστίας για τις τεχνολογίες μετατροπής (π.χ. αναγνώριση φωνής, εικόνας, κλπ) αλλά κυρίως για τις τεχνολογίες επεξεργασίας γραπτού λόγου

Ανάκτηση – Εξαγωγή Πληροφορίας Διαχείριση περιεχομένου μέσω κειμένου διαχείριση σε επίπεδο εγγράφου έγγραφα και μονάδες τους, π.χ. παράγραφοι ανάκτηση πληροφορίας ΕΡΩΤΗΣΗ Ανάκτηση ΕΓΓΡΑΦΩΝ διαχείριση σε επίπεδο περιεχομένου προτάσεις και σχέσεις τους μέσα στα έγγραφα εξαγωγή πληροφορίας Προκαθορισμένο ΠΛΑΙΣΙΟ Εξαγωγή ΠΛΗΡΟΦΟΡΙΑΣ από ΕΓΓΡΑΦΑ

Εξόρυξη πληροφορίας αριθμητικά δεδομένα κειμενικά δεδομένα εξαγωγή κανόνων που συσχετίζουν τα δεδομένα με σκοπό την μετατροπή των δεδομένων σε γνώση βάση οικονομικών δεδομένων βάση πελατών βάση ιατρικών δεδομένων κλπ. κειμενικές βάσεις δεδομένων για ένα θεματικό πεδίο π.χ. εξαγωγή του κανόνα Το φάρμακο Α χρησιμοποιείται για την ασθένεια Β.

Περιεχόμενα Διαχείριση Περιεχομένου Γλωσσική Τεχνολογία στην Ανάκτηση Πληροφορίας Εξαγωγή Πληροφορίας Πολυγλωσσική Εξαγωγή Πληροφορίας

Ανάκτηση Πληροφορίας με γλωσσική τεχνολογία τυπικές διαδικασίες: αναγνώριση δομής κειμένου (text structure) τίτλοι, κεφάλαια, παράγραφοι, κλπ. λεκτική ανάλυση (tokenisation) αναγνώριση λέξεων, προτάσεων (ιδιαίτερες δυσκολίες κυρίως όταν δεν ακολουθείται κάποια γραμματική στίξης) κανονικοποίηση μορφής αποκοπή καταλήξεων/μορφολογική ανάλυση/λημματοποίηση δεικτοδότηση

Κανονικοποίηση μορφής ο στόχος είναι να ‘υπολογίσουμε’ (κανονικοποιήσουμε) μορφογραφημικά παρόμοιες λέξεις μορφολογία (“μορφή” των λέξεων) κλιτική μορφολογία (inflectional morphology) παραγωγική μορφολογία (derivational morphology) λημματοποίηση (lemmatisation) αποκοπή καταλήξεων (stemming) συγχώνευση όρων (term conflation)

Δεικτοδότηση (με γλωσσική τεχνολογία) δεικτοδότηση όρων εξαγωγή όρων από (term indexing) κείμενα δεικτοδότηση με θησαυρούς κατασκευή θησαυρών (thesaurus indexing) από κείμενα δεικτοδότηση ονομάτων αναγνώριση και (name indexing) κατηγοριοποίηση ονοματικών οντοτήτων κατηγοριοποίηση κειμένων απόδοση θεματικής (text classification) κατηγορίας,(κλειστή ή ανοιχτή λίστα) κατασκευή περίληψης εξαγωγή σημαντικών (text summarisation) προτάσεων από κείμενα

Δεικτοδότηση και Ανάλυση Περιεχομένου αναγνώριση συναναφορών (coreference) σε κείμενα συναναφορά αντωνυμιών(pronouns) και οριστικών ονοματικών φράσεων(definite noun phrases) απαιτείται συντακτική, σημασιολογική και πραγματολογική ανάλυση για συνολική επίλυση των φαινομένων συναναφοράς Διαγραμματικά δεικτ/ηση όρων δεικτ/ηση ονομάτων επίλυση συναναφορών ευφυής δεικτοδότηση

Περιεχόμενα Διαχείριση Περιεχομένου Γλωσσική Τεχνολογία στην Ανάκτηση Πληροφορίας Εξαγωγή Πληροφορίας Πολυγλωσσική Εξαγωγή Πληροφορίας

Παράδειγμα Εξαγωγής Πληροφορίας Εξαγωγή Πληροφορίας ΠΡΟΚΑΘΟΡΙΣΜΕΝΟ ΠΛΑΙΣΙΟ ΓΕΓΟΝΟΤΩΝ : <organisation, location, money, type, percent…> ΠΛΗΡΟΦΟΡΙΑ ΑΠΟ ΕΓΓΡΑΦΑ <EVENT-01>:= ORGANISATION : ‘Venture capital Corp.’ LOCATION : ‘Νέα Υόρκη’ MONEY : ‘$100.000’ TYPE : ‘χρηματοδότηση νέας τεχνολογίας’ PERCENT: ‘60%-40%’ ...

Στάδια Εξαγωγής Πληροφορίας Κειμένο Εισόδου Λεκτικός Αναλυτής Λεκτική Ανάλυση Λεξικό Μορφοσυντακτικός σχολιασμός Μορφοσυντακτικός σχολιαστής & Λημματοποιητής Κανόνες Λημματοποίηση-Κανονικοποίηση Λίστες ονομάτων Αναγνωριστής ονομάτων Αναγνώριση Ονομάτων Κανόνες ονομάτων Συντακτική Ανάλυση Γραμματικοί κανόνες Συντακτικός και σημασιολογικός επεξεργαστής Ανάλυση βάσει σεναρίου Κανόνες σεναρίου Επίλυση συναναφορών Διερμηνευτής Λόγου Μοντέλο Πεδίου Συμπερασμός Κανόνες συμπερασμού Πλαίσιο Κατασκευή Πλαισίου

Ονοματικές Οντότητες σε ελληνικά κείμενα (2)

Ανάκτηση και φιλτράρισμα πληροφορίας Σύστημα Εξαγωγής Πληροφορίας Ανάκτηση και Εξαγωγή πληροφορίας ΔΙΑΔΙΚΤΥΟ Ανάκτηση και φιλτράρισμα πληροφορίας Βάση δεδομένων Σύστημα Εξαγωγής Πληροφορίας

Ταξινόμηση και δρομολόγηση πληροφορίας Ανάκτηση και Εξαγωγή πληροφορίας ΒΔ 1 Σύστημα ΕΠ 1 ΔΙΑΔΙΚΤΥΟ ΒΔ 2 Σύστημα ΕΠ 2 Ταξινόμηση και δρομολόγηση πληροφορίας ΒΔ N Σύστημα ΕΠ 3

Περιεχόμενα Διαχείριση Περιεχομένου Γλωσσική Τεχνολογία στην Ανάκτηση Πληροφορίας Εξαγωγή Πληροφορίας Πολυγλωσσική Εξαγωγή Πληροφορίας

Κατανομή περιεχομένου στο διαδίκτυο ανά γλώσσα

Πολυγλωσσική Εξαγωγή Πληροφοριών πολλές φορές η αναζητούμενη πληροφορία βρίσκεται σε κείμενα διαφορετικών γλωσσών   Δύο δυνατότητες χειρισμού της πολυγλωσσίας στην εξαγωγή πληροφορίας: μονογλωσσικό σύστημα ΕΠ εξάγει πληροφορία σε διαφορετικές γλώσσες μονογλωσσικό σύστημα ΕΠ : γλώσσα κειμένου και γλώσσα πλαισίου είναι ίδιες γλώσσα πλαισίου : η γλώσσα στην οποία συμπληρώνονται οι τιμές του πλαισίου διαγλωσσικό σύστημα εξαγωγής πληροφορίας διαγλωσσικό σύστημα ΕΠ : γλώσσα κειμένου και γλώσσα πλαισίου διαφορετικές

αναπαράσταση περιεχομένου ανεξάρτητη γλώσσας Προσεγγίσεις στη διαγλωσσική εξαγωγή πληροφορίας σύστημα αυτόματης μετάφρασης μεταφράζει το κείμενο και ένα μονογλωσσικό σύστημα ΕΠ εξάγει πληροφορία από το μετάφρασμα Μηχανική Μετάφραση Εξαγωγή Πληροφορίας κείμενο πηγή κείμενο στόχος πλαίσιο στη γλώσσα στόχο μονογλωσσικό σύστημα ΕΠ εξάγει πληροφορία από το κείμενο πηγή και σύστημα μετάφρασης μεταφράζει την πληροφορία του πλαισίου Εξαγωγή Πληροφορίας Μηχανική Μετάφραση κείμενο πηγή πλαίσιο στη γλώσσα πηγή πλαίσιο στη γλώσσα στόχο μονογλωσσικοί επεξεργαστές αντιστοιχίζουν το κείμενο σε γλωσσικά ανεξάρτητο μοντέλο λόγου αναπαράσταση περιεχομένου ανεξάρτητη γλώσσας διερμηνευτής περιεχομένου λόγου κείμενο πηγή πλαίσιο στη γλώσσα στόχο