Η αυτόματη επεξεργασία των φυσικών γλωσσών: Μέθοδοι και εφαρμογές

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING Τεχνολογία Στενοτυπικής Μεταγραφής Προφορικού Λόγου σε Ηλεκτρονικό Κείμενο.
Advertisements

ΛΟΓΙΣΜΙΚΟ ΔΙΑΧΕΙΡΙΣΗΣ DATA, ΤΟΠΟΘΕΣΙΩΝ ΚΑΙ ΠΟΡΩΝ.
Γ ΛΩΣΣΙΚΟΙ Π ΟΡΟΙ & Τ ΕΧΝΟΛΟΓΙΕΣ : Η ΣΗΜΕΡΙΝΗ ΕΛΛΗΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ Πένυ Λαμπροπούλου Ινστιτούτο Επεξεργασίας Λόγου / Ε.Κ. "Αθηνά" Ημερίδα παρουσίασης.
Τεχνολογίες ανάκτησης και εξαγωγής δεδομένων με γλωσσική υποστήριξη - Εφαρμογές στο e-government και e-business - Εφαρμογές στο e-government και e-business.
Εισαγωγή στην XML Μάρτιος 2005 Γ. Σ. Σακελλάρης Τ. Α. Κοντογιώργης
Γιάννα Αντωνίου Δρ Γλωσσολόγος - Ερευνήτρια ΙΕΛ Τεχνολογίες λογισμικών πολυμέσων για εκπαίδευση και πολιτισμό Δράσεις και Προοπτικές ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ.
Λεξικά όρων και θησαυροί Μαρία Γαβριηλίδου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING.
1 Ερευνητικό Πρόγραμμα BalkaNet. BalkaNet Project 2 Ερευνητικό Πρόγραμμα BalkaΝet Χρηματοδοτούμενο από την ΕΕ πρόγραμμα (IST ) με σκοπό την.
Ανάκτηση και Εξαγωγή Πληροφορίας από Πολυμεσικές και Πολυγλωσσικές
Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.
Τμήμα Εκπαιδευτικής Τεχνολογίας (ΤΕΤ) Ινστιτούτο Επεξεργασίας του Λόγου Φιλογλωσσία Διδασκαλία της Ελληνικής ως ξένης γλώσσας (2η Δράση του ΙΕΛ στην Γλωσσική.
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Τεχνικές NLP – Σχεδιαστικά Θέματα.
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
Η διδασκαλία ως διαδικασία διαμόρφωσης εγγράμματων ταυτοτήτων
Η Θεματική Ταξινόμηση και η Συμβολή της στην Αναζήτηση Ευρωπαϊκών Κοινωνικών Δεδομένων.
MUltilingual Subtitling of multimediA content
ΓΡΑΜΜΑΤΙΚΗ ΝΕΑΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ Α΄, Β΄, Γ΄ ΓΥΜΝΑΣΙΟΥ
Μηχανική Μάθηση και Εξόρυξη Γνώσης
Η μηχανική μάθηση στην αντιμετώπιση της Υπερπληροφόρησης
Ανάκτηση & Εξαγωγή Πληροφορίας στο Διαδίκτυο Γιώργος Παλιούρας Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Ε.Κ.Ε.Φ.Ε.
Εφαρμογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήματα Αναζήτησης των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών Άννα Μάστορα 1, Μανόλης Πεπονάκης 2, Σαράντος.
Ασύγχρονη Τηλεκπαίδευση
Google docs Google docs forms
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr
Διαδικτυακή εφαρμογή ανάλυσης και επεξεργασίας δεδομένων κυβερνητικών διαβουλεύσεωνgov.insight Η. Ζαβιτσάνος, Γ. Γιαννακόπουλος, Γ. Παλιούρας Ινστιτούτο.
ΒΕΛΤΙΩΣΗ ΤΗΣ ΠΡΟΣΒΑΣΗΣ ΣΤΑ e- ΠΕΡΙΟΔΙΚΑ ΚΑΙ ΤΙΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΣΤΙΣ ΒΙΒΛΙΟΘΗΚΕΣ MIT Χτίζοντας μια βάση δεδομένων- υποστηριγμένο ιστοχώρο ή την αποκαλούμενη.
Οργάνωση πληροφοριών Ευρετηρίαση Μέρος Β Σχεδιασμός ευρετηρίων.
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
Εισαγωγή στην Γλωσσολογία
3ος Τομέας: Τηλεπικοινωνιών και Επεξεργασίας Σήματος
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
Geo Tagging - Geo coding Εφεντάκης Αλέξανδρος. Ορισμοί  Geocoding – Γεωκωδικοποίηση = Απόδοση γεωγραφικών συντεταγμένων σε κείμενο  Αθήνα, Ευρώπη, Ελλάδα.
E X a M p L e Αξιοποιώντας την τεχνολογία XML στη διαχείριση της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών.
Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Λίνα Μπουντούρη - Μανόλης Γεργατσούλης Ιόνιο Πανεπιστήμιο 15ο Πανελλήνιο Συνέδριο Ακαδημαϊκών.
Generating Chinese Classical Poems with Statistical Machine Translation Models Jing He, Ming Zhou, Long Jiang Μαρία Κωστάκη Εθνικό & Καποδιστριακό Πανεπιστήμιο.
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Π. ΚΑΤΣΑΡΟΣ Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τμ. Πληροφορικής,
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Information Extraction.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ: «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΜΑΘΗΜΑ: ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΕΡΓΑΣΙΑ: MULTI-DOCUMENT SUMMARIZATIONS.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 – 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 – 2013 Μάθημα 1 ο : Εισαγωγή.
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Π. ΚΑΤΣΑΡΟΣ Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τμ. Πληροφορικής,
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
ΛΑΔΑΚΑΚΟΣ ΘΑΛΗΣ Α.Μ ΔΙΑΧΕΙΡΗΣΗ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
EContent Στέλιος Πιπερίδης Εθνικός Εκπρόσωπος eContent
Μάθημα 1ο: Εισαγωγή στη Γλωσσική Τεχνολογία
6/12/2012 Παρουσίαση: Μιμηγιάννης Δημήτρης
«Πρόγραμμα Αναμόρφωσης Προπτυχιακών Προγραμμάτων Σπουδών Γ.Π.Α» Σεμινάριο Ενημέρωσης Διδακτικού Προσωπικού Οι τεχνολογίες της Πληροφορικής και των Επικοινωνιών.
Μεταγλωττιστές (Compilers) (Θ) Ενότητα 9: Παραγωγή Ενδιάμεσου Κώδικα (Ενδιάμεσες Γλώσσες) Κατερίνα Γεωργούλη Τμήμα Μηχανικών Πληροφορικής ΤΕ Ανοικτά Ακαδημαϊκά.
ΤΠΕ - ΔΙΔΑΣΚΑΛΙΑ ΓΛΩΣΣΑΣ
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών – Τμήμα Πληροφορικής και Τηλεπικοινωνιών 1 Κεφάλαιο 4 Σημασιολογία μιας Απλής Προστακτικής Γλώσσας Προπτυχιακό.
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Κ. ΛΑΖΟΣ - Π. ΚΑΤΣΑΡΟΣ Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τμ.
Μεταγλωττιστές (Compilers) (Θ) Ενότητα 8: Πίνακας Συμβόλων Κατερίνα Γεωργούλη Τμήμα Μηχανικών Πληροφορικής ΤΕ Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας.
Πληροφοριακά Συστήματα και Επιχείρηση
Cultural Heritage Language Technologies ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ‘ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ’ ΣΤ΄ Εξάμηνο Υπεύθυνος καθηγητής: Καπιδάκης Σαράντος Λούβαρη Αγγελική.
ΥΠΟΛΟΓΙΣΤΙΚΗ ΓΛΩΣΣΟΛΟΓΙΑ ΕΙΣΑΓΩΓΗ
Γλωσσική τεχνολογία και ψηφιακή επιμέλεια Ίων Ανδρουτσόπουλος Τμήμα Πληροφορικής, Οικονομικό Πανεπιστήμιο Αθηνών και Μονάδα Ψηφιακής Επιμέλειας, Ερευνητικό.
Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης Τμήμα Εφηρμοσμένης Πληροφορικής και Πολυμέσων Εργαστήριο Νευρωνικών Δικτύων 1 Αναγνώριση Προτύπων- Τεχνητά Νευρωνικά.
ΤΙΤΛΟΣ ΕΡΓΑΣΙΑΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ανδρέου Βασίλης.
7. Λόγος – Γλώσσα – Ομιλία Επίπεδα γλωσσικής ανάλυσης Φωνητική
Διδακτική αρχαίων ελληνικών Α΄ λυκείου από πρωτότυπο κείμενο
ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ
Βάσεις Δεδομένων & Έμπειρα Συστήματα
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
RICAPITOLAZIONE Della prima lezione.
Θέματα Γλωσσολογίας (α)
Σχεσιακεσ βασεισ δεδομενων
Ψηφιακοί, γλωσσικοί περίπατοι στην πόλη μου
Σκοπός Η συνοπτική παρουσίαση
RICAPITOLAZIONE Della prima lezione.
Μεταγράφημα παρουσίασης:

Η αυτόματη επεξεργασία των φυσικών γλωσσών: Μέθοδοι και εφαρμογές Η αυτόματη επεξεργασία των φυσικών γλωσσών: Μέθοδοι και εφαρμογές Αναστασία Γιαννακοπούλου Δρ Υπολογιστικής Γλωσσολογίας Εργαστήριο ΤΝΤΛ Τομέα ΕΥ Γενικό Τμήμα Θετικών Επιστημών ΤΕΙ Κρήτης

Πλάνο Τι είναι η Υπολογιστική Γλωσσολογία Πεδία εφαρμογής Αυτόματη Μετάφραση Βασική έρευνα Εφαρμογές Συστήματα ερωταποκρίσεων στα ελληνικά

Αυτόματη επεξεργασία των φυσικών γλωσσών: ορισμός Αυτόματη επεξεργασία των φυσικών γλωσσών = NLP: Natural Language Processing Είναι μια επιστήμη που συνδυάζει την Πληροφορική, τη Γλωσσολογία και την Τεχνητή Νοημοσύνη. Φυσική γλώσσα = ανθρώπινη γλώσσα Απώτερος στόχος = κατανόηση της ανθρώπινης γλώσσας από τον υπολογιστή

Πεδία εφαρμογής Αυτόματη μετάφραση – MT: Machine Translation Ανάκτηση πληροφορίας – IR: Information Retrieval Εξαγωγή πληροφορίας – IE: Information Extraction Εξόρυξη δεδομένων – DM: Data Mining Αναγνώριση μερών του λόγου – Part-of-speech (POS) tagging Συντακτική ανάλυση – Parsing Αναγνώριση ονοματικών οντοτήτων – NER: Named Entities Recognition Μηχανική μάθηση – ML: Machine Learning Αυτόματη αναπαραγωγή κειμένων – NLG: Natural Language Generation Αναγνώριση προφορικού λόγου – Speech Recognition (Text-to-speech and Speech-to-text systems) …

Αυτόματη Μετάφραση http://translate.google.com/

Αυτόματη Μετάφραση Ruled-based machine translation (RBMT) – SYSTRAN Σημασιολογία Μεταφορά Σημασιολογία Σύνταξη Σύνταξη Μορφολογία Μορφολογία Μορφολογική ανάλυση του κειμένου-πηγής (POS tagging) Συντακτικές πληροφορίες για τη σύνταξη του ρήματος/ουσιαστικού της πρότασης Συντακτική ανάλυση της φράσης πηγής Μετάφραση των λέξεων Κανόνες για το συσχετισμό των δύο συντακτικών δομών Κείμενο-πηγή Ανάλυση Κείμενο-στόχος Σύνθεση

Αυτόματη Μετάφραση Statistical Machine Translation (SMT) Παράλληλα σώματα κειμένων (parallel corpus) – +1.000.000 λέξεις 2 μονόγλωσσα σώματα κειμένων – +1δις λέξεις το καθένα Στατιστικά μοντέλα Προβλήματα: Ευθυγράμμιση προτάσεων (Sentence alignement) Σύνθετες λέξεις και ιδιωματικές εκφράσεις Μορφολογικοί τύποι Σύνταξη

SMT System(Moses) Phrase Table Αυτόματη Μετάφραση Υβριδικά μοντέλα Output Text SMT System(Moses) Phrase Table Hybrid Output Phrase substitution Input Text RBMT System Output Text

Βασική έρευνα Δημιουργία ηλεκτρονικών λεξικών Εμπλουτισμός και διαχείριση ηλεκτρονικών λεξικών Συντακτικο-σημασιολογική περιγραφή των ιδιοτήτων των ρημάτων με συμπλήρωμα που δηλώνει τον τόπο. Δημιουργία γραμματικών για τη συντακτική ανάλυση, μερική ή πλήρη, δομών Ονοματικές Οντότητες (NER) Κυρίως γλώσσες: αγγλικά, γαλλικά, ελληνικά

Γλωσσολογικά δεδομένα Χρησιμοποιούμε τα γλωσσολογικά δεδομένα για να αναλύσουμε τα κείμενα (parsing), δηλαδή: μορφολογική ανάλυση των κειμένων, με την εφαρμογή ηλεκτρονικών λεξικών (electronic dictionaries) συντακτική και σημασιολογική ανάλυση των κειμένων, με την εφαρμογή γραμματικών (local grammars)

Ηλεκτρονικά λεξικά Με τον όρο «ηλεκτρονικά λεξικά» εννοούμε τα λεξικά που έχουν μια συγκεκριμένη δομή, η πληροφορία είναι κωδικοποιημένη και μπορούν να χρησιμοποιηθούν σε αναλυτές κειμένων (parsers). Διαφορά ηλεκτρονικών λεξικών και λεξικών σε ηλεκτρονική μορφή.

κλιτός_τύπος,λημματικός_τύπος.γραμμ_κατ+ΣΣ_πλρφ+…:κλιτ_πλρφ:… Ηλεκτρονικά λεξικά Παράδειγμα ηλεκτρονικού λεξικού: book,.N+Conc:s book,.V:W:P1s:P2s:P1p:P2p:P3p booking office,.N+XN+Conc+z1:s booking offices,booking office.N+XN+Conc+z1:p booking,.N:s booking,book.V:G bookings,booking.N:p books,book.N+Conc:p books,book.V:P3s bookseller,.N+Hum:s booksellers,bookseller.N+Hum:p Μορφή: κλιτός_τύπος,λημματικός_τύπος.γραμμ_κατ+ΣΣ_πλρφ+…:κλιτ_πλρφ:…

Γραμματικές Γενικά, μια γραμματική περιγράφει έναν ή περισσότερους κανόνες. Για τη διατύπωσή της, χρησιμοποιούμε τη μορφή πεπερασμένων αυτομάτων (Finite-State Automata, Roche 1997).

Γραμματικές

Ανάλυση σε XML Input: for an hour and a half Output: <duration hour=“1” min=“30”/>

UNITEX Πολύγλωσσος οpen-source parser που κατασκευάστηκε από τον Sébastien Paumier στο Εργαστήριο Υπολογιστικής Γλωσσολογίας του Institut Garspard Monge (IGM) στο Πανεπιστήμιο Paris-Est Marne-la-Vallée. http://www-igm.univ-mlv.fr/~unitex/ Χρησιμoποιούμε την επιφάνεια διεπαφής για να κατασκευάσουμε, να εμπλουτίσουμε και να διορθώσουμε τις τοπικές γραμματικές. Χρησιμοποιούμε τα εργαλεία του Unitex για να κάνουμε την ανάλυση κειμένων. Οι πηγές του UNITEX διατίθενται με την άδεια LGPLRS.

Convex

Convex Natural Language Processing module Output: <note><conversion> <convert-from value="7.1" unit="l/100km"/> <convert-to unit="mpg"/></conversion></note>

Convex Γλωσσολογικά δεδομένα Επιδόσεις Ηλεκτρονικά λεξικά Γραμματικές αναγνώρισης δομών Αναπαράσταση της πληροφορίας σε XML Επιδόσεις PAF = Packed Array File Αναγνώριση σε πραγματικό χρόνο

Αναγνώριση ονοματικών οντοτήτων Αναγνώριση ονοματικών οντοτήτων Systran Κώδικας σε C++ για την αυτόματη μετάφραση των ημερομηνιών σε 14 ζεύγη γλωσσών. Ergonotics ημερομηνίες κύρια ονόματα προσώπων τοπωνύμια και διευθύνσεις url, email τηλεφωνικοί αριθμοί και αριθμοί μονάδες μέτρησης

Συστήματα ερωταποκρίσεων Συστήματα ερωταποκρίσεων

Συστήματα ερωταποκρίσεων Συστήματα ερωταποκρίσεων

Συστήματα ερωταποκρίσεων Συστήματα ερωταποκρίσεων Ομάδα Επεξεργασίας Φυσικής Γλώσσας, Τμήμα Πληροφορικής, Οικονομικό Πανεπιστήμιο Αθηνών (Ιων Ανδουτσόπουλος) (URL) «Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων» (URL) «Αυτόματη κατάταξη ελληνικών ερωτήσεων σε κατηγορίες» (URL) «Χειρισµός Ερωτήσεων Ορισµού σε Συστήµατα Ερωταποκρίσεων» (URL)

Συστήματα ερωταποκρίσεων Συστήματα ερωταποκρίσεων Πολυτεχνείο Κρήτης (Σ. Χριστοδουλάκης) «Συντακτικός αναλυτής ελληνικής γλώσσας και εφαρμογές ανάληψης πληροφορίας” (URL) TEI Κρήτης (Μ. Μαρακάκης) «Ανάπτυξη συστήµατος ανάλυσης προτάσεων – ερωτήσεων της Ελληνικής γλώσσας, µετατροπή τους σε στόχους Prolog και επεξεργασία τους από σχεσιακή βάση δεδοµένων». Ανάπτυξη συστήματος δημιουργίας προτάσεων στην Ελληνική γλώσσα σαν απάντηση από την επεξεργασία ερωτήσεων σε σχεσιακή βάση δεδομένων. Καναδά: “Working Towards a Greek-English Cross-Language Question-Answering System” (URL)

Συστήματα ερωταποκρίσεων Συστήματα ερωταποκρίσεων Ερωτήσεις των οποίων η απάντηση είναι αυστηρά καθορισµένη (factual questions) όνοµα προσώπου όνομα οργανισμού χρονική έκφραση τοποθεσία ποσότητα ορισμός Ερωτήσεις γνώμης (opinion questions) Eρωτήσεις περίληψης (summary questions)

Συστήματα ερωταποκρίσεων Συστήματα ερωταποκρίσεων

Συστήματα ερωταποκρίσεων Συστήματα ερωταποκρίσεων Σύστημα αναγνώρισης μερών του λόγου (POS tagger) Σύστημα αναγνώρισης ονοματικών οντοτήτων (NER)

Ευχαριστώ! anastasiay@cs.teicrete.gr http://www.linkedin.com/in/anastasiayannacopoulou

Βιβλιογραφία Emmanuel Roche. 1997. Parsing with finite state transducers. In E. Roche & Y. Schabes (eds), Finite-State Language Processing, Cambridge, Mass./London, The MIT Press, pp. 241-281.