ΥΠΟΛΟΓΙΣΤΙΚΗ ΓΛΩΣΣΟΛΟΓΙΑ ΕΙΣΑΓΩΓΗ

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING Τεχνολογία Στενοτυπικής Μεταγραφής Προφορικού Λόγου σε Ηλεκτρονικό Κείμενο.
Advertisements

Τι είναι ο προγραμματισμός
Γ ΛΩΣΣΙΚΟΙ Π ΟΡΟΙ & Τ ΕΧΝΟΛΟΓΙΕΣ : Η ΣΗΜΕΡΙΝΗ ΕΛΛΗΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ Πένυ Λαμπροπούλου Ινστιτούτο Επεξεργασίας Λόγου / Ε.Κ. "Αθηνά" Ημερίδα παρουσίασης.
ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING Τεχνολογία Ορθογραφικής Διόρθωσης Κειμένων Ν.Γλάρος Δρ. Ηλ/γος Μηχανικός.
Γιάννα Αντωνίου Δρ Γλωσσολόγος - Ερευνήτρια ΙΕΛ Τεχνολογίες λογισμικών πολυμέσων για εκπαίδευση και πολιτισμό Δράσεις και Προοπτικές ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ.
Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.
Τμήμα Εκπαιδευτικής Τεχνολογίας (ΤΕΤ) Ινστιτούτο Επεξεργασίας του Λόγου Φιλογλωσσία Διδασκαλία της Ελληνικής ως ξένης γλώσσας (2η Δράση του ΙΕΛ στην Γλωσσική.
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Τεχνικές NLP – Σχεδιαστικά Θέματα.
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
Ιστορία και Δομή της Ελληνικής
ΤΟΜΕΑΣ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΚΑΙ ΕΦΑΡΜΟΓΩΝ
Ανάλυση Λόγου (Discourse Analysis)
Μηχανική Μάθηση και Εξόρυξη Γνώσης
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ
2. Μορφή και οργάνωση του μαθήματος
Σχόλια για τον επιστημονικό εγγραμματισμό
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΜΕΘΟΔΟΛΟΓΙΑ ΤΗΣ ΕΡΕΥΝΑΣ ΣΤΟΝ ΧΩΡΟ ΤΗΣ ΥΓΕΙΑΣ
Οργάνωση πληροφοριών Ευρετηρίαση Μέρος Β Σχεδιασμός ευρετηρίων.
Η αυτόματη επεξεργασία των φυσικών γλωσσών: Μέθοδοι και εφαρμογές
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
Εισαγωγή στην Γλωσσολογία
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
Λεξικολογία-Λεξικογραφία
Δόμηση και αποδόμηση κειμένων εκπαιδευτικής πολιτικής
ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΔΑΜΠΑΣ ΑΘΑΝΑΣΙΟΣ Β ΚΑΛΩΤΑ ΑΝΝΑ Β
Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Λίνα Μπουντούρη - Μανόλης Γεργατσούλης Ιόνιο Πανεπιστήμιο 15ο Πανελλήνιο Συνέδριο Ακαδημαϊκών.
Σχεδίαση Αλγορίθμων. Διεργασίες (1/2) Μία διεργασία αλληλεπιδρά με το περιβάλλον της δεχόμενη είσοδο και παράγοντας έξοδο.
Generating Chinese Classical Poems with Statistical Machine Translation Models Jing He, Ming Zhou, Long Jiang Μαρία Κωστάκη Εθνικό & Καποδιστριακό Πανεπιστήμιο.
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Π. ΚΑΤΣΑΡΟΣ Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τρίτη, 31 Μαρτίου 2015Τμ. Πληροφορικής,
31 Μαρτίου 2015 ΔΙΑΦΑΝΕΙΑ 1 ΤΥΠΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΣΥΣΤΗΜΑΤΩΝ ΤΜ. ΠΛΗΡΟΦΟΡΙΚΗΣ Α.Π.Θ. – ΔΙΔΑΣΚΩΝ: Π. ΚΑΤΣΑΡΟΣ ΚΑΤΗΓΟΡΗΜΑΤΙΚΟΣ ΛΟΓΙΣΜΟΣ Ι Για τον προτασιακό.
Η επιστήμη του Web.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 – 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 – 2013 Μάθημα 1 ο : Εισαγωγή.
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Π. ΚΑΤΣΑΡΟΣ Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τετάρτη, 1 Απριλίου 2015Τμ. Πληροφορικής,
1.5 Γλώσσες Προγραμματισμού
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
Μάθημα 1ο: Εισαγωγή στη Γλωσσική Τεχνολογία
Ειδική Ημερίδα για Ανάκτηση και Εξαγωγή Πληροφορίας Ειδική Ημερίδα για Ανάκτηση και Εξαγωγή Πληροφορίας Συζήτηση στρογγυλής τραπέζης.
ΠΜΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ The Digital Library and Computational Philology: The BAMBI Project Γόντικα Ειρήνη.
1. ΝΕΑ ΚΑΤΕΥΘΥΝΣΗ ΣΠΟΥΔΩΝ Τμήμα Διοικητικής Επιστήμης & Τεχνολογίας Οικονομικό Πανεπιστήμιο Αθηνών Ποσοτικές Μέθοδοι στα Οικονομικά & Διοίκηση Quantitative.
6/12/2012 Παρουσίαση: Μιμηγιάννης Δημήτρης
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Κ. ΛΑΖΟΣ - Π. ΚΑΤΣΑΡΟΣ Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τμ.
Η διδασκαλία ως διαδικασία διαμόρφωσης εγγράμματων ταυτοτήτων Ειδικό Μέρος Ενότητα Ι, 2.4.
1 ΠΛΗΡΟΦΟΡΙΑΚΑ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Γεώργιος Γιαγλής Οικονομικό Πανεπιστήμιο Αθηνών Τμήμα Διοικητικής Επιστήμης & Τεχνολογίας.
Εισαγωγή στην Επιστήμη των Υπολογιστών και Επικοινωνιών Οι απαιτούμενες γνώσεις και δεξιότητες του μηχανικού Σπύρος Κοκολάκης ΠΑΝΕΠΙΣΤΗΜΙΟ.
Η εργογραφία του Ναπολέοντα Μήτση
ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΣΩΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ.
Εισαγωγή στην Έννοια του Αλγορίθμου και στον Προγραμματισμό
Εισαγωγή στη Θεωρητική Γλωσσολογία A’ εξάμηνο ΦΙΛΟΛΟΓΙΚΟ, Ακαδ. Έτος Μαρία Ιακώβου, Τομέας Γλωσσολογίας γρφ. 830 (Tε, )
Πρόγραμμα Προπτυχιακών Σπουδών Ροή Λ: Λογισμικό Κώστας Κοντογιάννης Αναπλ. Καθηγητής Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Ε.Μ.Π.
Κατάκτηση της γλώσσας από το παιδί Ο γενικευτικός και αφαιρετικός χαρακτήρας της γλώσσας Το νόημα = σημαινόμενο του γλωσσικού σημείου συγκροτείται στη.
Λεξικολογία Ενότητα 1: Εισαγωγικές έννοιες Γιώργος Ι. Ξυδόπουλος Σχολή Ανθρωπιστικών και Kοινωνικών Eπιστημών Τμήμα Φιλολογίας.
Απόκτηση και Αναπαράσταση Γνώσης. Μηχανική Γνώσης (Knowledge Engineering) Η Μηχανική Γνώσης μπορεί να εξετασθεί από δύο διαφορετικές απόψεις. Αυτή που.
Εισαγωγή στις Αρχές της Επιστήμης των Υπολογιστών Β’ τάξη Γενικού Λυκείου Γενικής παιδείας Καθηγητής: Τζουμάκα Χριστίνα.
4 Μαίου 2012 Ομάδα 7 Βολιανίτη Γεωργία-Βαλεντίνα Καμπόλη Μαρίνα Κοντογιώργη Ιωάννα Τρίκολα Μαρίνα.
ΕΝΟΤΗΤΑ 1. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΕΦΑΛΑΙΟ 1.1 ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ 1.
7. Λόγος – Γλώσσα – Ομιλία Επίπεδα γλωσσικής ανάλυσης Φωνητική
Από το Web1.0 στον Web X.0 Καλτιριμτζής Ελ. Ιωάννης
ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ
Πρόγραμμα Προπτυχιακών Σπουδών Ροή Λ: Λογισμικό
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Μεθοδολογια εκπαιδευτικης ερευνας
Η θεωρία της επεξεργασίας των πληροφοριών
ΤΑ 8 ΘΑΝΑΣΙΜΑ ΑΜΑΡΤΗΜΑΤΑ ΤΟΥ ΠΟΛΙΤΙΣΜΟΥ ΜΑΣ
Επιστήμη των Υπολογιστών
Θέματα Γλωσσολογίας (α)
ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ
ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΑ ΥΠΟΔΕΙΓΜΑΤΑ  Προγραμματιστικό Υπόδειγμα: Είναι ένα πρότυπο ανάπτυξης προγραμμάτων, δηλ. μια καθορισμένη μεθοδολογία με βάση την οποία.
ΠΛΗΡΟΦΟΡΙΚΗ Γ΄ Γυμνασίου Α΄ Τρίμηνο
Σκοπός Η συνοπτική παρουσίαση
Μεταγράφημα παρουσίασης:

ΥΠΟΛΟΓΙΣΤΙΚΗ ΓΛΩΣΣΟΛΟΓΙΑ ΕΙΣΑΓΩΓΗ Ιστορικά ξεχωριστοί τομείς αρχίζουν να συγκλίνουν: Επεξεργασία Φυσικής Γλώσσας (NLP) Αναγνώριση Φωνής (speech recognition) Υπολογιστική Γλωσσολογία Υπολογιστική Ψυχογλωσσολογία

Ευρέως διαθέσιμα πλέον: μεγάλα Σώματα Κειμένων on-line Ηλεκτρονικά λεξικά Τράπεζες ορολογίας Συστήματα ελέγχου ορθογραφίας, γραμματικής & στυλ Συστήματα Ανάκτησης Πληροφοριών Συστήματα αναγνώρισης φωνής Συστήματα Μηχανικής Μετάφρασης

ΓΛΩΣΣΟΛΟΓΙΑ & ΠΛΗΡΟΦΟΡΙΚΗ Υπολογιστική Γλωσσολογία Computational Linguistics Η επιστήμη της γλώσσας που χρησιμοποιεί υπολογισμούς ως εργαλείο διερεύνησης Επεξεργασία Φυσικής Γλώσσας Natural Language Processing/NLP Η επιστήμη των υπολογισμών η οποία έχει ως αντικείμενο τις δομές δεδομένων & τους αλγορίθμους επεξεργασίας μιας φυσικής γλώσσας Γλωσσική Τεχνολογία Language Technology Aνάπτυξη συστημάτων επεξεργασίας φυσικής γλώσσας

ΓΛΩΣΣΟΛΟΓΙΑ & ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΗΣ ΓΛΩΣΣΑΣ (NLP) (1) Κλασσική γλωσσολογική προσέγγιση στον 1 αιώνα ζωής της επιστήμης: -Μελέτη μεμονωμένων φαινομένων βάσει περιορισμένων γλωσσικών δεδομένων με στόχο την ερμηνεία & τον καθορισμό του βαθμού παραγωγικότητας του κανόνα που διέπει το φαινόμενο -Ανάπτυξη γλωσσολογικών θεωριών/μοντέλων ανάλυσης των γλωσσικών δομών

ΣΤΟΧΟΙ ΓΛΩΣΣΟΛΟΓΙΚΗΣ ΕΞΕΤΑΣΗΣ Μέχρι 1980: έμφαση στη Δομή της γλώσσας - Περιγραφές (συγχρονικές/διαχρονικές) Φωνητικές/Φωνολογικές Μορφολογικές Συντακτικές - Καθολικές αρχές/ Τυπολογία γλωσσών Language Typology - Κατάκτηση γλώσσας/Ψυχογλωσσολογία Psycholinguistics - Κοινωνιογλωσσολογία Sociolinguistics

Δευτερεύουσας σημασίας: -Σημασιολογία Semantics -Πραγματολογία Pragmatics -Ανάλυση λόγου Discourse Analysis ΑΜΦΙΣΗΜΙΑ ΑΠΟΔΕΚΤΗ

ΦΩΝΗΤΙΚΗ/ΦΩΝΟΛΟΓΙΑ μελέτη φθόγγων ΜΟΡΦΟΛΟΓΙΑ μελέτη μορφημάτων (ελάχιστων μονάδων λεξικής ή γραμματικής σημασίας δυσ-προ-φερ-το-ς ΣΥΝΤΑΞΗ μελέτη συνταγμάτων (συντακτικών δομών των λέξεων) ΣΗΜΑΣΙΟΛΟΓΙΑ μελέτη σημασιών ΠΡΑΓΜΑΤΟΛΟΓΙΑ μελέτη τρόπων χρήσης γλώσσας για την επίτευξη στόχων ΑΝΑΛΥΣΗ ΛΟΓΟΥ μελέτη γλωσσικών μονάδων μεγαλύτερων των απλών εκφωνημάτων

ΓΛΩΣΣΟΛΟΓΙΑ & ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΗΣ ΓΛΩΣΣΑΣ (NLP) (2) Υιοθέτηση γλωσσολογικών θεωριών και ΕΛΕΓΧΟΣ της υπολογιστικής αποτελεσματικότητας αυτών βάσει εκτεταμένων γλωσσικών δεδομένων με στόχο τη κατανόηση της φυσικής γλώσσας & την ΑΡΣΗ ΤΗΣ ΑΜΦΙΣΗΜΙΑΣ (disambiguation)

ΣΥΝΕΠΕΙΑ Έλεγχος του μοντέλου γλωσσολογικής ανάλυσης ως προς τη κάλυψη του φαινομένου ανθεκτικότητά του (αντιμετώπιση μη αναμενόμενων δεδομένων) πολυπλοκότητα εφαρμογής του ως προς χώρο και χρόνο επεκτασιμότητά του προσαρμοστικότητά του δυνατότητα συντήρησής του

ΜΕΘΟΔΟΙ NLP & ΥΠΟΛΟΓΙΣΤΙΚΗΣ ΓΛΩΣΣΟΛΟΓΙΑΣ Βασισμένες στη γνώση rule/knowledge-based Στατιστικές data-driven Μοντέλα και αλγόριθμοι από: -Επιστήμη των Η/Υ -Γλωσσολογία -Τεχνητή Νοημοσύνη -Λογική -Μαθηματικά -Ψυχολογία -Φιλοσοφία -Γνωσιακή Επιστήμη

ΒΑΣΙΚΑ ΕΡΓΑΛΕΙΑ NLP για ανάλυση φωνητική, μορφολογική & συντακτική Μηχανές Καταστάσεων: διαδικαστικές State machines: procedural Καταστάσεις – μεταπτώσεις μεταξύ καταστάσεων– Αναπαράσταση εισόδου Αυτόματα Πεπερασμένων Καταστάσεων deterministic/non-deterministic FSA Trasnducers? (FST) Πεπερασμένων Καταστάσεων Αυτόματα με Βάρη Weighted Automata Μοντέλα Markov Κρυφά Μοντέλα Markov (ΗΜΜ)=Μοντέλα Markov εμπλουτισμένα με στοιχεία πιθανοτήτων

ΒΑΣΙΚΑ ΕΡΓΑΛΕΙΑ NLP για ανάλυση φωνητική, μορφολογική & συντακτική B) Τυπικά συστήματα κανόνων : δηλωτικά Formal rule systems: declarative Κανονικές Γραμματικές Regular Grammars & Κανονικές Σχέσεις Regular Relations Αλγεβρικές Γραμματικές Context-Free Grammars Γραμματικές Επαυξημένες με Χαρακτηριστικά? Feature-Augmented Grammars + παραλλαγές αυτών με στοιχεία πιθανοτήτων

ΒΑΣΙΚΑ ΕΡΓΑΛΕΙΑ NLP για ανάλυση σημασιολογική, πραγματολογική & λόγου Α) Λογική Λογική Πρώτης Τάξης First Order Logic = Κατηγορηματικός Λογισμός Predicate Calculus Δομές Χαρακτηριστικών Feature-Structures Σημασιολογικά Δίκτυα Semantic Networks Εννοιολογική Εξάρτηση Conceptual Dependency

ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 1 Χρήση Η/Υ στη λογοτεχνική ανάλυση Literary & Linguistic Computing Μηχανική Μετάφραση (ΜΜ) Machine Translation(ΜΤ) 17o αιώνα: πρόταση Descartes & Leibniz: Ανάγκη δημιουργίας λεξικών βασισμένων σε καθολικούς αριθμητικούς κώδικες

ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 2 -Μέσα 17ου αιώνα: Δημοσίευση παραδειγμάτων Cave Beck, Athanasius Kischer, Johann Becher -Kίνημα «Παγκόσμιας Γλώσσας» βασισμένης σε αρχές λογικής και εικονικά σύμβολα Interlingua του John Wilkins (1668) “Essay towards a Real Character & a Philosophical Language”

ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 3 18ος αιώνας – μέσα 20ου αιώνα: διάφορες προτάσεις για Παγκόσμια Γλώσσα Esperanto 1933: 2 πατέντες ανεξάρτητες α) Γαλλία: George Artsouni: αποθηκευτικό μηχάνημα σε χάρτινη ταινία όπου βρίσκεται το αντίστοιχο οποιασδήποτε λέξης σε άλλη γλώσσα 1937: επίδειξη πρωτοτύπου

3 στάδια μηχανικής μετάφρασης: ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 4 β) Ρωσία: P. Smirnov-Troyanski: 3 στάδια μηχανικής μετάφρασης: -ανθρώπινη ‘λογική’ ανάλυση των λέξεων της γλώσσας-πηγής στη βασική τους λημματική μορφή και καθορισμός των συντακτικών τους λειτουργιών -μηχανική μετατροπή των λημμάτων και συντακτικών λειτουργιών τους σε αντίστοιχη μορφή στη γλώσσα-στόχο -ανθρώπινη απόδοση στη γλώσσα-στόχο

Υπόμνημα: χρήση για Μηχανική Μετάφραση ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 5 1949: W. Weaver, Ίδρυμα Rockfeller, Η.Π.Α Υπόμνημα: χρήση για Μηχανική Μετάφραση μεταπολεμικών τεχνικών κρυπτογραφίας στατιστικής ανάλυσης θεωρία της πληροφορίας του Shannon λογικής και καθολικών γλωσσικών χαρακτηριστικών

Μηχανικής Μετάφρασης: ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 6 1951:1ος full-time ερευνητής σε ΜΜ στο ΜΙΤ: Yehoshua Bar-Hillel 1952: προτάσεις 1oυ συνεδρίου Μηχανικής Μετάφρασης: -σύνταξη -ελεγχόμενες γλώσσες controlled languages -κατασκευή συστημάτων υπογλώσσας -αναγνώριση ανάγκης pre- & post-editing

ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 7 1956: Πρώτη δημόσια επίδειξη συστήματος ΜΜ (Georgetown University-ΙΒM): 49 προτάσεις Ρωσικά-Αγγλικά Λεξιλόγιο 250 λέξεων 6 γραμματικοί κανόνες -Μεγάλης κλίμακας κρατική χρηματοδότηση στις ΗΠΑ την επόμενη 10ετία - Νέα projects ΜΜ σε Ρωσία και Αγγλία

ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 8 1956-1966: πολλές ενεργές ομάδες: Α) εμπειρικές μέθοδοι δοκιμής-λάθους, συχνά στατιστικές, με στόχο άμεσα λειτουργικά συστήματα (brute-force) Β) θεωρητικές μέθοδοι βασικής γλωσσολογικής έρευνας, με στόχο μακροπρόθεσμες λύσεις (perfectionist)

Παραδείγματα εμπειρικής προσέγγισης (pragmatically oriented): ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 9 Παραδείγματα εμπειρικής προσέγγισης (pragmatically oriented): -Λεξικογραφική προσέγγιση Παν/μιο Washington (Seattle)IBM Ρωσικά-Αγγλικά/ Πολεμική Αεροπορία ΗΠΑ -Στατιστική engineering προσέγγιση RAND Corporation -Institute of Precision Mechanics Σοβ. Ένωση -National Physical Laboratory Αγγλία

ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 10 -Μεγαλύτερη όλων: Georgetown University Επιτυχημένο Ρωσο-Αγγλικό σύστημα, τυπικό των συστημάτων 1ης γενεάς ΜΜ ‘Direct’ translation: ζεύγος 2 γλωσσών με αυστηρά προκαθορισμένη κατεύθυνση από μια γλώσσα-πηγή σε μια γλώσσα-στόχο

Παραδείγματα θεωρητικής προσέγγισης: ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 11 Παραδείγματα θεωρητικής προσέγγισης: -MIT -Παν/μιο Harvard -Παν/μιο Texas -Παν/μιο Καλιφόρνιας στο Berkeley -Institute of Linguistics Μόσχα -Παν/μιο Λένιγκραντ -Cambridge Language Research Unit (CLRU) -Παν/μιο Μιλάνου -Παν/μιο Grenoble

ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 12 Η έρευνα περιόδου 1956-1966 είναι σημαντικότατη, όχι μόνο για τη ΜΜ, μα κυρίως για την Υπολογιστική Γλωσσολογία και την Τεχνητή Νοημοσύνη (ανάπτυξη αυτοματοποιημένων λεξικών και τεχνικών συντακτικής ανάλυσης) Σημαντική συμβολή στη Γλωσσολογία

ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 13 Αποτυχία στις προσπάθειες δημιουργίας συστημάτων FAHQT Fully Automatic High Quality Translation 1960: Bar-Hillel (review of MT progress): “Σημασιολογικά εμπόδια στη ΜΜ μπορούν να ξεπεραστούν μόνο με τεράστιες ποσότητες εγκυκλοπαιδικής γνώσης για τον ‘πραγματικό κόσμο’” Πραγματολογία

Προοπτικές Μηχανικής Μετάφρασης ??? ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 14 -Λιγότερο φιλόδοξοι στόχοι -ΜΑHΤ Machine-Aided Human Translation -HAMT Human-Aided Machine Translation Computer-aided Translation (CAT) Προοπτικές Μηχανικής Μετάφρασης ??? 1966 Τελική ΈκθεσηAutomatic Language Processing Advisory Committee (ALPAC):

ΙΣΤΟΡΙΚΗ ΑΝΑΣΚΟΠΗΣΗ 15 « ΜΜ πιο αργή, λιγότερο ακριβής & διπλάσια ακριβότερη της ανθρώπινης» «Δεν υπάρχουν άμεσες ή προβλέψιμες προοπτικές χρήσιμης ΜΜ» «Δημιουργία μηχανικών εργαλείων για μεταφραστές, π.χ. ηλεκτρονικών λεξικών» «Συνεχής υποστήριξη βασικής έρευνας Υπολ.Γλωσσολογίας» ΤΕΛΟΣ ΚΡΑΤΙΚΗΣ ΧΡΗΜΑΤΟΔΟΤΗΣΗΣ στις ΗΠΑ ΑΡΧΗ ΥΠΟΛΟΓΙΣΤΙΚΗΣ ΓΛΩΣΣΟΛΟΓΙΑΣ/NLP/ ΓΛΩΣΣΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ

ΔΙΑΡΘΡΩΣΗ ΜΑΘΗΜΑΤΟΣ ΛΕΞΗ: Φωνητική/Φωνολογία Μορφολογία Αλγόριθμοι επεξεργασίας: Πεπερασμένα Αυτόματα