Αυτόματη Μετάφραση - Machine Translation Machine Translation (τα παραδείγματα από το: Speech and Language Processing – Daniel Jurafsky & James H. Martin 2000, Prentice-Hall, Inc
Interlingua Διαγλώσσα Χρησιμοποιώντας έννοιες
Ένα πρόβλημα του μοντέλου μετάβασης: Χρειάζονται σύνολα από κανόνες μετάβασης για κάθε ζευγάρι γλωσσών – μη πρακτικό για πολύγλωσσα περιβάλλοντα όπως η ΕΕ
Μοντέλο μετάβασης: Αλλαγή στην δομή και τις λέξεις της πρότασης εισόδου για την παραγωγή έγκυρης πρότασης της γλώσσας στόχου.
Εναλλακτικά: επεξεργασία για την εξαγωγή της σημασίας της εισόδου και παράσταση αυτής της σημασίας στην γλώσσα στόχου. Έτσι ένα σύστημα ΑΜ δεν θα χρειάζεται γνώση των διαφορών των γλωσσών, αλλά συντακτικούς και σημασιολογικούς κανόνες που θα χρησιμοποιούνται από τον διερμηνέα και παραγωγό της γλώσσας.
Προϋπόθεση Δυνατότητα αναπαράσταση γνώσης, μίας διαγλώσσας (interlingua), σε μορφή ανεξάρτητης της γλώσσας. Η διαγλώσσα θα αναπαριστά όλες τις προτάσεις που σημαίνουν το ίδιο πράγμα με τον ίδιο τρόπο, ανεξάρτητα από την γλώσσα.
Σημασιολογική ανάλυση της εισόδου της γλώσσας Χ σε αναπαράσταση διαγλώσσας και παραγωγή από την διαγλώσσα στην γλώσσα Υ.
Μικρό σταθερό σύνολο από θεματικούς ρόλους (thematic roles) Θεωρούνται καθολικά στις γλώσσες (language universals).
Θεματικοί Ρόλοι – thematic roles Οι θεματικοί ρόλοι είναι ένα σύνολο από κατηγορίες που παρέχουν μία ρηχή σημασιολογική γλώσσα για τον χαρακτηρισμό συγκεκριμένων θεμάτων (arguments)των ρημάτων. Είναι ένας τρόπος για την έκφραση ομοιοτήτων.
Δεν υπάρχει στάνταρ σύνολο θεματικών ρόλων, ωστόσο υπάρχουν ρόλοι που χρησιμοποιούνται ευρέως από υπολογιστικά συστήματα.
Μερικοί συχνά χρησιμοποιούμενοι θεματικοί ρόλοι AGENTthe volitional causer of an event EXPERIENCERthe experiencer of an event FORCEthe non-volitional causer of an event THEMEthe participant most directly affected by an event RESULTthe end product of an event CONTENTthe proposition or content of a propositional event INSTRUMENTan instrument used in an event BENEFICIARYthe beneficiary of an event SOURCEthe origin of the object of a transfer event GOAL the destination of an object of a transfer event
Παραδείγματα Θεματικών Ρόλων AGENTthe waiter spilled the soup EXPERIENCERJohn has a headache FORCEThe wind blows debris from the mall into the yards THEMEOnly after Benjamin Franklin broke the ice… RESULTThe French government has built a regulation-size base-ball diamond… CONTENTMona asked “you met Mary Ann at a supermarket”? INSTRUMENTHe turned to poaching catfish, stunning them with a shocking device.. BENEFICIARYWhen ever Ann Callahan makes hotel reservations for her boss… SOURCEI flew in from Boston. GOALI drove to Portland.
There was an old man gardening EVENTGARDENING MAN AGENTNUMBERSG DEFINITENESSINDEF ASPECTPROGRESSIVE TENSEPAST
Παρατήρηση: βέβαια δεν δίνεται η σύνταξη και σημασία της δομής του υπαρξιακού-there (η μη πλήρης ανάλυση σήμερα αριθμεί τις 124 σελίδες (Layoff, 1987).
Η διαγλώσσα απαιτεί εκτός της συντακτικής και σημασιολογική ανάλυση (semantic analyzer – σημασιολογικός αναλυτής). Η παραγωγή όμως γίνεται άμεσα από την διαγλώσσα χωρίς συντακτικούς μετασχηματισμούς.
Τι οντολογία (ontology) χρησιμοποιείται; Ποια είναι η κατάλληλη λίστα από έννοιες και σχέσεις για μία διαγλώσσα. Υπάρχει ελευθερία, αλλά η επιλογή της οντολογίας περιορίζει την αρχιτεκτονική του συστήματος.
Λεκτική μετάβαση Στην οντολογία στοιχεία ανεξάρτητα των γλωσσών. Man otoko, ningen, ojjisan Man GENERIC-HUMAN, MALE-HUMAN
Τεχνικές επεξεργασίας φυσικής γλώσσας. Το κομμάτι της μετάφρασης ελαχιστοποιείται.
Λεκτική αποσύνθεση – Lexical decomposition Αποσύνθεση των λέξεων στις έννοιες των συστατικών τους. was PASTPROGRESSIVE a SINGULARINDEFINITE drink (INGEST, FLUID, BY-MOUTH)
Τέτοιες αναπαραστάσεις θ μπορούσαν να είναι χρήσιμες για inference-based disambiguation. The policeman saw the man with a telescope. The policeman shot the man with a telescope. Δουλεύει με λίγα παραδείγματα ή σε πολύ μικρά θεματικά πεδία.
Πρακτικά, τέτοιες δυνατές τεχνικές που βασίζονται στην διαγλώσσα δεν χρησιμοποιούνται.
Κάνοντας λοιπόν τον συντακτικό και σημασιολογικό αναλυτή και/ή τον παραγωγό να κάνουν «λίγη» παραπάνω δουλειά, δεν χρειαζόμαστε συγκριτική γνώση.
Σχέση μεταξύ του Μοντέλου Μετάβασης και του Μοντέλου Διαγλώσσας Interlingua interpretationgeneration source language target language parse tree transfer parse tree parsing generation SL wordsTL words
Η επιπλέον δουλειά που χρειάζεται δεν είναι εύκολη. Ο σχεδιαστής του συστήματος πρέπει να εξαντλήσει τη σημασιολογία του πεδίου και να το τυποποιήσει σε μία οντολογία. Στις υπογλώσσες είναι πραγματοποιήσιμο. Γενικά είναι πάντως τέχνη.
Η διαγλώσσα απαιτεί το σύστημα να αποσαφηνίζει σε κάθε στιγμή με αποτέλεσμα δουλειά που δεν είναι πάντα απαραίτητη. ELDER BROTHER – YOUNGER BROTHER Απαραίτητο για Ιαπωνικά-Κινέζικα Όχι για Αγγλικά-Γερμανικά
Επιπλέον χρειάζονται τεχνικές για την διατήρηση της ασάφειας (preserving ambiguity) ώστε η έξοδος να είναι ασαφής στον ίδιο βαθμό με την είσοδο.