Αυτόματη Μετάφραση Machine Translation
«..Translation is a fine and exciting art, but there is much about it that is mechanical and routine..» Kay (1997)
Από το κεφαλαίου 45 της νουβέλα του 18ου αιώνα «The Story of the Stone» γνωστό και σαν «Dream of the Red Chamber», από τον Cao Xue Qin (Cao, 1792), με Κινεζικά διαλέκτου Mandarin, και μετάφραση από τον David Hawkes:
As she lay there alone, Dai-yu’s thoughts turned to Bao-chai.. Then she lishened to the insistent rustle of the rain on the bamboos and plantains outside her window. The coldness penetrated the curtains of her bed. Almost without noticing it she had begun to cry.
dai yuzizaichuangshanggan nia bao chai… Dai-yualoneonbedtopthink-of-with-gratitudeBao-chai youting jianchuangwaizhushaoxiangye zhe againlisten towindowoutsidebamboutipplantainleafof shang,yushengxili,qinghantou mu, on-top,rainsoundsighdrip,clearcoldpenetrate curtain bujueyoudixialeilai. not feelingagainfalldowntearscome.
Κινέζικα ονόματα (π.χ. Skybright) Χρόνος (π.χ. penetrated) “her window” αντί για “the window” “curtain of her bed” αντί για “curtain”
Βαθιά κατανόηση της γλώσσας-πηγής (source language) Ικανότητα δημιουργικής γραφής στην γλώσσα-στόχου (target language)
Rough translation Post-editing Sublanguage domains
Rough Translation We are a standard association Lo of 1901 and our raison d’ecirc;tre is to practice, promote, make discover Painball, and to support our teams of competition of necessary: …If you have questions, desires of organisation of parts, desires of playing very short and desires for discovering, do not hesitate to contact us by mail or telephone or even . … With leaving season 97/98 and especially at the beginning of this season 98/99, manpower of the HORS-TAXE are modified!
Η ΑΜ σε τέτοιες περιπτώσεις μπορεί μερικές φορές να αποφευχθεί με την χρήση τεχνικών της cross-language information retrieval για την εξαγωγή κειμένων σε γλώσσα άλλη από αυτή στην οποία έγινε η ερώτηση
Post-editing Ακολουθεί μία rough translation Computer-aided human translation (CAHT ή CAT) Π.χ. Computer manuals for localization, market-moving financial news
Sublanguage domains Η ασάφεια είναι σπάνια Π.χ. πρόγνωση καιρού ασθενείς άνεμοι εντάσεως 3 με 4 βαθμών, βαθμιαία αύξηση της θερμοκρασίας από τα δυτικά, κ.τ.λ.
Ομοιότητες και διαφορές των Γλωσσών
Μερικά φαινόμενα είναι καθολικά (universals) π.χ. λέξεις που αναφέρονται σε γυναίκες, άντρες, παιδιά, φαγητό, ποτό, λέξεις ευγένειας, π.χ. ουσιαστικά, επίθετα
Τυπολογία (typology) Η μελέτη συστηματικών γλωσσολογικών ομοιοτήτων και διαφορών μεταξύ των γλωσσών (Croft 1990; Comrie 1989)
Μορφολογία Απομονωτικές γλώσσες (isolating), κάθε λέξη ένα μόρφημα π.χ. Βιετναμεζικά, Καντονεζικά Πολυσυνθετικές (polysynthetic), μία λέξη πολλά μορφήματα, π.χ. Σιβηριακά Yupik (Eskimo)
Agglutinative languages, τα μορφήματα έχουν ξεκάθαρα όρια, π.χ. Τουρκικά Fusion languages, μορφήματα μπορούν να συνδιαστούν, π.χ. Ρωσικά
Σύνταξη SVO γλώσσες, π.χ. Γερμανικά Αγγλικά, Γαλλικά, Mandarin SOV γλώσσες, π.χ. Ιαπωνικά VSO γλώσσες, π.χ. Ιρλανδικά, Κλασσικά Αραβικά, Βιβλικά Εβραϊκά
Οι SVO γλώσσες έχουν γενικά προθέσεις ενώ οι SOV επιθέσεις, π.χ. στα Ιαπωνικά “Tokio ni” για «στο Τόκυο» (με κίνηση)
Συντακτικο-Μορφολογικά Head marking vs dependent marking γλώσσες (Nichols, 1986) Αγγλικάtheman- A ’s H house Ουγγρικάazember H hàz- A a themanhouse-his H: head noun A: affix
Οι γλώσσες χαρακτηρίζονται και με το αν η κατεύθυνση και τρόπος κίνησης στο ρήμα ή στους «δορυφόρους» (Talmy 1985; 1991) Στα Αγγλικά η κατεύθυνση στο particle out (satellite-framed), π.χ. Jump down, run after: The bottle floated out. Στα ισπανικά η κατεύθυνση στο ρήμα (verb-framed), π.χ. entrar, salir, acercarse: Labotellasalióflotando. Thebottleexited floating.
Verb-framed γλώσσες: Romance, Semitic, Japanese, Tamil, Polynesian, τα περισσότερα Bantu και Mayan, Nez Perce, και Caddo Satellite-framed γλώσσες: οι περισσότερες Ινδο-Ευρωπαϊκές πλην των Romance, Finno-Ugrin, Chinese, Ojibwa και Warlpiri.
Ειδικά χαρακτηριστικά Το there της Αγγλικής Π.χ. There burst into the room three men with guns.
Απλά αλλά σημαντικά π.χ. ημερομηνίες MM-DD-YY στα Αμερικανικά Αγγλικά DD/MM/YY στα Βρετανικά Αγγλικά ΥΥΜΜDD στα Ιαπωνικά (αλλά και βάση την αρχή του σημερινού αυτοκράτορα)
Λέξεις Κάποιες μεταφράζονται άμεσα, π.χ. γάτα, σοκολάτα Μία λέξη μεταφράζεται σε φράση, π.χ. Informatique (Γαλλικά) σε computer science (Αγγλικά), πληροφορική και επιστήμη υπολογιστών (Ελληνικά)
Κατά την μετάφραση μπορεί να αλλάζει το μέρος του λόγου: Το ρήμα like στα Αγγλικά γίνεται επίρρημα gern στα Γερμανικά, she likes to sing – sie singt gerne
Γραμματικοί περιορισμοί Στα Αγγλικά γένος στις αντωνυμίες ενώ στα Mandarin όχι Στα Αγγλικά “they”, στα Γαλλικά “ils” και “elles” για τα αρσενικά και θηλυκά αντίστοιχα Στα Αγγλικά “is”, στα Ιαπωνικά “iru” στα έμψυχα, “aru” στα άψυχα.
Σημασιολογία
ΑγγλικάΙαπωνικάMandarin Brotherotooto (younger)gege (younger) Oniisan (older)didi (older) ΑγγλικάΓαλλικά Knowconnaître (κάποιον) Savoir (κάτι) Theyils (αρσενικό) Elles (θηλυκό) ΑγγλικάΓερμανικά WallWand (εσωτερικός) Mauer (εξωτερικός) ΓερμανικάΑγγλικά Berghill mountain MandarinΑγγλικά Tāhe, she, it
Λεκτικό κενό (lexical gap) Όχι λέξη ή φράση για να εκφράσει ακριβώς την σημασία λέξης της γλώσσας πηγής Π.χ. Δεν υπάρχει λέξη για το privacy στα Ιαπωνικά
Δύο γλωσσολογικά κείμενα με τις ίδιες λέξεις και γραμματική μπορεί να έχουν διαφορετικά ερμηνείες εξαιτίας των διαφορών στον πολιτισμό (Steiner, 1975; Barnstone, 1993; Hofstadter, 1997)
Sapir-Whorf hypothesis «η γλώσσα μπορεί να περιορίσει την σκέψη» Δεν μπορεί να υπάρξει τέλεια μετάφραση αφού οι ομιλητές της γλώσσας πηγής και της γλώσσας στόχου έχουν διαφορετικούς τρόπους αντίληψης Η διαδικασία της μετάφρασης δεν μπορεί να είναι εύκολη