MUltilingual Subtitling of multimediA content Τεχνικές Αυτόματου Υποτιτλισμού MUltilingual Subtitling of multimediA content
Σημασία του Υποτιτλισμού Μεταφορά διαλόγων και αφήγησης σε μια ξένη γλώσσα Προσέγγιση κοινού που περιλαμβάνει περισσότερες από μία γλωσσικές ομάδες Χρήση υποτίτλων για να καλυφθούν οι ανάγκες των ανθρώπων με προβλήματα ακοής Υπότιτλοι: Στην ίδια γλώσσα: μονογλωσσικός υποτιτλισμός Μετάφραση: πολυγλωσσικός υποτιτλισμός
Υποτιτλισμός: Ιδιαιτερότητες Συμφωνία μεταξύ των υποτίτλων της προφορικής γλώσσας-πηγής και της εικόνας στην οποία αντιστοιχούν οι υπότιτλοι Σύνολο περιορισμών που επιβάλλονται από χωροχρονικούς παράγοντες: Αριθμός χαρακτήρων, λέξεων και γραμμών Χρονικό διάστημα μεταξύ δύο υποτίτλων Χρονικό διάστημα μεταξύ του προφορικού λόγου και του υποτίτλου
Στόχοι του IST-MUSA Σύστημα υποβοήθησης της διαδικασίας του υποτιτλισμού με αυτόματη μονογλωσσική και πολυγλωσσική παραγωγή υποτίτλων Μείωση του χρόνου και του κόστους του υποτιτλισμού Γλώσσες του έργου: Αγγλικά: πηγή και στόχος Γαλλικά και Ελληνικά: στόχος
Ενσωματωμένες Τεχνολογίες Αυτόματη Αναγνώριση Φωνής (ASR) για τη μεταγραφή από τα Αγγλικά του προφορικού λόγου Συμπίεση κειμένου για την παραγωγή Αγγλικών υποτίτλων από το μεταγραμμένο κείμενο Τεχνολογίες Μηχανικής Μετάφρασης και Μεταφραστικής Μνήμης για την παραγωγή υποτίτλων σε Γαλλικά και Ελληνικά
Αναγνώριση Φωνής Έχουμε δύο τρόπους λειτουργίας στο στάδιο αναγνώρισης φωνής. Ο ένας τρόπος, ο «προφανής» προσπαθεί απλώς να απομονώσει κομμάτια ομιλίας στο ηχητικό σήμα, να αναγνωρίσει τα όσα λένε οι ομιλητές και να αναγνωρίσει σημεία όπου αλλάζει ο ομιλητής. Στην περίπτωση όμως που διαθέτουμε το script, την χειρωνακτική καταγραφή των όσων ακούγονται, προσπαθούμε να ευθυγραμμίσουμε το αποτέλεσμα του ASR με το σωστό transcript που διαθέτουμε. Και στις δύο περιπτώσεις, παίρνουμε στην έξοδο μεταγραμμένο κείμενο μαζί με timecodes.
Υποτιτλισμός για ΕΝ: Περιορισμοί και Συμπίεση Οι περιορισμοί επιβάλλουν την συμπίεση του κειμένου των υποτίτλων Το ποσοστό συμπίεσης εκφράζεται σε αριθμό λέξεων και αριθμό χαρακτήρων που πρέπει να διαγραφούν Πίνακας παραφράσεων Within the next few years -> Soon During the years when -> While It was clear that -> Clearly Μορφοσυντακτική ανάλυση και κανόνες για τη διαγραφή «μη σημαντικών» μονάδων (π.χ. επιρρήματα, κ.λπ.) It was generally acknowledged -> It was acknowledged
Μετάφραση και Τελική Επεξεργασία Μετάφραση των Αγγλικών υποτίτλων σε Γαλλικά και Ελληνικά με Τεχνολογίες Μεταφραστικής Μνήμης (ΤΜ) και Αυτόματης Μετάφρασης Ενσωμάτωση ορολογικών λεξικών και Ειδικών λεξικών με κύρια ονόματα κ.α. Κατάτμηση των υποτίτλων σε γραμμές Υπολογισμός του cue-in/cue out Μετατροπή σε κατάλληλη μορφή για τη διεπαφή επεξεργασίας υποτίτλων
Παράδειγμα: EN
Παράδειγμα FR
Παράδειγμα EL
MUSA Web Site http://sifnos.ilsp.gr/musa