Τελικός Έλεγχος Sub4All, 8 Μαΐου 2008 1 Sub4All: Συμπύκνωση Κειμένου για την Παραγωγή Υποτίτλων Π. Προκοπίδης - ΙΕΛ.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Ταξινόμηση Κειμένων με Νευρωνικά Δίκτυα. Γ. Ταμπουρατζής Ινστιτούτο Επεξεργασίας του Λόγου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ10/12/2002 INSTITUTE FOR LANGUAGE.
Advertisements

Πρόγραμμα Εκπαίδευσης Μουσουλμανοπαίδων
Ισχυρισμοί διατροφής και υγείας Παρόν και μέλλον Βασίλης Μαθιουδάκης
Γ ΛΩΣΣΙΚΟΙ Π ΟΡΟΙ & Τ ΕΧΝΟΛΟΓΙΕΣ : Η ΣΗΜΕΡΙΝΗ ΕΛΛΗΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ Πένυ Λαμπροπούλου Ινστιτούτο Επεξεργασίας Λόγου / Ε.Κ. "Αθηνά" Ημερίδα παρουσίασης.
Copyright © 2005 Elsevier Κεφάλαιο 2 :: Σύνταξη των γλωσσών προγραμματισμού Πραγματολογία των Γλωσσών Προγραμματισμού Michael L. Scott.
Επιμέλεια: Δέγγλερη Σοφία
Οδηγός δημιουργίας ιστολογίου στο blogger.com
Ανάκτηση και Εξαγωγή Πληροφορίας από Πολυμεσικές και Πολυγλωσσικές
Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.
Τμήμα Εκπαιδευτικής Τεχνολογίας (ΤΕΤ) Ινστιτούτο Επεξεργασίας του Λόγου Φιλογλωσσία Διδασκαλία της Ελληνικής ως ξένης γλώσσας (2η Δράση του ΙΕΛ στην Γλωσσική.
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
ΥΠΟΠΡΟΓΡΑΜΜΑΤΑ ΤΜΗΜΑΤΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ
Οδηγίες Σχεδίασης Διαδραστικών Συστημάτων
Εργαστήριο μαθήματος «Τεχνολογία Γνώσης» Σαντιπαντάκης Γιώργος
Οι διαφάνειες αυτού του μαθήματος βασίζονται
MUltilingual Subtitling of multimediA content
Κεφάλαιο 2ο Πεπερασμένα αυτόματα.
Κοντινότεροι Κοινοί Πρόγονοι α βγ θ δεζ η π ν ι κλμ ρσ τ κκπ(λ,ι)=α, κκπ(τ,σ)=ν, κκπ(λ,π)=η κκπ(π,σ)=γ, κκπ(ξ,ο)=κ ξο κκπ(ι,ξ)=β, κκπ(τ,θ)=θ, κκπ(ο,μ)=α.
Δομές Αναζήτησης TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A Χειριζόμαστε ένα σύνολο στοιχείων όπου το κάθε.
Οργάνωση πληροφοριών Ευρετηρίαση Μέρος Β Σχεδιασμός ευρετηρίων.
Έντυπη ειδησεογραφία.
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
Λεξικολογία-Λεξικογραφία
Ιόνιο Πανεπιστήμιο ΠΜΣ Επιστήμη της Πληροφορίας Διατύπωση Ερωτημάτων σε XML τεκμήρια με τη γλώσσα XQuery Εργασία για το μάθημα Ηλεκτρονική Δημοσίευση Υπεύθυνος.
Σχεδίαση Αλγορίθμων. Διεργασίες (1/2) Μία διεργασία αλληλεπιδρά με το περιβάλλον της δεχόμενη είσοδο και παράγοντας έξοδο.
Generating Chinese Classical Poems with Statistical Machine Translation Models Jing He, Ming Zhou, Long Jiang Μαρία Κωστάκη Εθνικό & Καποδιστριακό Πανεπιστήμιο.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ: «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΜΑΘΗΜΑ: ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΕΡΓΑΣΙΑ: MULTI-DOCUMENT SUMMARIZATIONS.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
Διδακτική της Πληροφορικής ΗΥ302 Εργασία :Παρουσίαση σχολικού βιβλίου Γ’ Λυκείου Τεχνολογικής Κατεύθυνσης «Ανάπτυξη εφαρμογών σε προγραμματιστικό περιβάλλον»
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών – Τμήμα Πληροφορικής και Τηλεπικοινωνιών 1 Κεφάλαιο 3 Η Σημασιολογία των Γλωσσών Προγραμματισμού Προπτυχιακό.
Ταξίδι στον κόσμο της Γλώσσας Β’ Δημοτικού
Επεξεργασία Κειμένου Ονομ/νυμο Επιμορφωτή Επιμορφωτής: Ονομ/νυμο Επιμορφωτή ΥΠΕΠΘ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΠΡΟΓΡΑΜΜΑ «ΚΟΙΝΩΝΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΕΠΙΜΟΡΦΩΣΗ.
ΜΑΘΗΜΑ: ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ ΔΙΔΑΣΚΟΝΤΕΣ: Κ. ΛΑΖΟΣ - Π. ΚΑΤΣΑΡΟΣ Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τρίτη, 14 Απριλίου 2015Τμ.
Μεταγλωττιστές (Compilers) (Θ) Ενότητα 13: Επαναληπτικό μάθημα Κατερίνα Γεωργούλη Τμήμα Μηχανικών Πληροφορικής ΤΕ Το περιεχόμενο του μαθήματος διατίθεται.
Μεταγλωττιστές (Compilers) (Θ) Ενότητα 8: Πίνακας Συμβόλων Κατερίνα Γεωργούλη Τμήμα Μηχανικών Πληροφορικής ΤΕ Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας.
Αλγόριθμοι - Τμήμα Πληροφορικής ΑΠΘ - 4ο εξάμηνο1 Ανάλυση Αλγορίθμων b Θέματα: Ορθότητα Χρονική αποδοτικότητα Χωρική αποδοτικότητα Βελτιστότητα b Προσεγγίσεις:
Οργάνωση πληροφοριών Ταξινόμηση (Θ) Ενότητα 4: Αρχιτεκτονική της Ευρετηρίασης (β μέρος) Δάφνη Κυριάκη-Μάνεση Τμήμα Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης.
Γλώσσα και σκέψη Με τον όρο σκέψη εννοούμε ένα μεγάλο φάσμα νοητικών διεργασιών: Επεξεργασία εννοιών, επίλυση προβλημάτων, ονειροπόληση, προγραμματισμό.
Μεταγλωττιστές (Compilers) (Θ) Ενότητα 11: Βελτιστοποίηση Ενδιάμεσου Κώδικα Κατερίνα Γεωργούλη Τμήμα Μηχανικών Πληροφορικής ΤΕ Ανοικτά Ακαδημαϊκά Μαθήματα.
Γραφικό Περιβάλλον Συγγραφής Κανόνων στο Σημασιολογικό Διαδίκτυο Διπλωματική Εργασία της Βασιλικής Ζερβάκη Επιβλέπων Καθηγητής: Νικόλαος Βασιλειάδης Θεσσαλονίκη.
Υποτιτλισμός παράθυρο σε μα ξένη κουλτούρα Υποερώτημα Η ελληνική πραγματικότητα στο χώρο του υποτιτλισμού. Όνομα ομάδας: Άντε γειά Μέλη ομάδας : Αθανασοπούλου.
Κατάκτηση της γλώσσας από το παιδί Ο γενικευτικός και αφαιρετικός χαρακτήρας της γλώσσας Το νόημα = σημαινόμενο του γλωσσικού σημείου συγκροτείται στη.
ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ ΙΣΤΟΡΙΑ ΝΕΑ ΕΛΛΗΝΙΚΑ
Γλώσσες Προγραμματισμού Μεταγλωττιστές Πίνακας Συμβόλων Πανεπιστήμιο Μακεδονίας Τμήμα Εφαρμοσμένης Πληροφορικής Ηλίας Σακελλαρίου.
Σ ύστημα Σ υγχρονικής Λ ήψης και Α πεικόνισης (Microcomputer Based Labs)
ΤΡΟΠΟΣ ΣΥΓΓΡΑΦΗΣ ΕΠΙΣΤΗΜΟΝΙΚΩΝ ΕΡΓΑΣΙΩΝ
4 Μαίου 2012 Ομάδα 7 Βολιανίτη Γεωργία-Βαλεντίνα Καμπόλη Μαρίνα Κοντογιώργη Ιωάννα Τρίκολα Μαρίνα.
Προγραμματισμός έργων
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ
Μελλοντικές Προκλήσεις στην Επιστήμη και Μηχανική του Περιβάλλοντος
Διδακτική αρχαίων ελληνικών Α΄ λυκείου από πρωτότυπο κείμενο
ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ
Κεφάλαιο 4 :: Σημασιολογική Ανάλυση
- Πειραματικές Ασκήσεις –
να ζήσει μέχρι και 60 μέρες χωρίς τροφή, αλλά όχι πάνω
Άκουσμα Διαδικτυακό λογισμικό για αλλόφωνους μαθητές με δραστηριότητες για την κατανόηση προφορικού λόγου.
Υποκείμενο-Ρήμα-Αντικείμενο-Κατηγορούμενο
ΣΥΝΟΠΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ POWERPOINT
Συστήματα Θεματικής Πρόσβασης (Θ)
Μοντέλα διδασκαλίας της γλώσσας Σχετίζονται με εκάστοτε θεώρηση και αντίληψη για γλώσσα και παιδαγωγικές και διδακτικές τάσεις που επικρατούν. Η διδακτική.
Δομές Αναζήτησης Χειριζόμαστε ένα σύνολο στοιχείων όπου το κάθε στοιχείο έχει ένα κλειδί από ολικά διατεταγμένο σύνολο Θέλουμε να υποστηρίξουμε δύο.
Μορφοποίηση Περιεχομένου και εμφάνισης κελιών, γραμμών, στηλών
Οδηγός δημιουργίας ιστολογίου στο blogger.com
Εννοιολογική Χαρτογράφηση
Ξενοφών, ελληνικά, Επεξεργασία κειμένου με σκοπό την εμπέδωση της αναγνώρισης συντακτικών όρων μιας πρότασης και την κατανόηση του συντακτικού ρόλου.
Εισαγωγή στα Προσαρμοστικά Συστήματα
Τεχνολογίες προστασίας πνευματικών δικαιωμάτων στον ψηφιακό κόσμο
Άκουσμα Διαδικτυακό λογισμικό για αλλόφωνους μαθητές με δραστηριότητες για την κατανόηση προφορικού λόγου.
ΣΥΓΓΡΑΦΗ ΕΠΙΣΤΗΜΟΝΙΚΗΣ ΕΡΓΑΣΙΑΣ
Κεφάλαιο 11 Τροποποίηση φόρμας.
Μεταγράφημα παρουσίασης:

Τελικός Έλεγχος Sub4All, 8 Μαΐου Sub4All: Συμπύκνωση Κειμένου για την Παραγωγή Υποτίτλων Π. Προκοπίδης - ΙΕΛ

Τελικός Έλεγχος Sub4All, 8 Μαΐου Αρχιτεκτονική ΥΕΣΚ

Τελικός Έλεγχος Sub4All, 8 Μαΐου Περιορισμοί Περιορισμοί όσον αφορά τη χωρική παράμετρο (διάταξη) και τη χρονική παράμετρο (διάρκεια). Βάσει της πληροφορίας χρονισμού που παράγει το ΥΜΦ, υπολογισμός του αριθμού –των λέξεων και –των χαρακτήρων που πρέπει να διαγραφούν, για την ικανοποίηση των περιορισμών ΠεριορισμόςΕύρος τιμής Ρυθμός λέξεων 2.5 – 3 λέξεις/δευτ. Χρόνος εισόδου 0.25 δευτ. Καθυστέρηση μεταξύ 2 συνεχόμενων υποτίτλων 0.20 δευτ. Χαρακτήρες σε έναν πλήρη υπότιτλο 2 γραμμών 70 χαρακτήρες Λέξεις σε έναν πλήρη υπότιτλο 2 γραμμών 14 λέξεις Λέξεις σε έναν πλήρη υπότιτλο μίας γραμμής 7 λέξεις

Τελικός Έλεγχος Sub4All, 8 Μαΐου Περιορισμοί: παράδειγμα <Segment id="seg523" speaker="" mediaTimeStart=" " mediaTimeDuration="11545" xml:lang="el« constraint_w="2" constraint_c="3" subtitles="3"> Τα πλεονεκτήματά της δεν αξιοποιούνται από τη χώρα μας, ενώ αξιοποιούνται απ' όλες τις άλλες χώρες της Ευρωπακής Ένωσης και τα μειονεκτήματά της μεγεθύνονται. Το Υπουργείο Αγροτικής Ανάπτυξης και Τροφίμων απουσιάζει.

Τελικός Έλεγχος Sub4All, 8 Μαΐου Μορφοσυντακτική ανάλυση Μορφολογικός χαρακτηρισμός (POS Tagging) –λόγος-NoCmMaSgNm [No = ουσ., Cm = κοινό, Ma = αρσ., Sg = ενικ., Nm = ονομ.] Λημματοποίηση –απαντήσεις [NoCm...] -> απάντηση –απαντήσεις [VbMn...] -> απαντώ Αναγνώριση γραμματικών σχέσεων (υποκείμενο, αντικείμενο, κ.λπ.) με έναν συντακτικό αναλυτή που παράγει δένδρα εξαρτήσεων

Τελικός Έλεγχος Sub4All, 8 Μαΐου Παράδειγμα ανάλυσης Γιατί <Word depRel="Pred" head="0" id="w_704_2" lemma="ωριμάζω" tag="VbMnIdPr03PlXxIpAvXx">ωριμάζουν οι συνθήκες για να <Word depRel="Adv" head="5" id="w_704_7" lemma="έρχομαι" tag="VbMnIdXx03SgXxPePvXx">έρθει αυτή η ρύθμιση. Γιατί ωριμάζουν οι συνθήκες για να έρθει αυτή η ρύθμιση.

Τελικός Έλεγχος Sub4All, 8 Μαΐου Εφαρμογή παραφράσεων Ημιαυτόματη δημιουργία πίνακα παραφράσεων από διαθέσιμους λεξικούς πόρους, όπως –ο Εθνικός Θησαυρός Ελληνικής Γλώσσας (ΕΘΕΓ) [Γαβριηλίδου κ.α. 1993] και –το Λεξικό Συνωνύμων και Αντιθέτων της Άννας Ιορδανίδου [Ιορδανίδου 2006] 450 παραφράσεις 503 λημμάτων 9860 παραφράσεις μεταξύ τύπων με κοινά μορφολογικά χαρακτηριστικά: <Paraphrase id="Para_6501" source="θιασώτες" stag="NoCmMaPlAc" target="οπαδούς" ttag="NoCmMaPlAc"/> <Paraphrase id="Para_6503" source="θιασώτες" stag="NoCmMaPlNm" target="οπαδοί" ttag="NoCmMaPlNm"/> Μονόδρομες αλλά και αμφίδρομες παραφράσεις

Τελικός Έλεγχος Sub4All, 8 Μαΐου Κανόνες διαγραφής Απαλοιφή στοιχείων δευτερεύουσας σημασιολογικής πληροφορίας Είσοδος: τα δένδρα εξάρτησης από τον συντακτικό αναλυτή Οι κανόνες –διατρέχουν τους κόμβους του δένδρου –ελέγχουν αν συγκεκριμένοι μορφοσυντακτικοί περιορισμοί ισχύουν για κάθε κόμβο: π.χ. σχέση του κόμβου προς την κεφαλή του ή/και γραμματικά χαρακτηριστικά του κόμβου (ή/και του προγόνου ή των παιδιών του κόμβου) Όταν οι περιορισμοί επαληθεύονται για τον τρέχοντα υπό εξέταση κόμβο, ο κόμβος, και το υποδένδρο του σημειώνονται ως deletables (προς διαγραφή)

Τελικός Έλεγχος Sub4All, 8 Μαΐου Παράδειγμα κανόνα διαγραφής deleteAdjectivesWithoutChildren εντοπίζει επίθετα τα οποία –δεν αποτελούν κεφαλές μεγαλύτερων υποδένδρων –δεν έχουν αναγνωριστεί ως κατηγορούμενα που έχουν ως κεφαλή τους ένα συνδετικό ρήμα. sub deleteAdjectivesWithoutChildren { my $node = shift; if ($node->children()) { # recursively apply rule if there are children nodes foreach my $child ($node->children()) { deleteAdjectivesWithoutChildren($child); } # An adjective not headed by a copula verb } elsif (($node->getAttribute("tag") =~ /^Aj/) && ($node->getAttribute("afun") ne /Pnom/)) { # mark as deletable setDeletable($node); }

Τελικός Έλεγχος Sub4All, 8 Μαΐου Εφαρμογή κανόνων στα συντακτικά δένδρα

Τελικός Έλεγχος Sub4All, 8 Μαΐου Ταξινόμηση των προς διαγραφή υποδένδρων Ταξινόμηση με βάση το άθροισμα του surprise value των κόμβων του υποδένδρου –υποθέτοντας πως οι υψίσυχνες λέξεις είναι λιγότερο σημαντικές [Daelemans et al. 2004] Εξαγωγή λεκτικών συχνοτήτων από ένα ελληνικό corpus 70M λέξεων Για κάθε λέξη w στο κείμενο της εισόδου, sv(w) = -log(Freq(w)/N)

Τελικός Έλεγχος Sub4All, 8 Μαΐου Παράδειγμα εφαρμογής παραφράσεων και κανόνων 13 Παράφραση (w_del=0, c_del=5): ανυπεράσπιστους → αβοήθητους Όπως είπε προηγουμένως και ο εισηγητής της Πλειοψηφίας, αφήσατε αβοήθητους στα καρτέλ τους κτηνοτρόφους, αφήσατε να ανθίσει και να καρπίσει η διαφθορά στην Επιτροπή Ανταγωνισμού, την κάνατε ξέφραγο αμπέλι και μας φέρνετε σήμερα ρυθμίσεις για να διορίσετε έναν ακόμα αντιπρόεδρο στον Ελληνικό Οργανισμό Γάλακτος. actn_1 40_2 deleteAllAdverbs WithoutChildren (rel= w_del=1, c_del=6): σήμερα Όπως είπε προηγουμένως και ο εισηγητής της Πλειοψηφίας, αφήσατε αβοήθητους στα καρτέλ τους κτηνοτρόφους, αφήσατε να ανθίσει και να καρπίσει η διαφθορά στην Επιτροπή Ανταγωνισμού, την κάνατε ξέφραγο αμπέλι και μας φέρνετε ρυθμίσεις για να διορίσετε έναν ακόμα αντιπρόεδρο στον Ελληνικό Οργανισμό Γάλακτος. actn_1 40_3 deleteAllAdverbs WithoutChildren (rel= w_del=1, c_del=12): προηγουμένως Όπως είπε και ο εισηγητής της Πλειοψηφίας, αφήσατε αβοήθητους στα καρτέλ τους κτηνοτρόφους, αφήσατε να ανθίσει και να καρπίσει η διαφθορά στην Επιτροπή Ανταγωνισμού, την κάνατε ξέφραγο αμπέλι και μας φέρνετε ρυθμίσεις για να διορίσετε έναν ακόμα αντιπρόεδρο στον Ελληνικό Οργανισμό Γάλακτος. actn_1 40_4 deleteAllAdjective sWithoutChildren (rel= w_del=1, c_del=7): ξέφραγο Όπως είπε και ο εισηγητής της Πλειοψηφίας, αφήσατε αβοήθητους στα καρτέλ τους κτηνοτρόφους, αφήσατε να ανθίσει και να καρπίσει η διαφθορά στην Επιτροπή Ανταγωνισμού, την κάνατε αμπέλι και μας φέρνετε ρυθμίσεις για να διορίσετε έναν ακόμα αντιπρόεδρο στον Ελληνικό Οργανισμό Γάλακτος.

Τελικός Έλεγχος Sub4All, 8 Μαΐου Τελική Επεξεργασία Χωρισμός των προτάσεων σε υπότιτλους περίπου ίσου μήκους με βάση τη μορφοσυντακτική πληροφορία –Χωρισμός, όπου αυτό είναι δυνατό, στα όρια συντακτικών ομάδων … –… και όχι, π.χ., ανάμεσα σε ένα άρθρο και ένα ουσιαστικό:...οι οποίες μετά από γενική συνέλευση έχουν ορίσει τη διάρκεια......της θητείας τους στα 4 χρόνια ή μπορούν να την ορίσουν. Υπολογισμός cue_in, cue_out Μορφοποίηση (αποσιωπητικά, κ.α.)

Τελικός Έλεγχος Sub4All, 8 Μαΐου Αξιολόγηση Μέθοδος Μέσος αριθμός διαγραφέντων χαρακτήρων Μέσος λόγος συμπύκνωσης Παράφραση % Κανόνες διαγραφής % Ποσοστό συμπύκνωσης ανά μέθοδο Αξιολόγηση, από 2 σχολιαστές, σε κλίμακα 1-5 της γραμματικής ορθότητας (GR1, GR2) και της σημασιολογικής αποδεκτότητας (SEM1, SEM2) 100 προτάσεων χειρωνακτικά σχολιασμένων στο επίπεδο της σύνταξης

Τελικός Έλεγχος Sub4All, 8 Μαΐου Συνεισφορά και προεκτάσεις Συνεισφορά –Ανάπτυξη πίνακα παραφράσεων ανάμεσα σε τύπους, και συνόλου κανόνων διαγραφής για τα Ελληνικά –Ενσωμάτωση στο πρωτότυπο παραγωγής υποτίτλων του Sub4All –P. Prokopidis, V. Karra, A. Papagianopoulou, S. Piperidis. Condensing sentences for subtitle generation. In Proceedings of the 6 th International Conference on Language Resources and Evaluation, (LREC), Marrakech, May ELRA. Προεκτάσεις –αυτόματη επέκταση του πίνακα παραφράσεων με τη χρήση παράλληλων κειμένων –ανάπτυξη φίλτρου για τη μη διαγραφή λέξεων σε πολυλεκτικούς όρους και παγιωμένες εκφράσεις –κανόνες για απλοποίηση κειμένου για αναγνώστες με διαφορετικές ικανότητες κατανόησης