ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
1 Εξατομίκευση στις Ψηφιακές Βιβλιοθήκες Βασιλακάκη Ευγενία
Advertisements

WEIGHTED CLUSTERING ΠΡΟΗΓΜΕΝΗ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Μιχάλης Χριστόπουλος Μ Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence.
Ο Καταχωρητής εργασίας W είναι ένας ειδικός καταχωρητής που συμμετέχει σε πολλές διαδικασίες κύρια στη μεταφορά και αποθήκευση δεδομένων.
Επίδραση φορολογικής πολιτικής στον κλάδο Κινητής Τηλεφωνίας Αύγουστος 2011 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ.
Εισαγωγή στη Βιοπληροφορική Ενότητα 9: Text Mining Μακρής Χρήστος, Τσακαλίδης Αθανάσιος, Ιωάννου Μαρίνα Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ και Πληροφορικής.
ΆΝΟΙΑ Ντόλκερας Γιώργος 4 ο έτος Ιατρική Λαρισας Πανεπιστήμιο Θεσσαλίας Φυσιολογία της Συμπεριφοράς Πανεπιστήμιο Θεσσαλίας Τμήμα Ιατρικής.
Ράνια Μούσσα Α ’ Γυμνασίου.  Υπερυπολογιστής ονομάζεται ένας υπολογιστής που διαφέρει αισθητά απ ' τους υπολογιστές που χρησιμοποιούνται από απλούς χρήστες.
ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Εισαγωγή. Συστάσεις Ι Ποιός είμαι εγώ: Γραφείο: Β.3 Προτιμώμενες ώρες γραφείου: 11:00-18:00 Ενδιαφέροντα Web mining,
Σπουδές και ανεργία των νέων, υπάρχουσα κατάσταση προοπτικές Εισηγητής: Κων/νος Αδριανουπολίτης Εκπαιδευτικός – Ερευνητής Πρόεδρος Ε.Ε.Τ.Ε.Κ.
Παπαμιχαήλ Δημήτρης MSc, BSc, RD Κλινικός Διαιτολόγος - Διατροφολόγος Τηλ : Διατροφή και Αθλητισμός.
1 Πανεπιστήμιο Θεσσαλίας – Σχολή Ανθρωπιστικών & Κοινωνικών Επιστημών – ΙΑΚΑ Τομέας Ιστορίας Εργαστήριο Ιστορίας Εκπόνηση εργασιών στην ιστορία
Σύμπραξη AGNovel Εκπαίδευση Δασκάλων - Ενότητα 3 : AGnovel - Το μυθιστόρημα - Ιστορία και Χαρακτήρες AGnovel Προηγμένα Διαδραστικά Εικονογραφημένα Μυθιστορήματα.
ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ ΗΛΕΚΤΡΟΝΙΚΟ ΕΠΙΧΕΙΡΕΙΝ.
Πληροφορίες μαθήματος Διδασκαλία Θεωρίας: Τετάρτη Εγγραφή στο eclass του μαθήματος Βιβλιογραφία μαθήματος: –Θεμελιώδεις Αρχές Συστημάτων Βάσεων.
1 Κριτήρια συλλεκτικής ωριμότητας φρούτων Το στάδιο ανάπτυξης στο οποίο θα συγκομιστεί το οπωροκηπευτικό προϊόν έχει πολύ μεγάλη σημασία για την μετασυλλεκτική.
Υπηρεσίες Μακροχρόνιας Φροντίδας στην Ελλάδα Στην Ελλάδα η Μ.Φ.Υ. είναι ελλιπώς ανεπτυγμένη. Οι υπηρεσίες Μ.Φ.Υ στην χώρα μας παρέχονται από το σύστημα.
1 Διοίκηση Επιχειρήσεων Ενότητα 7: Διοίκηση της Γνώσης Πουλιόπουλος Λεωνίδας Τμήμα Διεθνούς Εμπορίου.
Ανακαλύπτοντας την Πληροφορική: Βάσεις Δεδομένων Γεώργιος Χατζημηλιούδης Ειδικός Επιστήμονας 8 Οκτωβρίου 2015.
Μπούρχα Ιωάννα, Νικολάου Σπύρος, Φειδάκης Λεωνίδας ΠΕΙΡΑΜΑΤΙΚΟ ΣΧΟΛΕΙΟ ΠΑΝ. ΑΘΗΝΩΝ Επιβλέπουσα καθηγήτρια: Λαμπρινή Παπατσίμπα.
 X-band (9Ghz)  S-band(3Ghz)
Τοποθέτηση στο αμαξίδιο. Εναλλακτικές Θέσεις Θέσεις (Jaeger, 1987;
Thasos Charalambous Προσωπικά δεδομένα και Υπολογιστές Μια από τις πιο κοινές χρήσεις των υπολογιστών είναι η εγγραφή σε βάσεις δεδομένων με σκοπό την.
ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ ΜΕ ΧΡΗΣΗ JAVA: ΤΟ ΛΟΓΙΣΜΙΚΟ WEKA
Ποσοτικές Μέθοδοι Έρευνας Αρχική μέθοδος στην οποία στηρίχτηκε η συγκρότηση της εμπειρικής ή πειραματικής παιδαγωγικής ήταν το πείραμα, κάτω από την επίδραση.
Βασικές Έννοιες της Πληροφορικής
Ανοιχτά δεδομένα στη δημόσια υγεία Το παράδειγμα των ΗΠΑ και η προστιθέμενη αξία του για την Ευρωπαϊκή Ένωση Εβίκα Καραμαγκιώλη, Ελένη-Ρεβέκκα Στάιου,
ΓΙΑΠΡΑΚΗ ΖΩΗ ΤΑΦΙΛΗ ΑΘΗΝΑ.
ΕΡΕΥΝΗΤΙΚΕΣ ΕΡΓΑΣΙΕΣ Βασική βιβλιογραφία:
Δρ. Πέτρος Τομάρας Καθηγητής Μάρκετινγκ ΤΕΙ Αθήνας
Εξόρυξη γνώσης Εισαγωγή
Data Warehouse – Data Mining
Αξιολόγηση επενδύσεων
ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ
Εφαρμογεσ τηλεματικησ στη διοικηση
Περιεχομενο σημερινου μαθηματοσ
Εθνικό & Καποδιστριακό Πανεπιστήμιο Αθηνών
ΜΟΡΦΕΣ ΣΥΣΤΗΜΑΤΩΝ ΥΓΕΙΑΣ
Ενεργειακές Πρώτες Ύλες
Η ΧΡΗΜΑΤΟΔΟΤΗΣΗ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ ΥΓΕΙΑΣ.
ΕΝΟΤΗΤΑ 1 – Κεφάλαιο 1: Ο Υπολογιστής και η Επεξεργασία των Δεδομένων
Καθηγητής Γιώργος Πλειός
Εισαγωγή στις Βάσεις Δεδομένων
Στόχοι-Σκοποί: Ευαισθητοποίηση των μαθητών στις ήπιες μορφές ενέργειας
Παυλίνα Χατζηθεοδούλου Λοϊζίδου Προϊσταμένη Τομέα Επιμόρφωσης
RIPASSO 3.
ΕΡΕΥΝΑ – ΘΕΩΡΙΑ – ΕΠΙΣΤΗΜΟΝΙΚΗ ΓΝΩΣΗ
ΕΝΟΤΗΤΑ 1 – Κεφάλαιο 1: Ο Υπολογιστής και η Επεξεργασία των Δεδομένων
Γυμνάσιο Νέας Κυδωνίας
Πίνακας σταθερών των εμπειρικών τύπων Hazen-Williams και Manning για διάφορα υλικά κατασκευής των αγωγών.
ΕΝΟΤΗΤΑ 1 – Κεφάλαιο 1: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ
Μαθηματικά και Γραφιστική στα Logos των Ποδοσφαιρικών Ομάδων
Εισαγωγή στις Βάσεις Δεδομένων
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ
ΤΕΙ ΛΑΜΙΑΣ ΔΡ. ΘΕΟΔΩΡΟΣ ΜΗΤΑΚΟΣ
Ψηφιακό Δέντρο (Trie) και Δέντρο Επιθεμάτων (Suffix tree)
ΓΕΝΙΚΟΣ ΚΑΝΟΝΙΣΜΟΣ ΠΡΟΣΤΑΣΙΑΣ ΠΡΟΣΩΠΙΚΩΝ ΔΕΔΟΜΕΝΩΝ 2016/679 ΕΕ (GDPR)
ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΕΓΚΥΡΟΤΗΤΑ ΤΗΣ ΚΛΙΜΑΚΑΣ THE KIDNEY DISEASE QUESTIONNAIRE ΣΕ ΑΣΘΕΝΕΙΣ ΥΠΟ ΑΙΜΟΚΑΘΑΡΣΗ Αλικάρη Βικτώρια1, Τσιρώνη Μαρία2, Μάτζιου Βασιλική3,
Βασικές έννοιες (Μάθημα 1) Τίτλος: Μερικές βασικές έννοιες της Πληροφορικής 22/11/2018 Ξένιος Αντωνιάδης.
مديرة المدرسة أ. خالدة المير رئيسة القسم أ. منيرة العدواني
Μεθοδολογία Εκπαιδευτικής Έρευνας
Διαχείρισης Πιστωτικού Ελέγχου
Παρουσίαση 26/09/2005.
Διδάσκουσα Δρ. Γεωργία Κηπουροπούλου
17/2/2019 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ (2) Ενότητα A1.1 β Ο Δάσκαλος.
Ελαστικές και μη ελαστικές κρούσεις Αρχή διατήρησης της ορμής
ΑΣΚΗΣΗ 11: Υπολογισμός των συντελεστών κινητικής και στατικής τριβής .
Ανοιχτά Δεδομένα στην Ελλάδα: από το Παρόν στο Μέλλον
Μάρκετινγκ, εμπορική επικοινωνία
Από τα παράλληλα κείμενα στα αναγνωστικά δίκτυα
Programmable Logic Device PLD. Φύλλο δεδομένων (Data Sheet) των TTL ICs.
Μεταγράφημα παρουσίασης:

ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ Κατερίνα Φλώρου

Παράλληλα Σώματα Κειμένων Ένα παράλληλο σώμα κειμένων είναι μια συλλογή κειμένων, καθένα από τα οποία έχει μεταφραστεί σε μία ή περισσότερες γλώσσες από ένα πρωτότυπο κείμενο. Στην απλούστερη περίπτωση εμπλέκονται δύο μόνο γλώσσες: ένα από τα σώματα κειμένων αποτελεί τη μετάφραση του άλλου. Ωστόσο, ορισμένα παράλληλα σώματα κειμένων περιλαμβάνουν περισσότερες από μία γλώσσες.

Παράλληλα Σώματα Κειμένων (παραδείγματα) Παράλληλα σώματα κειμένων παράγονται σε πολύγλωσσους οργανισμούς όπως τα Ηνωμένα Έθνη, το ΝΑΤΟ, η Ευρωπαϊκή Ένωση και χώρες με περισσότερες από μία επίσημες γλώσσες, όπως ο Καναδάς.

Συγκρίσιμα Σώματα Κειμένων Περιλαμβάνουν μια συλλογή πρωτότυπων κειμένων στις εμπλεκόμενες γλώσσες, τα οποία έχουν σχεδιαστεί βάσει κριτηρίων ομοιότητας ως προς το περιεχόμενο, το θεματικό πεδίο και την επικοινωνιακή λειτουργία.

Ομοιότητες : Κοινό στοιχείο ανάμεσα στα δύο αυτά είδη σωμάτων κειμένων παραμένει η δυνατότητα της σύγκρισης μεταξύ των δομών δύο ή περισσότερων γλωσσών, καθώς και η δυνατότητα εφαρμογής ηλεκτρονικών εργαλείων επεξεργασίας και ανάλυσής τους.

Χρησιμότητα: Ως επί το πλείστον γίνεται χρήση των παράλληλων και συγκρίσιμων σωμάτων κειμένων στους τομείς της μετάφρασης, αλλά και: της εκπαίδευσης μεταφραστών, της δίγλωσσης λεξικογραφίας της μηχανικής μετάφρασης.

Παραδείγματα χρήσης: Η Bowker συνέκρινε την αποτελεσματικότητα ενός ειδικού μονόγλωσσου σώματος κειμένων σε φυσική γλώσσα με αυτή συμβατικών πηγών, π.χ. λεξικών, και κατέδειξε ότι τα σώματα κειμένων παρείχαν πληροφορίες που έλειπαν από τα λεξικά, ιδίως όσον αφορά την επιλογή των κατάλληλων όρων και τις ιδιωματικές εκφράσεις. Ο Williams απέδειξε ότι τα παράλληλα σώματα κειμένων συμβάλλουν στην επιλογή των κατάλληλων μεταφραστικών αντιστοιχιών κατά 40%, σε σύγκριση με τη συμβολή δίγλωσσων λεξικών.

Παράλληλα Σώματα Κειμένων: Η χρησιμότητα των παράλληλων κειμένων είναι προφανής: ο μεταφραστής μπορεί να δει πώς αντιμετωπίστηκαν ορισμένα μεταφραστικά ζητήματα από άλλους και να εμπνευστεί από αυτά. Υπάρχουν ορισμένοι τύποι μεταφραστικών προβλημάτων, για την επίλυση των οποίων χρειάζεται ο μεταφραστής να καταφύγει σε παράλληλα σώματα κειμένων, κι αυτό γιατί καταδεικνύουν τις στρατηγικές επίλυσης προβλημάτων που χρησιμοποιήθηκαν από επαγγελματίες μεταφραστές

Παράλληλα Σώματα Κειμένων: Συμβάλλουν στην εξαγωγή πληροφοριών και όρων, χρησιμοποιούνται δηλ. για ορολογική αναζήτηση σε μια τράπεζα δεδομένων, η οποία περιέχει ευθυγραμμισμένες δίγλωσσες προτάσεις. Η χρήση των παράλληλων σωμάτων κειμένων στη σύγχρονη υπολογιστική γλωσσολογία επιτρέπει σε ελάχιστο χρόνο την εξαγωγή ορολογίας και τη δημιουργία δίγλωσσων ή και πολύγλωσσων ορολογικών βάσεων και λεξικών. Ακόμη, καθίσταται δυνατή η ανάπτυξη, η εκπαίδευση και αξιολόγηση συστημάτων αυτόματης μετάφρασης.

Παράλληλα Σώματα Κειμένων: Μπορούν να συμβάλουν στη μελέτη του φαινομένου της υπερμετάφρασης, δηλαδή της μη φυσικής χρήσης της γλώσσας-στόχου που προκύπτει ως απόρροια της προσκόλλησης σε χαρακτηριστικά της γλώσσας-πηγής

ΑΛΛΑ: Η εργασία με μεταφράσεις σημαίνει εργασία με διαστρεβλωμένες κατοπτρικές εικόνες της γλώσσας- πηγής μέσω της γλώσσαςστόχου, ενώ ο στόχος είναι η ανάλυση και περιγραφή της γλώσσας αυθύπαρκτης και όχι ως γλώσσας-στόχου. Γι’ αυτό το λόγο, ενώ τα παράλληλα σώματα μπορούν να αποτελέσουν σημεία εκκίνησης, πρέπει ωστόσο να συμπληρωθούν

Συγκρίσιμα Σώματα Κειμένων Η ανάλυση και περιγραφή της γλώσσας ολοκληρώνεται με τη μελέτη των συγκρίσιμων σωμάτων, τα οποία περιέχουν πρωτότυπα και αυθεντικά κείμενα και μπορούν να συντελέσουν στην πληρέστερη κατανόηση του κειμένου πηγής και της ορολογίας του, καθώς και στον εντοπισμό και την αξιολόγηση πιθανών αντιστοιχιών

Συγκρίσιμα Σώματα Κειμένων Τα συγκρίσιμα σώματα μπορούν να αποτελέσουν χρήσιμο εργαλείο για τον μεταφραστή, δεδομένου ότι μπορούν να οδηγήσουν σε βαθύτερη κατανόηση του κειμένου πηγής και της ορολογίας του, στον εντοπισμό και την αξιολόγηση πιθανών ισοδυνάμων στη γλώσσα-στόχο, καθώς επίσης και να συμβάλουν στην ανάπτυξη της κατάλληλης φρασεολογίας στη γλώσσα στόχο.

Συγκρίσιμα Σώματα Κειμένων Οι τεχνικές εξαγωγής δεδομένων (data mining) έχουν επεκταθεί και στα συγκρίσιμα σώματα, χρησιμοποιώντας μεθόδους προερχόμενες από τη συσχέτιση των συχνοτήτων των λέξεων μεταξύ διαφορετικών γλωσσών, ώστε να ανιχνευθούν οι αντιστοιχίες

ΑΡΑ: Η μελέτη των αντίστοιχων πλεονεκτημάτων και μειονεκτημάτων των διαφορετικών ειδών σωμάτων κειμένων οδήγησε στο συμπέρασμα ότι τα παράλληλα και τα συγκρίσιμα σώματα κειμένων πρέπει να θεωρούνται συμπληρωματικά και ότι έχουμε πολλά να κερδίσουμε από τη συνδυαστική χρήση τους. Είναι αναγκαίο να έχουμε πρόσβαση τόσο σε σώματα κειμένων που αποτελούν μεταφράσεις όσο και σώματα αυθεντικών κειμένων στη γλώσσα- στόχο