Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Ταξινόμηση Κειμένων με Νευρωνικά Δίκτυα. Γ. Ταμπουρατζής Ινστιτούτο Επεξεργασίας του Λόγου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ10/12/2002 INSTITUTE FOR LANGUAGE.
Advertisements

ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING Τεχνολογία Στενοτυπικής Μεταγραφής Προφορικού Λόγου σε Ηλεκτρονικό Κείμενο.
ΡΗΜΑΤΑ ΤΗΣ ΑΕ ΠΟΥ ΣΥΝΤΑΣΣΟΝΤΑΙ ΜΕ ΔΟΤΙΚΗ
Τεχνολογίες ανάκτησης και εξαγωγής δεδομένων με γλωσσική υποστήριξη - Εφαρμογές στο e-government και e-business - Εφαρμογές στο e-government και e-business.
5 Ιουλίου 2005Ινστιτούτο Επεξεργασίας του Λόγου - Εβδομάδα Επιστήμης & Τεχνολογίας1 Τεχνολογία Διόρθωσης Κειμένων και Εφαρμογές Ν.Γλάρος Δρ. Ηλ/γος Μηχανικός.
ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING Τεχνολογία Ορθογραφικής Διόρθωσης Κειμένων Ν.Γλάρος Δρ. Ηλ/γος Μηχανικός.
Γιάννα Αντωνίου Δρ Γλωσσολόγος - Ερευνήτρια ΙΕΛ Τεχνολογίες λογισμικών πολυμέσων για εκπαίδευση και πολιτισμό Δράσεις και Προοπτικές ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ.
ΠΤΥΧΙΑΚΕΣ ΕΡΓΑΣΙΕΣ Μέγεθος: δεν θα πρέπει να υπερβαίνει τις λέξεις περίπου 40 σελίδες. Παράδοση: το αργότερο πριν την εξεταστική περίοδο του δευτέρου.
Λεξικά όρων και θησαυροί Μαρία Γαβριηλίδου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING.
Slide 1 Δίκτυα Τηλεπικοινωνιών ENOTHTA 7 η ΔΙΑΚΙΝΗΣΗ ΤΗΛΕΦΩΝΙΚΩΝ ΚΛΗΣΕΩΝ (ΜΕΡΟΣ Α’) 1. ΘΕΩΡΙΑ ΤΗΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΗΣ ΚΙΝΗΣΗΣ  Εκτός από τις τερματικές.
Ανάκτηση και Εξαγωγή Πληροφορίας από Πολυμεσικές και Πολυγλωσσικές
Τμήμα Εκπαιδευτικής Τεχνολογίας (ΤΕΤ) Ινστιτούτο Επεξεργασίας του Λόγου Φιλογλωσσία Διδασκαλία της Ελληνικής ως ξένης γλώσσας (2η Δράση του ΙΕΛ στην Γλωσσική.
Μάθημα: Πληροφορική Οδοντιάτρων 4 ο εξάμηνο Ομάδα: Αργυρού Αντώνης Δαμιανού Στεφανία Ιωάννου Παναγιώτα
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
Οδηγίες Σχεδίασης Διαδραστικών Συστημάτων
Η διδασκαλία ως διαδικασία διαμόρφωσης εγγράμματων ταυτοτήτων
Κεφάλαιο 6 Υλοποίηση Γλωσσών Προγραμματισμού
«Γραμματική Ε΄ και Στ΄ Δημοτικού»
Πνευματικό κέντρο Ερμουπόλεως Σύρου
ΕΙΔΙΚΕΣ ΜΑΘΗΣΙΑΚΕΣ ΔΥΣΚΟΛΙΕΣ
Επεξεργασία Κειμένου Ονομ/νυμο Επιμορφωτή Επιμορφωτής: Ονομ/νυμο Επιμορφωτή ΥΠΕΠΘ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΠΡΟΓΡΑΜΜΑ «ΚΟΙΝΩΝΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΕΠΙΜΟΡΦΩΣΗ.
ΣΗΜΕΙΩΣΕΙΣ - ΠΕΡΙΛΗΨΗ. ΣΗΜΕΙΩΣΕΙΣ - ΠΕΡΙΛΗΨΗ Όταν θέλουμε να καταγράψουμε κάποια στοιχεία από το σύνολο ή τα επιμέρους στάδια μιας πράξης (επιστημονικό.
Μοντέλο Διδασκαλίας Φυσικών Επιστήμων, για την Υποχρεωτική Εκπαίδευση, στην Κατεύθυνση της Ανάπτυξης Γνώσεων και Ικανοτήτων. Π. Κουμαράς.
ΈΝΑ ΗΛΕΚΤΡΟΝΙΚΟ ΕΚΘΕΤΗΡΙΟ ΓΙΑ ΤΙΣ ΝΕΕΣ ΠΡΟΣΚΤΗΣΕΙΣ ΒΙΒΛΙΩΝ ΤΗΣ ΒΙΒΛΙΟΘΗΚΗΣ ΤΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕΔΟΝΙΑΣ Κολοβός Φίλιππος Τσανακτσίδου ΕλισάβετΠαπαργύρη.
Εθνικόν και Καποδιστριακόν Πανεπιστήμιον Αθηνών Μάθημα «Διοίκηση Επιχειρήσεων» Παρασκευή 18 Ιανουαρίου Εισαγωγή στην τεχνική της παρουσίασης.
Επιμορφωτής: Ονομ/νυμο Επιμορφωτή
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr
Οργάνωση πληροφοριών Ευρετηρίαση Μέρος Β Σχεδιασμός ευρετηρίων.
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
ΑΣΠΑΙΤΕ ΕΠΠΑΙΚ ΗΡΑΚΛΕΙΟΥ ΚΡΗΤΗΣ
Η ΝΕΑ ΓΡΑΜΜΑΤΙΚΗ Ε’ ΚΑΙ Στ’ ΤΑΞΗΣ.
Πρότυπα απόδοσης Είναι απαραίτητα για την αξιολόγηση. Για την αποτελεσματικότητα της αξιολόγησης πρέπει τα πρότυπα να συσχετισθούν με τα επιθυμητά αποτελέσματα.
E X a M p L e Αξιοποιώντας την τεχνολογία XML στη διαχείριση της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών.
Η διδασκαλία ως διαδικασία διαμόρφωσης εγγράμματων ταυτοτήτων Ειδικό Μέρος Ενότητα Ι, 2.4.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ " Διοίκηση και Οργάνωση Βιβλιοθηκών.
Η περιληψη.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 – 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 – 2013 Μάθημα 1 ο : Εισαγωγή.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
ΛΑΔΑΚΑΚΟΣ ΘΑΛΗΣ Α.Μ ΔΙΑΧΕΙΡΗΣΗ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
EContent Στέλιος Πιπερίδης Εθνικός Εκπρόσωπος eContent
Μάθημα 1ο: Εισαγωγή στη Γλωσσική Τεχνολογία
ΠΜΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ The Digital Library and Computational Philology: The BAMBI Project Γόντικα Ειρήνη.
6/12/2012 Παρουσίαση: Μιμηγιάννης Δημήτρης
Η διδασκαλία ως διαδικασία διαμόρφωσης εγγράμματων ταυτοτήτων Ειδικό Μέρος Ενότητα Ι, 2.4.
Γλωσσική πολυμορφία και γλωσσική διδασκαλία στο Δημοτικό Σχολείο
Τεχνολογία ΛογισμικούSlide 1 Τεχνολογία Απαιτήσεων u Καθορίζει τι θέλει ο πελάτης από ένα σύστημα λογισμικού.
 Κύριο αντικείμενο της μελέτης είναι ο καθορισμός της μεθοδολογίας, των προτύπων (standards) και των διαδικασιών (procedures) για τις πρώτες και πιο.
ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ ΙΣΤΟΡΙΑ ΝΕΑ ΕΛΛΗΝΙΚΑ
Διαδίκτυο και Διδακτική της Γλώσσας Δυνατότητες Αξιοποίησης στη Διδασκαλία του Γλωσσικού Μαθήματος Διονύσης Αρκαδιανός.
ΤΡΟΠΟΣ ΣΥΓΓΡΑΦΗΣ ΕΠΙΣΤΗΜΟΝΙΚΩΝ ΕΡΓΑΣΙΩΝ
ΑΝΩΤΑΤΗ ΣΧΟΛΗ ΠΑΙΔΑΓΩΓΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΕΝΙΚΟ ΤΜΗΜΑ ΠΑΙΔΑΓΩΓΙΚΩΝ ΜΑΘΗΜΑΤΩΝ ΓΕΝΙΚΟ ΤΜΗΜΑ ΠΑΙΔΑΓΩΓΙΚΩΝ ΜΑΘΗΜΑΤΩΝ «Εκπαιδευτική Τεχνολογία-Πολυμέσα»
Εισαγωγή στη Νοσηλευτική Επιστήμη
Αρχές Πληροφορικής Ενότητα # 13: Επεξεργασία κειμένου – LibreOffice #3
ΠερIληψη Α. Προετοιμασία
ΝΕΑ ΕΛΛΗΝΙΚΑ.
ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ
Τπε και γλώσσα.
Ανάπτυξη Εκπαιδευτικού Λογισμικού
Αρχεσ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ Η/Υ ΤΑξη Β΄
Ανάπτυξη Εκπαιδευτικού Λογισμικού
Αρχές Πληροφορικής Ενότητα # 11: Επεξεργασία κειμένου - LibreOffice
Αρχές Πληροφορικής Ενότητα # 10: Ιστολόγια. Η υπηρεσία Blogger
RICAPITOLAZIONE Della prima lezione.
Αρχές Πληροφορικής Ενότητα # 7: Εργονομία και σχολικά εργαστήρια
ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ
ΔΙΠΛΩΜΑΤΙΚΗ ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Γεώργιος Τζούμας (ΑΕΜ:45)  
RICAPITOLAZIONE Della prima lezione.
Εικονογράφηση: Πριάμη Ευγενία
Μεταγράφημα παρουσίασης:

Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Υπηρεσία μετρήσεων και ανάλυσης λόγου Βασική αποστολή: Διενέργεια ποσοτικών μετρήσεων σε γραπτά και προφορικά κείμενα της Νέας Ελληνικής γλώσσας με στόχους: n Τον έλεγχο της συνέπειας στην χρήση της γλώσσας n Τον υπολογισμό δεικτών «αναγνωσιμότητας» n Τον ευρετηριασμό των κειμένων με βάση τη γλωσσική τους φυσιογνωμία ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Υπηρεσία μετρήσεων και ανάλυσης λόγου n Υπολογισμός δεικτών «αναγνωσιμότητας»: αξιολόγηση κειμένων ως προς τον βαθμό ευκολίας στην ανάγνωση n Ευρετηριασμός των κειμένων με βάση τη συνολική γλωσσική τους φυσιογνωμία: καθορίζεται από το θέμα που πραγματεύεται το κείμενο, τον συγγραφέα, την εποχή που γράφτηκε το κείμενο κ.ά.  Έλεγχος της συνέπειας στην χρήση της γλώσσας: ορθογραφία/προφορά, γραμματική, λεξιλόγιο. ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Έλεγχος της συνέπειας στην χρήση της γλώσσας Η Νέα Ελληνική γλώσσα δίνει την δυνατότητα να χρησιμοποιηθούν περισσότερες της μίας εκφράσεις για το ίδιο περιεχόμενο. Για παράδειγμα: u έγραφαν και γράφανε, u ο οποίος και που, u ανελκυστήρας και ασανσέρ. ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Έλεγχος της συνέπειας στην χρήση της γλώσσας Για ορισμένα είδη γραπτού λόγου, η ύπαρξή πολλών εναλλακτικών εκφράσεων δεν εξυπηρετεί διότι:  Δημιουργεί αίσθημα ανασφάλειας κατά την συγγραφή κειμένων: πρέπει να γίνεται επιλογή μεταξύ δύο ή περισσότερων ισοδύναμων εκφράσεων, συχνά χωρίς κάποιο συγκεκριμένο κριτήριο  Δυσκολεύει την επεξεργασία των κειμένων με εργαλεία γλωσσικής τεχνολογίας: αυτόματη ορθογραφική διόρθωση, μηχανική μετάφραση, αυτόματος εντοπισμός όρων, αυτόματη εξαγωγή πληροφορίας κ.ά. ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Συνεπής χρήση της γλώσσας στα κείμενα της Δημόσιας Διοίκησης Τα κείμενα της Δημόσιας Διοίκησης θα πρέπει να αποφεύγουν την ποικιλία στην χρήση των γλωσσικών εκφράσεων διότι: n Μαρτυρεί την ύπαρξη ενός έντονα υποκειμενικού στοιχείου γραφής το οποίο  δεν συνάδει με τον δημόσιο χαρακτήρα των εγγράφων  κάνει το κείμενο ασαφές και δυσανάγνωστο  άτυπα, επιτρέπει ερμηνείες οι οποίες αφορούν ιδεολογικές επιλογές ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Συνεπής χρήση της γλώσσας στα κείμενα της Δημόσιας Διοίκησης n Περιπλέκει την ηλεκτρονική επεξεργασία των κειμένων δημιουργώντας σημαντικά προβλήματα στην τεχνική υλοποίηση του οράματος της ηλεκτρονικής διακυβέρνησης (e-government) n Μειώνει την απόκριση των μηχανών αναζήτησης του Διαδικτύου δυσχεραίνοντας την ανεύρεση κειμένων με λέξεις-κλειδιά ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Η γλωσσική συνέπεια σε κείμενα της Δημόσιας Διοίκησης n Συνέπεια στην απόδοση ακρωνύμων ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Η γλωσσική συνέπεια σε κείμενα της Δημόσιας Διοίκησης n Ορθογραφική συνέπεια ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Δείκτες γλωσσικής «ποιότητας» Οι δείκτες γλωσσικής «ποιότητας» χαρακτηρίζουν ποσοτικά:  Την συνέπεια στην χρήση της γλώσσας  Την αναγνωσιμότητα ενός κειμένου Υπολογίζονται αυτόματα. ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Δείκτες γλωσσικής «ποιότητας» n Συνέπεια στην χρήση της γλώσσας:  Πόσες ασυνέπειες έγιναν στην χρήση της γλώσσας  Ποιές ακριβώς είναι αυτές οι ασυνέπειες και πώς κατανέμονται  Πόσο αποκλίνει το κείμενο από τα επιθυμητά πρότυπα n Επαναληψιμότητα:  Υπολογίζονται οι επαναλήψεις λέξεων, φράσεων ή τύπων φράσεων σε ένα κείμενο, π.χ. αν χρησιμοποιούνται πολλά επίθετα στην σειρά  Πόσο αποκλίνει το κείμενο από τα επιθυμητά πρότυπα. ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Δείκτες αναγνωσιμότητας Υπολογίζουν το πόσο εύκολα διαβάζεται και γίνεται κατανοητό ένα κείμενο

Χρήση των δεικτών σε κείμενα της Δημόσιας Διοίκησης ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Ευρετηριασμός κειμένων με κριτήριο τη γλωσσική τους φυσιογνωμία Πολύ μεγάλες και συνεχώς εμπλουτιζόμενες βάσεις κειμένων: ενδείκνυται ο αυτόματος ευρετηριασμός των κειμένων με κριτήριο την ομοιότητά τους με κείμενα- υποδείγματα. n Ορίζονται ομάδες «παρομοίων» κειμένων n Γίνεται δυνατή η ανεύρεση κειμένων με κριτήριο την ομοιότητά τους προς δοθέν πρότυπο κείμενο ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Παράδειγμα 1 (1) ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING Σε σώματα κειμένων (68 κείμενα με συνολικά λέξεις) Ταξινόμηση κειμένων ως προς το είδος του λόγου (λογοτεχνία, πολιτικός λόγος, δοκιμιακός λόγος) Ακρίβεια ταξινόμησης: ξεπερνά το 95%

Παραδειγμα χρήσης ρημάτων/επιθέτων ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

Παράδειγμα χρήσης καταλήξεων ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING

ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING Παράδειγμα (2) Σε μεγάλο σώμα κειμένων με 1005 κείμενα και συνολικό μέγεθος λέξεις Ταξινόμηση κειμένων ως προς το συγγραφέα Ακρίβεια ταξινόμησης: ξεπερνά το 90%

Μέση πρόταση ανά συγγραφέα ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING