1 Ερευνητικό Πρόγραμμα BalkaNet. BalkaNet Project 2 Ερευνητικό Πρόγραμμα BalkaΝet Χρηματοδοτούμενο από την ΕΕ πρόγραμμα (IST-2000-29388) με σκοπό την.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Δρ. Σάλτας Βασίλειος Τμήμα Διαχείρισης Πληροφοριών ΣΔΟ – ΤΕΙ Καβάλας
Advertisements

Επιμέλεια: Τίκβα Χριστίνα
Παρουσίαση αποτελεσμάτων έργου Ε*CARE Εθνικό Ίδρυμα Ερευνών, 7 Ιουνίου
Συνεισφορά στις ελληνικές εξαγωγές ανά περιφέρεια Διάστημα: Ιαν-Ιούνιος 2012 •70% των ελληνικών εξαγωγών εξακολουθεί να πραγματοποιείται από τις περιφέρειες.
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Γ ΛΩΣΣΙΚΟΙ Π ΟΡΟΙ & Τ ΕΧΝΟΛΟΓΙΕΣ : Η ΣΗΜΕΡΙΝΗ ΕΛΛΗΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ Πένυ Λαμπροπούλου Ινστιτούτο Επεξεργασίας Λόγου / Ε.Κ. "Αθηνά" Ημερίδα παρουσίασης.
Τεχνολογίες ανάκτησης και εξαγωγής δεδομένων με γλωσσική υποστήριξη - Εφαρμογές στο e-government και e-business - Εφαρμογές στο e-government και e-business.
Υποδομές Ανοικτής Πρόσβασης: Το μέλλον της επιστημονικής επικοινωνίας, ΕΚΤ, Αθήνα, Δεκεμβρίου 2008 Πρωτοβουλίες Ανοικτής Πρόσβασης στη Βιβλιοθήκη.
Βάσεις Δεδομένων ΕΙΣΑΓΩΓΗ.
Επιμορφωτής: Ονομ/νυμο Επιμορφωτή
Καθηγητής: Δ. Μπουτακίδης
Οι Ακαδημαϊκές Βιβλιοθήκες της Περιφέρειας: Φορείς γνώσης και πολιτιστικής ανάπτυξης Βιβλιοθήκη Τ.Ε.Ι. Καλαμάτας 18 Δεκεμβρίου 2008 ΑΒΕΚΤ 5.6 Νέα έκδοση.
1 ERASMUS ΓΙΑ ΝΕΟΥΣ ΕΠΙΧΕΙΡΗΜΑΤΙΕΣ Νέο ευρωπαϊκό πρόγραμμα κινητικότητας επιχειρηματιών Λευκωσία, 2011 ERASMUS ΓΙΑ ΝΕΟΥΣ ΕΠΙΧΕΙΡΗΜΑΤΙΕΣ.
Λειτουργικό Σύστημα ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ENOTHTA B.1.3 (1)
Next Generation Networking
Γιάννα Αντωνίου Δρ Γλωσσολόγος - Ερευνήτρια ΙΕΛ Τεχνολογίες λογισμικών πολυμέσων για εκπαίδευση και πολιτισμό Δράσεις και Προοπτικές ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ.
Λεξικά όρων και θησαυροί Μαρία Γαβριηλίδου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING.
7.5.2 Αντικειμενοστραφής προγραμματισμός
Διαχείριση Έργου Οργάνωση, σχεδιασμός και προγραμματισμός έργων ανάπτυξης λογισμικού.
-Στοίβα-Ουρά - Πλεονεκτήματα πινάκων -Δομές δεδομένων δευτερεύουσας μνήμης -Πληροφορική και δεδομένα -Παραδείγματα-Προβλήματα ψευδοκώδικα.
Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.
ΣΥΣΤΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ, ΕΡΓΑΛΕΙΑ ΓΙΑ ΤΗΝ ΤΟΠΙΚΗ ΑΥΤΟΔΙΟΙΚΗΣΗ
Τμήμα Εκπαιδευτικής Τεχνολογίας (ΤΕΤ) Ινστιτούτο Επεξεργασίας του Λόγου Φιλογλωσσία Διδασκαλία της Ελληνικής ως ξένης γλώσσας (2η Δράση του ΙΕΛ στην Γλωσσική.
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
[ ] Ανοικτά Μαθήματα ocw-project.upatras.gr.
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ WordNet.
Η Θεματική Ταξινόμηση και η Συμβολή της στην Αναζήτηση Ευρωπαϊκών Κοινωνικών Δεδομένων.
CERTH Θεσσαλονίκη, 11 η Δεκεμβρίου 2007 ΕΚΕΤΑ 11 η Συνάντηση του Εθνικού Δικτύου Κέντρων Κινητικότητας Ερευνητών 1 Περιγραφή, νέα εμφάνιση και προοπτικές.
Κεφάλαιο 6 Υλοποίηση Γλωσσών Προγραμματισμού
ΗΥ-566 Διαχείρηση Γνώσης στο Διαδίκτυο1 SWRC Ontology Κτιστάκης Γιώργος Μπούτσικα Κατερίνα Παπαδάκης Μύρων.
Εκτέλεση Αλγορίθμων σε ψευδογλώσσα
MUltilingual Subtitling of multimediA content
Page  1 Ο.Παλιάτσου Γαλλική Επανάσταση 1 ο Γυμνάσιο Φιλιππιάδας.
ΝΕΟ ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ Α’, Β’, & Γ’ ΓΥΜΝΑΣΙΟΥ ΟΜΑΔΑ ΕΡΓΑΣΙΑΣ Ανδρέας Σ. Ανδρέου (Αναπλ. Καθηγητής ΤΕΠΑΚ - Συντονιστής) Μάριος Μιλτιάδου, Μιχάλης Τορτούρης.
Έρευνα για το Εθνικό Φορολογικό Σύστημα Αθήνα 9 Νοεμβρίου ο Πανελλήνιο Επιστημονικό Συνέδριο Ι.Ο.Φο.Μ. Ι.Ο.Φο.Μ. – Π.Μ.Σ. Φορολογία και Ελεγκτική.
Η μηχανική μάθηση στην αντιμετώπιση της Υπερπληροφόρησης
Καθιστώντας μια υπηρεσία θεματικής πλοήγησης στο διαδίκτυο συμβατή με τις τεχνολογίες των συνδεδεμένων δεδομένων Συγγραφείς: Κωνσταντίνος Κυπριανός, Ιωάννης.
LIFE- ENVIRONMENT PROGRAMME ‘Starting with the promotion of IPP approach in Mediterranean countries’’ Αθήνα, 19 Σεπτεμβρίου 2005 Παρουσίαση Start-IPP.
« Πανεπιστημιακό Δίκτυο Εκπαίδευσης, Έρευνας και Τεχνολογίας στην Υδρολογία και Περιβαλλοντική Διαχείριση Υδατικών Πόρων » Υ ΔΡΟΜΕΔΩΝ.
Title of the presentation | Date |1 Καταγραφή απαιτήσεων ερευνητών ανθρωπιστικών επιστημών για γλωσσικούς πόρους και εργαλεία Δρ Νίκος Χούσος Εθνικό Κέντρο.
Βασίλης Κόμης Αναπληρωτής Καθηγητής
Αποκεντρωμένη Διοίκηση Μακεδονίας Θράκης ∆ιαχείριση έργων επίβλεψης µε σύγχρονα µέσα και επικοινωνία C2G, B2G, G2G Γενική Δ/νση Εσωτερικής Λειτουργίας.
13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών – Κέρκυρα Οκτωβρίου 2004 Το σύστημα COINE για την προβολή της πολιτιστικής κληρονομιάς και την υποστήριξη.
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας: Διοίκηση & Οργάνωση Βιβλιοθηκών.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΘΕΜΑ «ΤΟ ΕΘΝΙΚΟ ΚΕΝΤΡΟ ΤΕΚΜΗΡΙΩΣΗΣ» ΚΑΝΤΑΡΕΛΗ ΑΙΚΑΤΕΡΙΝΗ.
Έργα Ψηφιοποίησης στη Βιβλιοθήκη του Πανεπιστημίου Μακεδονίας Άννα Φράγκου Πρ. Δ/σης Βιβλιοθήκης Παν/μίου Μακεδονίας Digitization Projects at the Library.
Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr
Διαδικτυακή εφαρμογή ανάλυσης και επεξεργασίας δεδομένων κυβερνητικών διαβουλεύσεωνgov.insight Η. Ζαβιτσάνος, Γ. Γιαννακόπουλος, Γ. Παλιούρας Ινστιτούτο.
Πρόγραμμα IST Στατιστικά 1η, 2η & 3η Πρόσκληση Υποβολής Προτάσεων Εθνικό Κέντρο Τεκμηρίωσης – Εθνικό Σημείο Επαφής για το IST 1 Στατιστικά Αποτελέσματα.
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ : ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ ΜΟΝΤΕΛΟ ΔΙΑΣΤΑΣΙΟΠΟΙΗΣΗΣ.
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
1 Η Θέση της Ελλάδας στη Διεθνή Αγορά Επενδύσεων Θεοδόσιος Β. Παλάσκας Καθηγητής Παντείου Πανεπιστημίου και Διευθυντής Έρευνας ΙΟΒΕ Ίδρυμα Οικονομικών.
1 Ενότητα 5.3.1: Ερωτηματολόγια με τη χρήση του Διαδικτύου Διδάσκων: Χρήστος Κατσάνος - Πανεπιστημιακό κέντρο εκπαίδευσης επιμορφωτών.
ΜΕΘΟΔΟΙ ΔΙΔΑΣΚΑΛΙΑΣ Δομιστική προσέγγιση (Ι)
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
1 6.Εισαγωγή γραφικού 6.1 Εισαγωγή γραφικού Στο μενού «Εισαγωγή» τοποθετούμε τον κέρσορα στην επιλογή «Εικόνα»
Εισαγωγικά Θέματα WWW Διαδικαστικά του μαθήματος 2007 – 2008.
1 Τ.Ε.Ι. ΚΑΒΑΛΑΣ Σ.Δ.Ο. Τμήμα: Διαχείριση Πληροφοριών Ον.Επ.: Μπίκος Κωνσταντίνος Μάντη Χρυσάνθη Χατζημάρκου Αθηνά Καπίταλη Ζωή Εισηγητής: Χατζής Θέμα:
ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΔΑΜΠΑΣ ΑΘΑΝΑΣΙΟΣ Β ΚΑΛΩΤΑ ΑΝΝΑ Β
Οριζόντιο Έργο Υποστήριξης Σχολείων, Εκπαιδευτικών και Μαθητών στο Δρόμο για το ΨΗΦΙΑΚΟ ΣΧΟΛΕΙΟ, νέες υπηρεσίες Πανελλήνιου Σχολικού Δικτύου και Στήριξη.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
Οριζόντιο Έργο Υποστήριξης Σχολείων, Εκπαιδευτικών και Μαθητών στο Δρόμο για το ΨΗΦΙΑΚΟ ΣΧΟΛΕΙΟ, νέες υπηρεσίες Πανελλήνιου Σχολικού Δικτύου και Στήριξη.
Residency Database Residency Database Project IFMSA Transnational project Από τηv Ελληνική Επιτροπή Διεθνών Σχέσεων και Ανταλλαγών Φοιτητών Ιατρικής (HelMSIC)
WORDNET Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία.
1 Βάσεις Δεδομένων ΙI Επιμέλεια: ΘΟΔΩΡΗΣ ΜΑΝΑΒΗΣ SQL (3 από 3) T Manavis.
«Πρόγραμμα Αναμόρφωσης Προπτυχιακών Προγραμμάτων Σπουδών Γ.Π.Α» Σεμινάριο Ενημέρωσης Διδακτικού Προσωπικού Οι τεχνολογίες της Πληροφορικής και των Επικοινωνιών.
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας «Διοίκηση & Οργάνωση Βιβλιοθηκών.
ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ
Μοντέλο Κατανόησης Κειμένου
Ψηφιακοί, γλωσσικοί περίπατοι στην πόλη μου
Μεταγράφημα παρουσίασης:

1 Ερευνητικό Πρόγραμμα BalkaNet

BalkaNet Project 2 Ερευνητικό Πρόγραμμα BalkaΝet Χρηματοδοτούμενο από την ΕΕ πρόγραμμα (IST ) με σκοπό την ανάπτυξη ενός πολύγλωσσου σημασιολογικού λεξικού σύμφωνα με τις αρχές του EuroWordNet. (Σεπτέμβριος Αύγουστος 2004) Γλώσσες για τις οποίες αναπτύσσονται σημασιολογικά λεξικά: Βουλγαρικά, τσεχικά, ελληνικά, ρουμανικά, σερβικά, τουρκικά. Ηλεκτρονική Διεύθυνση:

BalkaNet Project 3 Φορείς Έργου Πανεπιστήμιο Πατρών (DBLAB) - Ελλάδα (Συντονιστής προγράμματος) Πανεπιστήμιο Αθηνών (UOA) - Ελλάδα Ίδρυμα Τεχνολογίας Yπολογιστών (CTI) - Ελλάδα University of Alexandru Ioan Cuza (UAIC) - Ρουμανία Academia Romana (RACAI) - Ρουμανία Bulgarian Academy of Science (IBL-DCMB) - Βουλγαρία Masaryk University Brno (FI MU) – Δημοκρατία της Τσεχίας Memodata (MEM) - Γαλλία University of Plovdiv (PU) - Βουλγαρία  Υπεργολάβοι:  Belgrad University - Σερβία  OTENet - Ελλάδα

BalkaNet Project 4 Οικονομικά Δεδομένα Συνολικός Προϋπολογισμός Έργου: ευρώ Προϋπολογισμός Πανεπιστημίου Αθηνών: ευρώ

BalkaNet Project 5 Τι είναι το WordNet Το WordNet είναι ένα ηλεκτρονικό λεξικό βασισμένο στις έννοιες των λέξεων και στις σημασιολογικές σχέσεις που ισχύουν μεταξύ τους. Με τη βοήθεια των σημασιολογικών σχέσεων, οι έννοιες των λέξεων σε μια γλώσσα μπορούν να διασυνδεθούν, αποτελώντας ένα δίκτυο εννοιών, δηλ. το WordNet. Το WordNet αρχικά αναπτύχθηκε στο Princeton για τα αγγλικά. Μετά την επιτυχία του WordNet ένας αριθμός προγραμμάτων ξεκίνησε με σκοπό την ανάπτυξη WordNets για άλλες γλώσσες από τα αγγλικά. Π.χ. EuroWordNet, BalkaNet...

BalkaNet Project 6 Ένα σύνολο συνωνύμων (synset) είναι ένα σύνολο λέξεων οι οποίες σε ένα συγκεκριμένο περιβάλλον μπορούν να χρησιμοποιηθούν η μία στη θέση της άλλης. Κάθε σύνολο συνωνύμων συνοδεύεται και από έναν επεξηγηματικό ορισμό (gloss). Π.χ. το σύνολο {ασθενοφόρο, νοσοκομειακό} αποτελεί ένα σύνολο συνώνυμων με ορισμό: κατάλληλα εξοπλισμένο αυτοκίνητο που μεταφέρει ασθενείς στο νοσοκομείο. Το σύνολο {car, auto, automobile, machine, motorcar} αποτελεί ένα σύνολο συνώνυμων του αγγλικού WordNet με ορισμό: 4- wheeled motor vehicle; usually propelled by an internal combustion engine. Σύνολο Συνωνύμων (synset)

BalkaNet Project 7 Υπωνυμία / Υπερωνυμία: Το Α είναι υπερώνυμο του Β (ή με άλλα λόγια το Β είναι υπώνυμο του Α), σημαίνει ότι το Β είναι ένα είδος Α. Π.χ. Το {ασθενοφόρο, νοσοκομειακό} είναι ένα υπώνυμο του {αυτοκίνητο} (δηλ. το ασθενοφόρο είναι ένα είδος αυτοκινήτου). Μερωνυμία / Ολωνυμία: Το Α είναι ολώνυμο του Β (ή με άλλα λόγια το Β είναι μερώνυμο του Α), σημαίνει ότι το Β είναι μέρος του Α. Π.χ, Το {προφυλακτήρας} είναι μερώνυμο του {αυτοκίνητο} (δηλ. ο προφυλακτήρας είναι μέρος του αυτοκινήτου). Σημασιολογικές σχέσεις στο WordNet

BalkaNet Project 8 Ελληνικό WordNet Αναπτύσσεται στο Πανεπιστήμιο Πατρών από ομάδα γλωσσολόγων με τη χρήση των εξής υπολογιστικών εργαλείων:  Εργαλεία για εξαγωγή γλωσσικής πληροφορίας από ηλεκτρονικά λεξικά και σώματα κειμένων (Πανεπιστήμιο Αθηνών).  VisDic: Εργαλείο ανάπτυξης σημασιολογικών λεξικών (Πανεπιστήμιο Masaryk, Brno, Τσεχία).  WMS (WordNet Management System): Εργαλείο διαχείρισης σημασιολογικών λεξικών (Πανεπιστήμιο Πατρών)

BalkaNet Project 9 Στατιστικά στοιχεία του Ελληνικού WordNet Σύνολα Συνωνύμων (synsets):  Ουσιαστικά:  Ρήματα: 3402  Επίθετα: 617  Επιρρήματα: 16 Λέξεις: Λέξεις / synset: 1.33 Σημασιολογικές Σχέσεις: Σχέσεις / synset: 1.33 Ορισμοί: 18649

BalkaNet Project 10 VisDic: Εργαλείο Ανάπτυξης WordNet

BalkaNet Project 11 Συμμετοχή του Πανεπιστημίου Αθηνών στο BalkaNet Σχεδιασμός και υλοποίηση γλωσσικών υπολογιστικών εργαλείων για την υποστήριξη της ανάπτυξης και την πιστοποίηση του ελληνικού WordNet.  α. Χρήση ηλεκτρονικών λεξικών και των αντίστοιχων εργαλείων για την εξαγωγή των γλωσσικής πληροφορίας.  β. Χρήση σωμάτων κειμένου (text corpora) και των αντίστοιχων εργαλείων για την ανάπτυξη και την πιστοποίηση των WordNets Δημιουργία ενός ευθυγραμμισμένου και εμπλουτισμένου με γλωσσική πληροφορία σώματος κειμένου για την πιστοποίηση του ελληνικού WordNet.

BalkaNet Project 12 Βασισμένα στο ηλεκτρονικό λεξικό Τριανταφυλλίδη, το οποίο ήταν σε μορφή Microsoft Access. εξαγωγή πληροφορίας σχετική με το μέρος του λόγου: Το εργαλείο εξάγει τα λήμματα από το λεξικό βασισμένο στις πληροφορίες για το μέρος του λόγου τους. εξαγωγή των συνδεδεμένων λημμάτων και των συνθέτων λημμάτων: Το εργαλείο εξάγει τα συνδεμένα λήμματα: π.χ. θηλυκές μορφές (π.χ. Αδελφή - αδελφός). εξαγωγή συνωνύμων και αντωνύμων: Αναζήτηση συνωνυμικών και αντωνυμικών σχέσεων στους ορισμούς των λημμάτων του λεξικού. Υπολογιστικά Εργαλεία για την Εξαγωγή Γλωσσικής Πληροφορίας από Λεξικά

BalkaNet Project 13 Παράδειγμα Εξαγωγής Συνωνύμων

BalkaNet Project 14 Λημματοποιητής (Lemmatizer) για την ελληνική γλώσσα  Όταν δίνεται ως εισαγωγή μια ελληνική λέξη, αναλύει τη λέξη και βρίσκει τη μορφή με την οποία η λέξη εμφανίζεται στα λεξικά (λήμμα) (π.χ.ανθρώπου - > άνθρωπος)  Στόχοι σχεδιασμού  Να είναι χρήσιμος σε διαφορετικά εργαλεία.  Να απαιτεί όσο το δυνατόν λιγότερους λεξικούς πόρους (Απαιτεί μόνο μια λίστα λέξεων).  Να είναι υπολογιστικά αποδοτικός. Υπολογιστικά Εργαλεία που χρησιμοποιούν Σώματα Κειμένων

BalkaNet Project 15 Υπολογιστικά Εργαλεία που χρησιμοποιούν το Λημματοποιητή Μετρητής συχνότητας λημμάτων λέξεων σε σώματα κειμένου. Μεταφραστής λέξεων από ελληνικά στα αγγλικά Εργαλείο που βρίσκει το μέρος του λόγου των λέξεων (Part of Speech Tagger) Υπολογιστικό εργαλείο για την εξαγωγή συμφωνιών (concoradances) και παραθέσεων (collocations) λέξεων σε σώματα κειμένου.

BalkaNet Project 16 Μετρητής Συχνότητας Λημμάτων Λέξεων Παράδειγμα εμφάνισης συχνότητας λημμάτων ουσιαστικών σε σώμα κειμένων μεγέθους περίπου 1.3Μ λέξεων.

BalkaNet Project 17 Εργαλείο για την Εξαγωγή Συμφωνιών και Παραθέσεων Παραθέσεις της λέξης «μέρα» ταξινομημένες ως προς συχνότητα εμφάνισης

BalkaNet Project 18 Δημιουργία ενός σώματος κειμένου για την πιστοποίηση του Ελληνικού WordNet. Το 1984 του George Orwell Το κείμενο του 1984 υπήρχε ήδη έτοιμο (δηλ. ευθυγραμμισμένο σε επίπεδο πρότασης και εμπλουτισμένο με πληροφορία για το μέρος του λόγου και τα λήμματα των λέξεων) για όλες τις γλώσσες που συμμετέχουν στο BalkaNet, εκτός από τα ελληνικά και τα τουρκικά (στα πλαίσια του προγράμματος Multext-East) Η αντίστοιχη έκδοση του ελληνικού κειμένου αναπτύχθηκε για την πιστοποίηση του WordNet.

BalkaNet Project 19 Δημιουργία ενός σώματος κειμένου για την πιστοποίηση του Ελληνικού WordNet. Ευθυγράμμιση προτάσεων  Ευθυγράμμιση των προτάσεων του ελληνικού κειμένου με τις αντίστοιχες του αγγλικού κειμένου.  Ημιαυτόματη ευθυγράμμιση. Αρχικά αναπτύχθηκε ένας αλγόριθμος αυτόματης ευθυγράμμισης ο οποίος εφαρμόστηκε στο κείμενο και έπειτα έγινε διόρθωση των λαθών του αλγορίθμου με το χέρι. Εμπλουτισμός με πληροφορία για το μέρος του λόγου και τα λήμματα των λέξεων  Ο λημματοποιητής και το εργαλείο εύρεσης μερών του λόγου χρησιμοποιήθηκαν για να εκτελέσουν αυτές τις εργασίες. Επίσης, χρησιμοποιήθηκε και ένα εργαλείο ανάθεσης μερών του λόγου (Part-of-Speech Tagger), το οποίο αναπτύχθηκε στο Ινστιτούτο Επεξεργασίας Λόγου.

BalkaNet Project 20 Εργαλείο Ευθυγράμμισης Προτάσεων Ελληνικού και Αγγλικού Κειμένου

BalkaNet Project 21 Παράδειγμα πρότασης του κειμένου <w lemma="ακούω" ana="V-is3s-p------e">Ακούστηκε πάλι ένας πάταγος. Verb: Indicative, Past, 3 rd Singular, Passive, Perfective Noun: Common, Male, Singular There was another crash.