Γλωσσική τεχνολογία και ψηφιακή επιμέλεια Ίων Ανδρουτσόπουλος Τμήμα Πληροφορικής, Οικονομικό Πανεπιστήμιο Αθηνών και Μονάδα Ψηφιακής Επιμέλειας, Ερευνητικό Κέντρο «Αθηνά»
2 Ίων Ανδρουτσόπουλος – Γλωσσική τεχνολογία και ψηφιακή επιμέλεια Ανάλυση και παραγωγή εκφράσεων φυσικής γλώσσας
3 Ίων Ανδρουτσόπουλος – Γλωσσική τεχνολογία και ψηφιακή επιμέλεια Γλωσσική τεχνολογία και ψηφιακή επιμέλεια Αυτόματη ταξινόμηση εγγράφων: –Σε ποιες κατηγορίες και υπο-κατηγορίες μιας δεδομένης ταξινομίας ανήκει ένα εισερχόμενο επιστημονικό άρθρο; –Δεδομένου ενός συνόλου εγγράφων που μας ενδιαφέρουν, ποια άλλα έγγραφα ενδέχεται να μας ενδιαφέρουν και ποια όχι; Αυτόματη ομαδοποίηση εγγράφων: –Πώς μπορούμε να ομαδοποιήσουμε θεματολογικά τα έγγραφα μιας συλλογής εγγράφων για την οποία δεν διαθέτουμε ταξινομία; –Πώς μπορούμε να δημιουργήσουμε την ταξινομία μιας συλλογής; Αυτόματη παραγωγή περιλήψεων: –Περιλήψεις μεμονωμένων ή πολλών εγγράφων. –Περιλήψεις που απαντούν συγκεκριμένα ερωτήματα.
4 Ίων Ανδρουτσόπουλος – Γλωσσική τεχνολογία και ψηφιακή επιμέλεια Γλωσσική τεχνολογία και ψηφιακή επιμέλεια Αυτόματη εξαγωγή πληροφοριών από έγγραφα: –Ποιες οντότητες μιας οντολογίας αναφέρει ένα έγγραφο; –Ποιες σχέσεις μεταξύ οντοτήτων αναφέρει το έγγραφο; –Ποιες είναι οι σχέσεις (π.χ. υποστηρίζει, αντικρούει) μεταξύ των εγγράφων μιας συλλογής (π.χ. ιστολόγια); Αυτόματη παραγωγή εγγράφων: –Σε πολλές γλώσσες από μια ενιαία οντολογία (π.χ. OWL, CIDOC CRM) ή βάση δεδομένων. –Προσαρμογή γλωσσικών εκφράσεων: π.χ. απλούστερες λέξεις, πιο σύντομες προτάσεις όταν παράγουμε έγγραφα για παιδιά. –Προσαρμογή περιεχομένου: π.χ. αποφυγή εξήγησης βασικών εννοιών, όταν παράγουμε έγγραφα για ειδικούς. –Προσαρμογή ανάλογα με την προϊστορία αλληλεπίδρασης: π.χ. συγκρίσεις με προηγούμενα εκθέματα. –Η φυσική γλώσσα ως μέσο μακρόχρονης διατήρησης γνώσεων.
5 Ίων Ανδρουτσόπουλος – Γλωσσική τεχνολογία και ψηφιακή επιμέλεια Παραγωγή κειμένων από οντολογίες OWL This is an aryballos, a kind of vessel. It was was found in the Heraion of Delos and it was created during the archaic period. The archaic period covers the time between 700 B.C. and 480 B.C. This aryballos was decorated with the black-figure technique and it is currently exhibited in the Archaeological Museum of Delos.
6 Ίων Ανδρουτσόπουλος – Γλωσσική τεχνολογία και ψηφιακή επιμέλεια Παραγωγή κειμένων σε εικονικά μουσεία Το σύστημα NaturalOWL διατίθεται ελεύθερα από τη διεύθυνση: Χρησιμοποιείται στο εθνικό έργο ΞΕΝΙΟΣ ( και στο ευρωπαϊκό έργο INDIGO (
7 Ίων Ανδρουτσόπουλος – Γλωσσική τεχνολογία και ψηφιακή επιμέλεια Ενδεικτικές μελλοντικές κατευθύνσεις Παραγωγή περιγραφών εκθεμάτων από CIDOC CRM. –Εφαρμογές σε φυσικές αλλά και εικονικές συλλογές εκθεμάτων. Πλήρωση οντολογιών μέσω αυτόματης ταξινόμησης εγγράφων και εξαγωγής πληροφοριών από αυτά. –Ιδιαίτερα για συλλογές εγγράφων πολιτιστικού, βιοϊατρικού και νομικού περιεχομένου. Ανάπτυξη διεπαφών φυσικής γλώσσας για οντολογίες. –Ιδιαίτερα οντολογίες OWL, CIDOC CRM, βιοϊατρικές, νομικές. –Ανάκτηση πληροφοριών από τις οντολογίες, αλλά και ανάκτηση των εγγράφων από τα οποία προέρχονται οι πληροφορίες αυτές. Αυτόματη παραγωγή περιλήψεων. –Ιδιαίτερα περιλήψεων που απαντούν συγκεκριμένα ερωτήματα. –Ιδιαίτερα για έγγραφα πολιτιστικού και βιοϊατρικού περιεχομένου.