Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στη Γλωσσική Τεχνολογία 1Ακαδημαϊκό Έτος 2013-2014.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στη Γλωσσική Τεχνολογία 1Ακαδημαϊκό Έτος 2013-2014."— Μεταγράφημα παρουσίασης:

1 ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στη Γλωσσική Τεχνολογία 1Ακαδημαϊκό Έτος 2013-2014

2 Βασισμένο στις διαλέξεις προηγούμενων ετών της Σοφίας Στάμου και του Γιώργου Πετάση Ακαδημαϊκό Έτος 2013-20142

3 Εισαγωγικά Γλώσσα ◦Μέσο ανταλλαγής και καταγραφής πληροφοριών Φυσική Γλώσσα ◦Μέσο επικοινωνίας μεταξύ ανθρώπων Τεχνητή γλώσσα ◦Μέσο επικοινωνίας ανθρώπου- μηχανής Ελληνικά vs Java 3Ακαδημαϊκό Έτος 2013-2014

4 Τι είναι η γλωσσική τεχνολογία; Ορισμός ◦Η ανάπτυξη και μελέτη υπολογιστικών μοντέλων επεξεργασίας πληροφορίας εκφρασμένης σε φυσική γλώσσα Δημιουργία φορμαλιστικών μοντέλων (θεωρητική) ◦Αναπαράσταση της γλωσσολογικής γνώσης ◦Περιγραφή των μηχανισμών κατανόησης και παραγωγής της γλώσσας από τον άνθρωπο Ανάπτυξη συστημάτων λογισμικού για την επεξεργασία φυσικής γλώσσας (εφαρμοσμένη) Ακαδημαϊκό Έτος 2013-20144

5 Γλωσσική Τεχνολογία Αυτόματη ανάλυση και παραγωγή γραπτών ή προφορικών εκφράσεων φυσικής γλώσσας*: ◦Αυτόματη διόρθωση κειμένου ◦Επεξεργασία λόγου(αναγνώριση-σύνθεση) ◦Μηχανική μετάφραση ◦Ανάκτηση, Εξαγωγή πληροφορίας ◦Αυτόματη εξαγωγή περιλήψεων ◦Εξόρυξη κειμένου, άποψης ◦... *διάφορα μέσα την περιέχουν Ακαδημαϊκό Έτος 2013-20145

6 Γιατί είναι σημαντική; Κατανόηση της ανάλυσης και της παραγωγής της γλώσσας Επικοινωνία Πολύ μεγάλο μέρος της καταγεγραμένης ανθρώπινης γνώσης είναι εκφρασμένο σε φυσική γλώσσα ◦Γνώση οργανισμών: νόμοι, κανονισμοί, εγχειρίδια, οδηγίες, κλπ ◦Πληροφορία από/για χρήστες: ιστότοποι οργανισμών, αλληλογραφία, περιγραφές προϊόντων, μέσα κοινωνικής δικτύωσης, κλπ Ακαδημαϊκό Έτος 2013-20146

7 Ακόμα.. Ραγδαία αύξηση του Παγκόσμιου Ιστού ◦Μεγάλος όγκος πληροφορίας, άμεσα προσβάσιμος  Υπερ-πληροφόρηση Γλωσσική Τεχνολογία ◦Ανακάλυψη νέων τρόπων, καλύτερη συμβίωση με την τεχνολογία  Συστήματα που: ◦ Αναγνωρίζουν λόγο(ομιλία-γραφή) ◦ Κατανοούν κείμενα, επιλογή πληροφοριών ◦ Μεταφράζουν από μια γλώσσα σε άλλη ◦ Συνθέτουν λόγο ◦... Ακαδημαϊκό Έτος 2013-20147

8 Γιατί είναι δύσκολη; Η φυσική γλώσσα είναι περίπλοκη... ◦Πολλαπλοί τρόποι έκφρασης της ίδιας πληροφορίας ◦Ελλιπής πληροφορία ◦Ασάφεια ◦Διαφορετικό νόημα ανάλογα με το περιβάλλον ◦Δημιουργία νέων εκφράσεων, κλπ επειδή απευθύνεται σε ανθρώπους ◦Χρήση της γνώσης του κόσμου και της εμπειρίας για την κατανόηση της φυσικής γλώσσας Η μηχανή δυσκολεύεται σημαντικά ◦Περιορισμένη γνώση του κόσμου  Εστίαση σε θεματικές περιοχές, χρήση οντολογιών Ακαδημαϊκό Έτος 2013-20148

9 Ασάφεια Φωνολογική ◦Λύπη, λείπει, λίπη ◦Στον ώμο, στο νόμο Μορφοσυντακτική ◦Οι απαντήσεις, να απαντήσεις Σημασιολογική ◦Ποντίκι ◦Τόνος Πραγματολογική ◦- Ξέρεις τι ώρα είναι; ◦- Μα δεν σας είπα ότι δεν θέλω πράσινο; Ακαδημαϊκό Έτος 2013-20149

10 Συναφείς όροι Επεξεργασία Φυσικής Γλώσσας (NLP - Natural Language Processing) ◦Κυρίως γραπτό λόγο, δημιουργία υπολογιστικών συστημάτων, υποτομέας της ΤΝ Υπολογιστική Γλωσσολογία (CL – Computational Linguistics) ◦Κυρίως γραπτό λόγο, δημιουργία υπολογιστικών μοντέλων γλωσσολογικών θεωριών, πλέον συνώνυμο της ΕΦΓ Γλωσσική Τεχνολογία (LT – Language Technology) ◦Λιγότερο καθιερωμένος όρος, κυρίως τεχνικές επεξεργασίας φωνής, έμφαση στη δημιουργία υπολογιστικών συστημάτων Ακαδημαϊκό Έτος 2013-201410

11 Ανάλυση και παραγωγή λόγου Ακαδημαϊκό Έτος 2013-201411

12 Επίπεδα ανάλυσης λόγου Αναγνώριση λέξεων, προτάσεων, … Πληροφορίες για τις λέξεις, όπως θέμα, κατάληξη, πρόσωπο, αριθμό, γένος, … Συντακτική δομή περιόδων, ρόλοι των λέξεων, κλπ. Αναγνώριση του νοήματος των προτάσεων Αναφορικές εκφράσεις, σχέσεις μεταξύ προτάσεων Σκοποί του χρήστη, σχέδια δράσεως, … Ακαδημαϊκό Έτος 2013-201412

13 Σύντομη αναδρομή Γλωσσική τεχνολογία: τόσο παλιά όσο και οι Η/Υ ◦50s: αρχή έρευνας Επιρροή Noam Chomsky ◦Διατύπωση θεωριών εκμάθησης της γλώσσας από παιδιά ◦Ιεραρχία γλωσσών, αποτελούμενη από 4 κατηγορίες γραματικών  Κανονικές  Ανεξάρτητες από τα συμφραζόμενα  Εξαρτημένες άπό τα συμφραζόμενα  Απεριόριστες Ακαδημαϊκό Έτος 2013-201413

14 Ιστορικό 1950 - 1965 ◦Πρώτα βήματα, έμφαση στην μηχανική μετάφραση 1965 – 1980 ◦Έμφαση στη σημασιολογία 1980 – 1990 ◦Έμφαση στη σύνταξη, στατιστική μηχανική μετάφραση, αναγνώριση ομιλίας 1990 – σήμερα ◦Εργασίες χαμηλού επιπέδου, συνδυασμός με τεχνικές μηχανικής μάθησης, εξαγωγή πληροφορίας, αξιολόγηση Ακαδημαϊκό Έτος 2013-201414

15 Εφαρμογές Υποστήριξη συγγραφής Μετάφραση κειμένων Κατηγοριοποίηση/φιλτράρισμα κειμένου Εξαγωγή πληροφορίας – παραγωγή περίληψης Διεπαφές σε φυσική γλώσσα Αυτόματος υποτιτλισμός Εξαγωγή στοιχείων για το συγγραφέα από τον τρόπο γραφής του Εντοπισμός συναισθήματος Αντιστοίχηση βιογραφικών με αγγελίες ευρέσεως εργασίας Ακαδημαϊκό Έτος 2013-201415

16 Κοινές εργασίες Αναγνώριση ομιλίας, OCR Καθάρισμα κειμένων (π.χ. από HTML) Αναγνώριση λέξεων/προτάσεων Αναγνώριση μερών του λόγου Ρηχή συντακτική ανάλυση Αναγνώριση ονομάτων οντοτήτων Εξαγωγή συσχετίσεων Αναγνώριση συναισθήματος/πολικότητας Αποσαφήνιση έννοιας λέξεων Ακαδημαϊκό Έτος 2013-201416

17 Πλατφόρμες GATE - http://gate.ac.uk/ ◦Η πρώτη δημοφιλής πλατφόρμα – Java Ellogon - http://www.ellogon.org/ ◦Η πρώτη UNICODE πλατφόρμα – C/C++/Tcl/… NLTK - http://nltk.org/ ◦Η «εκπαιδευτική» πλατφόρμα – Python Apache UIMA - http://uima.apache.org/ ◦Η «ανερχόμενη» πλατφόρμα – Java/C++ Ακαδημαϊκό Έτος 2013-201417


Κατέβασμα ppt "ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στη Γλωσσική Τεχνολογία 1Ακαδημαϊκό Έτος 2013-2014."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google