Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Μάθημα 5 ο : Σημασιολογική ανάλυση 1 Ακαδημαϊκό Έτος 2013-2014.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Μάθημα 5 ο : Σημασιολογική ανάλυση 1 Ακαδημαϊκό Έτος 2013-2014."— Μεταγράφημα παρουσίασης:

1 Μάθημα 5 ο : Σημασιολογική ανάλυση 1 Ακαδημαϊκό Έτος 2013-2014

2 Οι διαφάνειες αυτού του μαθήματος βασίζονται στο κεφάλαιο 17 του βιβλίου: «Speech and Language Processing» των D. Jurafsky και J.H. Martin, 2η έκδοση, Pearson, 2009 2 Ακαδημαϊκό Έτος 2013-2014

3  Ορισμός:  Είναι η επιστημονική μελέτη του γλωσσικού νοήματος ενός εκφωνήματος  Τι είναι «σημασία» «έννοια» και «νόημα»  Αγγλικά: What is the meaning of the sentence X  Ελληνικά: Ποιο είναι το νόημα / η έννοια / η σημασία της πρότασης Χ 3 Ακαδημαϊκό Έτος 2013-2014

4  Μέχρι στιγμής, έχουμε επικεντρωθεί στην δομή της γλώσσας, και όχι στο τι σημαίνουν τα στοιχεία της  Είδαμε ότι οι λέξεις μπορεί να έχουν διαφορετική σημασία, ανάλογα με το περιβάλλον μέσα στο οποίο έχουν χρησιμοποιηθεί 4 Ακαδημαϊκό Έτος 2013-2014

5  Καθημερινές εργασίες που χρειάζονται σημασιολογική ανάλυση:  Απάντηση ερωτήματος σε διαγώνισμα  Γνώση θέματος, και πώς συνήθως απαντώνται  Παραγγελία φαγητού σε εστιατόριο διαβάζοντας τον κατάλογο, εκτέλεση συνταγής  Γνώση σχετική με φαγητό, την προετοιμασία, εστιατόρια,…  Αναγνώριση του ότι έχεις προσβληθεί..  Εκμάθηση χρήσης λογισμικού διαβάζοντας το εγχειρίδιο  Γνώση σχετική με Η/Υ, εφαρμογές, GUI, … 5 Ακαδημαϊκό Έτος 2013-2014

6  Η μετατροπή μιας πρότασης φυσική γλώσσας σε μια σημασιολογική αναπαράσταση (ΣΑ)  Η οποία αποτελείται από «πράγματα» που χρησιμοποιούνται για την αναπαράσταση καθημερινής, συνηθισμένης γνώσης του κόσμου 6 Ακαδημαϊκό Έτος 2013-2014

7 7

8  Συνδέουν γλωσσικές μορφές με γνώση για τον κόσμο  Διττή αναπαράσταση:  Σημασίας για την πρόταση  Κατάστασης κάποιου κόσμου  Τι είναι;  Οτιδήποτε εξυπηρετεί τους σκοπούς ενός προγράμματος που εκτελεί σημασιολογική ανάλυση 8 Ακαδημαϊκό Έτος 2013-2014

9  Θα καλύψουμε:  Ποια είναι η σημασία μιας λέξης  Πώς μπορούμε να αναπαραστήσουμε την σημασία  Τι φορμαλισμοί μπορούν να χρησιμοποιηθούν  Γλώσσες αναπαράστασης σημασίας 9 Ακαδημαϊκό Έτος 2013-2014

10  Επιθυμητά στοιχεία:  Επαληθευσιμότητα (Verifiability)  Σαφής Αναπαράσταση (Unambiguous Representation)  Κανονική Μορφή (Canonical Form)  Συμπερασμός (Inference)  Εκφραστικότητα (Expressiveness) 10 Ακαδημαϊκό Έτος 2013-2014

11  Η πλέον στοιχειώδης ιδιότητα:  Ποια η σχέση μεταξύ της έννοιας της πρότασης, και του κόσμου, όπως τον ξέρουμε;  Πρέπει να μπορούμε να καθορίσουμε το αληθές της αναπαράστασης  Ένα σύστημα πρέπει να μπορεί να συγκρίνει, ταιριάζει:  Την σημασιολογική αναπαράσταση με μια βάση γνώσης (ΒΓ)  Η οποία περιέχει πληροφορία για τον κόσμο 11 Ακαδημαϊκό Έτος 2013-2014

12  Π.χ. Does Maharani serve vegetarian food?  Αν υποθέσουμε ότι η πρόταση σημαίνει:  Maharani serves vegetarian food  Μπορούμε να έχουμε την αναπαράσταση:  Serves(Maharani, vegetarian food)  Η οποία πρέπει να συγκριθεί με την βάση γνώσης  Η οποία περιέχει γεγονότα για εστιατόρια  Αν βρεθεί ταίριασμα => «Ναι», αλλιώς => «Όχι»  Επαληθευσιμότητα: ικανότητα σύγκρισης μιας αναπαράστασης με μια βάση γνώσης για κάποιο κόσμο 12 Ακαδημαϊκό Έτος 2013-2014

13  Μια πρόταση μπορεί να έχει διαφορετικές σημασιολογικές αναπαραστάσεις  Κάθε σημασιολογική αναπαράσταση περιγράφει μια σημασία  Ανεξάρτητα από την αμφισημία της εισόδου, η τελική αναπαράσταση της σημασίας δεν πρέπει να είναι αμφίσημη  Ενδιάμεσες αναπαραστάσεις μπορεί να φέρουν αμφισημία  “I wanna eat someplace that’s close to ICSI.” 13 Ακαδημαϊκό Έτος 2013-2014

14  Σχετική έννοια είναι και η ασάφεια (vagueness)  Η σημασιολογική αναπαράσταση δεν προσδιορίζει επακριβώς το πραγματικό γεγονός  «Θέλω να φάω Ιταλικό φαγητό»  Δεν προκύπτουν πολλαπλές αναπαραστάσεις λόγω ασάφειας  Όπως στην περίπτωση της αμφισημίας  Η ασάφεια μπορεί να είναι αποδεκτή για κάποιες εφαρμογές  Θεμιτή η ασάφεια στην σημασιολογική αναπαράσταση 14 Ακαδημαϊκό Έτος 2013-2014

15  I went to the bank.  Bank: τράπεζα, όχθη  Αυτός είναι ψηλός.  Είναι ζεστό. 15 Ακαδημαϊκό Έτος 2013-2014

16  Πολλαπλές προτάσεις εισόδου μπορεί να έχουν την ίδια σημασία  Does Maharani have vegetarian dishes?  Do they have vegetarian food at Maharani?  Are vegetarian dishes served at Maharani?  Does Maharani serve vegetarian fare?  Εναλλακτική:  Τέσσερις σημασιολογικές αναπαραστάσεις  Αποθήκευση όλων των δυνατών αναπαραστάσεων στην βάση γνώσης (ΒΓ) 16 Ακαδημαϊκό Έτος 2013-2014

17  Λύση: ανάθεση σε όλες τις εισόδους με την ίδια σημασία, της ίδιας σημασιολογ. αναπαράστασης  Είναι εύκολο;  Όχι!  vegetarian fare, vegetarian dishes, vegetarian food  Σημαίνουν το ίδιο πράγμα σε αυτό το περιβάλλον χρήσης  Have, serve  Είναι ισοδύναμα, άσχετα με την διαφορετική σύνταξη  Τι μπορούμε να κάνουμε; 17 Ακαδημαϊκό Έτος 2013-2014

18  Αξιοποίηση θησαυρών για την συστηματική εξαγωγή ΣΑ  Π.χ. έννοιες λέξεων (word senses)  Food ___  Dish ___ | ___ Υπάρχει κάποια κοινή έννοια;  Fare ___ | ___ | …  Αξιοποίηση συντακτικών δομών για την συστηματική εξαγωγή ΣΑ  [S [NP Maharani] serves [NP vegetarian dishes]]  [S [NP vegetarian dishes] are served at [NP Maharani]] 18 Ακαδημαϊκό Έτος 2013-2014

19  Ένα πιο σύνθετο ερώτημα:  Can vegetarians eat at Maharani?  Αντί: Does Maharani serve vegetarian food?  Γιατί έχουν την ίδια απάντηση;  Μπορούμε να χρησιμοποιήσουμε την ίδια ΣΑ; (Όχι)  Δεν σημαίνουν το ίδιο πράγμα!  Απαντάμε το ίδιο επειδή:  Ξέρουμε τι τρώνε οι χορτοφάγοι  Ξέρουμε τι σερβίρουν τα χορτοφαγικά εστιατόρια  Κάνουμε την σύνδεση => Συμπερασμός 19 Ακαδημαϊκό Έτος 2013-2014

20  Εξαγωγή συμπερασμάτων για την αλήθεια κατηγορημάτων (propositions) που δεν είναι ρητά εκφρασμένα στην ΓΒ  Δεν περιέχονται αυτούσια στην ΓΒ  serve(Maharani, VegetarianFood) => CanEat(Vegetarians, AtMaharani) 20 Ακαδημαϊκό Έτος 2013-2014

21  Είναι επιθυμητό μια ΣΑ να μπορεί να περιγράψει μια ευρεία γκάμα από γεγονότα για τον κόσμο  Μια ΣΑ δεν πρέπει να θέτει σημαντικούς περιορισμούς  Ιδανικά θέλουμε μια ΣΑ ικανή να αναπαραστήσει οποιαδήποτε «λογική» πρόταση  Δεν είναι εύκολο να βρεθεί μια τέτοια ΣΑ  Υπάρχουν ωστόσο ΣΑ που είναι αρκετά εκφραστικές, επιτρέποντας την μοντελοποίηση αρκετών πραγμάτων  Πρωτοβάθμια Κατηγορηματική Λογική (First-Order Logic) 21 Ακαδημαϊκό Έτος 2013-2014

22  Αφορά τρόπους με τους οποίους η φυσική γλώσσα μεταφέρει σημασία  Οι φυσικές γλώσσες  Χρησιμοποιούν δομές κατηγόρημα-όρισμα (predicate – argument structure)  Χρησιμοποιούν μεταβλητές  Χρησιμοποιούν ποσοδείκτες (quantifiers)  Χρησιμοποιούν συνθετική σημασιολογία (compositional semantics)  Η σημασία κάθε έκφρασης ΦΓ υπολογίζεται ως συνάρτηση των σημασιών των επιμέρους μερών της 22 Ακαδημαϊκό Έτος 2013-2014

23  Η αρχή της συνθετικότητας είναι σημαντική στην σημασιολογία:  Η σημασία μιας έκφρασης είναι αυστηρά μια συνάρτηση των σημασιών των επιμέρους μερών της  Επιτρέπει την δημιουργία ΣΑ με αυξητικό τρόπο (incrementally)  Ο κατηγορικός λογισμός (predicate logic) δεν τηρεί αυτή την αρχή 23 Ακαδημαϊκό Έτος 2013-2014

24  Αναπαριστά έννοιες (concepts) και σχέσεις μεταξύ τους  Κάποιες λέξεις δρουν σαν ορίσματα, και κάποιες σαν κατηγορήματα:  Ουσιαστικά: έννοιες ή ορίσματα – κόκκινη(μπάλα)  Επίθετα, επιρρήματα, ρήματα: κατηγορήματα – κόκκινη(μπάλα) 24 Ακαδημαϊκό Έτος 2013-2014

25  Τα ρήματα υπαγορεύουν περιορισμούς:  Αριθμό, γένος, πτώση  Γραμματικές κατηγορίες  Θέση των φράσεων που τα συνοδεύουν  25 Ακαδημαϊκό Έτος 2013-2014

26  Το κατηγόρημα έχει δύο ορίσματα  Και τα δύο ορίσματα είναι τύπου ΟΦ (NP)  Το πρώτο όρισμα είναι πριν το ρήμα, και έχει τον ρόλο υποκειμένου  Το δεύτερο όρισμα είναι μετά το ρήμα, και έχει ρόλο του (άμεσου) αντικειμένου 26 Ακαδημαϊκό Έτος 2013-2014

27  Σημασιολογικοί/θεματικοί ρόλοι (semantic/thematic roles): συμμετέχουν σε ένα γεγονός  Ο υποκινητής μιας ενέργειας, ο αποδέκτης μιας ενέργειας, το αντικείμενο που μεταφέρει μια ενέργεια, κλπ.  Σημασιολογικοί περιορισμοί (selectional restrictions): περιορίζουν τους τύπους των ορισμάτων  Ο τρομοκράτης δολοφόνησε τον βουλευτή  *Η αράχνη δολοφόνησε την μύγα  • Subcategorisation ρημάτων: Επιτρέπουν την αντιστοίχιση ορισμάτων από την επιφανειακή δομή με τον συντακτικό τους ρόλο  Οι προθέσεις συμπεριφέρονται ανάλογα 27 Ακαδημαϊκό Έτος 2013-2014

28 28 Ακαδημαϊκό Έτος 2013-2014

29  First-Order Predicate Calculus:  – Παρέχει στέρεα υπολογιστική βάση για επαληθευσιμότητα, συμπερασμό και εκφραστικότητα  Επιτρέπει τον προσδιορισμό της αλήθειας/ψεύδους ενός κατηγορήματος  Επιτρέπει την συνθετικότητα της σημασίας  Επιτρέπει την απάντηση ερωτημάτων (μέσω μεταβλητών)  Επιτρέπει συμπερασμό 29 Ακαδημαϊκό Έτος 2013-2014

30  Όροι (terms):  Σταθερές: Maharani  Συναρτήσεις: LocationOf(Maharani)  Μεταβλητές: x in LocationOf(x)  Κατηγορήματα (predicates): σχέσεις μεταξύ αντικειμένων  Serves(Maharani, VegetarianFood)  Λογικοί τελεστές: επιτρέπουν σύνθεση σημασίας  I only have $5 and I don’t have a lot of time  Have (I, $5) ∧ ¬ � Have (I, lot of time) 30 Ακαδημαϊκό Έτος 2013-2014

31  Εκφράσεις σε ΠΚΛ μπορούν να σχετιστούν με τις τιμές Αληθές (True) ή Ψευδές (False) 31 Ακαδημαϊκό Έτος 2013-2014

32  Existential ( ∃ ): Υπάρχει  A restaurant that serves Mexican food near UMD  ( ∃ x)Restaurant(x) ∧ Serves(x.MexicanFood) ∧ Near(LocationOf(x),LocationOf(UMD))  Universal ( ∀ ): Για κάθε  All vegetarian restaurants serve vegetarian food  ( ∀ x)VegetarianRestaurant(x) ⇒ Serves(x,VegetarianFood) 32 Ακαδημαϊκό Έτος 2013-2014

33 33 Ακαδημαϊκό Έτος 2013-2014

34  Προτάσεις με το ρήμα “eat”  I ate.  I ate a turkey sandwich.  I ate a turkey sandwich at my desk.  I ate at my desk.  I ate lunch.  I ate a turkey sandwich for lunch.  I ate a turkey sandwich for lunch at my desk.  • Επτά διαφορετικές αναπαραστάσεις:  Eating1 (Speaker)  Eating2 (Speaker, TurkeySandwich)  Eating3 (Speaker, TurkeySandwich, Desk)  Eating4 (Speaker, Desk)  Eating5 (Speaker, Lunch)  Eating6 (Speaker, TurkeySandwich, Lunch)  Eating7 (Speaker, TurkeySandwich, Lunch, Desk) 34 Ακαδημαϊκό Έτος 2013-2014

35 35 Ακαδημαϊκό Έτος 2013-2014

36  Το κύριο κίνητρο για την χρήση της λογικής σαν ΣΑ, είναι επειδή επιτρέπει στέρεους (sound) και πλήρεις (complete) μεθόδους συμπερασμού  Στην κατηγορική λογική, ένα κατηγόρημα �, που περιέχει τις μεταβλητές Q1, …, Q, είναι έγκυρο αν το � είναι αληθές για όλες τις αληθείς τιμές των � Q1, …, Q 36 Ακαδημαϊκό Έτος 2013-2014

37  Αν υποθέσουμε ότι έχουμε:  Ένα σύνολο προτάσεων � S1, …, S  Και τις αντίστοιχες ΣΑ � P1, … P  Και θέλουμε να διαπιστώσουμε αν ένα � Q είναι έγκυρο  Αρκεί να ελέγξουμε αν το ακόλουθο είναι λογικά έγκυρο:  � P1 ∧ ⋯ ∧� P ⇒ Q 37 Ακαδημαϊκό Έτος 2013-2014

38  Δύο τρόποι συνδυασμού μεταξύ συντακτικής ανάλυσης και σημασιολογικής ανάλυσης 1. Οι δύο αναλύσεις γίνονται ταυτόχρονα, εμπλουτίζοντας την γραμματική με σημασιολογία 2. Η συντακτική ανάλυση πραγματοποιείται ανεξάρτητα, και με βάση το συντακτικό δέντρο δημιουργείται η σημασιολογική ερμηνεία 38 Ακαδημαϊκό Έτος 2013-2014

39 39 Ακαδημαϊκό Έτος 2013-2014

40 40 Ακαδημαϊκό Έτος 2013-2014

41  Ομώνυμα: ίδια γραφή, διαφορετικές σημασίες  Bank, γράμμα, άπειρος  Συνώνυμα: διαφορετικές λέξεις, με περίπου την ίδια σημασία  Αυτοκίνητο – αμάξι, big – large  Υπερώνυμο – υπώνυμο: ευρύτερη – στενότερη έννοια  Όχημα – αυτοκίνητο, θηλαστικό – άνθρωπος  Αντίθετα: αντίθετη έννοια  Μεγάλος – μικρός 41 Ακαδημαϊκό Έτος 2013-2014

42  Το δημοφιλέστερο ιεραρχικά οργανωμένο λεξικό της Αγγλικής (http://wordnet.princeton.edu/)  Κάθε έννοια παριστάνεται από ένα σύνολο συνωνύμων (synset) που μπορούν να έχουν αυτή την έννοια  Ιεραρχίες υπερωνύμων-υπωνύμων ανά μέρος του λόγου (ουσιαστικά, επίθετα, ρήματα, επιρρήματα)  Παρέχει και άλλες σχέσεις  Π.χ. μερώνυμα (το «παράθυρο» μέρος του «σπιτιού») 42 Ακαδημαϊκό Έτος 2013-2014

43  Επιλογή της σωστής έννοιας μιας λέξης σε ένα κείμενο (word sense disambiguation – WSD)  Χρήσιμο και σε άλλες εφαρμογές  Επιλογή από τις δυνατές έννοιες μιας λέξης (Wordnet), ή κατασκευή των δυνατών εννοιών μιας λέξης (sense induction)  Δημοφιλής η χρήση μηχανικής μάθησης 43 Ακαδημαϊκό Έτος 2013-2014


Κατέβασμα ppt "Μάθημα 5 ο : Σημασιολογική ανάλυση 1 Ακαδημαϊκό Έτος 2013-2014."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google