Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Μάθημα 5ο: Σημασιολογική ανάλυση

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Μάθημα 5ο: Σημασιολογική ανάλυση"— Μεταγράφημα παρουσίασης:

1 Μάθημα 5ο: Σημασιολογική ανάλυση
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 5ο: Σημασιολογική ανάλυση Ακαδημαϊκό Έτος

2 Οι διαφάνειες αυτού του μαθήματος βασίζονται στο κεφάλαιο 17 του βιβλίου: «Speech and Language Processing» των D. Jurafsky και J.H. Martin, 2η έκδοση, Pearson, 2009 Ακαδημαϊκό Έτος

3 Σημασιολογία Ορισμός: Τι είναι «σημασία» «έννοια» και «νόημα»
Είναι η επιστημονική μελέτη του γλωσσικού νοήματος ενός εκφωνήματος Τι είναι «σημασία» «έννοια» και «νόημα» Αγγλικά: What is the meaning of the sentence X Ελληνικά: Ποιο είναι το νόημα / η έννοια / η σημασία της πρότασης Χ Ακαδημαϊκό Έτος

4 Σημασιολογία (1) Μέχρι στιγμής, έχουμε επικεντρωθεί στην δομή της γλώσσας, και όχι στο τι σημαίνουν τα στοιχεία της Είδαμε ότι οι λέξεις μπορεί να έχουν διαφορετική σημασία, ανάλογα με το περιβάλλον μέσα στο οποίο έχουν χρησιμοποιηθεί Ακαδημαϊκό Έτος

5 Σημασιολογία (2) Καθημερινές εργασίες που χρειάζονται σημασιολογική ανάλυση: Απάντηση ερωτήματος σε διαγώνισμα Γνώση θέματος, και πώς συνήθως απαντώνται Παραγγελία φαγητού σε εστιατόριο διαβάζοντας τον κατάλογο, εκτέλεση συνταγής Γνώση σχετική με φαγητό, την προετοιμασία, εστιατόρια,… Αναγνώριση του ότι έχεις προσβληθεί.. Εκμάθηση χρήσης λογισμικού διαβάζοντας το εγχειρίδιο Γνώση σχετική με Η/Υ, εφαρμογές, GUI, … Ακαδημαϊκό Έτος

6 Σημασιολογική ανάλυση
Η μετατροπή μιας πρότασης φυσική γλώσσας σε μια σημασιολογική αναπαράσταση (ΣΑ) Η οποία αποτελείται από «πράγματα» που χρησιμοποιούνται για την αναπαράσταση καθημερινής, συνηθισμένης γνώσης του κόσμου Ακαδημαϊκό Έτος

7 I have a car Ακαδημαϊκό Έτος

8 Σημασιολογικές αναπαραστάσεις (1)
Συνδέουν γλωσσικές μορφές με γνώση για τον κόσμο Διττή αναπαράσταση: Σημασίας για την πρόταση Κατάστασης κάποιου κόσμου Τι είναι; Οτιδήποτε εξυπηρετεί τους σκοπούς ενός προγράμματος που εκτελεί σημασιολογική ανάλυση Ακαδημαϊκό Έτος

9 Σημασιολογικές αναπαραστάσεις (2)
Θα καλύψουμε: Ποια είναι η σημασία μιας λέξης Πώς μπορούμε να αναπαραστήσουμε την σημασία Τι φορμαλισμοί μπορούν να χρησιμοποιηθούν Γλώσσες αναπαράστασης σημασίας Ακαδημαϊκό Έτος

10 Αναπαράσταση σημασίας
Επιθυμητά στοιχεία: Επαληθευσιμότητα (Verifiability) Σαφής Αναπαράσταση (Unambiguous Representation) Κανονική Μορφή (Canonical Form) Συμπερασμός (Inference) Εκφραστικότητα (Expressiveness) Ακαδημαϊκό Έτος

11 Επαληθευσιμότητα (1) Η πλέον στοιχειώδης ιδιότητα:
Ποια η σχέση μεταξύ της έννοιας της πρότασης, και του κόσμου, όπως τον ξέρουμε; Πρέπει να μπορούμε να καθορίσουμε το αληθές της αναπαράστασης Ένα σύστημα πρέπει να μπορεί να συγκρίνει, ταιριάζει: Την σημασιολογική αναπαράσταση με μια βάση γνώσης (ΒΓ) Η οποία περιέχει πληροφορία για τον κόσμο Ακαδημαϊκό Έτος

12 Επαληθευσιμότητα (2) Π.χ. Does Maharani serve vegetarian food?
Αν υποθέσουμε ότι η πρόταση σημαίνει: Maharani serves vegetarian food Μπορούμε να έχουμε την αναπαράσταση: Serves(Maharani, vegetarian food) Η οποία πρέπει να συγκριθεί με την βάση γνώσης Η οποία περιέχει γεγονότα για εστιατόρια Αν βρεθεί ταίριασμα => «Ναι», αλλιώς => «Όχι» Επαληθευσιμότητα: ικανότητα σύγκρισης μιας αναπαράστασης με μια βάση γνώσης για κάποιο κόσμο Ακαδημαϊκό Έτος

13 Σαφής αναπαράσταση (1) Μια πρόταση μπορεί να έχει διαφορετικές σημασιολογικές αναπαραστάσεις Κάθε σημασιολογική αναπαράσταση περιγράφει μια σημασία Ανεξάρτητα από την αμφισημία της εισόδου, η τελική αναπαράσταση της σημασίας δεν πρέπει να είναι αμφίσημη Ενδιάμεσες αναπαραστάσεις μπορεί να φέρουν αμφισημία “I wanna eat someplace that’s close to ICSI.” Ακαδημαϊκό Έτος

14 Σαφής αναπαράσταση (2) Σχετική έννοια είναι και η ασάφεια (vagueness)
Η σημασιολογική αναπαράσταση δεν προσδιορίζει επακριβώς το πραγματικό γεγονός «Θέλω να φάω Ιταλικό φαγητό» Δεν προκύπτουν πολλαπλές αναπαραστάσεις λόγω ασάφειας Όπως στην περίπτωση της αμφισημίας Η ασάφεια μπορεί να είναι αποδεκτή για κάποιες εφαρμογές Θεμιτή η ασάφεια στην σημασιολογική αναπαράσταση Ακαδημαϊκό Έτος

15 Ασάφεια ή αμφισημία I went to the bank. Αυτός είναι ψηλός.
Είναι ζεστό. Ακαδημαϊκό Έτος

16 Κανονική μορφή (1) Πολλαπλές προτάσεις εισόδου μπορεί να έχουν την ίδια σημασία Does Maharani have vegetarian dishes? Do they have vegetarian food at Maharani? Are vegetarian dishes served at Maharani? Does Maharani serve vegetarian fare? Εναλλακτική: Τέσσερις σημασιολογικές αναπαραστάσεις Αποθήκευση όλων των δυνατών αναπαραστάσεων στην βάση γνώσης (ΒΓ) Ακαδημαϊκό Έτος

17 Κανονική μορφή (2) Λύση: ανάθεση σε όλες τις εισόδους με την ίδια σημασία, της ίδιας σημασιολογ. αναπαράστασης Είναι εύκολο; Όχι! vegetarian fare, vegetarian dishes, vegetarian food Σημαίνουν το ίδιο πράγμα σε αυτό το περιβάλλον χρήσης Have, serve Είναι ισοδύναμα, άσχετα με την διαφορετική σύνταξη Τι μπορούμε να κάνουμε; Ακαδημαϊκό Έτος

18 Παραγωγή κανονικής μορφής
Αξιοποίηση θησαυρών για την συστηματική εξαγωγή ΣΑ Π.χ. έννοιες λέξεων (word senses) Food ___ Dish ___ | ___ Υπάρχει κάποια κοινή έννοια; Fare ___ | ___ | … Αξιοποίηση συντακτικών δομών για την συστηματική εξαγωγή ΣΑ [S [NP Maharani] serves [NP vegetarian dishes]] [S [NP vegetarian dishes] are served at [NP Maharani]] Ακαδημαϊκό Έτος

19 Συμπερασμός (1) Ένα πιο σύνθετο ερώτημα:
Can vegetarians eat at Maharani? Αντί: Does Maharani serve vegetarian food? Γιατί έχουν την ίδια απάντηση; Μπορούμε να χρησιμοποιήσουμε την ίδια ΣΑ; (Όχι) Δεν σημαίνουν το ίδιο πράγμα! Απαντάμε το ίδιο επειδή: Ξέρουμε τι τρώνε οι χορτοφάγοι Ξέρουμε τι σερβίρουν τα χορτοφαγικά εστιατόρια Κάνουμε την σύνδεση => Συμπερασμός Ακαδημαϊκό Έτος

20 Συμπερασμός (2) Εξαγωγή συμπερασμάτων για την αλήθεια κατηγορημάτων (propositions) που δεν είναι ρητά εκφρασμένα στην ΓΒ Δεν περιέχονται αυτούσια στην ΓΒ serve(Maharani, VegetarianFood) => CanEat(Vegetarians, AtMaharani) Ακαδημαϊκό Έτος

21 Εκφραστικότητα Είναι επιθυμητό μια ΣΑ να μπορεί να περιγράψει μια ευρεία γκάμα από γεγονότα για τον κόσμο Μια ΣΑ δεν πρέπει να θέτει σημαντικούς περιορισμούς Ιδανικά θέλουμε μια ΣΑ ικανή να αναπαραστήσει οποιαδήποτε «λογική» πρόταση Δεν είναι εύκολο να βρεθεί μια τέτοια ΣΑ Υπάρχουν ωστόσο ΣΑ που είναι αρκετά εκφραστικές, επιτρέποντας την μοντελοποίηση αρκετών πραγμάτων Πρωτοβάθμια Κατηγορηματική Λογική (First-Order Logic) Ακαδημαϊκό Έτος

22 Σημασιολογική δομή γλώσσας (Meaning Structure of Language)
Αφορά τρόπους με τους οποίους η φυσική γλώσσα μεταφέρει σημασία Οι φυσικές γλώσσες Χρησιμοποιούν δομές κατηγόρημα-όρισμα (predicate – argument structure) Χρησιμοποιούν μεταβλητές Χρησιμοποιούν ποσοδείκτες (quantifiers) Χρησιμοποιούν συνθετική σημασιολογία (compositional semantics) Η σημασία κάθε έκφρασης ΦΓ υπολογίζεται ως συνάρτηση των σημασιών των επιμέρους μερών της Ακαδημαϊκό Έτος

23 Συνθετικότητα (compositionality)
Η αρχή της συνθετικότητας είναι σημαντική στην σημασιολογία: Η σημασία μιας έκφρασης είναι αυστηρά μια συνάρτηση των σημασιών των επιμέρους μερών της Επιτρέπει την δημιουργία ΣΑ με αυξητικό τρόπο (incrementally) Ο κατηγορικός λογισμός (predicate logic) δεν τηρεί αυτή την αρχή Ακαδημαϊκό Έτος

24 Δομή κατηγόρημα-όρισμα (1)
Αναπαριστά έννοιες (concepts) και σχέσεις μεταξύ τους Κάποιες λέξεις δρουν σαν ορίσματα, και κάποιες σαν κατηγορήματα: Ουσιαστικά: έννοιες ή ορίσματα – κόκκινη(μπάλα) Επίθετα, επιρρήματα, ρήματα: κατηγορήματα – κόκκινη(μπάλα) Ακαδημαϊκό Έτος

25 Δομή κατηγόρημα-όρισμα (2)
Τα ρήματα υπαγορεύουν περιορισμούς: Αριθμό, γένος, πτώση Γραμματικές κατηγορίες Θέση των φράσεων που τα συνοδεύουν Ακαδημαϊκό Έτος

26 Δομή κατηγόρημα-όρισμα (3)
Το κατηγόρημα έχει δύο ορίσματα Και τα δύο ορίσματα είναι τύπου ΟΦ (NP) Το πρώτο όρισμα είναι πριν το ρήμα, και έχει τον ρόλο υποκειμένου Το δεύτερο όρισμα είναι μετά το ρήμα, και έχει ρόλο του (άμεσου) αντικειμένου Ακαδημαϊκό Έτος

27 Σημασιολογικοί ρόλοι Σημασιολογικοί/θεματικοί ρόλοι (semantic/thematic roles): συμμετέχουν σε ένα γεγονός Ο υποκινητής μιας ενέργειας, ο αποδέκτης μιας ενέργειας, το αντικείμενο που μεταφέρει μια ενέργεια, κλπ. Σημασιολογικοί περιορισμοί (selectional restrictions): περιορίζουν τους τύπους των ορισμάτων Ο τρομοκράτης δολοφόνησε τον βουλευτή *Η αράχνη δολοφόνησε την μύγα • Subcategorisation ρημάτων: Επιτρέπουν την αντιστοίχιση ορισμάτων από την επιφανειακή δομή με τον συντακτικό τους ρόλο Οι προθέσεις συμπεριφέρονται ανάλογα Ακαδημαϊκό Έτος

28 Ένα μοντέλο για τον κόσμο των εστιατορίων
Ακαδημαϊκό Έτος

29 Πρωτοβάθμιος Κατηγορηματικός Λογισμός (1)
First-Order Predicate Calculus: – Παρέχει στέρεα υπολογιστική βάση για επαληθευσιμότητα, συμπερασμό και εκφραστικότητα Επιτρέπει τον προσδιορισμό της αλήθειας/ψεύδους ενός κατηγορήματος Επιτρέπει την συνθετικότητα της σημασίας Επιτρέπει την απάντηση ερωτημάτων (μέσω μεταβλητών) Επιτρέπει συμπερασμό Ακαδημαϊκό Έτος

30 ΠΚΛ: Σύνταξη Όροι (terms):
Σταθερές: Maharani Συναρτήσεις: LocationOf(Maharani) Μεταβλητές: x in LocationOf(x) Κατηγορήματα (predicates): σχέσεις μεταξύ αντικειμένων Serves(Maharani, VegetarianFood) Λογικοί τελεστές: επιτρέπουν σύνθεση σημασίας I only have $5 and I don’t have a lot of time Have (I, $5) ∧ ¬�Have (I, lot of time) Ακαδημαϊκό Έτος

31 ΠΚΛ: Σημασιολογία Εκφράσεις σε ΠΚΛ μπορούν να σχετιστούν με τις τιμές Αληθές (True) ή Ψευδές (False) Ακαδημαϊκό Έτος

32 Μεταβλητές και ποσοδείκτες
Existential (∃): Υπάρχει A restaurant that serves Mexican food near UMD (∃x)Restaurant(x) ∧ Serves(x.MexicanFood) ∧ Near(LocationOf(x),LocationOf(UMD)) Universal (∀): Για κάθε All vegetarian restaurants serve vegetarian food (∀x)VegetarianRestaurant(x) ⇒ Serves(x,VegetarianFood) Ακαδημαϊκό Έτος

33 Παραδείγματα Ακαδημαϊκό Έτος

34 Γιατί χρειαζόμαστε μεταβλητές;
Προτάσεις με το ρήμα “eat” I ate. I ate a turkey sandwich. I ate a turkey sandwich at my desk. I ate at my desk. I ate lunch. I ate a turkey sandwich for lunch. I ate a turkey sandwich for lunch at my desk. • Επτά διαφορετικές αναπαραστάσεις: Eating1 (Speaker) Eating2 (Speaker, TurkeySandwich) Eating3 (Speaker, TurkeySandwich, Desk) Eating4 (Speaker, Desk) Eating5 (Speaker, Lunch) Eating6 (Speaker, TurkeySandwich, Lunch) Eating7 (Speaker, TurkeySandwich, Lunch, Desk) Ακαδημαϊκό Έτος

35 Λύση με μεταβλητές Ακαδημαϊκό Έτος

36 Συμπερασμός (1) Το κύριο κίνητρο για την χρήση της λογικής σαν ΣΑ, είναι επειδή επιτρέπει στέρεους (sound) και πλήρεις (complete) μεθόδους συμπερασμού Στην κατηγορική λογική, ένα κατηγόρημα �, που περιέχει τις μεταβλητές Q1, … , Q𝑛, είναι έγκυρο αν το � είναι αληθές για όλες τις αληθείς τιμές των �Q1, … , Q𝑛 Ακαδημαϊκό Έτος

37 Συμπερασμός (2) Αν υποθέσουμε ότι έχουμε:
Ένα σύνολο προτάσεων �S1, … , S𝑛 Και τις αντίστοιχες ΣΑ �P1, … P𝑛 Και θέλουμε να διαπιστώσουμε αν ένα �Q είναι έγκυρο Αρκεί να ελέγξουμε αν το ακόλουθο είναι λογικά έγκυρο: �P1 ∧ ⋯ ∧�P𝑛 ⇒ Q Ακαδημαϊκό Έτος

38 Σύνταξη και Σημασιολογία
Δύο τρόποι συνδυασμού μεταξύ συντακτικής ανάλυσης και σημασιολογικής ανάλυσης 1. Οι δύο αναλύσεις γίνονται ταυτόχρονα, εμπλουτίζοντας την γραμματική με σημασιολογία 2. Η συντακτική ανάλυση πραγματοποιείται ανεξάρτητα, και με βάση το συντακτικό δέντρο δημιουργείται η σημασιολογική ερμηνεία Ακαδημαϊκό Έτος

39 Σημασιολογικές προσαρτήσεις
Ακαδημαϊκό Έτος

40 Σημασιολογία απλών προτάσεων
Ακαδημαϊκό Έτος

41 Σημασιολογικές σχέσεις λέξεων
Ομώνυμα: ίδια γραφή, διαφορετικές σημασίες Bank, γράμμα, άπειρος Συνώνυμα: διαφορετικές λέξεις, με περίπου την ίδια σημασία Αυτοκίνητο – αμάξι, big – large Υπερώνυμο – υπώνυμο: ευρύτερη – στενότερη έννοια Όχημα – αυτοκίνητο, θηλαστικό – άνθρωπος Αντίθετα: αντίθετη έννοια Μεγάλος – μικρός Ακαδημαϊκό Έτος

42 Wordnet Το δημοφιλέστερο ιεραρχικά οργανωμένο λεξικό της Αγγλικής ( Κάθε έννοια παριστάνεται από ένα σύνολο συνωνύμων (synset) που μπορούν να έχουν αυτή την έννοια Ιεραρχίες υπερωνύμων-υπωνύμων ανά μέρος του λόγου (ουσιαστικά, επίθετα, ρήματα, επιρρήματα) Παρέχει και άλλες σχέσεις Π.χ. μερώνυμα (το «παράθυρο» μέρος του «σπιτιού») Ακαδημαϊκό Έτος

43 Αποσαφήνιση εννοιών λέξεων
Επιλογή της σωστής έννοιας μιας λέξης σε ένα κείμενο (word sense disambiguation – WSD) Χρήσιμο και σε άλλες εφαρμογές Επιλογή από τις δυνατές έννοιες μιας λέξης (Wordnet), ή κατασκευή των δυνατών εννοιών μιας λέξης (sense induction) Δημοφιλής η χρήση μηχανικής μάθησης Ακαδημαϊκό Έτος


Κατέβασμα ppt "Μάθημα 5ο: Σημασιολογική ανάλυση"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google