Μάθημα 4ο: Συντακτική Ανάλυση

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Γραφήματα & Επίπεδα Γραφήματα
Advertisements

Copyright © 2005 Elsevier Κεφάλαιο 2 :: Σύνταξη των γλωσσών προγραμματισμού Πραγματολογία των Γλωσσών Προγραμματισμού Michael L. Scott.
ΓΡΑΜΜΑΤΙΚΕΣ ΧΩΡΙΣ ΣΥΜΦΡΑΖΟΜΕΝΑ I
Λογισμικό Συστήματος Κλειώ Σγουροπούλου.
Γιάννος Ιωάννου Σύμβουλος Καθηγητής Πληροφορικής Μέσης Εκπαίδευσης
Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.
Πιθανοκρατικοί Αλγόριθμοι
ΣΤΟΙΧΕΙΑ ΨΕΥΔΟΚΩΔΙΚΑ ΒΑΣΙΚΕΣ ΔΟΜΕΣ ΒΑΣΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΩΝ
Οι διαφάνειες αυτού του μαθήματος βασίζονται
Ο Αλγόριθμος FP-Growth. Αλγόριθμος FP-Growth Ο αλγόριθμος χρησιμοποιεί μια συμπιεσμένη αναπαράσταση της βάσης των συναλλαγών με τη μορφή ενός FP-δέντρου.
Web Services Υπηρεσίες διαδικτύου
ΕΙΔΙΚΕΣ ΜΑΘΗΣΙΑΚΕΣ ΔΥΣΚΟΛΙΕΣ
Κεφάλαιο 2ο Πεπερασμένα αυτόματα.
Γραφήματα & Επίπεδα Γραφήματα
Επιστημονικός Συνεργάτης ΤΕΙ Καβάλας
ΘΠ06 - Μεταγλωττιστές Πίνακας Συμβόλων. Πίνακας Συμβόλων (Symbol Table) (Ι)  Είναι μια δομή στην οποία αποθηκεύονται τα ονόματα ενός προγράμματος και.
Γιάννης Σταματίου Μερικά προβλήματα μέτρησης
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
ΕΠΛ Θεωρία και Πρακτική Μεταγλωττιστών5-1 Επίλυσης ασάφειας με εισαγωγή μη-τερματικών Π.χ. stmt = “if”, expr, “then”, stmt | “if”, expr, “then”,
Ψηφιακά Δένδρα TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A Μπορούμε να χρησιμοποιήσουμε την παραπάνω αναπαράσταση.
ΕΠΛ 231 – Δομές Δεδομένων και Αλγόριθμοι12-1 Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Ο αλγόριθμος του Prim και ο αλγόριθμος του Kruskal.
Ανάπτυξη της γλώσσας Η ανάπτυξη της γλωσσικής ικανότητας περνάει από συγκεκριμένα στάδια απόκτησης γλωσσικών επιπέδων. Ο στόχος ενός παιδιού που μαθαίνει.
ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ 2: ΘΕΜΑΤΑ ΘΕΩΡΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Η/Υ
ΘΕΩΡΙΑ ΠΟΛΥΠΛΟΚΟΤΗΤΑΣ ΠΑΡΟΥΣΙΑΣΗ ΣΤΑ ΚΕΦΑΛΑΙΑ 7.4 – 7.6 NP ΠΛΗΡΟΤΗΤΑ.
ΘΠ06 - Μεταγλωττιστές Πίνακας Συμβόλων Φροντιστήριο - 30/04/2009.
Σχεδίαση Αλγορίθμων. Διεργασίες (1/2) Μία διεργασία αλληλεπιδρά με το περιβάλλον της δεχόμενη είσοδο και παράγοντας έξοδο.
ΘΠ06 - Μεταγλωττιστές Εισαγωγή στον Bison Φροντιστήριο - 30/03/2009.
ΘΠ06 - Μεταγλωττιστές Συντακτική Ανάλυση, Bison 1.
Θεωρία Υπολογισμού Εισαγωγή (μέρος 2 ο ) Πρακτική Θεωρία.
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Information Extraction.
ΝΤΕΝΤΕΡΜΙΝΙΣΤΙΚΑ ΠΕΠΕΡΑΣΜΕΝΑ ΑΥΤΟΜΑΤΑ Ι
ΕΠΛ 223 Θεωρία και Πρακτική Μεταγλωττιστών7-1 Πίνακας Συμβόλων Πίνακας συμβόλων: δομή δεδομένων που χρησιμοποιείται για την αποθήκευση διαφόρων πληροφοριών.
Μάθημα 1ο: Εισαγωγή στη Γλωσσική Τεχνολογία
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών – Τμήμα Πληροφορικής και Τηλεπικοινωνιών 1 Κεφάλαιο 3 Η Σημασιολογία των Γλωσσών Προγραμματισμού Προπτυχιακό.
Έλενα Αναγνωστοπούλου
ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ 2: ΘΕΜΑΤΑ ΘΕΩΡΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Η/Υ
Έλενα Αναγνωστοπούλου
Λεξικό, Union – Find Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
Διερεύνηση γραφήματος. Ένας αλγόριθμος διερεύνησης γραφήματος επισκέπτεται τους κόμβους του γραφήματος με μια καθορισμένη στρατηγική, π.χ. κατά εύρος.
ΘΠ06 - Μεταγλωττιστές Εισαγωγή στον Bison Φροντιστήριο - 23/03/2010.
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών – Τμήμα Πληροφορικής και Τηλεπικοινωνιών 1 Κεφάλαιο 4 Σημασιολογία μιας Απλής Προστακτικής Γλώσσας Προπτυχιακό.
ΕΠΛ 231 – Δομές Δεδομένων και Αλγόριθμοι 8-1 Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: 2-3 Δένδρα, Υλοποίηση και πράξεις Β-δένδρα B-Δένδρα.
Μεταγλωττιστές (Compilers) (Θ) Ενότητα 13: Επαναληπτικό μάθημα Κατερίνα Γεωργούλη Τμήμα Μηχανικών Πληροφορικής ΤΕ Το περιεχόμενο του μαθήματος διατίθεται.
1 ΤΜΗΜΑ ΜΠΕΣ Αλγόριθμοι Αναζήτησης Εργασία 1 Τυφλή Αναζήτηση.
Γλώσσα και σκέψη Με τον όρο σκέψη εννοούμε ένα μεγάλο φάσμα νοητικών διεργασιών: Επεξεργασία εννοιών, επίλυση προβλημάτων, ονειροπόληση, προγραμματισμό.
Δομές Δεδομένων 1 Θέματα Απόδοσης. Δομές Δεδομένων 2 Οργανώνοντας τα Δεδομένα  Η επιλογή της δομής δεδομένων και του αλγορίθμου επηρεάζουν το χρόνο εκτέλεσης.
Περιεχόμενα Μαθήματος
Διαγνώσιμες και μη-διαγνώσιμες ασυμφραστικές γραμματικές και γλώσσες
Θεωρία Υπολογισμού Λήμμα της Άντλησης -Παραδείγματα.
ONOMATIKEΣ ΦΡΑΣΕΙΣ ΚΑΙ ΡΗΜΑΤΙΚΕΣ ΦΡΑΣΕΙΣ
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
Γλώσσες Προγραμματισμού Μεταγλωττιστές Πίνακας Συμβόλων Πανεπιστήμιο Μακεδονίας Τμήμα Εφαρμοσμένης Πληροφορικής Ηλίας Σακελλαρίου.
Γλώσσες Προγραμματισμού Μεταγλωττιστές Συντακτική Ανάλυση II Πανεπιστήμιο Μακεδονίας Τμήμα Εφαρμοσμένης Πληροφορικής Ηλίας Σακελλαρίου.
Διπλωματική Εργασία: Ανάπτυξη παράλληλων αλγορίθμων για γεωγραφικά προβλήματα Μεταπτυχιακό στα Συστήματα Τηλεπικοινωνιών και στην Πληροφορική Τμήμα Μηχανικών.
Ανάπτυξη της γλώσσας Η ανάπτυξη της γλωσσικής ικανότητας περνάει από συγκεκριμένα στάδια απόκτησης γλωσσικών επιπέδων. Ο στόχος ενός παιδιού που μαθαίνει.
Θέματα υπολογισμού στον πολιτισμό
Δυναμικός Κατακερματισμός
Επίλυση Προβλημάτων με Αναζήτηση
Προβλήματα Ικανοποίησης Περιορισμών
Κεφάλαιο 4 :: Σημασιολογική Ανάλυση
Διδάσκων: Δρ. Τσίντζα Παναγιώτα
Ισοδυναμία ΠΑ - ΚΕ Για να δείξουμε ότι οι κανονικές γλώσσες - εκφράσεις και τα πεπερασμένα αυτόματα είναι ισοδύναμα σε εκφραστική δυνατότητα έχουμε να.
Ισοδυναμία ΜΠΑ με ΠΑ Για κάθε ΜΠΑ Μ υπάρχει αλγόριθμος ο οποίος κατασκευάζει ΠΑ Μ’ αιτιοκρατικό ώστε να αναγνωρίζουν την ίδια ακριβώς γλώσσα. Καθώς το.
Νικήτας Σγούρος Μεταγλωττιστές Νικήτας Σγούρος
Νικήτας Σγούρος Μεταγλωττιστές Νικήτας Σγούρος
Προβλήματα Ικανοποίησης Περιορισμών (Επιπλέον Διαφάνειες) Μανόλης Κουμπαράκης Τεχνητή Νοημοσύνη.
Ενότητα 11: Επίλυση Προβλημάτων
Εξωτερική Αναζήτηση Ιεραρχία Μνήμης Υπολογιστή Εξωτερική Μνήμη
Δυναμικός Κατακερματισμός
Αναδρομή Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα:
Μεταγράφημα παρουσίασης:

Μάθημα 4ο: Συντακτική Ανάλυση ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Ακαδημαϊκό Έτος 2013-2014

Οι διαφάνειες αυτού του μαθήματος βασίζονται στα κεφάλαια 12 και 13 του βιβλίου: «Speech and Language Processing» των D. Jurafsky και J.H. Martin, 2η έκδοση, Pearson, 2009 Ακαδημαϊκό Έτος 2013-2014

Σύνταξη Ο τομέας της γλωσσολογίας που μελετά τη δομή των προτάσεων Δλδ ποιές σχέσεις συνδέουν μια ακολουθία Σε καμία φυσική γλώσσα οι προτάσεις δεν αποτελούν τυχαία παράθεση λέξεων ή ομάδων λέξεων Ύπαρξη κανόνων=> δόμηση πρότασης Συντακτικοί κανόνες: καθολικοί ή όχι α) Π => ΟΦ + ΡΦ β) γράφω/ εγώ γράφω, ενώ I write/*write Ακαδημαϊκό Έτος 2013-2014

Γλωσσική ικανότητα και πλήρωση (1) Γλωσσική ικανότητα: γενικά η γνώση του φυσικού ομιλητή για τη γλώσσα του, μέρος της οποίας είναι και η γραμματική Ικανότητα: γραμματικότητα πρότασης, γνώση δομής συστήματος Γλωσσική πλήρωση: η γλωσσική συμπεριφορά του ομιλητή κατά την επικοινωνία Η Μαρία ξεκίνησε να διαβάζει το βιβλίο. *Κώστας ο βάζο έσπασε το. *Ο σκύλος τραγούδησε τα κίτρινα δάπεδα. *Κοντεύω να φτάσεις. Ακαδημαϊκό Έτος 2013-2014

Γλωσσική ικανότητα και πλήρωση (2) H διάκριση γραμματικών από μη-γραμματικές προτάσεις είναι μέρος της γλωσσικής μας ικανότητας. Αυτό αποτελεί το γλωσσικό μας αίσθημα ή γλωσσική διαίσθηση H γλωσσική πλήρωση, από την άλλη μεριά, επιτρέπει τόσο γραμματικές όσο και μη-γραμματικές προτάσεις και δεν κάνει αυτή τη διάκριση Ακαδημαϊκό Έτος 2013-2014

Συντακτική ανάλυση (1) Η μετατροπή μιας πρότασης φυσικής γλώσσας σε μια ιεραρχική δομή Η οποία ανταποκρίνεται στην διασύνδεση των δομικών στοιχείων της πρότασης Η ανάλυση μπορεί να επιστρέψει περισσότερες από μία δομές (parses) Η πιο απλή μορφή δομής είναι ένα συντακτικό δέντρο (syntax tree) Ακαδημαϊκό Έτος 2013-2014

Συντακτική ανάλυση (2) Συνήθως τα υπάρχοντα συστήματα έχουν δύο συστατικά: Γραμματική (grammar): ρητή αναπαράσταση των συντακτικών κανόνων της γλώσσας Δηλωτικοί φορμαλισμοί που ορίζουν τις έγκυρες προτάσεις μιας γλώσσας, αλλά δεν καθορίζουν πως θα γίνει η αναγνώριση και η παραγωγή συντακτικών δομών Αναλυτής (parser): αναλύει τις προτάσεις εισόδου, συγκρίνοντάς τες με την γραμματική, και παράγει συντακτικές δομές Ακαδημαϊκό Έτος 2013-2014

Τι χρειαζόμαστε για την ανάλυση; (1) Τι γλωσσική πληροφορία χρειαζόμαστε για την συντακτική ανάλυση; Λέξεις Κατηγορίες: σύνολα λέξεων που συμπεριφέρονται όμοια Μέρη του λόγου: Ουσιαστικά, ρήματα, επίθετα, προθέσεις, κλπ. Συστατικά (constituents): Ομαδοποίηση λέξεων σε μεγαλύτερες ενότητες, οι οποίες συμπεριφέρονται όμοια Και έχουν ένα συγκεκριμένο μέρος του λόγου σαν «κύριο» (head) Φράσεις: Ονοματική φράση με «κύριο» το ουσιαστικό, ρηματική φράση με «κύριο» το ρήμα, κλπ. Ακαδημαϊκό Έτος 2013-2014

Τι χρειαζόμαστε για την ανάλυση; (2) Έχοντας: Μορφολογική ανάλυση: ανάλυση λέξεων σε μορφήματα και προσφύματα Με κανόνες, FSA, FST Αναγνώριση μερών του λόγου Περιμένουμε από την συντακτική ανάλυση: Να προσδιορίσει τα συστατικά, και πώς σχετίζονται Να προσδιορίσει αν μια πρόταση είναι γραμματικά σωστή Να παράγει συντακτικές δομές Ακαδημαϊκό Έτος 2013-2014

Παράδειγμα: Ανάλυση 1 Ακαδημαϊκό Έτος 2013-2014

Παράδειγμα: Ανάλυση 2 Ακαδημαϊκό Έτος 2013-2014

Γραμματικές ΦΓ (1) Ακαδημαϊκό Έτος 2013-2014

Γραμματικές ΦΓ (2) Οι γραμματικές χρησιμοποιούνται: Για την ανάλυση φυσικής γλώσσας Για την παραγωγή φυσικής γλώσσας Γλώσσα της γραμματικής: οι ακολουθίες τερματικών συμβόλων που παράγονται από το αρχικό σύμβολο Ακαδημαϊκό Έτος 2013-2014

Ιεραρχία γραμματικών του Chomsky (1) Ακαδημαϊκό Έτος 2013-2014

Ιεραρχία γραμματικών του Chomsky (2) Τύπος 2: γραμματικές χωρίς συμφραζόμενα (context free grammars) Μορφή κανόνων A→ α α: (πιθανώς κενή) ακολουθία τερματικών και μη τερματικών συμβόλων Επιτρέπουν κανόνες της μορφής: 𝑁𝑃 → Det Nominal (δεν επιτρέπεται στις κανονικές γραμματικές) Ονομάζονται και Phrase-Structure Grammars (PSG) Ακαδημαϊκό Έτος 2013-2014

Ιεραρχία γραμματικών του Chomsky (3) Τύπος 1: γραμματικές με συμφραζόμενα (context sensitive grammars) Μορφή κανόνων αΑβ → αγβ α, β, γ: ακολουθίες τερματικών και μη τερματικών συμβόλων – Το γ μη κενό, τα α, β πιθανώς κενά Επιτρέπουν κανόνες της μορφής: ( Date ) → ( Day / Month / Year ) Αυτή η μορφή δεν επιτρέπεται στις γραμματικές χωρίς συμφραζόμενα  formal grammar in which the left-hand sides and right-hand sides of any production rules may be surrounded by a context ofterminal and nonterminal symbols. Context-sensitive grammars are more general than context-free grammars but still orderly enough to be parsed by a linear bounded automaton. Ακαδημαϊκό Έτος 2013-2014

Ιεραρχία γραμματικών του Chomsky (4) Τύπος 0: αναδρομικά απαριθμήσιμες Μορφή κανόνων α → β α, β: ακολουθίες τερματικών και μη τερματικών συμβόλων – Το α μη κενό Ακαδημαϊκό Έτος 2013-2014

Παραγωγική ισχύς γραμματικών (1) yposynolo Ακαδημαϊκό Έτος 2013-2014

Παραγωγική ισχύς γραμματικών (2) Ακαδημαϊκό Έτος 2013-2014

Μοντέλα υπολογισμού Οι κανονικές γραμματικές αντιστοιχούν σε αυτόματα πεπερασμένων καταστάσεων (FSA) Για κάθε κανονική γραμματική, μπορεί να οριστεί FSA που να ορίζει την ίδια ακριβώς γλώσσα (και το αντίστροφο) Οι γραμματικές χωρίς συμφραζόμενα αντιστοιχούν σε μη αιτιοκρατικά (non deterministic) FSA με στοίβα Μη αιτιοκρατικό: η τρέχουσα κατάσταση και το σύμβολο εισόδου δεν προσδιορίζουν μονοσήμαντα την επόμενη κατάσταση Οι γραμματικές τύπου 0 αντιστοιχούν σε μηχανές Turing Ακαδημαϊκό Έτος 2013-2014

Τι γραμματικές χρειαζόμαστε; Σχεδόν όλα τα συντακτικά φαινόμενα των φυσικών γλωσσών μπορούν να παρασταθούν με κανονικές γραμματικές Άρα μπορούμε να κάνουμε συντακτική ανάλυση με αυτόματα πεπερασμένων καταστάσεων Πολύ αποδοτικοί αλγόριθμοι Συχνά, όμως, χρησιμοποιούμε ΓΧΣ επειδή είναι πιο σύντομες Και επειδή τα συντακτικά δέντρα που παράγουν είναι πιο χρήσιμα στη σημασιολογική ανάλυση Υπάρχουν φαινόμενα για τα οποία φαίνεται να απαιτούνται ΓΧΣ [Jurafsky & Martin 2009] (αγγλικά): The cat likes tuna fish. The cat (that) the dog chased likes tuna fish. Υπάρχουν φαινόμενα σε μερικές γλώσσες που φαίνεται να απαιτούν γραμματικές με συμφραζόμενα (γερμανικά) Ακαδημαϊκό Έτος 2013-2014

Αλγόριθμοι συντακτικής ανάλυσης Είσοδος: Μια γραμματική του τύπου που υποστηρίζει ο αλγόριθμος (π.χ. γραμματική χωρίς συμφραζόμενα) Μια ακολουθία 𝜎 από τερματικά σύμβολα της γραμματικής Αποκρίσεις: Ανήκει η 𝜎 στη γλώσσα που ορίζει η γραμματική; Ποιο είναι το συντακτικό δέντρο της 𝜎; Το συντακτικό δέντρο αποτελεί μια απόδειξη ότι η 𝜎 είναι σύμφωνη με τη γραμματική Παρέχει πληροφορίες για τη συντακτική δομή της 𝜎 Ακαδημαϊκό Έτος 2013-2014

ΓΧΣ για τμήμα της αγγλικής Ακαδημαϊκό Έτος 2013-2014

ΣΑ σαν πρόβλημα αναζήτησης Αναζήτηση σε αυτόματα πεπερασμένων κατ. (FSA) Εύρεση της σωστής διαδρομής εντός του αυτόματου Ο χώρος αναζήτησης ορίζεται από την δομή του αυτόματου Αναζήτηση σε ΓΧΣ Εύρεση του σωστού συντακτικού δέντρου ανάμεσα στα δυνατά συντακτικά δέντρα Ο χώρος αναζήτησης ορίζεται από την γραμματική Περιορισμοί (constraints) που προέρχονται: Από την πρόταση εισόδου Αυτόματο/γραμματική Ακαδημαϊκό Έτος 2013-2014

Στρατηγικές αναζήτησης Δύο στρατηγικές αναζήτησης Top-Down Αναζήτηση για δέντρο ξεκινώντας από το “S” (αρχικό σύμβολο), μέχρι να καλυφθούν όλες οι λέξεις της εισόδου Bottom-Up Αναζήτηση για δέντρο ξεκινώντας από τις λέξεις, και προσπαθώντας να καλυφθεί το σύμβολο “S” Οι κανόνες εφαρμόζονται αντίστροφα (ταίριασμα δεξιού μέρους) Ακαδημαϊκό Έτος 2013-2014

Αναλυτής Top-Down Δημιουργεί δέντρα από το αρχικό σύμβολο “S”, προχωρώντας προς τα φύλλα Υποθέτοντας την κατασκευή όλως των δέντρων παράλληλα: Εύρεση όλων των δέντρων με ρίζα το “S” Ανάπτυξη όλων των συστατικών (κόμβων) αυτών των δέντρων, μέχρι τα φύλλα Απόρριψη δέντρων που τα φύλλα τους δεν ταιριάζουν με την είσοδο Ακαδημαϊκό Έτος 2013-2014

Χώρος αναζήτησης Ακαδημαϊκό Έτος 2013-2014

Αναλυτής Bottom-Up Ξεκινά από τις λέξεις Κατασκευάζει δέντρα εφαρμόζοντας του κανόνες που το δεξί τους μέρος ταιριάζει Οδηγούνται από την είσοδο Και όχι από την γραμματική, όπως οι αναλυτές Top-Down Ακαδημαϊκό Έτος 2013-2014

Χώρος αναζήτησης Ακαδημαϊκό Έτος 2013-2014

Σύγκριση στρατηγικών αναζήτησης (1) Αναλυτές Top-Down: Δεν λαμβάνουν υπ’ όψιν άκυρες αναλύσεις (π.χ. δέντρα που δεν περιέχουν το “S”) Χάνουν χρόνο σε δέντρα που δεν ταιριάζουν με την είσοδο Αναλυτές Bottom-Up: Δεν λαμβάνουν υπ’ όψιν αναλύσεις που δεν ταιριάζουν με την είσοδο Χάνουν χρόνο παράγοντας άκυρες αναλύσεις Ακαδημαϊκό Έτος 2013-2014

Σύγκριση στρατηγικών αναζήτησης (2) Κοινό πρόβλημα: Πώς πρέπει να γίνει η αναζήτηση στον χώρο των δέντρων; Θα δημιουργηθούν όλα τα εναλλακτικά δέντρα παράλληλα; Ποιος κόμβος πρέπει να αναλυθεί στο επόμενο στάδιο; Ποιος κανόνας πρέπει να εφαρμοστεί στο επόμενο στάδιο; Ακαδημαϊκό Έτος 2013-2014

Στρατηγική και έλεγχος αναζήτησης (1) Παραλληλία Εξερεύνηση όλων των δέντρων παράλληλα Αναζήτηση σε βάθος (depth first search) Ατζέντα από καταστάσεις: βαθμιαία διαστολή του χώρου αναζήτησης, χρησιμοποιώντας την κατάσταση (δέντρο) που παράχθηκε τελευταία Αν η τρέχουσα κατάσταση είναι ασύμβατη με την είσοδο, οπισθοχώρηση (backtrack) στην πιο πρόσφατη ανεξερεύνητη κατάσταση Ακαδημαϊκό Έτος 2013-2014

Στρατηγική και έλεγχος αναζήτησης (2) Ποιος κόμβος πρέπει να αναλυθεί στο επόμενο στάδιο; Αυτός που βρίσκεται «αριστερά» Ποιος κανόνας πρέπει να εφαρμοστεί στο επόμενο στάδιο; Ανάλογα με την θέση (σειρά) του στην γραμματική Ακαδημαϊκό Έτος 2013-2014

Βασικός αλγόριθμος Top-Down, Depth-First, Left-Right Αρχικοποίηση ατζέντας με την κατάσταση: δέντρο “S”, δείκτης στην 1η λέξη (cur) Επανέλαβε μέχρι: άδεια ατζέντα ή επιτυχής ανάλυση Εφαρμογή όλων των εφαρμόσιμων κανόνων στο αριστερό, μη ανεπτυγμένο κόμβο του cur Αν ο κόμβος είναι τερματικό σύμβολο και ταιριάζει με την είσοδο, «πίεσε» (push) το στην ατζέντα Αλλιώς, «πίεσε» τα νέα δέντρα στην ατζέντα Pop νέο cur από την ατζέντα Ακαδημαϊκό Έτος 2013-2014

Αριστερή αναδρομή Η αναζήτηση σε βάθος (depth-first) δεν θα τερματίσει ποτέ, αν η γραμματική περιέχει αριστερή αναδρομή: Α → ΑΒβ 𝑁𝑃 → 𝑁𝑃 𝑃𝑃, 𝑉𝑃 → 𝑉𝑃 𝑃𝑃, 𝑆 → 𝑆 & 𝑆 →∈ Διαρκείς επαναλήψεις χωρίς κατανάλωση λέξεων εισόδου Με ένα δέντρο που μεγαλώνει διαρκώς Λύσεις Τοποθέτηση (εμπειρικού) ορίου στο βάθος της αναδρομής κατά την ανάλυση Αποφυγή αναζήτησης Top-Down Αλλαγή κανόνων γραμματικής, απαλοιφή αναδρομικών κανόνων Ακαδημαϊκό Έτος 2013-2014

Αμφισημία (1) Συντακτικά διφορούμενες προτάσεις «Είδαμε τον επιστήμονα με το τηλεσκόπιο.» Είδαμε [NP τον [Nominal επιστήμονα [PP με το τηλεσκόπιο]]] Όπως «την πτήση από τη Θεσσαλονίκη» Είδαμε [NP τον επιστήμονα] [PP με το τηλεσκόπιο]. Θα είχαμε και κανόνα: VP => V NP PP. «Είδαμε τον επιστήμονα με το τηλεσκόπιο από το Παρίσι.» Είδαμε [τον επιστήμονα] [με το τηλεσκόπιο] [από το Παρίσι] Είδαμε [τον επιστήμονα με το τηλεσκόπιο] [από το Παρίσι] Είδαμε [τον επιστήμονα] [με το [τηλεσκόπιο από το Παρίσι]] Είδαμε [τον [επιστήμονα με το [τηλεσκόπιο από το Παρίσι]]] Ακαδημαϊκό Έτος 2013-2014

Αμφισημία (2) «Είδαμε τον επιστήμονα με την άσπρη μπλούζα.» Χρειαζόμαστε σημασιολογικούς περιορισμούς που να αποκλείουν την περίπτωση η μπλούζα να είναι το μέσο της παρατήρησης Από καθαρά συντακτική σκοπιά, οι περισσότερες προτάσεις είναι εξαιρετικά διφορούμενες Πολύ μεγάλος αριθμός συντακτικών δένδρων (συχνά εκθετική αύξηση όσο αυξάνει ο αριθμός των φράσεων που συνδυάζονται) Χρονοβόρο να ανακαλύψουμε και να επιστρέψουμε όλα τα συντακτικά δέντρα ξεχωριστά Πρόβλημα για όλους τους απλούς αλγορίθμους συντακτικής ανάλυσης που έχουμε εξετάσει ως τώρα Ακαδημαϊκό Έτος 2013-2014

Λειτουργία Parser Ακαδημαϊκό Έτος 2013-2014

Αλγόριθμοι καιι μοντέλα Top-down parsers Recursive descent parser LL parser (Left-to-right, Leftmost derivation) Earley parser Bottom-up parsers Precedence parser Operator-precedence parser Simple precedence parser BC (bounded context) parsing LR parser (Left-to-right, Rightmost derivation) Simple LR (SLR) parser LALR parser Canonical LR (LR(1)) parser GLR parser CYK parser Recursive ascent parser Ακαδημαϊκό Έτος 2013-2014