ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 – 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 – 2013 Μάθημα 3 ο : Μορφολογία.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Γραφήματα & Επίπεδα Γραφήματα
Advertisements

Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙΙ.
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Μάθημα 3ο: Βασικές Γλωσσολογικές Έννοιες Ι: Μορφολογία
Πανεπιστήμιο Δυτικής Μακεδονίας Πανεπιστήμιο Δυτικής Μακεδονίας Παιδαγωγικό Τμήμα Νηπιαγωγών Τίτλος Μαθήματος Ενότητα # (bold): Τίτλος Ενότητας (normal)
ΜοντελοποίησηΈργα ΜαθήματαΑξιολόγηση Αναστοχασμος Μαθήματα.
Διαχείριση Έργου Οργάνωση, σχεδιασμός και προγραμματισμός έργων ανάπτυξης λογισμικού.
Το υλικό του Υπολογιστή
Τα στοιχειώδη περί γεωδαιτικών υπολογισμών
Χρήση και αξιοποίηση των ΤΠΕ κατά τη διδασκαλία των μαθηματικών στη δευτεροβάθμια ελληνική εκπαίδευση Δρ. Σάλτας Βασίλειος, Ιωαννίδου Ευφροσύνη Τμήμα.
6ο Γενικό Λύκειο Καλαμάτας Α΄ τάξη - ερευνητική εργασία Σχ
ΣΤΟΙΧΕΙΑ ΨΕΥΔΟΚΩΔΙΚΑ ΒΑΣΙΚΕΣ ΔΟΜΕΣ ΒΑΣΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΩΝ
Κεφάλαιο 6 Υλοποίηση Γλωσσών Προγραμματισμού
Πρόγραμμα Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ. Ε
Εκτέλεση Αλγορίθμων σε ψευδογλώσσα
Οι διαφάνειες αυτού του μαθήματος βασίζονται
Προγραμματισμός PASCAL Πληροφορική Γ' Λυκείου μέρος γ
Page  1 Ο.Παλιάτσου Γαλλική Επανάσταση 1 ο Γυμνάσιο Φιλιππιάδας.
ΝΕΟ ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ Α’, Β’, & Γ’ ΓΥΜΝΑΣΙΟΥ ΟΜΑΔΑ ΕΡΓΑΣΙΑΣ Ανδρέας Σ. Ανδρέου (Αναπλ. Καθηγητής ΤΕΠΑΚ - Συντονιστής) Μάριος Μιλτιάδου, Μιχάλης Τορτούρης.
Ανάλυση του λευκού φωτός και χρώματα
© GfK 2012 | Title of presentation | DD. Month
-17 Προσδοκίες οικονομικής ανάπτυξης στην Ευρώπη Σεπτέμβριος 2013 Δείκτης > +20 Δείκτης 0 a +20 Δείκτης 0 a -20 Δείκτης < -20 Σύνολο στην Ευρωπαϊκή Ένωση:
+21 Προσδοκίες οικονομικής ανάπτυξης στην Ευρώπη Δεκέμβριος 2013 Δείκτης > +20 Δείκτης 0 να +20 Δείκτης 0 να -20 Δείκτης < -20 Σύνολο στην Ευρωπαϊκή Ένωση:
Αναγνώριση Προτύπων.
Αβιοτικό περιβάλλον οργανισμοί.
Κεφάλαιο 2ο Πεπερασμένα αυτόματα.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Συναρτησιακές Εξαρτήσεις.
ΙΣΟΛΟΓΙΣΜΟΣ ΒΑΣΕΙ Δ.Λ.Π. (ΕΝΑΡΞΗΣ)
1 Θεματική Ενότητα Γραφήματα & Επίπεδα Γραφήματα.
ΑΠΕΙΚΟΝΙΣΗ ΕΝΝΟΙΩΝ 1. 2 Χρήστης Στόχος Ταμίας διενέργεια πώλησης διενέργεια ενοικίασης εισαγωγή ταμείου εξαγωγή ταμείου * 1 Μοντέλο Πεδίου Προβλήματος.
Η αλληλουχία των ενεργειών δεν είναι πάντα μία και μοναδική!!!
Αποκεντρωμένη Διοίκηση Μακεδονίας Θράκης ∆ιαχείριση έργων επίβλεψης µε σύγχρονα µέσα και επικοινωνία C2G, B2G, G2G Γενική Δ/νση Εσωτερικής Λειτουργίας.
Η επιρροή του χώρου εργασίας των σχολικών τάξεων στη μάθηση
ΕΠΛ223 Θεωρία και Πρακτική Μεταγλωττιστών Εαρινό Εξάμηνο 2002 Κ. Μουρλάς, Λέκτορας Σημείωση: Οι διαφάνειες αυτές βασίζονται κατά το μεγαλύτερο μέρος τους.
Βάσεις Δεδομένων II Διαχείριση Δοσοληψιών Πάνος Βασιλειάδης Σεπτέμβρης 2002
HY 120 ΨΗΦΙΑΚΗ ΣΧΕΔΙΑΣΗ Ασυγχρονα ακολουθιακα κυκλωματα.
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας: Διοίκηση & Οργάνωση Βιβλιοθηκών.
1 Τοπικές βλάβες από δήγματα όφεων Κουτσουμπού Γεωργία Ειδικευόμενη Γενικής Ιατρικής ΓΚΑ Αθήνα, 18 η Ιουλίου 2002.
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Ολυμπιάδα Πληροφορικής
Ηλεκτρονική Ενότητα 5: DC λειτουργία – Πόλωση του διπολικού τρανζίστορ
Διαδικτυακή εφαρμογή ανάλυσης και επεξεργασίας δεδομένων κυβερνητικών διαβουλεύσεωνgov.insight Η. Ζαβιτσάνος, Γ. Γιαννακόπουλος, Γ. Παλιούρας Ινστιτούτο.
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Τρίτο Συστήματα.
Ενιαίο Πλαίσιο Προγράμματος Σπουδών Πληροφορικής.
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
Ο ΗΛΕΚΤΡΟΝΙΚΟΣ ΥΠΟΛΟΓΙΣΤΗΣ
Dr. Holbert Νικ. Α. Τσολίγκας Χρήστος Μανασής
Τεχνολογία ΛογισμικούSlide 1 Αλγεβρική Εξειδίκευση u Καθορισμός τύπων αφαίρεσης σε όρους σχέσεων μεταξύ τύπων λειτουργιών.
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
Συνδυαστικά Κυκλώματα
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
ANAKOINWSH H 2η Ενδιάμεση Εξέταση μεταφέρεται στις αντί για , την 24 Νοεμβρίου στις αίθουσες ΧΩΔ και 110 λόγω μη-διαθεσιμότητας.
Ανάπτυξη Πρωτοτύπου Λογισμικού
Ενότητα Α.4. Δομημένος Προγραμματισμός
Προχωρημένα Θέματα Τεχνολογίας και Εφαρμογών Βάσεων Δεδομένων Διαχείριση Συναλλαγών Πάνος Βασιλειάδης Μάρτιος 2014
Θεωρία Υπολογισμού Εισαγωγή (μέρος 3 ο ). Χρειαζόμαστε Μοντέλα Εμπρός πατάκι Πίσω πατάκι Πόρτα ΚλειστόΑνοιχτό.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 – 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 – 2013 Μάθημα 1 ο : Εισαγωγή.
ΜΑΘΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗ ΜΕΤΑΓΓΙΣΗ ΑΙΜΑΤΟΣ - ΑΙΜΟΔΟΣΙΑ
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
Βάσεις Δεδομένων Εργαστήριο ΙΙ Τμήμα Πληροφορικής ΑΠΘ
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών – Τμήμα Πληροφορικής και Τηλεπικοινωνιών 1 Κεφάλαιο 3 Η Σημασιολογία των Γλωσσών Προγραμματισμού Προπτυχιακό.
Computers: Information Technology in Perspective By Long and Long Copyright 2002 Prentice Hall, Inc. Προγραμματισμός Η / Υ 6 η Διάλεξη.
Δομές Δεδομένων - Ισοζυγισμένα Δυαδικά Δένδρα (balanced binary trees)
Θεωρία Υπολογισμού Πεπερασμένα Αυτόματα. Υπολογισμοί Γλώσσα που αποδέχεται ένας υπολογιστής: Το σύνολο των λέξεων τα οποία οδηγούν σε κατάσταση αποδοχής.
+19 Δεκέμβριος 2014 Δείκτης > +20 Δείκτης 0 έως +20 Δείκτης 0 έως -20 Δείκτης < -20 Συνολικά της ΕΕ: +5 Δείκτης > +20 Δείκτης 0 έως +20 Δείκτης 0 έως -20.
ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ 2: ΘΕΜΑΤΑ ΘΕΩΡΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Η/Υ
Αγγελική Γεωργιάδου- Αναστασία Πεκτέσογλου Δράμα 2006
Μοντελοποίηση υπολογισμού
Μεταγράφημα παρουσίασης:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 – 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 – 2013 Μάθημα 3 ο : Μορφολογία

<> Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία1 Οι διαφάνειες αυτού του μαθήματος βασίζονται στα κεφάλαια 2 και 3 του βιβλίου: «Speech and Language Processing» των D. Jurafsky και J.H. Martin, 2η έκδοση, Pearson, 2009 Το βιβλίο δεν απαιτείται για το μάθημα αυτό.

<> Αυτόματα πεπερασμένων καταστάσεων Finite State Automata (FSA) – Αναπαριστάνεται σαν γράφος ενός συνόλου καταστάσεων κατευθυνόμενων μεταβάσεων – που αντιστοιχούν σε σύμβολα ενός αλφαβήτου – Μια κατάσταση ορίζεται σαν αρχική – Μερικές καταστάσεις ορίζονται σαν τελικές Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία2 baa+!

<> Αναγνώριση με FSA (1) Είσοδος: μια «ταινία» με «κελιά». Κάθε κελί περιέχει ένα σύμβολο από την είσοδο Η μηχανή ξεκινά από την αρχική κατάσταση: Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία3

<> Αναγνώριση με FSA (2) Σε κάθε κατάσταση, ελέγχεται ο επόμενος χαρακτήρας εισόδου – Αν υπάρχει μετάβαση για αυτόν τον χαρακτήρα, γίνεται η μετάβαση και η είσοδος μετακινείται 1 κελί – Αν δεν υπάρχει μετάβαση, η είσοδος δεν είναι αποδεκτή Αν τελειώσουν τα κελιά εισόδου: – Αν η τρέχουσα κατάσταση είναι τελική, η είσοδος είναι αποδεκτή Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία4

<> Μορφολογία (1) Εφαρμόζεται σε επίπεδο λέξης Εξετάζει τη μορφή των λέξεων Επηρεάζει/εται (από) τη φωνολογία Είναι το επίπεδο ανάλυσης που συσχετίζει: – Αλεπού, αλεπούδες, αλεπουδάκι – Είμαι, ήμουν – Έρχομαι, ήρθα – … Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία5

<> Μορφολογία (2) Δύο ειδών κανόνες: – Ορθογραφικοί κανόνες Ο πληθυντικός αγγλικών λέξεων σε –y σχηματίζεται με την μετατροπή του –y σε –i, και την προσθήκη –es – Μορφολογικοί κανόνες Μας λένε ότι οι λέξεις fish, deer, beer δεν έχουν πληθυντικό Ο πληθυντικός την λέξης goose γίνεται με αλλαγή του φωνήεντος (geese) Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία6

<> Μορφολογική ανάλυση Το πρόβλημα της: – αναγνώρισης ότι μια λέξη (όπως αλεπούδες) αποσυντίθεται σε μορφήματα (αλεπ + ούδες), και – η δημιουργία μιας δομημένης αναπαράστασης για αυτό το γεγονός, ονομάζεται μορφολογική ανάλυση (morphological parsing) Parsing: η διαδικασία της παραγωγής κάποιας μορφής γλωσσικής πληροφορίας για κάποια είσοδο Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία7

<> Υπολογιστική μορφολογία Η αυτόματη (μέσω μηχανής) αντιστοίχηση μιας λέξης με τις μορφολογικές πληροφορίες που την χαρακτηρίζουν – Μορφολογική ανάλυση (parsing) Αλεπούδες: αλεπού + ονομαστική + πληθυντικός – Μορφολογική παραγωγή (generation) Αλεπού + ονομαστική + πληθυντικός: αλεπούδες Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία8

<> Αλγόριθμοι και εργασίες Μορφολογική ανάλυση – Finite state transducers – Μορφολογικά λεξικά (ηλεκτρονικά) Μορφολογική παραγωγή – Μορφολογικά λεξικά (ηλεκτρονικά) – Συστήματα κανόνων Συχνές εργασίες – Εύρεση θέματος (stemming) – Λημματοποίηση: εύρεση λήμματος (lemmatization) – Αναγνώριση μερών του λόγου (POS tagging) – Αναγνώριση λέξεων/προτάσεων Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία9

<> Μορφολογική ανάλυση ΕίσοδοςΈξοδος αλεπούδεςαλεπού +N +Pl άνθρωποιάνθρωπος +N +Pl catscat +N +Plγάτες geesegoose +N +Plχήνες goosesgoose +V +1P +Sg cantocantar +V +PInd +1P +Sgτραγουδώ cantocanto +N +Masc +Sgτραγούδι Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία Στόχος: – Μορφολογική πληροφορία για την είσοδο 10

<> Μορφολογικός αναλυτής Για την κατασκευή ενός μορφολογικού αναλυτή χρειαζόμαστε: – Λεξικό: λίστα από θέματα και προσφύματα, μαζί με βασική πληροφορία για αυτά (π.χ. μέρος του λόγου) – Μορφοτακτικοί κανόνες (morphotactics) : το μοντέλο της οργάνωσης των μορφημάτων ποιοι τύποι μορφημάτων μπορούν να ακολουθούν άλλα μορφήματα μέσα σε μια λέξη – Ορθογραφικοί κανόνες: περιγράφουν τις αλλαγές που συμβαίνουν όταν συνδυάζονται μορφήματα city + s  cities (και όχι citys) Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία11

<> Προσεγγίσεις Προσεγγίσεις για την κατασκευή μορφολογικών αναλυτών: – Αποκλειστική χρήση λεξικού – Χρήση λεξικού και κανόνων Finite state transducers Finite state automata – Αποκλειστική χρήση κανόνων Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία12

<> Χρήση λεξικού Το λεξικό απαριθμεί όλες τις λέξεις και τις πληροφορίες που την χαρακτηρίζουν Δεν υπάρχουν κανόνες …? Εύκολη ανάλυση/παραγωγή Μεγάλο μέγεθος (αγγλικά) – Ελληνικά, Γαλλικά; – Αραβικά, Τούρκικα; – Κινέζικα; Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία13 acclaim acclaim $N$ acclaim acclaim $V+0$ acclaimed acclaim $V+ed$ acclaimed acclaim $V+en$ acclaiming acclaim $V+ing$ acclaims acclaim $N+s$ acclaims acclaim $V+s$ acclamation acclamation $N$ acclamations acclamation $N+s$ acclimate acclimate $V+0$ acclimated acclimate $V+ed$ acclimated acclimate $V+en$ acclimates acclimate $V+s$ acclimating acclimate $V+ing$

<> Προσεγγίσεις Προσεγγίσεις για την κατασκευή μορφολογικών αναλυτών: – Αποκλειστική χρήση λεξικού – Χρήση λεξικού και κανόνων Finite state transducers Finite state automata – Αποκλειστική χρήση κανόνων Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία14

<> Λεξικό + κανόνες (1) Λεξικό: Κανόνες: Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία15 reg-nounirreg-pl-nounirreg-sg-nounplural foxgeesegoose-s catsheep dogmicemouse

<> Λεξικό + κανόνες (2) reg-verb-stemirreg-verb-stemirreg-past-verbpastpast-partpres-part3sg walk fry talk impeach cut speak spoken sing sang caught ate eaten -ed -ing-s Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία16

<> Μορφολογικός αναγνωριστής Μια συμβολοσειρά από χαρακτήρες, είναι έγκυρη λέξη; Ενσωμάτωση των «υπο-λεξικών» στο FSA των κανόνων: Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία17

<> Μορφολογική ανάλυση Αυτόματα πεπερασμένων καταστάσεων (FSA) – Αναγνώριση – Μορφολογία ενός επιπέδου Finite state transducers (FST) – Μορφολογία δύο επιπέδων – Παράγουν έξοδο, ανάλογα με την είσοδο Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία18

<> Μορφολογία δύο επιπέδων Επιφανειακή (surface) μορφή: λέξη όπως απαντάται στο κείμενο Λεξιλογική (lexical) μορφή: η ακολουθία των μορφολογικών χαρακτηριστικών Μορφολογία δύο επιπέδων: αντιστοίχιση μεταξύ επιφανειακού/λεξιλογικού επιπέδου Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία19 Λεξιλογικό επίπεδο Επιφανειακό επίπεδο

<> FST: λεξικό και κανόνες Όπως και στην περίπτωση των FSA, τόσο το λεξικό όσο και οι μορφοτακτικοί κανόνες μπορούν να αναπαρασταθούν από FSTs Και φυσικά να συνδυαστούν (σειριακά) σε ένα FST: Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία20

<> Ορθογραφικοί κανόνες (1) Οι μέθοδοι που περιγράφηκαν αναγνωρίζουν λέξεις όπως «fox» και «goose» Όμως η απλή συνένωση μορφημάτων δεν λειτουργεί όταν απαιτούνται ορθογραφικές προσθήκες – foxs: αποδεκτό, foxes: απορριπτέο Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία21

<> Μπορούν να ειδωθούν σαν μετασχηματισμός: – Δέχεται μια συνένωση μορφημάτων (ενδιάμεσο επίπεδο) – Παράγει την επιφανειακή μορφή της λέξης Ορθογραφικοί κανόνες (2) NameRule DescriptionExample Consonant Doubling1-letter consonant doubled before -ing/-edbeg/begging E-deletionSilent e dropped before -ing and -edmake/making E-insertione added after s,z,x,ch,sh before swatch/watches Y-replacement-y changes to -ie before -s, -i before -edtry/tries K-insertionverbs ending with vowel + -c add -kpanic/panicked Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία22

<> Ορθογραφικοί κανόνες (3) Μπορούν να ειδωθούν σαν μετασχηματισμός: – Δέχεται μια συνένωση μορφημάτων (ενδιάμεσο επίπεδο) – Παράγει την επιφανειακή μορφή της λέξης Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία23 Λεξιλογικό επίπεδο Ενδιάμεσο επίπεδο Επιφανειακό επίπεδο

<> Ορθογραφικοί κανόνες (4) «Εισαγωγή ενός e στην ταινία επιφανειακού επιπέδου, όταν η ταινία του λεξιλογικού επιπέδου έχει ένα μόρφημα που τελειώνει σε x (ή z) και το επόμενο μόρφημα είναι το -s» Chomsky and Halle (1968) notation: Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία24

<> Ορθογραφικοί κανόνες (5) Αναπαράσταση του ορθογραφικού κανόνα σαν FST: Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία25

<> Ορθογραφικοί κανόνες (6) Πίνακας μεταβάσεων: Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία26

<> Συνδυάζοντας λεξικό και κανόνες (1) Το FST λεξικού αντιστοιχίζει το λεξιλογικό επίπεδο στο ενδιάμεσο επίπεδο, που αναπαριστά απλές συνενώσεις μορφημάτων Ένα σύνολο από FST κανόνων τρέχουν παράλληλα/σειριακά αντιστοιχίζοντας το ενδιάμεσο στο επιφανειακό επίπεδο Ο FST λεξικού και οι FST των ορθογραφικών κανόνων σχηματίζουν μια αλληλουχία (cascade) Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία27

<> Συνδυάζοντας λεξικό και κανόνες (2) Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία28

<> Συνδυάζοντας λεξικό και κανόνες (3) Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία29

<> FSTs και ασάφεια Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία30

<> Αναγνώριση θέματος Stemming: η εύρεση της ρίζας/θέματος μιας λέξης Συνήθως δεν χρησιμοποιείται λεξικό Χρησιμοποιείται σε εφαρμογές ανάκτησης πληροφορίας και ταξινόμησης κειμένων Η βελτίωση που επιφέρει στην ανάκτηση πληροφορίας δεν είναι πάντα αξιόλογη Χρησιμοποιείται στην μείωση διαστατικότητας, όταν εφαρμόζεται μηχανική μάθηση Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία31

<> Porter stemmer (1980) Γλωσσική Τεχνολογία, Μάθημα 3 ο, Μορφολογία32