ΥΛΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΗΝ ON-LINE ΑΝΑΓΝΩΡΗΣΗ ΨΗΦΙΟΠΟΙΗΜΕΝΩΝ ΓΡΑΜΜΑΤΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Γεώργιος Τζούμας (ΑΕΜ:45) Επιβλέπων: Καθηγητής Χαράλαμπος Στρουθόπουλος ΣΕΡΡΕΣ, ΔΕΚΕΜΒΡΙΟΣ 2017
Οπτική Αναγνώριση Χαρακτήρων (ΟΑΧ) Optical Character Recognition (OCR) Οπτική Αναγνώριση Χαρακτήρων είναι μια τεχνολογία που έχει αναπτυχθεί τα τελευταία χρόνια και επιτρέπει την ανάγνωση τυπωμένου ή χειρόγραφου κειμένου απ’ τον υπολογιστή και την κατευθείαν μεταφορά του σ’ έναν επεξεργαστή κειμένου Με με βάση τον τρόπο εφαρμογής χωρίζεται σε On line: όταν ο κάθε χαρακτήρας αναγνωρίζεται μόλις ολοκληρωθεί η γραφή του σε κάποια επιφάνεια ψηφιακής γραφής, Off line: όταν αναγνωρίζονται οι χαρακτήρες στο ψηφιοποιημένο έγγραφο.
Οπτική Αναγνώριση Χαρακτήρων (ΟΑΧ) Optical Character Recognition (OCR) Εμπλεκόμενα επιστημονικά πεδία: Ψηφιακή επεξεργασία εικόνας: ασχολείται με την ψηφιακή καταγραφή εικόνων και με την επεξεργασία τους με ηλεκτρονικό υπολογιστή Αναγνώριση προτύπων: είναι ο επιστημονικός κλάδος που ασχολείται με την εύρεση μεθόδων για την ταξινόμηση των όντων (προτύπων) σε κατηγορίες. Τις κατηγορίες αυτές θα τις ονομάζουμε κλάσεις.
Ψηφιακή Επεξεργασία Εικόνας Προ-επεξεργασία εγγράφων: Διόρθωση κλίσης των εγγράφων Εντοπισμός των περιοχών κειμένου Αποθορυβοποίηση Εξαγωγή χαρακτηριστικών Ειδικότερα τα τελευταία δύο αφορούν την on-line οπτική αναγνώριση
Αναγνώριση προτύπων Ένα σύστημα που αναγνωρίζει πρότυπα λέγεται ταξινομητής και επιτελούνται δύο κύριες εργασίες: εκπαίδευση ταξινόμηση Στη παρούσα εργασία για την εκπαίδευση χρησιμοποιήθηκε η εκπαίδευση με επόπτη κατά την οποία είναι γνωστή η κλάση στην οποία ανήκει κάθε πρότυπο του συνόλου εκπαίδευσης και επιδιώκεται η ορθή απόδοση των προτύπων που δεν ανήκουν στο σύνολο εκπαίδευσης, σε μία από τις προκαθορισμένες κλάσεις.
Η προσέγγισή μας On-line διαδικασία: αναγνωρίζεται ο χαρακτήρας μόλις γραφτεί ψηφιακά Εξαγωγή χαρακτηριστικών Ανεξαρτησία κλίμακας Ανεξαρτησία μετατόπισης Ανεξαρτησία στροφής Χρησιμοποιήθηκε ο Perceptron Back Error Propagation ταξινομητής
Ανεξαρτησία Στροφής Στις πλείστες των περιπτώσεων αναγνώρισης προτύπων εικόνων είναι επιθυμητή η εξαγωγή χαρακτηριστικών ανεξάρτητων από την κλίμακα, την μετατόπιση και την περιστροφή. Για ανεξαρτησία από την περιστροφή η εικόνα ενός χαρακτήρα περιστρέφεται κατά την γωνία Θο που σχηματίζει ο κύριος άξονας της μορφής με την κάθετο. Κύριος άξονας είναι εκείνος ο άξονας που περιγράφεται από το ιδιοδιάνυσμα της μεγαλύτερης ιδιοτιμής του πίνακα συνδιασποράς των συντεταγμένων του απεικονιζόμενου αντικειμένου
Απομόνωση του χαρακτήρα Ανεξαρτησία μετατόπισης
Ανεξαρτησία κλίμακας Η εικόνα που προκύπτει χωρίζεται σε 11×8 περιοχές. Για κάθε περιοχή υπολογίζεται το πλήθος των object pixels και δημιουργείται ένας πίνακας 11x8 τιμών. Για να είναι οι τιμές αυτές ανεξάρτητες από το μέγεθος της εικόνας του χαρακτήρα κανονικοποιούνται στο διάστημα [0,1]. Οι τιμές του πίνακα προσπελαύνοται σε σειρά από πάνω προς τα κάτω και από αριστερά προς τα δεξιά και αποτελούν το άνυσμα των χαρακτηριστικών (feature vector) του χαρακτήρα.
Εφαρμογή του Back Propagation νευρωνικό δίκτυο ένα εισόδου. ένα κρυφό. και ένα εξόδου. Για το άνυσμα εισόδου των 88 τιμών, το επίπεδο εισόδου έχει 88 νευρώνες, το κρυφό επίπεδο έχει 10 και το επίπεδο εξόδου έχει 1 νευρώνα. Για την εκπαίδευση του νευρωνικού δικτύου χρησιμοποιήθηκαν ενδεικτικά 500 πρότυπα χειρόγραφων χαρακτήρων (training set). Κατόπιν ορίζονται οι εποχές εκμάθησης στις ‘5000’ καθώς και ο τελικός στόχος λάθους της εκπαίδευσης στο ‘1e-30’, δεδομένα με τα οποία το δίκτυο εν τέλη εκπαιδεύεται. Η επιτυχία εκπαίδευσης στο training set ήταν 100%.