Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Σύστημα Αυτόματης Επεξεργασίας Εγράφου και Αναγνώρισης Χειρόγραφων Χαρακτήρων, Ανεξάρτητο Συγγραφέα.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Σύστημα Αυτόματης Επεξεργασίας Εγράφου και Αναγνώρισης Χειρόγραφων Χαρακτήρων, Ανεξάρτητο Συγγραφέα."— Μεταγράφημα παρουσίασης:

1 Σύστημα Αυτόματης Επεξεργασίας Εγράφου και Αναγνώρισης Χειρόγραφων Χαρακτήρων, Ανεξάρτητο Συγγραφέα

2 Δομή Παρουσίασης  Το πρόβλημα Οπτικής Αναγνώρισης Χαρακτήρων (OCR)  Στόχοι  Παρουσίαση Συστήματος – Ανάλυση Modules  Πειραματικά Δεδομένα  Πειραματικά Αποτελέσματα  Συμπεράσματα - Προοπτικές

3 Η μετατροπή εικόνων κειμένων ή λέξεων, τυπωμένων ή χειρόγραφων (ICR), σε ηλεκτρονικό κείμενο.  Οπτική Αναγνώριση Χαρακτήρων (OCR) Ορισμός

4 Ιστορική Αναδρομή  19ος αιώνας: πατέντες αναγνώρισης χαρακτήρων για τηλέγραφο.  1916: εμπορικά πακέτα για τηλέγραφο.  1950: εμπορικά πακέτα αναγνώρισης τυπωμένων ψηφίων.  1960: ανάλυση εικόνων εγγράφων (DIA).  Οπτική Αναγνώριση Χαρακτήρων (OCR)

5 Ιστορική Αναδρομή (συν.)  1965: εγκατάσταση αναγνωστών για τυπωμένες ταχ.διευθύνσεις.  1971: πρώτο περιοδικό στο OCR (Pattern Recognition).  1980: Συσκευές ανάγνωσης τυπωμένων και μεμονωμένων χειρόγραφων χαρακτήρων.  Οπτική Αναγνώριση Χαρακτήρων (OCR)

6 Συστημάτα Επεξεργασίας Γραφής Αναγνώρισης Γραφής  Κατανόησης Γραφής  Προσδιορισμού Συγγραφέα  Αναγνώρισης Υπογραφής  Οπτική Αναγνώριση Χαρακτήρων (OCR)

7 Συστήματα Αναγνώρισης Γραφής Ως προς τον τρόπο εισόδου δεδομένων:  On-line Off-line Ως προς το είδος των δεδομένων:  μεμονωμένων χαρακτήρων  συνεχόμενης γραφής γραφής χωρίς περιορισμούς  Οπτική Αναγνώριση Χαρακτήρων (OCR)

8  Στόχοι Δημιουργία οff-line συστήματος οπτικής αναγνώρισης γραφής χωρίς περιορισμούς. Ανεξάρτητο συγγραφέα. Με κατάτμηση σε χαρακτήρες. Υψηλής ακρίβειας.

9  Στόχοι Γρήγορης ανταπόκρισης. Εύκολα εκπαιδεύσιμο. Εύκολα προσαρμόσιμο σε συγκεκριμένη γλώσσα. Εύκολα προσαρμόσιμο σε συγκεκριμένο συγγραφέα.

10  Παρουσίαση Συστήματος – Ανάλυση Modules Διόρθωση γωνίας εκτροπής Εντοπισμός χειρόγραφου κειμένου Κατάτμηση σε γραμμές Διόρθωση κλίσης Κατάτμηση σε λέξεις Κατάτμηση σε χαρακτήρες Αναγνώριση χαρακτήρων Εικόνα Εγγράφου Κείμενο Κλάσεις χαρακτήρων Κανόνες Κατάτμησης Επεξεργασία Εγγράφου Διόρθωση Γωνίας Εκτροπής με Εφαρμογή Wigner-Ville Κατανομής. Διάκριση χειρόγραφου και τυπωμένου κειμένου Διόρθωση Κλίσης Χαρακτήρων με Εφαρμογή Wigner-Ville Κατανομής. Κατάτμηση σε Χαρακτήρες με Αυτόματη Εξαγωγή Κανόνων. Αναγνώριση βασισμένη σε νέα Μορφολογικά Χαρακτηριστικά. Διόρθωση γωνίας εκτροπής

11 Διόρθωση Γωνίας Εκτροπής Εγγράφου Γωνία εκτροπής -42.1°  Παρουσίαση Συστήματος – Ανάλυση Modules

12 Συνήθεις τεχνικές σε χρήση (O’Gorman, 1993): Ιστογράμματα  Πλησιέστεροι Γείτονες  Μετασχηματισμός Hough Διόρθωση Γωνίας Εκτροπής Εγγράφου - Τεχνικές  Παρουσίαση Συστήματος – Ανάλυση Modules

13 Συνήθη μειονεκτήματα που αντιμετωπίζουμε: Μεγάλο υπολογιστικό κόστος Χειρόγραφα έγγραφα Παρουσία πλαισίων, γραφικών, φωτογραφιών κ.α. Μεγάλες γωνίες κλίσης (  89 o ) Διόρθωση Γωνίας Εκτροπής Εγγράφου - Μειονεκτήματα  Παρουσίαση Συστήματος – Ανάλυση Modules

14  Χρήση οριζοντίου ιστογράμματος και κατανομής Wigner-Ville.  Χρήση μέρους της σελίδας για μείωση υπολογιστικού κόστους.  Ανίχνευση σε βήματα για μείωση υπολογιστικού κόστους. Διόρθωση Γωνίας Εκτροπής Εγγράφου  Παρουσίαση Συστήματος – Ανάλυση Modules

15 Εντοπισμός Παραθύρου προς χρήση Εντοπισμός Παραθύρου προς χρήση Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός αντίστοιχων κατανομών WV Υπολογισμός αντίστοιχων κατανομών WV Εντοπισμός Γωνίας Angle που μεγιστοποιεί την ένταση Εντοπισμός Γωνίας Angle που μεγιστοποιεί την ένταση Διόρθωση εγγράφου ως προς Angle Διόρθωση εγγράφου ως προς Angle Έγγραφο Διορθωμένο έγγραφο Step=10 Διόρθωση Γωνίας Εκτροπής Εγγράφου - Διαδικασία  Παρουσίαση Συστήματος – Ανάλυση Modules Εντοπισμός Παραθύρου προς χρήση Εντοπισμός Παραθύρου προς χρήση Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός αντίστοιχων κατανομών WV Υπολογισμός αντίστοιχων κατανομών WV Εντοπισμός Γωνίας Angle που μεγιστοποιεί την ένταση Εντοπισμός Γωνίας Angle που μεγιστοποιεί την ένταση Διόρθωση εγγράφου ως προς Angle Διόρθωση εγγράφου ως προς Angle Step=1 Διορθωμένο έγγραφο Έγγραφο Step=0.1

16 Εντοπισμός Παραθύρου προς χρήση Εντοπισμός Παραθύρου προς χρήση Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός αντίστοιχων κατανομών WV Υπολογισμός αντίστοιχων κατανομών WV Εντοπισμός Γωνίας Angle που μεγιστοποιεί την ένταση Εντοπισμός Γωνίας Angle που μεγιστοποιεί την ένταση Διόρθωση εγγράφου ως προς Angle Διόρθωση εγγράφου ως προς Angle Έγγραφο Διορθωμένο έγγραφο Step=10 Διόρθωση Γωνίας Εκτροπής Εγγράφου - Διαδικασία  Παρουσίαση Συστήματος – Ανάλυση Modules Εντοπισμός Παραθύρου προς χρήση Εντοπισμός Παραθύρου προς χρήση Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός αντίστοιχων κατανομών WV Υπολογισμός αντίστοιχων κατανομών WV Εντοπισμός Γωνίας Angle που μεγιστοποιεί την ένταση Εντοπισμός Γωνίας Angle που μεγιστοποιεί την ένταση Διόρθωση εγγράφου ως προς Angle Διόρθωση εγγράφου ως προς Angle Step=1 Διορθωμένο έγγραφο Έγγραφο Step=0.1

17 Διόρθωση Κλίσης σε Χειρόγραφη Σελίδα  Παρουσίαση Συστήματος – Ανάλυση Modules

18 Διόρθωση Κλίσης σε Χειρόγραφη Σελίδα  Παρουσίαση Συστήματος – Ανάλυση Modules

19 Απόδοση Αλγορίθμου Διόρθωσης Γωνίας Εκτροπής  CPU χρόνος sec σε Pentium III 350Mhz.  Απόδοση ανεξάρτητη ανάλυσης (resolution), παρουσίας πινάκων, γραφικών, είδος και οργάνωσης κειμένου.  Ακρίβεια πάνω από 100% για ανοχή 0.3 ο  Παρουσίαση Συστήματος – Ανάλυση Modules

20 Σύγκριση με άλλες μεθόδους  Παρουσίαση Συστήματος – Ανάλυση Modules

21 Διόρθωση γωνίας εκτροπής Εντοπισμός χειρόγραφου κειμένου Κατάτμηση σε γραμμές Διόρθωση κλίσης Κατάτμηση σε λέξεις Κατάτμηση σε χαρακτήρες Αναγνώριση χαρακτήρων Εικόνα Εγγράφου Κείμενο Κλάσεις χαρακτήρων Κανόνες Κατάτμησης Εντοπισμός χειρόγραφου κειμένου

22 Εντοπισμός Χειρόγραφου Κειμένου  Παρουσίαση Συστήματος – Ανάλυση Modules

23 Κατάτμηση εγγράφου σε περιοχές (CC) Κατάτμηση εγγράφου σε περιοχές (CC) Ξεκαθάρισμα περιοχών (θόρυβος, γραμμές) Ξεκαθάρισμα περιοχών (θόρυβος, γραμμές) Εντοπισμός συστατικών κάθε περιοχής (λέξεις, γράμματα) Εντοπισμός συστατικών κάθε περιοχής (λέξεις, γράμματα) Κατάταξη περιοχών (βάσει συστατικών) σε χειρόγραφες ή μη Κατάταξη περιοχών (βάσει συστατικών) σε χειρόγραφες ή μη Εισαγωγή εγγράφου Χειρόγραφο Εντοπισμός Χειρόγραφου Κειμένου – Διαδικασία  Παρουσίαση Συστήματος – Ανάλυση Modules

24 Απόδοση Αλγορίθμου Εντοπισμού Χειρόγραφου Κειμένου  Ακρίβεια 96% επί των εντοπισμένων περιοχών.  CPU χρόνος 15 sec / παράθυρο 600x600pixels.  Το υπόλοιπο 4% είναι συνήθως μικρές περιοχές με ανεπαρκή πληροφορία.  Παρουσίαση Συστήματος – Ανάλυση Modules

25 Εντοπισμός Χειρόγραφου Κειμένου – Παράδειγμα  Παρουσίαση Συστήματος – Ανάλυση Modules

26 Διόρθωση γωνίας εκτροπής Εντοπισμός χειρόγραφου κειμένου Κατάτμηση σε γραμμές Διόρθωση κλίσης Κατάτμηση σε λέξεις Κατάτμηση σε χαρακτήρες Αναγνώριση χαρακτήρων Εικόνα Εγγράφου Κείμενο Κλάσεις χαρακτήρων Κανόνες Κατάτμησης Κατάτμηση σε Γραμμές

27  Παρουσίαση Συστήματος – Ανάλυση Modules

28 Κατάτμηση σε Γραμμές - Διαδικασία  Τροποποίηση της μεθόδου των Shridar and Kasturi.  Χρήση οριζοντίου Ιστογράμματος. Εντοπισμός ορίων γραμμών στο Ιστόγραμμα Εντοπισμός ορίων γραμμών στο Ιστόγραμμα Χάραξη μονοπατιού λευκών pixels από αριστερά προς δεξιά Χάραξη μονοπατιού λευκών pixels από αριστερά προς δεξιά Κόψιμο και αποθήκευση γραμμών Κόψιμο και αποθήκευση γραμμών χειρόγρ. γραμμές  Παρουσίαση Συστήματος – Ανάλυση Modules

29 Απόδοση Αλγορίθμου Τεμαχισμού σε Γραμμές  άριστη αντιμετώπιση περιπτώσεων καλά διαχωρισμένων γραμών.  εισαγωγή θορύβου στην αντίθετη περίπτωση.  Παρουσίαση Συστήματος – Ανάλυση Modules

30 Διόρθωση γωνίας εκτροπής Εντοπισμός χειρόγραφου κειμένου Κατάτμηση σε γραμμές Διόρθωση κλίσης Κατάτμηση σε λέξεις Κατάτμηση σε χαρακτήρες Αναγνώριση χαρακτήρων Εικόνα Εγγράφου Κείμενο Κλάσεις χαρακτήρων Κανόνες Κατάτμησης Διόρθωση Κλίσης

31 Διόρθωση Κλίσης Χαρακτήρων  Παρουσίαση Συστήματος – Ανάλυση Modules

32 Διόρθωση Κλίσης Χαρακτήρων  Παρουσίαση Συστήματος – Ανάλυση Modules

33 Συνήθεις τεχνικές σε χρήση: Μέση κλίση κάθετων ή σχεδόν κάθετων γραμμών. Μεταβολή περιγραμμάτων χαρακτήρων. Διόρθωση Κλίσης Χαρακτήρων - Τεχνικές  Παρουσίαση Συστήματος – Ανάλυση Modules

34 Συνήθη μειονεκτήματα που αντιμετωπίζουμε:  Μεγάλο υπολογιστικό κόστος  Εξάρτηση από χαρακτήρες. Διόρθωση Κλίσης Χαρακτήρων - Μειονεκτήματα  Παρουσίαση Συστήματος – Ανάλυση Modules

35  Χρήση κάθετου ιστογράμματος γραμμής και κατανομής Wigner-Ville.  Χρήση τμημάτων λέξεων κατά την ανίχνευση για μείωση υπολογιστικού κόστους.  Ανίχνευση σε βήματα για μείωση υπολογιστικού κόστους. Διόρθωση Κλίσης Χαρακτήρων - Χαρακτηριστικά  Παρουσίαση Συστήματος – Ανάλυση Modules

36 Παρατηρήσεις  Τα περισσότερα γράμματα έχουν περίπου ίσο πλάτος με ύψος, w c  h c : Εξαιρέσεις: Γράμματα με ουρές προς τα πάνω (ascenders) ή κάτω (descenders): Iσχύει η παρατήρηση 1 αν αφαιρέσουμε τις ουρές. Οι χαρακτήρες ι,i,j,l,t, όπου προσεγγιστικά w c  h c /2. Οι χαρακτήρες ω,w,m, όπου προσεγγιστικά w c  3h c /2.

37 Παρατηρήσεις  Εντός των λέξεων είναι απίθανο να υπάρχει κενό πλάτους μεγαλύτερο του w c.  Οι χειρόγραφες λέξεις απέχουν μεταξύ τους διάστημα πλάτους ενός τουλάχιστον χαρακτήρα w c.

38 Εντοπισμός Ν τμημάτων προς χρήση Εντοπισμός Ν τμημάτων προς χρήση Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός αντίστοιχων κατανομών WV Υπολογισμός αντίστοιχων κατανομών WV Εντοπισμός κλίσης Angle που μεγιστοποιεί την ένταση Εντοπισμός κλίσης Angle που μεγιστοποιεί την ένταση Διόρθωση κλίση ως προς Angle Διόρθωση κλίση ως προς Angle Γραμμές Διορθωμένες γραμμές Step=10 Διόρθωση Κλίσης Χαρακτήρων - Διαδικασία  Παρουσίαση Συστήματος – Ανάλυση Modules Εντοπισμός Ν τμημάτων προς χρήση Εντοπισμός Ν τμημάτων προς χρήση Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός αντίστοιχων κατανομών WV Υπολογισμός αντίστοιχων κατανομών WV Εντοπισμός κλίσης Angle που μεγιστοποιεί την ένταση Εντοπισμός κλίσης Angle που μεγιστοποιεί την ένταση Διόρθωση κλίσης ως προς Angle Διόρθωση κλίσης ως προς Angle Step=1 Διορθωμένες γραμμές Γραμμές

39 Εντοπισμός Ν τμημάτων προς χρήση Εντοπισμός Ν τμημάτων προς χρήση Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός αντίστοιχων κατανομών WV Υπολογισμός αντίστοιχων κατανομών WV Εντοπισμός κλίσης Angle που μεγιστοποιεί την ένταση Εντοπισμός κλίσης Angle που μεγιστοποιεί την ένταση Διόρθωση κλίση ως προς Angle Διόρθωση κλίση ως προς Angle Γραμμές Διορθωμένες γραμμές Step=10 Διόρθωση Κλίσης Χαρακτήρων - Διαδικασία  Παρουσίαση Συστήματος – Ανάλυση Modules Εντοπισμός Ν τμημάτων προς χρήση Εντοπισμός Ν τμημάτων προς χρήση Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός Ιστογραμματων ανά Step Υπολογισμός αντίστοιχων κατανομών WV Υπολογισμός αντίστοιχων κατανομών WV Εντοπισμός κλίσης Angle που μεγιστοποιεί την ένταση Εντοπισμός κλίσης Angle που μεγιστοποιεί την ένταση Διόρθωση κλίσης ως προς Angle Διόρθωση κλίσης ως προς Angle Step=1 Διορθωμένες γραμμές Γραμμές

40 Σύγκριση με άλλες μεθόδους  Παρουσίαση Συστήματος – Ανάλυση Modules

41 Διόρθωση γωνίας εκτροπής Εντοπισμός χειρόγραφου κειμένου Κατάτμηση σε γραμμές Διόρθωση κλίσης Κατάτμηση σε λέξεις Κατάτμηση σε χαρακτήρες Αναγνώριση χαρακτήρων Εικόνα Εγγράφου Κείμενο Κλάσεις χαρακτήρων Κανόνες Κατάτμησης Κατάτμηση σε λέξεις

42 Κατάτμηση σε Λέξεις  Παρουσίαση Συστήματος – Ανάλυση Modules

43 Υπολογισμός κάθετων Ιστογραμμάτων Γραμμών Υπολογισμός κάθετων Ιστογραμμάτων Γραμμών Εντοπισμός κοιλάδων Ιστογραμμάτων με πλάτος > h c Εντοπισμός κοιλάδων Ιστογραμμάτων με πλάτος > h c Κόψιμο και αποθήκευση λέξεων Κόψιμο και αποθήκευση λέξεων Γραμμές Λέξεις Κατάτμηση σε Λέξεις  Παρουσίαση Συστήματος – Ανάλυση Modules

44 Διόρθωση γωνίας εκτροπής Εντοπισμός χειρόγραφου κειμένου Κατάτμηση σε γραμμές Διόρθωση κλίσης Κατάτμηση σε λέξεις Κατάτμηση σε χαρακτήρες Αναγνώριση χαρακτήρων Εικόνα Εγγράφου Κείμενο Κλάσεις χαρακτήρων Κανόνες Κατάτμησης Κατάτμηση σε χαρακτήρες

45  Παρουσίαση Συστήματος – Ανάλυση Modules Κατάτμηση σε Χαρακτήρες

46 Πλεονεκτήματα συστημάτων αναγνώρισης χαρακτήρων με κατάτμηση: Γενικότερες εφαρμογές (λεξικά, γλώσσες). Μεγαλύτερη ταχύτητα. Μειωμένες ανάγκες σε μνήμη.  Παρουσίαση Συστήματος – Ανάλυση Modules Κατάτμηση σε Χαρακτήρες - Πλεονεκτήματα

47 Εφαρμογή εμπειρικών κανόνων:  αδυναμία εύρεσης όλων των κανόνων. Αυτόματη εξαγωγή κανόνων με στατιστικές μεθόδους (Markov Models, Neural Networks):  εξαγωγή δυσνόητων κανόνων για περαιτέρω επεξεργασία.  Παρουσίαση Συστήματος – Ανάλυση Modules Κατάτμηση σε Χαρακτήρες – Συνήθεις Μέθοδοι

48 Εντοπισμός όλων των πιθανών ορίων Εντοπισμός όλων των πιθανών ορίων Εξαγωγή Διανυσμάτων Εξαγωγή Διανυσμάτων Κατάργηση των μη-ορίων Κατάργηση των μη-ορίων Λέξη Χαρακτήρες Προεπεξεργασία  Παρουσίαση Συστήματος – Ανάλυση Modules Κατάτμηση σε Χαρακτήρες – Τεχνική

49  Παρουσίαση Συστήματος – Ανάλυση Modules Κατάτμηση σε Χαρακτήρες – Απόδοση Αλγορίθμου

50  Παρουσίαση Συστήματος – Ανάλυση Modules Διόρθωση γωνίας εκτροπής Εντοπισμός χειρόγραφου κειμένου Κατάτμηση σε γραμμές Διόρθωση κλίσης Κατάτμηση σε λέξεις Κατάτμηση σε χαρακτήρες Αναγνώριση χαρακτήρων Εικόνα Εγγράφου Κείμενο Κλάσεις χαρακτήρων Κανόνες Κατάτμησης Αναγνώριση Χαρακτήρων

51 Οι προτεινόμενες τεχνικές αναγνώρισης ποικίλουν ως προς: Εξαγωγή Χαρακτηριστικών (στατιστικά ή περιγραφικά). Μέθοδοι Κατηγοριοποίησης (K-means, Markov Models, Νευρωνικά δίκτυα, γράφοι).  Παρουσίαση Συστήματος – Ανάλυση Modules Αναγνώριση Χαρακτήρων – Συνήθεις Μέθοδοι

52 Προεπεξεργασία Εξαγωγή Διανυσμάτων Εξαγωγή Διανυσμάτων Κατηγοριοποίηση με Κ-means Κατηγοριοποίηση με Κ-means Χαρακτήρες Κείμενο  Επιλογή περιγραφικών χαρακτηριστικών (Bunke, 1985, Pavlidis 2000)  Kατηγοριοποίηση με Κ-means  Παρουσίαση Συστήματος – Ανάλυση Modules Κατάτμηση σε Χαρακτήρες – Τεχνική

53 Προεπεξεργασία Αρχική μήτρα χαρακτήρα Καθάρισμα χαρακτήρα Κανονικ. Χαρακτ. Οριζόντια Προβολή Κάθετη Προβολή Ακτ. Εξωτ. Profile Ακτινική Προβολή Ακτ. Εσωτ. Profile

54  Δεδομένα από τις βάσεις GRUHD, NIST, IAM-DB.  2000 δείγματα ανά χαρακτήρα.  Κατηγοριοποίηση με K-means σε 128 κλάσεις/χαρακτήρα  Παρουσίαση Συστήματος – Ανάλυση Modules Αναγνώριση Χαρακτήρων – Εκπαίδευση

55 Βάση Ελληνικών χαρακήρων, ψηφίων και άλλων συμβόλων. Συγκεκριμένο κείμενο γραμμένο χωρίς περιορισμούς (unconstrained) συγγραφέων. Τουλάχιστον 2500 δείγματα ανά σύμβολο.  Πειραματικά Δεδομένα GRUHD Βάση Δεδομένων

56 Αμερικάνικη βάση Λατινικών χαρακήρων, ψηφίων και άλλων συμβόλων. Συγκεκριμένο κείμενο γραμμένο καθαρά (handprinted) συγγραφέων. Τουλάχιστον 2600 δείγματα ανά σύμβολο.  Πειραματικά Δεδομένα NIST Βάση Δεδομένων

57 Ελβετική βάση Λατινικών κειμένων γραμμένων χωρίς περιορισμούς. Κείμενα αποσπάσματα της βάσης Lancaster- Oslo-Bergen (LOB) συγγραφέων.  Πειραματικά Δεδομένα IAM-DB Βάση Δεδομένων

58 Πείραμα 1o: Εκπαίδευση από NIST δοκιμή στη NIST  Πειραματικά Αποτελέσματα 1 η Επιλογή 2 η Επιλογή 3 η Επιλογή Ψηφία98.8% % Κεφαλαία93.85% % Πεζά91.4%94.50%98.85% Μικτά %96.85%

59 Πείραμα 2o: Εκπαίδευση από GRUHD δοκιμή στη GRUHD  Πειραματικά Αποτελέσματα 1 η Επιλογή 2 η Επιλογή 3 η Επιλογή Ψηφία94%97.42%99,54% Κεφαλαία86.03%96.40%98.96% Πεζά81%90.36%96.60% Μικτά72.8%80.04%88.83%

60  Πειραματικά Αποτελέσματα Πείραμα 2o: Εκπαίδευση από GRUHD δοκιμή στη GRUHD Σε συνεχόμενο κείμενο:  65.6%-72.4% όταν λαμβάνεται υπ’όψιν η πρώτη επιλογή.  Πάνω από 80% όταν λαμβάνεται υπ’όψιν και η δέυτερη επιλογή.

61 Πείραμα 3o: Εκπαίδευση από NIST δοκιμή στη IAM-DB  Πειραματικά Αποτελέσματα Σε συνεχόμενο κείμενο:  71%-75.8% όταν λαμβάνεται υπόψιν η πρώτη επιλογή.  Πάνω από 80% όταν λαμβάνεται υπόψιν και η δέυτερη επιλογή.

62 Ακρίβεια Συναρτήσει Πλήθους Κλάσεων - NIST  Πειραματικά Αποτελέσματα Ψηφία Πεζά Κεφαλαία Ψηφία Μικτά

63 Ακρίβεια Συναρτήσει Πλήθους Κλάσεων - GRUHD  Πειραματικά Αποτελέσματα Ψηφία Πεζά Κεφαλαία Μικτά

64 Ακρίβεια Συναρτήσει Δειγμάτων Εκπαίδευσης - NIST  Πειραματικά Αποτελέσματα Ψηφία Πεζά Κεφαλαία Μικτά

65 Ακρίβεια Συναρτήσει Δειγμάτων Εκπαίδευσης - GRUHD  Πειραματικά Αποτελέσματα Ψηφία Πεζά Κεφαλαία Μικτά

66 Ακρίβεια Συναρτήσει Διανυσματικών Παραμέτρων - NIST  Πειραματικά Αποτελέσματα Ψηφία Πεζά Κεφαλαία Μικτά

67 Ακρίβεια Συναρτήσει Διανυσματικών Παραμέτρων - GRUHD  Πειραματικά Αποτελέσματα Ψηφία Πεζά Κεφαλαία Μικτά

68 Ακρίβεια Συναρτήσει Πλήθους Συγγραφέων  Πειραματικά Αποτελέσματα 1 η επιλογή 2 η επιλογή 3 η επιλογή 1ος συγγραφέας ος συγγραφέας ,08 3ος συγγραφέας86,3890,62  8 κλάσεις αντί 128,   8 δείγματα ανά χαρακτήρα αντί 2000.

69 Πίνακας Συσχέτισης Νist  Πειραματικά Αποτελέσματα

70 Υπολογιστικός Χρόνος  Πειραματικά Αποτελέσματα

71 Σύγκριση με άλλες μεθόδους  Παρουσίαση Συστήματος – Ανάλυση Modules

72 possilililiy tlat thi govemment mnght invohe the Public Ordir act, tgjb, and declare the whob ralby illegal – whitter the demomhators ut clown or not – uas bang diuuned in whilehall last mght. Jt uas last iised a year ago, to cleal with the St. Pancras sent nots. Toclay Mr. Butfr will have talhs with Rlici Comnimioner hi Joseph hmpson to clraw up linal plans for the n Battb of Parliument Guaren Nmp Παράδειγμα  Πειραματικά Αποτελέσματα

73 μ(μ,μ)ς(ε,ς) τ(τ,ζ)ω(ι,ι) (κ,κ)α(ο,ο)φ(μ,ρ)δ(δ,γ)ι(ι,υ)α(δ,α) μ(ρ,ρ)ε(ι,ν) τ(τ,τ)ι(ι,ς) π(π,η)κ(κ,ν)ο(ο,ο)ξ(η,η) τ(τ,τ)ι(ι,ι) π(η,π)ο(σ,ο)θ(θ,ς)ο(α,ο)ω(ν,κ)ε(ι,ι)ς(ξ,ς) κ(χ,κ)α(α,α)η(κ,ι) ι(ι,τ) π(β,κ)α(α,α),ι)θ(θ,δ)ο(α,σ)ι(ς,ς) π(π,π)ν(ν,τ)ρ(λ,χ)α(α,α)μ(ν,γ)β(ε,β) ο(α,α)ν(ι,φ) ζ(σ,ξ)κ(ω,ι)ξ(η,π) μ(υ,γ)α(α,α)ς(δ,ς)ι(ι,ς)λ(τ,χ)α(α,ο) θ(δ,δ)σ(ο,α)ς(ς,δ) κ(χ,κ)υ(ι,ι) α(α,ω)χ(λ,λ)χ(χ,λ)α(α,α)ζ(δ,ξ)α(α,α)ψ(μ,ς)ε(ε,ε) ξ(ζ,ξ)ω(β,κ)χ(χ,η) Παράδειγμα  Πειραματικά Αποτελέσματα

74 Επιλογή Παραθύρου προς Χρήση  Σάρωση εγγράφου με επικαλυπτόμενα κατά το ήμισυ παράθυρα μεγέθους 600x600.  Καταμέτρηση των μαύρων pixels του παράθυρου D.  Καταμέτρηση των εναλλαγών από μαύρα σε άσπρα pixels και αντίστροφα C.  Επιλογή του παράθυρου που μεγιστοποιεί το γινόμενο C*D.  Παρουσίαση Συστήματος – Ανάλυση Modules

75 Κατανομή Wigner-Ville  Παρουσίαση Συστήματος – Ανάλυση Modules

76 Εντοπισμός Χειρόγραφου Κειμένου – Διαδικασία  Παρουσίαση Συστήματος – Ανάλυση Modules

77 Εντοπισμός Χειρόγραφου Κειμένου – Διαδικασία  Παρουσίαση Συστήματος – Ανάλυση Modules

78  Πυκνότητα μαύρων pixels.  Μεταβολή ύψους συστατικών μιας περιοχής.  Μέση κάθετη συσχέτιση περιοχής: Εντοπισμός Χειρόγραφου Κειμένου – Κριτήρια Κατάταξης Συστατικών  Παρουσίαση Συστήματος – Ανάλυση Modules

79  Οριζόντια συμμετρία συστατικών.  Κάθετη συμμετρία συστατικών.  Συμμετρία κέντρου συστατικών.  Λόγος πλάτους ως προς το ύψος συστατικών. Εντοπισμός Χειρόγραφου Κειμένου – Κριτήρια Κατάταξης Συστατικών  Παρουσίαση Συστήματος – Ανάλυση Modules

80 Εφαρμόζονται με τη σειρά οι κανόνες:  0.3 < Πυκνότητα μαύρων pixels <0.6  χειρόγραφο.  πλήθος διακεκρ. σε ύψος συστατικών/πλήθος συστ.<1  τυπωμένο.  Άθροισμα συμμετριών <1.5  χειρόγραφο.  Άθροισμα συμμετριών >1.9  τυπωμένο.  Μέσος λόγος πλάτος ως προς ύψος συστ.>2.48  χειρόγραφο, αλλιώς  τυπωμένο. Εντοπισμός Χειρόγραφου Κειμένου – Κανόνες Κατάταξης Συστατικών  Παρουσίαση Συστήματος – Ανάλυση Modules

81  Υπολογισμός κάθετων Ιστογραμμάτων γραμμών.  Υπολογισμός ύψους κυρίου σώματος χαρακτήρων h c  Εντοπισμός κοιλάδων Ιστογραμμάτων με πλάτος Τ> h c /2  Επιλογή των Ν τμημάτων με το μεγαλύτερο μήκος που εμπεριέχονται μεταξύ των κοιλάδων. Διόρθωση Κλίσης Χαρακτήρων – Επιλογή Τμημάτων προς Χρήση  Παρουσίαση Συστήματος – Ανάλυση Modules

82 Υπολογισμός Υψους Κυρίους Σώματος Λέξης H c  Υπολογισμός του Ιστογράμματος ενός τμήματος γραμμής.  Έυρεση μεγίστου Ιστογράμματος (peak)  Εύρεση σημείων που η τιμή του Ιστογράμματος πέφτει κάτω από το 1/3 peak, πριν (πάνω όριο) και μετά (κάτω όριο) το peak.

83 Διόρθωση Κλίσης Χαρακτήρων – Χρήση Κατανομής Wigner-Ville  Παρουσίαση Συστήματος – Ανάλυση Modules

84 Όροι:  Τα όρια να απέχουν μεταξύ τους τουλάχιστον h c /2.  Τα όρια να μην ξεπερνούν σε πλήθος το: μήκος λέξης h c /2 Λέξη εισόδου Εντοπισμός κυρίου σώματος λέξης Υπολογισμός καθ. Ιστογραμ. κυρίου σώματος Εντοπισμός πιθανών ορίων από τα ελάχιστα του ιστογράμματος  Παρουσίαση Συστήματος – Ανάλυση Modules Κατάτμηση σε Χαρακτήρες – Προεπεξεργασία

85  τη θέση τομής ορίου-χαρακτήρα (αν υπάρχει) κανονικοποιημένη ως προς το h c.  Τιμή κάθετου ιστογράμματος στο σημείο τομής.  Πλάτος τμήματος κανονικοποιημένο ως προς το h c.  -  Τις θέσεις των δυο μεγαλύτερων κάθετων γραμμών (αν υπάρχουν) στο τμήμα.  -  Τις θέσεις των δυο μεγαλύτερων οριζόντιων γραμμών (αν υπάρχουν) στο τμήμα.  Παρουσίαση Συστήματος – Ανάλυση Modules Κατάτμηση σε Χαρακτήρες – Εξαγωγή Διανυσμάτων

86 Αυτόματη εξαγωγή κανόνων με τη μέθοδο της Εκμάθησης Βάσει Μετασχηματισμών (Stamatatos, et al., 1999).  Παρουσίαση Συστήματος – Ανάλυση Modules Κατάτμηση σε Χαρακτήρες – Κατάργηση των μη ορίων

87 Σώμα εκπαίδευσης Αρχικοποίηση Απομάκρυνση μη ορίων Σύνολο κανόνων Λέξεις με όλα τα πιθανά όρια Χαρακτήρες Εκμάθησης Βάσει Μετασχηματισμών (Stamatatos, et al., 1999).

88 Εκπαίδευση Μεθόδου Μετασχηματισμών 350 λέξεις από 250 διαφορετικούς συγγραφείς (βάση GRUHD).


Κατέβασμα ppt "Σύστημα Αυτόματης Επεξεργασίας Εγράφου και Αναγνώρισης Χειρόγραφων Χαρακτήρων, Ανεξάρτητο Συγγραφέα."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google