Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεΕἰρήνη Γαλάνης Τροποποιήθηκε πριν 6 χρόνια
1
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Σύγκριση των μοντέλων LPC και Filter Bank αναγνώρισης ομιλίας από ανεξάρτητο ομιλητή. Σπουδάστρια: Μωυσίδου Ελπίδα Επιβλέπων Καθηγητής: Δρ. Αθανασίου Μιχαήλ Ιανουάριος 2012
2
ΣΚΟΠΟΣ ΤΗΣ ΠΤΥΧΙΑΚΗΣ ΕΡΓΑΣΙΑΣ
Σκοπός της εργασίας είναι η σύγκριση των μοντέλων Filter Bank και LPC αναγνώριση ομιλίας από ανεξάρτητο ομιλήτη.
3
ΠΕΡΙΕΧΟΜΕΝΑ Μέθοδος Filter bank και LPC-Βασική Θεωρία Πειραματικά αποτελέσματα για 10 μονοψήφιους αριθμούς και 10 ονόματα από τις μεθόδους Filter bank και LPC Σύγκριση αποτελεσμάτων των μεθόδων Filter bank και LPC Ανακεφαλαίωση συμπεράσματα
4
Η κυματομορφή του σήματος που αντιστοιχεί στη λέξη «Τέσσερα»
Μέθοδος Filter bank και LPC-Βασική Θεωρία Περιβάλλον CoolEdit Η κυματομορφή του σήματος που αντιστοιχεί στη λέξη «Τέσσερα»
5
Μέθοδος Filter bank και LPC-Βασική Θεωρία
Δημιουργία frames Το αρχικό σήμα χωρίζεται σε frames Ν=240 δειγμάτων το καθένα. Ένα frame προκύπτει από τη μετατόπιση του προηγούμενου κατά M=80 δείγματα
6
Μεθοδος Filter bank και LPC-Βαςικη Θεωρια ιδανικο ζωνοπερατο φιλτρο
7
Μέθοδος Filter bank και LPC-Βασική Θεωρία
Σε κάθε frame εφαρμόζεται το filter bank. Το filter bank αποτελείται από Q=15 φίλτρα με εύρος συχνοτήτων 200 Hz το καθένα. Η μικρότερη συχνότητα των καναλιών είναι 200 Hz και η μεγαλύτερη 3200 Hz. Η κρουστική απόκριση κάθε φίλτρου έχει k=80 όρους 1 200 400 2 600 3 800 4 1000 5 1200 6 1400 7 1600 8 1800 9 2000 10 2200 11 2400 12 2600 13 2800 14 3000 15 3200 Κανάλια συχνοτήτων
8
Μέθοδος Filter bank και LPC-Βασική Θεωρία
ΔΗΜΙΟΥΡΓΙΑ ΠΡΟΤΥΠΟΥ Πρότυπο της λέξης Vector που αντιστοιχεί στο i frame X= x11 x12 … x1Q x21 x22 x2Q xP1 xP2 xPQ P: Σύνολο των frames
9
Πρότυπο της λέξης «Αριστοτέλης»
Τα πρώτα 30 διανύσματα (vectors) από τα 110 συνολικά του προτύπου που αντιστοιχεί στη λέξη «Αριστοτέλης» 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 -3.97 -1.06 -1.03 -4.21 -5.50 -3.50 -0.53 -2.77 -3.37 -2.85 -4.58 -9.54 -8.33 -7.34 -6.22 -0.30 -1.07 -4.63 -5.18 -3.81 -0.22 -2.66 -2.69 -2.37 -3.85 -7.88 -7.77 -7.93 -5.79 -2.78 0.18 -0.91 -4.44 -5.28 -3.87 -0.27 -2.81 -3.36 -3.03 -4.18 -7.55 -9.34 -7.03 -5.75 -2.63 0.12 -1.02 -5.09 -5.76 -3.90 -0.77 -2.67 -3.41 -3.30 -8.01 -6.55 -6.61 -2.39 0.22 -2.20 -5.35 -6.57 -4.86 -0.24 -1.31 -3.29 -7.28 -6.47 -7.10 -2.13 -3.15 -6.17 -4.69 -1.45 -1.89 -3.17 -8.10 -8.49 -6.98 -7.20 -1.68 -6.18 -5.93 -4.78 -0.71 -3.18 -3.43 -6.31 -7.47 -8.90 -7.14 -7.48 -1.41 -3.24 -4.33 -5.44 -7.24 -0.98 -3.13 -3.46 -5.25 -8.41 -8.70 -8.42 -9.66 -1.34 -1.94 -5.27 -6.80 -5.90 -4.11 -3.38 -4.41 -8.45 -8.21 -8.22 -7.95 -1.36 -2.24 -8.58 -7.22 -6.26 -1.82 -2.25 -3.71 -5.08 -8.88 -9.44 -8.43 -7.87 -1.13 -2.64 -3.83 -8.40 -7.82 -2.21 -1.26 -2.80 -3.01 -4.92 -8.81 -8.86 -8.73 -8.08 -2.57 -4.52 -8.23 -7.84 -6.33 -3.21 -1.25 -2.38 -8.03 -8.04 -9.47 -0.81 -1.57 -7.33 -6.39 -5.84 -2.92 -1.70 -3.62 -3.92 -5.74 -8.62 -8.51 -10.29 -0.90 -2.17 -4.93 -6.88 -7.26 -6.00 -4.04 -1.76 -4.15 -4.39 -5.58 -8.84 -8.26 -8.85 -2.06 -5.48 -6.37 -8.02 -6.32 -4.28 -3.54 -5.86 -4.70 -9.20 -9.12 16 -2.74 -3.58 -5.66 -6.92 -8.19 -3.67 -4.72 -6.11 -6.38 -6.30 -8.11 -10.27 -10.15 -9.49 17 -2.41 -2.22 -6.48 -6.71 -8.56 -3.56 -3.68 -8.07 -7.05 -8.55 -9.26 -7.68 18 -2.84 -2.75 -6.86 -6.51 -5.42 -3.98 -5.82 -9.30 -9.22 -7.65 19 -3.77 -4.03 -5.62 -6.77 -7.72 -7.71 -4.54 -5.02 -5.83 -7.36 -7.41 -7.89 -7.13 -6.01 20 -3.47 -3.73 -7.09 -3.96 -3.10 -4.16 -6.59 -7.64 -5.87 -5.54 21 -4.56 -6.82 -7.62 -4.13 -5.70 -4.91 -6.70 -4.55 22 -5.94 -6.74 -6.68 -8.52 -7.44 -6.19 -6.64 -7.76 -6.45 23 -6.20 -8.24 -6.04 -6.43 -6.75 24 -4.45 -4.71 -6.29 -6.87 -9.13 -8.54 -7.42 -7.25 -7.54 -9.18 -8.39 -7.40 25 -3.79 -4.88 -6.72 -9.43 -7.69 -6.83 -7.06 -7.39 -7.07 -10.84 -10.07 -7.96 26 -6.54 -8.25 -8.57 -7.51 -7.29 -6.36 -7.99 -7.94 -8.89 -9.05 -7.90 -8.17 27 -5.46 -8.14 -7.83 -8.98 -8.47 -7.01 -7.56 -7.21 -7.37 -8.79 -7.08 -6.91 28 -6.28 -8.05 -7.75 -7.85 -9.19 -7.60 29 -6.52 -9.09 -8.18 -6.99 -7.11 -8.95 -9.01 -9.25 -6.09 30 -5.40 -7.70 -7.17 -8.59 -7.63 -7.52 -7.43 -8.06 -8.66 -8.30 Οκτώβριος 2010
10
Πρότυπο της λέξης «Μαρία»
Τα πρώτα 17 διανύσματα από τα συνολικά 61 του προτύπου που αντιστοιχεί στη λέξη «Μαρία» 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 -5.76 -8.99 -9.10 -9.43 -8.56 -10.77 -9.60 -9.22 -9.71 -9.52 -11.38 -11.10 -11.18 -11.29 -10.84 -5.21 -8.52 -9.87 -9.07 -8.68 -8.94 -9.56 -9.53 -9.95 -10.74 -10.91 -11.40 -10.81 -10.61 -12.34 -5.18 -7.39 -10.1 -8.36 -8.11 -8.22 -10.18 -9.78 -9.49 -8.85 -12.26 -11.17 -10.50 -11.16 -10.57 -5.73 -6.95 -8.61 -9.08 -8.41 -8.92 -9.98 -10.95 -11.53 -11.68 -11.14 -4.99 -6.98 -9.14 -9.13 -7.99 -7.54 -9.21 -10.07 -9.29 -10.06 -10.47 -11.88 -11.45 -10.62 -11.87 -5.52 -6.73 -6.96 -7.31 -6.66 -8.31 -9.44 -9.30 -9.94 -10.68 -11.50 -10.94 -10.69 -11.07 -4.51 -6.03 -4.73 -4.48 -4.12 -3.67 -5.24 -9.57 -9.15 -11.54 -11.39 -11.99 -5.12 -4.83 -3.84 -2.99 -3.39 -1.64 -3.42 -6.67 -10.11 -8.27 -10.64 -10.70 -10.54 -13.11 -4.75 -4.09 -3.60 -2.29 -4.24 -1.29 -2.09 -5.75 -8.70 -8.76 -9.67 -11.27 -11.76 -4.76 -3.26 -3.02 -2.32 -3.47 -1.94 -1.19 -5.03 -7.47 -8.35 -10.29 -12.06 -11.49 -11.08 -5.20 -2.98 -3.17 -2.53 -3.15 -0.60 -8.33 -8.74 -11.66 -9.66 -11.31 -10.93 -5.43 -2.73 -2.79 -2.42 -2.91 -2.20 -1.09 -3.72 -8.28 -10.90 -8.73 -10.48 -11.00 -5.46 -2.67 -2.66 -2.64 -2.77 -2.31 -0.73 -3.48 -9.03 -9.70 -10.27 -10.21 -5.88 -2.52 -2.01 -2.87 -0.47 -8.46 -8.19 -11.23 -11.06 -10.24 -6.00 -2.47 -1.62 -2.26 -0.31 -8.04 -8.08 -9.19 -10.04 -9.90 16 -6.43 -2.27 -2.19 -1.38 -2.76 -2.68 -0.25 -3.41 -7.28 -7.59 -9.47 -9.41 -10.13 -9.24 17 -5.68 -2.12 -1.30 -2.94 -3.46 -0.61 -3.30 -5.50 -6.40 -8.87 -10.56
11
Μέθοδος Filter bank και LPC-Βασική Θεωρία
ΣΥΓΚΡΙΣΗ ΠΡΟΤΥΠΩΝ Χρονική ευθυγράμμιση και απόσταση προτύπων Έστω Χ, Υ δύο πρότυπα (πίνακες) που αντιστοιχούν σε δύο διαφορετικές λέξεις και Τx , Τy οι γραμμές των πινάκων Χ και Υ αντίστοιχα. Εφαρμογή της γραμμικής αντιστοίχησης των vectors στο χρόνο Απόσταση μεταξύ των προτύπων Χ και Υ Ευκλείδεια απόσταση
12
Παράδειγμα σύγκρισης προτύπων
Μέθοδος Filter bank και LPC-Βασική Θεωρία Παράδειγμα σύγκρισης προτύπων Έστω Υ πρότυπο της λέξης «Αριστοτέλης» της 12ης βάσης -3.97 -1.06 -1.03 -4.21 -5.50 -3.50 -5.34 -2.77 -3.37 -2.85 -4.58 -9.54 -8.33 -7.34 -6.22 -5.21 -8.52 -9.87 -9.07 -8.68 -8.94 -9.56 -9.53 -9.95 -10.74 -10.91 -11.40 -10.81 -10.61 -12.34 … -1.08 -1.77 -9.13 -8.53 -9.33 -8.31 -9.26 -8.84 -9.86 -8.71 -1.16 -1.17 -1.21 -1.31 -1.20 y110 Έστω Χ πρότυπο της λέξης «Μαρία» της βάσης test -2,8 -4,5 -3,5 -3,6 -2,4 -3,8 -3,7 -4,9 -8,2 -5,9 -6,2 -7,6 -8,1 -8,6 -5.21 -8.52 -9.87 -9.07 -8.68 -8.94 -9.56 -9.53 -9.95 -10.74 -10.91 -11.40 -10.81 -10.61 -12.34 … -1.08 -1.77 -9.13 -8.53 -9.33 -8.31 -9.26 -8.84 -9.86 -8.71 -1.16 -1.17 -1.21 -1.31 -1.20 x61
13
Μέθοδος Filter bank και LPC-Βασική Θεωρία
Για Τx=61 και Τy =110είναι: Εύρεση των ζευγών ( ix , iy ) των γραμμών που θα συγκριθούν Εύρεση της απόστασης μεταξύ των προτύπων Χ και Υ Η απόσταση αυτών των δύο προτύπων είναι: D=1.45 ix 1 2 3 4 5 6 7 8 9 10 … 60 61 iy 12 14 16 18 108 110
14
ΜΟΝΤΕΛΟ L.P.C. ΓΙΑ ΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΦΩΝΗΣ
Μέθοδος Filter bank και LPC-Βασική Θεωρία ΜΟΝΤΕΛΟ L.P.C. ΓΙΑ ΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΦΩΝΗΣ Παρέχει ένα καλό μοντέλο του σήματος ομιλίας. Μαθηματικά ακριβής μέθοδος και απλή στην εφαρμογή της σε software και hardware Αναπαράσταση του σήματος με λίγα χαρακτηριστικά – Καλύτερη συμπίεση Μικρότερο υπολογιστικό κόστος από άλλες μεθόδους όπως Filter-bank
15
ΜΟΝΤΕΛΟ L.P.C Μέθοδος Filter bank και LPC-Βασική Θεωρία Mια τιμή (sample) ενός σήματος στο χρόνο, την χρονική στιγμή n μπορεί να προσεγγισθεί ως γραμμικός συνδυασμός των ‘p’ προηγούμενων δειγμάτων Εύρεση συντελεστών
16
Η ίδια διαδικασία ηχογράφησης εφαρμόστηκε και για δέκα ονόματα.
Πειραματικά αποτελέσματα για 10 μονοψήφιους αριθμούς και 10 ονόματα από τις μεθόδους Filter bank και LPC Ηχογραφήθηκαν οι αριθμοί 0 έως 9, σαράντα φορές ο καθένας, και ταξινομήθηκαν σε 40 αντίστοιχες βάσεις. Η ίδια διαδικασία ηχογράφησης εφαρμόστηκε και για δέκα ονόματα. Η ηχογράφηση έγινε από σαράντα διαφορετικούς ομιλητές. Για την ηχογράφηση επιλέχθηκε η συχνότητα δειγματοληψίας των Hz. ΗΧΟΓΡΑΦΗΣΗ ΛΕΞΕΩΝ
17
Πειραματικά αποτελέσματα για 10 μονοψήφιους αριθμούς και 10 ονόματα από τις μεθόδους Filter bank και LPC Η ίδια διαδικασία επαναλαμβάνεται για την εύρεση των αποστάσεων των αριθμών της βάσης test από τους αριθμούς των άλλων 39 βάσεων που αντιστοιχούν σε 39 άτομα. Οπότε προκύπτουν συνολικά 40 διαφορετικοί πίνακες όμοιοι με τον πίνακα της προηγούμενης διαφάνειας. Από αυτούς τους πίνακες με την εφαρμογή κατάλληλου προγράμματος βρίσκονται οι αποστάσεις του προτύπου ενός αριθμού της βάσης test από τα αντίστοιχα πρότυπα των αριθμών 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 των 40 ατόμων.
18
Στον παρακaτω filter bank πινακα δειχνονται οι αποςταςεις του αριθμου τεςςερα της βαςης τεςςερα απο τα προτυπα των αριθμων της γενικης βαςης βα των αριθμων των ςαραντα ατομων για ευρος παραθυρου Ν=120. μηδέν ένα δύο τρία τέσσερα πέντε έξι εφτά οχτώ εννιά Άτομο1 1,11 0,99 1,23 1,14 1,02 0,90 1,26 1,03 1,06 0,98 Άτομο2 0,96 0,94 0,93 0,81 0,80 0,78 0,82 Άτομο3 0,89 1,16 0,84 1,17 0,88 0,92 Άτομο4 1,12 1,05 0,68 0,67 0,83 Άτομο5 1,22 1,09 1,01 1,04 Άτομο6 0,95 0,85 1,00 Άτομο7 0,73 1,08 Άτομο8 1,30 1,31 1,15 1,07 Άτομο9 1,29 1,21 1,18 0,87 1,13 Άτομο10 Άτομο11 0,86 0,91 0,97 Άτομο12 Άτομο13 Άτομο14 1,20 Άτομο15 0,76 Άτομο16 1,43 1,10 1,34 Άτομο17 Άτομο18 1,27 1,28 Άτομο19 Άτομο20 1,41 1,25 1,19
19
τέσσερα μηδέν ένα δύο τρία πέντε έξι εφτά οχτώ εννέα Άτομο21 Άτομο22
1,26 1,04 1,19 1,13 0,90 0,86 1,08 1,18 1,03 Άτομο22 1,24 0,93 1,25 1,20 0,82 0,84 1,09 1,06 1,07 Άτομο23 1,16 0,89 0,85 1,02 0,98 1,00 Άτομο24 0,88 0,95 Άτομο25 0,99 0,83 0,81 1,11 Άτομο26 1,15 1,01 0,96 1,10 Άτομο27 0,91 0,80 0,97 0,75 Άτομο28 1,14 0,94 Άτομο29 0,78 Άτομο30 1,12 0,87 1,17 Άτομο31 1,23 Άτομο32 0,76 Άτομο33 1,21 1,05 Άτομο34 1,29 Άτομο35 Άτομο36 Άτομο37 0,70 0,79 Άτομο38 1,28 Άτομο39 0,92 0,73 Άτομο40 0,77
20
Αποςταςεις του προτυπου αριθμου τεςςερα της βαςης τεςτ απο τα προτυπα των αριθμων της γενικης βαςης των αριθμων των 40 ατομων για ευρος παραθυρου Ν=120 μηδέν ένα δύο τρία τέσσερα πέντε έξι εφτά οχτώ εννέα 0,91 0,80 0,92 0,93 0,68 0,67 0,83 0,78 0,82 0,96 0,94 0,70 0,73 0,88 1,00 0,85 0,95 0,75 0,79 1,02 0,86 0,98 0,99 0,87 0,97 0,76 0,89 1,03 0,77 1,05 1,06 1,01 1,07 0,81 1,08 0,90 1,09 1,10 1,11 1,12 1,15 1,04 1,16 1,13 0,84 1,14 1,17
21
Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «Τεςςερα» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=120. Βάση αριθμών σαράντα ατόμων για N=120 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Μηδέν 0,91 0,937 0,97 1,02 Ένα 0,8 0,83 0,85 Δύο 0,92 0,931 0,94 1 Τρία 0,93 0,934 Τέσσερα 0.68 0,71 0,75 Πέντε 0,67 0,7 0,72 0,76 Έξι 0.83 0,86 0,96 Εφτά 0,81 0,87 Οχτώ 0,78 Εννιά 0,82 0,84 0,88
22
Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «Τεςςερα» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=240. Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Μηδέν 1.15 1.16 1.19 1.29 Ένα 1.17 1.20 Δύο 1.33 1.39 1.45 Τρία 0.91 0.99 1.10 Τέσσερα 0.94 0.96 1.01 1.05 Πέντε 1.1 1.11 1.13 1.14 Έξι 1.04 1.21 Εφτά 1.24 1.28 Οχτώ 1.08 Εννιά
23
Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «Τεςςερα» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=360. Βάση αριθμών σαράντα ατόμων για N=360 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Μηδέν 1,47 1,5 1,59 1,25 Ένα 1,23 1,28 1,32 1,37 Δύο 1,41 1,46 1,54 1,68 Τρία 1,45 1,48 1,53 Τέσσερα 1,09 1,13 1,17 Πέντε 1,2 1,24 Έξι 1,40 1,4 1,63 Εφτά 1,21 1,27 1,31 1,42 Οχτώ 1,34 Εννιά 1,35
24
Στον πινακα LPC παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «Τεςςερα» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=240. Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο.των δύο μικρότερων αποστάσεων τεσσάρων μικρότερων αποστάσεων δέκα μικρότερων Μηδέν 0,15 0,16 Ένα 0,14 Δύο Τρία 0,17 Τέσσερα 0,11 0,12 Πέντε Έξι Εφτά Οχτώ 0,13 Εννιά
25
Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «αριςτοτελης» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=120. Βάση αριθμών σαράντα ατόμων για N=120 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Αγγελική 0,74 0,79 0,83 0,89 Γιάννης 0,78 0,8 0,82 0,87 Αφροδίτη 0,99 1 1,03 Πλάτωνας 0,94 0,95 0,97 1,02 Ελένη 0,85 0,93 Αριστοτέλης 0,63 0,64 0.65 0.69 Μαρία 1. 1,10 Τάσος 0,91 Αθηνά 0,86 0,88 Μιχάλης 0,98 1,04
26
Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «αριςτοτελης» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=240. Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Αγγελική 0.97 1.03 1.07 Γιάννης 0.95 1.05 1.15 1.22 Αφροδίτη 0.93 0.98 1.04 Πλάτωνας 1.16 1.17 1.19 1.21 Ελένη 1.02 1.08 Αριστοτέλης 0.74 0.79 0.84 0.87 Μαρία 1.25 1.34 1.44 1.52 Τάσος 1.14 Αθηνά 1.18 Μιχάλης 1.09
27
Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «αριςτοτελης» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=360. Βάση αριθμών σαράντα ατόμων για N=360 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Αγγελική 1 1,14 1,22 Γιάννης 1,04 1,11 Αφροδίτη 1,17 1,18 1,25 Πλάτωνας 1,23 1,24 1,3 Ελένη 1,12 1,13 1,2 Αριστοτέλης 0,93 0,94 0,97 Μαρία 1,27 1,28 1,34 Τάσος 1,15 1,19 1,26 Αθηνά 1,07 1,1 Μιχάλης 1,29 1,35
28
Στον πινακα LPC παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «αριςτοτελης» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=240 Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Aθηνά 0,17 0,18 Αριστοτέλης 0,10 0,11 Αγγελική 0,15 0,16 Αφροδήτη 0,12 0,13 Ελένη Γιάννης 0,19 Μαρία Μιχάλης Πλάτωνας Τάσος 0,20
29
Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «Τεςςερα» kai «αριςτοτελης» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=240 kai nf=4. Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Μηδέν 2,05 2,13 2,29 2,37 Ένα 1,69 1,79 1,86 1,96 Δύο 2,42 2,55 2,65 2,73 Τρία 1,48 1,51 1,71 1,87 Τέσσερα 1,20 1,29 1,52 1,73 Πέντε Έξι 2,57 2,61 2,74 Εφτά 2,19 2,22 2,35 Οχτώ 2,08 2,14 2,18 2,32 Εννιά Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Αγγελική 2,36 1,98 2,05 2,68 Γιάννης 2,35 1,85 1,93 2,55 Αφροδίτη 2,19 2 2,12 2,71 Πλάτωνας 2,14 2,09 2,11 2,57 Ελένη 1,84 1,9 2,58 Αριστοτέλης 1,34 1,37 2,26 Μαρία 1,92 1,97 Τάσος 1,75 1,89 Αθηνά 1,91 2,02 2,63 Μιχάλης 2,28 2,33 2,39 2,88
30
ΣΥΓΚΡΙΣΗ ΤΩΝ ΜΕΘΟΔΩΝ FILTER BANK ΚΑΙ LPC ΣΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΤΗΣ ΛΕΞΗΣ ΤΕΣΣΕΡΑ-%ςφαλμα
Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Filter Bank για Ν=120 και nf=15 - 2,94 1,4 1,33 Filter Bank για Ν=240 3,12 8,9 8,57 Filter Bank για Ν=360 2,65 0,81 και nf=4 23,3 16,27 12,5 8,09 LPCγια Ν=240 και Q=15 18,2 27,2 25
31
ΣΥΓΚΡΙΣΗ ΤΩΝ ΜΕΘΟΔΩΝ FILTER BANK ΚΑΙ LPC ΣΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΤΗΣ ΛΕΞΗΣ αριςτοτελης- %ςφαλμα
Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Filter Bank για Ν=120 και nf=15 17,4 23,4 26,15 26 Filter Bank για Ν=240 25,6 22,7 21,4 2,29 Filter Bank για Ν=360 19,35 20,4 1,06 23,7 και nf=4 30,5 38 38,6 LPCγια Ν=240 και Q=15 20 18,1
32
ΣΥΜΠΕΡΑΣΜΑΤΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΜΕΘΟΔΩΝ FILTER BANK ΚΑΙ LPC ΓΙΑ ΑΡΙΘΜΟΥΣ
Ανάμεσα στις μεθόδους Filter Bank και LPC η μέθοδος που δίνει τα καλύτερα αποτελέσματα είναι η μέθοδος LPC με Ν=240 Στη μέθοδο Filter Bank με nf=15 και nf=4 τα καλύτερα αποτελέσματα τα έχω για nf=4 και Ν=240 Στη μέθοδο Filter Bank με nf=15 και Ν=120,Ν=240 και Ν=360 τα καλύτερα αποτελέσματα τα έχω για Ν=240
33
ΣΥΜΠΕΡΑΣΜΑΤΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΜΕΘΟΔΩΝ FILTER BANK ΚΑΙ LPC ΓΙΑ ΟΝΟΜΑΤΑ
Ανάμεσα στις μεθόδους Filter Bank και LPC η μέθοδος που δίνει τα καλύτερα αποτελέσματα είναι η μέθοδος Filter Bank με Ν=240 και nf=4 Στη μέθοδο Filter Bank με nf=15 και nf=4 τα καλύτερα αποτελέσματα τα έχω για nf=4 και Ν=240 Στη μέθοδο Filter Bank με nf=15 και Ν=120,Ν=240 και Ν=360 τα καλύτερα αποτελέσματα τα έχω για Ν=240
34
Ποια βαςη εχει μεγαλυτερη αναγνωριςιμοτητα οι αριθμοι η τα ονοματα?
Την μεγαλήτερη αναγνωρισιμότητα την έχει η βάση με τα ονόματα
35
ΑΝΑΚΕΦΑΛΑΙΩΣΗ ΚΑΙ ΣΥΜΠΕΡΑΣΜΑΤΑ
Εφαρμόστηκε η μέθοδος filter bank και LPC για αναγνώριση ξεχωριστών λέξεων από σαράντα διαφορετικούς ομιλητές. Ο έλεγχος των μεθόδων έγινε για δύο κατηγορίες δεδομένων αποτελούμενες από 10 αριθμούς και 10 ονόματα. Δεν υπήρχε λανθασμένη αναγνώριση λέξης τόσο για τους αριθμούς όσο και για τα ονόματα. Διαπιστώθηκε ότι μεγαλύτερη αναγνωρισιμότητα από την εφαρμογή αυτή είχαν οι λέξεις των ονομάτων. Επίσης είναι φανερό πως στη μέθοδο Filter Bank τη μεγαλύτερη αναγνωρισιμότητα έχουν τα ονόματα για Ν=240, ενώ για Ν=120 και Ν=360 το ποσοστό αναγνωρισιμότητας για τους αριθμούς και τα ονόματα είναι το ίδιο.
36
Διαπιστώθηκε ότι οι μεθόδοι Filter bank και LPC για την αναγνώριση ξεχωριστών λέξεων από ανεξάρτητο ομιλητή είναι αποτελεσματικές. Ακόμη σε αυτή την εργασία εφαρμόστηκαν οι μέθοδοι Filter Bank και LPC για την αναγνώριση λέξεων που εκφωνήθηκαν από μια συγκεκριμένη γυναίκα. Τα πρότυπα των λέξεων αυτών συγκρίθηκαν με τα αντίστοιχα πρότυπα των λέξεων που εκφωνήθηκαν από 40 άτομα. Όμως από τα 40 αυτά άτομα μόνο ήταν γυναίκες.Στη μέθοδο Filter Bank τα αποτελέσματα αναμένεται να είναι καλύτερα όσο μεγαλύτερο είναι το ποσοστό γυναικών στα 40 άτομα ενώ στη μέθοδο LPC θα είχαμε καλύτερα αποτελέσματα αν στη γενική βάση είχαμε περισσότερους άνδρες
38
ΠΑΡΟΥΣΙΑΣΗ ΚΑΙ ΣΥΓΚΡΙΣΗ ΚΥΜΑΤΟΜΟΡΦΩΝ ΔΙΑΦΟΡΕΤΙΚΩΝ ΛΕΞΕΩΝ
ρι στο τέ λης Μη δ έ ν α) Κυματομορφή της λέξης «Αριστοτέλης» της 1ης βάσης των ονομάτων β) Κυματομορφή της λέξης «Μηδέν» της 1ης βάσης των αριθμών Μα Τέ σσ ε ρ α ρί α γ) Κυματομορφή της λέξης «Μαρία» της 1ης βάσης των ονομάτων δ) Κυματομορφή της λέξης «Τέσσερα» της 1ης βάσης των αριθμών
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.