ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Σύγκριση των μοντέλων LPC και.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
1 /11/05 ΕΝΟΤΗΤΑ ΠΑΘΗΤΙΚΑ ΣΤΟΙΧΕΙΑ ΠΥΚΝΩΤΕΣ ΑΞΙΟΛΟΓΗΣΗ & ΚΑΤ ΌΙΚΟΝ ΕΡΓΑΣΙΑ ΦΥΛΛΑΔΙΟ.
Advertisements

ΜΕΡΟΣ 1 Οι κατευθύνσεις της οικονομικής πολιτικής και η εναλλακτική μακρο-οικονομική και αναπτυξιακή πολιτική ΜΕΡΟΣ 2 Η ελληνική οικονομία κατά το
Απόκλίσεις της σπονδυλικής στήλης Σκολίωση, Κύφωση, Λόρδωση
1 Κλαδικά Λογιστικά Σχέδια Ναυτιλιακή Λογιστική – Ο Λογαριασμός Πλοιάρχου Διακομιχάλης Μιχαήλ Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
ΣΧΟΛΙΚΟΣ ΕΚΦΟΒΙΣΜΟΣ SCHOOL BULLING. ΕΠΙΜΕΛΕΙΑ: ΧΡΗΣΤΟΣ ΤΑΤΣΗΣ ΒΑΣΙΛΗΣ ΠΑΤΣΕΛΗΣ ΔΗΜΗΤΡΗΣ ΣΙΜΙΝΙΟΥΚ YΠΕΥΘΥΝΗ ΚΑΘΗΓΗΤΡΙΑ: Κα ΠΟΛΥΧΡΟΝΙΑΔΟΥ ΠΕΤΡΟΥΛΑ.
Τεχνολογία Περιβάλλοντος: Επεξεργασία Βιομηχανικών Υγρών Αποβλήτων Ενότητα 1: Εισαγωγή στις προχωρημένες μεθόδους επεξεργασίας υγρών αποβλήτων Μαντζαβίνος.
3 ο ΓΥΜΝΑΣΙΟ ΤΡΙΠΟΛΗΣ ΕΕΕΕΚ ΜΑΝΤΙΝΕΙΑΣ ΠΡΟΓΡΑΜΜΑ ΠΡΟΣΒΑΣΙΜΟΤΗΤΑΣ.
1 Συναρτησιακές Εξαρτήσεις και Κανονικοποίηση Κανονικές Μορφές - Πρώτη κανονική μορφή (1NF) - Δεύτερη κανονική μορφή (2NF) - Τρίτη κανονική μορφή (3NF)
Στρατηγικό Μάνατζμεντ Τηλεπικοινωνιών Ιεράρχηση Στρατηγικής –Επίπεδα Στρατηγικής.
12. Αναπαραγωγή & ανάπτυξη Βιολογία Α’ Λυκείου. Αναπαραγωγή Το μόνο σύστημα που δεν είναι απαραίτητο για επιβίωση Ύπαρξη 2 διαφορετικών φύλων Πρωτεύοντα.
Ποιοτικός Έλεγχος Πρώτων Υλών Ενότητα 3: Ποιοτικός Έλεγχος στα Έπιπλα Γεώργιος Νταλός, Καθηγητής, Τμήμα Σχεδιασμού & Τεχνολογίας Ξύλου και Επίπλου, T.E.I.
ΤΟΜΕΑΣ ΥΓΕΙΑΣ ΠΡΟΝΟΙΑΣ. ΕΙΔΙΚΟΤΗΤΑ ΒΟΗΘΩΝ ΝΟΣΗΛΕΥΤΩΝ.
Test.
Test.
Η ΘΕΣΗ ΤΗΣ ΓΥΝΑΙΚΑΣ.
Διαφοροποίηση της διδασκαλίας για μαθητές με αυτισμό
Γραμμική παλινδρόμηση και Συσχέτιση: έλεγχοι με τον συντελεστή συσχέτισης r Στην ενότητα αυτή μελετάται η σχέση ανάμεσα σε δυο ποσοτικά χαρακτηριστικά.
Διαδικασία συλλογής των δεδομένων – Δειγματοληψία Απώτερος στόχος η διερεύνηση των σχέσεων μεταξύ μεταβλητών και παραγωγή γνώσης με το σχήμα «αίτιο – αποτέλεσμα».
Νέο Τεχνολογικό Λύκειο
Τεχνολογία Πολυμέσων Ενότητα # 13: Κωδικοποίηση βίντεο: MPEG
Tο υλικό του Ηλεκτρονικού Υπολογιστή
Ο υπολογιστής Εισαγωγή.
Μεθοδολογία της έρευνας στις Κοινωνικές Επιστήμες Ι & ΙΙ
ΕΠΑΓΓΕΛΜΑΤΙΚΟΥ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΓΙΑ ΤΙΣ ΑΣΤΥΝΟΜΙΚΕΣ ΣΧΟΛΕΣ
Θεωρία Συστημάτων και Πληροφοριακά Συστήματα
Αν. Καθηγητής Γεώργιος Ευθύμογλου
ΜΕΤΑΣΧΗΜΑΤΙΣΤΕΣ.
Συσχέτιση ιδιοτήτων Γονίδια Φαινότυπος Περιβάλλον Ιδιότητα 1
ΟΙ ΔΕΚΑ ΜΕΓΑΛΥΤΕΡΕΣ ΕΠΙΧΕΙΡΗΣΕΙΣ ΤΗΣ ΕΛΛΑΔΑΣ
Ανάλυση και Σχεδιασμός Πληροφοριακών Συστημάτων (Θεωρία)
ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ
Προσομοίωση Ανεμογεννήτριας
(ALPHA BANK – EUROBANK – ΤΡΑΠΕΖΑ ΠΕΙΡΑΙΩΣ)
Μερκ. Παναγιωτόπουλος - Φυσικός
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΩΤΑΤΗ ΣΧΟΛΗ ΠΑΙΔΑΓΩΓΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΠΜΣ «ΣΥΜΒΟΥΛΕΥΤΙΚΗ ΚΑΙ ΕΠΑΓΓΕΛΜΑΤΙΚΟΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΣ»
ΚΛΙΝΙΚΕΣ ΕΦΑΡΜΟΣΜΕΝΗΣ EΡΕΥΝΑΣ. EΝΑ ΝΕΟ ΥΓΕΙΟΝΟΜΙΚΟ ΠΡΟΪΟΝ.
ΑΠO ΤΟΥΣ ΜΑΘΗΤΕΣ ΤΟΥ Β1 1.ΙΑΣΟΝΑ ΑΝΑΣΤΑΣΙΟ ΜΑΚΡΗ 2.ΑΠΟΣΤΟΛΟ ΓΕΡΟΔΗΜΟ
Μετασχηματισμοί των κυματισμών
Το υλικό του Υπολογιστή
23o Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών Α. Π. Θ
Η σοκολάτα στη διατροφή μας
ΗΛΕΚΤΡΟΛΟΓΙΑ ΔΙΕΥΘΥΝΣΗ ΜΕΣΗΣ ΤΕΧΝΙΚΗΣ ΚΑΙ ΕΠΑΓΓΕΛΜΑΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ.
ΛΕΞΙΚΟ ΟΡΩΝ.
Ορισμός της έννοιας αλγόριθμος, πρόγραμμα Σχεδιασμός απλών αλγορίθμων
ΕΓΚΑΤΑΣΤΑΣΕΙΣ ΑΣΘΕΝΩΝ ΡΕΥΜΑΤΩΝ
ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ
Το Υλικό του Υπολογιστή
ΜΕΤΑΣΧΗΜΑΤΙΣΤΕΣ.
Σχεδιασμός e-learning – Παιδαγωγική διάσταση
6.8 Εντολή Αναζήτησης και Εφαρμογή Φίλτρων
ΜΕΛΕΤΗ ΤΗΣ ΕΥΘΥΓΡΑΜΜΗΣ ΟΜΑΛΑ ΕΠΙΤΑΧΥΝΟΜΕΝΗΣ ΚΙΝΗΣΗΣ
أثر بعض استراتيجيات حل المشكلات الرياضية وتكوينها
التردد حركة دائرية سرعة محيطية سرعة زاوية راديان
ΦΥΛΕΤΙΚΟΣ ΔΙΜΟΡΦΙΣΜΟΣ ΕΓΚΕΦΑΛΟΥ
Βασικές έννοιες (Μάθημα 1) Τίτλος: Μερικές βασικές έννοιες της Πληροφορικής 22/11/2018 Ξένιος Αντωνιάδης.
ΠΕΡΙΓΡΑΜΜΑ ΕΝΗΜΕΡΩΣΗΣ
الاهتزازات والموجــات
Τέστ Μπανάνας Test de la banane: Κάνε κλίκ!.
Τράπεζα Τροφίμων Food Bank   Οι Εκκλησίες της Ελληνικής Κοινότητας Τορόντο διοργανώνουν για 4η συνεχή χρονιά Τράπεζα Τροφίμων   Η συλλογή τροφίμων έχει.
Προβλήματα του υπολογιστικού συστήματος και η αντιμετώπιση τους
Μάθημα [GD3021]: ΑΝΑΛΥΣΗ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΩΝ ΚΑΤΑΣΤΑΣΕΩΝ
Διαδικασία συλλογής των δεδομένων – Δειγματοληψία Απώτερος στόχος η διερεύνηση των σχέσεων μεταξύ μεταβλητών και παραγωγή γνώσης με το σχήμα «αίτιο – αποτέλεσμα».
1.
Καθηγητής Γεώργιος Ευθύμογλου
ΛΟΓΙΣΜΙΚΟ/SOFTWARE ΨΕΠ
ΜΙΑ ΝΕΑ ΕΠΟΧΗ ΓΙΑ ΤΗΝ ΚΩΔΙΚΟΠΟΙΗΣΗ ΚΑΙ ΑΝΑΜΟΡΦΩΣΗ ΤΗΣ ΝΟΜΟΘΕΣΙΑΣ
Η Ένταση του Ηλεκτρικού Πεδίου – Δυναμικές Γραμμές.
ΑΝΤΙΓΟΝΙΔΕΣ.
Φαινόμενα και θεσμοί του ελληνιστικού κόσμου
(ALPHA BANK – EUROBANK – ΤΡΑΠΕΖΑ ΠΕΙΡΑΙΩΣ)
Μεταγράφημα παρουσίασης:

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Σύγκριση των μοντέλων LPC και Filter Bank αναγνώρισης ομιλίας από ανεξάρτητο ομιλητή. Σπουδάστρια: Μωυσίδου Ελπίδα Επιβλέπων Καθηγητής: Δρ. Αθανασίου Μιχαήλ Ιανουάριος 2012

ΣΚΟΠΟΣ ΤΗΣ ΠΤΥΧΙΑΚΗΣ ΕΡΓΑΣΙΑΣ Σκοπός της εργασίας είναι η σύγκριση των μοντέλων Filter Bank και LPC αναγνώριση ομιλίας από ανεξάρτητο ομιλήτη.

ΠΕΡΙΕΧΟΜΕΝΑ Μέθοδος Filter bank και LPC-Βασική Θεωρία Πειραματικά αποτελέσματα για 10 μονοψήφιους αριθμούς και 10 ονόματα από τις μεθόδους Filter bank και LPC Σύγκριση αποτελεσμάτων των μεθόδων Filter bank και LPC Ανακεφαλαίωση συμπεράσματα

Η κυματομορφή του σήματος που αντιστοιχεί στη λέξη «Τέσσερα» Μέθοδος Filter bank και LPC-Βασική Θεωρία Περιβάλλον CoolEdit Η κυματομορφή του σήματος που αντιστοιχεί στη λέξη «Τέσσερα»

Μέθοδος Filter bank και LPC-Βασική Θεωρία Δημιουργία frames Το αρχικό σήμα χωρίζεται σε frames Ν=240 δειγμάτων το καθένα. Ένα frame προκύπτει από τη μετατόπιση του προηγούμενου κατά M=80 δείγματα

Μεθοδος Filter bank και LPC-Βαςικη Θεωρια ιδανικο ζωνοπερατο φιλτρο

Μέθοδος Filter bank και LPC-Βασική Θεωρία Σε κάθε frame εφαρμόζεται το filter bank. Το filter bank αποτελείται από Q=15 φίλτρα με εύρος συχνοτήτων 200 Hz το καθένα. Η μικρότερη συχνότητα των καναλιών είναι 200 Hz και η μεγαλύτερη 3200 Hz. Η κρουστική απόκριση κάθε φίλτρου έχει k=80 όρους 1 200 400 2 600 3 800 4 1000 5 1200 6 1400 7 1600 8 1800 9 2000 10 2200 11 2400 12 2600 13 2800 14 3000 15 3200 Κανάλια συχνοτήτων

Μέθοδος Filter bank και LPC-Βασική Θεωρία ΔΗΜΙΟΥΡΓΙΑ ΠΡΟΤΥΠΟΥ Πρότυπο της λέξης Vector που αντιστοιχεί στο i frame X= x11 x12 … x1Q x21 x22 x2Q xP1 xP2 xPQ P: Σύνολο των frames

Πρότυπο της λέξης «Αριστοτέλης» Τα πρώτα 30 διανύσματα (vectors) από τα 110 συνολικά του προτύπου που αντιστοιχεί στη λέξη «Αριστοτέλης» 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 -3.97 -1.06 -1.03 -4.21 -5.50 -3.50 -0.53 -2.77 -3.37 -2.85 -4.58 -9.54 -8.33 -7.34 -6.22 -0.30 -1.07 -4.63 -5.18 -3.81 -0.22 -2.66 -2.69 -2.37 -3.85 -7.88 -7.77 -7.93 -5.79 -2.78 0.18 -0.91 -4.44 -5.28 -3.87 -0.27 -2.81 -3.36 -3.03 -4.18 -7.55 -9.34 -7.03 -5.75 -2.63 0.12 -1.02 -5.09 -5.76 -3.90 -0.77 -2.67 -3.41 -3.30 -8.01 -6.55 -6.61 -2.39 0.22 -2.20 -5.35 -6.57 -4.86 -0.24 -1.31 -3.29 -7.28 -6.47 -7.10 -2.13 -3.15 -6.17 -4.69 -1.45 -1.89 -3.17 -8.10 -8.49 -6.98 -7.20 -1.68 -6.18 -5.93 -4.78 -0.71 -3.18 -3.43 -6.31 -7.47 -8.90 -7.14 -7.48 -1.41 -3.24 -4.33 -5.44 -7.24 -0.98 -3.13 -3.46 -5.25 -8.41 -8.70 -8.42 -9.66 -1.34 -1.94 -5.27 -6.80 -5.90 -4.11 -3.38 -4.41 -8.45 -8.21 -8.22 -7.95 -1.36 -2.24 -8.58 -7.22 -6.26 -1.82 -2.25 -3.71 -5.08 -8.88 -9.44 -8.43 -7.87 -1.13 -2.64 -3.83 -8.40 -7.82 -2.21 -1.26 -2.80 -3.01 -4.92 -8.81 -8.86 -8.73 -8.08 -2.57 -4.52 -8.23 -7.84 -6.33 -3.21 -1.25 -2.38 -8.03 -8.04 -9.47 -0.81 -1.57 -7.33 -6.39 -5.84 -2.92 -1.70 -3.62 -3.92 -5.74 -8.62 -8.51 -10.29 -0.90 -2.17 -4.93 -6.88 -7.26 -6.00 -4.04 -1.76 -4.15 -4.39 -5.58 -8.84 -8.26 -8.85 -2.06 -5.48 -6.37 -8.02 -6.32 -4.28 -3.54 -5.86 -4.70 -9.20 -9.12 16 -2.74 -3.58 -5.66 -6.92 -8.19 -3.67 -4.72 -6.11 -6.38 -6.30 -8.11 -10.27 -10.15 -9.49 17 -2.41 -2.22 -6.48 -6.71 -8.56 -3.56 -3.68 -8.07 -7.05 -8.55 -9.26 -7.68 18 -2.84 -2.75 -6.86 -6.51 -5.42 -3.98 -5.82 -9.30 -9.22 -7.65 19 -3.77 -4.03 -5.62 -6.77 -7.72 -7.71 -4.54 -5.02 -5.83 -7.36 -7.41 -7.89 -7.13 -6.01 20 -3.47 -3.73 -7.09 -3.96 -3.10 -4.16 -6.59 -7.64 -5.87 -5.54 21 -4.56 -6.82 -7.62 -4.13 -5.70 -4.91 -6.70 -4.55 22 -5.94 -6.74 -6.68 -8.52 -7.44 -6.19 -6.64 -7.76 -6.45 23 -6.20 -8.24 -6.04 -6.43 -6.75 24 -4.45 -4.71 -6.29 -6.87 -9.13 -8.54 -7.42 -7.25 -7.54 -9.18 -8.39 -7.40 25 -3.79 -4.88 -6.72 -9.43 -7.69 -6.83 -7.06 -7.39 -7.07 -10.84 -10.07 -7.96 26 -6.54 -8.25 -8.57 -7.51 -7.29 -6.36 -7.99 -7.94 -8.89 -9.05 -7.90 -8.17 27 -5.46 -8.14 -7.83 -8.98 -8.47 -7.01 -7.56 -7.21 -7.37 -8.79 -7.08 -6.91 28 -6.28 -8.05 -7.75 -7.85 -9.19 -7.60 29 -6.52 -9.09 -8.18 -6.99 -7.11 -8.95 -9.01 -9.25 -6.09 30 -5.40 -7.70 -7.17 -8.59 -7.63 -7.52 -7.43 -8.06 -8.66 -8.30 Οκτώβριος 2010

Πρότυπο της λέξης «Μαρία» Τα πρώτα 17 διανύσματα από τα συνολικά 61 του προτύπου που αντιστοιχεί στη λέξη «Μαρία»   1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 -5.76 -8.99 -9.10 -9.43 -8.56 -10.77 -9.60 -9.22 -9.71 -9.52 -11.38 -11.10 -11.18 -11.29 -10.84 -5.21 -8.52 -9.87 -9.07 -8.68 -8.94 -9.56 -9.53 -9.95 -10.74 -10.91 -11.40 -10.81 -10.61 -12.34 -5.18 -7.39 -10.1 -8.36 -8.11 -8.22 -10.18 -9.78 -9.49 -8.85 -12.26 -11.17 -10.50 -11.16 -10.57 -5.73 -6.95 -8.61 -9.08 -8.41 -8.92 -9.98 -10.95 -11.53 -11.68 -11.14 -4.99 -6.98 -9.14 -9.13 -7.99 -7.54 -9.21 -10.07 -9.29 -10.06 -10.47 -11.88 -11.45 -10.62 -11.87 -5.52 -6.73 -6.96 -7.31 -6.66 -8.31 -9.44 -9.30 -9.94 -10.68 -11.50 -10.94 -10.69 -11.07 -4.51 -6.03 -4.73 -4.48 -4.12 -3.67 -5.24 -9.57 -9.15 -11.54 -11.39 -11.99 -5.12 -4.83 -3.84 -2.99 -3.39 -1.64 -3.42 -6.67 -10.11 -8.27 -10.64 -10.70 -10.54 -13.11 -4.75 -4.09 -3.60 -2.29 -4.24 -1.29 -2.09 -5.75 -8.70 -8.76 -9.67 -11.27 -11.76 -4.76 -3.26 -3.02 -2.32 -3.47 -1.94 -1.19 -5.03 -7.47 -8.35 -10.29 -12.06 -11.49 -11.08 -5.20 -2.98 -3.17 -2.53 -3.15 -0.60 -8.33 -8.74 -11.66 -9.66 -11.31 -10.93 -5.43 -2.73 -2.79 -2.42 -2.91 -2.20 -1.09 -3.72 -8.28 -10.90 -8.73 -10.48 -11.00 -5.46 -2.67 -2.66 -2.64 -2.77 -2.31 -0.73 -3.48 -9.03 -9.70 -10.27 -10.21 -5.88 -2.52 -2.01 -2.87 -0.47 -8.46 -8.19 -11.23 -11.06 -10.24 -6.00 -2.47 -1.62 -2.26 -0.31 -8.04 -8.08 -9.19 -10.04 -9.90 16 -6.43 -2.27 -2.19 -1.38 -2.76 -2.68 -0.25 -3.41 -7.28 -7.59 -9.47 -9.41 -10.13 -9.24 17 -5.68 -2.12 -1.30 -2.94 -3.46 -0.61 -3.30 -5.50 -6.40 -8.87 -10.56

Μέθοδος Filter bank και LPC-Βασική Θεωρία ΣΥΓΚΡΙΣΗ ΠΡΟΤΥΠΩΝ Χρονική ευθυγράμμιση και απόσταση προτύπων Έστω Χ, Υ δύο πρότυπα (πίνακες) που αντιστοιχούν σε δύο διαφορετικές λέξεις και Τx , Τy οι γραμμές των πινάκων Χ και Υ αντίστοιχα. Εφαρμογή της γραμμικής αντιστοίχησης των vectors στο χρόνο Απόσταση μεταξύ των προτύπων Χ και Υ Ευκλείδεια απόσταση

Παράδειγμα σύγκρισης προτύπων Μέθοδος Filter bank και LPC-Βασική Θεωρία Παράδειγμα σύγκρισης προτύπων Έστω Υ πρότυπο της λέξης «Αριστοτέλης» της 12ης βάσης   -3.97 -1.06 -1.03 -4.21 -5.50 -3.50 -5.34 -2.77 -3.37 -2.85 -4.58 -9.54 -8.33 -7.34 -6.22 -5.21 -8.52 -9.87 -9.07 -8.68 -8.94 -9.56 -9.53 -9.95 -10.74 -10.91 -11.40 -10.81 -10.61 -12.34 … -1.08 -1.77 -9.13 -8.53 -9.33 -8.31 -9.26 -8.84 -9.86 -8.71 -1.16 -1.17 -1.21 -1.31 -1.20 y110 Έστω Χ πρότυπο της λέξης «Μαρία» της βάσης test   -2,8 -4,5 -3,5 -3,6 -2,4 -3,8 -3,7 -4,9 -8,2 -5,9 -6,2 -7,6 -8,1 -8,6 -5.21 -8.52 -9.87 -9.07 -8.68 -8.94 -9.56 -9.53 -9.95 -10.74 -10.91 -11.40 -10.81 -10.61 -12.34 … -1.08 -1.77 -9.13 -8.53 -9.33 -8.31 -9.26 -8.84 -9.86 -8.71 -1.16 -1.17 -1.21 -1.31 -1.20 x61

Μέθοδος Filter bank και LPC-Βασική Θεωρία Για Τx=61 και Τy =110είναι: Εύρεση των ζευγών ( ix , iy ) των γραμμών που θα συγκριθούν Εύρεση της απόστασης μεταξύ των προτύπων Χ και Υ Η απόσταση αυτών των δύο προτύπων είναι: D=1.45 ix 1 2 3 4 5 6 7 8 9 10 … 60 61 iy 12 14 16 18 108 110

ΜΟΝΤΕΛΟ L.P.C. ΓΙΑ ΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΦΩΝΗΣ Μέθοδος Filter bank και LPC-Βασική Θεωρία ΜΟΝΤΕΛΟ L.P.C. ΓΙΑ ΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΦΩΝΗΣ Παρέχει ένα καλό μοντέλο του σήματος ομιλίας. Μαθηματικά ακριβής μέθοδος και απλή στην εφαρμογή της σε software και hardware Αναπαράσταση του σήματος με λίγα χαρακτηριστικά – Καλύτερη συμπίεση Μικρότερο υπολογιστικό κόστος από άλλες μεθόδους όπως Filter-bank

ΜΟΝΤΕΛΟ L.P.C Μέθοδος Filter bank και LPC-Βασική Θεωρία Mια τιμή (sample) ενός σήματος στο χρόνο, την χρονική στιγμή n μπορεί να προσεγγισθεί ως γραμμικός συνδυασμός των ‘p’ προηγούμενων δειγμάτων Εύρεση συντελεστών

Η ίδια διαδικασία ηχογράφησης εφαρμόστηκε και για δέκα ονόματα. Πειραματικά αποτελέσματα για 10 μονοψήφιους αριθμούς και 10 ονόματα από τις μεθόδους Filter bank και LPC Ηχογραφήθηκαν οι αριθμοί 0 έως 9, σαράντα φορές ο καθένας, και ταξινομήθηκαν σε 40 αντίστοιχες βάσεις. Η ίδια διαδικασία ηχογράφησης εφαρμόστηκε και για δέκα ονόματα. Η ηχογράφηση έγινε από σαράντα διαφορετικούς ομιλητές. Για την ηχογράφηση επιλέχθηκε η συχνότητα δειγματοληψίας των 8000 Hz. ΗΧΟΓΡΑΦΗΣΗ ΛΕΞΕΩΝ

Πειραματικά αποτελέσματα για 10 μονοψήφιους αριθμούς και 10 ονόματα από τις μεθόδους Filter bank και LPC Η ίδια διαδικασία επαναλαμβάνεται για την εύρεση των αποστάσεων των αριθμών της βάσης test από τους αριθμούς των άλλων 39 βάσεων που αντιστοιχούν σε 39 άτομα. Οπότε προκύπτουν συνολικά 40 διαφορετικοί πίνακες όμοιοι με τον πίνακα της προηγούμενης διαφάνειας. Από αυτούς τους πίνακες με την εφαρμογή κατάλληλου προγράμματος βρίσκονται οι αποστάσεις του προτύπου ενός αριθμού της βάσης test από τα αντίστοιχα πρότυπα των αριθμών 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 των 40 ατόμων.

Στον παρακaτω filter bank πινακα δειχνονται οι αποςταςεις του αριθμου τεςςερα της βαςης τεςςερα απο τα προτυπα των αριθμων της γενικης βαςης βα των αριθμων των ςαραντα ατομων για ευρος παραθυρου Ν=120.   μηδέν ένα δύο τρία τέσσερα πέντε έξι εφτά οχτώ εννιά Άτομο1 1,11 0,99 1,23 1,14 1,02 0,90 1,26 1,03 1,06 0,98 Άτομο2 0,96 0,94 0,93 0,81 0,80 0,78 0,82 Άτομο3 0,89 1,16 0,84 1,17 0,88 0,92 Άτομο4 1,12 1,05 0,68 0,67 0,83 Άτομο5 1,22 1,09 1,01 1,04 Άτομο6 0,95 0,85 1,00 Άτομο7 0,73 1,08 Άτομο8 1,30 1,31 1,15 1,07 Άτομο9 1,29 1,21 1,18 0,87 1,13 Άτομο10 Άτομο11 0,86 0,91 0,97 Άτομο12 Άτομο13 Άτομο14 1,20 Άτομο15 0,76 Άτομο16 1,43 1,10 1,34 Άτομο17 Άτομο18 1,27 1,28 Άτομο19 Άτομο20 1,41 1,25 1,19

τέσσερα μηδέν ένα δύο τρία πέντε έξι εφτά οχτώ εννέα Άτομο21 Άτομο22 1,26 1,04 1,19 1,13 0,90 0,86 1,08 1,18 1,03 Άτομο22 1,24 0,93 1,25 1,20 0,82 0,84 1,09 1,06 1,07 Άτομο23 1,16 0,89 0,85 1,02 0,98 1,00 Άτομο24 0,88 0,95 Άτομο25 0,99 0,83 0,81 1,11 Άτομο26 1,15 1,01 0,96 1,10 Άτομο27 0,91 0,80 0,97 0,75 Άτομο28 1,14 0,94 Άτομο29 0,78 Άτομο30 1,12 0,87 1,17 Άτομο31 1,23 Άτομο32 0,76 Άτομο33 1,21 1,05 Άτομο34 1,29 Άτομο35 Άτομο36 Άτομο37 0,70 0,79 Άτομο38 1,28 Άτομο39 0,92 0,73 Άτομο40 0,77

Αποςταςεις του προτυπου αριθμου τεςςερα της βαςης τεςτ απο τα προτυπα των αριθμων της γενικης βαςης των αριθμων των 40 ατομων για ευρος παραθυρου Ν=120 μηδέν ένα δύο τρία τέσσερα πέντε έξι εφτά οχτώ εννέα 0,91 0,80 0,92 0,93 0,68 0,67 0,83 0,78 0,82 0,96 0,94 0,70 0,73 0,88 1,00 0,85 0,95 0,75 0,79 1,02 0,86 0,98 0,99 0,87 0,97 0,76 0,89 1,03 0,77 1,05 1,06 1,01 1,07 0,81 1,08 0,90 1,09 1,10 1,11 1,12 1,15 1,04 1,16 1,13 0,84 1,14 1,17

Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «Τεςςερα» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=120. Βάση αριθμών σαράντα ατόμων για N=120 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Μηδέν 0,91 0,937 0,97 1,02 Ένα 0,8 0,83 0,85 Δύο 0,92 0,931 0,94 1 Τρία 0,93 0,934 Τέσσερα 0.68 0,71 0,75 Πέντε 0,67 0,7 0,72 0,76 Έξι 0.83 0,86 0,96 Εφτά 0,81 0,87 Οχτώ 0,78 Εννιά 0,82 0,84 0,88

Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «Τεςςερα» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=240. Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Μηδέν 1.15 1.16 1.19 1.29 Ένα 1.17 1.20 Δύο 1.33 1.39 1.45 Τρία 0.91 0.99 1.10 Τέσσερα 0.94 0.96 1.01 1.05 Πέντε 1.1 1.11 1.13 1.14 Έξι 1.04 1.21 Εφτά 1.24 1.28 Οχτώ 1.08 Εννιά

Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «Τεςςερα» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=360. Βάση αριθμών σαράντα ατόμων για N=360 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Μηδέν 1,47 1,5 1,59 1,25 Ένα 1,23 1,28 1,32 1,37 Δύο 1,41 1,46 1,54 1,68 Τρία 1,45 1,48 1,53 Τέσσερα 1,09 1,13 1,17 Πέντε 1,2 1,24 Έξι 1,40 1,4 1,63 Εφτά 1,21 1,27 1,31 1,42 Οχτώ 1,34 Εννιά 1,35

Στον πινακα LPC παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «Τεςςερα» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=240. Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο.των δύο μικρότερων αποστάσεων τεσσάρων μικρότερων αποστάσεων δέκα μικρότερων Μηδέν 0,15 0,16 Ένα 0,14 Δύο Τρία 0,17 Τέσσερα 0,11 0,12 Πέντε Έξι Εφτά Οχτώ 0,13 Εννιά

Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «αριςτοτελης» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=120. Βάση αριθμών σαράντα ατόμων για N=120 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Αγγελική 0,74 0,79 0,83 0,89 Γιάννης 0,78 0,8 0,82 0,87 Αφροδίτη 0,99 1 1,03 Πλάτωνας 0,94 0,95 0,97 1,02 Ελένη 0,85 0,93 Αριστοτέλης 0,63 0,64 0.65 0.69 Μαρία 1. 1,10 Τάσος 0,91 Αθηνά 0,86 0,88 Μιχάλης 0,98 1,04

Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «αριςτοτελης» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=240. Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Αγγελική 0.97 1.03 1.07 Γιάννης 0.95 1.05 1.15 1.22 Αφροδίτη 0.93 0.98 1.04 Πλάτωνας 1.16 1.17 1.19 1.21 Ελένη 1.02 1.08 Αριστοτέλης 0.74 0.79 0.84 0.87 Μαρία 1.25 1.34 1.44 1.52 Τάσος 1.14 Αθηνά 1.18 Μιχάλης 1.09

Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «αριςτοτελης» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=360. Βάση αριθμών σαράντα ατόμων για N=360 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Αγγελική 1 1,14 1,22 Γιάννης 1,04 1,11 Αφροδίτη 1,17 1,18 1,25 Πλάτωνας 1,23 1,24 1,3 Ελένη 1,12 1,13 1,2 Αριστοτέλης 0,93 0,94 0,97 Μαρία 1,27 1,28 1,34 Τάσος 1,15 1,19 1,26 Αθηνά 1,07 1,1 Μιχάλης 1,29 1,35

Στον πινακα LPC παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «αριςτοτελης» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=240 Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Aθηνά 0,17 0,18 Αριστοτέλης 0,10 0,11 Αγγελική 0,15 0,16 Αφροδήτη 0,12 0,13 Ελένη Γιάννης 0,19 Μαρία Μιχάλης Πλάτωνας Τάσος 0,20

Στον πινακα filter bank παρουςιαζονται τα αποτελεςματα της μικροτερης αποςταςης καθως και ο μεςος ορος των δυο ,πεντε και δεκα μικροτερων αποςταςεων των προτυπων της λεξης «Τεςςερα» kai «αριςτοτελης» της βαςης test των αριθμων και ονοματων απο τα αντιςτοιχα προτυπα των γενικων βαςεων, με Ν=240 kai nf=4. Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Μηδέν 2,05 2,13 2,29 2,37 Ένα 1,69 1,79 1,86 1,96 Δύο 2,42 2,55 2,65 2,73 Τρία 1,48 1,51 1,71 1,87 Τέσσερα 1,20 1,29 1,52 1,73 Πέντε Έξι 2,57 2,61 2,74 Εφτά 2,19 2,22 2,35 Οχτώ 2,08 2,14 2,18 2,32 Εννιά Βάση αριθμών σαράντα ατόμων για N=240 Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Αγγελική 2,36 1,98 2,05 2,68 Γιάννης 2,35 1,85 1,93 2,55 Αφροδίτη 2,19 2 2,12 2,71 Πλάτωνας 2,14 2,09 2,11 2,57 Ελένη 1,84 1,9 2,58 Αριστοτέλης 1,34 1,37 2,26 Μαρία 1,92 1,97 Τάσος 1,75 1,89 Αθηνά 1,91 2,02 2,63 Μιχάλης 2,28 2,33 2,39 2,88

ΣΥΓΚΡΙΣΗ ΤΩΝ ΜΕΘΟΔΩΝ FILTER BANK ΚΑΙ LPC ΣΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΤΗΣ ΛΕΞΗΣ ΤΕΣΣΕΡΑ-%ςφαλμα   Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Filter Bank για Ν=120 και nf=15 - 2,94 1,4 1,33 Filter Bank για Ν=240 3,12 8,9 8,57 Filter Bank για Ν=360 2,65 0,81 και nf=4 23,3 16,27 12,5 8,09 LPCγια Ν=240 και Q=15 18,2 27,2 25

ΣΥΓΚΡΙΣΗ ΤΩΝ ΜΕΘΟΔΩΝ FILTER BANK ΚΑΙ LPC ΣΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΤΗΣ ΛΕΞΗΣ αριςτοτελης- %ςφαλμα   Τιμές μικρότερης απόστασης Μ.Ο. των δύο μικροτέρων αποστάσεων των πέντε μικροτέρων αποστάσεων των δέκα μικροτέρων αποστάσεων Filter Bank για Ν=120 και nf=15 17,4 23,4 26,15 26 Filter Bank για Ν=240 25,6 22,7 21,4 2,29 Filter Bank για Ν=360 19,35 20,4 1,06 23,7 και nf=4 30,5 38 38,6 LPCγια Ν=240 και Q=15 20 18,1

ΣΥΜΠΕΡΑΣΜΑΤΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΜΕΘΟΔΩΝ FILTER BANK ΚΑΙ LPC ΓΙΑ ΑΡΙΘΜΟΥΣ Ανάμεσα στις μεθόδους Filter Bank και LPC η μέθοδος που δίνει τα καλύτερα αποτελέσματα είναι η μέθοδος LPC με Ν=240 Στη μέθοδο Filter Bank με nf=15 και nf=4 τα καλύτερα αποτελέσματα τα έχω για nf=4 και Ν=240 Στη μέθοδο Filter Bank με nf=15 και Ν=120,Ν=240 και Ν=360 τα καλύτερα αποτελέσματα τα έχω για Ν=240

ΣΥΜΠΕΡΑΣΜΑΤΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΜΕΘΟΔΩΝ FILTER BANK ΚΑΙ LPC ΓΙΑ ΟΝΟΜΑΤΑ Ανάμεσα στις μεθόδους Filter Bank και LPC η μέθοδος που δίνει τα καλύτερα αποτελέσματα είναι η μέθοδος Filter Bank με Ν=240 και nf=4 Στη μέθοδο Filter Bank με nf=15 και nf=4 τα καλύτερα αποτελέσματα τα έχω για nf=4 και Ν=240 Στη μέθοδο Filter Bank με nf=15 και Ν=120,Ν=240 και Ν=360 τα καλύτερα αποτελέσματα τα έχω για Ν=240

Ποια βαςη εχει μεγαλυτερη αναγνωριςιμοτητα οι αριθμοι η τα ονοματα? Την μεγαλήτερη αναγνωρισιμότητα την έχει η βάση με τα ονόματα

ΑΝΑΚΕΦΑΛΑΙΩΣΗ ΚΑΙ ΣΥΜΠΕΡΑΣΜΑΤΑ Εφαρμόστηκε η μέθοδος filter bank και LPC για αναγνώριση ξεχωριστών λέξεων από σαράντα διαφορετικούς ομιλητές. Ο έλεγχος των μεθόδων έγινε για δύο κατηγορίες δεδομένων αποτελούμενες από 10 αριθμούς και 10 ονόματα. Δεν υπήρχε λανθασμένη αναγνώριση λέξης τόσο για τους αριθμούς όσο και για τα ονόματα. Διαπιστώθηκε ότι μεγαλύτερη αναγνωρισιμότητα από την εφαρμογή αυτή είχαν οι λέξεις των ονομάτων. Επίσης είναι φανερό πως στη μέθοδο Filter Bank τη μεγαλύτερη αναγνωρισιμότητα έχουν τα ονόματα για Ν=240, ενώ για Ν=120 και Ν=360 το ποσοστό αναγνωρισιμότητας για τους αριθμούς και τα ονόματα είναι το ίδιο.

Διαπιστώθηκε ότι οι μεθόδοι Filter bank και LPC για την αναγνώριση ξεχωριστών λέξεων από ανεξάρτητο ομιλητή είναι αποτελεσματικές. Ακόμη σε αυτή την εργασία εφαρμόστηκαν οι μέθοδοι Filter Bank και LPC για την αναγνώριση λέξεων που εκφωνήθηκαν από μια συγκεκριμένη γυναίκα. Τα πρότυπα των λέξεων αυτών συγκρίθηκαν με τα αντίστοιχα πρότυπα των λέξεων που εκφωνήθηκαν από 40 άτομα. Όμως από τα 40 αυτά άτομα μόνο 19 ήταν γυναίκες.Στη μέθοδο Filter Bank τα αποτελέσματα αναμένεται να είναι καλύτερα όσο μεγαλύτερο είναι το ποσοστό γυναικών στα 40 άτομα ενώ στη μέθοδο LPC θα είχαμε καλύτερα αποτελέσματα αν στη γενική βάση είχαμε περισσότερους άνδρες

ΠΑΡΟΥΣΙΑΣΗ ΚΑΙ ΣΥΓΚΡΙΣΗ ΚΥΜΑΤΟΜΟΡΦΩΝ ΔΙΑΦΟΡΕΤΙΚΩΝ ΛΕΞΕΩΝ ρι στο τέ λης Μη δ έ ν α) Κυματομορφή της λέξης «Αριστοτέλης» της 1ης βάσης των ονομάτων β) Κυματομορφή της λέξης «Μηδέν» της 1ης βάσης των αριθμών Μα Τέ σσ ε ρ α ρί α γ) Κυματομορφή της λέξης «Μαρία» της 1ης βάσης των ονομάτων δ) Κυματομορφή της λέξης «Τέσσερα» της 1ης βάσης των αριθμών