Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Επεξεργασία Ομιλίας & Ήχου

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Επεξεργασία Ομιλίας & Ήχου"— Μεταγράφημα παρουσίασης:

1 Επεξεργασία Ομιλίας & Ήχου
Ενότητα # 2: Εισαγωγή στην Επεξεργασία Σήματος Ιωάννης Καρύδης Τμήμα Πληροφορικής

2 Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς.

3 Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα Ιονίου Πανεπιστημίου» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους.

4 Εργασία 1η Πρώτη εργασία
Σύντομη παρουσίαση (15 διαφάνειες) μιας εφαρμογής Επεξεργασίας Ομιλίας. Για τον σκοπό αυτό θα πρέπει να γίνει ανάλυση ορισμένων παραμέτρων όπως Είδος της εφαρμογής (πχ αναγνώριση ομιλίας, αναγνώριση ομιλητή) Στόχος, λειτουργίες και χρήστες της εφαρμογής (π.χ. ψυχαγωγία, εκπαίδευση, βιομηχανία) Συσκευές εισόδου και εξόδου (τηλέφωνο, μικρόφωνο) Βασικές ενέργειες του χρήστη (τρόπος χρήσης) Παραδείγματα και σενάρια λειτουργίας. Αρχίστε την έρευνα για να βρείτε την εφαρμογή Επεξεργασίας Ομιλίας που θα παρουσιάσετε από τώρα! Η παρουσίαση θα γίνει στο μάθημα της 13ης Απριλίου Θα είναι μια 15λεπτη παρουσίαση με PowerPoint Καταληκτική ημερομηνία παράδοσης των αρχείων των παρουσιάσεων: Δευτέρα 12 Απριλίου, 23:59

5 Τι θα δούμε σήμερα Εισαγωγή στην ψηφιακή επεξεργασία σήματος
Τι είναι διακριτό σήμα και τι διακριτό σύστημα Μετασχηματισμός Fourier Δειγματοληψία και ψηφιοποίηση σήματος

6 Εισαγωγή στην Επεξεργασία Σήματος

7 Ψηφιακή επεξεργασία σήματος. Γιατί;
Η ομιλία είναι ένα ακουστικό σήμα. Μια τοπική διαταραχή στην πυκνότητα του αέρα που διαδίδεται ως ακουστικό κύμα Για να την επεξεργαστούμε στον υπολογιστή πρέπει να την μετατρέψουμε σε ηλεκτρικό σήμα και μάλιστα ψηφιακό Εδώ υπεισέρχεται η ψηφιακή επεξεργασία σήματος

8 Ψηφιακή επεξεργασία σήματος. Γιατί;
Τι μας προσφέρει η ψηφιακή επεξεργασία σήματος; Μας καθορίζει πως μπορούμε να μετατρέψουμε το σήμα από αναλογικό σε ψηφιακό Μας παρέχει μεθόδους για να βελτιώσουμε το σήμα (αφαίρεση θορύβου, αλλοιώσεων, παραμορφώσεων) Επιτρέπει μετασχηματισμούς ενός σήματος (φίλτρα) που θα μας βοηθήσουν στην επεξεργασία του Συνεισφέρει στην συμπίεση ενός σήματος για την μετάδοση/αποθήκευση του

9 Διαδικασία παραγωγής ψηφιακού σήματος
Μετατροπή αναλογικού σήματος σε ψηφιακό Παραγωγή ακουστικού σήματος Μετατροπή ακουστικού σήματος σε ηλεκτρικό σήμα (αναλογικό) Ψηφιακή επεξεργασία σήματος

10 Τι είναι σήμα; Τι είναι «σήμα»;
Σήμα είναι μια ποσότητα που μεταβάλλεται σε συνάρτηση με κάτι άλλο (μια μεταβλητή). Παράδειγμα χρόνος, απόσταση κλπ Σήμα είναι το ηλεκτρικό ρεύμα (μεταβολή τάσης σε σχέση με χρόνο) Σήμα είναι η μουσική (μεταβολή πίεσης αέρα σε σχέση με χρόνο) Πώς μοιάζει ένα σήμα; ποσότητα μεταβλητή

11 Τι είναι αναλογικό σήμα;
Πως αναπαριστούμε μαθηματικά ένα σήμα; Ως συνάρτηση μιας ανεξάρτητης μεταβλητής t : x(t). Συχνά η μεταβλητή t αναπαριστά χρόνο. Δίνοντας τιμές στην μεταβλητή t παίρνουμε τιμές x για το σήμα μας Η t μπορεί να συνεχούς χρόνου (να παίρνει δηλαδή κάθε δυνατή τιμή) οπότε το σήμα μας είναι συνεχές (αναλογικό). x(t) t

12 Τι είναι διακριτό σήμα;
Η μεταβλητή t μπορεί να είναι διακριτού χρόνου (παράδειγμα κάθε λεπτό, κάθε ώρα) οπότε το σήμα μας είναι διακριτό (δηλαδή ψηφιακό). Στην περίπτωση αυτή η συνάρτηση x(t) ορίζεται μόνο σε διακριτές χρονικές στιγμές Οι διακριτές τιμές του t αναπαριστούν ουσιαστικά μια ακολουθία τιμών με αποτέλεσμα το ίδιο το σήμα x(t) να αποτελεί μια ακολουθία τιμών η οποία απεικονίζεται ως x(n), όπου n είναι ακέραιος. x(n) n

13 Ταξινόμηση σημάτων Ψηφιακό σήμα : Πρόκειται για το σήμα διακριτού χρόνου x(n) που μπορεί να λάβει μόνο ένα πεπερασμένο πλήθος διακριτών τιμών Αναλογικό σήμα : Πρόκειται για το σήμα συνεχούς χρόνου x(t) που μπορεί να λάβει όλες τις τιμές ενός διαστήματος τιμών (α,β) Το α μπορεί να είναι -∞ και το β μπορεί να είναι +∞, το διάστημα δηλαδή μπορεί να καλύπτει όλο το εύρος των αριθμών. Στη φύση τα περισσότερα σήματα είναι αναλογικά Ένα αναλογικό σήμα μπορεί να μετατραπεί σε ψηφιακό με δειγματοληψία (sampling) και κβαντισμό (quantisation)

14 Ταξινόμηση σημάτων Νομοτελειακά και Τυχαία
Νομοτελειακά : Είναι τα σήματα εκείνα των οποίων οι τιμές είναι πλήρως καθορισμένες αναφορικά με τον χρόνο. Μπορούν να αναπαρασταθούν με γνωστές συναρτήσεις Τυχαία : Είναι τα σήματα εκείνα των οποίων οι τιμές είναι τυχαίες για μια δεδομένη χρονική στιγμή. Τα χαρακτηριστικά τους μπορούν να μελετηθούν με στατιστικό τρόπο Άρτια και Περιττά Άρτια : Είναι τα σήματα για τα οποία ισχύει: x(-t) = x(t) x(-n) = x(n) Περιττά : Είναι τα σήματα για τα οποία ισχύει: x(-t) = -x(t) x(-n) = -x(n)

15 Ταξινόμηση σημάτων Περιοδικά και Μη-Περιοδικά
Περιοδικά: Ένα σήμα συνεχούς χρόνου x(t) είναι περιοδικό με περίοδο Τ αν υπάρχει μια θετική (μη μηδενική) τιμή του Τ ώστε να ισχύει x(t+Τ)=x(t), για όλα τα t Η μικρότερη τιμή του Τ για την οποία είναι ένα σήμα περιοδικό, ονομάζεται θεμελιώδης περίοδος και συμβολίζεται με Τ0 Μη περιοδικά : Οποιοδήποτε σήμα δεν είναι περιοδικό

16 Ταξινόμηση σημάτων Περιοδικά σήματα Συχνότητα f a T t Συχνότητα f’=2f
Τα περιοδικά σήματα χαρακτηρίζονται από την συχνότητα f = (1/T) και πλάτος τους a Συχνότητα f a T t Συχνότητα f’=2f a T/2 t

17 Χρήσιμα διακριτά σήματα
Υπάρχουν μερικά είδη διακριτών σημάτων με χρήσιμες ιδιότητες Συνάρτηση μοναδιαίου βήματος. Ορίζεται ως u(n) = 1 αν n >= 0 u(n) = 0 αν n < 0 Συνάρτηση μοναδιαίου βήματος μετατοπισμένη κατά k. Ορίζεται ως u(n-k) = 1 αν n >= k u(n-k) = 0 αν n < k k θετικό, μετατόπιση προς τα δεξιά k αρνητικό, μετατόπιση προς τα αριστερά

18 Χρήσιμα διακριτά σήματα
Κρουστικός Παλμός : Πρόκειται για την συνάρτηση δ(n) η οποία ορίζεται ως δ(n) = 1, n=0 δ(n) = 0, n≠0 Κρουστικός Παλμός Μετατοπισμένος κατά k : Πρόκειται για τη συνάρτηση δ(n-k) η οποία ορίζεται ως δ(n-k)=1, n=k δ(n-k)=0, n≠k k θετικό, μετατόπιση προς τα δεξιά k αρνητικό, μετατόπιση προς τα αριστερά

19 Χρήσιμα διακριτά σήματα
Ο κρουστικός παλμός δ(n) έχει πολύ μεγάλη εφαρμογή στην επεξεργασία σημάτων Φανταστείτε ότι έχετε ένα διακριτό σήμα {x[n]} και θέλετε να απομονώσετε την τιμή του την χρονική στιγμή n=2. Αυτό γίνεται εύκολα πολ/ντας το σήμα με την ακολουθία {δ[n-2]} {y[n]} = {x[n]} {δ[n-2]} H νέα ακολουθία {y[n]} θα έχει κάθε τιμή 0 εκτός από την χρονική στιγμή n=2 στη οποία η τιμή της θα είναι x[2] Κατ’ επέκταση:

20 Ενέργεια σήματος Η ενέργεια ενός διακριτού σήματος ορίζεται ως
Δηλαδή υψώνουμε στο τετράγωνο και αθροίζουμε όλες τις τιμές της ακολουθίας του σήματος Αν Ε < ∞ τότε το σήμα καλείται πεπερασμένης ενέργειας Η ενέργεια ενός ακουστικού σήματος (ομιλία, μουσική) εκφράζει πόσο δυνατά αντιλαμβανόμαστε το ακουστικό σήμα.

21 Πράξεις διακριτών σημάτων
Μπορούμε να ορίσουμε μερικές απλές πράξεις μεταξύ διακριτών σημάτων Πολ/μός με αριθμό (κλιμάκωση πλάτους) Α{x[n]} = {Ax[n]} : πολ/με τον αριθμό με κάθε στοιχείο της ακολουθίας Πρόσθεση σημάτων {x[n]} + {y[n]} = { x[n] + y[n] } : προσθέτουμε κάθε αντίστοιχο ζεύγος στοιχείων Πολ/μός σημάτων {x[n]} . {y[n]} = { x[n] . y[n] } : πολ/με κάθε αντίστοιχο ζεύγος στοιχείων Χρονική ολίσθηση σήματος κατά k {y[n]} = {x[n-k]} Αν k > 0 το σήμα {x[n]} ολισθαίνει k θέσεις δεξιά Αν k < 0 το σήμα {x[n]} ολισθαίνει k θέσεις αριστερά Ανάκλαση σήματος {y[n]} = {x[-n]} : αντικαθιστούμε το n με το -n

22 Διακριτά Συστήματα

23 Τι είναι «Διακριτό Σύστημα»;
Διακριτό Σύστημα ονομάζουμε μια διεργασία που μετατρέπει μια διακριτή ακολουθία εισόδου {x[n]} σε μια διακριτή ακολουθία εξόδου {y[n]} Ένα διακριτό σύστημα συμβολίζεται ως {y[n]} = Τ [ {x[n]} ] Παράδειγμα διακριτού συστήματος : Τ Σήμα εισόδου Σήμα εξόδου

24 Ταξινόμηση διακριτών συστημάτων
Τα συστήματα διακριτού χρόνου μπορούν να ταξινομηθούν ως εξής: Στατικά – Δυναμικά Στατικό (χωρίς μνήμη) καλούμε ένα σύστημα στο οποίο η έξοδος την χρονική στιγμή n εξαρτάται μόνο από την είσοδο την ίδια χρονική στιγμή y[n] = A x[n] πχ y[n] = x2[n] Δυναμικό καλούμε ένα σύστημα το οποίο δεν πληρεί την παραπάνω συνθήκη πχ y[n] = x[n] + x[n-2] Γραμμικά – Μη γραμμικά Ένα διακριτό σύστημα καλείται γραμμικό αν Τ[ {a1x1[n]} + {a2x2[n]} ] = a1T[ {x1[n]} ] + a2T[ {x2[n]} ] Διαφορετικά είναι μη γραμμικό

25 Ταξινόμηση διακριτών συστημάτων
Τα συστήματα διακριτού χρόνου μπορούν να ταξινομηθούν ως εξής: Χρονικά αμετάβλητα – Χρονικά μεταβαλλόμενα Χρονικά αμετάβλητο καλούμε ένα σύστημα για το οποίο ισχύει {y[n]} = T[ {x[n]} ] → {y[n-k]} = T[ {x[n-k]} ] για κάποια ολίσθηση k Διαφορετικά καλείται χρονικά μεταβαλλόμενο

26 Διδιάστατα Διακριτά Συστήματα
Ένα γραμμικό και χρονικά αμετάβλητο σύστημα ορίζεται από την κρουστική του απόκριση h(n) (impulse response) Αν η κρουστική απόκριση ενός συστήματος είναι γνωστή, τότε y(n) = x(n) * h(n) Η κρουστική απόκριση είναι και αυτή μια διακριτή συνάρτηση. Μπορεί πχ να είναι ένα φίλτρο που καθαρίζει το θόρυβο Η πράξη που συσχετίζει το σήμα εισόδου με την κρουστική απόκριση του συστήματος ονομάζεται συνέλιξη (convolution):

27 Τ Διακριτά Συστήματα h(n) = T[ δ(n) ]

28 | x(n) | <= B => υπάρχει B’ ώστε | y(n) | <= B’
Διακριτά Συστήματα Σύστημα πεπερασμένης κρουστικής απόκρισης (FIR) Συστήματα στα οποία η απόκριση έχει περιορισμένη περιοχή υποστήριξης (δηλαδή κάποιο μέγεθος M) Σύστημα άπειρης κρουστικής απόκρισης (ΙIR) Συστήματα στα οποία η απόκριση έχει μη περιορισμένη περιοχή υποστήριξης (μπορεί και άπειρη) Ευσταθή συστήματα (BIBO) Συστήματα στα οποία ισχύει : | x(n) | <= B => υπάρχει B’ ώστε | y(n) | <= B’ δηλαδή αν κάθε τιμή του σήματος εισόδου είναι πεπερασμένη (όχι άπειρη), τότε και κάθε τιμή του σήματος εξόδου είναι πεπερασμένη

29 Μετασχηματισμός Fourier

30 Τι λέει ο Fourier για τα σήματα
= +

31 Τι λέει ο Fourier για τα σήματα
Ένα ημιτονοειδές σήμα περιγράφεται από την φάση, το πλάτος και την περίοδο (συχνότητα) του. Πλάτος a t Περίοδος T (συχνότητα f=1/T) φάση φ

32 Τι λέει ο Fourier για τα σήματα
Πλάτος a Συχνότητα f f a Πλάτος a t Περίοδος T (συχνότητα f=1/T) Τι είναι αυτός ο όρος στην συχνότητα 0; Είναι ο όρος μηδενικής συχνότητας (DC) που εκφράζει την μέση τιμή του σήματος Υπάρχει σε κάθε διάγραμμα στην αρχή των αξόνων Πλάτος a Πλάτος a a t f 2f Περίοδος T/2 (συχνότητα f=2/T)

33 Τι λέει ο Fourier για τα σήματα
Πλάτος a t Περίοδος T (συχνότητα f=1/T) f a -f Αντίστροφος Μετασχηματισμός Fourier Ο Μετασχηματισμός Fourier κωδικοποιεί ένα εύρος συχνοτήτων στο σήμα, από συχνότητα 0 μέχρι τη συχνότητα του Nyquist (μέγιστη συχνότητα στο σήμα)

34 Γιατί μας ενδιαφέρει; Ο Μετασχηματισμός Fourier μας δίνει μια διαφορετική αναπαράσταση ενός σήματος, από συνάρτηση χρόνου σε συνάρτηση πλάτους/συχνότητας (συχνοτικό περιεχόμενο ενός σήματος). Αυτό είναι ένα πολύ ισχυρό εργαλείο για την επεξεργασία ενός σήματος. Συμπαγής αναπαράσταση της ενός σήματος όπου μεγάλες περιοχές αναπαριστούνται με μερικούς αριθμούς (συχνότητα και πλάτος) Μικρές και γρήγορες αλλαγές στο συχνοτικό περιεχόμενο ενός σήματος μας επιτρέπει να κάνουμε μεγάλες αλλαγές στο αρχική σήμα Φιλτράρισμα Αφαίρεση θορύβου Συμπίεση Μετασχηματισμός Fourier Αντίστροφος Μετασχηματισμός Fourier

35 Το συχνοτικό περιεχόμενο του μετ. Fourier
ενδιαφέρουσα ιδιότητα Οι χαμηλές συχνότητες στο φάσμα του μετασχηματισμού περιέχουν την μεγαλύτερη ενέργεια στο σήμα (την ένταση του σήματος) Οι υψηλές συχνότητες στο φάσμα περιέχουν την «λεπτομέρεια» στο σήμα. Επίσης φέρουν και τον θόρυβο που ίσως να υπάρχει στο σήμα

36 Ιδιότητες μετασχηματισμού Fourier
Γραμμικότητα x(n) =au(n) + bw(n) ↔ X(ω) =aU(ω) + bW(ω) Συνέλιξη y(n) = x(n) * h(n) ↔ Y(ω) = X(ω) H(ω) H πολύπλοκη πράξη της συνέλιξης γίνεται ένας απλός πολλ/μος στο χώρο των συχνοτήτων Θεώρημα Parseval H συνολική ενέργεια του σήματος στο χρόνο είναι ίση με την συνολική ενέργεια του σήματος στην συχνότητα

37 Εφαρμογή μετ. Fourier: Φίλτρα
ένα σήμα Φίλτρο ονομάζουμε ένα οποιοδήποτε διακριτό σύστημα το οποίο μετατρέπει μια διακριτή ακολουθία εισόδου σε μια διακριτή ακολουθία εξόδου Ένα φίλτρο/διακριτό σύστημα χαρακτηρίζεται από την κρουστική του απόκριση h(n) Ένα φίλτρο επιδρά πάνω σε ένα σήμα εισόδου με την διαδικασία της συνέλιξης y(n) = x(n) * h(n) Είπαμε ότι με το μετασχηματισμό Fourier η συνέλιξη γίνεται ένας απλός πολλ/μος y(n) = x(n) * h(n) ↔ Y(ω) = X(ω) H(ω) Οπότε η διαδικασία φιλτραρίσματος ενός σήματος γίνεται μια απλή πράξη πολλ/μού στο χώρο των συχνοτήτων  πολύ γρήγορη

38 Εφαρμογή μετ. Fourier: Φίλτρα
Με την χρήση φίλτρων μπορούμε να αποκόψουμε συγκριμένες συχνότητες στο σήμα μας

39 Εφαρμογή μετ. Fourier: Φίλτρα
Παράδειγμα, μπορώ να αποκόψω (μηδενίσω) συχνότητες μεγαλύτερες από μια συχνότητα ω/2 με ένα απλό χαμηλοπερατό φίλτρο x

40 Δειγματοληψία σήματος

41 Διαδικασία παραγωγής ψηφιακού σήματος
Παραγωγή ακουστικού σήματος Μετατροπή ακουστικού σήματος σε ηλεκτρικό σήμα (αναλογικό)

42 Ψηφιοποίηση σήματος Το ακουστικό σήμα που φεύγει από τον ομιλητή μετατρέπεται σε συνεχές ηλεκτρικό σήμα από το μικρόφωνο Συνεχές σήμα  «άπειρο» εύρος τιμών, «απειροελάχιστη» απόσταση η μία στην άλλη Συνεχές σήμα  δεν μπορεί να αναπαρασταθεί στο υπολογιστή λόγω της ψηφιακής φύσης του υπολογιστή και πεπερασμένης μνήμης του Πρέπει να μειώσουμε την «άπειρη» πληροφορία που εμπεριέχει το συνεχές σήμα ώστε να μπορέσουμε να το αναπαραστήσουμε στον υπολογιστή Δειγματοληψία Κβαντισμός

43 Δειγματοληψία σήματος
Με την δειγματοληψία (sampling) ενός σήματος, παίρνουμε «δείγματα» x(n) μιας συνεχούς συνάρτησης f(t) ανά τακτά χρονικά διαστήματα T x(n) = f(nT) Όπου Τ τo διάστημα δειγματοληψίας στον άξονα t και 0<=n<M f(t) δ(n) t Τ

44 Δειγματοληψία σήματος
Σημαντική παράμετρος της διαδικασίας δειγματοληψίας (sampling) είναι η συχνότητα δειγματοληψίας (sampling rate) f = 1 / T H συχνότητα δειγματοληψίας εκφράζεται σε δείγματα ανά δευτερόλεπτο, ή κύκλους ανά δευτερόλεπτο, ή Hertz (Hz) Παράδειγμα, για να αποθηκεύσουμε την μουσική σε ένα CD, την δειγματοληπτούμε στα 44.1 ΚΗz

45 Δειγματοληψία σήματος
Όσο μικρότερο είναι το διάστημα δειγματοληψίας Τ (όσο μεγαλύτερη η συχνότητα δειγματοληψίας f) τόσο καλύτερη είναι η δειγματοληψία, και τόσο μεγαλύτερος χώρος χρειάζεται για την αποθήκευση του σήματος. Πως αποφασίζουμε πόσο πρέπει να είναι το διάστημα δειγματοληψίας; Αν είναι μικρότερο από όσο πρέπει, το σήμα θα έχει παραπανίσια δείγματα και θα θέλει περισσότερο χώρο να αποθηκευτεί Αν είναι μεγαλύτερο από όσο πρέπει, ο αριθμός των δειγμάτων δεν θα είναι αρκετός για να αναπαραστήσω πιστά το σήμα και θα υπάρχουν παραμορφώσεις

46 Δειγματοληψία σήματος
Θεώρημα δειγματοληψίας Nyquist: Ένα συνεχές, πεπερασμένο σήμα μπορεί να ανακτηθεί πλήρως από τα δείγματα του, αν η συχνότητα δειγματοληψίας (1/Τ) του είναι τουλάχιστον διπλάσια της μέγιστης συχνότητας (μmax) στο σήμα. 1/Τ > 2μmax To μmax μπορεί να βρεθεί μέσω μετασχηματισμού Fourier.

47 Μετασχηματισμός Fourier και δειγματοληψία

48 Μετασχηματισμός Fourier και δειγματοληψία
Ιδεατό κατωπερατό φίλτρο Μετασχηματισμός Fourier του συνεχούς σήματος

49 Μετασχηματισμός Fourier και δειγματοληψία
Θεώρημα δειγματοληψίας Nyquist: Ένα συνεχές, πεπερασμένο σήμα μπορεί να ανακτηθεί πλήρως από τα δείγματα του, αν η συχνότητα δειγματοληψίας (1/Τ) του είναι τουλάχιστον διπλάσια της μέγιστης συχνότητας (μmax) στο σήμα. 1/Τ > 2μmax To μmax μπορεί να βρεθεί μέσω μετασχηματισμού Fourier. Μετασχηματισμός Fourier συνεχούς σήματος μmax

50 Μετασχηματισμός Fourier και δειγματοληψία
Τι θα συμβεί αν δεν τηρήσω αυτό τον κανόνα; 1/Τ > 2μmax Η(μ) Έχω την δυνατότητα να ανασυνθέσω το αρχικό μου σήμα επακριβώς. 1/Τ = 2μmax Η(μ) Έχω την δυνατότητα να ανασυνθέσω το αρχικό μου σήμα επακριβώς (οριακά) 1/Τ < 2μmax Έχασα την δυνατότητα να ανασυνθέσω το αρχικό μου σήμα επακριβώς! Η(μ)

51 Δειγματοληψία σήματος
Όμως! Ο αποδέκτης των ακουστικών σημάτων που μελετάμε εμείς είναι συνήθως ο άνθρωπος. Οι περισσότεροι άνθρωποι μπορούν να «ακούσουν» ήχους με συχνότητα το πολύ 22 KHz. Οπότε η ελάχιστη συχνότητα δειγματοληψίας που συνήθως χρησιμοποιείται είναι τα 44.1 ΚHz Αυτός είναι ο λόγος που για να αποθηκεύσουμε την μουσική σε ένα CD, την δειγματοληπτούμε στα 44 ΚΗz

52 Κβαντισμός Κάναμε δειγματοληψία των τιμών της συνάρτησης στο χρόνο και λάβαμε ένα πεπερασμένο αριθμό δειγμάτων. Η τιμή του κάθε δείγματος όμως συνεχίζει να είναι «συνεχής» με αποτέλεσμα ο υπολογιστής να μην μπορεί να την αποθηκεύσει σε μια μεταβλητή (8, 16, ή 32 bit). Πρέπει να ψηφιοποιήσουμε και τις τιμές των δειγμάτων. Το είδος αυτό ψηφιοποίησης ονομάζεται κβαντισμός (quantisation) Κβαντισμός : αναπαράσταση ενός εισερχόμενου συνεχούς σήματος με N διακριτές τιμές Ο αριθμός των bits b που χρησιμοποιούμε για την αναπαράσταση κάθε δείγματος καθορίζει και την ακρίβεια (Ν) με την οποία θα αναπαραστήσουμε το σήμα. Αν το b είναι 8bits ανά δείγμα τότε μπορούμε να αναπαραστήσουμε μόνο 256 τιμές ενός σήματος (0-255). Αν είναι 16bits/δείγμα; Ν = 2b

53 Κβαντισμός Ο κβαντισμός εκφράζεται από την συνάρτηση Q(i), όπου i το εισερχόμενο συνεχές σήμα. H Q(i) είναι μια κλιμακωτή συνάρτηση (step function) Αν διαθέσουμε b bits για τον κβαντισμό, τότε μπορούμε να αναπαραστήσουμε 2b επίπεδα τιμών. Το κάθε επίπεδο της Q θα έχει ύψος q=2-b Q(i) q/2 -q/2 e i Λάθος μετατροπής 2,34545 2q q i Κλιμακωτή σχέση εισόδου εξόδου

54 Κβαντισμός: οπτικό παράδειγμα
Ο αριθμός των bit που θα διαθέσουμε για την κβάντιση επηρεάζει τον αριθμό των διαφορετικών επιπέδων φωτεινότητας που μπορούμε να αναπαραστήσουμε σε μια εικόνα. 256 128 16 8 64 32 4 2

55 Τι θα δούμε στο επόμενο μάθημα
Στο επόμενο μάθημα θα δούμε Το μηχανισμό παραγωγής ομιλίας από το άνθρωπο Πώς δημιουργούνται οι ήχοι ομιλίας και ποια είναι τα χαρακτηριστικά τους Πως μοντελοποιούμε το σύστημα ομιλίας του ανθρώπου

56 f Ερωτήσεις;

57 Τέλος Ενότητας


Κατέβασμα ppt "Επεξεργασία Ομιλίας & Ήχου"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google