Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Επεξεργασία Ομιλίας & Ήχου Ενότητα # 10: Κωδικοποίηση ψηφιακών ακουστικών σημάτων Ιωάννης Καρύδης Τμήμα Πληροφορικής.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Επεξεργασία Ομιλίας & Ήχου Ενότητα # 10: Κωδικοποίηση ψηφιακών ακουστικών σημάτων Ιωάννης Καρύδης Τμήμα Πληροφορικής."— Μεταγράφημα παρουσίασης:

1 Επεξεργασία Ομιλίας & Ήχου Ενότητα # 10: Κωδικοποίηση ψηφιακών ακουστικών σημάτων Ιωάννης Καρύδης Τμήμα Πληροφορικής

2 Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2

3 Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα Ιονίου Πανεπιστημίου» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

4 Εισαγωγικά Μετά την έξοδο από το ADC, το σήμα είναι διαδοχή από ψηφιακές λέξεις – ταχύτητα διαδοχής συχνότητα δειγματοληψίας μέγεθος δείγματος/ψηφιακής λέξης – έξοδος ADC = λέξεις με τα bits σε παράλληλη διάταξη Η παράλληλη έξοδος πρέπει να γίνει σειριακή – συνήθη πρωτόκολλα επικοινωνίας AES / EBU, SPDIF, MADI, RS-232, Ethernet, USB, FireWire χρησιμοποιούν σειριακή μετάδοση – τελική μορφή: συρμός/ροή από bits – οι λέξεις διαδέχονται η μια την άλλη

5 Μετατροπή παράλληλης ροής σε σειριακή ADC 01110001001101010111000100110101 00110011001100110011001100110011 100100110111100110010011011110010 τελευταίο bit πρώτο bit Παράλληλη έξοδος fs KHz 16-bit 1 0 0 1 0 0 1 1 0 1 1 1 1 0 0 1 ροή bits πρώτο bit τελευταίο bit

6 Εισαγωγικά Παράλληλη μετάδοση – τείνει να εξαλειφτεί αντικατάσταση από USB – Χρήση ενός καλωδίου για κάθε bit μετάδοσης κατασκευαστικά υπερβολικό οικονομικά ασύμφορο Σειριακή μετάδοση – περιορισμένο πλήθος καλωδίων για το σήμα ~4 – ένα για τη γη

7 Κωδικοποίηση … … είναι η μετατροπή ενός αναλογικού ακουστικού σήματος σε ροή bits (ψηφιακή διαμόρφωση) Αντίστροφη διαδικασία – αποκωδικοποίηση (decoding) Ο συνδυασμός – κωδικοποιητή (encoder ή coder) – αποκωδικοποιητή (decoder) δίνει τον όρο codec Codec – υλικό ή λογισμικό μετασχηματισμού ακουστικού σήματος σε κωδικοποιημένη ροή bits

8 Αναγκαιότητα κωδικοποίησης Βελτιστοποίηση – μετάδοσης – αποθήκευσης ψηφιακών ακουστικών σημάτων Ακόμα – πρόληψη & διόρθωση λαθών κατά τη μεταφορά & αποθήκευση – οικονομία στη χρήση μέσων (μικρότερη διαμεταγωγή) – δυνατότητα πολύπλεξης διαφορετικών σημάτων (καναλιών ήχου, κ.α.)

9 Μέθοδοι κωδικοποίησης … … υπάρχουν πολλοί! Διαφορετικά – χαρακτηριστικά – πλεονεκτήματα/μειονεκτήματα Συνήθεις – PCM – DSD – PWM

10 Κωδικοποίηση PCM Παλμοκωδική διμόρφωση – Pulse Code Modulation Απλούστερη και άμεση μέθοδος κωδικοποίησης Για δειγματοληψία fs KHz και μέγεθος δείγματος nbits bits, η ροή των bits έχει ταχύτητα (bit rate) fs × nbits bits per second (kbps) – 44,1KHz & 16 bit δείγμα -> 705,6 kbps – 48KHz & 16 bit δείγμα -> 768 kbps

11 Κωδικοποίηση PCM Πολύπλεξη σημάτων PCM στο χρόνο – μετάδοση στο ίδιο κανάλι επικοινωνίας – αποθήκευση στο ίδιο μέσο αποθήκευσης Μετάδοση περισσότερων του ενός ακουστικά σήματα – η ταχύτητα ροής πολλαπλασιάζεται (ανάλογα με τον αριθμό των διαφορετικών σημάτων) Στερεοφωνική μετάδοση (2 κανάλια ήχου) – 705,6 kbps το καθένα – το πεπλεγμένο σήμα έχει 2 × 705,6 = 1,41 mbps

12 Κωδικοποίηση PCM σε CD & DVD CD – PCM με 2 κανάλια – 88,2 KHz (44,1 KHz × 2) DVD – PCM με πολύ υψηλότερη συχνότητα δειγματοληψίας υψηλότερη ποιότητα – 96 KHz (48 KHz × 2) – 192 KHz (48 KHz × 4 & μέγεθος δείγματος 24-bit)

13 Διαφορετικές εκδοχές PCM Γραμμικό (linear) PCM – απλούστερη μορφή PCM χωρίς συμπίεση – υποστηρίζει συνθήκες μετατροπής ADC 8-bit, 12-bit, 16-bit και 24-bit – προσημασμένες τιμές δειγμάτων (αρνητικές & θετικές) – πολύπλεξη καναλιών – μέγεθος δείγματος 8KHz, 11,025KHz, 16KHz, 32KHz, 44,1KHz και 48KHz

14 Διαφορετικές εκδοχές PCM Λογαριθμικό (logarithmic) PCM – κατά τη μετατροπή ADC χρησιμοποιεί λογαριθμική συμπίεση του πλάτους των δειγμάτων χρήση κανόνων μ-Law & A-Law – εφαρμογή σε κινητή τηλεφωνία & τηλεπικοινωνιακές εφαρμογές μεταφοράς ακουστικών και μουσικών σημάτων Διαφορικό (differential) PCM ή DPCM – κωδικοποίηση διαφοράς τιμών μεταξύ διαδοχικών δειγμάτων PCM προηγούμενο & τρέχον δείγμα – επιτυγχάνει μείωση (συμπίεση) όγκου ψηφιακής πληροφορίας έως και 25% (μέγεθος διαφοράς < μεγέθους δείγματος)

15 Διαφορετικές εκδοχές PCM Προσαρμοζόμενο (adaptive) DPCM ή ADPCM – δυναμική προσαρμογή του αλγορίθμου στις μεταβολές του σήματος – στόχος η ελαχιστοποίηση του λάθους στο υπολογισμό της διαφοράς μέσω αλλαγής βήματος κβαντισμού – συμπίεση 4:1 16-bit PCM αντιστοιχούν σε 4-bit ADPCM – εφαρμογή σε τηλεπικοινωνιακές εφαρμογές μεταφοράς ομιλίας (λ.χ. VOIP)

16 Επιπλέον κωδικοποίηση Κατά τη μετάδοση ψηφιακών ακουστικών σημάτων – στόχος: ελαχιστοποίηση πιθανότητα λάθους στη μετάδοση – λ.χ. συσσώρευση πολλών όμοιων bits σε μια ροή σειρά bits 1111111111111 Non-Return-To-Zero (NRZ) – αναπαράσταση PCM bits ως έχουν Return-To-Zero (RZ) – αντικατάσταση του PCM bit 1 με σύμβολο που έχει 2 νέα bits (01) μείωση χρονικής διάρκειας νέων bits στο μισό Bi-phase coding – διπλασιάζει το αρχικό bit rate – αντικαθιστά τα PCM bits με 2 νέα bits (01 και 10)

17 Κωδικοποίηση DSD

18 Τέλος Ενότητας


Κατέβασμα ppt "Επεξεργασία Ομιλίας & Ήχου Ενότητα # 10: Κωδικοποίηση ψηφιακών ακουστικών σημάτων Ιωάννης Καρύδης Τμήμα Πληροφορικής."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google