Επεξεργασία Ομιλίας & Ήχου Ενότητα # 10: Κωδικοποίηση ψηφιακών ακουστικών σημάτων Ιωάννης Καρύδης Τμήμα Πληροφορικής
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα Ιονίου Πανεπιστημίου» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3
Εισαγωγικά Μετά την έξοδο από το ADC, το σήμα είναι διαδοχή από ψηφιακές λέξεις – ταχύτητα διαδοχής συχνότητα δειγματοληψίας μέγεθος δείγματος/ψηφιακής λέξης – έξοδος ADC = λέξεις με τα bits σε παράλληλη διάταξη Η παράλληλη έξοδος πρέπει να γίνει σειριακή – συνήθη πρωτόκολλα επικοινωνίας AES / EBU, SPDIF, MADI, RS-232, Ethernet, USB, FireWire χρησιμοποιούν σειριακή μετάδοση – τελική μορφή: συρμός/ροή από bits – οι λέξεις διαδέχονται η μια την άλλη
Μετατροπή παράλληλης ροής σε σειριακή ADC τελευταίο bit πρώτο bit Παράλληλη έξοδος fs KHz 16-bit ροή bits πρώτο bit τελευταίο bit
Εισαγωγικά Παράλληλη μετάδοση – τείνει να εξαλειφτεί αντικατάσταση από USB – Χρήση ενός καλωδίου για κάθε bit μετάδοσης κατασκευαστικά υπερβολικό οικονομικά ασύμφορο Σειριακή μετάδοση – περιορισμένο πλήθος καλωδίων για το σήμα ~4 – ένα για τη γη
Κωδικοποίηση … … είναι η μετατροπή ενός αναλογικού ακουστικού σήματος σε ροή bits (ψηφιακή διαμόρφωση) Αντίστροφη διαδικασία – αποκωδικοποίηση (decoding) Ο συνδυασμός – κωδικοποιητή (encoder ή coder) – αποκωδικοποιητή (decoder) δίνει τον όρο codec Codec – υλικό ή λογισμικό μετασχηματισμού ακουστικού σήματος σε κωδικοποιημένη ροή bits
Αναγκαιότητα κωδικοποίησης Βελτιστοποίηση – μετάδοσης – αποθήκευσης ψηφιακών ακουστικών σημάτων Ακόμα – πρόληψη & διόρθωση λαθών κατά τη μεταφορά & αποθήκευση – οικονομία στη χρήση μέσων (μικρότερη διαμεταγωγή) – δυνατότητα πολύπλεξης διαφορετικών σημάτων (καναλιών ήχου, κ.α.)
Μέθοδοι κωδικοποίησης … … υπάρχουν πολλοί! Διαφορετικά – χαρακτηριστικά – πλεονεκτήματα/μειονεκτήματα Συνήθεις – PCM – DSD – PWM
Κωδικοποίηση PCM Παλμοκωδική διμόρφωση – Pulse Code Modulation Απλούστερη και άμεση μέθοδος κωδικοποίησης Για δειγματοληψία fs KHz και μέγεθος δείγματος nbits bits, η ροή των bits έχει ταχύτητα (bit rate) fs × nbits bits per second (kbps) – 44,1KHz & 16 bit δείγμα -> 705,6 kbps – 48KHz & 16 bit δείγμα -> 768 kbps
Κωδικοποίηση PCM Πολύπλεξη σημάτων PCM στο χρόνο – μετάδοση στο ίδιο κανάλι επικοινωνίας – αποθήκευση στο ίδιο μέσο αποθήκευσης Μετάδοση περισσότερων του ενός ακουστικά σήματα – η ταχύτητα ροής πολλαπλασιάζεται (ανάλογα με τον αριθμό των διαφορετικών σημάτων) Στερεοφωνική μετάδοση (2 κανάλια ήχου) – 705,6 kbps το καθένα – το πεπλεγμένο σήμα έχει 2 × 705,6 = 1,41 mbps
Κωδικοποίηση PCM σε CD & DVD CD – PCM με 2 κανάλια – 88,2 KHz (44,1 KHz × 2) DVD – PCM με πολύ υψηλότερη συχνότητα δειγματοληψίας υψηλότερη ποιότητα – 96 KHz (48 KHz × 2) – 192 KHz (48 KHz × 4 & μέγεθος δείγματος 24-bit)
Διαφορετικές εκδοχές PCM Γραμμικό (linear) PCM – απλούστερη μορφή PCM χωρίς συμπίεση – υποστηρίζει συνθήκες μετατροπής ADC 8-bit, 12-bit, 16-bit και 24-bit – προσημασμένες τιμές δειγμάτων (αρνητικές & θετικές) – πολύπλεξη καναλιών – μέγεθος δείγματος 8KHz, 11,025KHz, 16KHz, 32KHz, 44,1KHz και 48KHz
Διαφορετικές εκδοχές PCM Λογαριθμικό (logarithmic) PCM – κατά τη μετατροπή ADC χρησιμοποιεί λογαριθμική συμπίεση του πλάτους των δειγμάτων χρήση κανόνων μ-Law & A-Law – εφαρμογή σε κινητή τηλεφωνία & τηλεπικοινωνιακές εφαρμογές μεταφοράς ακουστικών και μουσικών σημάτων Διαφορικό (differential) PCM ή DPCM – κωδικοποίηση διαφοράς τιμών μεταξύ διαδοχικών δειγμάτων PCM προηγούμενο & τρέχον δείγμα – επιτυγχάνει μείωση (συμπίεση) όγκου ψηφιακής πληροφορίας έως και 25% (μέγεθος διαφοράς < μεγέθους δείγματος)
Διαφορετικές εκδοχές PCM Προσαρμοζόμενο (adaptive) DPCM ή ADPCM – δυναμική προσαρμογή του αλγορίθμου στις μεταβολές του σήματος – στόχος η ελαχιστοποίηση του λάθους στο υπολογισμό της διαφοράς μέσω αλλαγής βήματος κβαντισμού – συμπίεση 4:1 16-bit PCM αντιστοιχούν σε 4-bit ADPCM – εφαρμογή σε τηλεπικοινωνιακές εφαρμογές μεταφοράς ομιλίας (λ.χ. VOIP)
Επιπλέον κωδικοποίηση Κατά τη μετάδοση ψηφιακών ακουστικών σημάτων – στόχος: ελαχιστοποίηση πιθανότητα λάθους στη μετάδοση – λ.χ. συσσώρευση πολλών όμοιων bits σε μια ροή σειρά bits Non-Return-To-Zero (NRZ) – αναπαράσταση PCM bits ως έχουν Return-To-Zero (RZ) – αντικατάσταση του PCM bit 1 με σύμβολο που έχει 2 νέα bits (01) μείωση χρονικής διάρκειας νέων bits στο μισό Bi-phase coding – διπλασιάζει το αρχικό bit rate – αντικαθιστά τα PCM bits με 2 νέα bits (01 και 10)
Κωδικοποίηση DSD
Τέλος Ενότητας