HY530 “ΨΗΦΙΑΚΕΣ ΕΠΙΚΟΙΝΩΝΙΕΣ” QUANTIZATION
Διαδικασια μετατροπης αναλογικου σε ψηφιακο (ADC) Αναλογικο σημα Μετα την δειγματοληψια Κβαντισμενο σημα
Kβαντισμος - Quantization Τα σηματα συνεχους χρονου υφιστανται δειγματοληψια κατα τακτα χρονικα διαστηματα Η δειγματοληψια δεν εισαγει οποιαδηποτε παραμορφωση αν γινει με ρυθμο μεγαλυτερο απο τον ρυθμο Nyquist. Τα αναλογικα δειγματα εχουν τιμες σε ενα συνεχες διαστημα τιμων και χρειαζεται απειρος αριθμος bits για την παρασταση τους με τελεια ακριβεια. Κβαντισμος (Quantization) ειναι η διαδικασια της προσεγγισης ενος αναλογικου (συνεχους) δειγματος με ενα πεπερασμενο αριθμο bits. O κβαντισμος εισαγει παντοτε παραμορφωση. Μπορουμε να την μειωσουμε αν αυξησουμε τον αριθμο των bits με τα οποια παριστανουμε ενα δειγμα.
Συμβολισμος σχετικος με τον κβαντισμο Εστω Χ μια τυχαια μεταβλητη που παριστανει το δειγμα ενος αναλογικου σηματος το οποιο υφισταται δειγματοληψια. Τοτε ειναι η κβαντισμενη τιμη της Χ. Ενας κβαντιστης εχει Μ επιπεδα κβαντισμου: Τα ορια των ζωνων κβαντισμου οριζονται απο τις Μ + 1 τιμες: {x0, x1, …, xM}, οπου x0= -, xM = Ετσι για Καθε επιπεδο κβαντισμου μπορει να αντιστοιχισθεί σε εναν log2M –bit δυαδικο αριθμο
Γραφικη παρασταση του Κβαντισμου ~ x8 3.5 111 x8=3.5 M=8 110 101 100 -3 -2 -1 1 2 3 -3 3 x0 x1 x7 x8 011 - 010 001 x1 ~ -3.5 000 x1=-3.5
Συνοπτικη παρασταση Κβαντιστη Συνηθως αρκει ο καθορισμος των επιπεδων κβαντισμου Παραδειγμα: {-3.5,-2.5, -1.5, -0.5, +0.5, 1.5, 2.5, 3,5} Γιατι? Υποθετουμε οτι ολα τα δείγματα κβαντιζονται στο πλησιεστερο επιπεδο κβαντισμου Αυτο καθοριζει τα ορια των ζωνων κβαντισμου, εν προκειμενω στο μεσον μεταξυ των επιπεδων κβαντισμου δηλαδη: {-, -3.0, -2.0, -1.0, 0, 1.0, 2.0, 3.0, } Καθε αλλο οριο αυξανει το σφαλμα κβαντισμου (θεωρημα Loyd-Marx)
Υλοποιηση του Κβαντιστη Ενας μετατροπεας αναλογικου-σε-ψηφιακο (ADC – Analog to Digital Converter) προσεγγιζει το σημα (δειγμα) στην εισοδο του με ενα απο τα Μ επιπεδα κβαντισμου. Ενα κυκλωμα σειριακης εξοδου (SIO – Serial Input Output) μετατρεπει το επιπεδο κβαντισμου σε ακολουθια απο n=log2M bits. x n bits ADC SIO Quantizer
Πρακτικοι τροποι κατασκευης ADCs Counting or Ramp ADC Μια ταση αναφορας αυξανει κατα σταθερα βηματα μεχρι να γινει μεγαλυτερη απο το δειγμα. Ο δυαδικος αριθμος που αντιστοιχει στους παλμους του ρολογιου που χρειαστηκαν γι’ αυτο ειναι η κβαντισμενη τιμη του δειγματος Serial or Successive Approximation ADC (Σειριακος ADC ή διαδοχικων προσεγγισεων ADC) Χρησιμοποιει δυαδικη ερευνα (μεχρι να φθασει στην επιθυμητη ακριβεια ) για να προσδιορισει την ζωνη κβαντισμου του δειγματος εισοδου. Parallel or Flash ADC (Παραλληλος ή «αστραπιαιος») Το δειγμα εισοδου συγκρινεται ταυτοχρονα με ολα τα δυνατα επιπεδα κβαντισμου. Επιλεγεται το υψηλότερο απο τα επιπεδα κβαντισμου που ειναι μικροτερα του σηματος Μεγαλυτερη ταχυτητα Mικροτερη πολυπλοκοτητα
Ειδη Θορυβου στον Κβαντιστη Θορυβος κβαντισμου (Quantization Noise) Εμφανιζεται γιατι η τιμη του δειγματος x αντικαθισταται απο την τιμη του πλησιεστερου επιπεδου κβαντισμου. Το σφαλμα κβαντισμου για ενα δειγμα ειναι nQ = x – fQ(x) και ειναι μικροτερο, κατα απολυτο τιμη, απο το ημισυ του μεγεθους της ζωνης κβαντισμου. Θορυβος υπερφορτωσης (Overload Noise): Εμφανιζεται οταν το σημα εισοδου ειναι μεγαλυτερο απο το μεγαλυτερο επιπεδο κβαντισμου με αποτελεσμα τον «ψαλλιδισμο» του. Κοκκωδης Θορυβος (Granularity Noise): Εμφανιζεται οταν τα επιπεδα κβαντισμου δεν ειναι αρκετα πυκνα για να προσεγγισουν με ακριβεια το δειγμα. Ειναι πιο εμφανης οταν οι τιμες των δειγματων κυμαινονται ελαφρα γυρω απο ενα οριο περιοχης κβαντισμου. Αν ο αριθμος των επιπεδων κβαντισμου Μ ειναι σταθερος τοτε υπαρχει ανταλλαγη μεταξυ των θορυβων κβαντισμου και υπερφορτωσης
Παραμορφωση Ο κβαντισμος εισαγει παραμορφωση στο σημα ~ Χ Χ = fQ(Χ) Θελουμε να ελαχιστοποιησουμε την μεση παραμορφωση D, οπου: οπου f(x) η pdf του σηματος. Αυτο το μετρο παραμορφωσης ονομαζεται και μεσο τετραγωνικο σφαλμα (MSE – Mean Square Error) To MSE «μεγεθύνει» τα μεγαλα σφαλματα περισσοτερο απο τα μικρα. ~ Χ Χ = fQ(Χ) Κβαντιστης
Μια εναλλακτικη θεωρηση του κβαντισμου ~ Ο κβαντισμος προσθετει ενα τυχαιο θορυβο nQ = x - x στην πραγματικη τιμη x του δειγματος. Ετσι η παραμορφωση D ή το MSE = E[nQ2] μπορει να θεωρηθει οτι ειναι η ισχυς του θορυβου κβαντισμου Μπορουμε να ορισουμε μια σηματοθορυβικη σχεση (SNR – Signal to Noise Ratio) για να χαρακτηρισουμε την συμπεριφορα του κβαντιστη. SNR=ισχυς σηματος x / ισχυς θορυβου nQ + Κβαντιστης x nQ = x - x ~ x = fQ(x) = x + nQ
Υπολογισμος της σηματοθορυβικης σχεσης Μεση τιμη της σηματοθορυβικης σχεσης (SNR): SNR= (S/N)avg = ισχυς σηματος x / ισχυς θορυβου nQ Μπορουμε να ορισουμε και την μεγιστη SNR (peak SNR): λιγωτερο χρησιμη. Δεν θα την χρησιμοποιησουμε...
Παραδειγμα υπολογισμου SNR ~ ~ ~ Εστω κβαντιστης με επιπεδα κβαντισμου Χ = {x1, x2,…x8} = ={x1=-3.5, x2=-2.5, x3=-1.5, x4=-0.5, x5=0.5, x6=1.5, x7=2.5, x8=3.5} H pdf f(x) του σηματος εισοδου ειναι ομοιομορφη με τιμη 1/8 στο διαστημα [-4, +4] Η ισχυς του σηματος X ειναι: Η παραμορφωση D ειναι: ~ ~ ~ ~ ~ ~ ~ ~ f(x) -4 0 +4 x
Παραδειγμα υπολογισμου SNR (συνεχεια) Ας εξετασουμε τον ορο για k=5: Και οι 12 οροι του αθροισματος ειναι ισοι MSE =D= 1/12 Το SNR σε db ειναι (S/N)avg = 10log10(64) = 10log10(26) =63 = 18 Ενας εμπειρικος κανονας οριζει οτι καθε προσθετο bit στην κωδικοποιηση των δειγματων προσθετει 6 db στην σηματο-θορυβικη σχεση του ομοιομορφου κβαντιστη οταν τα σηματα εισοδου εχουν ομοιομορφη pdf
Κβαντιστης 3 bit , 8 επιπεδων ~ x8 Σφαλμα ~ x1 Σημα Εισοδου x
Κβαντιστης Μ=26 =64 επιπεδων
SNR για Ομοιομορφο Κβαντιστη (συνοψη) Γενικο αποτελεσμα (μπορει να αποδειχθει ευκολα): Προυποθεσεις: Ομοιομορφος κβαντιστης Μ επιπεδων Τα δειγματα εισοδου εχουν ομοιομορφη κατανομη, με περιοχη τιμων ιση με την περιοχη τιμων που καλυπτει ο κβαντιστης. Εμπειρικος Κανονας: Καθε προσθετο bit (= διπλασιασμος επιπεδων) αυξανει το SNR κατα 6 db (=τετραπλασιασμος SNR)
Παλμοκωδικη Διαμορφωση (PCM) Η Παλμοκωδικη Διαμορφωση παραγει ενα σημα Βασικης Ζωνης το οποιο αποτελειται από σειρα παλμων που προερχονται από την σειριακη εξοδο ενος κβαντιστη. Μερικες φορες ο ορος «PCM» χρησιμοποιειται εναλλακτικα για τον ορο «κβαντισμος».
Ευρος ζωνης σηματων PCM Ομοιομορφος κβαντιστης n bits και 2n = M επιπεδων Ο ρυθμος δειγματοληψιας ειναι: fs δειγματα/sec. Ο ρυθμος παραγωγης δυαδικων συμβολων, δηλαδη ο ρυθμός κωδικοποίησης στη εξοδο του κβαντιστη, ειναι fs log2M = fs n bits/sec. To ελαχιστο απαιτουμενο ευρος φασματος (με βελτιστη μορφη παλμου *) ειναι: fs n/2 Hz. To ευρος φασματος «πρωτου μηδενισμου» (με ορθογωνικη μορφη παλμου) ειναι fs n Hz. * Θα αναφερθουμε σε επομενα μαθηματα στην επιδραση της μορφης του παλμου επι του ευρους φασματος του σηματος PCM
Παραδειγμα υπολογισμου για σημα PCM Προβλημα: Ενα αναλογικο μουσικο σημα εχει ευρος φασματος 15 kHz και τα δειγματα του μπορουν να θεωρηθουν οτι εχουν ομοιομορφη pdf. Να βρεθει το ελαχιστο ευρος φασματος για την μεταδοση του σηματος με διαμορφωση PCM και με μεση παραμορφωση καλλιτερη απο 58db. Λυση: Συχνοτητα δειγματοληψιας fs 2B = 30.000 δειγματα/sec. 10log10M2 58db M 102.9103 210 n 10 bits/sample Ελαχιστος ρυθμος παραγωγης δεδομενων R = fs n 300.000 b/s Ελαχιστο ευρος φασματος: BW = R/2 150 kHz. (υποτιθεται οτι χρησιμοποιουμε παλμο βελτιστης μορφης)
Μη ομοιομορφος κβαντιστης Ενας κβαντιστης, με ισαπεχοντα επιπεδα κβαντισμου, δηλαδη με: xk-1 – xk = Δ, k {1,2,…,M} ονομαζεται ομοιομορφος κβαντιστης. Σε μερικες περιπτωσεις ειναι καλλίτερα να εχουμε επιπεδα κβαντισμου με διαφορετικες αποστασεις μεταξυ τους. Αν εξετασουμε την μεση παραμορφωση (MSE) D: βλεπουμε οτι για να γινει το D ελαχιστο πρεπει να επιλεξουμε τα επιπεδα κβαντισμου xk ετσι ωστε το σφαλμα (x- x)2 να γινεται μικρο οταν η pdf f(x) εχει μεγαλη τιμη και να δεχομαστε να είναι μεγαλυτερο οπου η f(x) εχει μικρη τιμη. Βασικη αρχη: Εκει οπου η pdf εχει μεγαλη τιμη εχουμε συσσωρευση των επιπεδων κβαντισμου ~ ~ ~ ~
Μη ομοιομορφος κβαντιστης Παραδειγμα συσσωρευσης των επιπεδων κβαντισμου στις περιοχες οπου η pdf εχει μεγαλυτερες τιμες.
Αλγοριθμος Lloyd-Max Επιτρεπει την σχεδιαση βελτιστου κβαντιστη για οποιοδηποτε αριθμο επιπεδων και για καθε f(x). Ο αλγοριθμος Lloyd-Max απαντα σε δυο βασικες ερωτησεις: Για δεδομενο συνολο επιπεδων κβαντισμου, ποια ειναι τα βελτιστα ορια των ζωνων κβαντισμου? Για δεδομενο συνολο ζωνων κβαντισμου, ποια ειναι τα βελτιστα επιπεδα κβαντισμου? Εαν αυτες οι ερωτησεις τεθουν και απαντηθουν διαδοχικα, τοσο οι ζωνες οσο και τα επιπεδα κβαντισμου συγκλινουν στα βελτιστα.
Ερωτηση #1: Ποια ειναι τα βελτιστα ορια των ζωνων για δεδομενο συνολο επιπεδων κβαντισμου ~ ~ ~ Διδεται ενα συνολο επιπεδων κβαντισμου: {x1, x2,…xΜ} Επιλεγουμε ενα συνολο οριων για τις ζωνες κβαντισμου, {x0, x1,…,xΜ} οποτε η μεση παραμορφωση D ισουται με: Υποθετουμε οτι f(x) = const μεσα στην ζωνη κβαντισμου. Τα βελτιστα ορια των ζωνων κβαντισμου επιλεγονται ετσι ωστε: Βρισκουμε οτι πρεπει παντοτε να κβαντιζουμε στο πλησιεστερο επιπεδο κβαντισμου, δηλαδη:
Ερωτηση #2: Ποια ειναι τα βελτιστα επιπεδα για δεδομενα ορια ζωνων κβαντισμου? Διδεται ενα συνολο οριων ζωνων κβαντισμου: {x0, x1,…, xΜ} Επιλεγουμε ενα συνολο επιπεδων κβαντισμου: {x1, x2,…, xΜ}. Τα βελτιστα xi ικανοποιουν την σχεση: ~ ~ ~ ~ ~ Δηλαδη το xk ειναι το κεντροειδες της ζωνης κβαντισμου
Περιληψη του Αλγοριθμου Lloyd-Max Επιλεγουμε ενα αρχικο συνολο επιπεδων κβαντισμου: {x1, x2,…,xM}. Τα ορια των ζωνων κβαντισμου πρεπει να ειναι στο μεσον των επιπεδων κβαντισμου, δηλαδη: Τα επιπεδα κβαντισμου ειναι τα κεντροειδή των ζωνων: Επαναλαμβανουμε τα δυο τελευταια βηματα μεχρις οτου: ~ ~ ~
Παραδειγμα εφαρμογης του Αλγοριθμου Lloyd-Max Διδεται η τυχαια μεταβλητη x με pdf: 1 f(x) x Εστω οτι τα αρχικα επιπεδα κβαντισμου ειναι τα {1,2,3,4}
Παραδειγμα εφαρμογης του Αλγοριθμου Lloyd-Max (2) Τα ορια των ζωνων κβαντισμου ειναι: x0=0, x1=(1+2)/2=1.5, x2 = (2+3)/2=2.5, x3=(3+4)/2=3.5, x4=. H παραμορφωση στην περιπτωση αυτη ειναι: Τα νεα επιπεδα κβαντισμου ειναι: Συνεχεια
Παραδειγμα εφαρμογης του Αλγοριθμου Lloyd-Max (3) Νεα επιπεδα κβαντισμου (συνεχεια) κ.ο.κ. Στον πινακα συνοψιζουμε την ολη διαδικασια ~ Επαναληψη Επιπεδα {xk} Ορια ζωνων {xk} MSE Αρχικη 1, 2, 3, 4 0, 1.5, 2.5, 3.5, 0.329 1 0.57, 1.92, 2.92, 4.5 0, 1.24, 2.42, 3.71, 0.152 2 0.50, 1.72, 2.93, 4.71 0, 1.11, 2.32, 3.82, 0.131 5 0.41, 1.45, 2.80, 4.85 0, 0.93, 2.12, 3.82, 0.116 10 0.37, 1.31, 2.59, 4.66 0, 0.84, 1.95, 3.63, 0.111
Ενα αλλο παραδειγμα για τον Αλγοριθμο Lloyd-Max Διδεται η Gaussian pdf: Αρχικη εκτιμηση επιπεδων κβαντισμου: {x1= -2, x2= -1, x3=1, x4=2} Επαναληψη Επιπεδα {xk} Ορια ζωνων {xk} MSE Αρχικη -2, -1, 1 2 -, -1.5, 0, 1.5, 0.29 -1.94, -0.62, 0.62, 1.94 -, -1.28, 0, 1.28, 0.14 -1.75, -0.56, 0.56, 1.75 -, -1.16, 0, 1.16, 0.13 5 -1.56, -0.48, 0.48, 1.56 -, -1.02, 0, 1.02, 0.12 -1.51, -0.45, 0.45, 1.51 -, -0.98, 0, 0.98, 0.118 Μη ομοιομορφος κβαντιστης: D=0.1175, E[X2]=1, (S/N)avg=9.3db Ομοιομορφος κβαντιστης: (S/N)avg=9.25 db Για λιγα επιπεδα κβαντισμου δεν εχει και μεγαλη διαφορα ~ ~ ~ ~
Οι επιδοσεις βελτιωνονται για μεγαλυτερα Μ Οι επιδοσεις βελτιωνονται για μεγαλυτερα Μ Παραδειγμα 2ο Ο κβαντισμος μιας Gaussian τυχαιας μεταβλητης Μ SNR (db) Ομοιομορφος SNR (db) Μη-Ομοιομορφος 2 4.4 4.4 4 9.25 9.30 8 14.27 14.62 16 19.38 20.22 32 24.57 26.00 64 29.83 31.89 128 35.13 37.81
Παρατηρησεις επι του Αλγοριθμου Lloyd-Max Για δεδομενη pdf βρισκει τον βελτιστο μη-ομοιομορφο κβαντιστη. Μπορει να χρειασθουν αρκετες επαναληψεις για να συγκλινει (εξαρταται απο την αρχικη εκτιμηση). Ειναι δυνατον να επιλεγουν pdfs και αρχικες εκτιμησεις για τις οποιες ο αλγοριθμος Lloyd-Max συγκλινει σε τοπικο βελτιστο. Πως βρισκουμε τον βελτιστο μη-ομοιομορφο κβαντιστη αν η pdf δεν ειναι γνωστη?? => Γενικευμενος Αλγοριθμος Lloyd-Max. Πως μπορουμε να προσεγγισουμε καλλιτερα το οριο ρυθμου –παραμορφωσης?? => Διανυσματικος κβαντιστης
Σχεση ρυθμου R και παραμορφωσης D Σχεδιαστικοι στοχοι κβαντιστου: Για δεδομενο ρυθμο κωδικοποιησης R, να ελαχιστοποιηθει η παραμορφωση D, Για δεδομενη παραμορφωση D, να ελαχιστοποιηθει ο ρυθμος κωδικοποιησης R Υπενθυμιση: R = fs n bits/sec. Θεμελιωδες Οριο: Η θεωρια πληροφοριων αποδεικνυει οτι για ενα δεδομενο μετρο παραμορφωσης D, υπαρχει μια συναρτηση «Ρυθμου-παραμορφωσης» R(D) η οποια δινει ενα προσεγγισιμο κατωτερο οριο στον ρυθμο κωδικοποιησης R για δεδομενη παραμορφωση D.
Συναρτηση «ρυθμου-παραμορφωσης» R(D) για Gaussian πηγες Αν η x είναι μια Gaussian τυχαια μεταβλητη με τυπικη αποκλιση σx δηλαδη τοτε η συναρτηση «ρυθμου-παραμορφωσης» R(D) ισουται προς: Παρατηρησεις: 1) Η μεγιστη θεωρητικη παραμορφωση είναι D=σx2. Επιτυγχανεται κωδικοποιωντας κάθε δειγμα με 0 (οποτε R=0). 2) D=0 δεν επιτυγχανεται με κανενα R
Ανω οριο της R(D) Θεωρημα: Η Gaussian πηγη απαιτει τον μεγιστο ρυθμο κωδικοποιησης μεταξυ ολων των αλλων πηγων για συγκεκριμενο επιπεδο της μεσης τετραγωνικης παραμορφωσης. Αυτό σημαινει ότι η Gaussian αποτελει “worst case scenario” Επομενως για τυχουσα συναρτηση κατανομης πιθανοτητας είναι Λύνοντας ως προς D για μια Gaussian πηγη εχουμε D=σx2 2-2R και σε dB D = 10log10(σx2) -6R dB
Προβληματα με τον μονοδιαστατο κβαντιστη Ακομα και με τον βελτιστο μονοδιαστατο (scalar) κβαντιστη, οι επιδοσεις δεν φθανουν τις προβλεπομενες απο την Θεωρια «Ρυθμου-παραμορφωσης». Λυση: Ομαδοποιηση των δειγματων σε blocks και κβαντισμος ολου του block δεδομενων καθε φορα- «Διανυσματικος κβαντιστης –Vector Quantizer». Ο διανυσματικος κβαντιστης εχει καλα αποτελεσματα διοτι: Εκμεταλλευεται την συσχετιση μεταξυ δειγματων, και Ακομα και αν δεν υπαρχει συσχετιση παρεχει ενα κερδος στo SNR μεχρι 1.52 db (“shaping gain”)
Διανυσματικος Κβαντιστης Vector Quantizer (VQ) Κβαντιζουμε blocks δεδομενων Υ = (y1,…,yn). n ειναι η διασταση του κβαντιστη. Τα Μ επιπεδα κβαντισμου αντικαθισταται απο Μ διανυσματα κβαντισμου. Οι ζωνες κβαντισμου αντικαθιστανται απο τις περιοχες κβαντισμου Καθε σημειο σε δεδομενη περιοχη κβαντισμου προσεγγιζεται (κβαντιζεται) απο το αντιστοιχο διανυσμα κβαντισμου. Ρυθμος κβαντισμου R = (log2M) / n bits/sample. Ειναι δυνατον να εχουμε κλασματικους ρυθμους
Ομοιομορφος κβαντιστης 2 διαστασεων Μ=16, n=2 Διδονται τα δυο σηματα x1 και x2. Αν κβαντισουμε κάθε σημα χωριστα με κβαντιστη 4 επιπεδων χρειαζομαστε 2 bits/sample. Αν χρησιμοποιησουμε διανυσματικο κβαντιστη 16 επιπεδων όπως του σχηματος χρειαζομαστε R = (log2M) / n =2 bits/sample. Εδώ δεν υπαρχει διαφορα μεταξυ βαθμωτου και διανυσματικου κβαντιστη x2 X Διανυσματα κβαντισμου Περιοχες κβαντισμου x1
Διανυσματικος κβαντιστης Μ=8 περιοχες κβαντισμου , n=2 διαστασεις Ρυθμος κβαντισμου R = (log2M) / n =3/2
Η Bivariate Gaussian pdf
Γιατι είναι αποτελεσματικος ενας VQ Εκμεταλλευεται την συσχετιση μεταξυ δυο τυχαιων σηματων x1 και x2 Αν οι x1 και x2 είναι από κοινου Gaussian με υψηλη συσχετιση οι ισουψεις καμπυλες της από κοινου pdf θα είναι όπως στο σχημα: Μικροτερη παραμορφωση
Γιατι είναι αποτελεσματικος ενας VQ (2) περιοχων κβαντισμου με πιο καταλληλη μορφη. Οι x1 και x2 είναι ασυσχετιστες από κοινου Gaussian Κερδος μορφοποιησης => μεχρι και 1.52 db βελτιωση της D
Διαφορες μεταξυ ομοιομορφου και μη-ομοιομορφου κβαντιστη Εστω οτι το σημα εχει Gaussian pdf, δηλαδη: f(x)=exp(-x2/2)/2π Εστω οτι: {x1 = -1.494, x2 = -0.498, x3 = 0.498, x4 = 1.494}. Με αριθμητικη ολοκληρωση βρισκουμε: D = 0.1188, E[X2]=1, (S/N)avg = 10log10(1/0.1188) = 9.25 db Ο μη ομοιομορφος κβαντιστης εχει καλλιτερα αποτελεσματα. Ο καλλιτερος δυνατος (μη-ομοιομορφος) κβαντιστης 4 επιπεδων εχει: (S/N)avg= 12 db (απο την σχεση D = 10log10(σx2) -6R dB) ~ ~ ~ ~
Companding (συστολοδιαστολη) Οι μη-ομοιομορφοι κβαντιστες μπορουν, για τα περισσοτερα σηματα, να δωσουν καλλίτερα αποτελεσματα απο τους ομοιομορφους κβαντιστες. Ειναι ομως πολυ φθηνοτερο να κατασκευασουμε ADC με ομοιομορφους κβαντιστες. Η συστολοδιαστολη (companding – compressing & expanding) εισαγει μια μη γραμμικοτητα στο σημα πριν τον κβαντισμο. Η μη-γραμμικοτητα εκλεγεται ετσι ωστε το προκυπτον σημα να εχει pdf η οποια να πλησιαζει κατα το δυνατον την ομοιομορφη κατανομη. Ενας τυπικος ADC με ομοιομορφη αποσταση επιπεδων κβαντισμου μπορει να χρησιμοποιηθει μετα τον compandor. H εισαχθεισα μη-γραμμικοτητα αναιρειται με την εισαγωγη της αντιστροφης μη-γραμμικοτητας κατα την μετατροπη σε αναλογικο
Ψηφιακο συστημα επικοινωνιας με compandor Σημα Εισοδου Εξοδου x Compressor ADC Πομπος g(x) Καναλι g-1(x) x Expandor DAC Δεκτης
Τυπικες μη-γραμμικοτητες που χρησιμοποιουνται σε compandors Mu-Law (χρησιμοποιειται στην Β. Αμερικη και στην Ιαπωνια). A-Law (χρησιμοποιειται στην Ευρωπη) συνηθως Α = 87.6 συνηθως μ = 255
Σχεση εισοδου-εξοδου του μ-Law Compandor g(x) x
H pdf ενος σηματος πριν και μετα τον μ – Law compandor PDF πριν PDF μετα Επιθυμητη pdf Επιθυμητο
64 kbit/sec PCM για ψηφιακη τηλεφωνια Χρησιμοποιειται companding με μ = 255 (Β. Αμερικη) και Α=87.6 (Ευρωπη). Γινεται δειγματοληψια της φωνης με 8.000 δειγματα/sec. Καθε δειγμα κωδικοποιειται με 8 bits (ο κβαντιστης ειναι 256 επιπεδων). Ο ρυθμος μεταδοσης δεδομενων ειναι 8x8.000 = 64 kbits/sec
Μετρηση της παραμορφωσης ομιλιας Εκτος απο το MSE εχουμε και εναλλακτικες μεθοδους μετρησης της παραμορφωσης της ομιλιας: Η κατα περιοχες SNR (segmental SNR) Itakura-Saito φασματικη αποσταση Log Spectral Distance Perceptually weighted MSE http://dynamo.ecn.purdue.edu/~ctanner/Distortion_Measures/distortion_measures.html Κανενα απο τα πιο πανω κριτηρια δεν αρκει μονο του για να περιγραψει με ακριβεια την ακουστικη ποιοτητα μιας ομιλιας. Καταφευγουμε σε Υποκειμενικη Αξιολογιση της ποιοτητας της φωνης με το Mean Opinion Score Testing (MOST): Ακροατες βαθμολογουν την ποιοτητα μιας ομιλιας με βαθμους που κυμαινονται μεταξυ 1 (ακατανοητη) και 5 (τελεια ομιλια). Η τηλεφωνικης ποιοτητας φωνη συνηθως βαθμολογειται με 4.3
Τεχνικες Κωδικοποιησης για φωνη Ολες οι μεθοδοι κωδικοποιησης φωνης χρησιμοποιουν κβαντισμο. Πολλες κανουν επιπλεον χρηση ιδιαιτερων χαρακτηριστικων της φωνης: Κωδικοποιηση χρονικης κυματομορφης –προσπαθεια παραστασης των δειγματων της κυματομορφης της φωνης στο πεδιο του χρονου. Φασματικη Μεθοδος Κωδικοποιησης –προσπαθεια παραστασης των φασματικων χαρακτηριστικων της κυματομορφης της φωνης. Κωδικοποιηση βασισμενη στο μοντελο της φωνης. – προσπαθεια αναπαραγωγης του μοντελου της διαδικασιας παραγωγης φωνης
Ποιοτητα φωνης vs ρυθμου κωδικοποιησης Ο ρυθμος κωδικοποησης μπορει να ελαττωθεί με ανταλλαγμα: Την αυξηση της πολύ- πλοκοτητας του κωδικο- ποιητή, ή Την μειωση της ποιοτητας της φωνης
Κωδικοποιηση της κυματομορφης της φωνης Διαφορικη PCM Το σημα της ομιλιας εχει μεγαλη συσχετιση για γειτονικες χρονικες στιγμες. Ο διαφορικος παλμοκωδικοποιητης (DPCM- Differential PCM) κβαντιζει την διαφορα μεταξυ ενος δειγματος και της προβλεπομενης τιμης του η οποια προβλεπεται με γραμμικο συνδυασμο προηγουμενων δειγματων. Συνηθως η διαφορα αυτη ειναι μικρη και με λιγωτερα bits επιτυγχανεται μικρη παραμορφωση Η αντιληπτη ποιοτητα φωνης εξαρταται απο την σχετικη τιμη του σφαλματος κβαντισμου και της εντασεως (ισχυος) της φωνης. Οι προσαρμοζομενοι DPCM (ADPCM – Adaptive DPCM) μετα-βαλλουν το βημα κβαντισμου αναλογα με την ενταση της φωνης. Το ADPCM με 32kbits/sec ειναι πολυ κοινο και ευκολο στην υλοποιηση, χρησιμοποιειται δε ερυτατα (π.χ. στο DECT)
Δομη του DPCM xn yn ~ + yn + rn=rn-1+yn+qn Σ Σ =yn+qn + - rn-1 xn-1 Quantizer Σ Σ =yn+qn + - Delay T=1 Delay T=1 rn-1 xn-1 Συσσωρευση των σφαλματων κβαντισμου ~ yn xn + yn=yn+qn ~ Quantizer yn Σ ^ xn - ~ ~ yn ´ + + yn-1 ´ Delay T=1 Delay T=1 Σ Σ ^ xn-1 + + ^ ~ Τελικα xn = yn ´ Μη-συσσωρευση των σφαλματων κβαντισμου
Predictive DPCM ~ yn + ^ Σ xn - ´ Quantizer Predictor Σ yn ~ ´ xn ^ + - O predictor χρησιμοποιει τα p προηγουμενα κβαντισμενα δειγματα για να προβλεψει το παρον δειγμα. Κβαντιζεται η διαφορα τους. Τα αi επιλεγονται ετσι ωστε να ελαχιστοποιειται το μεσο τετραγωνικο σφαλμα προβλεψης: Θετουμε:
Διαμορφωση DELTA (DM) ~ yn yn=±1 xn + ~ Ακραια περιπτωση κωδικοποιητη PCM στον οποιο το σημα υφισταται υπερ-δειγματοληψια και κωδικοποιειται με 1 bit/sample. Ο Διαμορφωτης Delta μπορει να υλοποιηθει με εναν εξαιρετικα απλο κβαντιστη 1 επιπεδου. H Adaptive DM με 16 kbits/sec μπορει να παραγει ηχο καλης ποιοτητας 1 bit Quantizer yn ^ Σ xn - Δ X X ~ ~ yn ´ + yn-1´ + Delay T=1 Delay T=1 Σ Σ + +
Φασματικες μεθοδοι κωδικοποιησης Subband Coding H αντιληψη της ακουστικης ποιοτητας εξαρταται απο την ζωνη συχνοτητων. Στις πολυ χαμηλες ή πολυ υψηλες συχνοτητες μπορουν να γινουν ανεκτα μεγαλυτερα MSE. Οι Subband Coders διαχωριζουν το σημα σε πολλες ζωνες με καταλληλα φιλτρα. Τα σηματα σε καθε ζωνη μετατρεπονται σε ψηφιακα με το standard PCM αλλα με διαφορετικο ρυθμο R σε καθε ζωνη.
Φασματικες μεθοδοι κωδικοποιησης Adaptive Transform Coding Τα δειγματα του σηματος ομαδοποιουνται σε πλαισια. Τα συσχετισμενα στον χρονο δειγματα μετατρεπονται σε ασυσχετιστα (ελπιζουμε...) φασματικα δειγματα κανοντας FFT ή DCT (Discrete Cosine Transform). Τα φασματικα δειγματα παριστανονται συμφωνα με την βαρος τους στην αντιληψη της φωνης Ο βελτιστος κωδικοποιητης φωνης “half-rate” (4 kbits/sec) χρησιμοποιει Adaptive Transform Coding ( μαζι με διανυσματικο κβαντισμο και Γραμμικη προβλεψη)
Τεχνικες κωδικοποιησης βασιζομενες σε μοντελα Κωδικοποιητες φωνης Γραμμικης προβλεψης – Linear Predictive Speech Coders (LPC) Το σημα της φωνης διαιρειται σε πλαισια διαρκειας 20 ms. Η ομιλια μοντελοποιειται σαν θορυβος (αερας απο τους πνευμονες) που διεγειρει ενα γραμμικο φιλτρο (λαρυγγας, φωνητικες χορδες, και στομα – ρινικη κοιλοτητα). Ο LPC κβαντιζει την ακολουθια διεγερσης, τις παραμετρους του φιλτρου, και το κερδος του φιλτρου, και μεταδιδει τα δυαδικα δεδομενα στον δεκτη. Συχνα χρησιμοποιειται διανυσματικος κβαντιστης Ακολουθια Διεγερσης Εξοδος Φωνης Φιλτρο Προβλεψης Χ Κερδος Φιλτρου Παραμετροι Φιλτρου
Vector Sum Excited Linear Prediction (VSELP) Χρησιμοποιειται στη ψηφιακη κινητη τηλεφωνια της Β. Αμερικης (προτυπο IS-136) Πλαισια των 20 ms. Καθε πλαισιο παριστανεται με 159 bits. Ο ρυθμος δεδομενων ειναι περιπου 8 kbits/sec. Ενας διανυσματικος κβαντιστης δυο βαθμιδων χρησιμοποιειται για τον κβαντισμο της ακολουθιας διεγερσης. Μερικα bits (οπως το κερδος του φιλτρου) ειναι πιο σημαντικα για την ποιοτητα της φωνης απο οτι αλλα. Αυτα προστατευονται με κωδικοποιηση διορθωσης λαθων.
Συγκριση μεθοδων κωδικοποιησης φωνης Τυπος Ρυθμος (kb/s) Πολυπλοκοτητα(MIPS) Καθυστερηση (ms) Ποιοτητα PCM 64 0.01 0 υψηλη ADPCM 32 0.1 0 υψηλη Delta Mod. 16 0.1 0 υψηλη Sub-Band 16 1 25 υψηλη VSELP 8 ~100 35 Καλη Θεωρια 1 ?? ?? υψηλη
Κωδικοποιηση εικονας και Video Εικονα 1000 x 1000 pixels με 8 bits για καθε ενα απο τα τρια χρωματα χρειαζεται 24 Mbits για να κωδικοποιηθει. Το video χρειαζεται περιπου 20 frames/sec. Τα standards συμπιεσης ειναι βασικα για την αναπτυξη του ψηφιακου video. JPEG: Συμπιεση εικονας κατα 20 φορες τουλαχιστον MPEG: Συμπιεση video κατα 100 φορες ή περισσοτερο