ΗΜΥ 007 – Τεχνολογία Πληροφορίας Διάλεξη 7 ΗΜΥ 007 – Τεχνολογία Πληροφορίας Διάλεξη 7 Οπτική Πληροφορία Μέρος Β 16 Φεβρουαρίου, 2004 Χρυσάνθη Πρέζα, D.Sc. Επισκέπτρια Επίκουρη Καθηγήτρια TΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ
Περίληψη Θέματα για σήμερα Επανάληψη και ολοκλήρωση Απεικόνιση πληροφορίας Δημιουργία εικόνας Αναπαράσταση εικόνας Ψηφιακή εικόνα, κβαντισμός Απόδοση χρώματος (αποχρώσεις γκρίζου, πλήρες χρώμα ) Αναπαράσταση βίντεο
Υλικό Αναφοράς Cyganski, D., Orr, A. O., and Vaz, R. F., Information Technology Inside and Outside, Prentice Hall, 2001, Κεφ. 5, σελίδες 74-93 Κεφ. 7, σελίδες 108-114 Κεφ. 8, σελίδες 126-128,131-133 Demo programs στον οπτικό δίσκο Web Colors http://www.webcolors.freeserve.co.uk/chooser.htm Bit depth, color depth http://archive.devx.com/projectcool/developer/gzone/basics/04-tech/bitdepth.html
Φωτογραφική απεικόνιση πληροφορίας Συστήματα φωτογραφικής απεικόνισης πληροφορίας Φωτογραφική κάμερα μάτι χρησιμοποιούν ορατό φως προβολή τοπίου ή αντικειμένου από ένα φακό πάνω στο επίπεδο απεικόνισης Φιλμ αμφιβληστροειδής χιτώνας (retina) του ματιού Το είδωλο ή η εικόνα είναι η προβολή (projection) ενός αντικειμένου από τρις διαστάσεις σε δύο
Ψηφιακές εικόνες Δημιουργία ψηφιακών εικόνων Χρήση ψηφιακής κάμερας Χρήση scanner για την σάρωση αναλογικών εικόνων (π.χ. φωτογραφιών) Χαρακτηριστικά Στοιχεία εικόνας (picture elements pixels) Αναπαράσταση μιας εικόνας μέσω ενός ορθογωνίου πλέγματος (grid) από pixels Ανάλυση ή ευκρίνεια εικόνας (picture resolution) Πλέγμα με 13 x 13 στοιχεία = 169 pixels
Αναλογική σε ψηφιακή μετατροπή Βασίζεται σε προσεγγίσεις αναλογικές εικόνες έχουν άπειρες διαστάσεις και κάθε σημείο μπορεί να έχει μία οποιαδήποτε τιμή η ψηφιακή εικόνα έχει πεπερασμένες διαστάσεις και τιμές => στην μετατροπή χάνεται μέρος της οπτικής πληροφορίας Βασίζεται σε “trade-offs” (αντιπραγματισμούς, ανταλλαγές) Μέγεθος εικόνας αριθμός bits = (αριθμός όλων των pixel) x (bits / pixel) Ανάλυση ή ευκρίνεια Εξαρτάται από την εφαρμογή στην οποία η εικόνα θα χρησιμοποιηθεί την δυνατότητα που έχουμε για μετατροπή, αποθήκευση και μετάδοση της εικόνας (ορθότητα) το κόστος και το κονδύλι που έχουμε Την ακρίβεια που χρειαζόμαστε δεν είναι άπειρη! Ψηφιακή εικόνα Πλέγμα 13 x 13 Κάθε στοιχείο έχει μία περιορισμένη τιμή που χαρακτηρίζεται από ένα κώδικα ψηφίων
Παράδειγμα ψηφιακής εικόνας Η εικόνα των λουλουδιών αποτελείται από πολύ μικρά στοιχεία Τα στοιχεία είναι αντιληπτά όταν μεγεθύνουμε μια περιοχή αρκετά Ο αριθμός στοιχείων μιας εικόνας εξαρτάται από την ψηφιοποίηση που κάνουμε και καθορίζει την ανάλυση της εικόνας
Ψηφιοποίηση μίας εικόνας 256 x 256 = 65.536 pixels 128 x 128 = 16.384 pixels 64 x 64 = 4.096 pixels 16 x 16 = 256 pixels
Αναπαράσταση εικόνας Δύο βασικές αποφάσεις ψηφιακής αναπαράστασης Αριθμός στοιχείων εικόνας <= ψηφιοποίηση <=> ανάλυση εικόνας Αριθμός τιμών (intensity values) για κάθε στοιχείο εικόνας <= κβαντισμός Κβαντισμός Η συνεχές τιμή ενός pixel στρογγυλεύεται σε μία τιμή που αναπαριστάται από τον δυαδικό κώδικα που επιλέγουμε Κώδικας με κ bits δίνει 2κ τιμές για κάθε pixel Γενικά Διτονικές εικόνες (bitonal) 1 bit για κάθε pixel (0 για μαύρο και 1 για άσπρο) Εικόνες συνεχούς τόνου (continuous tone images) ένα ή περισσότερα bits για κάθε pixel κλίμακες γκρίζου (gray scale) π.χ. με 6 bits έχουμε 64 τιμές 000000 … 111111 μαύρο … άσπρο έγχρωμες (color) Ανάμιξη ποσοτήτων κόκκινου, πράσινου και μπλε χρώματος ψηφιοποίηση 3 αριθμών για τις ποσότητες
Κβαντισμός μιας εικόνας Απόδοση χρωμάτων (color encoding) Συσχέτιση κάθε στοιχείου εικόνας με ένα χρώμα μέσω ενός αριθμού από bits Ασπρόμαυρη εικόνα Εικόνα σε επίπεδα του γκρίζου (gray level quantization) Έγχρωμη εικόνα 1 bit ασπρόμαυρη 6 bits 64 επίπεδα γκρίζου 3 bits 8 επίπεδα γκρίζου
Προσθετική Παραγωγή Χρώματος Αποχρώσεις χρωμάτων στο ορατό φάσμα Ένα μεγάλο μέρος του ορατού φάσματος μπορεί να φτιαχτεί από τη μίξη τριών βασικών χρωμάτων: Κόκκινο, Πράσινο και Μπλε (Red, Green, Blue - RGB) Είναι προσθετικά χρώματα: η μίξη και των τριών χρωμάτων δημιουργεί το λευκό χρώμα Ένα χρώμα αναπαριστάται με 3 αριθμούς που δείχνουν την ποσότητα των χρωμάτων Η ψηφιοποίηση γίνεται όπως πριν αλλά τώρα για 3 αριθμούς π.χ. 3 bits για κάθε RGB χρώμα => 9 bits/pixel => 29 = 512 χρώματα Για πλήρες χρώμα (full color) το πρότυπο είναι 24 bits/pixel δηλ. 8 bits για κάθε χρώμα 100% κορεσμός 0% κορεσμός
Απόδοση χρωμάτων 24 bit full color 16 bit color (8 bits για το καθένα , κόκκινο, πράσινο και μπλε) 16 bit color 4 bit color 8 bit color
Παράδειγμα με 16 bits Κόκκινο Πράσινο Μπλε 5 bits 6 bits 5 bits Κόκκινο Πράσινο Μπλε 5 bits 6 bits 5 bits 32 values 64 values 32 values Σύνολο 32 x 64 x 32 = 65,536 [64k] pixels
Από εικόνες σε βίντεο Το βίντεο είναι η “ψευδαίσθηση” κινούμενης εικόνας που προκαλείται από την ταχεία προβολή μιας σειράς ανεξάρτητων εικόνων με μικρές διαφορές. Οι (μικρές) διαφορές ανάμεσα στις εικόνες γίνονται αντιληπτές σαν κίνηση των στοιχείων της εικόνας. Η ταχύτητα προβολής πρέπει να ξεπερνά τις 40 εικόνες το δευτερόλεπτο Βασισμένο σε ερευνητικές μελέτες που έδειξαν ότι η αντίδραση του οπτικού μας συστήματος σε αλλαγές είναι περιορισμένη Αυτό το φαινόμενο οδήγησε στην εφεύρεση της κινηματογραφικής μηχανής Μικρότερη ταχύτητα προκαλεί την αίσθηση τρέμουλου (flickering)
Αναπαράσταση σήματος βίντεο Δομή σήματος Αποτελείται από πλαίσια (frames) Κάθε πλαίσιο αποτελείται από έναν αριθμό οριζόντιων γραμμών σάρωσης Υπάρχουν διαφορετικοί τρόποι αναπαράστασης χρωμάτων Ρυθμός πλαισίων Ο αριθμός των πλαισίων που παράγονται από ένα σήμα βίντεο ανά sec Τυπικές τιμές: 25-75 πλαίσια/sec Όχι τρεμόσβημα όταν παράγονται 40 πλαίσια/sec Ελάχιστο όριο για ανθρώπινο μάτι: 15 πλαίσια/sec Πλήθος γραμμών σάρωσης Σταθερό για όλα τα πλαίσια. Ρυθμός σάρωσης (scan rate) = ( αριθμός γραμμών σάρωσης) * (ρυθμός πλαισίων)
Συμπίεση εικόνας Το μέγεθος μιας εικόνας είναι πολύ μεγάλο π.χ. Εικόνα μεγέθους Α4 δημιουργημένη από ένα σαρωτή με 300 pixels ανά ίντσα και με χρήση του RGB μοντέλου (24 bits, 8 ανά χρώμα) καταλαμβάνει 20 Mbytes μνήμης Δύο κατηγορίες τεχνικών συμπίεσης Χωρίς απώλειες (lossless): η εικόνα που παράγεται μετά από συμπίεση και αποσυμπίεση της αρχικής είναι της ίδιας ποιότητας Με απώλειες (lossy): η εικόνα που παράγεται μετά από συμπίεση και αποσυμπίεση της αρχικής είναι κατώτερης ποιότητας Ο βαθμός αποτελεσματικότητας μιας τεχνικής συμπίεσης είναι συνήθως αντιστρόφως ανάλογος της διατήρησης ποιότητας της αρχικής εικόνας Ο τύπος (format) εικόνας σχετίζεται και με τον τρόπο συμπίεσής της GIF (Graphics Interchange Format) – περιορίζεται στην αναπαράσταση εικόνων μέσω 256 χρωμάτων (8 bits of color depth) JPEG (Joint Photographic Experts Group) – εκατομμύρια χρωμάτων (24 bits of color depth)
Παραδείγματα GIF και JPEG Εικόνα με 115 x 87 pixels 2 χρώματα 1 bit GIF 1,329 bytes 16 χρώματα 4 bit GIF 4,407 bytes 256 χρώματα 8 bit GIF 8,822 bytes 16,777,216 χρώματα 24 bit JPEG 4,321 bytes Μέγιστο όριο GIF Καλύτερη συμπίεση Bit depth (βάθος ψηφίου) = αριθμός bit που χρησιμοποιείται για κάθε pixel Color depth (βάθος χρώματος) = αριθμός χρωμάτων που χρησιμοποιείται για κάθε pixel
GIF Αναπτύχθηκε από την CompuServe με στόχο τη διευκόλυνση της ανταλλαγής εικόνων μέσω δικτύου. Υποστηρίζει συμπίεση εικόνας που βασίζεται στο αλγόριθμο LZW (Lempel-Ziv-Welch). Ο αλγόριθμος αυτός ανήκει στην κατηγορία των διανυσματικών τεχνικών συμπίεσης και λειτουργεί χωρίς απώλειες. Ο λόγος συμπίεσης (compression ratio) που επιτυγχάνει είναι 4:1 αλλά περιορίζεται σε εικόνες βάθους χρώματος των 8bits (256 χρώματα). Προτερήματα: λειτουργεί χωρίς απώλειες για εικόνες βάθους 8 bits είναι ιδανικός για εικόνες με πολλές ακμές και γωνίες όπως γραμμικά σχέδια. χρησιμοποιείται ευρέως και ελεύθερα Μειονεκτήματα: δεν είναι κατάλληλο για εικόνες με πολλά χρώματα οι λόγοι συμπίεσης είναι μικροί και δεν μπορούν να ανταλλαχθούν με ποιότητα εικόνας δεν μπορεί να χρησιμοποιηθεί για κινούμενη εικόνα δεν είναι ανεξάρτητος από την ανάλυση της εικόνας
Το πρότυπο JPEG Σχεδιάστηκε από την ομάδα Joint Photographic Expert Group σε συνεργασία με την Διεθνή Ένωση Τηλεπικοινωνιών (ITU-TS) Μπορεί να δώσει διαφορετικό αποτέλεσμα ανάλογα με τις απαιτήσεις που έχουμε για την ποιότητα της εικόνας και το λόγο συμπίεσης 10:1 έως 20:1 – υψηλή ποιότητα 30:1 έως 50:1 – μέτρια ποιότητα 60:1 έως 100:1 – κακή ποιότητα Πετυχαίνει συμπίεση του αρχικού μεγέθους ακόμη και μικρότερο του ενός δέκατου χωρίς ορατές απώλειες στην ποιότητα της εικόνας. Βασίζεται στη Μείωση της χρωματικής πληροφορίας Συμπίεση των πληροφοριών φωτεινότητας και απόχρωσης
JPEG (συν.) Χρησιμοποιείται κυρίως για (ασπρόμαυρες ή έγχρωμες) εικόνες, αλλά και για βίντεο (Motion JPEG) Υλοποιείται μέσω είτε μόνο ειδικού λογισμικού είτε συνδυασμού λογισμικού και hardware (ειδικών καρτών) Ο χρήστης μπορεί να ορίσει την ποιότητα της εικόνας που θα παραχθεί, το χρόνο επεξεργασίας της συμπίεσης και το μέγεθος της συμπιεσμένης εικόνας Εκτός από τις γενικές απαιτήσεις που πρέπει να ικανοποιεί κάθε τεχνική συμπίεσης, ισχύουν επίσης τα εξής: Η τεχνική είναι ανεξάρτητη του μεγέθους ή του περιεχομένου της εικόνας και εφαρμόσιμη σε οποιοδήποτε είδος εικόνας και pixel aspect ratio Η αναπαράσταση των χρωμάτων πρέπει να είναι ανεξάρτητη από τη συγκεκριμένη υλοποίηση της τεχνικής Ο βαθμός συμπίεσης και η ποιότητα της εικόνας που επιτυγχάνεται πρέπει να είναι όσο το δυνατόν καλύτερα
Άλλοι τύποι αρχείων εικόνας BMP Bitmap τύπος που υποστηρίζουν τα MS Windows ίσως ο πιο απλό τύπος - απλώς περιγράφει το τρόπο με τον οποίο θα αποθηκευτούν τα bits της εικόνας σε ένα αρχείο δεν προσφέρει καμιά δυνατότητα συμπίεσης. TIFF Tagged Image File Format αναπτύχθηκε από τις εταιρείες Aldus και Microsoft χρησιμοποιείται ευρέως στην ανταλλαγή εικόνων αποτελείται από ένα σύνολο εικόνων, με μια κεφαλίδα (header) να καθορίζει τις παραμέτρους της κωδικοποίησης. Δεν περιλαμβάνει αλγορίθμους συμπίεσης.
Περίληψη - Τύπος αρχείων εικόνας Τύπος Αρχείου Περιγραφή BMP standard Windows format (true color) TIFF Tag Image File Format GIF Graphics Interchange Format (8-bit) διαθέτει μέθοδο συμπίεσης Lempel-Ziv-Welch - LZW) JPΕG Joint Photographic Experts Group (true color, διαθέτει την ομώνυμη μέθοδο συμπίεσης )
Στην συνέχεια … Αναπαράσταση Ηχητικής πληροφορίας: βασικές γνώσεις ηχητικών σημάτων (συχνότητα, εύρος ζώνης, φάσμα) μετατροπή ηχητικού σήματος αναλογικό/ψηφιακό (A/D)