Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
1
Ψηφιακή Επεξεργασία Εικόνας
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Ψηφιακή Επεξεργασία Εικόνας Ενότητα 1 : Εισαγωγικές έννοιες Ιωάννης Έλληνας Τμήμα Η/ΥΣ
2
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς.
3
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους.
4
Σκοποί ενότητας Η ενότητα αυτή παρουσιάζει τις εισαγωγικές έννοιες στην επεξεργασία εικόνας, όπως την παράσταση των ψηφιακών εικόνων, τα χρωματικά συστήματα και τις εντολές στο Matlab για τον χειρισμό των εικόνων.
5
Περιεχόμενα ενότητας Τι είναι η ψηφιακή εικόνα
Τυπικό σύστημα παραγωγής ψηφιακής εικόνας Εισαγωγικές έννοιες Χρωματικά συστήματα Οι εικόνες στο Matlab Το ιστόγραμμα
6
Τι είναι η ψηφιακή εικόνα
Σχήμα 1.1 (α) color image (β) gray scale (γ) binary image Το διακεκριμένο σήμα Η μετάβαση από τον αναλογικό στο ψηφιακό κόσμο συνεπάγεται τη μετατροπή των αναλογικών σημάτων σε ψηφιακά. Έτσι, το αναλογικό σήμα μιας εικόνας μεταφέρεται στον ψηφιακό κόσμο με τη μορφή διακεκριμένου σήματος, που έχει τη μορφή ψηφιακών πινάκων. Μια ψηφιακή εικόνα μπορεί να είναι: - δυαδική (binary image). μονοχρωματική με αποχρώσεις του γκρι (gray level ή gray scale image). - έγχρωμη (color image).
7
Τυπικό σύστημα παραγωγής ψηφιακής εικόνας
Τυπικό σύστημα παραγωγής ψηφιακής εικόνας Το αισθητήριο μετατρέπει το φως σε ηλεκτρικό ρεύμα στους άξονες (x,y), το οποίο δειγματοληπτείται, κβαντίζεται και ψηφιοποιείται μέσω ενός μετατροπέα A/D. Η ψηφιακή εικόνα (gray scale), η οποία παράγεται, συμβολίζεται με ένα δισδιάστατο πίνακα Μ × Ν pixels. Σχήμα 1.2 Μπλοκ διάγραμμα σύλληψης εικόνας και μορφή ψηφιακής εικόνας.
8
Εισαγωγικές έννοιες (1)
Μια ψηφιακή εικόνα αποχρώσεων του γκρι, διαστάσεων Μ x Ν , παριστάνεται από έναν δισδιάστατο πίνακα ακεραίων αριθμών: I(i,j) με i = 1…Μ και j = 1…Ν (1.1) όπου 0 ≤ I(i,j) ≤ L – 1 . Το L ισούται συνήθως με μια δύναμη του 2, δηλαδή L = 2k , με συνηθέστερη τιμή το k = 8 , που αντιστοιχεί σε 256 αποχρώσεις του γκρι. Η τιμή I(i,j) αντιπροσωπεύει τη φωτεινότητα του εικονοστοιχείου (pixel) (i,j). Η απλούστερη μορφή μιας εικόνας είναι η δυαδική μορφή. Μια δυαδική εικόνα έχει μόνο δύο στάθμες φωτεινότητας, που συνήθως είναι το μαύρο και το άσπρο (L=2 και k=1). Το μαύρο αντιστοιχεί στην τιμή 0 και το άσπρο στην τιμή 1. Μια δυαδική εικόνα καταλαμβάνει μικρότερη μνήμη και η επεξεργασία της απαιτεί μικρότερο υπολογιστικό κόστος. Σε δυαδική μορφή μπορούν να απεικονισθούν σημαντικές πληροφορίες όπως είναι το εμβαδόν και η θέση των αντικειμένων, η μορφή αντικειμένων κ.α.
9
Εισαγωγικές έννοιες (2)
Σημειώνεται ότι πάρα πολλές εφαρμογές της ΨΕΕ, όπως η οπτική αναγνώριση χαρακτήρων (OCR: Optical Character Recognition), η αναγνώριση υπογραφής (signature recognition), η αναγνώριση αποτυπωμάτων (fingerprint recognition), γίνονται συνήθως με τη χρήση των δυαδικών εικόνων. Οι έγχρωμες ψηφιακές εικόνες αποτελούν το μέσο για την απεικόνιση του πραγματικού κόσμου. Μια έγχρωμη ψηφιακή εικόνα αποτελείται από τρεις gray scale εικόνες. Δηλαδή το χρώμα του κάθε εικονοστοιχείου έχει τρεις συνιστώσες που αντιστοιχούν στις αποχρώσεις των αντίστοιχων εικονοστοιχείων των τριών εικόνων. Μια ψηφιακή έγχρωμη εικόνα διαστάσεων Μ × Ν μπορεί να παρασταθεί ως: Ic(i,j) με i = 1…Μ και j = 1…Ν (1.2) όπου 0 ≤ Ic(i,j) ≤ L – 1 , για κάθε c = 1, 2, 3. Έτσι το χρώμα του κάθε pixel (i,j) προκύπτει από το συνδυασμό τριών χρωματικών συνιστωσών: Color(i,j) = [ I1(i,j) , I2(i,j) , I3(i,j) ] (1.3)
10
Εισαγωγικές έννοιες (3)
Το χρωματικό σύστημα RGB Σχήμα 1.3 Η αρχική έγχρωμη (RGB) εικόνα και οι τρεις συνιστώσες της red, green, blue. Για παράδειγμα, στο χρωματικό σύστημα RGB, το κάθε χρώμα συντίθεται από τα χρώματα κόκκινο (Red), πράσινο (Green) και μπλε (Blue). Στο Σχήμα 1.3 παρουσιάζεται μια RGB εικόνα και η διάσπασή της στα τρία επιμέρους χρώματα.
11
Εισαγωγικές έννοιες (4)
Το k αποδίδει το πλήθος των αποχρώσεων και καλείται βάθος χρώματος (color depth). Μεγαλύτερο βάθος σημαίνει περισσότερες διαθέσιμες αποχρώσεις. Ο αριθμός των bits μιας εικόνας είναι b=M x N x k. Προφανώς μια έγχρωμη εικόνα απαιτεί τριπλάσιο αριθμό bits από μια gray scale εικόνα.
12
Εισαγωγικές έννοιες (5)
Σχήμα 1.4 Μεταβολή της ευκρίνειας κρατώντας σταθερό το k και μεταβάλλοντας τις διαστάσεις της εικόνας. Η ευκρίνεια μιας εικόνας καθορίζει το πόσο καλά μπορούμε να βλέπουμε τις λεπτομέρειές της. Ισούται με το πλήθος των pixels ανά μονάδα επιφανείας, και συνήθως μετριέται σε pixels / in2 ή διαφορετικά σε d.p.i ( dots per inch ). Είναι φανερό ότι η ευκρίνεια εξαρτάται τόσο από τις διαστάσεις, όσο και από το πλήθος των αποχρώσεων της κάθε εικόνας. Αν για παράδειγμα κρατήσουμε σταθερό το βάθος χρώματος και μεταβάλλουμε (μειώνουμε) τις διαστάσεις μιας εικόνας, τότε η εικόνα θα εμφανίσει το φαινόμενο του σκακιού (checkboard). Δηλαδή η εικόνα θα κατατεμαχιστεί σε ομοιόμορφες χρωματικά περιοχές, όπως στο διπλανό Σχήμα 1.4.
13
Εισαγωγικές έννοιες (6)
Αν από την άλλη πλευρά κρατήσουμε σταθερές τις διαστάσεις και μειώσουμε το βάθος χρώματος, τότε θα εμφανιστούν πάλι οπτικά ομοιόμορφες χρωματικές περιοχές, που όμως η ευκρίνειά τους θα καθορίζεται από το k και τη συγγένεια των τοπικών αποχρώσεων. Αυτό φαίνεται στο Σχήμα 1.5. Σχήμα 1.5 Μεταβολή της ευκρίνειας κρατώντας σταθερές τις διαστάσεις της εικόνας και μεταβάλλοντας το k. Εικόνα 1η : k=24 bit ( 16 εκατομμύρια χρώματα ) Εικόνα 2η : k=8 bit ( 256 χρώματα ) Εικόνα 3η : k=4 bit ( 16 χρώματα ) Εικόνα 4η : k=1 bit ( 2χρώματα )
14
Εισαγωγικές έννοιες (7)
Η μορφή της ψηφιακής εικόνας, μετά τη δειγματοληψία και την κβάντιση, είναι ένας πίνακας (matrix) πραγματικών αριθμών. Αντίθεση ή contrast σε μια εικόνα είναι η κλίμακα από τη σκοτεινότερη στη φωτεινότερη περιοχή της και ορίζεται ως:
15
Εισαγωγικές έννοιες (8)
Ψηφιοποίηση εικόνας
16
Χρωματικά συστήματα (1)
Το εκλαμβανόμενο χρώμα κάποιου αντικειμένου από το ανθρώπινο μάτι καθορίζεται ουσιαστικά από τη φύση του φωτός που ανακλάται από αυτό. Το ορατό φως είναι συγκροτημένο από ένα σχετικά περιορισμένο εύρος συχνοτήτων μέσα στο σύνολο του ηλεκτρομαγνητικού φάσματος. Ένα σώμα που αντανακλά με τον ίδιο τρόπο (προσδίδει ίσες ποσότητες φωτός) όλα τα μήκη κύματος του ορατού φάσματος εμφανίζεται λευκό. Ωστόσο, ένα σώμα που «ευνοεί» ένα περιορισμένο εύρος από το οπτικό φάσμα, τότε αυτό εμφανίζεται να έχει κάποια χρωματική απόχρωση. Για παράδειγμα, τα αντικείμενα που εμφανίζονται με πράσινο χρώμα αντανακλούν το φως εκείνο που το μήκος κύματος κυμαίνεται κυρίως στο φάσμα των 500 με 570 nm (10-9m), ενώ απορροφούν το μεγαλύτερο μέρος της ενέργειας του υπόλοιπου φάσματος
17
Χρωματικά συστήματα (2)
Ο χαρακτηρισμός του φωτός είναι βασικός στην κατανόηση του χρώματος. Αν το φως είναι άχρωμο, τότε το μόνο χαρακτηριστικό του γνώρισμα είναι η ένταση (intensity). Ένα παράδειγμα αχρωματικής όψης είναι αυτή της ασπρόμαυρης τηλεόρασης όπου έχουμε απουσία χρώματος με εναλλαγή μόνο της ποσότητας φωτός. Με αυτόν τον τρόπο δημιουργούνται διαφορετικά επίπεδα του γκρι. Συνεπώς, ο όρος επίπεδο του γκρι αναφέρεται στη βαθμωτή μέτρηση της έντασης που διακυμαίνεται από το μαύρο στο γκρίζο και καταλήγει στο λευκό. Οι τρεις βασικές ποσότητες που χρησιμοποιούνται για να περιγράψουν την ποιότητα της πηγής του χρωματικού φωτός είναι η ακτινοβολία (radiance) , η φωτεινότητα (luminance) και η λαμπρότητα (brightness). Η ακτινοβολία είναι το τελικό ποσό ενέργειας που εκπέμπεται από την πηγή του φωτός, και μετριέται συνήθως σε Watt.
18
Χρωματικά συστήματα (3)
Η φωτεινότητα δίνει μια μέτρηση του ποσού της ενέργειας που λαμβάνει ένας παρατηρητής και μετριέται σε lumens. Η λαμπρότητα είναι ένα υποκειμενικό μέγεθος το οποίο πρακτικά είναι αδύνατο να υπολογισθεί. Ενσωματώνει την αχρωματική έννοια της έντασης του φωτός (intensity). Εξαιτίας της δομής του ανθρώπινου ματιού, όλα τα χρώματα θεωρούνται συνδυασμοί των τριών βασικών χρωμάτων (primary colors): του κόκκινου (Red), του πράσινου (Green) και του μπλε (Blue). Για λόγους τυποποίησης καθορίστηκαν οι ακόλουθες τιμές: Κόκκινο = 700 nm / Πράσινο = 546,1 nm / Μπλε = 435,8 nm. Τα βασικά χρώματα μπορούν να αναμιχθούν ώστε να παραχθούν τα δευτερεύοντα χρώματα (secondary colors). Αυτά είναι τα: ματζέντα (κόκκινο και μπλε), κυανό (πράσινο και μπλε), κίτρινο (κόκκινο και πράσινο). Ο συνδυασμός των τριών βασικών χρωμάτων ή ενός δευτερεύοντος με το αντίθετο βασικό, παράγουν το λευκό χρώμα αν αναμιχθούν με συγκεκριμένες εντάσεις φωτός. Τα αποτελέσματα αυτά φαίνονται στο παρακάτω Σχήμα 1.6.
19
Χρωματικά συστήματα (4)
Τα χαρακτηριστικά με τα οποία γίνεται ο διαχωρισμός μεταξύ των χρωμάτων είναι η λαμπρότητα (brightness), η απόχρωση (hue) και η χρωματική καθαρότητα ή ποσότητα χρώματος (saturation). Η λαμπρότητα είναι ένα υποκειμενικό μέγεθος το οποίο πρακτικά είναι αδύνατο να υπολογισθεί. Ενσωματώνει την αχρωματική έννοια της έντασης του φωτός (intensity). Η απόχρωση αντιπροσωπεύει το υπερισχύον χρώμα που εκλαμβάνεται από ένα παρατηρητή. Η χρωματική καθαρότητα αναφέρεται στη σχετική αγνότητα ή στο ποσό του λευκού φωτός όταν αυτό αναμιγνύεται με μια απόχρωση. Π.χ.: το κόκκινο έχει πλήρη χρωματική καθαρότητα, ενώ το ροζ (κόκκινο και άσπρο) έχει μικρότερη χρωματική καθαρότητα.
20
Χρωματικά συστήματα (5)
Σχήμα 1.6 Στην 1η εικόνα έχουμε την ανάμειξη των βασικών χρωμάτων και στη 2η των δευτερευόντων.
21
Χρωματικά συστήματα (6)
Μοντέλο RGB: Το μοντέλο αυτό απλοποιεί αρκετά την σχεδίαση γραφικών συστημάτων, αλλά δημιουργεί δυσκολίες στην ανάπτυξη αλγορίθμων λόγω της συσχέτισης των χρωματικών συνιστωσών του. Για παράδειγμα η εξισορρόπηση ιστογράμματος λειτουργεί μόνο επί της φωτεινότητας μίας εικόνας και πραγματοποιείται πιο εύκολα στο μοντέλο HSI. Έτσι πολλές φορές είναι η αναγκαία η μετατροπή ενός χρωματικού μοντέλου σε ένα άλλο. Χρησιμοποιείται συνήθως σε έγχρωμες οθόνες και κάμερες. Η μετατροπή RGB σε κλίμακα γκρι γίνεται για το σύστημα NTSC με τη σχέση: Gray=0.299R G B (1.10) ή μπορεί να δοθεί σαν ο μέσος όρος των τριών χρωματικών συνιστωσών: Gray=0.333R G B (1.11)
22
Χρωματικά συστήματα (7)
Μοντέλο CMY ή CMYK: Το μοντέλο αυτό ορίζεται από τα χρώματα κυανό (πράσινο και μπλε) ή (Cyan), ματζέντα (κόκκινο και μπλε) ή (Magenta), κίτρινο (κόκκινο και πράσινο) ή (Yellow) τα οποία είναι συμπληρωματικά των χρωμάτων RGB. Χρησιμοποιείται συνήθως σε έγχρωμους εκτυπωτές. Η μετατροπή μεταξύ των δύο συστημάτων γίνεται ως εξής: C = 1 – R M = 1 – G (1.12) Y = 1 – B
23
Χρωματικά συστήματα (8)
Εάν σε αυτό το σύστημα προστεθεί και το μαύρο, προκύπτει το CMYK, το οποίο παρέχει στις εκτυπώσεις καλύτερο μαύρο από εκείνο το οποίο παράγει ο συνδυασμός των τριών χρωμάτων. Η μετατροπή από το CMY στο CMYK και αντίστροφα γίνεται με αφαίρεση ή πρόσθεση του μαύρου στα βασικά χρώματα αντίστοιχα. Μοντέλο HSI: Το μοντέλο αυτό αποτελείται από τα τρία χαρακτηριστικά του χρώματος, την απόχρωση ή Hue, την καθαρότητα ή Saturation, τη φωτεινότητα ή Intensity. Σε αυτό το σύστημα δεν χρειάζεται η αναλογία των RGB, αλλά το χρώμα καθορίζεται από τη μεταβολή του Η. Η μεταβολή του S δίνει διαφορετική καθαρότητα στο ίδιο χρώμα. Για παράδειγμα το σκούρο κόκκινο μπορεί να γίνει ροζ με μεταβολή του S. Τέλος το Ι καθορίζει τη φωτεινότητα. Στο μοντέλο HIS, το Η είναι γωνία 0 έως 3600 , το S είναι ακτίνα 0 έως 1 και το Ι είναι ο άξονας z με τιμές 0 για το μαύρο και 1 για το άσπρο.
24
Χρωματικά συστήματα (9)
Μοντέλο YCbCr: Το μοντέλο αυτό διαχωρίζει τη φωτεινότητα (Υ) από την πληροφορία του χρώματος (μπλε και κόκκινο – CbCr). Η μετατροπή από το RGB δίνεται από: Y = R G B Cb = R – G B (1.13) Cr = R – G – B Αντίστροφα: R = Y Cr G = Y – Cb – Cr (1.14) B = Y Cb
25
Χρωματικά συστήματα (10)
Μοντέλο YIQ: Τα βασικά χαρακτηριστικά αυτού του μοντέλου είναι η φωτεινότητα (Υ), η απόχρωση και η χρωματική καθαρότητα (Ι,Q). Χρησιμοποιείται στην έγχρωμη τηλεοπτική μετάδοση. Πρόκειται για μια επανακωδικοποίηση του μοντέλου RGB, για τη βελτιστοποίηση της μετάδοσης και τη συμβατότητα με την ασπρόμαυρη τηλεόραση. Αυτό συμβαίνει γιατί η ασπρόμαυρη τηλεόραση αντιλαμβάνεται μόνο τον παράγοντα Υ της εκπομπής, που αφορά τη φωτεινότητα Στο Matlab υπάρχουν συναρτήσεις μετατροπής από το ένα χρωματικό μοντέλο στο άλλο: rgb2ntsc και ntsc2rgb για μετατροπή RGB εικόνων σε YIQ και αντίστροφα για το NTSC. rgb2ycbcr και ycbcr2rgb για μετατροπή RGB εικόνων σε YCbCr και αντίστροφα. rgb2hsv και hsv2rgb για μετατροπή RGB εικόνων σε HSV και αντίστροφα.
26
Οι εικόνες στο Matlab (1)
27
Οι εικόνες στο Matlab (2)
gray2ind μετατροπή intensity image σε indexed. im2bw μετατροπή σε binary image από τους άλλους τύπους με τη χρήση κατωφλίου φωτεινότητας. ind2gray μετατροπή indexed σε intensity. mat2gray - μετατροπή ενός πίνακα τιμών σε intensity image με κλιμάκωση των τιμών του. rgb2gray μετατροπή ενός RGB σε intensity.
28
Οι εικόνες στο Matlab (3)
rgb2ind μετατροπή ενός RGB σε indexed. Υπάρχουν συναρτήσεις οι οποίες μετατρέπουν τον τύπο παράστασης μιας εικόνας, όπως για παράδειγμα: im2double - μετατροπή στο διάστημα (0,1). im2uint μετατροπή στο διάστημα (0,255). im2uint μετατροπή στο διάστημα (0,65535).
29
Οι εικόνες στο Matlab (4)
Σημείωση: Η μετατροπή από ένα τύπο σε ένα άλλο με λιγότερα bits απεικόνισης μπορεί να προκαλέσει απώλεια πληροφορίας. Για παράδειγμα μια μετατροπή από 16 bits (65536 ή 256×256 επίπεδα) σε 8 bits (256 επίπεδα) συμπτύσσει 256 αποχρώσεις σε μία, για κάθε επίπεδο μετατροπής Το Matlab διαθέτει συναρτήσεις για την ανάγνωση και εγγραφή αρχείων με εικόνες διαφόρων τύπων, όπως: BMP (Microsoft Windows Bitmap) JPEG (Joint Photographic Experts Group) PCX (Paintbrush) PNG (Portable Network Graphics) TIFF (Tagged Image File Format)
30
Οι εικόνες στο Matlab (5)
Οι συναρτήσεις ανάγνωσης και εγγραφής είναι η imread και η imwrite αντίστοιχα. Η ανάγνωση ή εγγραφή μιας εικόνας σε δυαδική μορφή (συνήθως καλείται raw ή bin) δεν υποστηρίζεται από αυτές τις συναρτήσεις. Παρακάτω δίνεται ένα πρόγραμμα ανάγνωσης τέτοιων αρχείων. Η απεικόνιση των εικόνων γίνεται με τη συνάρτηση imshow: imshow(I,map) - εμφάνιση εικόνων με χρωματικό δείκτη. imshow(I,n) - εμφάνιση εικόνων με n επίπεδα του γκρι. imshow(BW) - εμφάνιση δυαδικών εικόνων. imshow(‘onoma.tiff’) - εμφάνιση αρχείου εικόνας.
31
Οι εικόνες στο Matlab (6)
α) Ανάγνωση της εικόνας woman.mat, η οποία ευρίσκεται στο Matlab. Σημειώνεται ότι ο συγκεκριμένος τύπος αρχείου είναι του Matlab και δημιουργείται εάν ένας πίνακας αποθηκευτεί με την εντολή save. Η ανάγνωση ενός τέτοιου αρχείου γίνεται με την εντολή load και ο πίνακας αναπαρίσταται με το Χ. Παράδειγμα 1.1
32
Οι εικόνες στο Matlab (7)
β) Η τιμή φωτεινότητας του πρώτου pixel ευρίσκεται: » map(X(1,1),:) ans = Εάν αυτή η τιμή πολλαπλασιαστεί με το 255 θα δώσει την ισοδύναμη τιμή του πρώτου pixel για intensity image τύπου double, δηλαδή ή 154 για τύπο uint8.
33
Οι εικόνες στο Matlab (8)
Εάν αυτή η τιμή πολλαπλασιαστεί με το 255 θα δώσει την ισοδύναμη τιμή του πρώτου pixel για intensity image τύπου double, δηλαδή ή 154 για τύπο uint8. γ) η μετατροπή indexed image σε intensity image γίνεται ως εξής: » Y=ind2gray(X,map); » Y(1:5,1:5) ans =
34
Οι εικόνες στο Matlab (9)
δ) Η μετατροπή από τύπο double σε τύπο uint8 γίνεται ως εξής: » Z=im2uint8(Y); » Z(1:5,1:5) ans =
35
Οι εικόνες στο Matlab (10)
ε) Η εικόνα Χ υποδειγματοληπτείται με συντελεστή 8, με αποτέλεσμα την ελάττωση της ευκρίνειάς της. Για να φανεί η διαφορά, απεικονίζουμε την εικόνα στις ίδιες διαστάσεις με την αρχική. Επίσης, ελαττώνονται οι αποχρώσεις της από 256 σε 64, Σχήμα 1.7. » X1=X(1:8:256,1:8:256); » [X2,newmap]=imapprox(X,map,64); » whos Name Size Bytes Class X 256x double array X1 32x double array X2 256x uint8 array map 255x double array newmap 32x3 768 double array Grand total is elements using bytes
36
Οι εικόνες στο Matlab (11)
» imshow(X,map); » figure; » imshow(X1,map); » imshow(X2,newmap); στ) Η φωτεινότητα μιας εικόνας μπορεί να μεταβληθεί, εάν οι τιμές των pixels μετατοπιστούν προς το άσπρο ή μαύρο. Αυτό γίνεται με την εντολή: Υ = imadjust (X, [low high], [bottom top]), όπου οι τιμές της Χ που είναι μικρότερες της low παίρνουν την τιμή bottom (συνήθως 0) και οι τιμές που είναι μεγαλύτερες του high παίρνουν τιμή top (συνήθως 1). Σε περίπτωση εικόνων indexed γίνεται το ίδιο με το δείκτη (map).
37
Οι εικόνες στο Matlab (12)
Για παράδειγμα οι εντολές: newmap = imadjust (map, [0 0.7], [0 1]) και imshow(X,newmap) δίνουν την εξής εικόνα, Σχήμα 1.8, η οποία είναι ίδια με την εικόνα από τις εντολές : Χ3 = ind2gray(X,map) και Χ3 = imadjust (Χ3, [0 0.7], [0 1]) και imshow(X3): Σχήμα 1.7 Αρχική εικόνα Εικόνα με υποδειγματοληψία Χ Εικόνα με λιγότερες αποχρώσεις Χ2
38
Οι εικόνες στο Matlab (13)
Παράδειγμα 1.2 α) Οι εικόνες πολλές φορές ευρίσκονται σε μορφή raw ή bin, όπου κάθε pixel έχει δυαδική τιμή από 0 έως 255. Η ανάγνωση αυτών των εικόνων, γνωρίζοντας τη διάστασή τους, μπορεί να γίνει ως εξής: Σχήμα Αρχική εικόνα Χ Μεταβολή φωτεινότητας
39
Οι εικόνες στο Matlab (14)
Δυαδικό αρχείο
40
Οι εικόνες στο Matlab (15)
Η εμφάνιση της εικόνας στην οθόνη μπορεί να γίνει με την εντολή imshow(im’,gray(256)) επειδή έχει τύπο double ή με την εντολή imshow(uint8(im’)), η οποία την μετατρέπει πρώτα σε τύπο uint8. Χρησιμοποιείται ο ανάστροφος πίνακας (transpose) για την περιστροφή της. Η εικόνα im μπορεί να αποθηκευτεί σε αρχείο με δυαδική μορφή, σαν filename.mat, με την εντολή save filename im και μπορεί να επαναφορτωθεί με την εντολή load filename.
41
Οι εικόνες στο Matlab (16)
Χρωματικός πίνακας β) Ένα αρχείο εικόνας τύπου mat, εκτός από τον πίνακα της εικόνας, συνοδεύεται και από τον αντίστοιχο χρωματικό πίνακα.
42
Οι εικόνες στο Matlab (17)
Σχήμα 1.9
43
Οι εικόνες στο Matlab (18)
γ) Ο πίνακας μιας εικόνας με το χρωματικό της πίνακα μπορεί να εγγραφεί σαν ένας διαφορετικός τύπος εικόνας.
44
Οι εικόνες στο Matlab (19)
δ) Ένας τύπος εικόνας μπορεί να μετατραπεί σε άλλο τύπο. Το παρακάτω Σχήμα 1.10 δείχνει τη μετατροπή της έγχρωμης εικόνας clown σε εικόνα φωτεινότητας. Σχήμα Αρχική έγχρωμη εικόνα Χ Σχήμα Μετατροπή σε εικόνα φωτεινότητας χρωματικού δείκτη
45
Οι εικόνες στο Matlab (20)
ε) Με τον ίδιο τρόπο μπορεί μια εικόνα χρωματικού δείκτη να μετατραπεί σε μια εικόνα RGB.
46
Οι εικόνες στο Matlab (21)
Παράδειγμα 1.3 : Διαβάζεται και απεικονίζεται μια εικόνα με τις εντολές: » X=imread('pentagon.png'); » imshow(X); » figure; » imshow(X,[80 200]); » imshow(X,[]); Η ελάχιστη τιμή του πίνακα Χ είναι 63 και η μέγιστη 241. Το [80 200] υποδηλώνει ότι όλα τα pixels με τιμή μικρότερη ή ίση του 80 θα απεικονιστούν μαύρα (δηλ. 0) και όλα τα pixels με τιμή μεγαλύτερη ή ίση του 200 θα απεικονιστούν άσπρα (δηλ. 255). Οι ενδιάμεσες τιμές θα κλιμακωθούν στον προκαθορισμένο αριθμό επιπέδων (π.χ. 256). Το [ ] υποδηλώνει ότι τα προηγούμενα όρια είναι η ελάχιστη και μέγιστη τιμή του πίνακα (δηλ. το 63 και 241). Το αποτέλεσμα φαίνεται στις εικόνες του παρακάτω Σχήματος 1.11.
47
Οι εικόνες στο Matlab (22)
Σχήμα 1.11 α. Αρχική εικόνα με μικρή δυναμική περιοχή Σχήμα 1.11 β. Αύξηση της δυναμικής περιοχής
48
Οι εικόνες στο Matlab (23)
Παρατηρούμε ότι με αυτό τον τρόπο είναι δυνατή η μετατροπή μιας εικόνας με φτωχή ευκρίνεια σε εικόνα η οποία να αναδεικνύει καλύτερα ορισμένες περιοχές της. Βέβαια αυτό μπορεί να γίνει και με διαφορετικούς τρόπους, όπως θα εξεταστεί παρακάτω. Μια εικόνα μπορεί να αποθηκευτεί είτε σε μορφή mat με την εντολή save είτε με την εντολή imwrite σε μια μορφή υποστηριζόμενη από το Matlab. Για παράδειγμα η προηγούμενη εικόνα, η οποία είναι σε μορφή png, μπορεί να αποθηκευτεί σε άλλη μορφή ως εξής: » imwrite(X,'pentagon2.tif'); Σχήμα 1.11 γ. Μέγιστη δυνατή αύξηση της δυναμικής περιοχής
49
Το ιστόγραμμα (1) Το ιστόγραμμα μιας ψηφιακής εικόνας (gray scale για χάριν απλότητας) με L επίπεδα φωτεινότητας στην περιοχή [0 255] ορίζεται σαν την ακόλουθη διακριτή συνάρτηση: h(rk) = nk (1.15) Όπου rk είναι το k επίπεδο φωτεινότητας στο διάστημα [0 255] και nk είναι ο αριθμός των pixels στην εικόνα που έχουν επίπεδο φωτεινότητας rk. Πολλές φορές χρησιμοποιείται το κανονικοποιημένο ιστόγραμμα (normalized histogram) το οποίο ευρίσκεται διαιρώντας τη σχέση (1.15) με το συνολικό αριθμό των pixels στην εικόνα. (1.16)
50
Το ιστόγραμμα (2) Όπου n είναι ο συνολικός αριθμός των pixels της εικόνας και k = 1,2,…,L. Το p(rk) αντιπροσωπεύει την πιθανότητα εμφάνισης του επιπέδου φωτεινότητας rk. Η συνάρτηση του Matlab για την εύρεση του ιστογράμματος είναι: h = imhist ( I , b ) Όπου Ι είναι η εικόνα εισόδου και b είναι ο αριθμός των βημάτων (bins), ο οποίος είναι ίσος με 256 εάν δεν ορίζεται. Το κανονικοποιημένο ιστόγραμμα δημιουργείται με τη σχέση: p = imhist ( I , b ) / numel ( I ) Η συνάρτηση numel ( I ) υπολογίζει τον αριθμό των pixels της εικόνας εισόδου. Η απεικόνιση του ιστογράμματος στην οθόνη γίνεται μόνο με τη συνάρτηση imhist ( I , b ). Για παράδειγμα η συχνότητα εμφάνισης κάθε απόχρωσης της προηγούμενης εικόνας “pentagon” και η απεικόνιση του ιστογράμματος φαίνεται στο Σχήμα 1.12.
51
Το ιστόγραμμα (3) Πίνακας Σχήμα 1.12 Ιστόγραμμα εικόνας “pentagon”
52
Βιβλιογραφία N. Η. Παπαμάρκος, “Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας”, Δημοκρίτειο, Ξάνθη 2001. Σ. Δ. Κόλλιας, “Επεξεργασία, Ανάλυση και Τεχνολογία Εικόνων και Βίντεο”, Σημειώσεις ΕΜΠ, Αθήνα 2001. I. Pitas, “Digital Image Processing Algorithms”, Prentice Hall, 1992. R. C. Gonzalez, R. E. Woods, “Digital Image Processing”, Prentice Hall, 2nd Edition 2002. R. C. Gonzalez, R. E. Woods, S. L. Eddins, “Digital Image Processing Using MATLAB”, Prentice Hall. A. K. Jain, “Fundamentals of Digital Image Processing”, Prentice Hall, 1989.
53
Τέλος Ενότητας
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.