Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
1
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ Δρ.Χ.Στρουθόπουλος
2
Οι στόχοι της ΨΕΕ είναι οι εξής:
Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την αποθήκευση, μετάδοση και εκτύπωσή τους. Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την καλύτερη απεικόνισή τους. Η ανάλυση και κατανόηση των εικόνων
3
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ) Ρομποτική όραση Τεχνητή Νοημοσύνη Αναγνώριση Προτύπων Νευρωνικά Δίκτυα Ασαφής Λογική Κωδικοποίηση Γραφικά Η/Υ
4
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας και του κβαντισμού.
5
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ Εικονοστοιχείο (picture element, pixel, pel) Η τιμή I(j,k) με k=0,1,2….K-1 και j=0,1,2….J-1 είναι ο κωδικός του χρώματος του εικονοστοιχείου στην θέση (k,j) της ψηφιακής εικόνας J πλήθος γραμμών Κ πλήθος στηλών JxK πλήθος εικονοστοιχείων
7
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ Δυαδικές εικόνες (binary images) I(k,j){0,1} Εικόνες αποχρώσεων του γκρι (gray level images) I(k,j)=0,1,...255 Eγχρωμες εικόνες (color images): κάθε εικονοστοιχείο χρωματίζεται με χρώματα που προέρχονται από την ανάμειξη των αποχρώσεων του κόκκινου, πράσινου και μπλε (RGB). I(k.j)=(IR(k,j), IG(k,j), IB(k,j)) IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
8
Είδος εικόνας J K B bits bytes Δυαδική 100 1 10000 1250
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα. Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται Β bits και ισχύουν οι σχέσεις: C=2B B=log2C Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται JKB bits. Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών. Είδος εικόνας J K B bits bytes Δυαδική 100 1 10000 1250 Αποχρώσεων του γκρι 8 80000 Έγχρωμη RGB 24 240000 30000
9
Φαινόμενο της σκακιέρας K
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ J K J ΜΟΝΑΔΕΣ pixels/mm2 dpi ( dots per inch : κουκίδες ανά ίντσα) Φαινόμενο της σκακιέρας K
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
11
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία 1 (0,3),(7,2) (5,2),(9,2) (0,5),(7,3) (0,2),(8,9) (5,6),(9,10) (0,4),(7,9) 3,4,2,2 0,5,2,2,2 5,2,3,1 Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components) Μη συνδεδεμένο χωρίο (not connected component) Συνδεδεμένο χωρίο (connected component)
12
Κωδικοποίηση αλυσίδας (chain coding)
7 6 5 4 3 2 1 Εκκίνηση από (2,2) 0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1. Υπογραφή (signature)
13
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
16
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ Ιστόγραμμα
250 100 50 10
17
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
19
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος 10 14 25 26 27 g H(g) h(g) P(g) g΄ 10 2 2/15 255*2/15 = 34 14 5 5/15 7/15 255*7/15 = 119 25 4 4/15 11/15 255*11/15 = 187 26 1 1/15 12/15 255*12/15 = 204 27 3 3/15 15/15 255*15/15 = 255 P(g) = P(g-1)+ h(g). I΄(k,j) = [(G-1)P(I(k,j)]
20
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος Παράδειγμα 1ο
21
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
22
Κατωφλίωση και πολυκατωφλίωση
Συχνά τα εικονοστοιχεία ενός αντικειμένου μιας εικόνας παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων της εικόνας και την απόδοσή της με λιγότερες κύριες αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές αυτές λέγονται κατώφλια.
23
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
g Τ C1 C2
24
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
p1+p2=1. μ1 μ2 μ=p1μ1+p2μ2 t=107
25
Παράδειγμα
26
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
t=111
27
Παράδειγμα
28
Πολυκατωφλίωση
29
Πολυκατωφλίωση – ΝΔ Kohonen
Γειτονιά του j νευ- ρώνα για d(t)=2 w0 wj wJ-1 I(x,y) I wj-2 w1 wj+2 wj-1 wj+1 x oc(t) = min{oj(t)} wj(t+1)=wj(t)+Δwj(t)
30
Πολυκατωφλίωση – ΝΔ Kohonen
31
Συγκριτικά αποτελέσματα
Πολυκατωφλίωση Συγκριτικά αποτελέσματα Μ έ θ ο δ ο ς Πλήθος κατωφλίων ΝΔ Kohonen Reddi Kapur Παπαμάρκου 1 T0 164 42 114 2 T1 151 227 112 191 210 167 226 3 T2 106 179 229 97 149 205 139 117 184 4 T3 178 224 237 95 142 192 230 118 -
32
Εύρεση ακμών Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως προς την κλίση τους.
33
Εύρεση ακμών
36
Άλλες μάσκες
39
Εύρεση ακμών με τον τελεστή Laplace
40
Εύρεση ακμών με τον τελεστή Laplace
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j) 1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1) 1 2= -4
42
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN 100 200 10 20 150 50 80 g H(g) h(g) 10 1 0.04 20 50 2 0.08 80 4 0.16 100 7 0.28 150 5 0.2 200 25 Ευκρινής Μονοσήμαντος Στιγμιαία αποκωδικοποιήσιμος 1 0.32 0.08 0.16 0.6 0.4 \ g 10 20 50 80 100 150 200 h(g) 00000 00001 0001 001 01 11 Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
43
Μετασχηματισμός συνημιτόνου
Έστω οι ακολουθίες τιμών για n=0,1,2
44
n: 1 3 2 Η οικογένεια των συναρτήσεων είναι ορθοκανονική
45
n=1 F0 g0 n=2 f g2 F2 F1 n=0 g1
46
Επειδή η βάση είναι ορθοκανονική
(επειδή η βάση είναι ορθοκανονική)
47
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
48
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1. Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
49
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ #include<stdio.h> #include<stdlib.h> #include<conio.h> #include<math.h> #include<alloc.h> /* */ float dct1d(int k, float *x, int N) { int n; float c=0.0; if( k == 0 ) { for( n = 0; n < N; n++) c += x[n]; return c/sqrt((float)N); } for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N)); return c/sqrt((float)N/2); float idct1d(int n, float *c, int N) int k; float x=0; for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N)); return c[0]/sqrt((float)N) + x/sqrt((float)N/2); float dct2d(int k1, int k2, float *x, int N1, int N2) int n1; float *c, cc; char buf[20]; c = (float*)malloc(N1*sizeof(float)); for(n1 = 0; n1<N1; n1++) c[n1]= dct1d(k2,&x[n1*N2],N2); cc = dct1d(k1,c,N1); free(c); return cc; float idct2d( int n1, int n2, float *c, int N1, int N2) float *x, xx; int k1; x = (float*)malloc(N1*sizeof(float)); for(k1 = 0; k1<N1; k1++) x[k1]= idct1d(n2,&c[k1*N2],N2); xx = idct1d(n1,x,N1); free(x); return xx; Ανακατασκευή με 8 συντελεστές
50
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ ρ A Ο (β) (ε) θ y x (α) Σχήμα 8. ρν = xκ συνθν + yκ ημθν
51
Ο μετασχηματισμός του Hough
x y τοξεφ(2) ) (ε) (1,0.5) (0,1) (2,0) O(0,0)
52
Μορφολογία Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη, από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται» κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή). Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες -αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο), ή γκρι αποχρώσεων ή πολύχρωμες
53
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
54
Η μεταφορά (translation) ενός συνόλου Α κατά ένα σημείο x σα σύνολο γράφεται ως εξής:
(Α)x = {c|c = α + x, a A} 2.1 Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5). Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές (computer graphics) – μία αλλαγή της θέσης κατά μία συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα ήταν η {1,2}).
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.