Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ Δρ.Χ.Στρουθόπουλος.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ Δρ.Χ.Στρουθόπουλος."— Μεταγράφημα παρουσίασης:

1 Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ Δρ.Χ.Στρουθόπουλος

2 Οι στόχοι της ΨΕΕ είναι οι εξής: Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την αποθήκευση, μετάδοση και εκτύπωσή τους. Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την καλύτερη απεικόνισή τους. Η ανάλυση και κατανόηση των εικόνων

3 Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους: Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ) Ρομποτική όραση Τεχνητή Νοημοσύνη Αναγνώριση Προτύπων Νευρωνικά Δίκτυα Ασαφής Λογική Κωδικοποίηση Γραφικά Η/Υ

4 Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας και του κβαντισμού.

5 Εικονοστοιχείο (picture element, pixel, pel) J πλήθος γραμμών Κ πλήθος στηλών JxK πλήθος εικονοστοιχείων Η τιμή I(j,k) με k=0,1,2….K-1 και j=0,1,2….J-1 είναι ο κωδικός του χρώματος του εικονοστοιχείου στην θέση (k,j) της ψηφιακής εικόνας Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ

6

7 ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ Eγχρωμες εικόνες (color images): κάθε εικονοστοιχείο χρωματίζεται με χρώματα που προέρχονται από την ανάμειξη των αποχρώσεων του κόκκινου, πράσινου και μπλε (RGB). I(k.j)=(I R (k,j), I G (k,j), I B (k,j)) IR(k,j), IG(k,j), IB(k,j)  {0,1,2,...,255} Δυαδικές εικόνες (binary images) I(k,j)  {0,1} Εικόνες αποχρώσεων του γκρι (gray level images) I(k,j)=0,1,...255

8 Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα. Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται Β bits και ισχύουν οι σχέσεις: C=2 B  B=log 2 C Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται J  K  B bits. Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών. Είδος εικόναςJKBbitsbytes Δυαδική Αποχρώσεων του γκρι Έγχρωμη RGB

9 ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ K K J J ΜΟΝΑΔΕΣ pixels/mm 2 dpi ( dots per inch : κουκίδες ανά ίντσα) Φαινόμενο της σκακιέρας

10 ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ Κέντρο Βάρους

11 (0,3),(7,2) (5,2),(9,2) (0,5),(7,3) (0,2),(8,9) (5,6),(9,10) (0,4),(7,9) 3,4,2,2 0,5,2,2,2 5,2,3,1 Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE) Συστοιχία Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components) Συνδεδεμένο χωρίο (connected component) Μη συνδεδεμένο χωρίο (not connected component)

12 Κωδικοποίηση αλυσίδας (chain coding) Εκκίνηση από (2,2) 0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1. Υπογραφή (signature)

13 ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ

14

15

16 Ιστόγραμμα

17 ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ Ιστόγραμμα

18

19 ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος I΄(k,j) = [(G-1)P(I(k,j)] P(g) = P(g-1)+ h(g) gH(g)H(g)h(g)h(g)P(g)P(g)g΄ 1022/15 255*2/15 = /157/15255*7/15 = /1511/15255*11/15 = /1512/15255*12/15 = /1515/15255*15/15 = 255

20 ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος Παράδειγμα 1ο

21 Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος Παράδειγμα 2ο

22 Συχνά τα εικονοστοιχεία ενός αντικειμένου μιας εικόνας παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων της εικόνας και την απόδοσή της με λιγότερες κύριες αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές αυτές λέγονται κατώφλια. Κατωφλίωση και πολυκατωφλίωση

23 Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση Τ C1C1 C2C2 g

24 Κατωφλίωση - Μέθοδος της διασποράς (Otsu) p1+p2=1. μ=p1μ1+p2μ2 μ1μ1 μ2μ2 t=107

25 Παράδειγμα

26 Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur) t=111

27 Παράδειγμα

28 Πολυκατωφλίωση

29 Γειτονιά του j νευ- ρώνα για d(t)=2 w0w0 wj wj w J-1 I(x,y) I w j- 2 w1w1 w j+2 wj-1wj-1 w j+1 x Πολυκατωφλίωση – ΝΔ Kohonen o c (t) = min{o j (t)} w j (t+1)=w j (t)+Δw j (t)

30 Πολυκατωφλίωση – ΝΔ Kohonen

31 Μ έ θ ο δ ο ς Πλήθος κατωφλίω ν ΝΔ Kohonen Reddi Kapur Παπαμάρκο υ 1T0T T0T1T0T T0T1T2T0T1T T0T1T2T3T0T1T2T Πολυκατωφλίωση Συγκριτικά αποτελέσματα

32 Εύρεση ακμών Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως προς την κλίση τους.

33 Εύρεση ακμών

34

35

36 Άλλες μάσκες

37

38

39 Εύρεση ακμών με τον τελεστή Laplace

40  1K (k+1,j)-  1K (k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)  1J (k,j+1)-  1J (k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1) 1 2=2= Εύρεση ακμών με τον τελεστή Laplace

41

42 Συμπίεση ψηφιακών εικόνων Κωδικοποίηση HUFFMAN gH(g)h(g) \ g h(g) Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1) Ευκρινής Μονοσήμαντος Στιγμιαία αποκωδικοποιήσιμος

43 Έστω οι ακολουθίες τιμών για n=0,1,2 Μετασχηματισμός συνημιτόνου

44 132 0 n: Η οικογένεια των συναρτήσεων είναι ορθοκανονική

45 n=0 n=2 n=1 g0g0 g1g1 g2g2 f F0F0 F1F1 F2F2

46 Επειδή η βάση είναι ορθοκανονική (επειδή η βάση είναι ορθοκανονική)

47 Η οικογένεια των συναρτήσεων είναι ορθοκανονική

48 Σε μία ψηφιακή εικόνα με Ν 1 στήλες και Ν 2 γραμμές η τιμή απόχρωσης είναι μία ακολουθία Ι(n 1,n 2 ), n 1 =0,1,…,N 1 -1, n 2 =0,1,…,N Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:

49 #include /* */ float dct1d(int k, float *x, int N) { int n; float c=0.0; if( k == 0 ) { for( n = 0; n < N; n++) c += x[n]; return c/sqrt((float)N); } for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N)); return c/sqrt((float)N/2); } /* */ float idct1d(int n, float *c, int N) { int k; float x=0; for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N)); return c[0]/sqrt((float)N) + x/sqrt((float)N/2); } /* */ float dct2d(int k1, int k2, float *x, int N1, int N2) { int n1; float *c, cc; char buf[20]; c = (float*)malloc(N1*sizeof(float)); for(n1 = 0; n1

50 Ο μετασχηματισμός του Hough ρ = x συνθ + y ημθ ρ A Ο (β) (ε) θ y ρ x θ (α) Σχήμα 8. ρ ν = x κ συνθ ν + y κ ημθ ν

51 x y τοξεφ(2) ) (ε ) (1,0. 5) (0,1) (2,0) O(0, 0) Ο μετασχηματισμός του Hough

52 Μορφολογία Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη, από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται» κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή). Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες - αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο), ή γκρι αποχρώσεων ή πολύχρωμες

53 ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

54 Η μεταφορά (translation) ενός συνόλου Α κατά ένα σημείο x σα σύνολο γράφεται ως εξής: (Α)x = {c|c = α + x, a A} 2.1 Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5). Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές (computer graphics) – μία αλλαγή της θέσης κατά μία συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα ήταν η {1,2}).

55

56

57

58

59

60

61

62

63

64

65


Κατέβασμα ppt "Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ Δρ.Χ.Στρουθόπουλος."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google