VIDEO Αναλογικό Video PAL, NTSC, Component, Y/C, Composite

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΑΡΑΓΩΓΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ “Σύνθεση πληροφοριών αισθητήρων για την ασφαλή πλοήγηση έντροχου ρομποτικού οχήματος” Αθανάσιος.
Advertisements

Ψηφιακές και Αναλογικές Πηγές
ΗΜΥ 100 Εισαγωγή στην Τεχνολογία
ΗΧΟΣ.
ΨΗΦΙΑΚΗ ΑΝΑΠΑΡΑΣΤΑΣΗ Πλεονεκτήματα:
Χαρακτηριστικά εικόνας
Κεφάλαιο 11ο Δομικά στοιχεία εφαρμογής πολυμέσων
Συμπίεση και Μετάδοση Πολυμέσων Βίντεο και Πολυμεσικές Εφαρμογές
Μπορείτε να σκεφτείτε μερικές πολυμεσικές εφαρμογές;
Συμπίεση και Μετάδοση Πολυμέσων
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΘΕΣΣΑΛΟΝΙΚΗΣ
Γυμνάσιο Νέας Κυδωνίας
ΤΕΧΝΟΛΟΓΙΑ ΕΠΙΚΟΙΝΩΝΙΩΝ 1 ο Λύκειο Ρόδου Δημητρης Γεωργαλίδης.
Σημειώσεις για την Α’ Λυκείου
ΒΑΣΙΚΕΣ ΑΣΚΗΣΕΙΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΟΣ
ΤΕΧΝΟΛΟΓΙΑ ΕΠΙΚΟΙΝΩΝΙΩΝ
ΣΥΜΠΙΕΣΗ Τεράστιες ανάγκες σε αποθηκευτικό χώρο Παράδειγμα:
Συσκευές Εισόδου/Εξόδου
«Πρόγραμμα Αναμόρφωσης Προπτυχιακών Προγραμμάτων Σπουδών Γ.Π.Α» Σεμινάριο Ενημέρωσης Διδακτικού Προσωπικού Οι τεχνολογίες της Πληροφορικής και των Επικοινωνιών.
Ο ΟΘΟΝΕΣ Η οθόνη  (monitor ) του υπολογιστή, περιλαμβάνει ένα καθοδικό σωλήνα, όπως η τηλεόραση, και κατάλληλα κυκλώματα σάρωσης. Μπορεί να είναι έγχρωμη.
Αρχές και Πρότυπα Συμπίεσης
Συμπίεση και Μετάδοση Πολυμέσων
ΤΕΧΝΟΛΟΓΙΑ ΕΠΙΚΟΙΝΩΝΙΩΝ 1 ο Λύκειο Ρόδου Δημήτρης Γεωργαλίδης.
Πολυμέσα – Δίκτυα (μαθ. επιλογής Γ’ Λυκείου)
Τεχνολογίες και Εφαρμογές Πολυμέσων
ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΗΧΟΥ
ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΗΧΟΥ
Μετάδοση Δεδομένων CD/DVD Σκληρός Δίσκος Ποντίκι Modem Η/Υ
Computers: Information Technology in Perspective By Long and Long Copyright 2002 Prentice Hall, Inc. Δίκτυα & Ε π ικοινωνία Υ π ολογιστών Διάλεξη 7 η -
ΣΥΣΤΗΜΑΤΑ ΣΥΛΛΟΓΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ ΜΕΤΡΗΣΕΩΝ
Βασικές έννοιες στην ψηφιακή εικόνα
Αναλογικό και Ψηφιακό Βίντεο, Υποδειγματοληψία χρώματος
Συμπίεση και Μετάδοση Πολυμέσων
Συμπίεση Ηχου.
ΒΕΣ 04: Συμπίεση και Μετάδοση Πολυμέσων Συμπίεση Βίντεο.
Επικοινωνίες δεδομένων
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Βασικές Έννοιες Ψηφιοποίηση Συνεχών Σημάτων
JPEG Joint Photographic Expert Group. Τι είναι; Ε ξαιρετικά διαδεδομένο σχήμα συμπίεσης για ακίνητη εικόνα, τόσο μονόχρωμη (grayscale) όσο και έγχρωμη.
Πανεπιστήμιο Αιγαίου Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Χαρακτηριστικά του ψηφιακού ήχου.
Ψηφιακές και αναλογικές πηγές & επικοινωνιακά συστήματα
3ο ΚΕΦΑΛΑΙΟ Ψηφιακές Συσκευές Επεξεργασίας Ήχου.
Δομικά στοιχεία πολυμέσων
Ο ήχος στη ψηφιακή εποχή.
ΚΕΦΑΛΑΙΟ 3ο ΠΟΛΥΜΕΣΑ.
Ανεξάρτητα από το θέμα που διαπραγματεύεται μια εφαρμογή πολυμέσων, συνήθως χρειάζεται λεκτική ανάπτυξη, ηχητική επένδυση και οπτική υποστήριξη. Τα κείμενα.
ΨηφιοποίησηΨηφιοποίηση Οι περισσότερες μεταβολές επηρεάζονται από τον Η/Υ. Τα συστήματα μετατρέπονται ώστε να μπορούν να συνδέονται με Υπολογιστές.
Β’ Γυμναςιου ΕΙΣΑΓΩΓΗ.
JPEG Μια τεχνική συμπίεσης ακίνητης εικόνας. Η Τεχνική JPEG Αφορά συμπίεση ακίνητων εικόνων Είναι τεχνική συμπίεσης με απώλειες Το πρόβλημα είναι η εκάστοτε.
12/01/2007 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «Ψηφιακές Μορφές Τέχνης»1 Εισαγωγή στους Η/Υ Μάθημα 2: Αναπαράσταση και Αποθήκευση Ψηφιακής Πληροφορίας Διδάσκουσα:
ΗΜΥ 007 – Τεχνολογία Πληροφορίας Διάλεξη 8 Ηχητική Πληροφορία 19 Φεβρουαρίου, 2004 Χρυσάνθη Πρέζα, D.Sc. Επισκέπτρια Επίκουρη Καθηγήτρια TΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ.
ΔΤΨΣ 150: Ψηφιακή Επεξεργασία Εικόνας © 2005 Nicolas Tsapatsoulis Συμπίεση Ψηφιακών Εικόνων: Συμπίεση με απώλειες – Πρότυπα Συμπίεσης Εικόνων Τμήμα Διδακτικής.
Ψηφιακά Δεδομένα Χαρακτηριστικό του Η/Υ αλλά και άλλων ψηφιακών συσκευών, όπως το κινητό τηλέφωνο, είναι η επεξεργασία διακριτών στοιχείων πληροφορίας,
Ήχος Ως Δομικό στοιχείο των Πολυμέσων. Ήχος  Διευκολύνει την παρακολούθηση μιας εφαρμογής Ακουστικής απόλαυσης Εντυπωσιασμός μέσω των ηχητικών εφέ 
ΗΜΥ 100 Εισαγωγή στην Τεχνολογία Στυλιανή Πετρούδη ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ.
Εικόνα - Ήχος - Βίντεο: Που, Πως, Τι & Γιατί... ΠΡΟΕΛΕΥΣΗΕΙΔΗ - ΚΑΤΗΓΟΡΙΕΣ ΑΝΑΠΑΡΑΓΩΓΗ - ΕΠΕΞΕΡΓΑΣΙΑ ΕΝΤΑΞΗ ΣΤΗΝ ΕΚΠ/ΚΗ ΔΙΑΔΙΚΑΣΙΑ ΕΙΚΟΝΑ ΗΧΟΣ ΒΙΝΤΕΟ.
Ενότητα 2 η Σήματα και Συστήματα. Σήματα Γενικά η πληροφορία αποτυπώνεται και μεταφέρεται με την βοήθεια των σημάτων. Ως σήμα ορίζουμε την οποιαδήποτε.
ΕΝΟΤΗΤΑ 1: Γνωρίζω τον υπολογιστή ως ενιαίο σύστημα.
Τεχνολογία Πολυμέσων Ενότητα # 8: Αρχές κωδικοποίησης
Αναλογική και Ψηφιακή Τηλεόραση
ΕΝΟΤΗΤΑ 1 – Κεφάλαιο 3: Πολυμέσα
ΕΝΟΤΗΤΑ 1 – Κεφάλαιο 3: Πολυμέσα
Analog vs Digital Δούρβας Ιωάννης ΙΩΑΝΝΗΣ ΔΟΥΡΒΑΣ.
Τεχνική ανάλυση του οπτικοακουστικού μέσου
Ονοματεπώνυμο : ………………………. Τμήμα : Β…. α ή β
Δίκτυα & Επικοινωνία Υπολογιστών
Ονοματεπώνυμο : Χρυσούλα Αγγελοπούλου Καθηγήτρια Πληροφορικής
Δίκτυα Ι Βπ - 2ο ΕΠΑΛ ΝΕΑΣ ΣΜΥΡΝΗΣ 2011.
ΕΙΣΑΓΩΓΗ K06 Σήματα και Γραμμικά Συστήματα Οκτώβρης 2005
Σημειώσεις για την Α’ Λυκείου
Βασικές έννοιες (Μάθημα 2) Τίτλος: Η Συσκευή
Μεταγράφημα παρουσίασης:

VIDEO Αναλογικό Video PAL, NTSC, Component, Y/C, Composite Σύλληψη Video, Υποδειγματοληψία σήματος, MPEG, Τεχνολογία DV

Μετείκασμα Ο ανθρώπινος εγκέφαλος διατηρεί την αίσθηση μιας εικόνας για ένα ελάχιστο κλάσμα του δευτερολέπτου αφού αυτή χαθεί από το οπτικό του πεδίο. Η φυσιολογική αυτή ιδιαιτερότητα είναι γνωστή ως «μετείκασμα» (persistence of vision) και σ’ αυτήν αποδίδεται συνήθως η αίσθηση της συνεχόμενης κίνησης Στον κινηματογράφο, πχ. τα πλαίσια (οι ακίνητες εικόνες) προβάλλονται με ταχύτητα 24 ανά δευτερόλεπτο

(A) Αναλογικό Video

Συμβατική «ασπρόμαυρη» τηλεόραση Σάρωση οριζόντιων γραμμών της οθόνης: πλαίσιο (frame)

Διαπλεκόμενη & συνεχής σάρωση Διαπλεκόμενη (interlaced) 1 πλαίσιο = 2 πεδία (fields) Εναλλακτική σάρωση των δύο πεδίων Συνεχής (non-interlaced ή progressive) Συνεχής σάρωση ενός πλαισίου

Χαρακτηριστικά Μεγέθη  Κάθετη Ανάλυση (vertical resolution) Πλήθος των διακριτών οριζόντιων γραμμών στην οθόνη PAL: 625 γραμμές NTSC: 525 γραμμές  Λόγος εικόνας (Aspect ratio) Είναι ο λόγος του πλάτους της εικόνας προς το ύψος της. Συμβατική τηλεοπτική εικόνα 4:3 Τηλεόραση υψηλής ευκρίνειας (High Definition TV ή HDTV) 16:9 Κινηματογράφος 1.85:1 ή 2.35:1.  Ρυθμός (ή συχνότητα) ανανέωσης πλαισίου (Frame rate, refresh rate) Πόσο συχνά ανανεώνεται το πλαίσιο της εικόνας στην οθόνη του δέκτη. Μετριέται σε μονάδες συχνότητας Hz (Hertz) ή σε fps (frames per second).

Συστήματα αναλογικού video: PAL & NTSC «ανάλυση / ρυθμός ανανέωσης πεδίου / διαπλοκή»  625/50/2:1 PAL (Phase Alternating Line) σε Ευρώπη & Ασία. Εύρος ζώνης 6.5 MHz Διαπλεκόμενη (2:1) εικόνα με 625 οριζόντιες γραμμές (συνολικά) Ρυθμός ανανέωσης πλαισίου 25 πλαίσια ανά sec (ή 50 fields per second) Λόγος εικόνας 4:3 / Μοντέλο χρώματος YUV  525/59.94/2:1 NTSA (National Television Systems Committee) σε Βόρεια Αμερική και Ιαπωνία Εύρος ζώνης 5.5 MHz Διαπλεκόμενη (2:1) εικόνα με 525 οριζόντιες γραμμές (συνολικά) Ρυθμός ανανέωσης πεδίου 30 πλαίσια – περίπου - ανά sec) (ή 59.94 fields per second) Λόγος εικόνας 4:3 / Μοντέλο χρώματος YIQ

Σχήματα κωδικοποίησης χρώματος: Component – Y/C – Composite Τρία βασικά σχήματα κωδικοποίησης έγχρωμου σήματος video (color encoding methods), Κατά φθίνουσα σειρά ποιότητας: Component Y/C Composite

Component Μεταφέρει τρία διαφορετικά συστατικά σήματα (components) με βάση τα οποία αναπαράγει την πληροφορία της έγχρωμης εικόνας στο δέκτη. Μορφές Component είναι τα σήματα RGB YUV YIQ YPrPb YCrCb

RGB: Ακροδέκετες τύπου D15

RGB: Ακροδέκετες τύπου BNC

Από το RGB στο YUV Πρόβλημα στο RGB: Ανάγκη για μετασχηματισμό του RGB Δεν υπάρχει ξεχωριστό το σήμα φωτεινότητας Ανάγκη για μετασχηματισμό του RGB Μετασχηματίζεται το RGB σε σήματα: «φωτεινότητας» (luminance, Y) και «χρωματικότητας» (chrominance, U & V) Έτσι εξασφαλίζεται συμβατότητα με την παλιά τεχνολογία της «ασπρόμαυρης» εικόνας video Ακόμη: Μικρότερη ευαισθησία της ανθρώπινης όρασης στη χρωματικότητα μπορούμε να συμπιέσουμε το χρώμα περισσότερο

YUV Το YUV προκύπτει από γραμμικό μετασχηματισμό του RGB Y =0.299 R + 0.587 G + 0.114 B U = B-Y V = R-Y Όπου Υ: φωτεινότητα (luminance) U & V: πληροφορία χρώματος («διαφορά χρώματος» / color difference signal) Χρησιμοποιείται σε συστήματα τύπου PAL όπου U = 0.492 (B - Y) και V = 0.877 (R - Y) κάμερες και συσκευές video τύπου Betacam και D1

Διόρθωση κατά «γ» Αρχική εικόνα video: πρωταρχικά R, G, B που καταγράφονται από το περιβάλλον. Φωτεινότητα Υ: αναλογικό σήμα που καταγράφει το βαθμό φωτεινότητας της αρχικής εικόνας ΌΜΩΣ η φωτεινότητα που παράγεται σε μια συσκευή (πχ. οθόνη) δεν είναι γραμμική συνάρτηση του εφαρμοζόμενου σήματος Η μη γραμμική σχέση πρέπει να ληφθεί υπόψη για τη σωστή αναπαραγωγή της εικόνας

Τι σημαίνει στην πράξη η διόρθωση κατά «γ» Η τεχνολογία μετατρέπει τα αρχικά R,G,B σε «διορθωμένα κατά γάμμα» (gamma corrected» σήματα R’, G’, B’ Παράγονται από τα RGB με μη γραμμικό τρόπο, δηλ. με εξισώσεις που περιέχουν εκθετικούς όρους. R’ = (1.099 * R 0.45)) – 0.099 G’ = (1.099 * G 0.45)) – 0.099 B’ = (1.099 * B 0.45)) – 0.099 Εκθέτης: συντελεστής γ Με βάση τα R’, G’ & B’ παράγεται: (α) η «διορθωμένη κατά γ» φωτεινότητα που ονομάζεται “luma” Y΄ Y΄ = 0.299*Rg + 0.587*Gg + 0.114*Bg (β) η «διορθωμένη κατά γ» χρωματικότητα που ονομάζεται “chroma”, U΄, V΄ Τα luma & chroma σήματα χρησιμοποιεί η τεχνολογία (Y’U’V’)

Άλλα σχήματα Component κωδικοποίησης χρώματος YIQ Στα συστήματα NTSC YPbPr Χρήση καταναλωτικές συσκευές video αναλογικής τεχνολογίας Pr και Pb: προσαρμοσμένες εκδοχές των U και V YCbCr Χρήση καταναλωτικές συσκευές video ψηφιακής τεχνολογίας (πχ. ψηφιακές κάμερες, συσκευές DVD, κλπ.). Cr και Cb: προσαρμοσμένες εκδοχές των U και V Δημιουργεί το χρωματικό χώρο (color space) που χρησιμοποιεί συνολικά η τεχνολογία ψηφιακού βίντεο (DV).

Y/C Προκύπτει από το Component YUV Μεταφέρει ΔΥΟ συνιστώσες: Ένα σήμα φωτεινότητας (luma) (Υ), και Ένα σήμα χρώματος (chroma) (C) Μεγαλύτερη συμπίεση (λόγω σύνθεσης U & V)  Χαμηλότερη ποιότητα από το YUV

Composite Προκύπτει με ΣΥΝΘΕΣΗ των luma (Y) και chroma (C) σε ένα μοναδικό σύνθετο (composite) σήμα Μεταφέρει ταυτόχρονα τις πληροφορίες φωτεινότητας, χρώματος αμαύρωσης και συγχρονισμού. Αναφέρεται και ως CVBS (από τα αρχικά των λέξεων Color, Video, Blanking, & Sync). Ακόμη μεγαλύτερη συμπίεση  χαμηλότερη ποιότητα από όλες τις μορφές σημάτων

RGB – Y/C – Composite

Είσοδοι VIDEO

(B) ΨΗΦΙΑΚΟ Video

Τεχνολογία DV (Digital Video) σύνολο ψηφιακών τεχνολογιών με τις οποίες είναι δυνατή η εξ αρχής παραγωγή, επεξεργασία, αποθήκευση και διαμοίραση ψηφιακών αρχείων οπτικοακουστικής πληροφορίας. Υπάρχουν ΔΥΟ τρόποι για να δημιουργήσει κανείς ψηφιακά αρχεία video:  (Α) Με ψηφιοποίηση αναλογικού video. Η τεχνική αυτή είναι γνωστή ως «σύλληψη αναλογικού video» (analog video capturing)  (Β) Με χρήση τεχνολογίας DV,

(Α) Σύλληψη αναλογικού video (capturing) «Σύλληψη» (capturing) του αναλογικού video: Δημιουργία αρχείου ψηφιακού video από αναλογικό σήμα video «Κάρτα σύλληψης video» (video capture card)

Κάρτα Σύλληψης Video (Video Capture Card) Βασικά χαρακτηριστικά: Δίαυλος Σύνδεσης: PCI (ή και USB) Παραγόμενα αρχεία: AVI ή MPEG-1, MPEG-2 Είσοδος: Y/C, Composite Έξοδος: (αν υπάρχει θα είναι συνήθως Y/C ή Composite) Δυνατότητα TV-tuner: (μπορεί να υπάρχει ή όχι) Μέγιστη Ανάλυση: 720x576 (PAL) Λογισμικό: συνήθως η κάρτα συνοδεύεται από κάποιο λογισμικό επεξεργασίας αρχείων video

(Β) Χρήση τεχνολογίας DV Ψηφιακή βιντεοκάμερα  CCD  Ροή ψηφιακών δεδομένων. Χρησιμοποιούν σχεδόν αποκλειστικά θύρες επικοινωνίας τύπου IEEE-1394 (γνωστότερο ως FireWire ή iLink) Σύνδεση με την αντίστοιχη θύρα 1394 στον υπολογιστή. Ο δίαυλος 1394 επιτυγχάνει υψηλούς ρυθμούς μεταγωγής ψηφιακών δεδομένων (μέχρι και 400 Mbps)

Δειγματοληψία σήματος video Οριζόντια Κάθετα Χρονικά Ψηφιακό σήμα video

Συχνότητα δειγματοληψίας Η συχνότητα δειγματοληψίας πρέπει να είναι τέτοια ώστε: (1) τα δείγματα να βρίσκονται σε απόλυτη στοίχιση στη κάθετη διάσταση (2) η απόσταση μεταξύ των δειγμάτων να είναι η ίδια και στην οριζόντια και στη κάθετη διάσταση (3) η συχνότητα να παραμένει ίδια στα διάφορα συστήματα αναλογικού video ……. 13.5 MHz

Video: Μεγάλος όγκος ψηφιακών δεδομένων Συχνότητα: 13.5 MHz Μέγιστη ανάλυση (PAL): 720x576 Βάθος χρώματος: 24 bit = 3 Byte Aριθμός πλαισίων: 25 fps 720 x 576 x 25 x 3 = 31104000 Bytes = 30375 kB ~ 30 MB για κάθε δευτερόλεπτο Για video διάρκειας μιας ώρας χρειάζεται αποθηκευτικός χώρος: 30 x 3600 = 108000 MB = 108 GB !!

Ανάγκη για συμπίεση Δύο σημαντικές τεχνικές για συμπίεση video: (α) υποδειγματοληψία χρώματος (chroma subsampling) (β) συμπίεση κατά MPEG

Υποδειγματοληψία Χρώματος H ανθρώπινη όραση είναι πολύ λιγότερο ευαίσθητη στις χρωματικές μεταβολές παρά σε εκείνες της φωτεινότητας. Κατά τη δειγματοληψία μπορούν να ψηφιοποιηθούν λιγότερα δείγματα από το σήμα χρώματος (chroma, σήματα Cb, Cr) σε σχέση με το σήμα φωτεινότητας (luma, σήμα Y), Η πρακτική αυτή ονομάζεται «υποδειγματοληψία χρώματος» (chroma subsampling) και είναι σημαντική για τη μείωση του όγκου των ψηφιακών δεδομένων. Η αναλογία δειγμάτων που παράγονται μεταξύ των σημάτων Υ και Cb, Cr εκφράζεται ως ένας διπλός λόγος ακεραίων αριθμών Οι συνηθέστερες αναλογίες όμως είναι 4:2:2, και 4:2:0.

Σχήματα Υποδειγματοληψίας 4:4:4  Αρχικό σήμα χωρίς συμπίεση 4:2:2  2 pixel για κάθε συνιστώσα chroma έναντι 4 του luma 4:1:1  1 pixel για κάθε συνιστώσα chroma έναντι 4 του luma 4:2:0  1 pixel για κάθε συνιστώσα chroma έναντι 4 του luma (και Οριζόντια και Κάθετα) (εφαρμογή σε MPEG)

MPEG Moving Picture Experts Group Οικογένεια ισχυρών συμπιεστών οπτικοακουστικής πληροφορίας MPEG-1, MPEG-2 & MPEG-4.

Βασικές τεχνικές στη συμπίεση κατά MPEG (α) Ενδοπλαισιακά (intra-frame) Τεχνικές συμπίεσης που εφαρμόζονται στην πληροφορία μόνον μέσα στο ίδιο το πλαίσιο (β) Διαπλαισιακά (inter-frame) Τεχνικές συμπίεσης που εκμεταλλεύονται τον τρόπο που μεταβάλλεται η πληροφορία μεταξύ διαδοχικών πλαισίων.

Ενδοπλαισιακή (intraframe) Συμπίεση JPEG στο πλαίσιο Μετασχηματισμός DCT στην πληροφορία ενός πλαισίου Κβαντισμός συντελεστών DCT  συμπίεση I-πλαίσια (I-frames) Τα πλαίσια μόνον με ενδοπλαισιακή συμπίεση Αποτελούν πλαίσια-κλειδιά (key frames) στην αλληλουχία των συμπιεσμένων πλαισίων που δημιουργεί το MPEG.

Διαπλαισιακή (interframe) H κωδικοποίηση κάθε επόμενου πλαίσιου μπορεί να βασιστεί στην πληροφορία του προηγούμενου Δεν χρειάζεται να αποθηκευθεί ολόκληρη η πληροφορία του επόμενου πλαίσιου αλλά μόνο το τμήμα που διαφέρει από το προηγούμενο πλαίσιο, πχ. εμφανίζεται διαφοροποιημένο λόγω κάποιας κίνησης. Το MPEG στη διαπλαισιακή συμπίεση δημιουργεί δύο νέα είδη πλαισίων:  Το πλαίσιο-Ρ (P-Frame, predicative frame)  Το πλαίσιο-Β (B-Frame, bi-directional frame)

Πλαίσιο -Ρ Αποθηκεύεται μόνον η πληροφορία που δείχνει το πόσο έχει μεταβληθεί αυτό το πλαίσιο σε σχέση με ένα προηγούμενο πλαίσιο αναφοράς (συνήθως ένα προηγούμενο –Ι ή –Ρ πλαίσιο). Έτσι το πλαίσιο-Ρ αναδημιουργείται προσθέτοντας στο πλαίσιο αναφοράς την πληροφορία μεταβολής.

Πλαίσιο -Β Ανάμεσα σε δύο πλαίσια-Ρ ή ανάμεσα σε ένα πλαίσιο–Ι και ένα –Ρ Αποθηκεύουν μόνον την πληροφορία μεταβολής τους σε σχέση με ένα προηγούμενο και με ένα επόμενο πλαίσιο αναφοράς. Το πλαίσιο-Β αναδημιουργείται λαμβάνοντας υπόψη και τα δύο αυτά πλαίσια (πριν & μετά).

Αλληλουχία Ι, Β, Ρ πλαισίων (1/2)

Αλληλουχία Ι, Β, Ρ πλαισίων (2/2) Ι: πλαίσιο αναφοράς (ενδοπλαισιακά) Ρ: προβλεπόμενο πλαίσιο (διαφορά με Ι) (forward prediction) Β: διπλής κατεύθυνσης (διαφορά με Ρ & Ι -- ή Ρ και Ρ) (forward & backward prediction, bidirectional))

Εκτίμηση κίνησης (motion estimation) (1/5) Συχνά στα διαδοχικά πλαίσια η διαφορά δημιουργείται από ένα αντικείμενο που κινείται. Aλγόριθμος: Διαίρεση πλαισίου σε macroblocks (16x16 pixels) Αναζήτηση των macroblocks που είτε δεν μεταβάλλονται από το ένα πλαίσιο στο άλλο είτε μεταβάλλονται μόνον κινούμενα (δηλ. αλλάζει η σχετική τους θέση μέσα στο πλαίσιο). Αν εντοπιστούν τέτοια macroblocks υπολογίζεται τότε το διάνυσμα κίνησής τους (motion vector) δηλ. ένα ζευγάρι αριθμών (πχ. 0,0, ή 12, 4 ή 25, -4 κλπ.) που δηλώνει τη κίνηση του macroblock

Εκτίμηση κίνησης (Motion estimation) (2/5)

Εκτίμηση κίνησης (motion estimation) (3/5) Συμπιέζει τα Ρ & Β πλαίσια μειώνοντας τον χρονικό πλεονασμό Βελτιώνει τη συμπίεση κατά ένα παράγοντα ~ 3 σε σύγκριση με την απλή ενδοπλαισιακή συμπίεση Κατά τη συμπίεση με εκτίμηση κίνησης στο συμπιεσμένο αρχείο αποθηκεύονται: Το διάνυσμα κίνησης (motion vector) (2 συντεταγμένες, x, y) της μετατόπισης του macroblock από την αρχική θέση (στο πλαίσιο αναφοράς) στη τελική θέση (στο πλαίσιο που κωδικοποιείται) Τη διαφορά περιεχόμενης πληροφορίας (error terms) μεταξύ του macroblock αναφοράς και του macroblock που κωδικοποιείται

Εκτίμηση κίνησης (Motion estimation) (4/5) P Ι Κωδικοποιείται: Διάνυσμα Κίνησης Διαφορά (σφάλμα) πληροφορίας

Εκτίμηση κίνησης (Motion estimation) (5/5) B Επιθυμητό πλαίσιο Προβλεπόμενο πλαίσιο (με βάση τα διανύσματα κίνησης των macroblocks) C «Σφάλμα» Πληροφορίας Διαφορά πληροφορίας που κωδικοποιείται στο αρχείο Α = B - C // Επιθυμητό = Προβλεπόμενο – Διαφορά

Τα βήματα του MPEG (1) Αναλύεται το αρχείο video για να καθοριστεί το ποια πλαίσια θα κωδικοποιηθούν ως πλαίσια-Ι, ποια ως πλαίσια–Ρ και ποια ως πλαίσια–Β. (2) Τα πλαίσια διαιρούνται σε macroblocks (16x16 pixels) (3) Το σήμα μετατρέπεται από RGB σε YUV ενώ ταυτόχρονα γίνεται και υποδειγματοληψία χρώματος. (4) Εφαρμόζεται η τεχνική εκτίμησης κίνησης σε κάθε πλαίσιο-Ρ και –Β. (5) Σε κάθε πλαίσιο Ι,-Ρ και Β τα macroblocks συμπιέζονται κατά JPEG, (6) Εφαρμογή συμπίεσης κατά Huffman στις τελικές τιμές

Πληρο-φορία σφάλ-ματος Κωδικοποίηση MPEG Furht et al. 1996 JPEG Κωδικοποίηση Πληρο-φορία σφάλ-ματος Διανύ-σματα κίνησης

MPEG-1 MPEG-1 Εκδόθηκε το 1992 Συμπίεση (και αποσυμπίεση) πληροφορίας video σε CD-ROM (Video CD) Μέγιστος ρυθμός μετάδοσης ψηφιακών δεδομένων (bit rate) 1.5 Mbps Λόγος συμπίεσης μεταξύ 50:1 και 100:1 Εφαρμόζεται σε σήμα με κωδικοποίηση χρώματος YCrCb. Εφαρμόζει 4:2:0 υποδειγματοληψία στο σήμα YCrCb.

MPEG-2 Εμφανίστηκε το 1994 Εφαρμογή: Τηλεόραση (και υψηλής ευκρίνειας HDTV) & Τεχνολογία DVD Bit rate από 4 έως 80 Mbps Ανάλυση 720x480 & 1280x720 στα 60 fps

MPEG-4 Το MPEG-4 παρουσιάστηκε το 1998 Συμπίεση για εφαρμογές Διαδικτύου Χαμηλό bit rate (ανάλυση 176x144 στα 10fps και εύρος ζώνης μεταξύ 4.8 και 64kbps). Εγκαταλείπει την έννοια του πλαισίου (frame) Εντοπίζει τις οντότητες που συνθέτουν την εικόνα (σχέδια, αντικείμενα, άνθρωποι, ήχος) = Audio Visual Objects (AVOs) Τα AVOs συσχετίζονται μεταξύ τους και αυτές οι σχέσεις κωδικοποιούνται Τεχνικές συμπίεσης Κωδικοποίηση σχημάτων Εκτίμηση κίνησης (motion estimation) DCT

Τεχνολογία DV Σύνολο ψηφιακών τεχνολογιών και τεχνικών (πχ. ψηφιακές βιντεοκάμερες, μορφοποιήσεις & σχήματα συμπίεσης ψηφιακού video, λογισμικό επεξεργασίας αρχείων ψηφιακού video) για την παραγωγή και επεξεργασία οπτικοακουστικής πληροφορίας αποκλειστικά σε ψηφιακή μορφή. Η «οικογένεια DV» περιλαμβάνει: κλασσική μορφοποίηση DV πλατφόρμα DVCAM (από τη Sony), DVCPRO (από τις Panasonic, Philips και ορισμένες άλλες εταιρίες).

Σύγκριση DV & αναλογικού video S-VHS / Hi8 VHS / 8mm Οριζόντια Ανάλυση (γραμμές) 500 400-420 240-250 Κωδικοποίηση χρώματος Component Y/C Composite Λόγος σήματος προς θόρυβο (Signal/Noise σε db) 60 45-46 43-45

Χαρακτηριστικά επεξεργασία τυχαίας προσπέλασης Δεν εμφανίζει το πρόβλημα των «επόμενων γενεών» Δεν εμφανίζει τα προβλήματα ποιότητας που προκύπτουν κατά την ψηφιοποίηση αναλογικής πληροφορίας. Πολύ μικρότερο μέγεθος βιντεοκάμερας Ευκολίες λόγω σύγκλισης των τεχνολογιών Ήχος με ποιότητα CD component σχήμα κωδικοποίησης χρώματος

DV25, DV50, DV100 Τρείς «οικογένειες» τεχνολογίας ψηφιακού video DV 25 DV, DVCAM, και DVCPRO συμπιέzουν το σήμα video σε bit rate 25 Mbps υποδειγματοληψία 4:1:1 ή 4:2:0 και λόγος συμπίεσης 5:1 DV 50 DVCPRO50 (Panasonic) και D-9 (JVC) υποδειγματοληψία 4:2:2. συμπιέzουν το σήμα video σε bit rate 50 Mbps DV 100 Bit rate 100 Mbps προορίζεται αποκλειστικά για τηλεοπτικό σήμα υψηλής ευκρίνειας (HDTV)

Audio στο DV Η τεχνολογία DV επιτρέπει τις εξής μορφοποιήσεις για την εγγραφή του ήχου: (α) 48 KHz, 16 bits, 2 κανάλια (stereo), κλειδωμένο ή όχι (β) 32 KHz, 16 bits, 2 κανάλια (stereo), κλειδωμένο ή όχι (γ) 32 KHz, 12 bits, 4 κανάλια (2 κανάλια stereo), κλειδωμένο ή όχι (δ) 44.1 KHz, 16 bits, 2 κανάλια (stereo), ξεκλείδωτο Οι μορφοποιήσεις (α) και (γ) είναι οι συνηθέστερες που απαντώνται στις βιντεοκάμερες. Ο κλειδωμένος ήχος «κλειδώνει» τη δειγματοληψία του ήχου και την αντίστοιχη των πλαισίων σε μια καθορισμένη σχέση αναλογίας.

ΙΕΕΕ 1394 Οι ονομασίες: δηλώνουν το ίδιο: IEEE-1394 (το ΙΕΕΕ προέρχεται από τα αρχικά «Institute of Electrical and Electronics Engineers»), FireWire™ (κατοχυρωμένη εμπορική ονομασία της Apple), i.Link™ (κατοχυρωμένη εμπορική ονομασία της Sony Electronics, Inc) δηλώνουν το ίδιο: ένα πρωτόκολλο επικοινωνίας υψηλής ταχύτητας διαμεταγωγής ψηφιακών δεδομένων (μέχρι και 400 Mbps) που είναι αναπόσπαστα συνδεδεμένο με τη τεχνολογία ψηφιακού video (κύρια με την πλατφόρμα DV25).

Τύπος Mega Bytes per second Σειριακή 0.01 Παράλληλη 0.115 USB 1.5 SCSI-1 5 SCSI-2 10 Ultra SCSI 20 1394 (FireWire) 12.5-50 Wide Ultra SCSI 40