MPEG Standards Spyros Psychis 21/11/2018

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
ΗΥ Παπαευσταθίου Γιάννης1 Clock generation.
Advertisements

Business English Ενότητα # 9: Financial Planning Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά.
Προσομοίωση Δικτύων 2n Άσκηση Δημιουργία, διαμόρφωση μελέτη επικοινωνιακών ζεύξεων.
Week 11 Quiz Sentence #2. The sentence. λαλο ῦ μεν ε ἰ δότες ὅ τι ὁ ἐ γείρας τ ὸ ν κύριον Ἰ ησο ῦ ν κα ὶ ἡ μ ᾶ ς σ ὺ ν Ἰ ησο ῦ ἐ γερε ῖ κα ὶ παραστήσει.
ΜΕΤΑΣΧΗΜΑΤΙΣΤΕΣ TRANSFORMERS Reference : ΤΕΙ Κρήτης - Ηλεκτρικές Μηχανές Συλλιγνάκης.
Τελική εργασία του μαθήματος “Σχεδιασμός Δημιουργικού & Διαφημιστικών Μηνυμάτων” Ιανουάριος 2054 Ομάδα Χ Ονοματεπώνυμο 1 Ονοματεπώνυμο 2 Ονοματεπώνυμο.
Διοίκηση Απόδοσης Επιχειρηματικών Διαδικασιών Ενότητα #5: Key result indicators (KRIs), Performance Indicators (PIs), Key Performance Indicators (KPIs)
Προσομοίωση Δικτύων 4η Άσκηση Σύνθετες τοπολογίες, διακοπή συνδέσεων, δυναμική δρομολόγηση.
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εισαγωγή στην Ανθρωπολογία της Τέχνης Η έννοια της Τέχνης (What is art 1) Διδάσκων: Καθηγητής Χρήστος.
Προσομοίωση Δικτύων 3η Άσκηση Δημιουργία, διαμόρφωση μελέτη σύνθετων τοπολογιών.
Time Management Matrix Assignment Submitted By Safwan Zubair October 21, 2013 BUS Contemporary Business Practice Professor Nankin.
Αριθμητική Επίλυση Διαφορικών Εξισώσεων 1. Συνήθης Δ.Ε. 1 ανεξάρτητη μεταβλητή x 1 εξαρτημένη μεταβλητή y Καθώς και παράγωγοι της y μέχρι n τάξης, στη.
ΕΥΡΩΠΑΪΚΑ ΣΧΟΛΕΙΑ. SCHOOLS OF EUROPEAN EDUCATION.
ΑΣΦΑΛΕΙΑ ΑΣΘΕΝΩΝ (PATIENT SAFETY) ωφελέειν ή μη βλάπτειν ωφελέειν = θεραπευτική παρέμβαση μη βλάπτειν = ασφάλεια ασθενών.
Αντίληψη (2016) Όραση Μαρία Κουτρομάνου. Structure of the Eye: Iris The iris is similar to the diaphragm in a camera Your iris widens in dim light and.
1 Πληροφορική Ι Ενότητα 2 : Ψηφιακή Αναπαράσταση Δεδομένων Δρ. Γκόγκος Χρήστος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
Διαχείριση Διαδικτυακής Φήμης! Do the Online Reputation Check! «Ημέρα Ασφαλούς Διαδικτύου 2015» Ε. Κοντοπίδη, ΠΕ19.
1 Αποτελέσματα κλάδου – ‘Α τρίμηνο 2015 Το α’ τρίμηνο του 2015 ο κλάδος παρουσιάζει τάσεις σταθεροποίησης στα έσοδα του ενώ οι επενδύσεις αυξάνονται με.
OFDM system characteristics. Effect of wireless channel Intersymbol interference in single carrier systems due to multipath propagation with channel delay.
Guide to Business Planning The Value Chain © Guide to Business Planning A principal use of value chain analysis is to identify a strategy mismatch between.
Guide to Business Planning The Value System © Guide to Business Planning The “value system” is also referred to as the “industry value chain”. In contrast.
Chapter 16 Control Unit Implemntation. A Basic Computer Model.
ΒΕΣ 04 – Συμπίεση και Μετάδοση Πολυμέσων
Μαθαίνω με “υπότιτλους”
Αντισταθμιστική ανάλυση
Φάσμα παιδαγωγικής ανάπτυξης
Ενότητα 2 : Ψηφιακή Αναπαράσταση Δεδομένων Δρ. Γκόγκος Χρήστος
Τμήμα Εφαρμοσμένης Πληροφορικής και Πολυμέσων Εργαστήριο Ρομποτικής
Επανασχεδιασμός του Ευρωπαϊκού Συστήματος Ενδοκοινοτικών Συναλλαγών (Revised Intrastat) Η συγκεκριμένη παρουσίαση συνοψίζει την ανάλυση των αποτελεσμάτων.
Matrix Analytic Techniques
Υδρόβια Φυτά Θεοφανώ Κούλεντρου Rippling Water (Basic)
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Keystroke-Level Model
Άλλη επιλογή: Κύλινδρος:
Πανεπιστήμιο Θεσσαλίας
ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Το χάρτινο θέατρο εμφανίζεται στη Ευρώπη στα τέλη του 18ου αιώνα
Οσμές στη Σχεδίαση του Λογισμικού
Γεώργιος Σ. Γκουμάς MD,PhD, FESC
Development of sample e-Hoop content
ECTS-DS Labels Selection 2011 Αθήνα, 28/11/2011
2 Θεςη και διαταξη 11/9/2018 6:52 πμ ΔΡ. ΧΡΥΣΟΥΛΑ ΠΑΠΑΪΩΑΝΝΟΥ
Aρχιτεκτονική άμεσων ενισχύσεων
Μία πρακτική εισαγωγή στην χρήση του R
Ανάλυση Γεωργικού Οικογενειακού Εισήματος (ΓΟΕ)
Πανεπιστήμιο Θεσσαλίας
Εκπαιδευτική ρομποτική
ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ
Απαιτήσεις Δικτύου για Ηχητικά και Video Σήματα
«Ψηφιακά σύνολα εικόνων για τα σημαντικά ιστορικά και πολιτιστικά υλικά» Αγάθος Μιχάλης 10/11/2018.
Find: φ σ3 = 400 [lb/ft2] CD test Δσ = 1,000 [lb/ft2] Sand 34˚ 36˚ 38˚
Χαρακτηριστικά και Αξιολόγηση Δικτύου για εφαρμογές Πολυμέσων
JSIS E 111: Elementary Modern Greek
aka Mathematical Models and Applications
GLY 326 Structural Geology
ΕΝΣΤΑΣΕΙΣ ΠΟΙΟΣ? Όμως ναι.... Ένα σκάφος
ΤΙ ΕΙΝΑΙ ΤΑ ΜΟΆΙ;.
Find: ρc [in] from load γT=110 [lb/ft3] γT=100 [lb/ft3]
Class X: Verbal Roots and Imperfect © Dr. Esa Autero
Βάλια Τόλιου, Registry Manager for Greece
Χαρακτηριστικά και Αξιολόγηση Δικτύου για εφαρμογές Πολυμέσων
Find: Force on culvert in [lb/ft]
Καθηγητής Γεώργιος Ευθύμογλου
Deriving the equations of
Find: ρc [in] from load (4 layers)
Εθνικό Μουσείο Σύγχρονης Τέχνης Faceforward … into my home!
CPSC-608 Database Systems
ΜΥΕ003: Ανάκτηση Πληροφορίας
Μεταγράφημα παρουσίασης:

MPEG Standards Spyros Psychis 21/11/2018 Σκοπός της παρουσίασης είναι να γίνει μια σύντομη καταγραφή των βασικότερων standards για την κωδικοποίηση video κυρίως από την οπτική του δικτυακής τους υπόστασης. Του τρόπου δηλαδή που κωδικοποιούν την πληροφορία προκειμένου να την διοχετεύσουν για μετάδοση σε ενσύρματους ή ασύρματους διαύλους. 21/11/2018

Introduction Generally speaking, video sequences contain a significant amount of statistical and subjective redundancy within and between frames. Το video αποτελείται από μία αλληλουχία εικόνων οι οποίες εναλλάσονται με ταχύτητα (από 15-30 ανά sec) και δίνουν την εντύπωση της κίνησης. Ο θεατής είναι πρακτικά αδύνατον να αντιληφθεί ότι στην πραγματικότητα αυτό που βλέπει είναι μεμονωμένες εικόνες καθώς η ικανότητα χρονικής διάκρισης του ανθρώπινου ματιού υπερβαίνει το 1/20 του δευτερολέπτου. Δυστυχώς όμως λόγω της φύσης της ψηφιακής εικόνας (video frame) που αποτελείται από αρκετές χιλιάδες pixels το πληροφοριακό περιεχόμενο μιας video ακολουθίας είναι εξαιρετικά μεγάλο. Ευτυχώς υπάρχει στατιστικός πλεονασμός πληροφορίας αλλά και πλεονασμός όσον αφορά το ανθρώπινο αισθητήριο. Π.χ. Στην απεικόνιση ενός ανθρώπου πού μιλάει μπροστά από ένα τοίχο το background δεν είναι απαραίτητο να κωδικοποιηθεί ixel προς pixel. 21/11/2018

The ultimate goal of video source coding is the bit-rate reduction for storage and transmission by exploring both statistical and subjective redundancies and to encode a "minimum set" of information using entropy coding techniques. O απώτατος σκοπός της κωδικοποίησης λοιπόν είναι να καθαριστεί η πληροφορία από στατιστικούς και αισθητικούς πλεονασμούς. 21/11/2018

Dependent on the applications requirements we may envisage "loss-less" and "lossy" coding of the video data. The aim of "loss-less" coding is to reduce image or video data for storage and transmission while retaining the quality of the original images - the decoded image quality is required to be identical to the image quality prior to encoding. Παρουσιάζονται όμως ορισμένα προβλήματα και απαιτήσει που έχουν να κάνουν με το είδος της πληροφορίας και της εφαρμογής που θα την αξιοποιήσει. Η κωδικοποίηση μπορεί είτε να προκαλεί απώλεια πληροφορίας είτε όχι. Για παράδειγμα στην ψηφιακή αναπαράσταση μιας εικόνας από αξονικό τομογράφο πρέπει να είμαστε εξαιρετικά προσεκτικοί στο είδος τησ πληροφορίας που θα πεταχτεί. Πολύ περισσότερο από ότι θα είμαστε όταν κωδικοποιούμε ψηφιακά ένα διαφημιστικό clip. 21/11/2018

“objective" or “subjective" optimization criteria. In contrast the aim of "lossy" coding techniques (MPEG-X, H.xxx) is to meet a given target bit-rate for storage and transmission. “objective" or “subjective" optimization criteria. What is visible? Τα standards MPEG & H.xxx είναι LOSSY κωδικοποιήσεις. Υπάρχουν υποκειμενικά και αντικειμενικά κριτήρια για αυτό που βλέπουμε. (SNR) Εν τέλει αυτό που μετραέι είναι αυτό που αντιλαμβάνεται ο μέσος θεατής. 21/11/2018

MPEG1: Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbps. MPEG2: Similar to MPEG1 but includes extensions to cover a wider range of applications. The primary application targeted during the MPEG-2 definition process was the all-digital transmission of broadcast TV quality video at coded bitrates between 4 and 9 Mbps. Το MPEG-1 κάλυψε την ανάγκη για ψηφιοποίηση video μέσων αναλύσεων αντίστοιχων με αυτών της σημερινής τηλεόρασης Το MPEG-2 κάλυψε την ανάγκη για υψηλότερες αναλύσεις CATV με υψηλότερους ρυθμούς Bitrates. 21/11/2018

Compression ratios vary from 50:1 to 200:1 (JPEG: 20:1 to 25:1) Here are some examples of typical frame sizes in bits: Parameters assume Test Model for encoding, I frame distance of 15 (N = 15), and a P frame distance of 3 (M = 3). I P B Avg MPEG-1 SIF @ 1.15 Mbps 150000 50000 20000 38000 MPEG-2 @ 4.00 Mbps 400000 200000 80000 130000 Compression ratios vary from 50:1 to 200:1 (JPEG: 20:1 to 25:1) IMPRTANT: MPEG algorithms are asymmetrical. More complex to compress than to decompress it. 21/11/2018

Example of temporal picture structure. There are 3 kinds of video frames: Intra (I), Predicted (P) and Bi - directional or interpolated (B). Each GOP begins with an I frame. 21/11/2018

I, P and B GOP example: IBBBPBBBPI or IPPBPBPBPPI I Pictures provide reference points. DCT transform is applied just like JPEG. Not very complex but neither very compressed. P Pictures are forward predicted related to preceding I or P pictures. More complex than I but higher compression achieved. B Pictures are forward, backward or bi-directional predicted related to other I or P pictures. Most complex but achieve highest compression ratios. GOP example: IBBBPBBBPI or IPPBPBPBPPI Τα video frames χωρίζονται σε IPB ανάλογα με τον τρόπο που έχουν κωδικοποιηθεί. Έτσι τα I είναι απλές JPEG εικόνες (DCT transform) Τα P έχουν κωδικοποιηθεί με βάση την προηγούμενη Ι ή Ρ εικόνα. Τα Β έχουν κωδικοποιηθεί και με βάση επόμενη εικόνα 21/11/2018

Motion Compensation MPEG-1 uses Macro Blocks of 16x16 pixels (16x16 is based on the trade-off: Coding gain / Complexity). Motion Vectors are estimated according to the Macro Blocks movement through time. To 16x16 είναι κάτι πολύ ρευστό.... Μπορεί να μεταβληθεί ανάλογα με την κινητικότητα της ταινίας 21/11/2018

Techniques used to achieve high compression ratio. Select an appropriate spatial resolution for the signal The algorithm then uses block based motion compensation to reduce the temporal redundancy. Επιλογή του κατάλληλου μεγέθους των blocks Motion compensation Motion Vector 21/11/2018

Motion compensation is used for causal prediction of the current picture from a previous picture, for non-causal prediction of the current picture from a future picture, or for interpolative prediction from past and future pictures. The difference signal, the prediction error, is further compressed using the discrete cosine transform DCT to remove spatial correlation and is then quantized The motion vectors are combined with the DCT information and coded using variable length codes 21/11/2018

So… why MPEG 1 & 2 exist? The most important goal of MPEG-1 and MPEG-2 was to make the storage and transmission of AV material more efficient, by compressing the data. Thus they deal with “frame-based” video & audio. Interaction with the content is limited to the video frame level only (ffwd, rewind, pause etc) 21/11/2018

What is special with MPEG-4? The MPEG-4 goes beyond these goals by specifying a description of digital AV scenes in the form of “objects” specially related in space and time. A wider variety of “objects” are supported: Natural video, Audio, Text, animation, synthetic video, synthetic sound and whiteboards 21/11/2018

MPEG-4 is optimized for: 1. Low (<64 kbps) mode 2. Intermediate (64 –384 kbps) mode 3. High (384 – 4 Mbps) mode It supports both CBR and VBR 21/11/2018

H.263 H.263 is a low bit rate video standard. Adopts the idea of PB frame. It consists of two pictures being coded as a unit. One P picture predicted from the last decoded P picture and one B predicted from the last decoded P and the P which is currently being decoded. 21/11/2018

Description Language like “VRML” MPEG-2  H.261 MPEG-4  H.263   Description Language like “VRML” named: BIFS (Binary Format for Scene Description) BIFS Encoder is the ”compiler” of BIFS 21/11/2018

  BIFSencoder produces binary streams FLEXMux is used   FLEXMux is used For creating a single stream. DMIF provides signaling for FLEXMux It is not error robust TRANSMux is used For flexible transmition of similar streams over a network It is error robust 21/11/2018

COMPLEXITY For a small (QCIF, 176x144 pixels) video format an average PC is more than enough (Celeron class). For higher resolutions special hardware maybe needed. 21/11/2018

ROBUSTNESS Several tests have been carried out for bitrates between 32 kbps – 384 kbps For example: Ditto Radio Channel with BER up to 10-3 with average length of burst errors about 10 ms. Results show that the video quality remains high although they were achieved with low overheads (lower than ones used with MPEG-1,-2). Video recovers quickly at the end of error periods. Even better results were were taken with ARTS Profile. 21/11/2018

Sample Movie Tests Movie was taken from CSELT. Corresponds to a 352x288 Video Only documentary. First 20 seconds were analyzed. Average bitrate: 252,489 kbps 21/11/2018

Sample Movie Test 21/11/2018