Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεOdysseus Georgiadis Τροποποιήθηκε πριν 10 χρόνια
1
VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ Υπάρχουσες εφαρμογές:
Αναπαραγωγή αποθηκευμένου οπτικοακουστικού υλικού (εκπαιδευτικές/ψυχαγωγικές π.χ. video on demand) Οπτικοακουστική επικοινωνία πραγματικού χρόνου (ένας-προς-έναν π.χ. ενημέρωση διευθυντή από υπαλλήλους ή ένας-προς-πολλούς π.χ. σεμινάριο για υπαλλήλους ή φοιτητές)
2
ΣΥΛΛΗΨΗ VIDEO Υποσυστήματα γραφικών: σύνθετο σήμα RGB, σάρωση raster
Τηλεοράσεις: σύνθετο σήμα YUV ή YIQ, πλεκτή (interlaced) σάρωση Συμπέρασμα: απαιτείται ειδικό υλικό για μετατροπή σήματος
3
ΣΥΛΛΗΨΗ VIDEO Κάρτες υπέρθεσης video (video overlay boards): παρουσίαση εικόνας σε τμήμα οθόνης, συγχρονισμός, μίξη με κείμενο, γραφικά (όχι ψηφιοποίηση) Ψηφιοποιητές: ψηφιοποιούν το σήμα PAL ή NTSC από video player, camera, δυνατότητα editing, παρουσίαση οπουδήποτε στην οθόνη Κάρτες συμπίεσης: DVI (Intel 1989) πρότυπο για εφαρμογές κινούμενης εικόνας, MJPEG (Motion JPEG), MPEG.
4
ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ Χωρικό και χρονικό πλεόνασμα πληροφορίας
Συμπίεση κινούμενης εικόνας: εκμετάλλευση χωρικού (π.χ. MJPEG) ή και χρονικού πλεονάσματος (π.χ. MPEG) MJPEG: ευκολία επέμβασης σε πλαίσια και ανθεκτικότητα σε λάθη MPEG: συσχέτιση πλαισίου με προηγούμενα (άρα λάθη), αλλά μεγαλύτεροι λόγοι συμπίεσης
5
Η ΑΝΑΓΚΗ ΓΙΑ ΨΗΦΙΑΚΗ ΣΥΜΠΙΕΣΗ
Στόχος: οικονομία στο εύρος φάσματος Ασυμπίεστο τηλεοπτικό σήμα PAL: 5 MHz Ψηφιακή μετάδοση: 10 MHz (θεώρημα Nyquist) Τουλάχιστον 8 bits/δείγμα (256 επίπεδα) Έγχρωμη εικόνα: τρία κανάλια χρώματος Συνολικά: 3*10*8=240 Mbits/sec Transfer rate από/προς επεξεργαστή (PCI bus): 133 Mbits/sec Transfer rate CD-ROM: 60 Mbits/sec Συμπέρασμα: αδύνατη αποθήκευση/αναπαραγωγή
6
Η ΑΝΑΓΚΗ ΓΙΑ ΨΗΦΙΑΚΗ ΣΥΜΠΙΕΣΗ
Τυπική κινηματογραφική ταινία 90 min (5400 sec): 162 GB (μεγαλύτερο από συνήθη χωρητικότητα σκληρού δίσκου) CD-DA: 75 λεπτά ασυμπίεστου στερεοφωνικού ήχου στα 44.1 KHz με 16 bit/sample → 650 ΜΒ Αποθήκευση ψηφιακού video στο CD: 30 sec DVD (Digital Versatile Disk): 4.7 GB (θέλω 35 DVD!)
7
ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG
MPEG (Moving Picture Experts Group): ομάδα ISO/IEC JTC1/SC29/WG11 (1988) Συντονιστής επιτροπής MPEG: Leonardo Chiariglione («πατέρας» του MPEG) MPEG: οικογένεια τυποποιήσεων (MPEG-1, MPEG-2, MPEG-4, MPEG-7, MPEG-21)
8
ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG
MPEG-1 (Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/sec): ανάλυση 352240 pixels (NTSC) ή 352288 pixels (PAL) ποιότητα VHS video Αποθήκευση σε CD-ROM, Video-CD, CD-i Εφαρμογές με ρυθμό μετάδοσης 4-5 Mbits/sec (όχι καλά αποτελέσματα)
9
ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG
MPEG-2 (Generic coding of moving pictures and associated audio information): Ανάλυση 704480 pixels (NTSC) ή 704576 pixels (PAL) (broadcast quality) Εικόνα πλεκτής σάρωσης (interlaced) Ρυθμός μετάδοσης 3-10 Mbits/sec Εφαρμογές στην καλωδιακή τηλεόραση (CableTV), στη δορυφορική (Direct Broadcasting Satellite TV), αποθήκευση ταινιών σε DVD.
10
ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG
MPEG-4 (Coding of audio-visual objects): Audio-visual objects (AVO): οντότητες που απαρτίζουν την εικόνα (σχήματα, ήχοι κλπ.) Ανάλυση εικόνας 176144 pixels Ρυθμός μετάδοσης Kbits/sec (δίκτυα με μικρό bandwidth) Εφαρμογές επικοινωνίας πολυμέσων (video-phone, video-conference, video , electronic news κλπ.)
11
ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG
MPEG-7: πρότυπο κωδικοποίησης με αναπαράσταση περιεχομένου (content representation) για αναζήτηση πληροφοριών σε εφαρμογές πολυμέσων CPB (Constrained Parameters Bitstream): ορίζει διαστάσεις MPEG σημάτων (επιτρέπονται και υψηλότερες αναλύσεις, χωρίς εγγυημένη αναπαραγωγή) MPEG-2 έως 19201080 pixels, MPEG-1 έως 40954095 pixels
12
ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG
MPEG-2 προσφέρει καλύτερη εικόνα και λόγους συμπίεσης από το MPEG-1 και είναι συμβατό (backwards compatible) MPEG-3 προοριζόταν για Τηλεόραση Υψηλής Ευκρίνειας (HDTV – High Definition TV) αλλά MPEG-2 κάλυψε τις απαιτήσεις
13
ΠΟΙΟΤΙΚΗ ΑΝΟΧΗ Δεχόμαστε ένα ποσοστό παραμόρφωσης
Αναβαθμίζουμε το μέσο όρο ανάλυσης σκηνών Χρυσή τομή ανάμεσα σε ποιότητα και bandwidth Υποκειμενικές μετρήσεις που βασίζονται σε έμπειρους εκτιμητές Αποδεκτή συμπίεση: ανεκτές ατέλειες (artifacts) εικόνας Ήχος προσφέρεται για μεγαλύτερα ποσοστά συμπίεσης
14
ΠΛΕΟΝΑΣΜΟΣ Στατικός πλεονασμός (Spatial Redundancy): Γειτονικές περιοχές στο ίδιο frame είναι παρόμοιες. Υποκειμενικός πλεονασμός (Temporal Redundancy): Αντίστοιχες περιοχές σε διαδοχικά frames είναι παρόμοιες. Εκμετάλλευση υποκειμενικού πλεονασμού στην αναλογική τηλεόραση παλιότερα και τώρα σε ψηφιακή μετάδοση
15
DCT Coding (Discrete Cosine Transform Coding)
Όπου Κάθε συντελεστής μεταφέρει πληροφορία που αντιστοιχεί σε τμήμα του φάσματος Ανθρώπινη όραση αντιλαμβάνεται περισσότερο χαμηλές συχνότητες
16
DCT Coding (Discrete Cosine Transform Coding)
Αντίστροφος διακριτός μετασχηματισμός συνημίτονου (IDCT): Λαμβάνεται σχεδόν ανέπαφη η αρχική πληροφορία (εκτός από σφάλματα στρογγυλοποίησης)
17
ΚΒΑΝΤΟΠΟΙΗΣΗ Απαλλασσόμαστε από σημαντικό μέρος της πληροφορίας
Μετατροπή σήματος άπειρων τιμών σε σήμα ορισμένων διακριτών τιμών Παράδειγμα: κβαντοποίηση εικόνας εκατομμυρίων χρωμάτων σε εικόνα 256 τιμών (πρότυπο JPEG)
18
ΚΒΑΝΤΟΠΟΙΗΣΗ Παράδειγμα:
45 στο δυαδικό (6 bits) Με 4 bits είναι 1011 (δηλ. 11) Με 3 bits είναι 101 (δηλ. 5) κτλ. Συμπέρασμα: εισάγεται σφάλμα ανάλογο του πλήθους bits που απορρίπτονται (lossy compression) Διαίρεση τιμών με σταθερές τιμές (uniform quantization) ή με τιμές από πίνακα (quantization table) όπως στο MPEG (intra-frame και inter-frame)
19
ΤΜΗΜΑΤΙΚΗ ΠΡΟΒΛΕΨΗ ΚΙΝΗΣΗΣ (BLOCK MOTION COMPENSATION)
Αποτελεσματική περιγραφή εικόνων με κίνηση Δια-πλαισιακή (inter-frame) κωδικοποίηση Περιγραφή με τμήματα που παραμένουν ίδια και διανύσματα που δείχνουν μετακίνηση άλλων τμημάτων Προβλήματα: τμήματα αλλάζουν θέση αλλά και χρώμα, εμφανίζονται νέα τμήματα MPEG: καθορίζεται η αναπαράσταση με διανύσματα κίνησης (motion vectors) αλλά δεν καθορίζεται η μέθοδος εύρεσής τους
20
ΤΜΗΜΑΤΙΚΗ ΠΡΟΒΛΕΨΗ ΚΙΝΗΣΗΣ (BLOCK MOTION COMPENSATION)
Συνήθως χρησιμοποιείται το απόλυτο λάθος (Absolute Error): f(i,j) το τρέχον μπλοκ και g(i,j) το macroblock αναφοράς (περιοχή αναζήτησης) Το macroblock που δίνει ελάχιστο σφάλμα αντιστοιχεί στο διάνυσμα κίνησης (dx,dy) Πλήρης αναζήτηση (full search): Απλή αλλά υπολογιστικά πολύπλοκη
21
ΤΜΗΜΑΤΙΚΗ ΠΡΟΒΛΕΨΗ ΚΙΝΗΣΗΣ (BLOCK MOTION COMPENSATION)
Αναζήτηση τριών βημάτων (TSS – Three Step Search): Υπολογίζεται το AE στο κέντρο και σε οκτώ περιοχές της περιοχής αναζήτησης (μεγέθους 3232 pixels) Περιοχή με ελάχιστο AE γίνεται κέντρο νέας αναζήτησης (μισού μεγέθους) Επανάληψη διαδικασίας τρεις φορές (three steps)
22
ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG Τρία επίπεδα ρεύματος (stream) MPEG:
23
ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG Επίπεδο system: πληροφορίες σχετικά με συγχρονισμό, ροή σήματος, σημεία αναφοράς για τυχαία προσπέλαση και για διαχωρισμό video και audio και συγχρονισμένη απεικόνιση Επίπεδα video και audio: κωδικοποιημένη εικόνα και ήχος αντίστοιχα Κωδικοποίηση επιπέδων ταυτόχρονη είτε ξεχωριστή Συνένωση δεδομένων με πολυπλεξία (multiplexing) (real time είτε όχι)
24
ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG MPEG coding/decoding γίνεται με hardware ή software Λύση software: φθηνή αλλά χειρότερη ποιότητα εικόνας και απαίτηση υπολογιστικής ισχύος Λύση hardware: ακριβότερη, αλλά αυτόνομα συστήματα (encoders/decoders) και καλύτερη ποιότητα Κωδικοποιήσεις όπως Cinepak, Indeo, MJPEG στηρίζονται στο JPEG.
25
ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG Κωδικοποίηση MPEG επεκτείνει βασικές αρχές JPEG παραμετροποιώντας την κίνηση (μεγαλύτερα ποσοστά συμπίεσης) Τα πλαίσια (frames) χωρίζονται σε τμήματα (slices) Τα slices περιέχουν macroblocks (και αυτά με τη σειρά τους blocks μεγέθους 88 pixels) Τα slices περιορίζουν διάδοση σφαλμάτων (error propagation) - βοηθούν στην απόκρυψη σφαλμάτων (error concealment)
26
ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG
27
ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG Δειγματοληψία χρωματικών συνιστωσών αναλογικού σήματος τηλεόρασης (Cr και Cb) στα 6,75 MHz Δειγματοληψία φωτεινότητας (Υ) στα 13,5 MHz (διπλάσια συχνότητα) Και τα δύο πολλαπλάσια του 2,25 MHz (ΕΚΠ ρυθμού σάρωσης γραμμών σε PAL και NTSC) Στην ψηφιακή τους μορφή για κάθε macroblock τρεις πίνακες (ένας 1616 και δύο 88 pixels) Στους πίνακες αυτούς εφαρμόζεται ο DCT, οι άλλες διαδικασίες συμπίεσης και η πρόβλεψη κίνησης
28
ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG
29
ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra-frame Coding): κάθε εικόνα αντιμετωπίζεται και κωδικοποιείται ανεξάρτητα από τις υπόλοιπες (όπως στο JPEG) Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding): λαμβάνονται υπόψη ομοιότητες πλαισίων, κωδικοποιείται η διαφορά τους (με block motion compensation) → μεγαλύτερη συμπίεση
30
ΕΙΔΗ ΠΛΑΙΣΙΩΝ I (Intra frames): κάνει χρήση intra-frame coding
Κωδικοποιείται ολόκληρο το πλαίσιο Μεγάλο μέγεθος Σημεία αναφοράς Μεταδίδονται ανά τακτό αριθμό πλαισίων (ανά 15 τουλάχιστον) Εικόνα χωρίζεται σε macroblocks και εκτελείται για καθένα DCT, κβαντοποίηση, zig-zag scanning, run-length encoding, Huffman encoding
31
ΕΙΔΗ ΠΛΑΙΣΙΩΝ P (Predicted frames):
Βασίζονται σε προηγούμενο I ή P πλαίσιο Κωδικοποιείται ο αριθμός του macroblock και το διάνυσμα κίνησης (motion vector) Αποτελούν κι αυτά σημεία αναφοράς για επόμενα P πλαίσια Είναι μικρότερα από τα I frames (μεγαλύτερη συμπίεση) Σύγκριση macroblocks, γραμμικός συνδυασμός παρόμοιων, δημιουργία motion vector, DCT σε κάθε block, κβαντοποίηση, run-length encoding, Huffman encoding
32
ΕΙΔΗ ΠΛΑΙΣΙΩΝ P (Predicted frames):
33
ΕΙΔΗ ΠΛΑΙΣΙΩΝ B (Bi-directional frames):
Μέσος όρος (σε επίπεδο macroblock) προηγούμενου και επόμενου πλαισίου I και P Δεν αποτελούν σημεία αναφοράς Δεν διαδίδουν σφάλματα όσο τα άλλα Δεν περιέχουν αυθύπαρκτη πληροφορία Αφαίρεση μέσου όρου macroblocks (προηγούμενου κι επόμενου πλαισίου) από το τρέχον πλαίσιο, συνδυασμός motion vectors (μέσος όρος), και κωδικοποίηση όπως τα I και P πλαίσια
34
ΕΙΔΗ ΠΛΑΙΣΙΩΝ B (Bi-directional frames):
35
ΕΙΔΗ ΠΛΑΙΣΙΩΝ Χρησιμότητα πλαισίων B: για τις περιπτώσεις που πληροφορία σε επόμενα πλαίσια δεν υπάρχει σε προηγούμενα (π.χ. ανοίγει πόρτα που αποκαλύπτει νέα αντικείμενα) Συμπεράσματα: Τα πλαίσια I πρέπει να στέλνονται πριν τα αντίστοιχα P Τα πλαίσια P και I πρέπει να στέλνονται πριν τα αντίστοιχα Β Πολλές φορές παρεμβάλλονται περισσότερα Β πλαίσια και τα Ι πλαίσια απέχουν περισσότερο
36
ΕΙΔΗ ΠΛΑΙΣΙΩΝ
37
ΕΙΔΗ ΠΛΑΙΣΙΩΝ GOP (Group of Pictures): Αναλογία πλαισίων σε σήμα MPEG:
Η μικρότερη μονάδα που αποκωδικοποιείται ανεξάρτητα. Περιέχει όλα τα Ι,Ρ,Β πλαίσια που χρειάζονται για αποκωδικοποίηση (χωρίς αναφορά σε άλλα GOP) Αναλογία πλαισίων σε σήμα MPEG: Είδος σήματος Bit-rate I P B MPEG-1 1.15 Mbit/sec 150,000 50,000 20,000 MPEG-2 4 Mbit/sec 400,000 200,000 80,000
38
ΠΑΡΑΔΕΙΓΜΑ: ΣΚΗΝΗ 3 ΠΛΑΙΣΙΩΝ
39
ΠΛΑΙΣΙΑ ΠΡΟΒΛΕΨΗΣ ΚΑΙ ΑΝΑΦΟΡΑΣ
40
ΑΝΤΙΣΤΑΘΜΙΣΗ ΚΙΝΗΣΗΣ
41
ΠΛΑΙΣΙΑ ΔΙΠΛΗΣ ΚΑΤΕΥΘΥΝΣΗΣ
42
RUN LENGTH ΚΑΙ HUFFMAN CODING
Δε μεταβάλλονται οι τιμές των δειγμάτων Μειώνεται το πλήθος bits Run-Length-Encoding: Πολλά μηδενικά σε διαδοχικές θέσεις Flags δείχνουν ότι ακολουθεί ομάδα τιμών Huffman Coding: Συχνότερα εμφανιζόμενες τιμές -> λίγα bits Λεξικό για αντιστοίχιση (μαζί με το σήμα)
43
ADAPTIVE CODING Δύο είδη κωδικοποίησης: inter-frame και intra-frame
Απαιτείται μετάδοση ενός Ι πλαισίου κάθε 15 πλαίσια Το βίντεο μπορεί να έχει γρήγορες αλλαγές σκηνικών και χρωμάτων Κωδικοποιητής επιλέγει είδος κωδικοποίησης (πολύπλοκη υλοποίηση) MPEG-2: μεταβαλλόμενος ρυθμός μετάδοσης
44
ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ
Παράδειγμα: κωδικοποίηση ενός Ι-frame 131 134 139 143 144 141 146 149 145 150 153 148 151 152 147
45
ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ
Εφαρμόζεται ο μετασχηματισμός DCT: 294,94 0,32 -3,08 -1,37 0,44 -0,02 -0,42 0,19 -5,81 -4,07 -1,19 -0,41 -0,15 -0,08 -0,11 -2,62 -2,40 -0,34 0,09 -0,29 0,01 0,06 -0,17 -2,06 -0,19 0,10 0,65 0,31 0,00 0,21 -0,25 -0,20 0,28 0,11 -0,01 0,02 0,16 -0,26 0,13 -0,21 0,33 -0,22 -0,27 0,35 0,12 -0,00 -0,12 0,66 -0,31 0,36 -0,50 -0,32 -0,52 0,37 0,07
46
ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ
Κατωφλίωση (thresholding): 294,94 0,00 -3,08 -1,37 -5,81 -4,07 -1,19 -2,62 -2,40 -2,06
47
ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ
Κβαντισμός (π.χ. στρογγυλοποίηση): 295 0,00 -3 -1 -6 -4 -2
48
ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ
Σάρωση σε σχήμα zig-zag:
49
ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ
Εικόνα μετά από αποκωδικοποίηση: 131 134 139 142 144 136 143 146 147 145 148 150 152 151 149 153
50
ΠΡΟΤΥΠΟ MPEG-2 Υποστηρίζει μεγαλύτερους ρυθμούς μετάδοσης δεδομένων (2-80 Mbits/sec) Χρησιμοποιείται για υψηλής ποιότητας ψηφιακό video (καλωδιακή, δορυφορική μετάδοση, DVD) Υποστηρίζονται ιεραρχικά/κλιμακωτά προφίλ Κάθε προφίλ υποστηρίζει χαρακτηριστικά συγκεκριμένης ομάδας εφαρμογών
51
ΠΡΟΦΙΛ MPEG-2 Ανώτερο επίπεδο 1920 εικονοστοιχεία/γραμμή 1152 γραμμές
< 80 Mbit/s < 100 Mbit/s 1440 εικονοστοιχεία/γραμμή 1152 γραμμές. < 60 Mbit/s Κύριο επίπεδο 720 εικονοστοιχεία/γραμμή 576 γραμμές. < 15 Mbit/s <15Mbit/s < 20 Mbit/s Κατώτερο επίπεδο 352 εικονοστοιχεία/γραμμή 288 γραμμές. < 4 Mbit/s ΣΤΡΏΜΑΤΑ Και ΠΡΟΤΥΠΑ Απλό προφίλ Χωρίς πλαίσια τύπου B 4:2:0 Όχι κλιμάκωση Κύριο Προφίλ Πλαίσια τύπου B SNR Κλιμακωτό Πλαίσια τύπου B SNR κλιμάκωση Ριποειδές SNR κλιμακωτό ,ή ριποειδές Ανώτερο 4:2:0 ,ή 4:2:2 SNR Κλιμακωτό , ή ριποιδές κλιμακωτό.
52
ΚΛΙΜΑΚΩΣΙΜΟΤΗΤΑ ΣΤΟ MPEG-2
Χωρική κλιμακωσιμότητα (Spatial scalability): δύο επίπεδα video με διαφορετικές χωρικές αναλύσεις (κωδικοποίηση πυραμίδας). Χρονική κλιμακωσιμότητα (Temporal scalability): δύο επίπεδα video με το ένα να κάνει χρονική πρόβλεψη ως προς το άλλο. Τεμαχισμός δεδομένων (Data partitioning): χωρισμός σε κρίσιμα δεδομένα (π.χ. επικεφαλίδες, διανύσματα κίνησης κλπ.) και λιγότερο κρίσιμα (π.χ. ψηλοί DCT συντελεστές). Κλιμακωσιμότητα εύρους (SNR scalability): δύο επίπεδα video με ίδια χωρική ανάλυση αλλά διαφορετική ποιότητα (προοδευτική ή κατά επίπεδα κωδικοποίηση).
53
ΠΡΟΤΥΠΟ MPEG-4 Αρχικά σχεδιάστηκε για εφαρμογές πολύ χαμηλού ρυθμού δεδομένων (π.χ. κινητές επικοινωνίες) Βασίζεται στην επιτυχία τριών περιοχών: Ψηφιακή τηλεόραση Διαδραστικές εφαρμογές γραφικών (συνθετικό περιεχόμενο) Διαδραστικά πολυμέσα (WWW, διανομή και πρόσβαση σε περιεχόμενο)
54
ΠΡΟΤΥΠΟ MPEG-4 Το MPEG-4 παρέχει πρότυπους τρόπους για:
Αναπαράσταση μονάδων ακουστικού, οπτικού ή οπτικοακουστικού περιεχομένου, των “media objects” (συνθετικά ή φυσικά) Περιγραφή της σύνθεσης αυτών των αντικειμένων Πολυπλεξία και συγχρονισμό των δεδομένων που σχετίζονται με τα media objects Αλληλεπίδραση με την οπτικοακουστική σκηνή στην πλευρά του δέκτη
55
ΠΡΟΤΥΠΟ MPEG-4 Πρωτογενή media objects:
Σταθερές εικόνες (π.χ. ένα σταθερό φόντο) Αντικείμενα video (π.χ. ένα άτομο που μιλάει) Αντικείμενα audio (π.χ. η φωνή που σχετίζεται με αυτό το άτομο, μουσική υπόβαθρου) Επίσης καθορίζεται η κωδικοποιημένη αναπαράσταση αντικειμένων όπως: Κείμενο και γραφικά Ομιλούντα συνθετικά κεφάλια και συσχετιζόμενο κείμενο Συνθετικός ήχος
56
ΠΡΟΤΥΠΟ MPEG-4 Το MPEG-4 παρέχει ένα πρότυπο τρόπο να συντίθεται μια σκηνή, επιτρέποντας: Τοποθέτηση media objects οπουδήποτε σε ένα δεδομένο σύστημα συντεταγμένων Εφαρμογή μετασχηματισμών για να αλλάξει η γεωμετρική και ακουστική εμφάνιση ενός media object Ομαδοποίηση πρωτογενών media objects για το σχηματισμό σύνθετων Εφαρμογή ρεύματος δεδομένων σε media objects για να τροποποιηθούν τα χαρακτηριστικά τους Αλληλεπιδραστική αλλαγή των σημείων θέασης και ακρόασης του χρήστη οπουδήποτε στη σκηνή
58
ΠΡΟΤΥΠΟ MPEG-4 Λειτουργίες που επιτρέπεται να εκτελέσει ένας χρήστης περιλαμβάνουν: Αλλαγή του σημείου θέασης/ακρόασης της σκηνής, π.χ. με πλοήγηση μέσω μιας σκηνής Τράβηγμα αντικειμένων στη σκηνή σε μια άλλη θέση Πρόκληση μιας σειράς γεγονότων κλικάροντας σε συγκεκριμένο αντικείμενο, π.χ. εκκίνηση ή σταμάτημα ενός ρεύματος video Επιλογή της επιθυμητής γλώσσας όταν είναι διαθέσιμα πολλαπλά tracks για τη γλώσσα
59
PROPRIETARY COMPRESSION
DVI (Digital Video Interactive): Παρουσιάστηκε το 1989 από την Intel Κάρτες για σύλληψη, συμπίεση, αναπαραγωγή εικόνας με αυτό το πρότυπο RTV (Real Time Video): επιτρέπει συμπίεση/αποσυμπίεση σε πραγματικό χρόνο (και interactive editing) PLV (Presentation Level Video): μη συμμετρική τεχνική συμπίεσης υψηλής ποιότητας Ο αλγόριθμός του DVI στηρίζεται στον DCT
60
PROPRIETARY COMPRESSION
Fractal Image Compression: Η εταιρεία Iterated Systems προσφέρει προϊόντα τόσο για ακίνητη όσο και για κινούμενη εικόνα Αποσυμπίεση (χωρίς hardware) σε πραγματικό χρόνο (σε υπολογιστή ΜΗz) Μέγεθος εικόνας 320×200 pixels Ρυθμός ανανέωσης 30 fps Βάθος χρώματος 15 bits
61
PROPRIETARY COMPRESSION
QuickTime: Τεχνολογία της Apple (για Macintosh και Windows) Λόγοι συμπίεσης από 5:1 έως 25:1 Μέγεθος εικόνας 160×120 με ρυθμό 15 fps Μετέπειτα έκδοση: 320×240 με ρυθμό 10 ως 15 fps Αποσυμπίεση με λογισμικό Video for Windows: Διάφορα είδη συμπίεσης (π.χ. Video και RLE της Microsoft, Indeo της Intel βασιζόμενο στο DVI)
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.