Κείμενο, Ήχος, Εικόνα & Video KEIMENO
Κείμενο n Κυρίαρχος τρόπος απεικόνισης πληροφορίας n Αποκλειστικό μέσο επικοινωνίας ανθρώπου - μηχανής n Aδυναμία αρχικών Η/Υ για χειρισμό ήχου, εικόνας και video n Περιορισμοί προτύπου ASCII για πολυγλωσσικές εφαρμογές
Κείμενο και Η/Υ n Αρχικές χρήσεις –Συγγραφή προγραμμάτων Η/Υ –Εισαγωγή δεδομένων n Σημερινές χρήσεις –Απλές κωδικοποιήσεις χαρακτήρων –Γλώσσες περιγραφής σελίδας
American Standard Code for Information Interchange n Η πιο απλή- διαδεδομένη μέθοδος κωδικοποίησης κειμένου n Χρησιμοποιεί λέξεις των 7 bit -> αποθηκεύονται σε 1 byte n Περιλαμβάνει το λατινικό αλφάβητο και κάποια ειδικά σύμβολα n Οι επιπλέον 128 χαρακτήρες χρησιμοποιούνται χωρίς προτυποποίηση n Πληθώρα ασυμβατοτήτων μεταξύ εφαρμογών ακόμα και από την ίδια χώρα
International Standard Organization (ISO) character sets n Αρχικές προσπάθειες κάλυψης των ελλείψεων του ASCII n ISO 1987b LATIN -> Κωδικοποίηση των βασικών ευρωπαϊκών γλωσσών n X-Windows System, Postscript
The Unicode Standard n ISO/IEC ;1993 n 16 bit κωδικοποίηση -> συνδιασμοί n UTF extension -> επιλέον χαρακτήρες
The Unicode actual content n Latin, Greek, Cyrillic, Armenian, Hebrew, Arabic, Devanagari, Bengali, Gurmuki, Gujarati, Oryia, Tamil, Telugu, Kannada, Malayalam, Thai, Lao, Georgian, Tibetan, Japanese Kana, Korean Hangul, Unified set of Chinese/Japanese/Korean (CJK) ideographs
Under development n Ethiopic, Canadian Syllabic, Cherokee, Sinhana, Syriac, Burmese, Khmer, Braille and additional rare ideographs
Also included n Punctuation marks, diacritics, mathematical symbols, technical symbols, arrows, dingbats, etc n Total of characters from the world’s alphabets, ideograph sets and symbol collections
Unicode Design Basis n Define the smallest usefull elements of text to be encode; n Assign a unique code to each element and n Provide basic rules for encoding and interpreting text
Defining the elements of text n Letters such as «w» or «M» n Characters such as those used Japanese Hiragana to represent syllables n Ideographs such as those used in Chinese to represent full words or concepts
Text processing n The Unicode standard directly addresses only encoding and semantics n All other actions performed on the text are carried out by the word processing program
Principles of the Unicode Standard n Sixtee-bit characters, Logical order, n Full Encoding, Unification, n Characters-not Glyphs, Dynamic composition, n Semantics, Equivalent Sequence, n Plain text, Convertibility
Παρουσίαση Σελίδας - Mark-up κείμενο n Το τυπωμένο κείμενο μεταφέρει: –Νοηματικό περιεχόμενο –Μορφή κειμένου στην σελίδα n Η μορφή του κειμένου ορίζεται με χρήση οδηγιών παρουσίασης αναμεμιγμένων με το κείμενο (markup κείμενο)
Γλώσσες παρουσίασης κειμένου n Standardised General Markup Language SGML -> ISO standard n TEX -> UNIX
Δομημένο κείμενο - Hypertext n Παραδοσιακό κείμενο - Στοιχειώδης ιεραρχική δομή - Σειριακό διάβασμα n Κείμενο σε κόμβους - Διασύνδεση σε γράφο n Hypertext Markup Language (HTML) n Hypertext Browser
Χειρισμός κειμένου n Πράξεις χαρακτήρων n Πράξεις συμβολοσειρών n Επεξεργασία κειμένου n Φορμάρισμα κειμένου n Αναζήτηση n Συμπίεση n Κρυπτογράφηση