Εισαγωγή στις Αποθήκες Δεδομένων

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Advertisements

Γραφήματα & Επίπεδα Γραφήματα
Ερωτηματολόγιο Συλλογής Απαιτήσεων Εφαρμογών Υψηλών Επιδόσεων
Μάρτιος 2011 Βαρόμετρο ΕΒΕΘ - Καταναλωτές. “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι.
Χαρακτηριστικά Απλό & Φιλικό περιβάλλον εργασίας
Αλέξανδρος Σαχινίδης, ΜΒΑ, Ph.D. ΙΟΥΝΙΟΣ 2009
ΜοντελοποίησηΈργα ΜαθήματαΑξιολόγηση Αναστοχασμος Μαθήματα.
Διαχείριση Έργου Οργάνωση, σχεδιασμός και προγραμματισμός έργων ανάπτυξης λογισμικού.
-Στοίβα-Ουρά - Πλεονεκτήματα πινάκων -Δομές δεδομένων δευτερεύουσας μνήμης -Πληροφορική και δεδομένα -Παραδείγματα-Προβλήματα ψευδοκώδικα.
Προχωρημένα Θέματα Τεχνολογίας και Εφαρμογών Βάσεων Δεδομένων
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Πρώτο Αρχιτεκτονική.
Χαρακτηριστικά συνθετικής κίνησης 1 Ελληνογαλλική Σχολή Καλαμαρί - Τίκβα Χριστίνα.
Τα στοιχειώδη περί γεωδαιτικών υπολογισμών
ΤΑ ΜΕΡΗ ΤΟΥ ΠΟΔΗΛΑΤΟΥ
ΣΤΟΙΧΕΙΑ ΨΕΥΔΟΚΩΔΙΚΑ ΒΑΣΙΚΕΣ ΔΟΜΕΣ ΒΑΣΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΩΝ
Data Warehousing στον SQL Server 2005
Βάσεις Δεδομένων 1 T.Manavis– N.Kyritsis.
Προγραμματισμός Ι Πίνακες •Ο πίνακας είναι μία συλλογή μεταβλητών ίδιου τύπου, οι οποίες είναι αποθηκευμένες σε διαδοχικές θέσεις μνήμης. Χρησιμοποιείται.
Εκτέλεση Αλγορίθμων σε ψευδογλώσσα
Α. Νανόπουλος & Γ. Μανωλόπουλος Εισαγωγή στην Εξόρυξη & τις Αποθήκες Δεδομένων Κεφάλαιο 3: Αποθήκες Δεδομένων και OLAP
 Αυδίκου Χριστίνα  Γιουμούκης Παναγιώτης  Κιντσάκης Θάνος  Πάπιστας Γιάννης.
Καλώς ήρθατε ! Ετοιμάζεστε να παρακολουθήσετε την παρουσίαση της εφαρμογής Copyright © iBS LTD, all rights reserved.
Δρ. Παναγιώτης Συμεωνίδης
Βάσεις Δεδομένων (ΚΒΔ)
δφσδφ ΦΥΣΙΚΟ ΕΠΙΠΕΔΟ ΑΠΟΘΗΚΩΝ ΔΕΔΟΜΕΝΩΝ: ΜΕΡΟΣ Α’ 4/6/2017
ΑΠΟΘΗΚΕΣ ΔΕΔΟΜΕΝΩΝ (Data Warehouses)
Ανάλυση του λευκού φωτός και χρώματα
-17 Προσδοκίες οικονομικής ανάπτυξης στην Ευρώπη Σεπτέμβριος 2013 Δείκτης > +20 Δείκτης 0 a +20 Δείκτης 0 a -20 Δείκτης < -20 Σύνολο στην Ευρωπαϊκή Ένωση:
Βαρόμετρο ΕΒΕΘ - Καταναλωτές Σεπτέμβριος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι.
Κεφάλαιο 2ο Πεπερασμένα αυτόματα.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Συναρτησιακές Εξαρτήσεις.
ΣΧΕΣΙΑΚΟ ΜΟΝΤΕΛΟ ΜΑΘΗΜΑ 3.
ΙΣΟΛΟΓΙΣΜΟΣ ΒΑΣΕΙ Δ.Λ.Π. (ΕΝΑΡΞΗΣ)
Αποκεντρωμένη Διοίκηση Μακεδονίας Θράκης ∆ιαχείριση έργων επίβλεψης µε σύγχρονα µέσα και επικοινωνία C2G, B2G, G2G Γενική Δ/νση Εσωτερικής Λειτουργίας.
Στοιχεία Διοίκησης Επιχειρήσεων
ΚΕΦΑΛΑΙΟ 3 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΤΩΝ Γ.Σ.Π.. ΟΡΙΣΜΟΙ Ένα σύστημα για τακτικό και συνηθισμένο τρόπο επεξεργασίας δεδομένων και για απάντηση προκαθορισμένων και.
Βαρόμετρο ΕΒΕΘ Μάρτιος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι του Νομού Θεσσαλονίκης”
Βάσεις Δεδομένων II Διαχείριση Δοσοληψιών Πάνος Βασιλειάδης Σεπτέμβρης 2002
ΚΕΦΑΛΑΙΟ 3 Περιγραφική Στατιστική
Προγραμματισμός ΙΙ Διάλεξη #6: Απλές Δομές Ελέγχου Δρ. Νικ. Λιόλιος.
Βαρόμετρο ΕΒΕΘ Μάρτιος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι του Νομού Θεσσαλονίκης”
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Τρίτο Συστήματα.
Δομές Δεδομένων 1 Στοίβα. Δομές Δεδομένων 2 Στοίβα (stack)  Δομή τύπου LIFO: Last In - First Out (τελευταία εισαγωγή – πρώτη εξαγωγή)  Περιορισμένος.
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ
Ο ΗΛΕΚΤΡΟΝΙΚΟΣ ΥΠΟΛΟΓΙΣΤΗΣ
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
1 Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Πανεπιστήμιο Πατρών ΟΝΤΟΚΕΝΤΡΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΙΙ (C++) Κληρονομικότητα.
Ανάπτυξη Πρωτοτύπου Λογισμικού
Ημέρα 1η.
Εξόρυξη Δεδομένων: Ακ. Έτος Αποθήκες Δεδομένων1 Εισαγωγή στις Αποθήκες Δεδομένων Διαφάνειες βασισμένες σε σχετικές διαφάνειες του Πάνου Βασιλειάδη.
Προχωρημένα Θέματα Τεχνολογίας και Εφαρμογών Βάσεων Δεδομένων Διαχείριση Συναλλαγών Πάνος Βασιλειάδης Μάρτιος 2014
Βάσεις Δεδομένων Εργαστήριο ΙΙ Τμήμα Πληροφορικής ΑΠΘ
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεσιακό Μοντέλο.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεσιακό Μοντέλο.
Διαχείριση Ψηφιακών Πνευματικών Δικαιωμάτων Ηλεκτρονική Δημοσίευση Στέλλα Λάμπουρα Ιούνιος 2004.
Δομές Δεδομένων - Ισοζυγισμένα Δυαδικά Δένδρα (balanced binary trees)
1 Βάσεις Δεδομένων ΙI Επιμέλεια: ΘΟΔΩΡΗΣ ΜΑΝΑΒΗΣ SQL (3 από 3) T Manavis.
1 Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Πανεπιστήμιο Πατρών ΟΝΤΟΚΕΝΤΡΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΙΙ (C++) Τάξεις και Αφαίρεση Δεδομένων.
Εξόρυξη Δεδομένων: Ακ. Έτος Αποθήκες Δεδομένων1 Εισαγωγή στις Αποθήκες Δεδομένων Διαφάνειες βασισμένες σε σχετικές διαφάνειες του Πάνου Βασιλειάδη.
Βαρόμετρο ΕΒΕΘ Σεπτέμβριος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι του Νομού.
Ειδικά Θέματα Βάσεων Δεδομένων
Ταξινόμηση Πληροφοριακών Συστημάτων. Μοντέλο Μελέτης των ΠΣ Επιχειρηματικά Θέματα Τεχνολογικά Θέματα Κοινωνικά Θέματα Πληροφοριακά Συστήματα.
ΤΙΤΛΟΣ ΕΡΓΑΣΙΑΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ανδρέου Βασίλης.
Εισαγωγή στις βάσεις δεδομένων ISBN
Data Warehouse Refreshment via ETL tools
Το Σχεσιακό Μοντέλο Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Προχωρημένα Θέματα Τεχνολογίας και Εφαρμογών Βάσεων Δεδομένων
Ερωτήματα Επιλογής σε ACCESS
Το Σχεσιακό Μοντέλο Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Μεταγράφημα παρουσίασης:

Εισαγωγή στις Αποθήκες Δεδομένων Εισαγωγή στις Αποθήκες Δεδομένων

Εισαγωγή: OLTP Παραδοσιακή Διαχείριση Δεδομένων με ΣΔΒΔ Σύστημα Επεξεργασίας Δοσοληψιών: On-Line Transaction Processing (OLTP) Ένα πλήρες σύστημα που περιέχει εργαλεία για προγραμματισμό εφαρμογών, εκτέλεση και διαχείριση των δοσοληψιών Μια τέτοια εφαρμογή πρέπει να δουλεύει συνεχώς, να αντεπεξέρχεται αποτυχιών, εξελίσσεται συνεχώς, είναι συνήθως κατανεμημένη και περιλαμβάνει: Βάση Δεδομένων Δίκτυο Προγράμματα εφαρμογής Εξαιρετικά κρίσιμη για τη λειτουργία κάθε οργανισμού

Εισαγωγή: OLTP ... DB Κράτησε για τον κ. Χ την θέση 13Α για LA! Κράτησε για τον κ. Y την θέση 13Α για LA! ... DB Πόσοι ταξιδεύουν για LA ? 100

Εισαγωγή: OLTP OLTP – Τράπεζα Δάνεια Γκισέ DB Πιστωτικές κάρτες ΑΤΜ

Εισαγωγή: OLTP OLTP – Βασικά Χαρακτηριστικά Ελάχιστος χρόνος διαθέσιμος για την εκτέλεση μιας δοσοληψίας. Λιγότερες από 10 προσβάσεις δίσκου. Περιορισμένος αριθμός υπολογισμών. Κάτω όριο λειτουργικών απαιτήσεων: 100 on-line Transactions Per Second (TPS) σε μια ΒΔ της τάξης του 1 GB Άνω όριο λειτουργικών απαιτήσεων: 50000 TPS σε μια ΒΔ μεγαλύτερη του 1 ΤB.

Εισαγωγή: OLΑP Συστήματα Στήριξης Αποφάσεων – Decision Support Systems (DSS) Υποβοήθηση λήψης αποφάσεων με πληροφορίες και αναφορές On-Line Analytical Processing (OLAP) Ευέλικτη, υψηλής απόδοσης πρόσβαση και ανάλυση μεγάλου όγκου σύνθετων δεδομένων από διαφορετικές εφαρμογές Ειδικού τύπου ερωτήσεις Οπτικοποίηση/στατιστική ανάλυση/πολυδιάστατη ανάλυση Εξόρυξη Γνώσης (Knowledge Discovery/Data Mining) Εξεύρεση προτύπων σε τεράστιες βάσεις δεδομένων OLAP + Data Mining => On-line Analytical Mining

Παραδείγματα ερωτήσεων OLAP Εισαγωγή: OLΑP Παραδείγματα ερωτήσεων OLAP Ποιος ήταν ο όγκος πωλήσεων ανά περιοχή και κατηγορία προϊόντος την περασμένη χρονιά; Πόσο σχετίζονται οι αυξήσεις τιμών των υπολογιστών με τα κέρδη των πωλήσεων τα 10 τελευταία χρόνια; Ποια ήταν τα δέκα πρώτα καταστήματα σε πωλήσεις CD; Τι ποσοστό από τους πελάτες που αγοράζουν αναψυκτικά αγοράζουν και πατατάκια;

Λειτουργικά Χαρακτηριστικά Απαιτήσεων OLAP Εισαγωγή: OLΑP Λειτουργικά Χαρακτηριστικά Απαιτήσεων OLAP Πρόσβαση σε μεγάλο όγκο δεδομένων Συμμετοχή αθροιστικών και ιστορικών δεδομένων σε πολύπλοκες ερωτήσεις Μεταβολή της «οπτικής γωνίας» παρουσίασης των δεδομένων (π.χ., από πωλήσεις ανά περιοχή -> πωλήσεις ανά τμήμα κλπ.) Συμμετοχή πολύπλοκων υπολογισμών (π.χ. στατιστικές συναρτήσεις) Γρήγορη απάντηση σε οποιαδήποτε χρονική στιγμή τεθεί ένα ερώτημα ( “On-Line”). Πως θα το πετύχουμε;

Εισαγωγή Δύο κεντρικά θέματα Απόδοση Αν μια πολύπλοκη OLAP ερώτηση χρειαστεί να κλειδώσει ένα ολόκληρο πίνακα, τότε όλες οι OLTP δοσοληψίες την περιμένουν μέχρι να τελειώσει Εννοιολογική διαφορά και ετερογένεια Αν στην Oracle ΒΔ του marketing ο πελάτης είναι EMP(ΑΤ,Name,Surname…) και στην COBOL ΒΔ των πωλήσεων είναι ΑΦΜ,FullName,… η επερώτηση δεν είναι πάντα εύκολη...

Εισαγωγή: Αποθήκη Δεδομένων Αποθήκες Δεδομένων Μια κεντρικοποιημένη ΒΔ με σκοπό: την ολοκλήρωση (integration) ετερογενών πηγών πληροφοριών (data sources) => συνάθροιση όλης της ενδιαφέρουσας πληροφορίας σε μία τοποθεσία την αποφυγή της σύγκρουσης μεταξύ OLTP και OLAP (DSS) συστημάτων => απόδοση εφαρμογών και διαθεσιμότητα του συστήματος Μπορεί να συμπληρώνεται και από εξειδικευμένα θεματικά υποσύνολα (Data Marts) για περαιτέρω απόδοση των OLAP εφαρμογών

Εισαγωγή: Αποθήκη Δεδομένων Αποθήκες Δεδομένων Μια ΒΔ υποστήριξης αποφάσεων, που διατηρείται χωριστά από την ΒΔ παραγωγής (operational database) ενός οργανισμού. S. Chaudhuri, U. Dayal, VLDB’96 tutorial Μια συλλογή δεδομένων που χρησιμοποιείται κυρίως για την λήψη αποφάσεων σε ένα οργανισμό, και είναι θεματικά προσανατολισμένη, έχει ολοκληρωμένα (ενοποιημένα) δεδομένα, τα οποία διατηρούνται σε βάθος χρόνου χωρίς να διαγράφονται. W.H. Inmon, Building the Data Warehouse, 1992 (ο εφευρέτης του όρου)

Εισαγωγή: Αποθήκη Δεδομένων Γενική Αρχιτεκτονική DW Data Marts Πηγή Δεδομένων OLTP συστήματα OLAP εργαλεία

Εισαγωγή: Αποθήκη Δεδομένων Ιδιότητες OLAP Ιστορικά Δεδομένα Ο χρονικός ορίζοντας μια αποθήκης δεδομένων είναι πολύ μεγαλύτερος από ότι ενός συστήματος σε λειτουργία Η ΒΔ έχει τα τωρινά δεδομένα ενώ οι αποθήκες διατηρούν και παλιά δεδομένα (πχ τα προηγούμενα 5-10 χρόνια) Τροποποιήσεις Οι τροποποιήσεις στις πηγές δεδομένων δεν φαίνονται άμεσα στις αποθήκες δεδομένων, συνήθως περιοδικά Μόνο δύο βασικές λειτουργίες: αρχικό φόρτωμα των δεδομένων (loading) και προσπέλαση δεδομένων (access)

Εισαγωγή: Αποθήκη Δεδομένων OLTP vs OLAP OLTP OLAP Λειτουργίες Αυτοματισμός Χάραξη καθημερινών στρατηγικής εργασιών Τύπος Δεδομένων Λεπτομερή Αθροιστικά Όγκος Δεδομένων ~ 100 GB ~ 1 TB Φύση Δεδομένων Δυναμικά Στατικά, Ιστορικά

Εισαγωγή: Αποθήκη Δεδομένων OLTP vs OLAP OLTP OLAP I/O Τύποι Περιορισμένο I/O Εκτεταμένο I/Os Συχνά disk seeks disk scans Τροποποιήσεις Συνεχείς Περιοδικές Ενημερώσεις Φόρτος Δοσοληψίες με Ερωτήσεις που πρόσβαση λίγων σαρώνουν εγγραφών εκατομμύρια εγγραφών Σχεδίαση ΒΔ Κατευθυνόμενη Κατευθυνόμενη από Εφαρμογή από Περιεχόμενο

Εισαγωγή: Αποθήκη Δεδομένων OLTP vs OLAP OLTP OLAP Τυπικοί Χρήστες Χαμηλόβαθμοι Υπ. Υψηλόβαθμοι Υπ. Χρήση Μέσω Ad-hoc προκατασκευασμένων φορμών Αριθμός Χρηστών Χιλιάδες Δεκάδες Εστίαση Εισαγωγή Εξαγωγή Δεδομένων Πληροφοριών

Μοντέλο Πολυδιάστατων Δεδομένων (Κύβος) και Λειτουργίες που εκτελούνται σε αυτό

Εισαγωγή Μια αποθήκη δεδομένων βασίζεται σε ένα πολυδιάστατο μοντέλο δεδομένων (multidimensional data model) που αναπαριστά τα δεδομένα με τη μορφή ενός κύβου δεδομένων (data cube) Ένας κύβος δεδομένων (data cube) επιτρέπει την μοντελοποίηση και την θεώρηση των δεδομένων από πολλές οπτικές γωνίες – Διαστάσεις (dimensions)- Για συγκεκριμένες τιμές στις διαστάσεις μια Μέτρηση (Measure) αφορά αυτό που μας ενδιαφέρει να μετρήσουμε Παράδειγμα Κύβος ΠΩΛΗΣΕΙΣ Location Item Time Διαστάσεις Μέτρηση: Αριθμός Πωλήσεων για τις συγκεκριμένες διαστάσεις (Location, Item, Time)

Εννοιολογική Ιεραρχία Ιεραρχίες Διαστάσεων Κάθε διάσταση παίρνει τιμές από διαφορετικά επίπεδα, μπορεί να εκφραστεί σε διαφορετικά επίπεδα λεπτομέρειας Κύβος ΠΩΛΗΣΕΙΣ Location Διαστάσεις: Product, Region, Date Ιεραρχίες διαστάσεων: Industry Country Year Category Region Item Quarter Product City Month Week Time Μέτρηση: Αριθμός Πωλήσεων για τις συγκεκριμένες διαστάσεις (Location, Item, Time) Store Day

Εννοιολογική ιεραρχία (Concept Hierarchy) για Location Εννοιολογική Ιεραρχία Παράδειγμα: Εννοιολογική ιεραρχία (Concept Hierarchy) για Location all all Europe ... North_America region Germany ... Spain Canada ... Mexico country Vancouver ... city Frankfurt ... Toronto L. Chan ... M. Wind office Αντίστοιχες Τιμές Πεδίο Τιμών

Μοντέλο Δεδομένων (Σχήμα) Εννοιολογικό Μοντέλο Μοντέλο Δεδομένων (Σχήμα) Σε σχεσιακό μοντέλο Πίνακες Διαστάσεων Πίνακας με πληροφορία σχετικά με κάθε διάσταση Ιtem (item_name, brand, type), Τime(day, week, month, quarter, year) Πίνακας γεγονότων (Fact Table) έχει ως γνωρίσματα: τις μετρήσεις (πχ αριθμός πωλήσεων, τιμή σε δολάρια, κλπ) + το πρωτεύον κλειδί κάθε σχετικού πίνακα διαστάσεων Σχήμα Αστέρι (Star schema) Πίνακας γεγονότων στο κέντρο που συνδέεται με ένα σύνολο από πίνακες διαστάσεων

Εννοιολογικό Μοντέλο item branch Παράδειγμα Σχήματος Αστεριού time time_key day day_of_the_week month quarter year time item_key item_name brand type supplier_type item Πίνακας Γεγονότων ΠΩΛΗΣΕΙΣ time_key item_key branch_key branch_key branch_name branch_type branch location_key street city state_or_province country location location_key units_sold dollars_sold avg_sales Μετρήσεις 4 διαστάσεις (time, item, location, branch)

Εννοιολογικό Μοντέλο Σχήμα Χιονονιφάδας (Snowflake schema) Μια βελτίωση του σχήματος αστέρι όπου η ιεραρχία διαστάσεων κανονικοποιείται σε ένα σύνολο από μικρότερους πίνακες διαστάσεων

Εννοιολογικό Μοντέλο item supplier branch Παράδειγμα Σχήματος Νιφάδας time_key day day_of_the_week month quarter year time item supplier Πίνακας Γεγονότων ΠΩΛΗΣΕΙΣ item_key item_name brand type supplier_key supplier_key supplier_type time_key item_key branch_key location_key street city_key location branch location_key branch_key branch_name branch_type units_sold dollars_sold city_key city state_or_province country avg_sales Μετρήσεις

Αστερισμό Γεγονότων ή Σχήμα Γαλαξία (galaxy schema) Εννοιολογικό Μοντέλο Αστερισμοί Γεγονότων (Fact constellations) Πολλαπλοί Πίνακες Γεγονότων που μοιράζονται τους Πίνακες Διαστάσεων, μπορούμε να τους δούμε ως συλλογή από αστέρια και άρα ως Αστερισμό Γεγονότων ή Σχήμα Γαλαξία (galaxy schema)

Εννοιολογικό Μοντέλο Παράδειγμα Σχήματος Νιφάδας item time time_key Πίνακας Γεγονότων ΑΠΟΣΤΟΛΗ time_key day day_of_the_week month quarter year time item_key item_name brand type supplier_type item Πίνακας Γεγονότων ΠΩΛΗΣΕΙΣ time_key item_key time_key shipper_key item_key from_location branch_key branch_key branch_name branch_type branch location_key to_location location_key street city province_or_state country location dollars_cost units_sold units_shipped dollars_sold shipper_key shipper_name location_key shipper_type shipper avg_sales Μετρήσεις

Κύβος Δεδομένων Ορολογία Συχνά ο n-D κύβος λέγεται βασικός κυβοειδής (base cuboid). Περιέχει τον μεγαλύτερο βαθμός λεπτομέρειας. π.χ. Για κύβο με τέσσερεις διαστάσεις (Item, Time, Branch, Location) έχουμε 4-D βασικό κυβοειδή O 0-D cuboid περιέχει τη μεγαλύτερο επίπεδο περίληψης, apex cuboid. Το πλέγμα των όλων των κυβοειδών ονομάζεται κύβος δεδομένων.

Κύβος Δεδομένων Πλέγμα Κυβοειδών – Κύβος δεδομένων all 0-D(apex) cuboid time item location supplier 1-D cuboids time, item time , location item, location location, supplier 2-D cuboids time, supplier item, supplier time, location, supplier 3-D cuboids time, item, location time, item, supplier item, location, supplier 4-D (base) cuboid time, item, location, supplier

Μετρήσεις - Συναθροίσεις Εκτός από τις λεπτομερείς πληροφορίες των fact tables, μπορεί να υπολογίσουμε και συναθροίσεις των δεδομένων για καλύτερους χρόνους απόκρισης. Για παράδειγμα, αν ο fact table είναι SALES(GeographyCode, ProductCode, TimeCode, AccountCode, Amount, Unit) μπορούμε να υπολογίσουμε AVG(Sales) ανά Region, Product, Quarter MAX(Sales) ανά Brand, Month, με Region = Europe SUM(Sales) ανά City

All, All, All Βασικές Πράξεις Date Product Country Παράδειγμα Total annual sales of TV in U.S.A. Date 1Qtr 2Qtr 3Qtr 4Qtr sum TV Product PC U.S.A VCR sum Canada Country Mexico sum All, All, All

Συναθροίσεις Δεδομένων Επέκταση του υπάρχοντος βασικού πίνακα: Ενσωμάτωση των αθροιστικών εγγραφών στον βασικό (base/basic) fact table + μια επιπλέον στήλη που να εξηγεί το επίπεδο συνάθροισης Χωριστός πίνακας/όψη αθροισμάτων Sales table sum Extended Sales table City-dimension sum table

Βασικές Αλγεβρικές Πράξεις Συναθροιστική Άνοδος (Roll up): συνάθροιση της πληροφορίας = μετάβαση από χαμηλότερο σε υψηλότερο επίπεδο ιεραρχίας (π.χ. από day σε month) Αναλυτική Κάθοδος (Drill down): το αντίστροφο του Roll up (π.χ month σε day) Οριζόντιος Τεμαχισμός (Slice): (σχεσιακή) επιλογή Κάθετος Τεμαχισμός (Dice): (σχεσιακή) προβολή Περιστροφή (Pivot): αναδιάταξη της 2D προβολής του πολυδιάστατου κύβου στην οθόνη

Βασικές Αλγεβρικές Πράξεις Roll-up Η συναθροιστική άνοδος περιλαμβάνει τον υπολογισμό μίας συνολικής τιμής για μία θέση στην ιεραρχία μίας διάστασης δεδομένων. Για παράδειγμα, με ένα roll-up, οι πωλήσεις σε επίπεδο τοπικών μαγαζιών (Store) παράγουν τις συνολικές πωλήσεις σε επίπεδο πόλης (City) και αυτές με τη σειρά τους με ένα ακόμα roll-up παράγουν τις πωλήσεις σε επίπεδο περιοχής (Region). Industry Category Product Country Region City Store Year Quarter Month Week Day

Βασικές Αλγεβρικές Πράξεις Roll-up (Παράδειγμα) Industry Category Product Country Region City Store Year Quarter Month Week Day Sales volume Electronics Toys Clothing Cosmetics Q1 $5,2 $1,9 $2,3 $1,1 Q2 $8,9 $0,75 $4,6 $1,5 Products Store1 Store2 $5,6 $1,4 $2,6 $1,1 $7,2 $0,4 $4,6 $0,5 Sales volume Electronics Toys Clothing Cosmetics Year 1996 $14,1 $2,65 $6,9 $2,6 Products Store1 Store2 $12,8 $1,8 $7,2 $1,6 Χρόνος: Επίπεδο Quarter Χρόνος: Επίπεδο Year SUM(Sales volumes)

Βασικές Αλγεβρικές Πράξεις Drill-Down Ο χρήστης περνά από ένα ανώτερο επίπεδο μίας διάστασης που έχει συγκεντρωτικά δεδομένα σε ένα χαμηλότερο επίπεδο με πιο λεπτομερή δεδομένα. Πρόκειται για την αντίστροφη πράξη του roll-up. Για παράδειγμα, κατά το drill down, ξεκινάμε από τις πωλήσεις ανά περιοχή (Region) και παίρνουμε τις αναλυτικές πωλήσεις ανά πόλη (City) και μετά τις πωλήσεις ανά κατάστημα (Store). Industry Category Product Country Region City Store Year Quarter Month Week Day

Drill-down (Παράδειγμα) Βασικές Αλγεβρικές Πράξεις Drill-down (Παράδειγμα) Industry Category Product Country Region City Store Year Quarter Month Week Day Sales volume Electronics Toys Clothing Cosmetics Q1 $5,2 $1,9 $2,3 $1,1 Q2 $8,9 $0,75 $4,6 $1,5 Products Store1 Store2 $5,6 $1,4 $2,6 $1,1 $7,2 $0,4 $4,6 $0,5 Sales volume VCR Camcorder TV CD player Q1 $1,4 $0,6 $2,0 $1,2 Q2 $2,4 $3,3 $2,2 $1,0 Electronics Store1 Store2 $1,4 $0,6 $2,4 $1,2 $2,4 $1,3 $2,5 $1,0 Item: Επίπεδο Industry Item: Επίπεδο Category

Βασικές Αλγεβρικές Πράξεις Περιστροφή (Pivot) Εναλλαγή των γραμμών και των στηλών του κύβου, όπως αυτός παρουσιάζεται στην οθόνη Δεν απαιτείται κανένας νέος υπολογισμός στη ΒΔ

Βασικές Αλγεβρικές Πράξεις Pivot (Παράδειγμα) Sales volume Electronics Toys Clothing Cosmetics Q1 $5,2 $1,9 $2,3 $1,1 Q2 $8,9 $0,75 $4,6 $1,5 Products Store1 Store2 $5,6 $1,4 $2,6 $1,1 $7,2 $0,4 $4,6 $0,5 Sales volume Electronics Toys Clothing Cosmetics Store 1 $5,2 $1,9 $2,3 $1,1 Store 2 $5,6 $1,4 $2,6 $1,1 Products Q1 Q2 $8,9 $0,75 $4,6 $1,5 $7,2 $0,4 $4,6 $0,5 Εναλλαγή γραμμών και στηλών

Οριζόντιος (slice) και Κάθετος (dice) Τεμαχισμός Βασικές Αλγεβρικές Πράξεις Οριζόντιος (slice) και Κάθετος (dice) Τεμαχισμός Slice : Επιλογή συγκεκριμένων τιμών σε κάποια διάσταση (select) Π.χ., διώξε το Store 2 από τα καταστήματα και τις βιομηχανίες Clothing και Cosmetics Dicing : Σβήσιμο μιας ολόκληρης διάστασης (project) Π.χ., από ένα κύβο πωλήσεων ανά προϊόν, ημερομηνία και περιοχή, να δειχθεί ο μέσος όρος πωλήσεων ανά προϊόν και ημερομηνία.

Slice&Dice (Παράδειγμα) Βασικές Αλγεβρικές Πράξεις Slice&Dice (Παράδειγμα) Sales volume Electronics Toys Clothing Cosmetics Q1 $5,2 $1,9 $2,3 $1,1 Q2 $8,9 $0,75 $4,6 $1,5 Products Store1 Store2 $5,6 $1,4 $2,6 $1,1 $7,2 $0,4 $4,6 $0,5 Sales volume Products Store1 Electronics Toys $5,2 $1,9 Q1 Electronics Toys $8,9 $0,75 Q2 Διώξε το Store 2 και τις βιομηχανίες Clothing & Cosmetics

Fig. 3.10 Typical OLAP Operations