δφσδφ ΦΥΣΙΚΟ ΕΠΙΠΕΔΟ ΑΠΟΘΗΚΩΝ ΔΕΔΟΜΕΝΩΝ: ΜΕΡΟΣ Α’ 4/6/2017

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Αλγόριθμοι σχεδίασης βασικών 2D σχημάτων (ευθεία)
Advertisements

Συνδυαστικα κυκλωματα με MSI και LSI
Ερωτηματολόγιο Συλλογής Απαιτήσεων Εφαρμογών Υψηλών Επιδόσεων
5 Οργάνωση υπολογιστών Εισαγωγή στην Επιστήμη των Υπολογιστών ã Εκδόσεις Κλειδάριθμος.
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Αλέξανδρος Σαχινίδης, ΜΒΑ, Ph.D. ΙΟΥΝΙΟΣ 2009
Η Μετρηση της Παραγωγικοτητασ των Εργαζομενων στα Logistics
Το υλικό του Υπολογιστή
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Πρώτο Αρχιτεκτονική.
Χρήση και αξιοποίηση των ΤΠΕ κατά τη διδασκαλία των μαθηματικών στη δευτεροβάθμια ελληνική εκπαίδευση Δρ. Σάλτας Βασίλειος, Ιωαννίδου Ευφροσύνη Τμήμα.
Εισαγωγή στους Η/Υ Πίνακες.
Πινακες (Arrays) Σημασια Συνταξη Αρχικοποιηση Προσβαση Παραμετροι
Ημερομηνία: 13/12/2006 Τμήμα: Πληροφορικής του Ιονίου Πανεπιστημίου
Προγραμματισμός Ι Πίνακες •Ο πίνακας είναι μία συλλογή μεταβλητών ίδιου τύπου, οι οποίες είναι αποθηκευμένες σε διαδοχικές θέσεις μνήμης. Χρησιμοποιείται.
Κεφάλαιο 6 Υλοποίηση Γλωσσών Προγραμματισμού
Πρόγραμμα Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ. Ε
Α. Νανόπουλος & Γ. Μανωλόπουλος Εισαγωγή στην Εξόρυξη & τις Αποθήκες Δεδομένων Κεφάλαιο 3: Αποθήκες Δεδομένων και OLAP
24/11/2003Message Passing Interface (MPI)1 Αθήνα, Νοέμβριος 2003 Συστήματα Παράλληλης Επεξεργασίας Εργαστήριο Υπολογιστικών Συστημάτων.
Retail vs e-tail Σπύρος Λούρος Marketing Director Multirama.
Καλή και δημιουργική χρονιά.
Δρ. Παναγιώτης Συμεωνίδης
© Copyrights. Grow’n Up Ltd
Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας.
Βάσεις Δεδομένων (ΚΒΔ)
ΑΠΟΘΗΚΕΣ ΔΕΔΟΜΕΝΩΝ (Data Warehouses)
Page  1 Ο.Παλιάτσου Γαλλική Επανάσταση 1 ο Γυμνάσιο Φιλιππιάδας.
ΝΕΟ ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ Α’, Β’, & Γ’ ΓΥΜΝΑΣΙΟΥ ΟΜΑΔΑ ΕΡΓΑΣΙΑΣ Ανδρέας Σ. Ανδρέου (Αναπλ. Καθηγητής ΤΕΠΑΚ - Συντονιστής) Μάριος Μιλτιάδου, Μιχάλης Τορτούρης.
1 Γυναίκες και επιστήμη: μια πρώτη διερεύνηση Λάουρα Αλιπράντη Κύρια Ερευνήτρια, Εθνικό Κέντρο Κοινωνικών Ερευνών.
Κώστας Διαμαντάρας Τμήμα Πληροφορικής ΤΕΙ Θεσσαλονίκης 2011 Συστολικοί επεξεργαστές.
-17 Προσδοκίες οικονομικής ανάπτυξης στην Ευρώπη Σεπτέμβριος 2013 Δείκτης > +20 Δείκτης 0 a +20 Δείκτης 0 a -20 Δείκτης < -20 Σύνολο στην Ευρωπαϊκή Ένωση:
Οι χημικοί δεσμοί και οι δομές Lewis
1 Θεματική Ενότητα Γραφήματα & Επίπεδα Γραφήματα.
Αποκεντρωμένη Διοίκηση Μακεδονίας Θράκης ∆ιαχείριση έργων επίβλεψης µε σύγχρονα µέσα και επικοινωνία C2G, B2G, G2G Γενική Δ/νση Εσωτερικής Λειτουργίας.
Νεοχώρι, Τ.Κ , Πήλιο, Μαγνησία
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας: Διοίκηση & Οργάνωση Βιβλιοθηκών.
Χρονοδρομολόγηση CPU Βασικές Αρχές Κριτήρια Χρονοδρομολόγησης
Προγραμματισμός ΙΙ Διάλεξη #6: Απλές Δομές Ελέγχου Δρ. Νικ. Λιόλιος.
A Balanced Tree Structure for Peer-to-Peer Networks
Travel Salesman. ABDCA, ABCDA, ACBDA, ACDBA, ADBCA, ADCBA … (3!) 3 σταθμοί και 1 βάση (3! διαδρομές) 4 σταθμοί και 1 βάση (4! = 24) 5 σταθμοί και 1 βάση.
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Τρίτο Συστήματα.
Προχωρημένα Θέματα Τεχνολογίας και Εφαρμογών Βάσεων Δεδομένων Επεξεργασία και βελτιστοποίηση ερωτήσεων Πάνος Βασιλειάδης Σεπτέμβρης 2005.
1 Ενότητα 5.3.1: Ερωτηματολόγια με τη χρήση του Διαδικτύου Διδάσκων: Χρήστος Κατσάνος - Πανεπιστημιακό κέντρο εκπαίδευσης επιμορφωτών.
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
Προγραμματισμός ΙΙ Διάλεξη #5: Εντολές Ανάθεσης Εντολές Συνθήκης Δρ. Νικ. Λιόλιος.
1 Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Πανεπιστήμιο Πατρών ΟΝΤΟΚΕΝΤΡΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΙΙ (C++) Κληρονομικότητα.
ANAKOINWSH H 2η Ενδιάμεση Εξέταση μεταφέρεται στις αντί για , την 24 Νοεμβρίου στις αίθουσες ΧΩΔ και 110 λόγω μη-διαθεσιμότητας.
Ανάπτυξη Πρωτοτύπου Λογισμικού
Συνολική Ζήτηση Εθνικό Εισόδημα Εθνικό Προϊόν Εθνική Δαπάνη
Ουρά Προτεραιότητας: Heap
Βάσεις Δεδομένων Ι Ενότητα 7: H γλώσσα SQL Γεωργία Γκαράνη Επίκουρος Καθηγήτρια Τμήμα Μηχανικών Πληροφορικής Τ.Ε. T.E.I. Θεσσαλίας.
Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης
Τα προϊόντα της EmGoldEx Τα προϊόντα της EmGoldEx Ράβδοι χρυσού 24k καθαρότητας 999,9 απο 1 έως 100 γραμμάρια Όλες οι ράβδοι χρυσού είναι πιστοποιημένες.
Το Εκτεταμένο Μοντέλο Οντοτήτων - Συσχετίσεων
1 Αδάμ Δαμιανάκης Conceptum A.E. Tουριστικές και Πολιτιστικές Πληροφορίες στο Διαδίκτυο. Η περίπτωση του.
ΜΑΘΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗ ΜΕΤΑΓΓΙΣΗ ΑΙΜΑΤΟΣ - ΑΙΜΟΔΟΣΙΑ
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεδιασμός Σχεσιακών Σχημάτων.
Βάσεις Δεδομένων Εργαστήριο ΙΙ Τμήμα Πληροφορικής ΑΠΘ
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεσιακό Μοντέλο.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεσιακό Μοντέλο.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Μετατροπή Σχήματος Ο/Σ σε Σχεσιακό.
Δομές Δεδομένων - Ισοζυγισμένα Δυαδικά Δένδρα (balanced binary trees)
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Τρίτο Συστήματα.
1 Μελέτη κανόνων συμμετοχής σε ομότιμα δίκτυα επικοινωνίας μέσω προσομοίωσης Φοιτητής : Χρήστος Ι. Καρατζάς Επιβλέποντες Καθηγητές : Γ. Πολύζος – Κ. Κουρκουμπέτης.
1 Βάσεις Δεδομένων ΙI Επιμέλεια: ΘΟΔΩΡΗΣ ΜΑΝΑΒΗΣ SQL (3 από 3) T Manavis.
1 Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Πανεπιστήμιο Πατρών ΟΝΤΟΚΕΝΤΡΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΙΙ (C++) Τάξεις και Αφαίρεση Δεδομένων.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Μετατροπή Σχήματος Ο/Σ σε Σχεσιακό.
Αγγελική Γεωργιάδου- Αναστασία Πεκτέσογλου Δράμα 2006
Περιγραφή Ενότητας Σκοπός του μαθήματος είναι η παρουσίαση δηλώσεων SQL που περιλαμβάνουν EXIST, ANY, ALL. Χ. Σκουρλάς.
Μεταγράφημα παρουσίασης:

δφσδφ ΦΥΣΙΚΟ ΕΠΙΠΕΔΟ ΑΠΟΘΗΚΩΝ ΔΕΔΟΜΕΝΩΝ: ΜΕΡΟΣ Α’ 4/6/2017 Δρ. Παναγιώτης Συμεωνίδης Εργ. Τεχνολογίας και Επεξεργασίας Δεδομένων Τμήμα Πληροφορικής Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών Αριστοτέλειο Πανεπιστήμιο Θεσ/νικης http://delab.csd.auth.gr/~symeon Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Αρχιτεκτονικές υλοποίησης αποθηκών δεδομένων 3 διαφορετικοί τύποι συστημάτων OLAP: Συστήματα ROLAP (Relational OLAP) Συστήματα MOLAP (Multidimensional OLAP) Συστήματα HOLAP (Hybrid OLAP)

Συστήματα ROLAP (Relational OLAP) Χρήση Σχεσιακής Βάσης Δεδομένων για την αποθήκευση και διαχείριση του κύβου. Ένας πίνακας γεγονότων & ξεχωριστοί πίνακες για διαστάσεις. Μη απαραίτητη η δημιουργία κύβου. Πολύ καλή κλιμάκωση (Μεγάλος όγκος δεδομένων) Ενδεχομένως μειωμένη ταχύτητα απόκρισης (slow on line response).

Παράδειγμα σχεσιακού πίνακα γεγονότος

Συστήματα MOLAP (Multidimensional OLAP) Ο πίνακας γεγονότων αποθηκεύεται σε αραιούς πολυδιάστατους πίνακες. Απαιτείται συμπίεση των πινάκων. 3. Άμεση πρόσβαση στα κελιά (μη ύπαρξη κλειδιών). 4. Mεγάλος χρόνος δημιουργίας κύβου (slow off-line part). 5. Πολύ γρήγορη εκτέλεση πράξεων (fast on-line response).

Παράδειγμα πίνακα Συστήματος MOLAP Μετρική κύβου : Τεμάχια 8 2 5 3 Ημερομηνίες Υποκαταστήματα Προϊόντα

Συστήματα HOLAP (Hybrid OLAP) Παρουσιάζει μεγαλύτερη ευελιξία. Σε χαμηλό επίπεδο χρησιμοποιεί σχεσιακούς πίνακες. Σε υψηλότερο επίπεδο χρησιμοποιεί απλούς πολυδιάστατους πίνακες. Συνδυασμός γρήγορης εκτέλεσης και κλιμάκωσης.

Κύβος Πωλήσεων Βιβλιοπωλείου Μετρική (measure) Τεμάχια Δεν υπάρχουν Ιεραρχίες στις διαστάσεις

Πλέγμα Κυβοειδών Κύβου Πωλήσεων Βιβλιοπωλείου Αν k διαστάσεις και ΔΕΝ ΥΠΑΡΧΟΥΝ ΙΕΡΑΡΧΙΕΣ, τότε υπάρχουν συνολικά 2k κυβοειδή. Στο παράδειγμα του βιβλιοπωλείου έχουμε 3 διαστάσεις. Άρα 23 = 8 κυβοειδή.

Δημιουργία των κυβοειδών με SQL Με k διαστάσεις έχουμε 2k ερωτήματα SQL.

Δημιουργία Κυβοειδών με τον τελεστή CUBE. Για την αποφυγή πολλών παρόμοιων ερωτημάτων SQL καθιερώθηκε ο τελεστής CUBE. SELECT Κωδ_Ημερομηνίας, Κωδ_Προϊόντος, Κωδ_Υποκαταστήματος, sum (Τεμάχια) FROM Κύβο Πωλήσεων CUBE BY Κωδ_Ημερομηνίας, Κωδ_Προϊόντος, Κωδ_Υποκαταστήματος

Αριθμός Κυβοειδών για διαστάσεις με ιεραρχίες Πολλοί πίνακες διαστάσεων έχουν ιεραρχίες: π.χ. Ιεραρχίες Διαστάσεων Βιβλιοπωλείου Για ένα κύβο με n διαστάσεις ο συνολικός αριθμός των κυβοειδών είναι: όπου Li είναι ο αριθμός των επιπέδων ιεραρχία της διάστασης i. *Για το βιβλιοπωλείο δημιουργούνται 4*5*6 = 120 κυβοειδή

Κύβος Πωλήσεων Βιβλιοπωλείου Σύνολο πωλήσεων χαρτιού στη χώρα Σύνολο πωλήσεων χρονιάς για όλα τα προϊόντα σε όλη τη χώρα

Υλοποίηση Κυβοειδών (3 επιλογές) Υλοποίηση όλων των κυβοειδών Καλύτερος χρόνος απόκρισης. Μη ρεαλιστική λύση για μεγάλους κύβους λόγω των πολύ υψηλού κόστους χώρου, δημιουργίας κύβου, συντήρησης. Καθόλου υλοποίηση των κυβοειδών Για κάθε ερώτημα, προσπέλαση στα βασικά (raw) δεδομένα για τον υπολογισμό κάθε κυβοειδούς (cuboid). Χαμηλός χρόνος απόκρισης Δίνει μεγάλη σημασία στο σύστημα που βασίζεται (RDBMS σε ROLAP) Υλοποίηση μέρους του κυβοειδών Οι τιμές πολλών κελιών είναι υπολογίσιμες από άλλα κελιά του κύβου (dependent cells). Ο αριθμός των υλοποιημένων κελιών εξαρτάται από τους περιορισμούς χώρου.

Γιατί επιλέγουμε την υλοποίηση μέρους των κυβοειδών? Το Χωρικό Κόστος αντανακλά το κόστος κατασκευής του κύβου και ενημέρωσης του. (offline part) Χρονικό Κόστος Το Χρονικό Κόστος αντανακλά την ταχύτητα εκτέλεσης ερωτημάτων στο κύβο. (online part) Χωρικό Αριθμός Υλοποιημένων κυβοειδών

Σχεδιαστικά Ερωτήματα για την υλοποίηση κυβοειδών Πόσα κυβοειδή πρέπει να υλοποιηθούν προκειμένου να έχουμε ανεκτή χρονική απόκριση στην υποβολή ερωτημάτων στον κύβο; Δεδομένου του χώρου που διαθέτουμε για την κατασκευή ενός κύβου, ποια κυβοειδή πρέπει να υλοποιηθούν ώστε να ελαχιστοποιηθεί το μέσο χρονικό κόστος ερωτημάτων; Αν δεχτούμε ένα ποσοστό X% υποβάθμισης του μέσου χρονικού κόστους ερωτημάτων, πόσο χώρο μπορούμε να γλιτώσουμε; Σύγκριση με την περίπτωση ολικής υλοποίησης

Επιλογή κυβοειδών προς υλοποίηση Στόχος Επιλογή κατάλληλων κυβοειδών βάσει (1) κάποιου κριτηρίου, (2) ενός περιορισμού βάσει του μέγιστου διαθέσιμου μεγέθους αποθηκευτικού χώρου. Για λόγους απλούστευσης ως περιορισμό χώρου ορίζουμε το μέγιστο πλήθος κυβοειδών που μπορούν να υλοποιηθούν σε δεδομένο αποθηκευτικό χώρο.

Motivating Example Parts (p) are bought from suppliers (s) and then sold to customers (c) at a sale price (sales in $). Schema: part, supplier, customer i.e., p, s, c CREATE VIEW as psc { SELECT p, s, c, sum(sales) FROM Cube_sales GROUP BY p, s, c

Parts are bought from suppliers and then sold to customers at a sale price SP Table T part supplier customer SP p1 s1 c1 4$ p3 c2 3$ p2 s3 7$ …

Table T part supplier customer SP p1 s1 c1 4$ p3 c2 3$ p2 s3 7$ … Parts are bought from suppliers and then sold to customers at a sale price SP c1 c2 c3 c4 Data cube customer 3$ s1 s2 s3 s4 4$ supplier p1 p2 p3 p4 p5 part

select part, customer, SUM(SP) from table T group by part, customer supplier customer SP p1 s1 c1 4 p3 c2 3 p2 s3 7 … Parts are bought from suppliers and then sold to customers at a sale price SP e.g., select part, customer, SUM(SP) from table T group by part, customer e.g., select customer, SUM(SP) from table T group by customer part customer SUM(SP) p1 c1 4 p3 c2 3 p2 7 customer SUM(SP) c1 11 c2 3 Group by customer (c) has 2 rows Less storage requirements Group by part customer (pc) has 3 rows More storage requirements

Suppose we materialize all views. psc 6MB pc 4MB ps 0.8MB sc 2MB p 0.2MB s 0.01MB c 0.1MB (total space cost 13.11Mb + total time cost 0 MB =13.11 MB).

Suppose we materialize the view “psc” space Cost for accessing ps = 6MB (not 0.8MB) Cost for accessing pc = 6MB (not 4MB) psc 6MB pc 4MB ps 0.8MB sc 2MB p 0.2MB s 0.01MB c 0.1MB Cost for accessing sc = 6MB (not 2MB) Cost for accessing p = 6MB (not 0.2MB) Cost for accessing s = 6MB (not 0.01MB) Cost for accessing c = 6MB (not 0.1MB) (total space cost 6MB + total time cost 36 MB = 42 MB).

(space cost 6.8MB + total time cost 19.6 MB = 26.4 MB). Suppose we materialize both the view “psc” and the view for “ps”. Cost for accessing ps = 0.8MB (not 6MB previously) Cost for accessing pc = 6MB (still 6MB) psc 6MB pc 4MB ps 0.8MB sc 2MB p 0.2MB s 0.01MB c 0.1MB Cost for accessing p = 0.8MB (not 6MB previously) Cost for accessing sc = 6MB (still 6MB) Cost for accessing s = 0.8MB (not 6MB previously) Cost for accessing c = 6MB (still 6MB) (space cost 6.8MB + total time cost 19.6 MB = 26.4 MB).

Comparing {view for “psc”, view for “ps”} with {view for “psc”} Gain({view for “psc”}, {view for “psc”, view for “ps”} = 5.2*3 = 15.6 MB Cost for accessing ps = 0.8MB (not 6MB previously) Cost for accessing pc = 6MB (still 6Mb) psc 6MB Gain = 5.2Mb Gain = 0 pc 4MB ps 0.8MB sc 2MB p 0.2MB s 0.01MB c 0.1MB Cost for accessing p = 0.8MB (not 6M previously) Gain = 5.2MB Cost for accessing sc = 6MB (still 6MB) Gain = 0 Cost for accessing s = 0.8MB (not 6M previously) Cost for accessing c = 6MB (still 6MB) Gain = 5.2MB Gain = 0 (Total Gain = 42MB -26.4MB = 15.6MB).