Ανακτηση Πληροφοριασ σε νεφη Υπολογιστων

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Indexing.
Advertisements

ΚΕΦΑΛΑΙΟ 6 ΕΙΣΟΔΟΣ: ΕΙΣΑΓΩΓΙΚΩΝ ΧΩΡΙΚΩΝ ΚΑΙ ΠΕΡΙΓΡΑΦΙΚΩΝ ΔΕΔΟΜΕΝΩΝ.
ΚΕΙΜΕΝΟ  Ο πρώτος τρόπος απεικόνισης πληροφορίας (και βασικός ως σήμερα).  Αδυναμία πρώτων υπολογιστών να χειριστούν άλλη μορφή πληροφορίας.  Πρόβλημα.
ΠΜΣ ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Κατεύθυνση ΤΕΔΑ Τεχνολογίες Διαχείρισης Ασφάλειας Security Management Engineering Τμήμα Πληροφορικής ΠΑΝΕΠΙΣΤΗΜΙΟ.
Κεφάλαιο 1ο: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΤΩΝ ΛΕΙΤΟΥΡΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
Συνάφεια Κρυφής Μνήμης σε Επεκτάσιμα Μηχανήματα. Συστήματα με Κοινή ή Κατανεμημένη Μνήμη  Σύστημα μοιραζόμενης μνήμης  Σύστημα κατανεμημένης μνήμης.
ΣΤΟΙΧΕΙΑ ΨΕΥΔΟΚΩΔΙΚΑ ΒΑΣΙΚΕΣ ΔΟΜΕΣ ΒΑΣΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΩΝ
Κεφάλαιο 6 Υλοποίηση Γλωσσών Προγραμματισμού
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Δυναμικός Κατακερματισμός.
ΜΑΘ-3122/106 Προγραμματισμός
 Αυδίκου Χριστίνα  Γιουμούκης Παναγιώτης  Κιντσάκης Θάνος  Πάπιστας Γιάννης.
Πανεπιστήμιο Ιωαννίνων Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής Ακαδημαϊκό Έτος MapReduce: Simplified Data processing on Large Clusters Φώτης.
Λειτουργικά Συστήματα ΙΙ
Λειτουργικά Συστήματα ΙΙ
Δένδρα Αναζήτησης Πολλαπλής Διακλάδωσης TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A Δένδρα στα οποία κάθε.
Εισαγωγικές Έννοιες Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
Επιλογή Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο.
Λειτουργικά συστήματα ΙΙ
Θέματα Βάσεων Δεδομένων Αποθήκευση XML δεδομένων σε Σχεσιακή Βάση Δεδομένων Θέματα Βάσεων Δεδομένων Αποθήκευση XML δεδομένων σε Σχεσιακή Βάση Δεδομένων.
Εργασία Η υλοποίηση του αλγορίθμου συγχώνευσης θα πρέπει να χρησιμοποιεί την ιδέα των ροών (streams). Θα πρέπει να υπάρχουν δύο διαφορετικά είδη.
Κατεύθυνση «Προηγμένες Τεχνολογίες Ανάπτυξης Λογισμικού»
ΗΥ 150 – ΠρογραμματισμόςΞενοφών Ζαμ π ούλης ΗΥ-150 Προγραμματισμός Αλγόριθμοι και Προγράμματα.
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ
ΘΠ06 - Μεταγλωττιστές Πίνακας Συμβόλων. Πίνακας Συμβόλων (Symbol Table) (Ι)  Είναι μια δομή στην οποία αποθηκεύονται τα ονόματα ενός προγράμματος και.
ΚΕΦΑΛΑΙΟ 3 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΤΩΝ Γ.Σ.Π.. ΟΡΙΣΜΟΙ Ένα σύστημα για τακτικό και συνηθισμένο τρόπο επεξεργασίας δεδομένων και για απάντηση προκαθορισμένων και.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων.
Η ΓΛΩΣΣΑ C ΜΑΘΗΜΑ 2.
ΕΥΡΕΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΕΚΤΟΠΩΝ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ
Συντάκτης :Δομουχτσής Στέργιος Κατασκευή Ιστοσελίδας Αυτόματο σύστημα Σχολικού Δικτύου Iware.
Ουρά Προτεραιότητας: Heap
Δομές Δεδομένων.
Η ΠΛΗΡΟΦΟΡΙΚΗ στην ΕΚΠΑΙΔΕΥΣΗ Αδάμ Κ. Αγγελής Παιδαγωγικό Ινστιτούτο.
Διδακτική της Πληροφορικής ΗΥ302 Εργασία :Παρουσίαση σχολικού βιβλίου Γ’ Λυκείου Τεχνολογικής Κατεύθυνσης «Ανάπτυξη εφαρμογών σε προγραμματιστικό περιβάλλον»
Μοντέλα - Αλγόριθμοι – Ταξινόμηση Advanced Data Indexing (Προηγμένη ευρετηρίαση δεδομένων)
Αναζήτηση – Δέντρα (2 ο Μέρος) Advanced Data Indexing (Προηγμένη ευρετηρίαση δεδομένων)
ΕΝΟΤΗΤΑ 2 – Κεφάλαιο 5: To λογισμικό του υπολογιστή
Προηγμένη Εφαρμογή Ιστού Διαχείρισης Δεδομένων Βιοεπιστημών Διπλωματική Εργασία του Γεωργίου Πρέκα ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ.
Λεξικό, Union – Find Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
Quicksort Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων.
ΕΠΛ 231 – Δομές Δεδομένων και Αλγόριθμοι 8-1 Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: 2-3 Δένδρα, Υλοποίηση και πράξεις Β-δένδρα B-Δένδρα.
ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ §3.7 ΤΑΞΙΝΟΜΗΣΗ
Ασυμπτωτικός Συμβολισμός
Δομές Δεδομένων 1 Θέματα Απόδοσης. Δομές Δεδομένων 2 Οργανώνοντας τα Δεδομένα  Η επιλογή της δομής δεδομένων και του αλγορίθμου επηρεάζουν το χρόνο εκτέλεσης.
1 Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Πανεπιστήμιο Πατρών ΟΝΤΟΚΕΝΤΡΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΙΙ (C++) Πίνακες.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Επεξεργασία Ερωτήσεων.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Επεξεργασία Ερωτήσεων.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Επεξεργασία Ερωτήσεων.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Επεξεργασία Ερωτήσεων.
Advanced Data Indexing (Προηγμένη ευρετηρίαση δεδομένων) Ροές Δεδομένων (3 ο Μέρος)
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
Γλώσσες Προγραμματισμού Μεταγλωττιστές Πίνακας Συμβόλων Πανεπιστήμιο Μακεδονίας Τμήμα Εφαρμοσμένης Πληροφορικής Ηλίας Σακελλαρίου.
Δομές δεδομένων και Αλγόριθμοι Κεφάλαιο 3. Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον Δεδομένα Δεδομένα (data) Δεδομένα (data) –αφαιρετική αναπαράσταση.
ΔΥΑΔΙΚΗ ΑΝΑΖΗΤΗΣΗ & ΤΑΞΙΝΟΜΗΣΗ ΜΕ ΣΥΓΧΩΝΕΥΣΗ. Δυαδική αναζήτηση (Binary search) ΔΕΔΟΜΕΝΟ: ένα μεγάλο αρχείο που περιέχει τιμές z [0,1,…,n-1] ταξινομημένες.
Ευρετήρια Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Δυναμικός Κατακερματισμός
Δεντρικά Ευρετήρια Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Java DataBase Connectivity
Διδάσκων: Δρ. Τσίντζα Παναγιώτα
Αρχεσ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ Η/Υ ΤΑξη Β΄
Αντικειμενοστραφής Προγραμματισμός ΙΙ
Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον ΑΕΠΠ
Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον ΑΕΠΠ
19η Διάλεξη Εξωτερική Αναζήτηση και Β-δέντρα Ε. Μαρκάκης
ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΤΕΧΝΙΚΕΣ ΓΙΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΔΟΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ
Εξωτερική Αναζήτηση Ιεραρχία Μνήμης Υπολογιστή Εξωτερική Μνήμη
Δυναμικός Κατακερματισμός
Μεταγράφημα παρουσίασης:

Ανακτηση Πληροφοριασ σε νεφη Υπολογιστων Πανεπιστήμιο Πατρών Τμήμα Μηχανικών Η/Υ & Πληροφορικής Διπλωματική Εργασία Ανακτηση Πληροφοριασ σε νεφη Υπολογιστων Ζώης Βασίλειος Α.Μ:4183

Περιεχόμενα Διπλωματικής Συστήματα Σε Νέφη Υπολογιστών Hadoop Distributed File System (HDFS ) Κατανεμημένη Βάση Δεδομένων(HBase) Μοντέλο Προγραμματισμού mapreduce Μελέτη Β, Β+ Δέντρων Κατασκευή Δέντρων στο ΗBase Ερωτήματα Εύρους σε B+ & B Δέντρα Πειράματα στην Κατασκευή Δέντρων Ανάλυση Αποτελεσμάτων Συμπεράσματα

Περιγραφή & Αρχιτεκτονική HDFS Υλοποίηση Ανοιχτού Κώδικα του GFS Κατανεμημένο Σύστημα Αρχείων της Google Google File System Κατανεμημένο Σύστημα Αρχείων Διαχείριση Μεγάλου Όγκου Δεδομένων Αυτόματος Εντοπισμός & Ανάκαμψη από Σφάλματα Ευκολία Επέκτασης Υλοποίηση σε Java Διαφορετικά Λειτουργικά Συστήματα Υπολογιστές με Διαφορετικό Hardware

Περιγραφή & Αρχιτεκτονική HBase Υλοποίηση Ανοιχτού Κώδικα του BigTable Ανήκει στην Κατηγορία NoSQL Συστημάτων Δεδομένα Οργανώνονται σε Πίνακες Πίνακες Χωρίζονται σε Οικογένειες Στηλών Κατηγορία Column Family Stores Παρόμοια Αρχιτεκτονική με το HDFS Λειτουργεί πάνω από το HDFS

Μοντέλο Προγραμματισμού mapreduce Προγραμματιστικό Μοντέλο Επεξεργασία Μεγάλου Συνόλου Δεδομένων Κατανεμημένος Υπολογισμός σε Συστοιχία Υπολογιστών Εμπνευσμένο από Functional Programming Map Function Reduce Function Λειτουργία Δεδομένα Δομημένα στην Μορφή (key,value) Επεξεργασία Δεδομένων Εισόδου Παράλληλα (Mapper) Επεξεργασία Ενδιάμεσων Αποτελεσμάτων (Reducer) Map(k1,v1) → List(k2,v2) Reduce(k2,list(v2)) → List(v3)

Κατασκευή Δέντρου ΒulkInsert Mapper Επεξεργασία Δεδομένων Αντιστοίχιση Στην Μορφή (key,value) Partitioner Ομαδοποίηση Δεδομένων Συνεχόμενες Τιμές Σε Κάθε Reducer Reducer Κατασκευή Δέντρου(BulkInsert) Διατήρηση Στην Μνήμη Cleanup Εγγραφή Του Δέντρου Στο Πίνακα του HBase

Εναλλακτική Υλοποίηση BulkLoading Καλύτερη Απόδοση Μικρότερες Απαιτήσεις σε Μνήμη. Ολοκλήρωση σε Λιγότερα Βήματα Ο(n/B). Απλοποιημένη Υλοποίηση Βήματα Εκτέλεσης Ταξινομημένα Κλειδιά στην Είσοδο του Reducer Διάσπαση σε φύλλα Αποθήκευση ορισμένων κλειδιών για το επόμενο επίπεδο. Επαναληπτική Διαδικασία μέχρι την κατασκευή της ρίζας.

Οργάνωση Δεδομένων στον Πίνακα Κόμβος Δέντρου = Γραμμή Πίνακα Ορισμός Οικογένειας Κόμβος (Node) Κλειδί Γραμμής Εσωτερικοί Κόμβοι – Τελευταίο Κλειδί Αντίστοιχου Κόμβου. Φύλλα – Προσθέτουμε Αναγνωριστικό (Λεξικογραφική Ταξινόμηση)

Ερωτήματα Εύρους σε Β+ Δέντρα Έλεγχος Εύρους Δέντρων Αναζήτηση Φύλλου Φύλλο που Περιέχει το Αριστερό Άκρο Φύλλο που Περιέχει το Δεξιό Άκρο Πίνακα HBase Εκτέλεση Scan Ορίσματα – Κλειδί Γραμμής Αριστερού & Δεξιού Φύλλου Πολυπλοκότητα Τ δέντρα , Ε κλειδιά σε κάθε δέντρο, Β τάξη του δέντρου Ο(2*(Τ + logB(E) )

Ερωτήματα Εύρους σε Β Δέντρα Αντίστοιχα με τα Β+ Δέντρα Αναζήτηση Δέντρων με Αντίστοιχο Εύρος Εύρεση Αρχικού & Τελικού Δέντρου Εκτέλεση Αναζήτησης Κατά Βάθος σε Κάθε Δέντρο Αναζήτηση κατά Βάθος Ανάκτηση Τιμών από Εσωτερικούς κόμβους Πολυπλοκότητα Πολυπλοκότητα αναζήτησης κατά βάθος Ο(|V| + |E|)*Τ

Πειράματα – Συστήματα & Εργαλεία Hadoop & HBase Hadoop version 1.0.1 HBase version 0.94.1 Λειτουργικό Σύστημα Debian Base 6.0.5 Μηχανήματα(4) – Okeanos 4 CPUs(Virtual) ανά μηχάνημα RAM 2048MB ανά μηχάνημα HDD 40 GB ανά μηχάνημα Δεδομένα tpc-H Χρήση του Πίνακα Orders (cust_id,order_id)

Πειράματα – Δεδομένα & Παρατηρήσεις Παρατηρήσεις Πειραμάτων Τάξη Δέντρου Χρόνος Εκτέλεσης Απαιτούμενος Αποθηκευτικός Χώρος Απαιτούμενο Μέγεθος Φυσικής Μνήμης Αριθμός Reducer

Πειράματα – Bulk Insert Σύγκριση Δέντρων Τάξης 5 & 101 Χρόνος Εκτέλεσης Rebalance Operation Απαιτούμενη Φυσική Μνήμη & Αποθηκευτικός Χώρος Απαραίτητες Πληροφορίες για την Διατήρηση της Δομής του Δέντρου. Συμπεράσματα O αλγόριθμος BulkInsert είναι μη αποδοτικός Υψηλές Απαιτήσεις σε Φυσική Μνήμη Αυξημένος Χρόνος Εκτέλεσης

Κατανομή Χρόνου Εκτέλεσης – Τάξη 5

Κατανομή Χρόνου Εκτέλεσης – Τάξη 101

Πειράματα – Bulk Loading Σύγκριση BulkLoading με BulkInsert Μικρότερος Χρόνος Εκτέλεσης Λιγότερες Απαιτήσεις σε Φυσική Μνήμη Μικρότερος Απαιτούμενος Αποθηκευτικός Χώρος Πειράματα με Αλλαγή του Buffer Buffer 128,512 Βελτίωση Χρόνου Εκτέλεσης Μικρή Αύξηση Απαιτήσεων Για Φυσική Μνήμη

Κατανομή Χρόνου Εκτέλεσης – Buffer 128

Κατανομή Χρόνου Εκτέλεσης – Buffer 512

Συμπεράσματα Σύγκριση Μεθόδων Κατασκευής Γιατί B+ & B δέντρα BulkInsert Ακριβής Επιλογή στην Τάξη του Δέντρου Αυξημένος Χρόνος Εκτέλεσης Υψηλές Απαιτήσεις σε Μνήμη BulkLoading Τάξη Δέντρου Εξαρτάται Πλήθος Δεδομένων Μειωμένος Χρόνος Εκτέλεσης Μειωμένες Απαιτήσεις σε Μνήμη Ευκολία στην Υλοποίηση Γιατί B+ & B δέντρα Τεχνική Prewarm

ΕΥΧΑΡΙΣΤΩ ΠΟΛΥ ΓΙΑ ΤΗΝ ΠΡΟΣΟΧΗ ΣΑΣ !!!