Προχωρημένα Θέματα Βάσεων Δεδομένων

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Τεχνολογίες Internet Υπηρεσίες & Εφαρμογές Τμήμα 1I-ΙΝΠ01 – Web Design / Development Κωνσταντίνος Σαπουντζής.
Advertisements

Επικοινωνιες-δικτυα-διαδικτυο-ιστοσελιδεσ
Δρ. Σάλτας Βασίλειος Τμήμα Διαχείρισης Πληροφοριών ΣΔΟ – ΤΕΙ Καβάλας
ΕΘΝΙΚΟ ΠΛΗΡΟΦΟΡΙΑΚΟ ΣΥΣΤΗΜΑ ΕΡΕΥΝΑΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ (ΕΠΣΕ+Τ) - Γ' ΦΑΣΗ ΑΠΟΘΕΤΗΡΙΑ ΚΑΙ ΕΠΙΣΤΗΜΟΝΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ ΠΕΡΙΟΔΙΚΑ ΑΝΟΙΚΤΗΣ ΠΡΟΣΒΑΣΗΣ Το έργο «Εθνικό.
Δομές Δεδομένων και Αλγόριθμοι
Ερωτηματολόγιο Συλλογής Απαιτήσεων Εφαρμογών Υψηλών Επιδόσεων
Ένα απαραίτητο στοιχείο στην ζωή μας. Εργασία Α’ εξαμήνου (Internet)  Τμήμα:1Ι-ΙΝΠ01  Έτος:  Ονοματεπώνυμο : Αντώνης Δημητριάδης  Μάθημα: Τεχν.
Προχωρημένα θέματα βάσεων δεδομένων
Δίκτυα υπολογιστών.
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Μετάβαση από BPOS σε Office 365 για υπάρχοντες πελάτες του BPOS
Jetspeed Open Source Εργαλείο για την Δημιουργία Information Portals Πανεπιστήμιο Αιγαίου Βιορρές Νίκος.
Εφαρμογές Υπολογιστών Ά Λυκείου Κεφ. 4 Λογισμικό Συστήματος
ΡΟΗ Υ: ΥΠΟΛΟΓΙΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ
Δεδομένα στα Σύνεφα Παναγιώτης Τριανταφύλλου Παν/μιο Πατρών.
 Παρουσιάζοντας πολιτισμικό υλικό στα σχολεία
Στόχοι Να εξηγήσουμε τι είναι τα δίκτυα υπολογιστών, ποιες είναι οι βασικές κατηγορίες τους και ποιες οι πιο συνηθισμένες τοπολογίες τους. Να περιγράψουμε.
Συμμετοχική ανάπτυξη – Helpdesk Κοσμίδης Δαμιανός Σύμβουλος ΤΠΕ Συνεργάτης Δήμου Θέρμης 21/11/2013Αξιοποίηση των ΤΠΕ στην ΤΑ1.
Το υλικό του Υπολογιστή
Κεφάλαιο 1ο: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΤΩΝ ΛΕΙΤΟΥΡΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
Ανακτηση Πληροφοριασ σε νεφη Υπολογιστων
Λειτουργικά Συστήματα ΙΙ
24/11/2003Message Passing Interface (MPI)1 Αθήνα, Νοέμβριος 2003 Συστήματα Παράλληλης Επεξεργασίας Εργαστήριο Υπολογιστικών Συστημάτων.
Εισαγωγή στην Επιστήμη των Υπολογιστών και Επικοινωνιών Εισαγωγή στο ηλεκτρονικό και κινητό επιχειρείν Σπύρος Κοκολάκης ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ.
Μονάδα Διασφάλισης Ποιότητας του ΤΕΙ Σερρών
Πανεπιστήμιο Ιωαννίνων Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής Ακαδημαϊκό Έτος MapReduce: Simplified Data processing on Large Clusters Φώτης.
Λειτουργικά Συστήματα ΙΙ
Βάσεις Δεδομένων (ΚΒΔ)
Page  1 Ο.Παλιάτσου Γαλλική Επανάσταση 1 ο Γυμνάσιο Φιλιππιάδας.
1/6/2011 Προσαρμοστικοί Αλγόριθμοι Εξισορρόπησης Φόρτου σε Κατανεμημένα Περιβάλλοντα (Δίκτυα Ομοτίμων και Υπολογιστικά Νέφη)
 Ιστορία  ACID  CAP Theorem  Eventual consistency και BASE  Enter NoSQL  Χαρακτηριστικά NoSQL βάσεων  NoSQL taxonomy  Ρολόγια Lamport 2.
Λειτουργικά συστήματα ΙΙ
Λειτουργικά συστήματα ΙΙ
Κατεύθυνση «Προηγμένες Τεχνολογίες Ανάπτυξης Λογισμικού»
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας: Διοίκηση & Οργάνωση Βιβλιοθηκών.
1 Content Addressable Network Λίλλης Κώστας Καλλιμάνης Νικόλαος Αγάθος Σπυρίδων – Δημήτριος Σταθοπούλου Ευγενία Γεωργούλας Κώστας.
Εισαγωγή στις Βασικές Έννοιες Πληροφορικής
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΘΕΜΑ «ΤΟ ΕΘΝΙΚΟ ΚΕΝΤΡΟ ΤΕΚΜΗΡΙΩΣΗΣ» ΚΑΝΤΑΡΕΛΗ ΑΙΚΑΤΕΡΙΝΗ.
Το cloud computing & τα νέα επιχειρηματικά μοντέλα 12o Συνέδριο Infocom World 2010 Αθήνα, 19 Οκτωβρίου 2010 Ειδική Γραμματεία Ψηφιακού Σχεδιασμού.
ΑΡΧΙΤΕΚΤΟΝΙΚΗ & ΟΡΓΑΝΩΣΗ ΥΠΟΛΟΓΙΣΤΩΝ Κεφάλαιο 1 Εισαγωγή
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Κέντρο Υποστήριξης Τεχνολογιών Πληροφορικής 1 Υπηρεσίες Κέντρου Υποστήριξης Τεχνολογιών Πληροφορικής ΚΥΤΠ (1) Η.
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών “ ΥΠΟΔΟΜΕΣ & ΥΠΗΡΕΣΙΕΣ ΝΕΕΣ ΤΑΣΕΙΣ ” Θεόδωρος Καρούνος,
Συστήματα Στήριξης Αποφάσεων
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
Ανάπτυξη Πρωτοτύπου Λογισμικού
Διαχείριση Ψηφιακών Πνευματικών Δικαιωμάτων Ηλεκτρονική Δημοσίευση Στέλλα Λάμπουρα Ιούνιος 2004.
Διοίκηση Πληροφοριακών Συστημάτων
ΕΡΕΥΝΑ ΚΕ.ΜΕ.ΤΕ. - Ο.Λ.Μ.Ε. (Απρίλης – Μάης 2008)
0.1 Διοίκηση Πληροφοριακών Συστημάτων Εισαγωγή Μαρία Καρύδα Γραφείο Β13, Κτήριο Λυμπέρη Ώρες Γραφείου: Δευτέρα 10-12, Πέμπτη
Οργάνωση Και Λειτουργία Κέντρων Πληροφορικής Επιμέλεια: Γιάννης Τρικαλίτης.
FOSS NTUA Server Installation Ubuntu Server LTS - Live InstallFest - by finrod (2010)
Κωνσταντίνος Αντωνής © 2011 Κατανεμημένα Συστήματα Υπολογισμός Σε Νέφος (Cloud Computing)
Cloud Computing Το cloud computing παρέχει υπηρεσίες υπολογισμού, λογισμικού, πρόσβασης σε δεδομένα και αποθήκευσης που δεν απαιτούν ο τελικός χρήστης.
Βάσεις Δεδομένων ΙΙ 9η διάλεξη
Εργασία για το μάθημα της Πληροφορικής. Θέμα: Εφαρμογές Νέφους
ΕΦΑΡΜΟΓΕΣ ΝΕΦΟΥΣ Cloud Computing.
Παρουσίαση Πτυχιακής Εργασίας
Βάσεις Δεδομένων Ι 10η διάλεξη
Εφαρμογές Της Διαδικτυακής Πλατφόρμας Google Drive
Κατηγορίες και Προδιαγραφές Λογισμικού Η/Υ (Software)
ΕΝΟΤΗΤΑ 4 – Ασφάλεια και συνεργασία στο Διαδίκτυο
ΕΦΑΡΜΟΓΕΣ ΝΕΦΟΥΣ 13.1 Εισαγωγή στις Εφαρμογές Νέφους
Επιβλέπων: Καθηγητής Εφαρμογών Δρ. Δημήτριος Βαρσάμης
Εφαρμογές Νέφους ΚΕΦΑΛΑΙΟ 13.
Templates ΑΥΞΗΣΗ ΤΗΣ ΠΑΡΑΓΩΓΙΚΟΤΗΤΑΣ ΜΕ ΤΗ ΧΡΗΣΗ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ
Εφαρμογές Νέφους ΚΕΦΑΛΑΙΟ 13.
Το υπολογιστικό σύστημα σαν ενιαίο σύνολο
Υπολογιστικό Νέφος ή Cloud computing
ΔΙΑΔΙΚΤΥΑΚΗ ΣΟΥΙΤΑ ΠΡΟΓΡΑΜΜΑΤΩΝ
Μεταγράφημα παρουσίασης:

Προχωρημένα Θέματα Βάσεων Δεδομένων Διδάσκων: Νεκτάριος Κοζύρης, καθηγητής (nkoziris@cslab.ntua.gr) Βοηθοί Δρ. Ιωάννης Κωνσταντίνου, (ikons@cslab.ntua.gr) Δρ. Μανόλης Τερροβίτης, (mter@imis.athena-innovation.gr) Δρ. Δημήτρης Σκούτας, (mter@imis.athena-innovation.gr)

Προχωρημένα θέματα βάσεων Κατανεμημένα Συστήματα Επεξεργασίας δεδομένων Database συστήματα: παραδοσιακά vs «κατανεμημένα» Αποθήκευση Ευρετηρίαση Ανάκτηση Ερωτήματα Κατανεμημένα συστήματα αρχείων Cloud computing – Γιατί?

Δομή Μαθήματος 1/2 Γενικά για τα clouds Παραδοσιακά θέματα ΒΔ Cloud management software Παραδοσιακά θέματα ΒΔ Transaction schedules, ACID properties, Locking protocols, Lamport Clocks Επεξεργασία δεδομένων με MapReduce Google File System (GFS) και HDFS RDBMS vs Key-Value Stores (NoSQL) Ανακοίνωση εργασίας, Φροντιστήριο

Δομή Μαθήματος 2/2 Row, Key-value Stores Παρουσίαση ειδικών θεμάτων Big Table, HBase Cassandra Dynamo Παρουσίαση ειδικών θεμάτων

Ορισμός Cloud Computing (wikipedia) “Παροχή υπολογιστικής ισχύος ως υπηρεσία και όχι σαν προϊόν. Πόροι, λογισμικό και πληροφορίες παρέχονται σε άλλους υπολογιστές και συσκευές σαν υπηρεσίες κοινής ωφελείας (πχ σαν το ρεύμα της ΔΕΗ) μέσω ενός δικτύου (συνήθως του Internet)” Διαβάστε: “Above the clouds: A Berkeley View of Cloud Computing” http://bit.ly/AiALuh

Τι κάνει? Τα νέφη υπολογιστών είναι ένα μοντέλο που επιτρέπει: Τα νέφη υπολογιστών είναι ένα μοντέλο που επιτρέπει: πρόσβαση μέσω δικτύου σε διαμορφώσιμους πόρους, όπως: υπολογιστική ισχύ, δίκτυα, αποθηκευτικό χώρο, εφαρμογές, υπηρεσίες, κλπ που μπορούν να δεσμεύονται και να απελευθερώνονται ταχέως με ελάχιστη διαχειριστική προσπάθεια ή επέμβαση από τον πάροχο της υπηρεσίας (elasticity).

Πώς το κάνει? Μεγάλα Data Centers Συστοιχίες από χιλιάδες υπολογιστές και αποθηκευτικές μονάδες Μεσαίας ισχύος υλικό (commodity hardware) Αποτυχίες κόμβων συνηθισμένες Διάφορα μοντέλα υπολογισμού / Ανομοιογενείς υπολογιστικοί πόροι Apple, North Carolina USA

Πώς το κάνει? Βασίζεται σε ήδη υπάρχουσες τεχνολογίες και πρακτικές Βασίζεται σε ήδη υπάρχουσες τεχνολογίες και πρακτικές Virtual machines Οn-demand, self-service, pay-as-you-go model Παροχή υπηρεσιών μέσω διαδικτύου Open Source Μοιάζει με προηγούμενα μοντέλα Grid computing Volunteer computing Peer to Peer Computing

Virtualization Virtualized Αρχιτεκτονική Παραδοσιακή Αρχιτεκτονική Εφ Εφ Εφ Εφ Εφ Εφ Παραδοσιακή Αρχιτεκτονική guest Λ.Σ. Guest Λ.Σ. Guest Λ.Σ. Εφαρμογή Εφαρμογή Εφαρμογή Hypervisor (kvm-xen-virtualbox-vmware) Λειτουργικό Σύστημα Host Λειτουργικό Σύστημα Υλικό Υλικό

Τυπικές εφαρμογές... Προβλήματα μεγάλης κλίμακας Crawling, Indexing, Searching, Web 2.0 εφαρμογές επιστημονικοί υπολογισμοί Επεξεργασία πολλών PB τη μέρα Κλιμάκωση! Διαδραστικές Web Εφαρμογές Google (mail, maps, docs, ads, …), Facebook, Yahoo, Amazon Startups: foursquare (ec2), dropbox (s3), κλπ. Ταχύτητα! Ανάγκη για διαχείριση δεδομένων!!!! Παραδοσιακές βάσεις δεν αρκούν!!

Χαρακτηριστικά Κλιμακωσιμότητα Διαθεσιμότητα Αξιοπιστία Ασφάλεια Ευελιξία Λειτουργικότητα Αποδοτικότητα Μετρήσιμο σύστημα Απλά APIs Κατανομή φόρτου

Ανάγκη για ελαστικότητα Over-provisioning, κοστίζει. Ελαστικό, pay-as-you-go Μόνο στο cloud!!! Under-provisioning, δεν λειτουργεί πάντα.

Υπολογιστικά νέφη Λύνουν πολλά προβλήματα, αλλά: Λύνουν πολλά προβλήματα, αλλά: Προσθέτουν πολυπλοκότητα Εξισορρόπηση φόρτου Συνέπεια Συγχρονισμός Ανοχή σε σφάλματα

Επίπεδα Υπηρεσιών 1 Χρήση προσφερόμενων υπηρεσιών π.χ. Google maps, mail, docs,… Software as a Service (SaaS) Παίρνεις ένα καλό και εύχρηστο API Και φτιάχνεις τις εφαρμογές σου π.χ. Google App Engine Platform as a Service (PaaS) Νοίκιασε υπολογιστές (υπολογιστική ισχύ, κύκλους) και αν θες παραπάνω τους παίρνεις όταν τους χρειάζεσαι π.χ. Amazon EC2 Infrastructure as a Service (IaaS)

Επίπεδα Υπηρεσιών 2

Τυπική αρχιτεκτονική cloud

Τοποθεσία Cloud Public Cloud π.χ. Amazon ή okeanos πολλοί χρήστες ενοικίαση πόρων σε δημόσιο Cloud (a la carte) πιθανότατα πιο φθηνό σύνδεση μέσω διαδικτύου Private Cloud (π.χ. το Cloud του cslab) λίγοι χρήστες πιθανή εσωτερική σύνδεση υψηλή ασφάλεια πιθανό μεγαλύτερο κόστος Hybrid Cloud Community Cloud Συνδεδεμένα clouds παρόμοιων οργανισμών π.χ GovCloud

Public Cloud Platforms Amazon Elastic Compute Cloud (EC2) Η πρώτη εταιρία που έδωσε cloud υπηρεσίες το 2006 RackSpace, RightScale, GoGrid, CloudSigma και άλλες πολλές Ελληνικό Cloud: okeanos http://okeanos.grnet.gr Ήδη σε πιλοτική λειτουργία Στόχος είναι η παροχή IaaS cloud υπηρεσίες στην ακαδημαϊκή κοινότητα Το project του μαθήματος θα γίνει στον okeano

Private Cloud IaaS software OpenStack Υποστήριξη από 150+ εταιρίες (Nasa, Dell, AMD, Intel, Canonical, κλπ) Από Μάιο 2011 προεπιλεγμένο cloud στο ubuntu O okeanos υποστηρίζει OpenStack εντολές

Συστήματα στο Cloud Κατανεμημένα Συστήματα Αρχείων Google File System (GFS) Hadoop Distributed File System (HDFS) CEPH file system Amazon Simple Storage Service (S3) Batch Processing Συστήματα Hadoop ecosystem (MapReduce, PIG, Hive, etc) Dryad Map Reduce Merge Row Stores (NoSQL) Proprietary: Big Table, Sherpa/PNUTS, AzureDB, SimpleDB Open source: Hbase, Cassandra, Dynamo, MongoDB Και πολλά άλλα http://nosql-database.org/

Σύστημα Αρχείων GFS: ένα κλιμακώσιμο κατανεμημένο σύστημα αρχείων για μεγάλες data-intensive εφαρμογές. Παρέχει ανοχή σε σφάλματα ενώ τρέχει σε φτηνό υλικό και προσφέρει υψηλή επίδοση σε μεγάλο αριθμό χρηστών. Παραδοχές : Υψηλή συχνότητα βλαβών. Συνήθως µεγάλα αρχεία. Η ανάκτηση γίνεται είτε σε µεγάλα κοµµάτια είτε σε πολλά µικρά. Τα περισσότερα αρχεία τροποποιούνται µε προσάρτηση(append). Το υψηλό bandwidth προτιµάται από το χαµηλό latency.

Batch Processing - MapReduce Μοντέλο παράλληλης επεξεργασίας μεγάλου όγκου δεδομένων Ο χρήστης ορίζει map και reduce functions ανάλογα με το πώς θέλει να επεξεργαστεί τα δεδομένα του Map : παίρνει για είσοδο ένα key/value και παράγει ένα ή περισσότερα ενδιάμεσα key/values Reduce : κάνει merge και επεξεργάζεται τα ενδιάμεσα key/values των mappers Αυτόματη παραλληλοποίηση των προγραμμάτων του χρήστη Partitioning στα δεδομένα εισόδου Scheduling Πιθανή αποτυχία κάποιου υπολογιστή Επικοινωνία μεταξύ υπολογιστών

MapReduce Master Map worker Reduce worker Part 1 Part 2 Part 3 Input Output

Row Stores Θα δούμε στο μάθημα αναλυτικά κάποια από αυτά και τις ιδιαιτερότητές τους Βάσεις δεδομένων χωρίς schema NoSQL (NoRel) Ένας μεγάλος πίνακας με ομογενοποιημένα δεδομένα διαχωρίζονται μέσω του κλειδιού (1 key = 1 row) πολλά attributes – values Key-value stores Συνήθως κάθονται πάνω από ένα κατανεμημένο σύστημα αρχείων πχ BigTable->GFS

Από το RDBMS στο NoSQL Id Ταινία Έτος 1 The Dark Knight 2008 2 King’s Speech 2010 3 The Fighter 4 Black Swan 5 The Prestige 2006 Key value The Dark Knight Ηθοποιοί: Christian Bale Έτος: 2008 King’s Speech Ηθοποιοί: Colin Firth Έτος: 2010 The Fighter Ηθοποιοί: Melissa Leo, Christian Bale Black Swan Ηθοποιοί: Natalie Portman The Prestige Έτος: 2006 Christian Bale Ημ.Γέννησης: 30-1-1974 Key value The Dark Knight Ηθοποιοί: Christian Bale Έτος: 2008 King’s Speech Ηθοποιοί: Colin Firth Έτος: 2010 The Fighter Ηθοποιοί: Melissa Leo, Christian Bale Black Swan Ηθοποιοί: Natalie Portman The Prestige Έτος: 2006 Id Ηθοποιός Ημ.γέννησης 1234 Christian Bale 30-1-1974 5678 Natalie Portman 9-6-1981 9012 Melissa Leo 14-9-1960 3456 Colin Firth 10-9-1960 Ηθοπ Ταινία 1234 1 3 5 5678 4 9012 3456 2 Ηθοπ Ταινία 1234 1 3 5 5678 4 9012 3456 2

Απαιτήσεις Μαθήματος 1/2 Εργασία στο Hadoop, απαιτεί: Εξοικείωση με το σύστημα Κατανόηση του MapReduce Γράψιμο δικών σας MapReduce προγραμμάτων Αποθήκευση και ανάγνωση Στο HDFS Στο Hbase