Βάσεις Δεδομένων II Προχωρημένα Θέματα Διαχείρισης Ταυτοχρονισμού Πάνος Βασιλειάδης Οκτώβρης 2002

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Indexing.
Advertisements

Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 Επεξεργασία Δοσοληψιών.
ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ Ι
Αλγόριθμοι Αναζήτησης
Προχωρημένα Θέματα Τεχνολογίας και Εφαρμογών Βάσεων Δεδομένων Προχωρημένα Θέματα Διαχείρισης Ταυτοχρονισμού Πάνος Βασιλειάδης Οκτώβρης.
Συνάφεια Κρυφής Μνήμης σε Επεκτάσιμα Μηχανήματα. Συστήματα με Κοινή ή Κατανεμημένη Μνήμη  Σύστημα μοιραζόμενης μνήμης  Σύστημα κατανεμημένης μνήμης.
Πολυπλοκότητα Παράμετροι της αποδοτικότητας ενός αλγόριθμου:
Προχωρημένα Θέματα Τεχνολογίας και Εφαρμογών Βάσεων Δεδομένων Βασικές Αρχές Διαχείρισης Ταυτοχρονισμού Πάνος Βασιλειάδης Οκτώβριος 2009.
Βάσεις Δεδομένων II Περίληψη: Προχωρημένα Θέματα Διαχείρισης Ταυτοχρονισμού Πάνος Βασιλειάδης Οκτώβρης 2002
Ο Αλγόριθμος FP-Growth. Αλγόριθμος FP-Growth Ο αλγόριθμος χρησιμοποιεί μια συμπιεσμένη αναπαράσταση της βάσης των συναλλαγών με τη μορφή ενός FP-δέντρου.
Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 Τεχνικές Ελέγχου Συνδρομικότητας - Ασκήσεις.
Βάσεις Δεδομένων (ΚΒΔ)
ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ Ι
Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 Τεχνικές Ελέγχου Συνδρομικότητας.
Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 Επεξεργασία Δοσοληψιών Ανακεφαλαίωση.
Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 Επεξεργασία Δοσοληψιών Ανακεφαλαίωση.
Entity-Relationship Παραδείγματα Πληροφοριακά Συστήματα και Βάσεις Δεδομένων Φροντιστήριο 1 Δαμιανός Χατζηαντωνίου.
1515 Διαχείριση Συναλλαγών  Συναλλαγές  Έλεγχος ταυτοχρονισμού  Επανάκτηση δεδομένων.
Εργασία Η υλοποίηση του αλγορίθμου συγχώνευσης θα πρέπει να χρησιμοποιεί την ιδέα των ροών (streams). Θα πρέπει να υπάρχουν δύο διαφορετικά είδη.
Λειτουργικά Συστήματα ΑΔΙΕΞΟΔΑ. 3.1 Εισαγωγή  Αδιέξοδο = ένα σύνολο από διεργασίες που δημιουργούν μια κυκλική αλυσίδα όπου κάθε process στην αλυσίδα.
Κοντινότεροι Κοινοί Πρόγονοι α βγ θ δεζ η π ν ι κλμ ρσ τ κκπ(λ,ι)=α, κκπ(τ,σ)=ν, κκπ(λ,π)=η κκπ(π,σ)=γ, κκπ(ξ,ο)=κ ξο κκπ(ι,ξ)=β, κκπ(τ,θ)=θ, κκπ(ο,μ)=α.
Προσεγγιστικοί Αλγόριθμοι
ΘΠ06 - Μεταγλωττιστές Πίνακας Συμβόλων. Πίνακας Συμβόλων (Symbol Table) (Ι)  Είναι μια δομή στην οποία αποθηκεύονται τα ονόματα ενός προγράμματος και.
Βάσεις Δεδομένων II Διαχείριση Δοσοληψιών Πάνος Βασιλειάδης Σεπτέμβρης 2002
ΕΠΛ 231 – Δομές Δεδομένων και Αλγόριθμοι12-1 Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Ο αλγόριθμος του Prim και ο αλγόριθμος του Kruskal.
Κεφάλαιο 19 Τεχνικές Ανάκαμψης Βάσεων Δεδομένων (Recovery)
ΘΠ06 - Μεταγλωττιστές Πίνακας Συμβόλων Φροντιστήριο - 30/04/2009.
Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 Επεξεργασία Δοσοληψιών (συνέχεια)
Προχωρημένα Θέματα Τεχνολογίας και Εφαρμογών Βάσεων Δεδομένων Διαχείριση Συναλλαγών Πάνος Βασιλειάδης Μάρτιος 2014
Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. K-means k-windows k-means: 2 φάσεις 1. Μια διαμέριση των στοιχείων σε k clusters 2. Η ποιότητα της διαμέρισης.
Βάσεις Δεδομένων II Περίληψη: Τεχνικές Ανάνηψης Πάνος Βασιλειάδης Νοέμβρης 2002
Αναζήτηση – Δέντρα (2 ο Μέρος) Advanced Data Indexing (Προηγμένη ευρετηρίαση δεδομένων)
ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ 2: ΘΕΜΑΤΑ ΘΕΩΡΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Η/Υ
Λεξικό, Union – Find Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων.
Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 Ασκήσεις Επεξεργασία Δοσοληψιών, Τεχνικές Ελέγχου Συνδρομικότητας, Τεχνικές Ανάκαμψεις από Σφάλματα.
ΕΠΛ 231 – Δομές Δεδομένων και Αλγόριθμοι13-1 Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Ο αλγόριθμος Dijkstra για εύρεση βραχυτέρων μονοπατιών.
1 ΤΜΗΜΑ ΜΠΕΣ Αλγόριθμοι Αναζήτησης Εργασία 1 Τυφλή Αναζήτηση.
Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 Επεξεργασία Δοσοληψιών.
Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙΙ.
Βάσεις Δεδομένων II Ανανηψιμότητα Δοσοληψιών Πάνος Βασιλειάδης Οκτώβρης 2002
Βάσεις Δεδομένων II Βασικές Αρχές Διαχείρισης Ταυτοχρονισμού Πάνος Βασιλειάδης Οκτώβρης 2002
Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 Επεξεργασία Δοσοληψιών (συνέχεια)
Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙΙ.
Βάσεις Δεδομένων II Εισαγωγικά του μαθήματος Πάνος Βασιλειάδης Σεπτέμβρης 2002
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Βάσεις Δεδομένων II Περίληψη: Διαχείριση Δοσοληψιών Πάνος Βασιλειάδης Οκτώβρης 2002
Βάσεις Δεδομένων II Περίληψη: Βασικές Αρχές Διαχείρισης Ταυτοχρονισμού Πάνος Βασιλειάδης Οκτώβρης 2002
Μέγιστη ροή TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A AA A A Συνάρτηση χωρητικότητας Κατευθυνόμενο γράφημα.
Συνδετικότητα γραφήματος (graph connectivity). α β Υπάρχει μονοπάτι μεταξύ α και β; Παραδείγματα: υπολογιστές ενός δικτύου ιστοσελίδες ισοδύναμες μεταβλητές.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
Διοίκηση Επιχειρήσεων Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας.
Διοίκηση Επιχειρήσεων Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας.
Γράφημα Συνδυαστικό αντικείμενο που αποτελείται από 2 σύνολα:
ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ Ι
Βάσεις Δεδομένων Ι 4η διάλεξη
Ευρετήρια Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Δυναμικός Κατακερματισμός
Προβλήματα Ικανοποίησης Περιορισμών
Βάσεις Δεδομένων Ι Εισαγωγή
ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΠΡΟΧΩΡΗΜΕΝΕΣ ΤΕΧΝΙΚΕΣ
Μέγιστη ροή Κατευθυνόμενο γράφημα 12 Συνάρτηση χωρητικότητας
Κατανεμημένα Συστήματα
Αµοιβαίος αποκλεισµός
Μέγιστη ροή Κατευθυνόμενο γράφημα 12 Συνάρτηση χωρητικότητας
Κατανεμημένα Συστήματα
Προχωρημένα Θέματα Τεχνολογίας και Εφαρμογών Βάσεων Δεδομένων
Κατανεμημένα Συστήματα
Διαχρονικές Δομές Δεδομένων
Δυναμικός Κατακερματισμός
Μεταγράφημα παρουσίασης:

Βάσεις Δεδομένων II Προχωρημένα Θέματα Διαχείρισης Ταυτοχρονισμού Πάνος Βασιλειάδης Οκτώβρης

2 Δοσοληψίες & Ταυτοχρονισμός DB Κράτησε για τον κ. Χ την θέση 13Α για LA! Κράτησε για τον κ. Y την θέση 13Α για LA! Πόσοι ταξιδεύουν για LA ?

3 Θεματολόγιο Α) Πρακτικά Θέματα στον Έλεγχο Ταυτοχρονισμού Φαντάσματα Κλείδωμα δέντρων Κλείδωμα σε διαφορετικά επίπεδα διακριτότητας Πώς τα βάζω όλα μαζί Β) Εναλλακτικές Τεχνικές Αισιόδοξος έλεγχος ταυτοχρονισμού Έλεγχος ταυτοχρονισμού με χρονόσημα Έλεγχος ταυτοχρονισμού με πολλαπλές εκδόσεις Γ) Δοσοληψίες και SQL

4 Θεματολόγιο Φαντάσματα Κλείδωμα δέντρων Κλείδωμα σε διαφορετικά επίπεδα διακριτότητας Πώς τα βάζω όλα μαζί Αισιόδοξος έλεγχος ταυτοχρονισμού Έλεγχος ταυτοχρονισμού με χρονόσημα Έλεγχος ταυτοχρονισμού με πολλαπλές εκδόσεις Δοσοληψίες και SQL

5 Αρχική παρατήρηση Μέχρι στιγμής, κάναμε δύο μη προφανείς υποθέσεις: Η ΒΔ δεν εμπλουτίζεται με νέες εγγραφές κατά τη διάρκεια των δοσοληψιών (ήτοι, υποθέταμε ότι write = UPDATE και όχι INSERT) Τα αντικείμενα της ΒΔ είναι ανεξάρτητα μεταξύ τους (το οποίο καταρρέει αν υποθέσουμε π.χ., ένα B+ tree σε κάποιο πεδίο ενός πίνακα) Τι θα γίνει αν αναιρέσουμε τις υποθέσεις αυτές?

6 Παράδειγμα: Sailors SIDSNAMERATINGAGE 1Popay1171 2Popay2143 3Popay3280 4Popay T1: SELECT RATING, MAX(AGE) FROM SAILORS GROUP BY RATING INSERT INTO SAILORS (5,’X’,1,96); DELETE FROM SAILORS WHERE RATING = 2 AND AGE IN (SELECT MAX(AGE) FROM SAILORS WHERE RATING =2) T2:

7 Πιθανή Εκτέλεση SIDSNAMERATINGAGE 1Popay1171 2Popay2143 3Popay3280 4Popay4263 T1: SELECT RATING, MAX(AGE) FROM SAILORS GROUP BY RATING Χ1 RATINGAGE 171 INSERT INTO SAILORS (5,’X’,1,96); DELETE FROM SAILORS WHERE RATING = 2 AND AGE IN (SELECT MAX(AGE) FROM SAILORS WHERE RATING =2) T2: Πρώτα, οι RATING=1

8 Πιθανή Εκτέλεση SIDSNAMERATINGAGE 1Popay1171 2Popay2143 3Popay3280 4Popay4263 5X196 T1: SELECT RATING, MAX(AGE) FROM SAILORS GROUP BY RATING Χ1 RATINGAGE 171 INSERT INTO SAILORS (5,’X’,1,96); DELETE FROM SAILORS WHERE RATING = 2 AND AGE IN (SELECT MAX(AGE) FROM SAILORS WHERE RATING =2) T2: Χ2Χ2 Το INS παίρνει X- lock

9 Πιθανή Εκτέλεση SIDSNAMERATINGAGE 1Popay1171 2Popay2143 3Popay3280 4Popay4263 5X196 T1: SELECT RATING, MAX(AGE) FROM SAILORS GROUP BY RATING Χ1 RATINGAGE 171 INSERT INTO SAILORS (5,’X’,1,96); DELETE FROM SAILORS WHERE RATING = 2 AND AGE IN (SELECT MAX(AGE) FROM SAILORS WHERE RATING =2) T2: Χ2Χ2 Το DEL παίρνει X- lock Χ2Χ2 Χ2Χ2

10 Πιθανή Εκτέλεση SIDSNAMERATINGAGE 1Popay1171 2Popay2143 4Popay4263 5X196 T1: SELECT RATING, MAX(AGE) FROM SAILORS GROUP BY RATING Χ1 RATINGAGE 171 INSERT INTO SAILORS (5,’X’,1,96); DELETE FROM SAILORS WHERE RATING = 2 AND AGE IN (SELECT MAX(AGE) FROM SAILORS WHERE RATING =2) T2: Τ2 COMMITS!!

11 Πιθανή Εκτέλεση SIDSNAMERATINGAGE 1Popay1171 2Popay2143 4Popay4263 5X196 T1: SELECT RATING, MAX(AGE) FROM SAILORS GROUP BY RATING Χ1 RATINGAGE INSERT INTO SAILORS (5,’X’,1,96); DELETE FROM SAILORS WHERE RATING = 2 AND AGE IN (SELECT MAX(AGE) FROM SAILORS WHERE RATING =2) T2: Μετά, όσοι έχουν RATING=2

12 Πιθανές Εκτελέσεις... SIDSNAMERATINGAGE 1Popay1171 2Popay2143 3Popay3280 4Popay4263 5X196 RATINGAGE Τ1 || Τ2 RATINGAGE Τ1 ; Τ2 RATINGAGE Τ2 ; Τ1

13 Φάντασμα Το φαινόμενο κατά το οποίο μια δοσοληψία ξεκινά με ένα σύνολο εγγραφών στην αρχή της, και βρίσκεται με ένα διαφορετικό σύνολο εγγραφών στο τέλος της, χωρίς να έχει κάνει αυτή τις αλλαγές. Ο 2PL ΔΕΝ μας προστατεύει από φαντάσματα!

14 Αν μπορούσαμε άραγε... SIDSNAMERATINGAGE 1Popay1171 2Popay2143 3Popay3280 4Popay4263 5X196 Χ1 Χ2Χ2 …να κλειδώναμε στην ίδια δοσοληψία όλες τις εγγραφές που πληρούν τη συνθήκη RATING=1...

15 Κλείδωμα κατηγορήματος Το γεγονός ότι κλειδώνω όλες τις εγγραφές που πληρούν μια συνθήκη (όπως π.χ., RATING = 1) Η πιο απλοϊκή λύση, είναι να κλειδώσω όλον τον πίνακα (βλ. και στη συνέχεια) Καμιά πιο έξυπνη ιδέα?

16 Θεματολόγιο Φαντάσματα Κλείδωμα δέντρων Κλείδωμα σε διαφορετικά επίπεδα διακριτότητας Πώς τα βάζω όλα μαζί Αισιόδοξος έλεγχος ταυτοχρονισμού Έλεγχος ταυτοχρονισμού με χρονόσημα Έλεγχος ταυτοχρονισμού με πολλαπλές εκδόσεις Δοσοληψίες και SQL

17 Κλείδωμα ευρετηρίων Αν είχαμε ένα index (π.χ., B+ tree) πάνω στο πεδίο rating, θα μπορούσαμε να κλειδώναμε γρήγορα όλες τις εγγραφές με RATING=1. Ακόμα κι αν δεν υπάρχουν τέτοιες εγγραφές, κλειδώνοντας τον index, μπορούμε να απαγορεύσουμε να δημιουργηθούν από άλλους κατά τη διάρκεια της δοσοληψίας! Ειδική περίπτωση του κλειδώματος κατηγορήματος... Στη συνέχεια, Ramakrishnan & Gehrke Β+ tree Table

18 Πρώτη λύση Ας υποθέσουμε ότι θέλουμε να εισάγουμε μια εγγραφή με RATING=1στη διάρκεια της Τ1 Κατεβαίνοντας από τη ρίζα προς τα φύλλα του Β+ δέντρου, μπορούμε να κλειδώνουμε κάθε κόμβο με X-lock [του φύλλου συμπεριλαμβανομένου] Τραγική απόδοση: ήδη από το πρώτο βήμα έχω κλειδώσει τη ρίζα, ήτοι, ΟΛΟ το δέντρο.

19 Παρατήρηση Στα Β+ δέντρα, οι ενδιάμεσοι κόμβοι χρησιμεύουν ΜΟΝΟ ως μονοπάτια για τα φύλλα [θυμάστε τη διαφορά με τα Β δέντρα?] Αν κλείδωνα με S-lock τους ενδιάμεσους κόμβους και με X-lock τα φύλλα? Bug: τι θα γίνει αν η εισαγωγή διασπάσει το παιδί ?

20 Απλός αλγόριθμος κλειδώματος δέντρων SELECT: Ξεκινώντας από τη ρίζα κλειδώνουμε με S-lock κάθε κόμβο. Μετά, ξεκλειδώνουμε τον γονέα του. INS/DEL: Ξεκινώντας από τη ρίζα κλειδώνουμε με X-locks κατά περίπτωση. Μετά ελέγχουμε αν ο κλειδωθείς κόμβος είναι ασφαλής: Αν ναι, ξεκλειδώνουμε τους προγόνους του. Ασφαλής κόμβος: οι όποιες αλλαγές δεν θα διαδοθούν προς τα πάνω από τον κόμβο αυτό INS: ο κόμβος δεν είναι πλήρης. DEL: ο κόμβος δεν είναι άδειος κατά το ήμισυ.

21 Απλός αλγόριθμος κλειδώματος δέντρων Α’ τρόπος για το «κατά περίπτωση» X-locks για όλους τους κόμβους Β’ τρόπος για το «κατά περίπτωση» S-locks για τους ενδιάμεσους κόμβους X-locks για τα φύλλα Μετατροπή του S-lock σε Χ-lock αν υπάρχει διάσπαση Elmasri & Navathe, Ramakrishnan & Gehrke

22 ROOT A B C DE F G H I * *23*24*35*36*38*41*44* Θυμάστε τι βάζουμε σε κάθε κουτάκι? 23

ROOT A B C DE F G H I * *23*24*35*36*38*41*44* DEL 38* 23 Χ Με Α’ τρόπο...

24 ROOT A B C DE F G H I * *23*24*35*36*38*41*44* 23 Χ DEL 38*

25 ROOT A B C DE F G H I * *23*24*35*36*38*41*44* 23 Χ DEL 38*

26 ROOT A B C DE F G H I * *23*24*35*36*38*41*44* 23 Χ DEL 38*

27 ROOT A B C DE F G H I * *23*24*35*36*41*44* 23 DEL 38*

28 ROOT A B C DE F G H I * *23*24*35*36*38*41*44* INS 45* 23 S Με Β’ τρόπο...

29 ROOT A B C DE F G H I * *23*24*35*36*38*41*44* INS 45* 23 S

30 ROOT A B C DE F G H I * *23*24*35*36*38*41*44* INS 45* 23 S S Γιατί ΔΕΝ ξεκλειδώνω το Β ?

31 ROOT A B C DE F G H I * *23*24*35*36*38*41*44* INS 45* 23 Χ

32 ROOT A B C DE F G H I * *23*24*35*36*38*41*44* INS 45* 23 45*

33 Πιο δύσκολα... Πώς θα έτρεχε το DEL 38* με τον Β’ τρόπο ? Τι θα γίνει αν πάω να κάνω INS 25* στο αρχικό δέντρο? Για το σπίτι: είναι 2PL ο αλγόριθμος ?

34 Θεματολόγιο Φαντάσματα Κλείδωμα δέντρων Κλείδωμα σε διαφορετικά επίπεδα διακριτότητας Πώς τα βάζω όλα μαζί Αισιόδοξος έλεγχος ταυτοχρονισμού Έλεγχος ταυτοχρονισμού με χρονόσημα Έλεγχος ταυτοχρονισμού με πολλαπλές εκδόσεις Δοσοληψίες και SQL

35 Τι κλειδώνουμε στην πράξη? Μέχρι τώρα θεωρούσαμε εγγραφές Στην πράξη, συνήθως μιλάμε για σελίδες Μπορούμε να κλειδώσουμε τη βάση σε πολλά «επίπεδα» που ορίζουν μια «ιεραρχία διακριτότητας» Tuples Tables Pages Database contains Ramakrishnan & Gehrke

36 Ορισμοί Διακριτότητα (granularity): πόσο μικρό είναι ένα αντικείμενο υπό παρατήρηση Μικρή διακριτότητα = μεγάλο μέγεθος στοιχείου (π.χ., πίνακας ή ΒΔ) Μεγάλη διακριτότητα = μικρό μέγεθος στοιχείου (π.χ., σελίδα ή εγγραφή) Πρόγονος ενός αντικειμένου: οποιοδήποτε αντικείμενο στην ιεραρχία διακριτότητας το περικλείει (π.χ., η ΒΔ είναι πρόγονος μιας σελίδας)

37 Κλείδωμα σε διαφορετικά επίπεδα διακριτότητας Κλείδωμα σε μικρή διακριτότητα: αποκλεισμός και καθυστέρηση των δοσοληψιών που τρέχουν εν παραλλήλω (π.χ., τι θα γίνει αν κλειδώσω όλη τη ΒΔ?) Κλείδωμα σε μεγάλη διακριτότητα: μεγάλος αριθμός κλειδωμάτων (χώρος μνήμης, καθυστέρηση διαχείρισης) Ερώτηση Κρίσεως: Ποια η καλύτερη διακριτότητα (& υπό ποιες συνθήκες)?

38 Παράδειγμα Τ1: UPDATE EMP WHERE EMP_ID = 1 SET… T2: SELECT * FROM EMP Η Τ1 για να γράψει μία και μόνο εγγραφή, μπλοκάρει την Τ2. Ιδέα: Τ1: κλειδώνει την εγγραφή της Τ1 Τ2: ελέγχει για κλείδωμα όλες τις εγγραφές μία μία? Καλύτερη Ιδέα: Μήπως να κλειδώναμε μόνο τη σελίδα που περιέχει την εγγραφή της Τ1?

39 Εκμετάλλευση της ιεραρχίας Η ιδέα είναι να κλειδώνουμε με κατάλληλο τρόπο σε διαφορετικά επίπεδα διακριτότητας Χρειαζόμαστε ένα νέο είδος κλειδώματος (γιατί?) Κλείδωμα πρόθεσης (intention lock): εφαρμόζεται σε ένα πρόγονο, χαρακτηρίζοντας τι πράξη (για την ακρίβεια: κλείδωμα) θα εφαρμοστεί στον απόγονό του Τριών ειδών κλειδώματα πρόθεσης...

40 Κλειδώματα Πρόθεσης Ένας πρόγονος (π.χ., σελίδα) λαμβάνει IS: αν η δοσοληψία θέλει να διαβάσει (πάρει S-lock) για κάποιους απoγόνους (π.χ., μια εγγραφή) IX: αν η δοσοληψία θέλει να γράψει (πάρει X-lock) για κάποιους απογόνους (π.χ., μια εγγραφή) SIX: αν η δοσοληψία θέλει να διαβάσει (πάρει S-lock) όλους τους απογόνους του και να γράψει (πάρει X- lock) και κάποιους από αυτούς. Πριν πάρεις ένα κλείδωμα για κάποιο αντικείμενο, πρέπει να πάρεις κλείδωμα πρόθεσης για όλους τους προγόνους του

41 Συγκρούσεις Ο πίνακας συγκρούσεων γίνεται πλέον: T1: έχει κάποιο lock σε ένα αντικείμενο Τ2: αιτείται κάποιο lock στο ίδιο αντικείμενο Ότι δεν έχει  είναι επιτρεπτό T1 T2 ISIXSIXSX IS  IX  SIX  S  X 

42 Παράδειγμα: «σύγκρουση» για μια σελίδα Τ1: έχει κλειδώσει με IS τη σελίδα, ώστε να διαβάσει μία (κάποιες) εγγραφή(ες) της Τ2: αντιστοίχως, αλλά για να γράψει Αν πρόκειται για διαφορετικές εγγραφές, κανείς δεν περιμένει Αλλιώς, η σύγκρουση συμβαίνει στο χαμηλότερο επίπεδο με τα κλειδώματα S- & X- locks T1 T2 ISIXSIXSX IS  IX  SIX  S  X 

43 Τα κλειδώματα είναι σε όλη την ιεραρχία... Tuples Tables Pages Database contains S IS T1 X IX T2 T1 T2 ISIX IS  IX  Στα ψηλά επίπεδα, δουλεύει καλά. Στα χαμηλά, όπως πριν...

44 Αλγόριθμος Κλειδωμάτων Ξεκινάς στην κορυφή της ιεραρχίας Για να πάρω ένα κλείδωμα S- (ή IS-) σε ένα αντικείμενο, πρέπει να έχω IS- (ή IX-) στον πρόγονό του [αλλιώς, περιμένω] Για να πάρω ένα κλείδωμα X- (ή IX- ή SIX) σε ένα αντικείμενο, πρέπει να έχω IX- (ή SIX-) στον πρόγονό του [αλλιώς, περιμένω] Ξεκλειδώνω με την αντίστροφη σειρά (bottom-up)

45 Παραδείγματα (και «τι σημαίνει S-lock σε ένα πίνακα?») T1 διαβάζει τον πίνακα R, και update κάποιες εγγραφές: T1 παίρνει SIX-lock στον R, μετά για κάθε εγγραφή του R παίρνει και ένα S-lock, και όπου δη, αναβαθμίζει το S-lock αυτό σε X-lock (στα updates στις κρίσιμες εγγραφές, δηλαδή). T2 χρησιμοποιεί ένα index για να διαβάσει τμήμα της R: T2 παίρνει IS στον R και μετά για κάθε εγγραφή του R παίρνει και ένα S-lock. T3 διαβάζει όλον τον R://ΠΡΟΣΟΧΗ! T3 παίρνει S-lock στο R. //S-lock σε πίνακα? ή, η T3 κάνει ότι και η T2 & μπορεί να χρησιμοποιήσει «κλιμάκωση κλειδώματος» (lock escalation) για να αποφασίσει αν θα πάρει S lock στο R.

46 Κλιμάκωση κλειδωμάτων Όταν μια δοσοληψία προσπαθήσει να πάρει κλειδώματα π.χ., για έναν ολόκληρο πίνακα, πέφτουμε στην περίπτωση του προβλήματος χώρου & χρόνου στη διαχείριση των κλειδωμάτων Κλιμάκωση Κλειδωμάτων: Αποφασίζουμε ότι πάνω από κάποιο threshold, αντί να κλειδώνω μία μία σελίδα (με S- ή X-lock), κλειδώνω μόνο τον πίνακα (με S- ή X-lock) και τίποτε άλλο. ΠΡΟΣΟΧΗ: Αδιέξοδα!!! (αν π.χ., ο ένας είχε SIX και ο άλλος IS στον πίνακα πριν την κλιμάκωση)

47 Θεματολόγιο Φαντάσματα Κλείδωμα δέντρων Κλείδωμα σε διαφορετικά επίπεδα διακριτότητας Πώς τα βάζω όλα μαζί Αισιόδοξος έλεγχος ταυτοχρονισμού Έλεγχος ταυτοχρονισμού με χρονόσημα Έλεγχος ταυτοχρονισμού με πολλαπλές εκδόσεις Δοσοληψίες και SQL

48 Το ζήτημα είναι... Όπως είπαμε, υπάρχει το πρόβλημα των φαντασμάτων Ο σκοπός είναι να το αποτρέψω και θα χρησιμοποιήσουμε την τεχνική κλειδώματος κατηγορήματος (predicate locking) Θα εξετάσουμε με ποιον τρόπο, γίνεται αυτό στην πράξη!

49 Φαντάσματα SIDSNAMERATINGAGE 1Popay1171 2Popay2143 3Popay3280 4Popay4263 5X196 Χ1 Χ2Χ2 …να κλειδώναμε στην ίδια δοσοληψία όλες τις εγγραφές που πληρούν τη συνθήκη RATING=1...

50 Κλείδωμα κατηγορήματος / ευρετηρίων Το γεγονός ότι κλειδώνω όλες τις εγγραφές που πληρούν μια συνθήκη (όπως π.χ., RATING = 1) Αν είχαμε ένα index (π.χ., B+ tree) πάνω στο πεδίο rating, θα μπορούσαμε να κλειδώναμε γρήγορα όλες τις εγγραφές με RATING=1. Β+ tree Table

51 Αν ΔΕΝ έχω κάποιον index Για να αποφύγω φαντάσματα SELECT statements: S-lock σε όλον τον πίνακα UPDATE / DELETE statements: SIX-lock στον πίνακα και Χ-locks στις κρίσιμες σελίδες με τις υπό τροποποίηση εγγραφές Αν κάποιος πάει να γράψει (X-lock στη σελίδα), θα συγκρουστεί με το εν λόγω κλείδωμα

52 Αν έχω B+ trees Στον index, S-locks στα φύλλα όταν κάνω SELECT, αλλιώς X-locks στα φύλλα Στον πίνακα: SELECT statements: IS-lock στον πίνακα, S-locks στις σελίδες με εγγραφές που ικανοποιούν τοWHERE clause UPDATE / DELETE statements: IX-lock στον πίνακα και Χ-locks στις κρίσιμες σελίδες με τις υπό τροποποίηση εγγραφές Πρώτα κλειδώνω τον index και μετά τον πίνακα Η σύγκρουση εντοπίζεται στον index

53 Tuning for performance Γράψτε μικρές δοσοληψίες. Εν ανάγκη, σπάστε τις μεγάλες σε πολλές μικρές δοσοληψίες [το default στην SQL είναι δοσοληψία ανά εντολή]! Χρησιμοποιήστε indexes. Όχι μόνο ψάχνουμε πιο γρήγορα [αν και γράφουμε πιο αργά] αλλά ο ταυτοχρονισμός αυξάνεται! Αποφύγετε το lock escalation. Τα νέα DBMS’s συνήθως δεν το κάνουν, εκτός κι αν τους το πείτε (RTFM)… Το granule (επίπεδο διακριτότητας ?) ήταν για καιρό η σελίδα. Σιγά σιγά, κατεβαίνουμε σε επίπεδο εγγραφής (π.χ., Oracle 9i)…

54 Θεματολόγιο Φαντάσματα Κλείδωμα δέντρων Κλείδωμα σε διαφορετικά επίπεδα διακριτότητας Πώς τα βάζω όλα μαζί Αισιόδοξος έλεγχος ταυτοχρονισμού Έλεγχος ταυτοχρονισμού με χρονόσημα Έλεγχος ταυτοχρονισμού με πολλαπλές εκδόσεις Δοσοληψίες και SQL Διαφάνειες της υποενότητας: Ramakrishnan & Gehrke

55 Οι τεχνικές κλειδώματος είναι συντηρητικές (αποφεύγονται οι συγκρούσεις) Μειονεκτήματα: επιβάρυνση (overhead) χειρισμού κλειδώματος έλεγχος προς ανίχνευση αδιεξόδων Προβλήματα των κλειδωμάτων

56 Αισιόδοξη εκτέλεση δοσοληψιών Κάθε δοσοληψία έχει τρεις φάσεις ΑΝΑΓΝΩΣΗ: η δοσοληψία διαβάζει από τη ΒΔ, αλλά τροποποιεί τοπικά αντίγραφα των αντικειμένων σε δικό της χώρο ΕΠΙΚΥΡΩΣΗ: έλεγχος για συγκρούσεις – αν υπάρχει σύγκρουση, abort & restart ΕΓΓΡΑΦΗ: γράφει τα τοπικά αντίγραφα στη ΒΔ Ti RVW

57 Πώς δουλεύει ? Χρονόσημο δοσοληψίας: η στιγμή που ξεκινά η φάση επικύρωσής της Έστω ότι έχουμε μια δοσοληψία Tj που θέλει να κάνει Επικύρωση Θα την ελέγξουμε σε σχέση με όλες τις δοσοληψίες Ti με χρονόσημο μικρότερο της Tj. Για όλες τις δοσοληψίες Ti, τ.ω. Ti < Tj, αρκεί να ισχύει μία από τις παρακάτω συνθήκες ελέγχου Αν δεν ισχύει καμία εξ αυτών, η Tj πρέπει να κάνει ABORT και να επανεκκινηθεί.

1η συνθήκη ελέγχου Η Ti τελειώνει πριν αρχίσει η Tj. Ti RVW Tj RVW Σειριακή εκτέλεση των δοσοληψιών

2η συνθήκη ελέγχου Η Τi τελειώνει πριν αρχίσει η φάση εγγραφής της Tj WriteSet(Ti)  ReadSet(Tj) =  Η Τj δεν διαβάζει κανένα αντικείμενο που τροποποιεί η Τi Όλες οι εγγραφές της Ti προηγούνται αυτών της Tj Ti RVW Tj RVW

3η συνθήκη ελέγχου Η Τi τελειώνει τη φάση ανάγνωσης πριν τελειώσει η φάση ανάγνωσης της Τj WriteSet(Ti)  ReadSet(Tj) =  WriteSet(Ti)  WriteSet(Tj) =  Η Τj και η Τi γράφουν αντικείμενα ταυτόχρονα, μεν,... αλλά, οι εγγραφές τους ΔΕΝ επικαλύπτονται! Ti RVW Tj RVW

61 Προσέξτε ότι... ΠΕΡΙΟΡΙΣΜΟΣ: Όταν μια δοσοληψία βρίσκεται σε φάση επικύρωσης, καμιά άλλη δοσοληψία δεν μπορεί να κάνει COMMIT!!! Ελέγξτε και μόνοι σας: ο αισιόδοξος έλεγχος ταυτοχρονισμού, ουσιαστικά υλοποιεί το γράφο σειριοποιησιμότητας (πρακτικά ελέγχει αν οι συγκρούσεις γίνονται με την ίδια σειρά)

62 Σχόλια Overhead διατήρησης λίστας προσπελασθέντων αντικειμένων Αν οι συγκρούσεις είναι σπάνιες έχουμε μεγαλύτερη απόδοση. Αν οι συγκρούσεις είναι συχνές, το overhead του abort & restart είναι μεγαλύτερο.

63 Θεματολόγιο Φαντάσματα Κλείδωμα δέντρων Κλείδωμα σε διαφορετικά επίπεδα διακριτότητας Πώς τα βάζω όλα μαζί Αισιόδοξος έλεγχος ταυτοχρονισμού Έλεγχος ταυτοχρονισμού με χρονόσημα Έλεγχος ταυτοχρονισμού με πολλαπλές εκδόσεις Δοσοληψίες και SQL

64 Ορολογία Χρονόσημο δοσοληψίας TS(T): η χρονική στιγμή που ξεκινά η δοσοληψία Τ Χρονόσημο ανάγνωσης αντικειμένου RTS(O): η χρονική στιγμή της τελευταίας ανάγνωσης του αντικειμένου Ο (ασχέτως δοσοληψίας) Χρονόσημο εγγραφής αντικειμένου WTS(O): η χρονική στιγμή της τελευταίας εγγραφής του αντικειμένου Ο (ασχέτως δοσοληψίας)

65 Κεντρική Ιδέα Αν η Τi ξεκινά ΠΡΙΝ την Τj, όλες οι συγκρούσεις πράξεων μεταξύ Τi και Τj, πρέπει να έχουν την πράξη της Τi (έστω αi) ΠΡΙΝ την πράξη της Τj (έστω αj) ΤiΤiΤjΤj  action ai,aj If TS(Ti) < TS(Tj),

66 Κεντρική Ιδέα Αντί να συγκρίνω δοσοληψίες, θεωρώ ότι η Ti διαβάζει/γράφει το αντικείμενο Ο Κάθε φορά, μια δοσοληψία Tj συγκρίνει το TS(Tj) με τα χρονόσημα των αντικειμένων ΤiΤiΤjΤj  action aj XX(O) < TS(Tj) If TS(Ti) < TS(Tj), Ο XX: WTS, ή RTS

67 Tj θέλει να κάνει read(O) Αν WTS(O) > TS(Tj) [ήτοι, η Τj ξεκίνησε πριν γραφτεί το O], abort Tj & restart με νέο μεγαλύτερο TS. Αν WTS(O) < TS(Tj), επέτρεψε στην Τj να διαβάσει και RTS(O) := max(RTS(O),TS(Tj)) ΤiΤiΤjΤj  action aj XX(O) < TS(Tj) TS(Ti) < TS(Tj) Ο Overhead!

68 Tj θέλει να κάνει write(O) Αν RTS(O) > TS(Tj) [ήτοι, η Τj ξεκίνησε πριν διαβαστεί το O], abort & restart Tj. Αν WTS(O) > TS(Tj), ΜΗΝ ΕΚΤΕΛΕΣΕΙΣ ΤΟ write(O), και συνέχισε την Τj με την επόμενη εντολή (Thomas Write Rule) Αλλιώς, επέτρεψε το write(O) ΤiΤiΤjΤj  action aj XX(O) < TS(Tj) TS(Ti) < TS(Tj) Ο

69 Thomas write rule Αν WTS(O) > TS(Tj) σημαίνει ότι η Τj ξεκίνησε ΠΡΙΝ από τη δοσοληψία που έγραψε το Ο (έστω Τ). Έτσι, η εγγραφή της Τj δεν έχει καμιά αξία (σε ένα σειριακό πρόγραμμα, η Τ θα ξαναέγραφε πάνω στην τιμή της Τj) Thomas Write Rule: Μπορούμε να αγνοήσουμε με ασφάλεια καθυστερημένες εγγραφές! Tj T R(A) W(A) Commit W(A) Commit ΤjΤjΤ Ο Ο

70 ΠΡΟΣΟΧΗ Πρέπει η Τ να έχει κάνει COMMIT Το παράδειγμα του βιβλίου είναι παραπλανητικό: αντί για Τj και Τ έχει Τ1 και Τ2. Αυτό που αγνοείται είναι το W(A) της Τ1! T1 T2 R(A) W(A) Commit W(A) Commit

71 Θεματολόγιο Φαντάσματα Κλείδωμα δέντρων Κλείδωμα σε διαφορετικά επίπεδα διακριτότητας Πώς τα βάζω όλα μαζί Αισιόδοξος έλεγχος ταυτοχρονισμού Έλεγχος ταυτοχρονισμού με χρονόσημα Έλεγχος ταυτοχρονισμού με πολλαπλές εκδόσεις Δοσοληψίες και SQL Διαφάνειες ενότητας: Ramakrishnan & Gehrke

Έλεγχος ταυτοχρονισμού με πολλαπλές εκδόσεις Ιδέα: Κάθε δοσοληψία που γράφει ένα αντικείμενο Ο, κατασκευάζει μια ιδιωτική της κόπια του Ο που αποθηκεύεται σε μια “Version pool” O O’ O’’ MAIN SEGMENT (Τρέχουσες versions της DB) VERSION POOL (παλαιότερες εκδόσεις μπορεί να είναι χρήσιμες για άλλες δοσοληψίες).

Έλεγχος ταυτοχρονισμού με πολλαπλές εκδόσεις Κάθε δοσοληψία έχει χρονόσημο TS τη στιγμή εκκίνησής της Κάθε version ενός αντικειμένου έχει WTS το χρονόσημο της δοσοληψίας που την έγραψε και RTS το χρονόσημο της δοσοληψίας που τη διάβασε τελευταία. Οι versions του ιδίου αντικειμένου συνδέονται με pointers σε μια λίστα.

Ανάγνωση Για να διαβάσει μια δοσοληψία Τ: Βρίσκει την τελευταία version με WTS < TS(T). (Αν δεν της κάνει η τρέχουσα version ψάχνει για προηγούμενες) Αν υποθέσουμε ότι για κάθε αντικείμενο υπάρχει και μια version οι δοσοληψίες που διαβάζουν μόνο (χωρίς να γράφουν ποτέ) δεν αποτυγχάνουν ποτέ. T old new WTS timeline

Εγγραφή Για να γράψει μια δοσοληψία Τ: Βρίσκει τη νεότερη version V τ.ω. WTS < TS(T). Αν RTS(V) < TS(T), T κάνει μια κόπια CV του V, με WTS(CV) = RTS(CV) = TS(T) (η εγγραφή αναμένει μέχρι το commit της Τ - οι άλλες δοσοληψίες δεν μπορούν να δουν την version CV) Αλλιώς, abort & restart με νέο TS. T old new WTS CV V RTS(V)

Εγγραφή Αν RTS(V) η Τ μπορεί να γράψει [το πολύ πολύ να κάνει overwrite ότι θα έγραφε η Τ’] Αν RTS(V) > TS(T) προφανώς κάποια Τ’ διάβασε αφού ξεκίνησε η Τ => κάποια πρέπει να κάνει abort & επιλέγουμε την Τ T old new WTS CV V RTS(V)

77 Θεματολόγιο Φαντάσματα Κλείδωμα δέντρων Κλείδωμα σε διαφορετικά επίπεδα διακριτότητας Πώς τα βάζω όλα μαζί Αισιόδοξος έλεγχος ταυτοχρονισμού Έλεγχος ταυτοχρονισμού με χρονόσημα Έλεγχος ταυτοχρονισμού με πολλαπλές εκδόσεις Δοσοληψίες και SQL

78 Δοσοληψίες και SQL Στην SQL-92 κάθε δοσοληψία έχει: Μέθοδο πρόσβασης: READ ONLY vs. READ WRITE Ένα από 4 επιτρεπτά επίπεδα απομόνωσης: READ UNCOMMITTED READ COMMITTED REPEATABLE READ SERIALIZABLE Παράδειγμα χρήσης: SET ISOLATION LEVEL SERIALIZABLE READ WRITE

79 Δοσοληψίες και SQL READ UNCOMMITTED : Δεν υποστηρίζει κλειδώματα. Επιτρέπεται μόνο σε READ ONLY δοσοληψίες READ COMMITTED : Κρατά X-locks για writes, και τα ελευθερώνει στο ΕΟΤ Κρατά S-locks για reads, και τα ελευθερώνει αμέσως Δεν έχει πρόβλημα με dirty reads (W-R συγκρούσεις), αλλά έχει πρόβλημα σε unrepeatable reads (R-W συγκρούσεις)

80 Δοσοληψίες και SQL RΕPEATABLE READ : Διαβάζει μόνο ότι προκύπτει από committed δοσοληψίες Ελευθερώνει locks στο τέλος (S-locks & X-locks) Ευάλωτη σε φαντάσματα SERIALIZABLE : Αυστηρό 2PL Ανεπηρέαστη από φαντάσματα

81 SQL-92 Όχι Serializable ΊσωςΌχι Repeatable Reads Ίσως ΌχιRead Committed Ίσως Read Uncommitted Πρόβλημα φαντάσματος Μη επαναλαμ- βανόμενη ανάγνωση Dirty Read Επίπεδο

82 Σύμφωνα με το βιβλίο … IBM DB2, Informix, Sybase, MS SQL Server: Strict 2PL (ή πιο χαλαρό πρωτόκολλο αν δεν ζητηθεί SERIALIZABLE isolation level) Oracle 8: multiversion concurrency control MS SQL Server: επιπλέον, επιτρέπει και optimistic concurrency control Ramakrishnan & Gehrke

83 Για εμβάθυνση, εμπέδωση και επέκταση... Hal Berenson, Philip A. Bernstein, Jim Gray, Jim Melton, Elizabeth J. O'Neil, Patrick E. O'Neil: A Critique of ANSI SQL Isolation Levels. SIGMOD Conference 1995