Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 1 Λογικός Σχεδιασμός Σχεσιακών Σχημάτων.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 1 Λογικός Σχεδιασμός Σχεσιακών Σχημάτων."— Μεταγράφημα παρουσίασης:

1 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 1 Λογικός Σχεδιασμός Σχεσιακών Σχημάτων

2 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 2 Εισαγωγή Θα εξετάσουμε πότε ένα σχεσιακό σχήμα για μια βάση δεδομένων είναι «καλό» Γενικές Οδηγίες Η Μέθοδος της Αποσύνθεσης Επιθυμητές Ιδιότητες της Αποσύνθεσης Συνένωση Άνευ Απωλειών Διατήρηση Εξαρτήσεων Αποφυγή Επανάληψης Πληροφορίας

3 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 3 Σχεδιασμός Σχεσιακών Σχημάτων Σχεδιασμός καλών σχεσιακών σχημάτων Μη τυπικές - γενικές κατευθύνσεις Θεωρία κανονικών μορφών που θα βασίζεται στις συναρτησιακές εξαρτήσεις

4 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 4 Σχεδιασμός Σχεσιακών Σχημάτων Γενικές Κατευθύνσεις 1. Σημασιολογία 2. Ελάττωση πλεονασμού 3. Ελάττωση τιμών null 4. Μη πλασματικές πλειάδες

5 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 5 Γενικές Κατευθύνσεις 1. Σημασιολογία Ταινία Τίτλος Έτος Διάρκεια Είδος Παίζει Όνομα Τίτλος Έτος Ηθοποιός Όνομα Διεύθυνση Έτος-Γέννησης Εύκολη η εξήγηση της σημασίας του Αποφυγή συνδυασμού γνωρισμάτων από πολλές οντότητες και συσχετίσεις στην ίδια σχέση

6 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 6 Γενικές Κατευθύνσεις 2. Πλεονασμός (επανάληψη πληροφορίας) Ταινία Τίτλος Έτος Διάρκεια Είδος Όνομα-Ηθοποιού Εισαγωγή Για την εισαγωγή μιας νέας ταινίας πρέπει να εισάγουμε τουλάχιστον έναν ηθοποιό (τιμή null;) Για την εισαγωγή ενός ηθοποιού στην ταινία πρέπει να επαναλάβουμε τα γνωρίσματα της ταινίας

7 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 7 Γενικές Κατευθύνσεις Ταινία Τίτλος Έτος Διάρκεια Είδος Όνομα-Ηθοποιού Διαγραφή Τι γίνεται αν διαγράψουμε και τον τελευταίο ηθοποιό Διαγραφή μιας ταινίας;

8 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 8 Γενικές Κατευθύνσεις Ταινία Τίτλος Έτος Διάρκεια Είδος Όνομα-Ηθοποιού Τροποποίηση Τι γίνεται αν θελήσουμε να τροποποιήσουμε τη διάρκεια μιας ταινίας;

9 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 9 Γενικές Κατευθύνσεις 3. Αποφυγή τιμών null Ηθοποιός Όνομα Διεύθυνση Έτος-Γέννησης Σύζυγος-Ηθοποιού Ηθοποιός Ζευγάρι-Ηθοποιών Όνομα Σύζυγος-Ηθοποιού Όνομα Διεύθυνση Έτος-Γέννησης

10 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 10 Γενικές Κατευθύνσεις 4. Αποφυγή δημιουργίας πλασματικών πλειάδων Τίτλος Έτος Διάρκεια Είδος Όνομα-Ηθοποιού Τίτλος Έτος Διάρκεια Είδος Τίτλος Όνομα-Ηθοποιού Ταινία Παίζει (αδυναμία αναπαράστασης συγκεκριμένης πληροφορίας) Χάνουμε πληροφορία δεν μπορούμε να βρούμε ποιος ηθοποιός σε ποια ταινία

11 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 11 Αλγόριθμος Σχεδιασμού Αλγόριθμος σχεδιασμού Αρχικά ένα καθολικό σχήμα σχέσης που περιέχει όλα τα γνωρίσματα Προσδιορισμός των συναρτησιακών εξαρτήσεων Διάσπαση σε ένα σύνολο από σχήματα που ικανοποιούν κάποιες ιδιότητες Αποσύνθεση (decomposition) Ένας γενικός (θεωρητικός) τρόπος κατασκευής του σχήματος

12 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 12 Αποσύνθεση R = {Τίτλος, Έτος, Διάρκεια, Είδος, Όνομα-Ηθοποιού, Διεύθυνση, Έτος-Γέννησης} Τίτλος Έτος  Διάρκεια Τίτλος Έτος  Είδος Όνομα Ηθοποιού  Διεύθυνση Όνομα-Ηθοποιού  Έτος Γέννησης Παράδειγμα R 1 = {Τίτλος, Έτος, Διάρκεια, Είδος} R 2 = {Τίτλος, Έτος, Όνομα- Ηθοποιού, Διεύθυνση, Έτος- Γέννησης} Πως μπορούμε να πάρουμε την αρχική σχέση; Μπορούμε να διασπάσουμε την R 2 με τον ίδιο τρόπο.

13 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 13 Αλγόριθμος Σχεδιασμού Αρχικά ένα καθολικό σχήμα R = {A 1, A 2, …, A n } αποσύνθεση (decomposition) σε δύο σχήματα R 1 = {B 1, B 2, …, B m } και R 2 = {C 1, C 2, …, C k } τέτοια ώστε 1. {A 1, A 2, …, A n } = {B 1, B 2, …, B m }  {C 1, C 2, …, C k } (διατήρηση γνωρισμάτων)γνωρίσματα 2. Οι πλειάδες της r 1 (R 1 ) είναι η προβολή των πλειάδων της r(R) στα {B 1, B 2, …, B m } πλειάδες 3. Οι πλειάδες της r 2 (R 2 ) είναι η προβολή των πλειάδων της r(R) στα {C 1, C 2, …, C k } πλειάδες Τυπικός ορισμός

14 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 14 Συνενώσεις Άνευ Απωλειών Α B C 1 2 3 4 2 5 R(r) A C 1 3 4 5 B C 2 3 2 5 R 1  R 2 = C Έστω το σχήμα R(A, B, C) αποσύνθεση σε R 1 (A, C) και R 2 (B, C) Τι γίνεται με τα στιγμιότυπα (σχέσεις) που ανήκουν στο R, συμβολισμός R(r) r 1 (R 1 ) r 2 (R 2 ) Μπορούμε να πάρουμε το αρχικό στιγμιότυπο; Φυσική συνένωση r 1 * r 2

15 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 15 Συνενώσεις Άνευ Απωλειών Α B C 1 2 3 4 2 5 r(R) A B 1 2 4 2 r 1 (R 1 ) B C 2 3 2 5 Έστω το σχήμα R(A, B, C) αποσύνθεση σε R 1 (A, B) και R 2 (B, C) Τι γίνεται με τα στιγμιότυπα (σχέσεις) που ανήκουν στο R, συμβολισμός r(R) r 2 (R 2 ) R 1  R 2 = Β Μπορούμε να πάρουμε το αρχικό στιγμιότυπο; Φυσική συνένωση r 1 * r 2

16 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 16 Αποσύνθεση Έστω ένα σχεσιακό σχήμα R. Ένα σύνολο από σχεσιακά σχήματα {R 1, R 2,.., R n } είναι μια αποσύνθεση του R αν R = R 1,  R 2, …,  R n Δηλαδή,  i = 1,.., n R i  R Έστω r(R) και r i = π R i (r),  i = 1,..,n r  r 1 * r 2 * … * r n γνωρίσματα στιγμιότυπα

17 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 17 Αποσύνθεση Έστω r(R) και r i = π R i (r),  i = 1,..,n ---- r  r 1 * r2 * … * r n Παράδειγμα Α B C 1 2 3 4 2 5 r A B 1 2 4 2 r1r1 r2r2 B C 2 3 2 5 r 1 * r 2 A B C 1 2 3 1 2 5 4 2 3 4 2 5 Δεν μπορούμε να πάρουμε την αρχική σχέση r από τα r 1 και r 2 Έστω το σχήμα R(A, B, C) αποσύνθεση σε R 1 (A, B) και R 2 (B, C) Τι γίνεται με τα στιγμιότυπα (σχέσεις) που ανήκουν στο R, συμβολισμός r(R) ή r

18 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 18 Επιθυμητές Ιδιότητες Αποσύνθεσης Επιθυμητές Ιδιότητες για την Αποσύνθεση 1. Συνενώσεις Άνευ Απωλειών Έστω C το σύνολο περιορισμών. Μια αποσύνθεση του R σε {R 1, R 2,.., R n } είναι μια αποσύνθεση άνευ απωλειών στη συνένωση (lossless join decomposition) αν για όλες τις σχέσεις r(R) που είναι νόμιμες στο C ισχύει r = π R 1 (r) * π R 2 (r) * … π R n (r)

19 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 19 Συνενώσεις Άνευ Απωλειών Παράδειγμα Α B C 1 2 3 4 2 5 r A B 1 2 4 2 r1r1 r2r2 B C 2 3 2 5 r 1 * r 2 A B C 1 2 3 1 2 5 4 2 3 4 2 5 A C 1 3 4 5 r’ 1 r’ 2 B C 2 3 2 5 r’ 1 * r’ 2 = ;

20 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 20 Συνενώσεις Άνευ Απωλειών Έστω R ένα σχεσιακό σχήμα και F ένα σύνολο από συναρτησιακές εξαρτήσεις στο R. Έστω R 1 και R 2 μια αποσύνθεση του R. Αν μια τουλάχιστον από τις ΣΕ R 1  R 2  R 1 ή R 1  R 2  R 2 ανήκει στο F + τότε η διάσπαση είναι χωρίς απώλειες στη συνένωση. Θεώρημα Δηλαδή τα κοινά γνωρίσματα των δύο σχημάτων είναι κλειδί για τουλάχιστον ένα από τα δύο σχήματα

21 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 21 Συνενώσεις Άνευ Απωλειών Παράδειγμα: R = {Τίτλος, Έτος, Διάρκεια, Είδος, Όνομα- Ηθοποιού, Διεύθυνση, Έτος-Γέννησης} Τίτλος Έτος  Διάρκεια Τίτλος Έτος  Είδος Όνομα Ηθοποιού  Διεύθυνση Όνομα-Ηθοποιού  Έτος Γέννησης R 1 = {Τίτλος, Έτος, Διάρκεια, Είδος} R 2 = {Τίτλος, Έτος, Όνομα- Ηθοποιού, Διεύθυνση, Έτος- Γέννησης} R 1  R 2 = {Τίτλος, Έτος}

22 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 22 Επιθυμητές Ιδιότητες Αποσύνθεσης 2. Διατήρηση Εξαρτήσεων Στόχος: Για να ελέγχουμε ότι διατηρούνται οι Σ.Ε. όταν γίνονται τροποποιήσεις σε μία από τις σχέσεις r i (R i ) να αρκεί να ελέγξουμε τι συγκεκριμένη σχέση (δηλαδή, να μη χρειάζεται να υπολογίσουμε τις αρχικές σχέσεις - αποφυγή των συνενώσεων) Επιθυμητές Ιδιότητες για την Αποσύνθεση

23 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 23 Διατήρηση Εξαρτήσεων F i περιορισμός του F στο R i είναι το σύνολο όλων των συναρτησιακών εξαρτήσεων του F + που περιέχουν μόνο γνωρίσματα του R i. Έστω F ένα σύνολο από ΣΕ στο σχήμα R και {R 1, R 2,.., R n } μια αποσύνθεση του R.

24 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 24 Διατήρηση Εξαρτήσεων Παράδειγμα: Υπολογισμός του περιορισμού του F σε ένα σχήμα Εφαρμογή 1: Έστω R(A, B, C, D), F = {A  B, B  C}. Περιορισμός του F στο S(A, C) Εφαρμογή 2: Έστω R(A, B, C, D, E), F = {A  D, B  Ε, DE  C}. Περιορισμός του F στο S(A, B, C)

25 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 25 Διατήρηση Εξαρτήσεων Η αποσύνθεση είναι μια αποσύνθεση που διατηρεί τις εξαρτήσεις (dependency preserving) αν F’ + = F + Έστω F ένα σύνολο από ΣΕ στο σχήμα R και {R 1, R 2,.., R n } μια αποσύνθεση του R. Έστω F’ = F 1  F 2...  F n

26 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 26 Διατήρηση Εξαρτήσεων Παράδειγμα: Πως δείχνουμε αν μια διάσπαση διατηρεί τις εξαρτήσεις Έστω R(A, B, C, D), F = {A  C, B  C, Β  A}. Έστω η αποσύνθεση S(A, C) και Τ(Α, Β, D)

27 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 27 Διατήρηση Εξαρτήσεων 1. Έστω R(A, B, C, D), F = {A  C, B  C, ΒD  A}. Η αποσύνθεση του R σε S(A, C) και Τ(Α, Β, D) διατηρεί τις εξαρτήσεις ; 2. Έστω R(A, B, C, D, E), F = {A  D, B  Ε, DE  C}. Η αποσύνθεση του R σε S(A, Β, C) και T(A, B, D, E) διατηρεί τις εξαρτήσεις ; Παραδείγματα

28 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 28 Σχεδιασμός Σχεσιακών Σχημάτων - Αποσύνθεση καθολικού σχήματος Επιθυμητές ιδιότητες - διατήρηση εξαρτήσεων - όχι απώλειες στη συνένωση - όχι επανάληψη πληροφορίας λόγω ΣΕ - Συνέχεια: Κανονικές Μορφές BCNF 3NF

29 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 29 Κανονικές Μορφές

30 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 30 Σχεδιασμός Σχεσιακών Σχημάτων (επανάληψη) Σχεδιασμός καλών σχεσιακών σχημάτων Μη τυπικές - γενικές κατευθύνσεις 1. Σημασιολογία 2. Ελάττωση πλεονασμού 3. Ελάττωση τιμών null 4. Μη πλασματικές πλειάδες

31 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 31 Σχεδιασμός Σχεσιακών Σχημάτων (επανάληψη) Αλγόριθμος σχεδιασμού Αρχικά ένα καθολικό σχήμα σχέσης που περιέχει όλα τα γνωρίσματα Προσδιορισμός των συναρτησιακών εξαρτήσεων Διάσπαση σε ένα σύνολο από σχήματα που ικανοποιούν κάποιες ιδιότητες Αποσύνθεση (decomposition)

32 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 32 Σχεδιασμός Σχεσιακών Σχημάτων (επανάληψη) Έστω ένα σχεσιακό σχήμα R. Ένα σύνολο από σχεσιακά σχήματα {R 1, R 2,.., R n } είναι μια αποσύνθεση του R αν R = R 1,  R 2, …,  R n Δηλαδή,  i = 1,..,n R i  R Έστω r(R) και r i = π R i (r),  i = 1,..,n r  r 1 * r2 * … * r n πλειάδες γνωρίσματα

33 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 33 Σχεδιασμός Σχεσιακών Σχημάτων (επανάληψη) Επιθυμητές Ιδιότητες Αποσύνθεσης 2. Διατήρηση Εξαρτήσεων Στόχος: Έλεγχος διατήρησης εξαρτήσεων όταν γίνονται τροποποιήσεις χωρίς να υπολογίζουμε τις αρχικές σχέσεις (αποφυγή των συνενώσεων) F’ = F1  F2...  Fn, πρέπει F’ + = F + 1. Συνενώσεις Άνευ Απωλειών Η φυσική συνένωση των σχέσεων που προκύπτουν μας δίνει ακριβώς την αρχική σχέση (χωρίς επιπρόσθετες πλειάδες): r = π R1 (r) * π R2 (r) * … π Rn (r) R1  R2  R1 ή R1  R2  R2 ανήκει στο F +, δηλαδή τα κοινά γνωρίσματα των δύο σχημάτων είναι κλειδί για τουλάχιστον ένα από τα δύο 3. Αποφυγή Επανάληψης Πληροφορίας, πως; Κανονικές Μορφές

34 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 34 Επιθυμητές Ιδιότητες Αποσύνθεσης (επανάληψη) Θα δούμε πάλι τη διατήρηση εξαρτήσεων: Στόχος: Για να ελέγχουμε ότι διατηρούνται οι ΣΕ όταν γίνονται τροποποιήσεις σε μία από τις σχέσεις r i (R i ) να αρκεί να ελέγξουμε τι συγκεκριμένη σχέση (δηλαδή, να μη χρειάζεται να υπολογίσουμε τις αρχικές σχέσεις - αποφυγή των συνενώσεων)

35 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 35 Διατήρηση Εξαρτήσεων (επανάληψη) F i περιορισμός του F στο R i : το σύνολο όλων των συναρτησιακών εξαρτήσεων του F + που περιέχουν μόνο γνωρίσματα του R i. Έστω F ένα σύνολο από ΣΕ στο σχήμα R και {R 1, R 2,.., R n } μια αποσύνθεση του R.

36 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 36 Διατήρηση Εξαρτήσεων 1. Έστω R(A, B, C, D), F = {A  C, B  C, ΒD  A} και η αποσύνθεση του R σε R 1 (A, C) και R 2 (Α, Β, D). Θα υπολογίσουμε τα F 1 και F 2 2. Έστω R(A, B, C, D, E), F = {A  D, B  Ε, DE  C} και η αποσύνθεση του R σε R 1 (A, Β, C) και R 2 (A, B, D, E). Θα υπολογίσουμε τα F 1 και F 2 Παραδείγματα

37 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 37 Διατήρηση Εξαρτήσεων (επανάληψη) Η αποσύνθεση είναι μια αποσύνθεση που διατηρεί τις εξαρτήσεις (dependency preserving) αν F’ + = F + Έστω F ένα σύνολο από ΣΕ στο σχήμα R και {R 1, R 2,.., R n } μια αποσύνθεση του R. Έστω F’ = F 1  F 2...  F n

38 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 38 Διατήρηση Εξαρτήσεων 1. Έστω R(A, B, C, D), F = {A  C, B  C, ΒD  A} και η αποσύνθεση του R σε R 1 (A, C) και R 2 (Α, Β, D). (α) Διατηρεί τις εξαρτήσεις; (β) Είναι χωρίς απώλειες; Παράδειγμα

39 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 39 Κανονικές Μορφές: Εισαγωγή  Στόχος: Δοσμένου ενός σχήματος, αν είναι «καλό» ή χρειάζεται περαιτέρω διάσπαση. Πως; Κανονικές μορφές.  Ξέρουμε ότι αν ένα σχήμα είναι σε κάποια Κανονική Μορφή δεν υπάρχουν συγκεκριμένα προβλήματα  Με φθίνουσα σειρά (από την πιο περιοριστική στη λιγότερο περιοριστική) BCNF 3NF 2NF 1NF  Βασίζεται σε Σ.Ε., οι Σ.Ε. έχουν σχέση με την επανάληψη πληροφορίας

40 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 40 Κανονικές Μορφές: Εισαγωγή Πλεονασμός (επανάληψη πληροφορίας) Ταινία Τίτλος Έτος Διάρκεια Είδος Όνομα-Ηθοποιού Τι συμβαίνει με το (πρωτεύον) κλειδί και τις συναρτησιακές εξαρτήσεις;

41 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 41 Boyce-Codd Κανονική Μορφή Ένα σχεσιακό σχήμα R είναι σε Κανονική Μορφή Boyce-Codd ( BCNF) σε σχέση με ένα σύνολο F συναρτησιακών εξαρτήσεων αν για όλες τις ΣΕ στο F + της μορφής X  Y ισχύει τουλάχιστον ένα από τα παρακάτω: -- X  Y είναι μια τετριμμένη ΣΕ ή -- X είναι υπερκλειδί του σχήματος R Δηλαδή το αριστερό μέρος κάθε μη τετριμμένης ΣΕ πρέπει να περιέχει ένα κλειδί Το σχήμα μιας ΒΔ είναι σε BCNF αν το σχήμα κάθε σχέσης της είναι σε BCNF.

42 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 42 Boyce-Codd Κανονική Μορφή Παράδειγμα 1 Ταινία (Τίτλος, Έτος, Διάρκεια, Είδος, Όνομα-Ηθοποιού) Η σχέση Ταινία δεν είναι σε BCNF (υποψήφιο) κλειδί: {Τίτλος, Έτος, Όνομα-Ηθοποιού} Για παράδειγμα η ΣΕ Τίτλος Έτος  Διάρκεια

43 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 43 Boyce-Codd Κανονική Μορφή Παράδειγμα 2 Ταινία2 (Τίτλος, Έτος, Διάρκεια, Είδος) Η σχέση Ταινία2 είναι σε BCNF Παράδειγμα 3 Οποιαδήποτε σχέση με δύο γνωρίσματα είναι σε BCNF

44 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 44 Boyce-Codd Κανονική Μορφή Αλγόριθμος Αποσύνθεσης σε BCNF Βρες μια μη τετριμμένη ΣΕ που παραβιάζει τον BCNF ορισμό, έστω X  Y και Χ  Υ =  Αποσύνθεση του αρχικού σχήματος R σε δύο σχήματα R 1 με γνωρίσματα Χ  Y R 2 με γνωρίσματα R - Y Ευριστικός: στα δεξιά όσο το δυνατόν περισσότερα γνωρίσματα Αποσύνθεση χωρίς απώλειες;

45 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 45 Boyce-Codd Κανονική Μορφή Παράδειγμα 1 Ταινία (Τίτλος, Έτος, Διάρκεια, Είδος, Όνομα-Ηθοποιού) Τίτλος Έτος  Διάρκεια Είδος Ταινία1(Τίτλος, Έτος, Διάρκεια, Είδος) Ταινία2(Τίτλος, Έτος, Όνομα-Ηθοποιού)

46 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 46 Boyce-Codd Κανονική Μορφή Παράδειγμα 2 Ταινία-Εταιρεία1 (Εταιρεία-Παραγωγής, Διεύθυνση-Εταιρείας) Τίτλος Έτος  Εταιρεία-Παραγωγής Εταιρεία-Παραγωγής  Διεύθυνση-Εταιρείας Πρόβλημα: υπάρχει μια μεταβατική εξάρτηση Τίτλος Έτος  Διεύθυνση-Εταιρείας Ταινία-Εταιρεία2 (Τίτλος, Έτος, Διάρκεια, Είδος, Εταιρεία-Παραγωγής) Ταινία-Εταιρεία (Τίτλος, Έτος, Διάρκεια, Είδος, Εταιρεία-Παραγωγής, Διεύθυνση-Εταιρείας)

47 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 47 Boyce-Codd Κανονική Μορφή Μπορεί να χρειαστεί παραπάνω από μία αποσύνθεση Αποσύνθεση του αρχικού σχήματος R σε δύο σχήματα - R 1 με γνωρίσματα Χ  Y και R 2 με γνωρίσματα R - Y η R 2 μπορεί να μην είναι σε BCNF

48 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 48 Boyce-Codd Κανονική Μορφή Δεν είναι πάντα δυνατή η αποσύνθεση σε μια BCNF που να διατηρεί τις εξαρτήσεις Παράδειγμα Έστω η σχέση Παίζει(Έργο, Κινηματογράφος, Πόλη) με τους περιορισμούς ότι (i) δεν υπάρχουν κινηματογράφοι με το ίδιο όνομα, (ii) κάθε κινηματογράφος έχει πολλές αίθουσες (παίζει πολλά έργα) και (iii) κάθε έργο παίζεται μόνο σε ένα κινηματογράφο σε κάθε πόλη Κινηματογράφος  Πόλη Έργο Πόλη  Κινηματογράφος Κλειδιά; {Έργο, Πόλη} {Κινηματογράφος, Έργο}

49 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 49 Boyce-Codd Κανονική Μορφή Παίζει(Έργο, Κινηματογράφος, Πόλη) Κινηματογράφος  Πόλη Έργο Πόλη  Κινηματογράφος Κλειδιά {Έργο, Πόλη} {Κινηματογράφος, Έργο} Αποσύνθεση σε: R 1 {Κινηματογράφος, Πόλη} και R 2 {Κινηματογράφος, Έργο} Κινηματογράφος Έργο Odeon-ΑΒΑΝΑΜέγας Αλέξαντρος Village Center Μαρούσι Μέγας Αλέξαντρος ΚινηματογράφοςΠόλη Odeon-ABANA Αθήνα Village Center Μαρούσι Αθήνα Δε μπορώ κοιτάζοντας μόνο την R2 να δω ότι η εισαγωγή της δεύτερης πλειάδας παραβιάζει μια ΣΕ

50 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 50 Τρίτη Κανονική Μορφή Ένα σχεσιακό σχήμα R είναι σε τρίτη κανονική μορφή (3ΝF) σε σχέση με ένα σύνολο F συναρτησιακών εξαρτήσεων αν για όλες τις ΣΕ στο F + της μορφής X  Y ισχύει τουλάχιστον ένα από τα παρακάτω: -- X  Y είναι μια τετριμμένη ΣΕ ή -- X είναι υπερκλειδί του σχήματος R -- κάθε γνώρισμα Α του Υ - Χ περιέχεται σε κάποιο υποψήφιο κλειδί BCNF πιο περιοριστική -- αν σε BCNF  3NF

51 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 51 Τρίτη Κανονική Μορφή Παίζει(Έργο, Κινηματογράφος, Πόλη) Κινηματογράφος  Πόλη Έργο Πόλη  Κινηματογράφος Κλειδιά {Έργο, Πόλη} {Κινηματογράφος, Έργο} Η σχέση είναι σε 3NF Είδος ΣΕ: μοναδικά αντικείμενα ή με βάση πρακτικές Παράδειγμα

52 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 52 Τρίτη Κανονική Μορφή Αλγόριθμος Αποσύνθεσης σε 3NF Υπολόγισε το ελάχιστο κάλυμμα F c του F Για κάθε α.μ. Χ μιας συναρτησιακής εξάρτισης του F c έστω Y το σύνολο όλων των γνωρισμάτων Α i που εμφανίζονται στο δ.μ. μιας ΣΕ του F c Χ  Α i νέα σχέση με γνωρίσματα Χ  Y Βάλε όλα τα γνωρίσματα που περισσεύουν (αν υπάρχουν) σε ένα νέο σχήμα

53 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 53 Τρίτη Κανονική Μορφή Αλγόριθμος Αποσύνθεσης σε 3NF Απώλειες στη συνένωση; Διατήρηση εξαρτήσεων;

54 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 54 Τρίτη Κανονική Μορφή Παράδειγμα Τραπεζίτης(Όνομα-Υποκαταστήματος, Όνομα-Πελάτη, Όνομα-Τραπεζίτη, Αριθμός Γραφείου) Όνομα-Τραπεζίτη  Όνομα-Υποκαταστήματος Αριθμός-Γραφείου Όνομα-Πελάτη Όνομα-Υποκαταστήματος  Όνομα-Τραπεζίτη Κλειδιά {Όνομα-Πελάτη, Όνομα-Υποκαταστήματος} 3NF; Τραπεζίτης1(Όνομα-Τραπεζίτη, Όνομα-Υποκαταστήματος Αριθμός-Γραφείου) Τραπεζίτης2(Όνομα-Πελάτη, Όνομα-Υποκαταστήματος, Όνομα-Τραπεζίτη) BCNF;

55 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 55 Σχεδιασμός Σχεσιακών Σχημάτων -Επανάληψη Κανονική Μορφή Boyce-Codd Ένα σχεσιακό σχήμα R είναι σε BCNF σε σχέση με ένα σύνολο F συναρτησιακών εξαρτήσεων αν για όλες τις ΣΕ στο F + της μορφής X  Y ισχύει τουλάχιστον ένα από τα παρακάτω: -- X  Y είναι μια τετριμμένη ΣΕ ή -- X είναι υπερκλειδί του σχήματος R Τρίτη Κανονική Μορφή -- κάθε γνώρισμα Α του Υ - Χ περιέχεται σε κάποιο υποψήφιο κλειδί

56 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 56 Σχεδιασμός Σχεσιακών Σχημάτων -Επανάληψη Αποφυγή επανάληψης πληροφορίας ναι όχι πάντα Αποσύνθεση χωρίς απώλειες στη συνένωση ναι ναι Διατήρηση εξαρτήσεων όχι πάντα ναι BCNF 3NF

57 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 57 2NF Κανονικές Μορφές 2NF ΟΛΕΣ οι ΣΧΕΣΕΙΣ 1NF 3NF BCNF 4NF 5NF 2NF

58 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 58 Πρώτη Κανονική Μορφή 1NF (ιστορικοί λόγοι, κάθε γνώρισμα παίρνει ατομικές τιμές)

59 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 59 Πλειότιμες Εξαρτήσεις Υπάρχει επανάληψη πληροφορίας που δεν μπορεί να εκφραστεί με απλές ΣΕ

60 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 60 Πλειότιμες Εξαρτήσεις Προκύπτουν όταν δυο γνωρίσματα είναι ανεξάρτητα το ένα από το άλλο Παράδειγμα Ηθοποιός(Όνομα, Οδός, Πόλη, Τίτλος, Έτος) Yποθέτουμε ότι για κάθε ηθοποιό είναι πιθανόν να υπάρχουν πολλές διευθύνσεις Κανένα από τα 5 γνωρίσματα δεν εξαρτάται συναρτησιακά από τα άλλα τέσσερα  δεν υπάρχουν μη μη τετριμμένες εξαρτήσεις  κλειδί ? π.χ., Όνομα Οδός Τίτλος Έτος  Πόλη δεν ισχύει

61 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 61 Πλειότιμες Εξαρτήσεις Παράδειγμα (συνέχεια) Ηθοποιός(Όνομα, Οδός, Πόλη, Τίτλος, Έτος) Το σχήμα είναι σε BCNF αλλά υπάρχει επανάληψη πληροφορίας που δεν οφείλεται όμως σε συναρτησιακές εξαρτήσεις Όλες οι εξαρτήσεις είναι τετριμμένες

62 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 62 Πλειότιμες Εξαρτήσεις Για κάθε ζεύγος πλειάδων t 1 και t 2 της σχέσης R που συμφωνούν σε όλα τα γνωρίσματα του X μπορούμε να βρούμε στο R δυο πλειάδες t 3 και t 4 τέτοιες ώστε και οι δυo συμφωνούν με τις t 1 και t 2 στο X: t 1 [X] = t 2 [X] = t3[X] = t 4 [X] η t 3 συμφωνεί με την t 1 στο Υ: t3[Y] = t 1 [Y] η t 3 συμφωνεί με την t 2 στο R - X - Y: t3[R- X - Y] = t2[R - X - Y] η t 4 συμφωνεί με την t 1 στο R - X - Y: t4[R- X - Y] = t 1 [R - X - Y] η t 4 συμφωνεί με την t 2 στο Υ: t4[Y] = t2[Y] X Y

63 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 63 Πλειότιμες Εξαρτήσεις A 1 A 2 … A n B 1 B 2 … B m A 1 A 2 … A n B 1 B 2 … B m C 1 C 2 … C k a 1 a 2 … a n b 1 b 2 … b m c 1 c 2 … c k a 1 a 2 … a n b’ 1 b’ 2 … b’ m c’ 1 c’ 2 … c’ k t1t1 t2t2 t3t3 t4t4 Χ ΥR – X - Y

64 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 64 Πλειότιμες Εξαρτήσεις Παράδειγμα Ηθοποιός(Όνομα, Οδός, Πόλη, Τίτλος, Έτος) Όνομα Οδός Πόλη Όνομα Οδός Πόλη Τίτλος Έτος C. Fisher 123 Mapple Str Hollywood Star Wars 1977 C. Fisher 5 Locust Ln Malibu Empire Strikes Back 1980 ?

65 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 65  Η διαδικασία Κανονικοποίησης έχει και μειονεκτήματα: oΔεν είναι δημιουργική -- με στόχο τα κριτήρια που αναφέρθηκαν προηγουμένως, δεν υπάρχει τρόπος να δημιουργηθεί μια «καλή» βάση δεδομένων oΣυνήθως η κανονικοποίηση γίνεται αφού έχουμε κάποιο σχήμα (μας λέει αν είναι «καλό» ή «κακό») oΔεν προσφέρει ένα εννοιολογικό σχήμα (ασχολείται μόνο με σχέσεις και γνωρίσματα) Όμως, είναι μια ενδιαφέρουσα και πρακτικά χρήσιμη προσπάθεια να γίνουν με τυπικό και συστηματικό τρόπο πράγματα που τα κάνουμε συνήθως διαισθητικά. Σχεδιασμός Σχεσιακών Σχημάτων

66 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 66 Ένας μεγάλος αριθμός από εμπορικά εργαλεία, δοθέντων ενός συνόλου Σχημάτων Σχέσεων/Γνωρισμάτων και ενός συνόλου συναρτησιακών εξαρτήσεων δημιουργούν αυτόματα σχήματα σχέσεων σε μορφή 3NF (σπάνια πάνε σε BCNF, 4NF και 5NF) Μια άλλη χρήση τέτοιων εργαλείων είναι να ελέγχουν το επίπεδο κανονικοποίησης μιας σχέσης - γενικά, η χρήση ως ευριστικό εργαλείο επιλογής ενός σχεδιασμού έναντι κάποιου άλλου Υπάρχουν πρακτικά αποτελέσματα της θεωρίας που επιτρέπουν σε έναν σχεδιαστή να κάνει ανάλυση της μορφής: Αν μια σχέση είναι σε 3NF και κάθε υποψήφιο κλειδί αποτελείται ακριβώς από ένα γνώρισμα, τότε είναι και σε 5NF (Fagin, 1991) Σχεδιασμός Σχεσιακών Σχημάτων

67 Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 67 Σχεδιασμός Σχεσιακών Σχημάτων Η Διαδικασία Σχεδιασμού 1. Συλλογή και ανάλυση απαιτήσεων 2. Εννοιολογικός σχεδιασμός 3. Επιλογή ΣΔΒΔ 4. Απεικόνιση στο μοντέλο δεδομένων (λογικός σχεδιασμός) 5. Φυσικός σχεδιασμός 6. Υλοποίηση


Κατέβασμα ppt "Βάσεις Δεδομένων 2004-2005 Ευαγγελία Πιτουρά 1 Λογικός Σχεδιασμός Σχεσιακών Σχημάτων."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google