Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

1 Από τη διαχείριση πληροφορίας στη διαχείριση γνώσης Χ. Παπαθεοδώρου, Μ. Γεργατσούλης, Σ. Καπιδάκης Εργαστήριο Ψηφιακών Βιβλιοθηκών & Ηλεκτρονικής Δημοσίευσης.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "1 Από τη διαχείριση πληροφορίας στη διαχείριση γνώσης Χ. Παπαθεοδώρου, Μ. Γεργατσούλης, Σ. Καπιδάκης Εργαστήριο Ψηφιακών Βιβλιοθηκών & Ηλεκτρονικής Δημοσίευσης."— Μεταγράφημα παρουσίασης:

1 1 Από τη διαχείριση πληροφορίας στη διαχείριση γνώσης Χ. Παπαθεοδώρου, Μ. Γεργατσούλης, Σ. Καπιδάκης Εργαστήριο Ψηφιακών Βιβλιοθηκών & Ηλεκτρονικής Δημοσίευσης Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας, Ιόνιο Πανεπιστήμιο Μεταπτυχιακό Πρόγραμμα Σπουδών στην Ιστορική Δημογραφία Τμήμα Ιστορίας, Ιόνιο Πανεπιστήμιο

2 2 Τι είναι το DBMS;  Βάσεις δεδομένων: Ιδιαίτερα μεγάλες ολοκληρωμένες συλλογές δεδομένων.  Αφορούν μοντέλα πραγματικών οργανισμών. Καταχωρούν πληροφορία για:  Οντότητες (π.χ., φοιτητές, μαθήματα, διδάσκοντες).  Συσχετίσεις (π.χ., Ο Νίκος έχει εγγραφεί στο μάθημα Βάσεις Δεδομένων).  Το Σύστημα Διαχείρισης Βάσεων Δεδομένων (DBMS) είναι λογισμικό ειδικά σχεδιασμένο για να διευκολύνει την αποθήκευση και τη διαχείριση βάσεων δεδομένων.

3 3 Γιατί να μελετούμε Βάσεις Δεδομένων;  Μετακίνηση από τον υπολογισμό στην πληροφορία  Συλλογές δεδομένων με συνεχώς αυξανόμενη ποικιλομορφία και όγκο.  Ψηφιακές Βιβλιοθήκες, αλληλεπιδραστικό βίντεο. ?

4 4 Μοντέλα Δεδομένων  Μοντέλο δεδομένων είναι μια συλλογή από έννοιες για την περιγραφή των δεδομένων.  Το σχήμα είναι η περιγραφή μιας συγκεκριμένης συλλογής δεδομένων, με τη χρήση δοσμένου μοντέλου δεδομένων.  Το σχεσιακό μοντέλο δεδομένων είναι το πιο διαδεδομένο μοντέλο σήμερα.  Βασική έννοια: σχέση, (ουσιαστικά είναι ένας πίνακας με γραμμές και στήλες).  Κάθε σχέση έχει ένα σχήμα το οποίο περιγράφει τις στήλες ή πεδία ή γνωρίσματα ή χαρακτηριστικά.

5 5 Παράδειγμα  Σχήμα:  Φοιτητής (ΑΜ:string, Όνομα:string, Επώνυμο:string, Ηλικία: integer) ΑΜΌνομαΕπώνυμ ο Ηλικία 53123ΝίκοςΝικολάου ΠέτροςΓεωργίου ΜαρίαΠέτρου ΣοφίαΑνδρέου ΓιώργοςΑντωνίου20

6 6 Επίπεδα Αφαίρεσης  Πολλές όψεις (εξωτερικό σχήμα), ένα ιδεατό (λογικό) σχήμα και ένα φυσικό σχήμα.  Οι όψεις περιγράφουν πως βλέπουν τα δεδομένα οι χρήστες.  Το ιδεατό σχήμα ορίζει τη λογική δομή.  Το φυσικό σχήμα περιγράφει τα αρχεία και τα ευρετήρια που χρησιμοποιούνται. * Τα σχήματα ορίζονται με τη βοήθεια της DDL, * Τα δεδομένα τροποποιούνται / ερωτούνται με τη βοήθεια της DML. Φυσικό Σχήμα Ιδεατό Σχήμα Όψεις 1 Όψεις 2 Όψεις 3

7 7 Παράδειγμα: Βάση Δεδομένων Πανεπιστημίου  Ιδεατό Σχήμα:  φοιτητές(ΑΜ: string, Όνομα: string, Επώνυμο: string, Ηλικία: integer )  μαθήματα(ΚΜ: string, Ονομασία:string, Κατηγορία:integer)  εγγραφές(ΑΜ:string, ΚΜ:string, Βαθμός:integer)  Φυσικό Σχήμα:  Σχέσεις αποθηκευμένες σαν μη ταξινομημένα αρχεία.  Ευρετήριο πάνω στη πρώτη στήλη του πίνακα φοιτητές.  Εξωτερικό Σχήμα (Όψη):  εγγεγραμμένοι(ΚΜ:string, Πλήθος:integer)ΚΜ:string

8 8 Τα Αιτήματα στο DBMS  Ευκολία ανάκτησης δεδομένων από τη βάση.  Ποιο είναι το ονοματεπώνυμο του φοιτητή με Αριθμό Μητρώου (ΑΜ) 12345;  Πόσοι φοιτητές έχουν εγγραφεί στο μάθημα με κωδικό C1234;  Γλώσσα αιτημάτων.  Τυπικές Γλώσσες αιτημάτων:  Σχεσιακός Λογισμός: βασίζεται στη μαθηματική λογική.  Σχεσιακή Άλγεβρα: χρήση συνόλου τελεστών.

9 9 Επισκόπηση του Σχεδιασμού ΒΔ  Ανάλυση Απαιτήσεων.  Κατανόηση-καταγραφή είδους δεδομένων, επισήμανση λειτουργιών που συμβαίνουν συχνότερα και επηρεάζουν την απόδοση του συστήματος, καταγραφή απαιτήσεων χρηστών.  Σχεδιασμός Ιδεατής ΒΔ.  Χρήση ER μοντέλου.  Σχεδιασμός της Λογικής ΒΔ.  Επιλογή DBMS (έχουν επικρατήσει τα σχεσιακά), δημιουργία λογικού σχήματος.  Τελειοποίηση του Σχήματος.  Σχεδιασμός του Φυσικού Σχήματος.  Σχεδιασμός της Πολιτικής Ασφάλειας

10 10 Επισκόπηση Σχεδιασμού Ιδεατής ΒΔ  Σχεδιασμός Ιδεατής ΒΔ : (σ’ αυτή τη φάση χρησιμοποιείται το Μοντέλο Οντότητας- Συσχέτισης ή ER Μοντέλο.)  Ποιες είναι οι οντότητες και οι συσχετίσεις;  Ποιες πληροφορίες σχετικές με αυτές τις οντότητες και τις συσχετίσεις πρέπει να αποθηκεύσουμε στη βάση δεδομένων;  Ποιοι είναι οι περιορισμοί ακεραιότητας και οι επιχειρηματικοί κανόνες λειτουργίας που ισχύουν;  Ένα `σχήμα’ βάσης δεδομένων στο ER Μοντέλο μπορεί να παρασταθεί γραφικά (ER διαγράμματα).  Ένα ER διάγραμμα μπορεί να απεικονιστεί σε ένα σχεσιακό σχήμα.

11 11 Το ER Μοντέλο  Οντότητα: Αντικείμενο του πραγματικού κόσμου διακριτό από τα άλλα αντικείμενα. Μια οντότητα περιγράφεται στη ΒΔ χρησιμοποιώντας ένα σύνολο γνωρισμάτων.  Σύνολο Οντοτήτων: Συλλογή ομοειδών οντοτήτων. Π.χ., όλοι οι εργαζόμενοι (Employees).  Όλες οι οντότητες σε ένα σύνολο οντοτήτων έχουν το ίδιο σύνολο γνωρισμάτων. (Τουλάχιστον μέχρι να μιλήσουμε για ISA ιεραρχίες!)  Κάθε σύνολο οντοτήτων έχει ένα κλειδί (ελάχιστος αριθμό γνωρισμάτων που προσδιορίζουν μονοσήμαντα μια οντότητα).  Κάθε γνώρισμα έχει ένα πεδίο ορισμού. Employee s ss n name lot

12 12 Το ER Μοντέλο (Συνέχεια)  Συσχέτιση: Διασύνδεση μεταξύ δύο ή περισσοτέρων οντοτήτων. Π.χ. η Μαρία εργάζεται στο τμήμα καλλυντικών.  Σύνολο Συσχετίσεων: Συλλογή ομοειδών συσχετίσεων.  Το ίδιο σύνολο οντοτήτων μπορεί να συμμετέχει σε διαφορετικά σύνολα συσχετίσεων ή σε διαφορετικούς ‘ρόλους’ στο ίδιο σύνολο.  Μια συσχέτιση μπορεί να εμπεριέχει και περιγραφικά γνωρίσματα. lot dname budget did since name Works_In DepartmentsEmployees ssn Reports_To lot name Employees subor- dinate super- visor ssn

13 13 Βασικά δομικά στοιχεία του ER μοντέλου γνώρισμα οντότητα συσχέτι ση Συνδέει γνωρίσματα με την αντίστοιχη οντότητα και οντότητες με συσχετίσεις Α πό οντότητα προς συσχέτιση. Απεικονίζει περιορισμό κλειδιού (δηλ. κάθε οντότητα συμμετέχει το πολύ μια φορά στη συσχέτιση). Π.χ. κάθε τμήμα έχει το πολύ ένα διευθυντή. Υ ποδηλώνει περιορισμό συμμετοχής (π.χ. κάθε υπάλληλος εργάζεται σε ένα τμήμα Περιορισμός κλειδιού + περιορισμός συμμετοχής (π.χ. κάθε τμήμα έχει ακριβώς ένα διευθυντή) Ιεραρχίες Οντοτήτων ISA

14 14 Οντότητα ή Γνωρίσματα  Θα έπρεπε η address να είναι γνώρισμα της Employees ή οντότητα (συνδεμένη με την Employees μέσω μιας συσχέτισης);  Εξαρτάται από τη χρήση που θα κάνουμε στη διεύθυνση, και τη σημασιολογία των δεδομένων:  Αν έχουμε πολλές διευθύνσεις ανά εργαζόμενο, η address πρέπει να είναι οντότητα (αφού οι τιμές των γνωρισμάτων δεν μπορεί να είναι σύνολα).  Όταν η δομή της διεύθυνσης (πόλη, οδός, κ.λ.π.) μας ενδιαφέρει, π.χ., επιθυμούμε να ανακτούμε αυτούς που εργάζονται σε συγκεκριμένη πόλη, η address πρέπει να παρασταθεί σαν οντότητα (αφού οι τιμές των γνωρισμάτων είναι ατομικές).

15 15 Οντότητα ή Γνωρίσματα  Η Works_In2 δεν επιτρέπει σε εργαζόμενο να εργάζεται σε ένα τμήμα για δύο ή περισσότερες περιόδους.  Παρόμοιο πρόβλημα με καταχώρηση πολλαπλών διευθύνσεων για έναν εργαζόμενο: θέλουμε να καταχωρούμε πολλαπλές τιμές περιγραφικού γνωρίσματος για κάθε στιγμιότυπο της συσχέτισης.  Αντιμετώπιση: Εισαγωγή του συνόλου οντοτήτων Duration. name Employees ssn lot Works_In2 from to dname budget did Departments dname budget did name Departments ssn lot Employees Works_In3 Duration from to

16 16 Οντότητα ή Συσχέτιση  Το πρώτο ER διάγραμμα ικανοποιεί αν ο διευθυντής αντιστοιχίζεται σε έναν προϋπολογισμό για κάθε τμήμα που διευθύνει.  Τι γίνεται αν ο προϋπολογισμός που καταχωρείται καλύπτει όλα τα τμήματα που διευθύνει ο συγκεκριμένος διευθυντής; Manages2 name dname budget did Employees Departments ssn lot dbudget since Employees since name dname budget did Departments ssn lot Mgr_Appt s Manages3 dbudget apptnum

17 17 Περίληψη του ER Μοντέλου  Ο σχεδιασμός ιδεατής ΒΔ ακολουθεί την ανάλυση απαιτήσεων.  Παρέχει υψηλού επιπέδου περιγραφή των δεδομένων που πρόκειται να αποθηκευτούν.  Το ER μοντέλο είναι δημοφιλές για σχεδιασμό ιδεατής ΒΔ.  Χρησιμοποιεί εκφραστικά δομικά στοιχεία, κοντά στον τρόπο που σκέφτονται οι άνθρωποι για τις εφαρμογές.  Βασικά δομικά στοιχεία: οντότητες, συσχετίσεις, και γνωρίσματα (οντοτήτων και συσχετίσεων).  Επιπρόσθετα δομικά στοιχεία: αδύναμες οντότητες, ISA ιεραρχίες, και συνυπολογισμός.  Σημείωση: Υπάρχουν πολλές παραλλαγές του ER.

18 18 Περίληψη του ER Μοντέλου (Συνέχεια)  Διάφορα είδη περιορισμών ακεραιότητας μπορούν να εκφραστούν στο ER μοντέλο: περιορισμοί κλειδιού, περιορισμοί συμμετοχής, και περιορισμοί επικάλυψης/κάλυψης για ISA ιεραρχίες. Κάποιοι περιορισμοί ξένου κλειδιού μπορούν επίσης να περιγραφούν έμμεσα στον ορισμό ενός συνόλου συσχετίσεων.  Κάποιοι περιορισμοί (όπως οι, συναρτησιακές εξαρτήσεις) δεν μπορούν να εκφραστούν στο ER μοντέλο.  Οι περιορισμοί παίζουν σημαντικό ρόλο στον προσδιορισμό της βέλτιστης σχεδίασης της βάσης δεδομένων ενός οργανισμού.

19 19 Περίληψη του ER Μοντέλου (Συνέχεια)  Η σχεδίαση του ER διαγράμματος είναι υποκειμενική. Υπάρχουν συνήθως πολλοί τρόποι να μοντελοποιηθεί ένα σενάριο! Η ανάλυση των εναλλακτικών λύσεων είναι περίπλοκη κυρίως για μεγάλους οργανισμούς. Οι συνήθεις επιλογές περιλαμβάνουν:  Οντότητα ή χαρακτηριστικά, οντότητα ή συσχέτιση, δυαδική ή ν-αδική συσχέτιση, χρήση ή όχι ιεραρχιών ISA, χρήση ή όχι συνυπολογισμού.  Εξασφάλιση καλής σχεδίασης της ΒΔ: το σχεσιακό μοντέλο που θα προκύψει πρέπει να αναλυθεί και να βελτιωθεί παραπέρα.

20 20 ER-διάγραμμα: παράδειγμα

21 21 Γιατί Μελετάμε το Σχεσιακό Μοντέλο;  Είναι το πιο διαδεδομένο μοντέλο.  Σχεσιακά DBMS: DB2 της IBM, Oracle, Informix, MS-ACCESS και MS-SQLServer της Microsoft, Sybase, κ.λ.π.  Τελευταίος ανταγωνιστής: αντικειμενοστραφές μοντέλο.  ObjectStore, Versant, Ontos  Πρόσφατη σύνθεση των δύο μοντέλων: αντικείμενο- σχεσιακό μοντέλο  Informix Universal Server, UniSQL, O2, Oracle, DB2

22 22 Σχεσιακές Βάσεις Δεδομένων: Ορισμοί  Σχεσιακή ΒΔ: ένα σύνολο σχέσεων (πινάκων)  Σχέση: αποτελείται από 2 συστατικά:  Στιγμιότυπο : ένας πίνακας, με γραμμές και στήλες. #Γραμμές = πληθυσμός, #πεδία = βαθμός.  Σχήμα : προσδιορίζει το όνομα της σχέσης, και τα ονόματα και τους τύπους κάθε στήλης.  Π.χ. Students(sid: string, name: string, login: string, age: integer, gpa: real).  Μια σχέση μπορεί να θεωρηθεί ως σύνολο γραμμών ή πλειάδων (οι γραμμές είναι διαφορετικές μεταξύ τους).

23 23 Παράδειγμα: Στιγμιότυπο της Σχέσης Students v Πληθυσμός = 3, βαθμός = 5, διακριτές γραμμές v Πρέπει όλες οι στήλες σε ένα στιγμιότυπο μιας σχέσης να είναι διακριτές;

24 24 Σχεσιακές Γλώσσες Αιτημάτων  Ισχυρό πλεονέκτημα του σχεσιακού μοντέλου: υποστηρίζει την υποβολή απλών αλλά ισχυρών αιτημάτων πάνω στα δεδομένα.  Τα αιτήματα μπορούν να διατυπωθούν διαισθητικά και το DBMS είναι υπεύθυνο για τον αποδοτικό υπολογισμό τους.  Σημείο κλειδί: η ακριβής σημασιολογία των σχεσιακών αιτημάτων.  Επιτρέπει στο βελτιστοποιητή την εκτενή αναδιάταξη των λειτουργιών, εξασφαλίζοντας παράλληλα ότι η απάντηση δεν αλλάζει.

25 25 Η Γλώσσα Αιτημάτων SQL  Αναπτύχθηκε από την IBM (system R) τη δεκαετία του  Απαίτηση για πρότυπα αφού χρησιμοποιείται από πολλούς κατασκευαστές λογισμικού.  Πρότυπα:  SQL-86  SQL-89 (μικρές βελτιώσεις)  SQL-92 (σημαντικές βελτιώσεις, το τρέχον πρότυπο)  SQL-99 (ουσιαστικές επεκτάσεις)

26 26 Η Γλώσσα Αιτημάτων SQL  Για να βρούμε όλους τους φοιτητές ηλικίας 18 ετών γράφουμε: SELECT * FROM Students S WHERE S.age=18 •Για να πάρουμε μόνο τα ονόματα και τα logins, αντικαθιστούμε την πρώτη γραμμή με: SELECT S.name, S.login Αποτέλεσμα

27 27 Δημιουργία Σχέσεων με την SQL  Δημιουργεί τη σχέση Students. Παρατηρήστε ότι προσδιορίζεται και ο τύπος (domain) κάθε πεδίου, και επιβάλλεται από το DBMS κάθε φορά που προστίθενται ή τροποποιούνται πλειάδες.  Άλλο παράδειγμα: ο πίνακας Enrolled διατηρεί πληροφορίες σχετικά με τα μαθήματα που παίρνουν οι φοιτητές. CREATE TABLE Students (sid CHAR(20), name CHAR(20), login CHAR(10), age INTEGER, gpa REAL ) CREATE TABLE Enrolled (sid CHAR(20), cid CHAR(20), grade CHAR (2))

28 28 Ακύρωση και Μεταβολή Σχέσεων  Ακυρώνει τη σχέση Students. Η πληροφορία του σχήματος και οι πλειάδες διαγράφονται. DROP TABLE Students v Το σχήμα της σχέσης Students μεταβάλλεται και προστίθεται ένα νέο πεδίο. Κάθε πλειάδα στο τρέχον στιγμιότυπο επεκτείνεται με τη τιμή null στο νέο πεδίο. ALTER TABLE Students ADD COLUMN firstYear integer

29 29 Εισαγωγή και Διαγραφή Πλειάδων  Μπορούμε να εισάγουμε μια πλειάδα ως εξής: INSERT INTO Students (sid, name, login, age, gpa) VALUES (53688, ‘Smith’, 18, 3.2) v Μπορούμε να διαγράψουμε όλες τις πλειάδες που ικανοποιούν μια συνθήκη (π.χ., name = ‘ Smith’ ): DELETE FROM Students S WHERE S.name = ‘Smith’ * Παρέχονται επίσης ισχυρές παραλλαγές αυτών των εντολών. Περισσότερα αργότερα!

30 30 Στιγμιότυπα του Παραδείγματος R1 S1 S2  Στα παραδείγματα μας θα χρησιμοποιήσουμε τα παρόντα στιγμιότυπα των σχέσεων Sailors και Reserves.  Ποια θα ήταν η διαφορά στη σημασιολογία αν το κλειδί της σχέσης Reserves περιελάμβανε μόνο τα πεδία sid και bid;

31 31 Βασικό SQL Αίτημα  λίστα-πινάκων: λίστα ονομάτων πινάκων (καθένα από τα οποία μπορεί να ακολουθείται από μια μεταβλητή διαστήματος).  λίστα-επιλογής: λίστα από ονόματα στηλών (ή παραστάσεις που περιέχουν ονόματα στηλών) πινάκων που περιλαμβάνονται στη λίστα-πινάκων.  καταλληλότητα: Συνθήκες της μορφής παράσταση op παράσταση όπου το op μπορεί να είναι ένας από τους, =, =, <>. παράσταση μπορεί να αποτελέσει το όνομα μιας στήλης, μια σταθερά, μια αριθμητική παράσταση ή μια συμβολοσειρά. Οι παραστάσεις συνδυάζονται με τους λογικούς τελεστές AND, OR και NOT.  Η χρήση του όρου DISTINCT είναι προαιρετική και δείχνει ότι η απάντηση δε θα πρέπει να περιέχει επαναλήψεις. Χωρίς το DISTINCT οι πολλαπλές εμφανίσεις δεν απαλείφονται. SELECT [DISTINCT] λίστα-επιλογής FROM λίστα-πινάκων WHERE καταλληλότητα

32 32 Ιδεατή Στρατηγική Υπολογισμού  Η σημασιολογία ενός αιτήματος SQL ορίζεται με βάση την ακόλουθη ιδεατή στρατηγική υπολογισμού :  Υπολογισμός του καρτεσιανού γινομένου των πινάκων στη λίστα-πινάκων.  Απάλειψη των πλειάδων που προκύπτουν οι οποίες δεν ικανοποιούν την καταλληλότητα.  Διαγραφή στηλών που δεν βρίσκονται στην λίστα- επιλογής.  Αν το αίτημα περιλαμβάνει το DISTINCT, απαλείφονται οι πολλαπλές εμφανίσεις της ίδιας πλειάδας.  Η στρατηγική αυτή είναι πιθανά η λιγότερο αποδοτική για τον υπολογισμό του αιτήματος! Ένας βελτιστοποιητής θα έβρισκε πιο αποδοτικές στρατηγικές για να υπολογίσει τις ίδιες απαντήσεις.

33 33 Παράδειγμα Ιδεατού Υπολογισμού SELECT S.sname FROM Sailors S, Reserves R WHERE S.sid=R.sid AND R.bid=103

34 34 Παραστάσεις και Συμβολοσειρές  Δείχνει τη χρήση των αριθμητικών παραστάσεων και του ταιριάσματος συμβολοσειρών: Να βρείτε τριάδες (ηλικία ναυτικού και δύο πεδία που ορίζονται μέσω παραστάσεων) για τους ναυτικούς που το όνομα τους αρχίζει και τελειώνει με B και αποτελείται από τουλάχιστον τρεις χαρακτήρες.  AS και = είναι δύο τρόποι να δώσουμε ονόματα στα πεδία του αποτελέσματος.  LIKE χρησιμοποιείται για το ταίριασμα συμβολοσειρών. Το `_’ αντιπροσωπεύει έναν χαρακτήρα ενώ το `%’ παριστάνει 0 ή περισσότερους χαρακτήρες. Κάποια συστήματα χρησιμοποιούν το `*’ αντί του `%’ και το `?’ αντί του `_’. SELECT S.age, age1=S.age-5, 2*S.age AS age2 FROM Sailors S WHERE S.sname LIKE ‘B_%B’

35 35 Περισσότερα Σχετικά με Τελεστές Σύγκρισης Συνόλων  Έχουμε ήδη συναντήσει τους IN, EXISTS και UNIQUE. Μπορούμε ακόμη να χρησιμοποιήσουμε τους NOT IN, NOT EXISTS και NOT UNIQUE.  Υπάρχουν επίσης τα: op ANY, op ALL όπου op είναι ένα από τα, =, =, <>.  Να βρεθούν οι ναυτικοί με τιμή διατίμησης (rating) μεγαλύτερη από εκείνη ενός ναυτικού με το όνομα Horatio: SELECT * FROM Sailors S WHERE S.rating > ANY ( SELECT S2.rating FROM Sailors S2 WHERE S2.sname=‘Horatio’)

36 36 Τελεστές Συνάθροισης COUNT (*) COUNT ( [ DISTINCT ] A) SUM ( [ DISTINCT ] A) AVG ( [ DISTINCT ] A) MAX (A) MIN (A) SELECT AVG (S.age) FROM Sailors S WHERE S.rating=10 SELECT COUNT (*) FROM Sailors S SELECT AVG ( DISTINCT S.age) FROM Sailors S WHERE S.rating=10 SELECT COUNT ( DISTINCT S.rating) FROM Sailors S WHERE S.sname=‘Bob’

37 37 Να βρεθεί το όνομα και η ηλικία του πλέον ηλικιωμένου ναυτικού SELECT S.sname, S.age FROM Sailors S WHERE S.age = ( SELECT MAX (S2.age) FROM Sailors S2) SELECT S.sname, S.age FROM Sailors S WHERE ( SELECT MAX (S2.age) FROM Sailors S2) = S.age

38 38 Να βρεθεί η ηλικία του νεώτερου ναυτικού για κάθε τιμή διατίμησης (rating).  Με τη χρήση της συνιστώσας GROUP BY διατυπώνεται ως εξής: SELECT S.rating, MIN (S.age) FROM Sailors S GROUP BY S.rating Ο πίνακας της απάντησης

39 39 Να βρεθεί η ηλικία του νεότερου ενήλικα ναυτικού (ηλικία >= 18), για κάθε τιμή διατίμησης με τουλάχιστον 2 ενήλικες ναυτικούς  Μόνο τα S.rating και S.age αναφέρονται στις συνιστώσες SELECT, GROUP BY και HAVING. Τα άλλα παιδία είναι `μη αναγκαία’.  Η 2η στήλη του αποτελέσματος είναι ανώνυμη (Μπορεί να πάρει όνομα με τη χρήση του AS ). SELECT S.rating, MIN (S.age) FROM Sailors S WHERE S.age >= 18 GROUP BY S.rating HAVING COUNT (*) > 1 Ο πίνακας της απάντησης

40 40 Πληροφοριακό Σύστημα  Ολοκληρωμένο σύστημα που περιλαμβάνει  Αρχές, διαδικασίες, οργανωτική δομή  Προσωπικό  δεδομένα  Υλικό, εγκαταστάσεις, δίκτυα επικοινωνιών και  λογισμικό  Που αλληλεπιδρούν μεταξύ τους και με το περιβάλλον με σκοπό την παραγωγή και διαχείριση πληροφορίας για την υποστήριξη των λειτουργιών ενός οργανισμού.

41 41 Στοιχεία Πληροφοριακού Συστήματος Άνθρωποι Δεδομένα Λογισμικό Υλικό Διαδικασίες

42 42 Ο οργανισμός ως σύστημα Υποσύστημα Παραγωγής Υποσύστημα Διοίκησης Πληροφοριακό υποσύστημα στοιχεία απόδοσης και λειτουργίας εντολές, παραγγελίες πληροφορίες οδηγίες Στόχοι, επιδιώξεις λειτουργίας

43 43 Ο ρόλος του Π.Σ.  Φυσικό υποσύστημα  Input: πρώτη ύλη, παραγγελίες, οδηγίες  Output: προϊόν  Υποσύστημα διοίκησης  Input: πληροφορίες  Output: εντολές  Πληροφοριακό υποσύστημα: μεσάζων  Μετασχηματισμός δεδομένων από φυσικό υποσύστημα σε πληροφορίες για τη διοίκηση  Διαβιβάζει τις οδηγίες της διοίκησης στο φυσικό υποσύστημα  Ενδιάμεσο με το περιβάλλον

44 44 Συμπεράσματα  Το πληροφοριακό σύστημα  Είναι ο συνεκτικός κρίκος των υποσυστημάτων ενός οργανισμού (απαίτηση για ευελιξία)  Λειτουργεί όπως το κυκλοφοριακό σύστημα σε ένα οργανισμό  Στοχεύει στη βέλτιστη λειτουργία του όλου συστήματος  Συνεισφέρει στη δημιουργία αλλαγών ώστε ο οργανισμός να προσαρμόζεται στο περιβάλλον του (απαίτηση για προσαρμοστικότητα)

45 45 Κύκλος ζωής Π.Σ. (1/3) ΦάσηΕνέργειεςΠαρατηρήσεις Διερευνητική μελέτη  Ορισμός συστήματος και προβλήματος  Παρουσίαση εναλλακτικών λύσεων Επιλογή λύσης για μελέτη Μελέτη σκοπιμότητας  Εφικτότητα υλοποίησης λύσης  Εναλλακτικοί τρόποι υλοποίησης  Ανάλυση κόστους/οφέλους Περιγραφή λύσης που θα υλοποιηθεί Ανάλυση απαιτήσεων  Λειτουργίες συστήματος  Ειδικές απαιτήσεις  Κριτήρια επικύρωσης/αποδοχής προϊόντων Περιγραφή ΤΙ θα κάνει το σύστημα

46 46 Κύκλος ζωής Π.Σ. (2/3) ΦάσηΕνέργειεςΠαρατηρήσεις Σχεδιασμός συστήματος  Δομή συστήματος  Εξοπλισμός (υλικό/λογισμικό)  Απαιτούμενες Διαδικασίες  Προδιαγραφές δοκιμών ελέγχου 1. ΠΩΣ θα λειτουργεί το σύστημα (αναλυτικά) 2. Τεχνικές προδιαγραφές υλικού/λογισμικού Υλοποίηση  Εφικτότητα υλοποίησης λύσης  Εναλλακτικοί τρόποι υλοποίησης  Ανάλυση κόστους/οφέλους Τεκμηρίωση υλικού/λογισμικού και διαδικασιών

47 47 Κύκλος ζωής Π.Σ. (3/3) ΦάσηΕνέργειεςΠαρατηρήσεις Εγκατάσταση  Έλεγχος λειτουργίας συστήματος  Μετάπτωση από το παλαιό στο νέο 1. Εγχειρίδια οδηγιών 2. Παραλαβή συστήματος Λειτουργία - Συντήρηση Ενέργειες για ομαλή λειτουργία και συνεχή βελτίωση (προσθήκες, αλλαγές, βελτιώσεις)

48 48 Ψηφιακές Βιβλιοθήκες

49 49 Παραδείγματα

50 50

51 51 biology Canadian Biochemical Society

52 52

53 53

54 54

55 55 Παράδειγμα Ψηφιακής Βιβλιοθήκης με Μουσική PATRON – μια Ψηφιακή Βιβλιοθήκη πολυμέσων για μουσική … n2/

56 56 Εξαγωγή Χωρικής Πληροφορίας  Εξαγωγή ονομάτων οντοτήτων για αναγνώριση, κωδικοποίηση και ευρετηρίαση όλων των αναφερόμενων τοποθεσιών σε κάθε άρθρο  Αυτόματη δημιουργία χαρτών που συνοψίζουν και ακολουθούν την εξέλιξη κάθε άρθρου  Κάνει δυνατή την αναζήτηση σε άρθρα που αφορούν την περιοχή που οριοθετεί ο χρήστης

57

58

59 59 Τι είναι «Βιβλιοθήκη» / «Αρχείο»  Τι είναι «Βιβλιοθήκη» ή «Αρχείο» ή …  Χώρος συγκέντρωσης, φύλαξης, διατήρησης, περιφρούρησης, οργάνωσης και διάθεσης της πληροφορίας  Τι είναι «Ψηφιακή Βιβλιοθήκη» ή …  Συγκέντρωση (ή εξασφάλιση πρόσβασης) πληροφορίας (περιεχόμενο)  Σε ψηφιακά μέσα  Οργανωμένο για εύκολη πρόσβαση  Δεν είναι η «Αυτοματοποιημένη βιβλιοθήκη»

60 60 Ορισμοί Ψηφιακής Βιβλιοθήκης  Χαλαρός ορισμός:  Οποιαδήποτε online συλλογή τεκμηρίων  Αυστηρός ορισμός:  Πλήρη κείμενα (Full text) / υψηλή ποιότητα μέσων  Πλούσια μορφοποίηση τεκμηρίων  Εξελιγμένες δυνατότητες αναζήτησης  Αληθινή πλοήγηση υπερκειμένου

61 61 Η Έννοια της «Ψηφιακής Βιβλιοθήκης» «...η έννοια της "ψηφιακής βιβλιοθήκης" δεν ισοδυναμεί απλά με μια ψηφιοποιημένη συλλογή με εργαλεία διαχείρισης πληροφορίας. Αφορά μάλλον ένα περιβάλλον το οποίο ενώνει συλλογές, υπηρεσίες και ανθρώπους για την υποστήριξη ολόκληρου του κύκλου ζωής της δημιουργίας, διάχυσης, χρήσης και συντήρησης δεδομένων, πληροφορίας και γνώσης.» Santa Fe planning workshop on distributed knowledge work environments, Digital Library Initiative (DLI), March 1997

62 62 Τι είναι οι «Ψηφιακές Βιβλιοθήκες»  Είναι Βάσεις Δεδομένων που  Έχουν ψηφιακά αντικείμενα  Είναι περισσότερο κατανεμημένες  Έχουν περισσότερη ανομοιογένεια  Έχουν λιγότερες δυνατότητες αναζήτησης  Έχουν λιγότερες ενημερώσεις  Είναι μηχανές αναζήτησης που  Έχουν διαδικασία πρόσκτησης / καταχώρησης  Είναι λιγότερο κατανεμημένες  Έχουν περισσότερα μεταδεδομένα  Δεν περιέχουν παραπλανητικά μεταδεδομένα

63 63 Ανάμεσα σε Ιστό και ΒΔ Ιστός ΒΔ Ψηφιακές Βιβλιοθήκες Δόμηση δεδομένων Γνώση Χρηστών & Διαδικασιών

64 64 Ο Ιστός δεν είναι Ψηφιακή Βιβλιοθήκη Η πληροφορία στον Ιστό  Δεν είναι (αρκετά) δομημένη  Έχει απλοϊκή διεπαφή (μηχανές αναζήτησης)  Είναι δύσκολο να ανακτηθεί (πλήρως)  Είναι παροδική  Είναι συχνά παραπλανητική Αλλά συχνά μια Ψηφιακή Βιβλιοθήκη είναι προσπελάσιμη από τον Ιστό

65 65 Χαρακτηριστικά Ψηφιακής Βιβλιοθήκης  Ηλεκτρονικά – Ψηφιακά μορφότυπα  Δικτυωμένη (διαμοιραζόμενη πληροφορία)  Προφανής οργάνωση (βιβλιοθήκης, όχι σωρού)  Πολιτική ανάπτυξης συλλογών  Συστηματική δόμηση και χαρακτηρισμός δεδομένων  Χρήση πολιτικών (και «fair policy»)  Μονιμότητα  Καθοδήγηση και αναφορές

66 66 Ψηφιακό Αντικείμενο  Κάθε είδους ψηφιακή πληροφορία  Εικόνες  Ήχο – μουσική  Βίντεο  Προγράμματα υπολογιστών  Πολυμέσα  Αποθηκευμένο και μεταφερόμενο ψηφιακό περιεχόμενο  Απλά αρχεία  Εξελιγμένα – περίπλοκα αντικείμενα Πως θα είναι τα «ψηφιακά άπαντα του Καβάφη»;

67 67 Έννοιες μιας Ψηφιακής Βιβλιοθήκης  Τα συστατικά μιας ψηφιακής βιβλιοθήκης ονομάζονται "ψηφιακά αντικείμενα" (digital objects)  Αυτά αποθηκεύονται σε "αποθετήρια δεδομένων" (repositories)  Αναγνωρίζονται από τα "προσδιοριστικά" (handles)  Οι πληροφορίες που είναι αποθηκευμένες σε ένα ψηφιακό αντικείμενο ονομάζεται "περιεχόμενο" (content)  Αυτό διαχωρίζεται σε "δεδομένα" (data) και πληροφορίες για αυτά, τις "ιδιότητες" (properties) ή μεταδεδομένα

68 68 Βασικές Συνιστώσες Δομής Τυπικής Ψηφιακής Βιβλιοθήκης  Διεπαφή με τον χρήστη (User interfaces)  Αποθετήριο δεδομένων (Repository)  Σύστημα προσδιορισμού (ή ονοματολογίας, Handle system)  Σύστημα αναζήτησης (Search system)

69 69 Ψηφιακή Βιβλιοθήκη – Σχηματικά Υπηρεσίες Ψηφιακών Βιβλιοθηκών Αποθετήριο 1Αποθετήριο 2Αποθετήριο N Παροχείς Υπηρεσιών Ψηφιακών Βιβλιοθηκών Ψηφιακά αντικείμενα στα Αποθετήριο Εκδότες Χρήστες Βιβλιοθήκης Ψηφιακά αντικείμενα εκτός Αποθετηρίων

70 70 Μεταδεδομένα

71 71 Αναγκαιότητα Μεταδεδομένων  Ο Παγκόσμιος Ιστός είναι περιβάλλον  αχανές  ετερογενές  κατανεμημένο  δυναμικά μεταβαλλόμενο  Πώς ενοποιείται η πρόσβαση σε πηγές ψηφιακής βιβλιοθήκης;  Τα μεταδεδομένα είναι κλειδί για τη λύση: είναι η ταυτότητα του Ψηφιακού Αντικειμένου

72 72 Μεταδεδομένα  Είναι «Δομημένα δεδομένα για άλλα δεδομένα»  Δομημένα δεδομένα για πόρους, που μπορεί να υποστηρίξουν ένα μεγάλο εύρος λειτουργιών  Καταλογογράφηση, Απογραφή / Μητρώο …  Τα μεταδεδομένα καθιστούν δυνατή  Την ταξινόμηση του υλικού  Την οργάνωση και συσχέτιση αρχείων – πιθανά σύνθετων, μη δομημένων και ενδεχόμενα τεραστίου μεγέθους

73 73 Dublin Core simple  15 προαιρετικά και επαναλαμβανόμενα πεδία  Σε 3 κατηγορίες:  Περιεχόμενο  Πνευματική Ιδιοκτησία  Στιγμιότυπο  Τα μεταδεδομένα συγκρίνονται άμεσα    Συστήνουν ανταλλαγή με RDF/XML

74 74 Dublin Core: Τα 15 Στοιχεία  Τίτλος / Title  Θέμα / Subject  Περιγραφή / Description  Πηγή / Source  Γλώσσα / Language  Σχέση / Relation  Κάλυψη / Coverage  Δημιουργός / Creator  Εκδότης / Publisher  Συντελεστής / Contributor  Δικαιώματα / Rights  Ημερομηνία / Date  Τύπος / Type  Μορφότυπο / Format  Κωδικός / Identifier

75 75 Τα Στοιχεία Μεταδεδομένων του Dublin Core  Διεπιστημονική ομοφωνία σε απλά σύνολα στοιχείων για ανακάλυψη πόρων  15 στοιχεία (πεδία μεταδεδομένων)  όλα προαιρετικά  όλα επαναλαμβανόμενα  Δεν προορίζεται για περιγραφή περίπλοκων πόρων  Η αρχική ιδέα των «απλών αντικειμένων – σαν τεκμήρια»  Απλότητα στη σημασιολογία, ευκολία χρήσης  Παρέχει βασική «σημασιολογική διαλειτουργικότητα»  Μεταξύ επιστημονικών περιοχών, μεταξύ γλωσσών  Δεν παρέχει λεπτομερείς κανόνες καταλογογράφησης  Επιτρέπει επεκτασιμότητα – σε άλλες κατηγορίες πόρων

76 76 Χρήση του Dublin Core  Είναι βασικός πυρήνας στοιχείων  Δεν είναι υποκατάστατο σε πλουσιότερα περιγραφικά πρότυπα  Παρέχει 15 «παράθυρα» από πλουσιότερη περιγραφή πόρων  Φανερώνει πλούσιες περιγραφές σε απλή μορφή  Σημασιολογικά σταυροδρόμια, αντιστοιχίσεις σε υπάρχοντα δεδομένα

77 77 Περιγραφή σε Dublin Core Το Dublin Core είναι περισσότερο αντικείμενο εξαγωγής – παρά δημιουργίας title creator date desc rights Πλούσια περιγραφή Περιγραφή σε «DC Simple»

78 78 Ανάκτηση Πληροφορίας  ΠΩΣ εκφράζουμε ανάγκες πληροφόρησης (queries)  ΠΩΣ εντοπίζουμε και ανακτούμε πληροφορίες που ικανοποιούν τις ανάγκες  ΠΩΣ αξιολογούμε τα αποτελέσματα της αναζήτησης

79 79 Information Retrieval System InputInput Document classification Processor Search strategy Documents queries Output feedback

80 80 Information retrieval process Docs database DB manager Index User Interface Text Operations (tokenization, stopwords, stemming, etc.) Indexing Searching Ranking Query operations text user need query Retrieved docs user feedback ranked docs

81 81 Ανακεφαλαίωση IR = D: documents Q: queries F: πλαίσιο αναπαράστασης κειμένων R: συνάφεια query q i με κείμενο d j αριθμός  0-1


Κατέβασμα ppt "1 Από τη διαχείριση πληροφορίας στη διαχείριση γνώσης Χ. Παπαθεοδώρου, Μ. Γεργατσούλης, Σ. Καπιδάκης Εργαστήριο Ψηφιακών Βιβλιοθηκών & Ηλεκτρονικής Δημοσίευσης."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google