Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Από τη διαχείριση πληροφορίας στη διαχείριση γνώσης

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Από τη διαχείριση πληροφορίας στη διαχείριση γνώσης"— Μεταγράφημα παρουσίασης:

1 Από τη διαχείριση πληροφορίας στη διαχείριση γνώσης
Από τη διαχείριση πληροφορίας στη διαχείριση γνώσης Χ. Παπαθεοδώρου, Μ. Γεργατσούλης, Σ. Καπιδάκης Εργαστήριο Ψηφιακών Βιβλιοθηκών & Ηλεκτρονικής Δημοσίευσης Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας, Ιόνιο Πανεπιστήμιο Μεταπτυχιακό Πρόγραμμα Σπουδών στην Ιστορική Δημογραφία Τμήμα Ιστορίας, Ιόνιο Πανεπιστήμιο

2 Τι είναι το DBMS; Βάσεις δεδομένων: Ιδιαίτερα μεγάλες ολοκληρωμένες συλλογές δεδομένων. Αφορούν μοντέλα πραγματικών οργανισμών. Καταχωρούν πληροφορία για: Οντότητες (π.χ., φοιτητές, μαθήματα, διδάσκοντες). Συσχετίσεις (π.χ., Ο Νίκος έχει εγγραφεί στο μάθημα Βάσεις Δεδομένων). Το Σύστημα Διαχείρισης Βάσεων Δεδομένων (DBMS) είναι λογισμικό ειδικά σχεδιασμένο για να διευκολύνει την αποθήκευση και τη διαχείριση βάσεων δεδομένων.

3 Γιατί να μελετούμε Βάσεις Δεδομένων;
? Μετακίνηση από τον υπολογισμό στην πληροφορία Συλλογές δεδομένων με συνεχώς αυξανόμενη ποικιλομορφία και όγκο. Ψηφιακές Βιβλιοθήκες, αλληλεπιδραστικό βίντεο.

4 Μοντέλα Δεδομένων Μοντέλο δεδομένων είναι μια συλλογή από έννοιες για την περιγραφή των δεδομένων. Το σχήμα είναι η περιγραφή μιας συγκεκριμένης συλλογής δεδομένων, με τη χρήση δοσμένου μοντέλου δεδομένων. Το σχεσιακό μοντέλο δεδομένων είναι το πιο διαδεδομένο μοντέλο σήμερα. Βασική έννοια: σχέση, (ουσιαστικά είναι ένας πίνακας με γραμμές και στήλες). Κάθε σχέση έχει ένα σχήμα το οποίο περιγράφει τις στήλες ή πεδία ή γνωρίσματα ή χαρακτηριστικά. 5

5 Παράδειγμα ΑΜ Όνομα Επώνυμο Ηλικία 53123 Νίκος Νικολάου 18 45123
Σχήμα: Φοιτητής (ΑΜ:string, Όνομα:string, Επώνυμο:string, Ηλικία: integer) ΑΜ Όνομα Επώνυμο Ηλικία 53123 Νίκος Νικολάου 18 45123 Πέτρος Γεωργίου 20 93122 Μαρία Πέτρου 19 11234 Σοφία Ανδρέου 21 99876 Γιώργος Αντωνίου

6 Επίπεδα Αφαίρεσης Πολλές όψεις (εξωτερικό σχήμα), ένα ιδεατό (λογικό) σχήμα και ένα φυσικό σχήμα. Οι όψεις περιγράφουν πως βλέπουν τα δεδομένα οι χρήστες. Το ιδεατό σχήμα ορίζει τη λογική δομή. Το φυσικό σχήμα περιγράφει τα αρχεία και τα ευρετήρια που χρησιμοποιούνται. Όψεις 1 Όψεις 2 Όψεις 3 Ιδεατό Σχήμα Φυσικό Σχήμα Τα σχήματα ορίζονται με τη βοήθεια της DDL, Τα δεδομένα τροποποιούνται / ερωτούνται με τη βοήθεια της DML. 6

7 Παράδειγμα: Βάση Δεδομένων Πανεπιστημίου
Ιδεατό Σχήμα: φοιτητές(ΑΜ: string, Όνομα: string, Επώνυμο: string, Ηλικία: integer ) μαθήματα(ΚΜ: string, Ονομασία:string, Κατηγορία:integer) εγγραφές(ΑΜ:string, ΚΜ:string, Βαθμός:integer) Φυσικό Σχήμα: Σχέσεις αποθηκευμένες σαν μη ταξινομημένα αρχεία. Ευρετήριο πάνω στη πρώτη στήλη του πίνακα φοιτητές. Εξωτερικό Σχήμα (Όψη): εγγεγραμμένοι(ΚΜ:string, Πλήθος:integer) 7

8 Τα Αιτήματα στο DBMS Ευκολία ανάκτησης δεδομένων από τη βάση.
Ποιο είναι το ονοματεπώνυμο του φοιτητή με Αριθμό Μητρώου (ΑΜ) 12345; Πόσοι φοιτητές έχουν εγγραφεί στο μάθημα με κωδικό C1234; Γλώσσα αιτημάτων. Τυπικές Γλώσσες αιτημάτων: Σχεσιακός Λογισμός: βασίζεται στη μαθηματική λογική. Σχεσιακή Άλγεβρα: χρήση συνόλου τελεστών.

9 Επισκόπηση του Σχεδιασμού ΒΔ
Ανάλυση Απαιτήσεων. Κατανόηση-καταγραφή είδους δεδομένων, επισήμανση λειτουργιών που συμβαίνουν συχνότερα και επηρεάζουν την απόδοση του συστήματος, καταγραφή απαιτήσεων χρηστών. Σχεδιασμός Ιδεατής ΒΔ. Χρήση ER μοντέλου. Σχεδιασμός της Λογικής ΒΔ. Επιλογή DBMS (έχουν επικρατήσει τα σχεσιακά), δημιουργία λογικού σχήματος. Τελειοποίηση του Σχήματος. Σχεδιασμός του Φυσικού Σχήματος. Σχεδιασμός της Πολιτικής Ασφάλειας

10 Επισκόπηση Σχεδιασμού Ιδεατής ΒΔ
Σχεδιασμός Ιδεατής ΒΔ : (σ’ αυτή τη φάση χρησιμοποιείται το Μοντέλο Οντότητας-Συσχέτισης ή ER Μοντέλο.) Ποιες είναι οι οντότητες και οι συσχετίσεις; Ποιες πληροφορίες σχετικές με αυτές τις οντότητες και τις συσχετίσεις πρέπει να αποθηκεύσουμε στη βάση δεδομένων; Ποιοι είναι οι περιορισμοί ακεραιότητας και οι επιχειρηματικοί κανόνες λειτουργίας που ισχύουν; Ένα `σχήμα’ βάσης δεδομένων στο ER Μοντέλο μπορεί να παρασταθεί γραφικά (ER διαγράμματα). Ένα ER διάγραμμα μπορεί να απεικονιστεί σε ένα σχεσιακό σχήμα. 2

11 Employees ssn name lot Το ER Μοντέλο Οντότητα: Αντικείμενο του πραγματικού κόσμου διακριτό από τα άλλα αντικείμενα. Μια οντότητα περιγράφεται στη ΒΔ χρησιμοποιώντας ένα σύνολο γνωρισμάτων. Σύνολο Οντοτήτων: Συλλογή ομοειδών οντοτήτων. Π.χ., όλοι οι εργαζόμενοι (Employees). Όλες οι οντότητες σε ένα σύνολο οντοτήτων έχουν το ίδιο σύνολο γνωρισμάτων. (Τουλάχιστον μέχρι να μιλήσουμε για ISA ιεραρχίες!) Κάθε σύνολο οντοτήτων έχει ένα κλειδί (ελάχιστος αριθμό γνωρισμάτων που προσδιορίζουν μονοσήμαντα μια οντότητα). Κάθε γνώρισμα έχει ένα πεδίο ορισμού. The slides for this text are organized into several modules. Each lecture contains about enough material for a 1.25 hour class period. (The time estimate is very approximate--it will vary with the instructor, and lectures also differ in length; so use this as a rough guideline.) This covers Lectures 1 and 2 (of 6) in Module (5). Module (1): Introduction (DBMS, Relational Model) Module (2): Storage and File Organizations (Disks, Buffering, Indexes) Module (3): Database Concepts (Relational Queries, DDL/ICs, Views and Security) Module (4): Relational Implementation (Query Evaluation, Optimization) Module (5): Database Design (ER Model, Normalization, Physical Design, Tuning) Module (6): Transaction Processing (Concurrency Control, Recovery) Module (7): Advanced Topics 3

12 Το ER Μοντέλο (Συνέχεια)
name ssn lot Employees since name dname super-visor subor-dinate ssn lot did budget Reports_To Employees Works_In Departments Συσχέτιση: Διασύνδεση μεταξύ δύο ή περισσοτέρων οντοτήτων. Π.χ. η Μαρία εργάζεται στο τμήμα καλλυντικών. Σύνολο Συσχετίσεων: Συλλογή ομοειδών συσχετίσεων. Το ίδιο σύνολο οντοτήτων μπορεί να συμμετέχει σε διαφορετικά σύνολα συσχετίσεων ή σε διαφορετικούς ‘ρόλους’ στο ίδιο σύνολο. Μια συσχέτιση μπορεί να εμπεριέχει και περιγραφικά γνωρίσματα. 4

13 Βασικά δομικά στοιχεία του ER μοντέλου
Από οντότητα προς συσχέτιση. Απεικονίζει περιορισμό κλειδιού (δηλ. κάθε οντότητα συμμετέχει το πολύ μια φορά στη συσχέτιση). Π.χ. κάθε τμήμα έχει το πολύ ένα διευθυντή. οντότητα Υποδηλώνει περιορισμό συμμετοχής (π.χ. κάθε υπάλληλος εργάζεται σε ένα τμήμα γνώρισμα Περιορισμός κλειδιού + περιορισμός συμμετοχής (π.χ. κάθε τμήμα έχει ακριβώς ένα διευθυντή) συσχέτιση Συνδέει γνωρίσματα με την αντίστοιχη οντότητα και οντότητες με συσχετίσεις ISA Ιεραρχίες Οντοτήτων

14 Οντότητα ή Γνωρίσματα Θα έπρεπε η address να είναι γνώρισμα της Employees ή οντότητα (συνδεμένη με την Employees μέσω μιας συσχέτισης); Εξαρτάται από τη χρήση που θα κάνουμε στη διεύθυνση, και τη σημασιολογία των δεδομένων: Αν έχουμε πολλές διευθύνσεις ανά εργαζόμενο, η address πρέπει να είναι οντότητα (αφού οι τιμές των γνωρισμάτων δεν μπορεί να είναι σύνολα). Όταν η δομή της διεύθυνσης (πόλη, οδός, κ.λ.π.) μας ενδιαφέρει, π.χ., επιθυμούμε να ανακτούμε αυτούς που εργάζονται σε συγκεκριμένη πόλη, η address πρέπει να παρασταθεί σαν οντότητα (αφού οι τιμές των γνωρισμάτων είναι ατομικές).

15 Οντότητα ή Γνωρίσματα Η Works_In2 δεν επιτρέπει σε εργαζόμενο να εργάζεται σε ένα τμήμα για δύο ή περισσότερες περιόδους. Παρόμοιο πρόβλημα με καταχώρηση πολλαπλών διευθύνσεων για έναν εργαζόμενο: θέλουμε να καταχωρούμε πολλαπλές τιμές περιγραφικού γνωρίσματος για κάθε στιγμιότυπο της συσχέτισης. Αντιμετώπιση: Εισαγωγή του συνόλου οντοτήτων Duration. from to name Employees ssn lot dname did budget Works_In2 Departments name dname budget did ssn lot Employees Works_In3 Departments Duration from to 5

16 Οντότητα ή Συσχέτιση Το πρώτο ER διάγραμμα ικανοποιεί αν ο διευθυντής αντιστοιχίζεται σε έναν προϋπολογισμό για κάθε τμήμα που διευθύνει. Τι γίνεται αν ο προϋπολογισμός που καταχωρείται καλύπτει όλα τα τμήματα που διευθύνει ο συγκεκριμένος διευθυντής; since dbudget name dname ssn lot did budget Employees Manages2 Departments Employees since name dname budget did Departments ssn lot Mgr_Appts Manages3 dbudget apptnum 6

17 Περίληψη του ER Μοντέλου
Ο σχεδιασμός ιδεατής ΒΔ ακολουθεί την ανάλυση απαιτήσεων. Παρέχει υψηλού επιπέδου περιγραφή των δεδομένων που πρόκειται να αποθηκευτούν. Το ER μοντέλο είναι δημοφιλές για σχεδιασμό ιδεατής ΒΔ. Χρησιμοποιεί εκφραστικά δομικά στοιχεία, κοντά στον τρόπο που σκέφτονται οι άνθρωποι για τις εφαρμογές. Βασικά δομικά στοιχεία: οντότητες, συσχετίσεις, και γνωρίσματα (οντοτήτων και συσχετίσεων). Επιπρόσθετα δομικά στοιχεία: αδύναμες οντότητες, ISA ιεραρχίες, και συνυπολογισμός. Σημείωση: Υπάρχουν πολλές παραλλαγές του ER. 11

18 Περίληψη του ER Μοντέλου (Συνέχεια)
Διάφορα είδη περιορισμών ακεραιότητας μπορούν να εκφραστούν στο ER μοντέλο: περιορισμοί κλειδιού, περιορισμοί συμμετοχής, και περιορισμοί επικάλυψης/κάλυψης για ISA ιεραρχίες. Κάποιοι περιορισμοί ξένου κλειδιού μπορούν επίσης να περιγραφούν έμμεσα στον ορισμό ενός συνόλου συσχετίσεων. Κάποιοι περιορισμοί (όπως οι, συναρτησιακές εξαρτήσεις) δεν μπορούν να εκφραστούν στο ER μοντέλο. Οι περιορισμοί παίζουν σημαντικό ρόλο στον προσδιορισμό της βέλτιστης σχεδίασης της βάσης δεδομένων ενός οργανισμού. 12

19 Περίληψη του ER Μοντέλου (Συνέχεια)
Οντότητα ή χαρακτηριστικά, οντότητα ή συσχέτιση, δυαδική ή ν-αδική συσχέτιση, χρήση ή όχι ιεραρχιών ISA, χρήση ή όχι συνυπολογισμού. Εξασφάλιση καλής σχεδίασης της ΒΔ: το σχεσιακό μοντέλο που θα προκύψει πρέπει να αναλυθεί και να βελτιωθεί παραπέρα. 13

20 ER-διάγραμμα: παράδειγμα

21 Γιατί Μελετάμε το Σχεσιακό Μοντέλο;
Είναι το πιο διαδεδομένο μοντέλο. Σχεσιακά DBMS: DB2 της IBM, Oracle, Informix, MS-ACCESS και MS-SQLServer της Microsoft, Sybase, κ.λ.π. Τελευταίος ανταγωνιστής: αντικειμενοστραφές μοντέλο. ObjectStore, Versant, Ontos Πρόσφατη σύνθεση των δύο μοντέλων: αντικείμενο-σχεσιακό μοντέλο Informix Universal Server, UniSQL, O2, Oracle, DB2 2

22 Σχεσιακές Βάσεις Δεδομένων: Ορισμοί
Σχεσιακή ΒΔ: ένα σύνολο σχέσεων (πινάκων) Σχέση: αποτελείται από 2 συστατικά: Στιγμιότυπο : ένας πίνακας, με γραμμές και στήλες. #Γραμμές = πληθυσμός, #πεδία = βαθμός. Σχήμα : προσδιορίζει το όνομα της σχέσης, και τα ονόματα και τους τύπους κάθε στήλης. Π.χ. Students(sid: string, name: string, login: string, age: integer, gpa: real). Μια σχέση μπορεί να θεωρηθεί ως σύνολο γραμμών ή πλειάδων (οι γραμμές είναι διαφορετικές μεταξύ τους). 3

23 Παράδειγμα: Στιγμιότυπο της Σχέσης Students
Πληθυσμός = 3, βαθμός = 5, διακριτές γραμμές Πρέπει όλες οι στήλες σε ένα στιγμιότυπο μιας σχέσης να είναι διακριτές; 4

24 Σχεσιακές Γλώσσες Αιτημάτων
Ισχυρό πλεονέκτημα του σχεσιακού μοντέλου: υποστηρίζει την υποβολή απλών αλλά ισχυρών αιτημάτων πάνω στα δεδομένα. Τα αιτήματα μπορούν να διατυπωθούν διαισθητικά και το DBMS είναι υπεύθυνο για τον αποδοτικό υπολογισμό τους. Σημείο κλειδί: η ακριβής σημασιολογία των σχεσιακών αιτημάτων. Επιτρέπει στο βελτιστοποιητή την εκτενή αναδιάταξη των λειτουργιών, εξασφαλίζοντας παράλληλα ότι η απάντηση δεν αλλάζει. 9

25 Η Γλώσσα Αιτημάτων SQL Αναπτύχθηκε από την IBM (system R) τη δεκαετία του 1970. Απαίτηση για πρότυπα αφού χρησιμοποιείται από πολλούς κατασκευαστές λογισμικού. Πρότυπα: SQL-86 SQL-89 (μικρές βελτιώσεις) SQL-92 (σημαντικές βελτιώσεις, το τρέχον πρότυπο) SQL-99 (ουσιαστικές επεκτάσεις)

26 Η Γλώσσα Αιτημάτων SQL Για να βρούμε όλους τους φοιτητές ηλικίας 18 ετών γράφουμε: Αποτέλεσμα SELECT * FROM Students S WHERE S.age=18 Για να πάρουμε μόνο τα ονόματα και τα logins, αντικαθιστούμε την πρώτη γραμμή με: SELECT S.name, S.login

27 Δημιουργία Σχέσεων με την SQL
Δημιουργεί τη σχέση Students. Παρατηρήστε ότι προσδιορίζεται και ο τύπος (domain) κάθε πεδίου, και επιβάλλεται από το DBMS κάθε φορά που προστίθενται ή τροποποιούνται πλειάδες. Άλλο παράδειγμα: ο πίνακας Enrolled διατηρεί πληροφορίες σχετικά με τα μαθήματα που παίρνουν οι φοιτητές. CREATE TABLE Students (sid CHAR(20), name CHAR(20), login CHAR(10), age INTEGER, gpa REAL) CREATE TABLE Enrolled (sid CHAR(20), cid CHAR(20), grade CHAR(2)) 15

28 Ακύρωση και Μεταβολή Σχέσεων
DROP TABLE Students Ακυρώνει τη σχέση Students. Η πληροφορία του σχήματος και οι πλειάδες διαγράφονται. ALTER TABLE Students ADD COLUMN firstYear integer Το σχήμα της σχέσης Students μεταβάλλεται και προστίθεται ένα νέο πεδίο. Κάθε πλειάδα στο τρέχον στιγμιότυπο επεκτείνεται με τη τιμή null στο νέο πεδίο. 16

29 Εισαγωγή και Διαγραφή Πλειάδων
Μπορούμε να εισάγουμε μια πλειάδα ως εξής: INSERT INTO Students (sid, name, login, age, gpa) VALUES (53688, ‘Smith’, 18, 3.2) Μπορούμε να διαγράψουμε όλες τις πλειάδες που ικανοποιούν μια συνθήκη (π.χ., name = ‘Smith’): DELETE FROM Students S WHERE S.name = ‘Smith’ Παρέχονται επίσης ισχυρές παραλλαγές αυτών των εντολών. Περισσότερα αργότερα! 10

30 Στιγμιότυπα του Παραδείγματος
Στιγμιότυπα του Παραδείγματος R1 Στα παραδείγματα μας θα χρησιμοποιήσουμε τα παρόντα στιγμιότυπα των σχέσεων Sailors και Reserves. Ποια θα ήταν η διαφορά στη σημασιολογία αν το κλειδί της σχέσης Reserves περιελάμβανε μόνο τα πεδία sid και bid; S1 S2

31 Βασικό SQL Αίτημα SELECT [DISTINCT] λίστα-επιλογής FROM λίστα-πινάκων WHERE καταλληλότητα λίστα-πινάκων: λίστα ονομάτων πινάκων (καθένα από τα οποία μπορεί να ακολουθείται από μια μεταβλητή διαστήματος). λίστα-επιλογής: λίστα από ονόματα στηλών (ή παραστάσεις που περιέχουν ονόματα στηλών) πινάκων που περιλαμβάνονται στη λίστα-πινάκων. καταλληλότητα: Συνθήκες της μορφής παράσταση op παράσταση όπου το op μπορεί να είναι ένας από τους <, >, =, <=, >=, <>. παράσταση μπορεί να αποτελέσει το όνομα μιας στήλης, μια σταθερά, μια αριθμητική παράσταση ή μια συμβολοσειρά. Οι παραστάσεις συνδυάζονται με τους λογικούς τελεστές AND, OR και NOT. Η χρήση του όρου DISTINCT είναι προαιρετική και δείχνει ότι η απάντηση δε θα πρέπει να περιέχει επαναλήψεις. Χωρίς το DISTINCT οι πολλαπλές εμφανίσεις δεν απαλείφονται.

32 Ιδεατή Στρατηγική Υπολογισμού
Η σημασιολογία ενός αιτήματος SQL ορίζεται με βάση την ακόλουθη ιδεατή στρατηγική υπολογισμού: Υπολογισμός του καρτεσιανού γινομένου των πινάκων στη λίστα-πινάκων. Απάλειψη των πλειάδων που προκύπτουν οι οποίες δεν ικανοποιούν την καταλληλότητα. Διαγραφή στηλών που δεν βρίσκονται στην λίστα-επιλογής. Αν το αίτημα περιλαμβάνει το DISTINCT, απαλείφονται οι πολλαπλές εμφανίσεις της ίδιας πλειάδας. Η στρατηγική αυτή είναι πιθανά η λιγότερο αποδοτική για τον υπολογισμό του αιτήματος! Ένας βελτιστοποιητής θα έβρισκε πιο αποδοτικές στρατηγικές για να υπολογίσει τις ίδιες απαντήσεις.

33 Παράδειγμα Ιδεατού Υπολογισμού
SELECT S.sname FROM Sailors S, Reserves R WHERE S.sid=R.sid AND R.bid=103

34 Παραστάσεις και Συμβολοσειρές
SELECT S.age, age1=S.age-5, 2*S.age AS age2 FROM Sailors S WHERE S.sname LIKE ‘B_%B’ Δείχνει τη χρήση των αριθμητικών παραστάσεων και του ταιριάσματος συμβολοσειρών: Να βρείτε τριάδες (ηλικία ναυτικού και δύο πεδία που ορίζονται μέσω παραστάσεων) για τους ναυτικούς που το όνομα τους αρχίζει και τελειώνει με B και αποτελείται από τουλάχιστον τρεις χαρακτήρες. AS και = είναι δύο τρόποι να δώσουμε ονόματα στα πεδία του αποτελέσματος. LIKE χρησιμοποιείται για το ταίριασμα συμβολοσειρών. Το `_’ αντιπροσωπεύει έναν χαρακτήρα ενώ το `%’ παριστάνει 0 ή περισσότερους χαρακτήρες. Κάποια συστήματα χρησιμοποιούν το `*’ αντί του `%’ και το `?’ αντί του `_’.

35 Περισσότερα Σχετικά με Τελεστές Σύγκρισης Συνόλων
Έχουμε ήδη συναντήσει τους IN, EXISTS και UNIQUE. Μπορούμε ακόμη να χρησιμοποιήσουμε τους NOT IN, NOT EXISTS και NOT UNIQUE. Υπάρχουν επίσης τα: op ANY, op ALL όπου op είναι ένα από τα <, >, =, <=, >=, <>. Να βρεθούν οι ναυτικοί με τιμή διατίμησης (rating) μεγαλύτερη από εκείνη ενός ναυτικού με το όνομα Horatio: SELECT * FROM Sailors S WHERE S.rating > ANY (SELECT S2.rating FROM Sailors S2 WHERE S2.sname=‘Horatio’)

36 Τελεστές Συνάθροισης COUNT (*) SELECT COUNT (*) COUNT ( [DISTINCT] A)
SUM ( [DISTINCT] A) AVG ( [DISTINCT] A) MAX (A) MIN (A) SELECT COUNT (*) FROM Sailors S SELECT AVG (S.age) FROM Sailors S WHERE S.rating=10 SELECT AVG ( DISTINCT S.age) FROM Sailors S WHERE S.rating=10 SELECT COUNT (DISTINCT S.rating) FROM Sailors S WHERE S.sname=‘Bob’

37 Να βρεθεί το όνομα και η ηλικία του πλέον ηλικιωμένου ναυτικού
SELECT S.sname, S.age FROM Sailors S WHERE S.age = (SELECT MAX (S2.age) FROM Sailors S2) SELECT S.sname, S.age FROM Sailors S WHERE (SELECT MAX (S2.age) FROM Sailors S2) = S.age

38 Να βρεθεί η ηλικία του νεώτερου ναυτικού για κάθε τιμή διατίμησης (rating).
Με τη χρήση της συνιστώσας GROUP BY διατυπώνεται ως εξής: SELECT S.rating, MIN (S.age) FROM Sailors S GROUP BY S.rating Ο πίνακας της απάντησης

39 Να βρεθεί η ηλικία του νεότερου ενήλικα ναυτικού (ηλικία >= 18), για κάθε τιμή διατίμησης με τουλάχιστον 2 ενήλικες ναυτικούς SELECT S.rating, MIN (S.age) FROM Sailors S WHERE S.age >= 18 GROUP BY S.rating HAVING COUNT (*) > 1 Μόνο τα S.rating και S.age αναφέρονται στις συνιστώσες SELECT, GROUP BY και HAVING. Τα άλλα παιδία είναι `μη αναγκαία’. Η 2η στήλη του αποτελέσματος είναι ανώνυμη (Μπορεί να πάρει όνομα με τη χρήση του AS). Ο πίνακας της απάντησης

40 Πληροφοριακό Σύστημα Ολοκληρωμένο σύστημα που περιλαμβάνει
Αρχές, διαδικασίες, οργανωτική δομή Προσωπικό δεδομένα Υλικό, εγκαταστάσεις, δίκτυα επικοινωνιών και λογισμικό Που αλληλεπιδρούν μεταξύ τους και με το περιβάλλον με σκοπό την παραγωγή και διαχείριση πληροφορίας για την υποστήριξη των λειτουργιών ενός οργανισμού.

41 Στοιχεία Πληροφοριακού Συστήματος
Δεδομένα Άνθρωποι Υλικό Λογισμικό Διαδικασίες

42 Ο οργανισμός ως σύστημα
πληροφορίες Υποσύστημα Διοίκησης εντολές, παραγγελίες Στόχοι, επιδιώξεις λειτουργίας Υποσύστημα Παραγωγής οδηγίες Πληροφοριακό υποσύστημα στοιχεία απόδοσης και λειτουργίας

43 Ο ρόλος του Π.Σ. Φυσικό υποσύστημα Υποσύστημα διοίκησης
Input: πρώτη ύλη, παραγγελίες, οδηγίες Output: προϊόν Υποσύστημα διοίκησης Input: πληροφορίες Output: εντολές Πληροφοριακό υποσύστημα: μεσάζων Μετασχηματισμός δεδομένων από φυσικό υποσύστημα σε πληροφορίες για τη διοίκηση Διαβιβάζει τις οδηγίες της διοίκησης στο φυσικό υποσύστημα Ενδιάμεσο με το περιβάλλον

44 Συμπεράσματα Το πληροφοριακό σύστημα
Είναι ο συνεκτικός κρίκος των υποσυστημάτων ενός οργανισμού (απαίτηση για ευελιξία) Λειτουργεί όπως το κυκλοφοριακό σύστημα σε ένα οργανισμό Στοχεύει στη βέλτιστη λειτουργία του όλου συστήματος Συνεισφέρει στη δημιουργία αλλαγών ώστε ο οργανισμός να προσαρμόζεται στο περιβάλλον του (απαίτηση για προσαρμοστικότητα)

45 Κύκλος ζωής Π.Σ. (1/3) Διερευνητική μελέτη Μελέτη σκοπιμότητας
Φάση Ενέργειες Παρατηρήσεις Διερευνητική μελέτη Ορισμός συστήματος και προβλήματος Παρουσίαση εναλλακτικών λύσεων Επιλογή λύσης για μελέτη Μελέτη σκοπιμότητας Εφικτότητα υλοποίησης λύσης Εναλλακτικοί τρόποι υλοποίησης Ανάλυση κόστους/οφέλους Περιγραφή λύσης που θα υλοποιηθεί Ανάλυση απαιτήσεων Λειτουργίες συστήματος Ειδικές απαιτήσεις Κριτήρια επικύρωσης/αποδοχής προϊόντων Περιγραφή ΤΙ θα κάνει το σύστημα

46 Κύκλος ζωής Π.Σ. (2/3) Σχεδιασμός συστήματος Υλοποίηση Φάση Ενέργειες
Παρατηρήσεις Σχεδιασμός συστήματος Δομή συστήματος Εξοπλισμός (υλικό/λογισμικό) Απαιτούμενες Διαδικασίες Προδιαγραφές δοκιμών ελέγχου ΠΩΣ θα λειτουργεί το σύστημα (αναλυτικά) Τεχνικές προδιαγραφές υλικού/λογισμικού Υλοποίηση Εφικτότητα υλοποίησης λύσης Εναλλακτικοί τρόποι υλοποίησης Ανάλυση κόστους/οφέλους Τεκμηρίωση υλικού/λογισμικού και διαδικασιών

47 Κύκλος ζωής Π.Σ. (3/3) Εγκατάσταση Λειτουργία - Συντήρηση Φάση
Ενέργειες Παρατηρήσεις Εγκατάσταση Έλεγχος λειτουργίας συστήματος Μετάπτωση από το παλαιό στο νέο Εγχειρίδια οδηγιών Παραλαβή συστήματος Λειτουργία - Συντήρηση Ενέργειες για ομαλή λειτουργία και συνεχή βελτίωση (προσθήκες, αλλαγές, βελτιώσεις)

48 Ψηφιακές Βιβλιοθήκες

49 Παραδείγματα

50

51 biology Canadian Biochemical Society

52

53

54

55 Παράδειγμα Ψηφιακής Βιβλιοθήκης με Μουσική
PATRON – μια Ψηφιακή Βιβλιοθήκη πολυμέσων για μουσική … performing arts

56 Εξαγωγή Χωρικής Πληροφορίας
Εξαγωγή ονομάτων οντοτήτων για αναγνώριση, κωδικοποίηση και ευρετηρίαση όλων των αναφερόμενων τοποθεσιών σε κάθε άρθρο Αυτόματη δημιουργία χαρτών που συνοψίζουν και ακολουθούν την εξέλιξη κάθε άρθρου Κάνει δυνατή την αναζήτηση σε άρθρα που αφορούν την περιοχή που οριοθετεί ο χρήστης

57

58

59 Τι είναι «Βιβλιοθήκη» / «Αρχείο»
Τι είναι «Βιβλιοθήκη» ή «Αρχείο» ή … Χώρος συγκέντρωσης, φύλαξης, διατήρησης, περιφρούρησης, οργάνωσης και διάθεσης της πληροφορίας Τι είναι «Ψηφιακή Βιβλιοθήκη» ή … Συγκέντρωση (ή εξασφάλιση πρόσβασης) πληροφορίας (περιεχόμενο) Σε ψηφιακά μέσα Οργανωμένο για εύκολη πρόσβαση Δεν είναι η «Αυτοματοποιημένη βιβλιοθήκη»

60 Ορισμοί Ψηφιακής Βιβλιοθήκης
Χαλαρός ορισμός: Οποιαδήποτε online συλλογή τεκμηρίων Αυστηρός ορισμός: Πλήρη κείμενα (Full text) / υψηλή ποιότητα μέσων Πλούσια μορφοποίηση τεκμηρίων Εξελιγμένες δυνατότητες αναζήτησης Αληθινή πλοήγηση υπερκειμένου Ασθενής ορισμός Ισχυρός ορισμός

61 Η Έννοια της «Ψηφιακής Βιβλιοθήκης»
«...η έννοια της "ψηφιακής βιβλιοθήκης" δεν ισοδυναμεί απλά με μια ψηφιοποιημένη συλλογή με εργαλεία διαχείρισης πληροφορίας. Αφορά μάλλον ένα περιβάλλον το οποίο ενώνει συλλογές, υπηρεσίες και ανθρώπους για την υποστήριξη ολόκληρου του κύκλου ζωής της δημιουργίας, διάχυσης, χρήσης και συντήρησης δεδομένων, πληροφορίας και γνώσης.» Santa Fe planning workshop on distributed knowledge work environments, Digital Library Initiative (DLI), March 1997

62 Τι είναι οι «Ψηφιακές Βιβλιοθήκες»
Είναι Βάσεις Δεδομένων που Έχουν ψηφιακά αντικείμενα Είναι περισσότερο κατανεμημένες Έχουν περισσότερη ανομοιογένεια Έχουν λιγότερες δυνατότητες αναζήτησης Έχουν λιγότερες ενημερώσεις Είναι μηχανές αναζήτησης που Έχουν διαδικασία πρόσκτησης / καταχώρησης Είναι λιγότερο κατανεμημένες Έχουν περισσότερα μεταδεδομένα Δεν περιέχουν παραπλανητικά μεταδεδομένα επίσημη

63 Γνώση Χρηστών & Διαδικασιών
Ανάμεσα σε Ιστό και ΒΔ Ιστός ΒΔ Ψηφιακές Βιβλιοθήκες Γνώση Χρηστών & Διαδικασιών Δόμηση δεδομένων

64 Ο Ιστός δεν είναι Ψηφιακή Βιβλιοθήκη
Η πληροφορία στον Ιστό Δεν είναι (αρκετά) δομημένη Έχει απλοϊκή διεπαφή (μηχανές αναζήτησης) Είναι δύσκολο να ανακτηθεί (πλήρως) Είναι παροδική Είναι συχνά παραπλανητική Δεν έχει διαδικασία πρόσκτησης Αλλά συχνά μια Ψηφιακή Βιβλιοθήκη είναι προσπελάσιμη από τον Ιστό

65 Χαρακτηριστικά Ψηφιακής Βιβλιοθήκης
Ηλεκτρονικά – Ψηφιακά μορφότυπα Δικτυωμένη (διαμοιραζόμενη πληροφορία) Προφανής οργάνωση (βιβλιοθήκης, όχι σωρού) Πολιτική ανάπτυξης συλλογών Συστηματική δόμηση και χαρακτηρισμός δεδομένων Χρήση πολιτικών (και «fair policy») Μονιμότητα Καθοδήγηση και αναφορές

66 Ψηφιακό Αντικείμενο Κάθε είδους ψηφιακή πληροφορία
Εικόνες Ήχο – μουσική Βίντεο Προγράμματα υπολογιστών Πολυμέσα Αποθηκευμένο και μεταφερόμενο ψηφιακό περιεχόμενο Απλά αρχεία Εξελιγμένα – περίπλοκα αντικείμενα Πως θα είναι τα «ψηφιακά άπαντα του Καβάφη»;

67 Έννοιες μιας Ψηφιακής Βιβλιοθήκης
Τα συστατικά μιας ψηφιακής βιβλιοθήκης ονομάζονται "ψηφιακά αντικείμενα" (digital objects) Αυτά αποθηκεύονται σε "αποθετήρια δεδομένων" (repositories) Αναγνωρίζονται από τα "προσδιοριστικά" (handles) Οι πληροφορίες που είναι αποθηκευμένες σε ένα ψηφιακό αντικείμενο ονομάζεται "περιεχόμενο" (content) Αυτό διαχωρίζεται σε "δεδομένα" (data) και πληροφορίες για αυτά, τις "ιδιότητες" (properties) ή μεταδεδομένα

68 Βασικές Συνιστώσες Δομής Τυπικής Ψηφιακής Βιβλιοθήκης
Διεπαφή με τον χρήστη (User interfaces) Αποθετήριο δεδομένων (Repository) Σύστημα προσδιορισμού (ή ονοματολογίας, Handle system) Σύστημα αναζήτησης (Search system)

69 Ψηφιακή Βιβλιοθήκη – Σχηματικά
Υπηρεσίες Ψηφιακών Βιβλιοθηκών Αποθετήριο 1 Αποθετήριο 2 Αποθετήριο N Παροχείς Υπηρεσιών Ψηφιακών Βιβλιοθηκών Ψηφιακά αντικείμενα στα Αποθετήριο Εκδότες Χρήστες Βιβλιοθήκης Ψηφιακά αντικείμενα εκτός Αποθετηρίων

70 Μεταδεδομένα

71 Αναγκαιότητα Μεταδεδομένων
Ο Παγκόσμιος Ιστός είναι περιβάλλον αχανές ετερογενές κατανεμημένο δυναμικά μεταβαλλόμενο Πώς ενοποιείται η πρόσβαση σε πηγές ψηφιακής βιβλιοθήκης; Τα μεταδεδομένα είναι κλειδί για τη λύση: είναι η ταυτότητα του Ψηφιακού Αντικειμένου

72 Μεταδεδομένα Είναι «Δομημένα δεδομένα για άλλα δεδομένα»
Δομημένα δεδομένα για πόρους, που μπορεί να υποστηρίξουν ένα μεγάλο εύρος λειτουργιών Καταλογογράφηση, Απογραφή / Μητρώο … Τα μεταδεδομένα καθιστούν δυνατή Την ταξινόμηση του υλικού Την οργάνωση και συσχέτιση αρχείων – πιθανά σύνθετων, μη δομημένων και ενδεχόμενα τεραστίου μεγέθους

73 Dublin Core simple 15 προαιρετικά και επαναλαμβανόμενα πεδία
Σε 3 κατηγορίες: Περιεχόμενο Πνευματική Ιδιοκτησία Στιγμιότυπο Τα μεταδεδομένα συγκρίνονται άμεσα Συστήνουν ανταλλαγή με RDF/XML

74 Dublin Core: Τα 15 Στοιχεία
Τίτλος / Title Θέμα / Subject Περιγραφή / Description Πηγή / Source Γλώσσα / Language Σχέση / Relation Κάλυψη / Coverage Δημιουργός / Creator Εκδότης / Publisher Συντελεστής / Contributor Δικαιώματα / Rights Ημερομηνία / Date Τύπος / Type Μορφότυπο / Format Κωδικός / Identifier

75 Τα Στοιχεία Μεταδεδομένων του Dublin Core
Διεπιστημονική ομοφωνία σε απλά σύνολα στοιχείων για ανακάλυψη πόρων 15 στοιχεία (πεδία μεταδεδομένων) όλα προαιρετικά όλα επαναλαμβανόμενα Δεν προορίζεται για περιγραφή περίπλοκων πόρων Η αρχική ιδέα των «απλών αντικειμένων – σαν τεκμήρια» Απλότητα στη σημασιολογία, ευκολία χρήσης Παρέχει βασική «σημασιολογική διαλειτουργικότητα» Μεταξύ επιστημονικών περιοχών, μεταξύ γλωσσών Δεν παρέχει λεπτομερείς κανόνες καταλογογράφησης Επιτρέπει επεκτασιμότητα – σε άλλες κατηγορίες πόρων across domains

76 Χρήση του Dublin Core Είναι βασικός πυρήνας στοιχείων
Δεν είναι υποκατάστατο σε πλουσιότερα περιγραφικά πρότυπα Παρέχει 15 «παράθυρα» από πλουσιότερη περιγραφή πόρων Φανερώνει πλούσιες περιγραφές σε απλή μορφή Σημασιολογικά σταυροδρόμια, αντιστοιχίσεις σε υπάρχοντα δεδομένα

77 Περιγραφή σε Dublin Core
Πλούσια περιγραφή Περιγραφή σε «DC Simple» title creator date desc rights Το Dublin Core είναι περισσότερο αντικείμενο εξαγωγής – παρά δημιουργίας

78 Ανάκτηση Πληροφορίας ΠΩΣ εκφράζουμε ανάγκες πληροφόρησης (queries)
ΠΩΣ εντοπίζουμε και ανακτούμε πληροφορίες που ικανοποιούν τις ανάγκες ΠΩΣ αξιολογούμε τα αποτελέσματα της αναζήτησης

79 Information Retrieval System
Input Document classification Processor Search strategy Documents Output queries feedback

80 Information retrieval process
ranked docs User Interface user feedback user need Text Operations (tokenization, stopwords, stemming, etc.) text DB manager Indexing Query operations query Searching Docs database Retrieved docs Index Ranking

81 IR = < D, Q, F, R(qi, dj)>
Ανακεφαλαίωση IR = < D, Q, F, R(qi, dj)> D: documents Q: queries F: πλαίσιο αναπαράστασης κειμένων R: συνάφεια query qi με κείμενο dj αριθμός  0-1


Κατέβασμα ppt "Από τη διαχείριση πληροφορίας στη διαχείριση γνώσης"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google