Βάσεις Δεδομένων ΙΙ 2004-2005 Ευαγγελία Πιτουρά 1 Βάσεις Διαδικτύου.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Advertisements

Κατηγορηματικός Λογισμός
Τεχνολογίες Web Απαραίτητες γνώσεις για την υλοποίηση της άσκησης.
Δομές Δεδομένων και Αλγόριθμοι
ΚΕΙΜΕΝΟ  Ο πρώτος τρόπος απεικόνισης πληροφορίας (και βασικός ως σήμερα).  Αδυναμία πρώτων υπολογιστών να χειριστούν άλλη μορφή πληροφορίας.  Πρόβλημα.
Να περιγράψετε τους 2 τρόπους οργάνωσης Ιστοσελίδων
ΕΝΟΤΗΤΑ 4 – Κεφάλαιο 12: Ο Παγκόσμιος Ιστός – Εισαγωγή στην έννοια του Υπερκειμένου Λέξεις Κλειδιά: Διαδίκτυο, Παγκόσμιος Ιστός (World Wide Web), ιστοσελίδα.
Η γλώσσα μορφοποίησης υπερκειμένου HTML
ΣΤΟΙΧΕΙΑ ΨΕΥΔΟΚΩΔΙΚΑ ΒΑΣΙΚΕΣ ΔΟΜΕΣ ΒΑΣΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΩΝ
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων.
1 ΠΟΛΥΜΕΣΑ ΚΑΙ ΔΙΚΤΥΑ Μάθημα 1 ο : Μέσα και πολυμέσα Εισηγήτρια:Αναστασία Κατρανίδου.
ΘΠ06 - Μεταγλωττιστές Πίνακας Συμβόλων. Πίνακας Συμβόλων (Symbol Table) (Ι)  Είναι μια δομή στην οποία αποθηκεύονται τα ονόματα ενός προγράμματος και.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων.
ΕΝΟΤΗΤΑ 4 – Κεφάλαιο 12: Ο Παγκόσμιος Ιστός – Εισαγωγή στην έννοια του Υπερκειμένου Το 1989 ο Τιμ Μπέρνερς μέλος του κέντρου cern επινόησε τον παγκόσμιο.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Ευρετήρια.
Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr
ΗΥ302 Διδακτική της Πληροφορικής Η γλώσσα προγραμματισμού LOGO Writer Ομάδα Εργασία: Αλεβίζου Βασιλική (Α.Μ.:1029) Κοφφινά Ιωάννα (Α.Μ.:1035) Τριανταφυλλίδου.
ΘΠ06 - Μεταγλωττιστές Πίνακας Συμβόλων Φροντιστήριο - 30/04/2009.
E X a M p L e Αξιοποιώντας την τεχνολογία XML στη διαχείριση της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεδιασμός Σχεσιακών Σχημάτων.
Επικοινωνία Ανθρώπου Μηχανής HTML CGI JAVASCRIPT Κουμπούλης Χρήστος Α.Μ. 921 Χαλαβαζής Βασίλης Α.Μ. 988.
ΠΜΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ The Digital Library and Computational Philology: The BAMBI Project Γόντικα Ειρήνη.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ορισμοί Σχεσιακού Μοντέλου και Τροποποιήσεις Σχέσεων.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΙΜΙΟ Τμήμα Αρχειονομίας-Βιβλιοθηκονομίας Εργασία στο μάθημα της Ηλεκτρονικής Δημοσίευσης ΘΕΜΑ:SGML και PDF-Γιατί χρειαζόμαστε και τα δύο;
Γράφημα TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A Συνδυαστικό αντικείμενο που αποτελείται από.
Σημασιολογική Ολοκλήρωση Ολοκλήρωση Πληροφορίας Το πρόβλημα της ολοκλήρωσης πληροφορίας (information integration) προκύπτει από την ύπαρξη ετερογενών.
Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό.
Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό.
Εισαγωγή στην XML Μ. ΓΑΒΑΛΑΣ.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Επεξεργασία Ερωτήσεων.
Επιστημονικός Υπολογισμός Ι Πρώτο Εργαστήριο Εισαγωγή στο matlab 15 Οκτωβρίου 2010 Γιώργος Δρακόπουλος ΤΜΗΥΠ.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Λογικός Σχεδιασμός Σχεσιακών Σχημάτων.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Επεξεργασία Ερωτήσεων.
Διαδίκτυο Κίκα Χρυσοστόμου. Υπάρχει η δυνατότητα ενσωμάτωσης μιας φόρμας σε μια ιστοσελίδα. Μπορούμε να συμπληρώσουμε κάποια στοιχεία και να τα υποβάλουμε.
ΕΝΟΤΗΤΑ 4 – Κεφάλαιο 12: Ο Παγκόσμιος Ιστός – Εισαγωγή στην έννοια του Υπερκειμένου Λέξεις Κλειδιά: Λέξεις Κλειδιά: Διαδίκτυο, Παγκόσμιος Ιστός (World.
1Κεφάλαιο 4 Κανόνες Σύνταξης HTML Όλες οι ετικέτες εσωκλείονται μεταξύ των χαρακτήρων “ “. Κάθε τι που βρίσκεται μεταξύ των χαρακτήρων “ ”, αποτελεί σχόλιο.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή Σχεδιασμός μιας ΒΔ ανάλυση ποιας πληροφορίας και της σχέσης ανάμεσα στα στοιχεία της περιγραφή.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή Σχεδιασμός μιας ΒΔ ανάλυση ποιας πληροφορίας και της σχέσης ανάμεσα στα στοιχεία της περιγραφή.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Επεξεργασία Ερωτήσεων.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Επεξεργασία Ερωτήσεων.
Εφαρμογές Πολυμέσων: Εισαγωγή στην HTML (1)
ΠΡΙΝ ΞΕΚΙΝΗΣΟΥΜΕ Πράγματα που αξιολογείτε θετικά σε σχέση με το μάθημα του προηγούμενου τετραμήνου Πράγματα που θα μπορούσαν να βελτιωθούν.
Γλώσσες Προγραμματισμού Μεταγλωττιστές Πίνακας Συμβόλων Πανεπιστήμιο Μακεδονίας Τμήμα Εφαρμοσμένης Πληροφορικής Ηλίας Σακελλαρίου.
Βάσεις Δεδομένων και Παγκόσμιος Ιστός IR και Μηχανές αναζήτησης.
Γράφημα Συνδυαστικό αντικείμενο που αποτελείται από 2 σύνολα:
Ευρετήρια Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Το Σχεσιακό Μοντέλο Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Δυναμικός Κατακερματισμός
Δεντρικά Ευρετήρια Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Παιδαγωγικές εφαρμογές Η/Υ
Εργασία στο μάθημα «Προγραμματισμός ΙΙ»
ΔΙΑΔΙΚΤΥΟ, WEB2.0 KAI WEB X Από τον WEB 1.0 στον WEB X.0
Παιδαγωγικές εφαρμογές Η/Υ
Το Σχεσιακό Μοντέλο Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Κεφαλαιο 11 ΕΙΣΑΓΩΓΗ ΣΤΗΝ HTML.
Πίνακας Συμβόλων Διαλέξεις στο μάθημα: Μεταφραστές Γιώργος Μανής.
Δεντρικά Ευρετήρια Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Εφαρμογές Πληροφορικής Κεφάλαιο 11
Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον ΑΕΠΠ
ΕΝΟΤΗΤΑ 4 – Κεφάλαιο 12: Ο Παγκόσμιος Ιστός – Εισαγωγή στην έννοια του Υπερκειμένου Λέξεις Κλειδιά: Διαδίκτυο, Παγκόσμιος Ιστός (World Wide Web), ιστοσελίδα.
19η Διάλεξη Εξωτερική Αναζήτηση και Β-δέντρα Ε. Μαρκάκης
Μάθημα 6ο Ανάλυση Κειμένου και Δεικτοδότηση
Το Σχεσιακό Μοντέλο Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Δυναμικός Κατακερματισμός
Μεταγράφημα παρουσίασης:

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 1 Βάσεις Διαδικτύου

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 2 Θέματα Εισαγωγή στην XML Ευρετήρια για την Ανάκτηση Κειμένων Ο αλγόριθμος HITS

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 3 Τι είναι η XML Mark-up Γλώσσες (Γλώσσες Σημειοθέτησης) HTML ετικέτες (tags) για την αναπαράσταση της δομής των εγγράφων XML (Extensible Markup Language) δε διαθέτει μια συγκεκριμένη συλλογή ετικετών με σταθερή και καθορισμένη σημασία Αντίθετα, ο χρήστης μπορεί να ορίσει δικές του ετικέτες – που συνήθως αφορούν τη σημασία του περιεχομένου

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 4 Παράδειγμα XML Richard Feymann Απλά και εμφωλευμένα στοιχεία (elements/sub-elements) Ετικέτα αρχής ( ) και ετικέτα τέλους ( )

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 5 Παράδειγμα XML Richard Feymann Γνωρίσματα (Attributes) περιγραφικές πληροφορίες για τα στοιχεία att = “value”

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 6 Richard Feymann The Character of Physical Law 1980 R. K Narayan The Character of Physical Law 1981

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 7 R. K Narayan The English Teacher 1980 Παράδειγμα XML Ορθά Διαμορφωμένο ( well-formed)  Ξεκινά με δηλωτικό  Υπάρχει στοιχείο ρίζα  Κατάλληλα εμφωλευμένα στοιχεία

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 8 Μια δήλωση DTD είναι ένα σύνολο από κανόνες που επιτρέπουν στο χρήστη να ορίζει το δικό του σύνολο στοιχείων και γνωρισμάτων Έγκυρο έγγραφο όταν συνοδεύεται από μια αντίστοιχη DTD και το έγγραφο είναι δομημένο σύμφωνα με τους κανόνες που ορίζει η DTD XML DTD

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 9 <!DOCTYPE BOOKLIST [ ]> Παράδειγμα DTD

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 10 <!DOCTYPE BOOKLIST [ ]> Παράδειγμα DTD Γενικό σχήμα <!DOCTYPE name [ DTDDeclaration ] > Στοιχείο ρίζα

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 11 <!DOCTYPE BOOKLIST [ ]> Παράδειγμα DTD * 0 ή περισσότερα + 1 ή περισσότερα ? Προαιρετική εμφάνιση, subelements

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 12 <!DOCTYPE BOOKLIST [ ]> Παράδειγμα DTD * 0 ή περισσότερα + 1 ή περισσότερα ? Προαιρετική εμφάνιση, subelements

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 13 <!DOCTYPE BOOKLIST [ ]> Παράδειγμα DTD #PCDATA δηλώνει στοιχεία με μορφή χαρακτήρων

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 14 Παράδειγμα DTD Γενικά Όπου contenttype  Άλλα στοιχεία  #PCDATA  EMPTY  Κανονική έκφραση exp1, exp2, exp3, … exp* exp? exp+ exp1 | exp2

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 15 <!DOCTYPE BOOKLIST [ ]> Παράδειγμα DTD attType: τύποι απαρίθμησης ή τύποι συμβολοσειράς

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 16 XML XQuery: Γλώσσα ερωτήσεων για XML δεδομένα Τεχνικές  Για την αποθήκευση δεδομένων σε σχεσιακές βάσεις δεδομένων  Ειδικές (native) βάσεις δεδομένων για αποθήκευση εγγράφων XML

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 17 Θέματα Εισαγωγή στην XML Ευρετήρια για την Ανάκτηση Κειμένων Ο αλγόριθμος HITS

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 18 Ευρετηριοποίηση για την Ανάκτηση Κειμένων Βάση κειμένων: συλλογή από έγγραφα Αναζήτηση με μια λέξη κλειδί (keyword queries) Αίτημα Boole (t 11  t 12  …  t i11 )  (t 21  t 22  …  t 2i2 )  …. (t j1  t j2  …  t jij ) Αίτημα Διαβάθμισης (Ranking)

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 19 Ευρετηριοποίηση για την Ανάκτηση Κειμένων Παράδειγμα Rid Λέξεις-Κλειδιά 1agent James Bond 2agent mobile computer 3James Madison movie 4James Bond movie Παράδειγμα ερωτήσεων

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 20 Ανεστραμμένο Αρχείο Μια ταξινομημένη λίστα (ανεστραμμένη λίστα) για κάθε όρο Ευρετήριο Λεξιλογίου: Για τον ταχύτερο εντοπισμό της λίστας για κάθε όρο: Το σύνολο των όρων μπορεί να οργανωθεί με τη χρήση μιας δομής ευρετηρίου (π.χ. Β+-δέντρο) Παράδειγμα Ένας όρος, σύζευξη, διάζευξη

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 21 Αρχείο Υπογραφών Υπογραφή εγγράφου (File Signature) Μια εγγραφή ευρετηρίου για κάθε έγγραφο στη βάση δεδομένων Σταθερό μήκος bits – εύρος υπογραφής Υ1 ταιριάζει με Υ2, Υ1 τουλάχιστον τα 1 που έχει και η Υ2 Εσφαλμένη διάγνωση (false positive) Παράδειγμα Ένας όρος, σύζευξη, διάζευξη

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 22 Αρχείο Υπογραφών Αρχείο υπογραφών με κατακόρυφο διαμερισμό σε μονοψήφιες στήλες: Διαμερίζουμε ένα αρχείο υπογραφών σε ένα σύνολο κατακόρυφων δυαδικών στηλών Για κ άσσους ανάκτηση κ-στηλών

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 23 Θέματα Εισαγωγή στην XML Ευρετήρια για την Ανάκτηση Κειμένων Αναζητήσεις λέξεων κλειδιών στο διαδίκτυο: Ο αλγόριθμος HITS

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 24 O Αλγόριθμος HITS Δύο τύποι σελίδων Αυθεντική Μια σελίδα που είναι αυθεντία σε ένα θέμα και αναγνωρίζεται ως τέτοια από άλλες σελίδες (δηλαδή, υπάρχουν πολλοί σύνδεσμοι σε αυτήν) Κομβικοί Μια σελίδα που αναφέρεται σε μια αυθεντική σελίδα

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 25 O Αλγόριθμος HITS Το web ως ένας κατευθυνόμενος γράφος Κόμβοι: ιστοσελίδες Ακμή από Α στον Β: η ιστοσελίδα Α έχει έναν υπερ-σύνδεσμο στην ιστοσελίδα Β Ο αλγόριθμος σε 2 φάσεις: Φάση Ι: (δειγματοληπτικό στάδιο) ένα σύνολο σελίδων που αποτελεί το βασικό σύνολο Φάση ΙΙ: (επαναληπτικό στάδιο) επεξεργασία του βασικού συνόλου για τον εντοπισμό καλών αυθεντικών και κομβικών ιστοσελίδων

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 26 O Αλγόριθμος HITS Φάση Ι: Υπολογισμός βασικού συνόλου 1. Υπολογισμός αρχικού συνόλου: σύνολο-ρίζα Κλασικοί μέθοδοι: πχ ανάκτηση όλων των σελίδων που περιέχουν τις λέξεις κλειδιά (περιμένουμε ότι θα περιέχει (τουλάχιστον) αναφορές προς σχετικές σελίδες) 2. Σελίδες-σύνδεσμοι: σελίδα που είτε συμπεριλαμβάνει σύνδεσμο που να αναφέρεται στο σύνολο ρίζα είτε το σύνολο ρίζα περιέχει σύνδεσμο που αναφέρεται σε αυτήν Βασικό Σύνολο: διεύρυνση του συνόλου-ρίζα ώστε να περιλαμβάνει και τις σελίδες συνδέσμους – Βασικές ιστοσελίδες

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 27 O Αλγόριθμος HITS Φάση ΙΙ: Ποιες βασικές ιστοσελίδες είναι κόμβοι και αυθεντίες Κάθε βασική σελίδα p δύο τιμές: h p - Συντελεστής Κομβικού Ρόλου (πολλούς δείκτες σε αυθεντικές) a p - Συντελεστής Αυθεντικότητας (πολλοί δείκτες από κομβικές σε αυτήν) Αρχικοποίηση,  p, h p = 1 και α p = 1 Επαναληπτικά, αυξάνεται a p = Σ h q Βασικές σελίδες q που δείχνουν στην p h p = Σ α q Βασικές σελίδες q στις οποίες δείχνει η p

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 28 O Αλγόριθμος HITS Έστω το βασικό σύνολο σελίδων {1, 2,..., n} Πίνακας Γειτνίασης (adjacency matrix) B: n x n B[i, j] = 1 αν η σελίδα i περιέχει σύνδεσμο που δείχνει στη σελίδα j Έστω h = το διάνυσμα συντελεστών κομβικών ρόλων και α = το διάνυσμα συντελεστών αυθεντικότητας

Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 29 O Αλγόριθμος HITS Οι κανόνες ενημέρωσης h = B aa = B Τ h 1η επανάληψη h = B B Τ h = (B B Τ ) ha = B T B a = (B T B) a 2η επανάληψη h = (B B Τ ) 2 ha = (B T B) 2 a Σύγκλιση στα ιδιοδιανύσματα του ΒΒ Τ και Β Τ Β αν κανονικοποιηθούν αρχικά οι συντελεστές