ΑΠΟΘΗΚΕΣ ΚΑΙ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
«Πρόγραμμα Αναμόρφωσης Προπτυχιακών Προγραμμάτων Σπουδών Γ.Π.Α.» Σεμινάριο Επιμόρφωσης Διδακτικού Προσωπικού Οι τεχνολογίες της Πληροφορικής και των Επικοινωνιών.
Advertisements

“Recommendation systems” Σπύρος Συρμακέσης, Επίκουρος Καθηγητής
Εν. 6.5 & 6.6 Ειδικού Μέρους Ανάπτυξη, εφαρμογή και αξιολόγηση εκπαιδευτικού σεναρίου Νότα Σεφερλή
Διάγραμμα Παρουσίασης
Χαρακτηριστικά Απλό & Φιλικό περιβάλλον εργασίας
ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Εισαγωγή στις Βάσεις Δεδομένων για Μαθητές Λυκείων και Τεχνικών Σχολών Δημήτρης Ζεϊναλιπούρ Λέκτορας Τμήμα Πληροφορικής,
ΠΜΣ ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Κατεύθυνση ΤΕΔΑ Τεχνολογίες Διαχείρισης Ασφάλειας Security Management Engineering Τμήμα Πληροφορικής ΠΑΝΕΠΙΣΤΗΜΙΟ.
Α. Νανόπουλος & Γ. Μανωλόπουλος Εισαγωγή στην Εξόρυξη & τις Αποθήκες Δεδομένων Κεφάλαιο 3: Αποθήκες Δεδομένων και OLAP
 Αυδίκου Χριστίνα  Γιουμούκης Παναγιώτης  Κιντσάκης Θάνος  Πάπιστας Γιάννης.
δφσδφ ΦΥΣΙΚΟ ΕΠΙΠΕΔΟ ΑΠΟΘΗΚΩΝ ΔΕΔΟΜΕΝΩΝ: ΜΕΡΟΣ Α’ 4/6/2017
Πληροφοριακά Συστήματα Διοίκησης
Μηχανική Μάθηση και Εξόρυξη Γνώσης
Η ποιότητα της πληροφορίας στο εκπαιδευτικό υλικό που χρησιμοποιείται ή διανέμεται μέσω του Internet Χρήστος Σαβρανίδης Πανεπιστήμιο Ιωαννίνων Τμήμα ΦΠΨ.
1 Εισαγωγή στις Βάσεις Δεδομένων  Ανάγκη Αποθήκευσης και Διαχείρισης Δεδομένων  Συστήματα Αρχείων  Συστήματα Βάσεων Δεδομένων  Παραδοσιακές και Σύγχρονες.
ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ
Εν. 2.4 Γενικού Μέρους Εν. 6.5 & 6.6 Ειδικού Μέρους Το εκπαιδευτικό σενάριο Νότα Σεφερλή
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ
ΕΥΡΕΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΕΚΤΟΠΩΝ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Διαδικτυακή εφαρμογή ανάλυσης και επεξεργασίας δεδομένων κυβερνητικών διαβουλεύσεωνgov.insight Η. Ζαβιτσάνος, Γ. Γιαννακόπουλος, Γ. Παλιούρας Ινστιτούτο.
Οργάνωση πληροφοριών Ευρετηρίαση Μέρος Β Σχεδιασμός ευρετηρίων.
Συστήματα Στήριξης Αποφάσεων
1 Εισαγωγή στις Βάσεις Δεδομένων  Ανάγκη Αποθήκευσης και Διαχείρισης Δεδομένων  Συστήματα Αρχείων  Συστήματα Βάσεων Δεδομένων  Παραδοσιακές και Σύγχρονες.
Χρήστος Δ. Ταραντίλης, Λέκτορας ΔΕΤ Εφαρμογές Διοικητικής Επιστήμης ΙΙ.
ΠΟΛΥΜΝΙΑ - Ολοκληρωμένο Σύστημα Εργαλείων Μουσικής και Μουσική Πύλη
Δομές Δεδομένων (Data Structures) 3o Εξάμηνο Σπουδών Διδάσκων: Απόστολος Παπαδόπουλος και
Βλάσσης Νικόλαος Α.Μ Γεωργακόπουλος Παναγιώτης Α.Μ Δεπάστα Χαρίκλεια Α.Μ Κουτσιώρα Τριανταφυλλιά Α.Μ
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας Εργασία Μαθήματος Ψηφιακές Βιβλιοθήκες Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας.
Α. Νανόπουλος & Γ. Μανωλόπουλος Εισαγωγή στην Εξόρυξη & τις Αποθήκες Δεδομένων Κεφάλαιο 1: Εισαγωγή
Ημέρα 1η.
ΑΝΑΛΥΣΗ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ ΣΥΣΤΗΜΑΤΩΝ ΔΙΑΝΟΜΗΣ & ΜΕΤΑΦΟΡΩΝ
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
Ιστοεξερευνήσεις (Webquests) Ζαρταλούδη Σμαρώ Μαζαράκου Μάντυ.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΠΣ: «Επιστήμη Της Πληροφορίας: Διοίκηση Και Οργάνωση Βιβλιοθηκών Με Έμφαση Στις Νέες Τεχνολογίες.
Συστήματα Διαχείρισης της Μάθησης (CMS, LMS) Τα Συστήματα Διαχείρισης της Μάθησης (Learning Management Systems- ΣΔΜ ) παρέχουν ολοκληρωμένες υπηρεσίες,
Διδακτική προσέγγιση βασισμένη σε δραστηριότητες αξιοποιώντας το διαδίκτυο.
Network Inference Μπαλάφα Κασιανή - Αδριανή Πλασταρά Κατερίνα.
Προηγμένες υπηρεσίες προς τους Πολίτες Σταύρος Αλεξάκης Public Sector Lead– Microsoft Hellas.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ “ USING MILOS TO BUILD A MULTIMEDIA.
Μάθημα: «Ψηφιακές Βιβλιοθήκες» Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας Ιόνιο Πανεπιστήμιο Κωνσταντόπουλος Παναγιώτης
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας «Διοίκηση & Οργάνωση Βιβλιοθηκών.
Τεχνολογία Βάσεων Δεδομένων Εαρινό Εξάμηνο Διδάσκοντες: Απόστολος Παπαδόπουλος, Αναστάσιος Γούναρης Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή.
1 Διαχείριση Γνώσης Μ. Γεργατσούλης Χ. Παπαθεοδώρου.
ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Δρ. Παναγιώτης Συμεωνίδης
ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εισαγωγή Εξόρυξη Δεδομένων: Ακ. Έτος ΕΙΣΑΓΩΓΗ3 Εισαγωγή Τι είναι η Εξόρυξη Δεδομένων (με δυο λόγια) Αποδοτικές τεχνικές για.
Τεχνολογία ΛογισμικούSlide 1 Τεχνολογία Απαιτήσεων u Καθορίζει τι θέλει ο πελάτης από ένα σύστημα λογισμικού.
 Κύριο αντικείμενο της μελέτης είναι ο καθορισμός της μεθοδολογίας, των προτύπων (standards) και των διαδικασιών (procedures) για τις πρώτες και πιο.
Δρ. Αλέξανδρος Βακαλούδης.  Εξόρυξη δεδομένων (Data Mining)  Association Rules  Clustering  Classification  Στάδια για εξόρυξη δεδομένων  Επανάληψη.
ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Εισαγωγή. Συστάσεις Ι Ποιός είμαι εγώ: Γραφείο: Β.3 Προτιμώμενες ώρες γραφείου: 11:00-18:00 Ενδιαφέροντα Web mining,
Γιάννης Τζωρτζάκης Σχολικός Σύμβουλος ΠΕ12 Αξιολόγηση με Πίνακες Διαβαθμισμένων Κριτηρίων (rubrics) στη Δευτεροβάθμια Εκπαίδευση.
Η χρήση του περιεχομένου ως ψηφιακό περιεχόμενο Χρήστος Παπαθεοδώρου Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας, Ιόνιο Πανεπιστήμιο & Μονάδα Ψηφιακής Επιμέλειας,
Δομή & και Αξιολόγηση εκπαιδευτικών σεναρίων. Διδασκαλία μέσω παραδείγματος Ανοίξτε την παρακάτω ιστοσελίδα και διαβάστε το σενάριο βασισμένο στο «Πούσι»
Ανάπτυξη ΣΥΑ.
Κατή Αργυρώ Πρωτοψάλτου Θεόφιλος Τσαρτσαράκης Αντώνιος
ΤΙΤΛΟΣ ΕΡΓΑΣΙΑΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ανδρέου Βασίλης.
Τα καινοτόμα χαρακτηριστικά του Διαδικτύου και η ευρεία του αποδοχή από τις νεαρές ηλικίες καλλιέργησαν την ιδέα της αξιοποίησής του ως ένα εργαλείο στην.
Εισαγωγή στις βάσεις δεδομένων ISBN
Πρόγραμμα Προπτυχιακών Σπουδών Ροή Λ: Λογισμικό
Αρχές Διοίκησης και Διαχείρισης Έργων
Θέματα Σχεδίασης ΕΛ Πληροφορική και Εκπαίδευση 2005
Μεθοδολογία Έρευνας 3ο εξάμηνο
Επιχειρησιακός Σχεδιασμός και Διαχείριση Έργων
MOODLE- assessment tools
Βάσεις Δεδομένων και Παγκόσμιος Ιστός
ΔΙΔΑΚΤΙΚΗ ΑΞΙΟΠΟΙΗΣΗ ΤΩΝ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΣΤΟ ΜΑΘΗΜΑ ΤΗΣ ΙΣΤΟΡΙΑΣ:
ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Διαδικαστικά.
Σχεσιακεσ βασεισ δεδομενων
DATA MINING ΕΞΑΜΗΝΙΑΙΟ ΘΕΜΑ ΣΤΟ ΜΑΘΗΜΑ ‘ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ ΧΩΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΘΕΩΡΙΑ ΣΥΣΤΗΜΑΤΩΝ’
Επιχειρηματική Πολιτική και Στρατηγική
ΤΕΧΝΟΛΟΓΙΑ ΕΠΙΚΟΙΝΩΝΙΩΝ Πληροφοριακά Συστήματα Διοίκησης(Ε) 3ο Εξάμηνο
Μεταγράφημα παρουσίασης:

ΑΠΟΘΗΚΕΣ ΚΑΙ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ δφσδφ ΑΠΟΘΗΚΕΣ ΚΑΙ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ 4/17/2017 Δρ. Παναγιώτης Συμεωνίδης Εργ. Τεχνολογίας και Επεξεργασίας Δεδομένων Τμήμα Πληροφορικής Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών Αριστοτέλειο Πανεπιστήμιο Θεσ/νικης http://delab.csd.auth.gr/~symeon Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Αποθήκες Δεδομένων Η τεχνολογία των αποθηκών δεδομένων προσφέρει Η τεχνολογία των αποθηκών δεδομένων προσφέρει ολοκλήρωση ετερογενών πηγών δεδομένων και πλατφόρμα για αποδοτική ανάλυση ιστορικών δεδομένων Μία αποθήκη δεδομένων αποτελεί μία συλλογή δεδομένων που επιλέγονται από τις Επιχειρησιακές Βάσεις Δεδομένων, Ολοκληρώνονται (integrated), τα δεδομένα αναλύονται με διαδικασίες όπως η On-line Analytical Processing (OLAP) ή η εξόρυξη δεδομένων.

Ορισμός Αποθήκης Δεδομένων Σύμφωνα με τον (Inmon, 1992) ορίζουμε την αποθήκη δεδομένων ως μια συλλογή δεδομένων προσανατολισμένη προς ένα θέμα (subject-oriented), Π.χ. πωλήσεις, προϊόντα, πελάτες, κτλ. ολοκληρωμένη (integrated), Ενοποίηση ετερογενών δεδομένων, χρονικά μεταβαλλόμενη (time-variant), Ιστορικά δεδομένα Που δεν διαγράφεται (non-volatile) Με σκοπό την υποστήριξη λήψης αποφάσεων W.H. Inmon, Building the Data Warehouse, 1992 (ο εφευρέτης του όρου)

Αποθήκες δεδομένων – Λειτουργικά Χαρακτηριστικά Ιστορικά Δεδομένα Ο χρονικός ορίζοντας μιας αποθήκης δεδομένων είναι πολύ μεγαλύτερος από ότι ενός συστήματος σε λειτουργία Η ΒΔ έχει τα τωρινά δεδομένα ενώ οι αποθήκες διατηρούν και παλιά δεδομένα (πχ τα προηγούμενα 5-10 χρόνια) Τροποποιήσεις Οι τροποποιήσεις στις πηγές δεδομένων δεν φαίνονται άμεσα στις αποθήκες δεδομένων, συνήθως περιοδικά Μόνο δύο βασικές λειτουργίες: αρχικό φόρτωμα των δεδομένων (loading) και προσπέλαση δεδομένων (access)

Εξόρυξη Δεδομένων - Ορισμός δφσδφ 4/17/2017 Εξόρυξη Δεδομένων - Ορισμός Η εξαγωγή πληροφορίας από μεγάλες βάσεις δεδομένων: ενδιαφέρουσας νέας (μη γνωστής εκ των προτέρων) μη προφανούς χρήσιμης (αξιοποιήσιμης) Δρ. Παναγιώτης Συμεωνίδης – Αποθήκες και Εξόρυξη Δεδομένων 5 Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Δρ. Παναγιώτης Συμεωνίδης – Αποθήκες και Εξόρυξη Δεδομένων 6 δφσδφ 4/17/2017 Κίνητρο για εξόρυξη “Παντού δεδομένα…” Σχεσιακές βάσεις αποθήκες δεδομένων δεδομένα συναλλαγών (ATM, υπερκαταστήματα) χωρικά δεδομένα (GIS, δορυφόροι) δεδομένα χρονοσειρών πολυμεσικά δεδομένα (φωνή, εικόνα) δεδομένα Ιστού (logs, ιστοσελίδες) Αντί “προβλήματος”, πηγή πλεονεκτήματος Δρ. Παναγιώτης Συμεωνίδης – Αποθήκες και Εξόρυξη Δεδομένων 6 Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Δρ. Παναγιώτης Συμεωνίδης – Αποθήκες και Εξόρυξη Δεδομένων 7 δφσδφ 4/17/2017 Εξόρυξη ως διαδικασία Γνώση Αποτίμηση Προτύπων Εξόρυξη Δεδομένων Αποθήκη Δεδομένων Καθαρισμός Ανάδραση Βάσεις Δεδομένων Δρ. Παναγιώτης Συμεωνίδης – Αποθήκες και Εξόρυξη Δεδομένων 7 Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Είδη προτύπων αγόρασε (Χ, “Α”) à αγόρασε (Χ, “Β”) [1%, 75%] δφσδφ Είδη προτύπων 4/17/2017 Κανόνες συσχέτισης αγόρασε (Χ, “Α”) à αγόρασε (Χ, “Β”) [1%, 75%] Κατηγοριοποίηση κατάταξη πελατών ως καλούς ή μη, πιστωτές Ομαδοποίηση εύρεση ομάδων πελατών με κοινά ηλικιακά και εισοδηματικά δεδομένα Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

ΑΠΟΘΗΚΕΣ & ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ δφσδφ ΑΠΟΘΗΚΕΣ & ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ 4/17/2017 Εξόρυξη από τον Παγκόσμιο Ιστό Δεδομένα Δομής (PageRank, HITS) Δεδομένα Περιεχομένου Δεδομένα Χρήσης Εξόρυξη Δεδομένων Κατηγοριοποίηση Ομαδοποίηση Κανόνες Συσχέτισης Υλοποίηση Αποθηκών Δεδομένων Δημιουργία Κύβων Analysis Services Αποθήκες & Εξόρυξη Δεδομένων Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

ΣΚΟΠΟΣ ΤΟΥ ΜΑΘΗΜΑΤΟΣ Τρεις διδακτικοί στόχοι: δφσδφ ΣΚΟΠΟΣ ΤΟΥ ΜΑΘΗΜΑΤΟΣ 4/17/2017 Τρεις διδακτικοί στόχοι: Γνώση προχωρημένων θεμάτων Αποθηκών και Εξόρυξης Δεδομένων. Ικανότητα για κριτική αξιολόγηση ερευνητικών εργασιών στην Εξόρυξη Δεδομένων. Εφαρμογή αλγορίθμων Εξόρυξης Δεδομένων για την επίλυση προβλημάτων. Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

ΒΙΒΛΙΟΓΡΑΦΙΑ [1] Introduction to Data Mining (Tan, Steinbach, Kumar) δφσδφ ΒΙΒΛΙΟΓΡΑΦΙΑ 4/17/2017 [1] Introduction to Data Mining (Tan, Steinbach, Kumar) [2] Mining of Massive Datasets (Rajaraman, Leskovec, Ullman) [3] Εισαγωγή στην εξόρυξη και τις αποθήκες δεδομένων (Νανόπουλος, Μανωλόπουλος) Mining of Massive Datasets Anand Rajaraman Jure Leskovec Jeffrey D. Ullman Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

ΒΑΘΜΟΛΟΓΙΑ ΜΑΘΗΜΑΤΟΣ ΠΑΡΟΥΣΙΑΣΗ ΕΡΕΥΝΗΤΙΚΗΣ ΕΡΓΑΣΙΑΣ (2 μονάδες) δφσδφ ΒΑΘΜΟΛΟΓΙΑ ΜΑΘΗΜΑΤΟΣ 4/17/2017 ΠΑΡΟΥΣΙΑΣΗ ΕΡΕΥΝΗΤΙΚΗΣ ΕΡΓΑΣΙΑΣ (2 μονάδες) ΣΥΝΘΕΤΙΚΗ ΕΡΓΑΣΙΑ (3 μονάδες) ΕΞΕΤΑΣΕΙΣ (5 μονάδες) *Οι μονάδες αθροίζονται χωρίς προϋποθέσεις Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

ΠΑΡΟΥΣΙΑΣΗ ΕΡΕΥΝΗΤΙΚΗΣ ΕΡΓΑΣΙΑΣ δφσδφ ΠΑΡΟΥΣΙΑΣΗ ΕΡΕΥΝΗΤΙΚΗΣ ΕΡΓΑΣΙΑΣ 4/17/2017 Δυνατότητες επιλογής Θέματος State-of-the-art papers from Conferences or Workshops Papers from Data Engineering Lab (DELAB) DM Book project Topics Τρόπος Παρουσίασης Διάλεξη 25 λεπτών Προβολή διαφανειών σε Power Point (30 διαφάνειες) Ερωτήσεις – Συζήτηση (5 λεπτά) Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

δφσδφ ΣΥΝΘΕΤΙΚΗ ΕΡΓΑΣΙΑ 4/17/2017 Χρήση του MS SQL Server 2008 R2 Business Intelligence Σενάριο Μια επιχείρηση διαθέτει μια βάση δεδομένων με στοιχεία των πελατών της. Θα σας δοθούν τρία προβλήματα που αντιμετωπίζει η επιχείρηση και θα προτείνετε λύσεις. Εφαρμογή αλγορίθμων Εξόρυξης δεδομένων Αλγόριθμοι Δέντρου, Συστάδων και Κανόνων Συσχέτισης Παραδοτέα Προσδιορισμός πιθανών μοντέλων Διαγράμματα κύβου, δέντρου, συστάδων και κανόνων συσχέτισης Αξιολόγηση των πιθανών μοντέλων Επιλογή καλύτερου μοντέλου Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Εξετάσεις Ύλη μαθήματος Θα πρέπει να απαντηθούν πέντε θέματα δφσδφ Εξετάσεις 4/17/2017 Ύλη μαθήματος (5-6 κεφάλαια από τα βιβλία που προτείνονται) Θα πρέπει να απαντηθούν πέντε θέματα (1 μονάδα το καθένα) Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Οργάνωση του Μαθήματος δφσδφ 4/17/2017 Μάθημα 1 : Διάγραμμα & περιγραφή Μαθήματος (Syllabus) Μάθημα 2 : Βασικές έννοιες στις Αποθήκες Δεδομένων Μάθημα 3 : Φυσικό Επίπεδο Αποθηκών Δεδομένων Μάθημα 4 : MS SQL Server 2008 (Δημιουργία κύβου) Μάθημα 5 : Κατηγοριοποίηση Μάθημα 6 : Κανόνες Συσχέτισης Μάθημα 7 : Ομαδοποίηση (πρώτος μέρος) Μάθημα 8 : Ομαδοποίηση (δεύτερο μέρος) Μάθημα 9 : MS SQL Server 2008 (Ομαδοποίηση) Μάθημα 10 : MS SQL Server 2008 (Κατηγοριοποίηση) Μάθημα 11 : MS SQL Server 2008 (Κανόνες Συσχέτισης) Μάθημα 12 : Εξόρυξη Δεδομένων Παγκόσμιου Ιστού Μάθημα 13 : Εξόρυξη Δεδομένων Ειδικού Σκοπού Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Δημιουργία Αποθήκης Δεδομένων Σχήματα Αστέρα, Χιονονιφάδας και Γαλαξία δφσδφ Αποθήκες Δεδομένων 4/17/2017 Δημιουργία Αποθήκης Δεδομένων Σχήματα Αστέρα, Χιονονιφάδας και Γαλαξία Δημιουργία Κύβου Συστήματα MOLAP, ROLAP και HOLAP Υποβολή Ερωτημάτων σε Κύβο Τεχνικές Drill Down και Drill up Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Agglomerative Hierarchical Clustering δφσδφ Θέματα Ομαδοποίησης 4/17/2017 K-means Agglomerative Hierarchical Clustering Density-based algorithms (DBSCAN) Graph-based algorithms (Two-way nCut) Scalable Clustering algorithms Cluster Evaluation Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Θέματα Κατηγοριοποίησης δφσδφ Θέματα Κατηγοριοποίησης 4/17/2017 Decision Tree Classifier Model Overfitting Naïve Bayes Classifier Nearest Neighbor Classifier Evaluating and Comparing Classifiers Ensemble Methods Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Θέματα Κανόνων Συσχέτισης δφσδφ Θέματα Κανόνων Συσχέτισης 4/17/2017 Frequent Itemset Generation (Apriori) Alternative Itemset Generation (FP-Growth) Sequential Patterns (temporal information) Recommendations based on Ass. Rules (cross-sales) Evaluation of Association Patterns Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

MS SQL Server 2008 (Δημιουργία Κύβου) δφσδφ MS SQL Server 2008 (Δημιουργία Κύβου) 4/17/2017 Δημιουργία Κύβου Δεδομένων Προβολή του Κύβου Δεδομένων Αξιολόγηση του Κύβου Δεδομένων Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

MS SQL Server 2008 (Κατηγοριοποίηση) δφσδφ MS SQL Server 2008 (Κατηγοριοποίηση) 4/17/2017 Εφαρμογή αλγορίθμου Δέντρου Απόφασης Παράμετροι Αλγορίθμου Προβολή του Δέντρου Απόφασης Αξιολόγηση του Δέντρου Απόφασης Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

MS SQL Server 2008 (Ομαδοποίηση) δφσδφ MS SQL Server 2008 (Ομαδοποίηση) 4/17/2017 Εφαρμογή αλγορίθμου Ομαδοποίησης Παράμετροι Αλγορίθμου Προβολή συστάδων Αξιολόγηση των συστάδων Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

MS SQL Server 2008 (Κανόνες Συσχέτισης) δφσδφ MS SQL Server 2008 (Κανόνες Συσχέτισης) 4/17/2017 Εφαρμογή αλγορίθμου Κανόνων Συσχέτισης Παράμετροι Αλγορίθμου Προβολή Κανόνων Συσχέτισης Αξιολόγηση των Κανόνων Συσχέτισης Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Εξόρυξη Δεδομένων Χρήσης ΠΙ δφσδφ Εξόρυξη Δεδομένων Χρήσης ΠΙ 4/17/2017 Χρησιμοποιεί δεδομένα από αρχεία καταγραφής των ιστοσελίδων (Log files) και από τα προφίλ των χρηστών (π.χ. βαθμολογίες χρηστών σε προϊόντα) Εφαρμογές : Συστήματα Συστάσεων Συνεργατικής Διήθησης. (Recommender Systems) Item1 Item2 Item3 Item4 User1 - 4 2 User2 3 User3 User4 5 Βαθμός 1 έως 5 Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Μάθημα 7 : Εξόρυξη Δεδομένων Χρήσης ΠΙ δφσδφ Μάθημα 7 : Εξόρυξη Δεδομένων Χρήσης ΠΙ 4/17/2017 Data Collection Session Analysis Collaborative Filtering Recommender Systems Social Tagging Singular Value Decomposition Tensor Dimensionality Reduction Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Εξόρυξη Δεδομένων Περιεχομένου ΠΙ δφσδφ Εξόρυξη Δεδομένων Περιεχομένου ΠΙ 4/17/2017 χρησιμοποιεί το περιεχόμενο των ιστοσελίδων (κείμενο, λέξεις κτλ.) προκειμένου να βρει ομοιότητα μεταξύ τους. Εφαρμογές : Συστήματα Προτάσεων Βάσει περιεχομένου, Ανάκτηση Πληροφοριών. Term1 Τerm2 Τerm3 Τerm4 Web page1 12 10 - Web page2 8 9 Web page3 5 3 Web page4 4 6 Συχνότητα Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Εξόρυξη Δεδομένων Περιεχομένου ΠΙ δφσδφ Εξόρυξη Δεδομένων Περιεχομένου ΠΙ 4/17/2017 Information Retrieval Models Web Page Pre-processing Latent Semantic Indexing Web Spamming Content-based Collaborative Filtering Explanations in Recommender Systems Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Εξόρυξη Δεδομένων Δομής ΠΙ δφσδφ Εξόρυξη Δεδομένων Δομής ΠΙ 4/17/2017 Ανακαλύπτει ενδιαφέρουσα γνώση από υπερσυνδέσμους μεταξύ ιστοσελίδων του ΠΙ. Εφαρμογές : Μηχανές Αναζήτησης, Ανακάλυψη Κοινοτήτων κτλ. Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Εξόρυξη Δεδομένων Δομής ΠΙ δφσδφ Εξόρυξη Δεδομένων Δομής ΠΙ 4/17/2017 Social Network Analysis (friendship network) Web Search and Search Engines PageRank HITS Community Discovery Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Εξόρυξη Δεδομένων Ειδικού Σκοπού δφσδφ Εξόρυξη Δεδομένων Ειδικού Σκοπού 4/17/2017 Data Mining and Audience Intelligence for Advertising (ADKDD 2012) Multimedia Data Mining (MDM/KDD 2012) Knowledge Discovery on the Web (WebKDD 2012) Knowledge Discovery from Sensor Data (Sensor-KDD 2012) Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

Εξόρυξη Δεδομένων Ειδικού Σκοπού δφσδφ Εξόρυξη Δεδομένων Ειδικού Σκοπού 4/17/2017 Data Mining in Bioinformatics (BIOKDD 2012) Data Mining using Matrices and Tensors (KDD 2012)   Large-Scale Recommender Systems (KDD 2012) Social Network Mining and Analysis (SNA-KDD 2012) ASONAM RecSys PKDD Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού

ΑΠΟΘΗΚΕΣ ΚΑΙ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ δφσδφ ΑΠΟΘΗΚΕΣ ΚΑΙ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ 4/17/2017 Δρ. Παναγιώτης Συμεωνίδης Εργ. Τεχνολογίας και Επεξεργασίας Δεδομένων Τμήμα Πληροφορικής Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών Αριστοτέλειο Πανεπιστήμιο Θεσ/νικης http://delab.csd.auth.gr/~symeon Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων για Εξατομίκευση Υπηρεσιών Παγκόσμιου Ιστού