ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Διαδικαστικά.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Βάσεις Δεδομένων II Ευαγγελία Πιτουρά 1 ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙΙ.
Advertisements

ΛΗΨΗ ΑΠΟΦΑΣΗΣ Ο σύγχρονος άνθρωπος πρέπει συνεχώς να αποφασίζει και να ελίσσεται σε διαρκώς μεταβαλ .κόσμο.Έχει μεγαλύτερο εύρος επιλογών.
Επιμέλεια: Τίκβα Χριστίνα
• ΕΙΣΑΓΩΓΙΚΑ • ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ • ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ • ΣΤΟΧΟΙ • ΜΕΘΟΔΟΙ ΔΙΔΑΣΚΑΛΙΑΣ • ΑΞΙΟΛΟΓΗΣΗ - ΑΥΤΟΑΞΙΟΛΟΓΗΣΗ.
Δημιουργία ιστοσελίδων στο διαδίκτυο με Dreamweaver, PHP, MySQL και Apache ΠΛΗΡΟΦΟΡΙΚΗ Ι (Β ή Γ Λυκείου) ΜΑΘΗΜΑ ΕΝΔΙΑΦΕΡΟΝΤΟΣ(2ωρο) [Στην περίπτωση που.
Ανάπτυξη Λογισμικού (Software Development)
Η δομή του μαθήματος των μαθηματικών στο σύγχρονο ΤΕΙ Σάλτας Βασίλειος, Τσιάντος Βασίλειος Γενικό Τμήμα Θετικών Επιστημών ΤΕΙ Καβάλας.
Εκπαιδευτικο Σενάριο (Σχέδιο Εργασίας)
ΣΤΟΙΧΕΙΑ ΨΕΥΔΟΚΩΔΙΚΑ ΒΑΣΙΚΕΣ ΔΟΜΕΣ ΒΑΣΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΩΝ
ΔΙΔΑΚΤΙΚΕΣ ΔΥΣΚΟΛΙΕΣ ΣΤΟΥΣ ΠΙΝΑΚΕΣ ΠΕΚ ΠΕΙΡΑΙΑ Α΄φάση Επιμόρφωσης Εκπ/κών κλάδου ΠΕ19 Διδακτική της Πληροφορικής Ρόδος, Νοέμβρης 2007.
ΠΩΣ ΝΑ ΔΙΑΒΑΖΩ Βασικές δεξιότητες μελέτης. Β. Βασιλείου.
Μηχανική Μάθηση και Εξόρυξη Γνώσης
Εισαγωγικές Έννοιες Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
Εισηγητής:Στέφανος Μέτης
ΑΝΤΙΠΛΟΙΑΡΧΟΣ(ΥΝ) Α. ΚΟΥΣΗ ΠΝ, ΠΛΩΤΑΡΧΗΣ (Μ) Α. ΡΗΜΙΚΗΣ ΠΝ, ΠΛΩΤΑΡΧΗΣ Γ. ΖΟΥΡΟΣ ΠΝ, ΜΠΥ Ι. ΔΗΜΗΤΡΑΚΗΣ Ενεργητικές Τεχνικές- Θεωρία και πράξη Αξιολόγηση.
Αλγόριθμοι και Πολυπλοκότητα
Συστήματα Στήριξης Αποφάσεων
Χρήστος Δ. Ταραντίλης, Λέκτορας ΔΕΤ Εφαρμογές Διοικητικής Επιστήμης ΙΙ.
Δομές Δεδομένων (Data Structures) 3o Εξάμηνο Σπουδών Διδάσκων: Απόστολος Παπαδόπουλος και
Μεθοδολογίες και Εργαλεία Ανάλυσης και Σχεδιασμού Π.Σ. Σπύρος Κοκολάκης ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ.
Μεθοδολογίες και Εργαλεία Ανάλυσης και Σχεδιασμού Π.Σ. Σπύρος Κοκολάκης ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ.
ΑΝΑΛΥΣΗ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ ΣΥΣΤΗΜΑΤΩΝ ΔΙΑΝΟΜΗΣ & ΜΕΤΑΦΟΡΩΝ
1 Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Δημήτρης Πλεξουσάκης 10/2/2015ΗΥ180 – Μάθημα 1ο Διδάσκων: Δημήτρης Πλεξουσάκης Καθηγητής
Αλγόριθμοι - Τμήμα Πληροφορικής ΑΠΘ - 4ο εξάμηνο1 Αλγόριθμοι b b Σελίδα μαθήματος με ημερολόγιο, υλικό, βιβλιογραφία, ανακοινώσεις
Τίτλος Ενδιάμεση Εξέταση Πτυχιακής Εργασίας >. 2 Αντικείμενο της εργασίας Ο σκοπός της εργασίας είναι να κατασκευασθεί ένα σύστημα > Οδηγία: customize.
ΕΡΕΥΝΗΤΙΚΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ Τεχνολογίες Βάσεων Δεδομένων και Παγκόσμιος Ιστός Προκαταρκτικά.
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ Μαρία Καρύδα, Επίκουρη Καθηγήτρια
Χρήση του ελεύθερου λογισμικού "Γλωσσομάθεια" για την διδασκαλία εννοιών αλγοριθμικής - προγραμματισμού στη Γ' Γυμνασίου Φουστέρης Νικόλαος Μηχανικός.
Χ. Καραγιαννίδης, ΠΘ-ΠΤΕΑΑνάπτυξη Εφαρμογών για την ΕΕΑ Διάλεξη 1: Εισαγωγή 1/26 12/2/2015 Διάλεξη 1 Εισαγωγή Ανάπτυξη Εφαρμογών για την Εκπαίδευση & την.
Μαθηματικά Διοικητικής Επιστήμης Ι – Τμήμα Διοικητικής Επιστήμης & Τεχνολογίας 1 Μαθηματικά Διοικητικής Επιστήμης Ι Διδακτικό Προσωπικό: Λέκτορας Χρήστος.
Βάσεις Δεδομένων II Εισαγωγικά του μαθήματος Πάνος Βασιλειάδης Σεπτέμβρης 2002
ΗΥ220 - Βασίλης Παπαευσταθίου1 ΗΥ220 Εργαστήριο Ψηφιακών Κυκλωμάτων Χειμερινό Εξάμηνο Εισαγωγή.
ΑΠΟΘΗΚΕΣ ΚΑΙ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ
Διδακτική Πληροφορικής
Διάλεξη 1 Εισαγωγή Επισκόπηση άσκησης Διάλεξη 1 1 Τμήμα Πληροφορικής και Τηλεπικοινωνιών Ανάπτυξη Λογισμικού Χειμερινό Εξάμηνο
3 η διδασκαλία. Παραγοντοποίση- Χρήση ταυτοτήτων- Επίλυση εξισώσεων Τάξη: Γ’ Γυμνασίου Αριθμός Μαθητών: 28.
ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Εισαγωγή. Συστάσεις Ι Ποιός είμαι εγώ: Γραφείο: Β.3 Προτιμώμενες ώρες γραφείου: 11:00-18:00 Ενδιαφέροντα Web mining,
Ασφάλεια Πληροφοριακών Συστημάτων Δρ. Γιώργος Αγγελινός Περίγραμμα μαθήματος & τρόπος αξιολόγησης.
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ Επιχειρηματικότητα: Θεωρία και Πράξη 1.
Ασύρματα Δίκτυα και Κινητές Επικοινωνίες Ενότητα # 1: Διαδικαστικά, Στόχος και Περιεχόμενα Διδάσκων: Βασίλειος Σύρης Τμήμα: Πληροφορικής.
Γενικές οδηγίες για το μάθημα. Δύο διαστάσεις  Πως μπορώ να διδάξω;  Πως μπορώ να σχεδιάσω εκπαιδευτικές τεχνολογίες; Δύο μέρη μαθήματος  Διάλεξη 
Θέματα Υπολογισμού στον Πολιτισμό Εύη Παπαϊωάννου
Προγραμματισμός συστήματος και Προηγμένα Λειτουργικά
Καθηγητής Σιδερής Ευστάθιος
ΕΦΑΡΜΟΓΕΣ ΥΠΟΛΟΓΙΣΤΩΝ
Βάσεις Δεδομένων Ι Εισαγωγή
ΤΕΧΝΙΚΕΣ Αντικειμενοστραφουσ προγραμματισμου
Πρόγραμμα Προπτυχιακών Σπουδών Ροή Λ: Λογισμικό
Καθιστώντας τους μαθητές υπεύθυνους
ΑΣΦΑΛΕΙΑ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ
ΣΥΣΤΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΑΣΦΑΛΕΙΑΣ Περίγραμμα μαθήματος
Εισαγωγή Επισκόπηση άσκησης
Επιχειρηματικότητα: Θεωρία και Πράξη
Βάσεις Δεδομένων και Παγκόσμιος Ιστός
Μεθοδολογία έρευνας και συγγραφής επιστημονικών εργασιών – αγγλική ορολογία εισαγωγή.
Η ΕΝΝΟΙΑ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ
Πολυμεσικές υπηρεσίες στην υγεία (ΛΟΓ51) 1. Εισαγωγή στο μάθημα
ΜΥΥ105: Εισαγωγή στον Προγραμματισμό
Μεθοδολογία Έρευνας Διάλεξη 9η Σύνταξη Πτυχιακής Εργασίας
Αναζητώντας το καλό κλίμα στο σχολείο
Η Πρακτική σας Άσκηση στο πλαίσιο της Διδακτικής Μαθηματικών ΙΙ
Ενδιάμεση Εξέταση Πτυχιακής Εργασίας
Καθηγητής Σιδερής Ευστάθιος
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ
ΤΕΧΝΙΚΕΣ Αντικειμενοστραφουσ προγραμματισμου
2Ο ΓΕΛ ΙΛΙΟΥ ΕΡΕΥΝΗΤΙΚΗ ΕΡΓΑΣΙΑ Β’ ΛΥΚΕΙΟΥ
ΜΥΥ105: Εισαγωγή στον Προγραμματισμό
Εκπαιδευτικο Σενάριο (Σχέδιο Εργασίας)
ΤΜΗΜΑ Μηχανικών Παραγωγής & Διοίκησης
Οι Κατευθύνσεις στο τμήμα Μηχανικών Πληροφορικής
Μεταγράφημα παρουσίασης:

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Διαδικαστικά

Συστάσεις Ι Ποιός είμαι εγώ: Email: tsap@cs.uoi.gr Γραφείο: Β.3 Προτιμώμενες ώρες γραφείου: 11:00-18:00 Ενδιαφέροντα Web mining, Social networks, User Generated Content Mobile applications, Mining of mobile data. Bioinformatics Συνδυασμός θεωρίας και πράξης

Συστάσεις ΙΙ Ποιοί είσαστε εσείς: Συμπληρώστε τη φόρμα με τα στοιχεία σας για την email λίστα του μαθήματος.

Γενικές πληροφορίες για το μάθημα Διαλεξεις: Τρίτη 2:00 – 5:00 μ.μ., αίθουσα Ι2 Οι διαφάνειες θα είναι στα αγγλικά, αλλά η διάλεξη θα γίνεται στα ελληνικά. Θα έχουμε και κάποια επιπλέον μαθήματα/αναπληρώσεις κάποιες εβδομάδες. Πότε σας βολεύει? Web: http://www.cs.uoi.gr/~tsap/teaching/cse012/ Ανακοινώσεις, ασκήσεις, υλικό για διάβασμα διαφάνειες από τις διαλέξεις Θα δημιουργηθεί και μια σελίδα στο ecourse. Βαθμολογία: Το μάθημα θα έχει 4 εργασίες. Μπορεί να υπάρχει προσωπική εξέταση. Οι εργασίες είναι απαλλακτικές. Δεν υπάρχει τελική εξέταση ούτε τον Ιανουάριο ούτε τον Σεπτέμβριο. Πολιτική για καθυστερημένες εργασίες: Μία μέρα καθυστέρηση -10%, δύο μέρες -20%, τρεις μέρες -40%, τέσσερεις μέρες -70%, πέντε μέρες -100%. Free pass policy: Έχετε 4 free passes τα οποία μπορείτε να χρησιμοποιήσετε όποτε θέλετε για να καθυστερήσετε την παράδοση μιας εργασίας. Το κάθε pass σας δίνει μία μέρα επιπλέον.

Ασκήσεις Οι ασκήσεις θα έχουν (συνήθως) δύο τύπους ερωτήσεων: θεωρητικές και προγραμματιστικές. Θεωρητικές: Θα σας ζητηθεί να σχεδιάσετε ένα αλγόριθμο, ή να αποδείξετε κάποια ιδιότητα Αλγοριθμικές: Θα σας ζητηθεί να σχεδιάσετε ένα μια λύση για ένα πρόβλημα. Προγραμματιστικές: Θα σας ζητηθεί να υλοποιήσετε ένα αλγόριθμο, ή να χρησιμοποιήσετε κάποιο έτοιμο εργαλείο σε κάποια δεδομένα. Αναφορά: Στις κάποιες ερωτήσεις θα πρέπει να παραδώσετε μία αναφορά. Η αναφορά αυτή μετράει ένα σημαντικό ποσοστό του βαθμού της ερώτησης και πρέπει να γίνεται προσεκτικά. Τις περισσότερες φορές σας ζητείται να εξηγήσετε τα αποτελέσματα κάποιου πειράματος. Προγραμματισμός: Η επεξεργασία μεγάλων ποσοτήτων δεδομένων απαιτεί έξυπνο και αποτελεσματικό προγραμματισμό. Πρέπει να αποφεύγετε δαπανηρές λειτουργίες. Πρέπει να χρησιμοποιείτε τις κατάλληλες δομές. Πρέπει να προσπαθείτε να χρησιμοποιείτε λίγη μνήμη. Κάποιες φορές το πρόγραμμα σας μπορεί να πάρει μερικές ώρες να τελειώσει.

«Προαπαιτούμενα» Δεν υπάρχουν προαπαιτούμενα αλλά καλό θα είναι να έχετε κάποια άνεση με: Αλγορίθμους: γνώση βασικών αλγορίθμων (π.χ., sorting), και σχεδίασης αλγορίθμων (greedy algorithms, dynamic programming). Δομές δεδομένων: χρήση βασικών δομών δεδομένων. Προγραμματισμός: γρήγορο prototyping για τρέχετε πειράματα (οποιαδήποτε γλώσσα); matlab Πιθανότητες: Γνώσεις πιθανοτήτων. Γραφήματα: βασικές έννοιες γραφημάτων Γραμμική άλγεβρα: πίνακες, διανύσματα, ιδιοδιανύσματα. Python: Θα χρησιμοποιήσουμε κάποια εργαλεία python για την επεξεργασία δεδομένων.

Στόχοι του μαθήματος Να μάθετε βασικές έννοιες του data mining, που καλύπτουν και τo θεωρητικό υπόβαθρο, και την εφαρμογή στην πράξη. Να καταλάβετε το είδος των προβλημάτων που μπορείτε να λύσετε χρησιμοποιώντας τεχνικές data mining. Να καταλάβετε τη θεωρία και τα μαθηματικά πίσω από τους αλγόριθμους και τις τεχνικές Να αποκτήσετε ένα σύνολο από εργαλεία (toolbox) για εξόρυξη δεδομένων. Να παίξετε με πραγματικά δεδομένα και να δείτε κάποια ενδιαφέροντα πραγματικά προβλήματα (ελπίζω). Να μάθετε κάτι ενδιαφέρον.

Μάθημα Η παρακολούθηση και συμμετοχή είναι απαραίτητες Κάνετε ερωτήσεις. Κάποια πράγματα δεν θα είναι ξεκάθαρα και θα πρέπει να τα επαναλάβω. Αν κάτι στηρίζεται σε παλαιότερη γνώση που δεν θυμάστε ζητήστε να κάνουμε μια (σύντομη) επισκόπηση. Αν υπάρχει πρόβλημα με αγγλική ορολογία και τις διαφάνειες μπορούμε να κάνουμε κάποιες ρυθμίσεις. Για τα εργαλεία που θα χρησιμοποιήσουμε θα προσπαθήσω να κάνουμε ένα ξεχωριστό φροντιστήριο.

Θέματα που θα καλύψουμε Κάποιο υποσύνολο από τα παρακάτω Frequent itemsets and association rules (συσχετισμοί) Definitions and Computation of Similarity Clustering (συσταδiοποίηση), co-clustering, compression Classification (κατηγοριοποίηση) Dimensionality Reduction Ranking (ιεραρχηση/ταξινόμηση) Recommendation systems Graph Analysis Covering problems Map-Reduce tools Time-series analysis Aggregation Privacy preserving data mining

Βιβλιογραφία (ελληνικά) P.-N. Tan, M. Steinbach and V. Kumar, Introduction to Data Mining Addison Wesley, 2006, Β. Βερύκιος και Σ. Σουραβλάς, Εκδόσεις Τζιόλα (2010). A. Rajaraman, J. D. Ullman. Εξόρυξη από Μεγάλα Σύνολα Δεδομένων, ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ, 2014 Μ. Βαζιργιάννης και Μ. Χαλκίδη, Εξόρυξη Γνώσης από Βάσεις Δεδομένων. Τυποθήτω, Νοέμβριος 2003 M. H. Dunham, Data Mining, Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης από Δεδομένα. Επιμέλεια Ελληνικής Έκδοσης: Β. Βερύκιος και Γ. Θεοδωρίδης. Εκδόσεις Νέων Τεχνολογιών, 2004.

Βιβλιογραφία (αγγλικά) P.-N. Tan, M. Steinbach and V. Kumar, Introduction to Data Mining, Addison Wesley, 2006 J. Han and M. Kamber. Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006 Hand, Mannila, Smyth. Principles of Data Mining

Online βιβλία (αγγλικά) Anand Rajaraman, Jeff Ullman and Jure Leskovec Mining Massive Datasets. Διατίθεται δωρεάν online. Toby Segaran, Programming Collective Intelligence. Building Smart Web 2.0 Applications

Υλικό Εκτός από βιβλία θα χρησιμοποιήσουμε υλικό και από δημοσιευμένα άρθρα Για τις διαφάνειες θα δανειστούμε από πολλές πηγές Εξόρυξη δεδομένων, Ε. Πιτρουρά Data Mining, E. Terzi Data Mining, Aris Anagnostopoulos P.-N. Tan, M. Steinbach and V. Kumar, Introduction to Data Mining, Addison Wesley, 2006 J. Han and M. Kamber. Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006 Anand Rajaraman and Jeff Ullman Mining Massive Datasets.

Ερωτηματολόγιο Σύντομο ερωτηματολόγιο για να δω τι ξέρετε Χρησιμεύει για να πάρω μια ιδέα του τι κενά μπορεί να χρειαστεί να καλύψουμε. Δεν επηρεάζει βαθμό ή κάτι άλλο.