ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Εισαγωγή. Συστάσεις Ι Ποιός είμαι εγώ: Γραφείο: Β.3 Προτιμώμενες ώρες γραφείου: 11:00-18:00 Ενδιαφέροντα Web mining,

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ.
Advertisements

Π ΑΡΑΛΛΗΛΗ / ΚΑΤΑΝΕΜΗΜΕΝΗ ΕΠΕΞΕΡΓΑΣΙΑ ΚΑΙ ΕΦΑΡΜΟΓΕΣ Εισαγωγή στο OpenMP.
1 Εξατομίκευση στις Ψηφιακές Βιβλιοθήκες Βασιλακάκη Ευγενία
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ Μαρία Καρύδα, Επίκουρη Καθηγήτρια
1 Διαχείριση Γνώσης Μ. Γεργατσούλης Χ. Παπαθεοδώρου.
ΑΠΟΘΗΚΕΣ ΚΑΙ ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ
Μαρία Καρύδα, Επίκουρη Καθηγήτρια Γραφείο B13, Κτήριο Λυμπέρη Ώρες Γραφείου: Δευτέρα, Τρίτη, Τετάρτη 10:00 – 11: 00
Εισαγωγή στη Βιοπληροφορική Ενότητα 9: Text Mining Μακρής Χρήστος, Τσακαλίδης Αθανάσιος, Ιωάννου Μαρίνα Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ και Πληροφορικής.
Πολιτικές & Διαχείριση Ασφάλειας Δρ. Γιώργος Αγγελινός Περίγραμμα μαθήματος & τρόπος αξιολόγησης.
 Βασικές έννοιες.    ΓΙΑ ΠΟΙΟ ΛΟΓΟ ΘΑ ΠΡΟΤΙΜΟΥΣΑΤΕ ΚΑΝΕΤΕ ΤΙΣ ΑΓΟΡΕΣ ΣΑΣ ΗΛΕΚΤΡΟΝΙΚΑ;
Documents for filing systems/Βοηθητικά στοιχεία συστημάτων αρχειοθέτησης Κάρτες Δανεισμού Κάρτες Δανεισμού Σημείωμα καθοδήγησης στην σωστή θέση (Cross.
Ασύρματες και Κινητές Επικοινωνίες Ενότητα # 1: Διαδικαστικά, Στόχος και Περιεχόμενα Διδάσκων: Βασίλειος Σύρης Τμήμα: Πληροφορικής.
Δρ. Ξανθή Κωνσταντινίδου Σχολική Σύμβουλος Φυσικής Aγωγής ΠΕ11 Θράκης Φυσικής Aγωγής ΠΕ11 Θράκης.
Εισαγωγή στη Βιοπληροφορική Ενότητα 1: Εισαγωγικά θέματα Μακρής Χρήστος, Τσακαλίδης Αθανάσιος, Περδικούρη Αικατερίνη Πολυτεχνική Σχολή Τμήμα Μηχανικών.
Ειδική Γραμματεία Ψηφιακού Σχεδιασμού ICT 4 Growth Ενίσχυση Επιχειρήσεων για την Υλοποίηση Επενδυτικών Σχεδίων ανάπτυξης-παροχής καινοτόμων προϊόντων και.
Η αγορά εργασίας στον διαδικτυακό τουρισμό Αλέξανδρος Καραβίτης Διευθυντής Λειτουργιών.
« Τοπική πλατφόρμα για την απασχόληση και την επιχειρηματικότητα νέων επιστημόνων ΤΕΙ/ΑΕΙ στην καινοτομία, και την καινοτομική επιχειρηματικότητα » Royal.
Καλώς ήλθατε, μαθητές! Όνομα δασκάλου. Πρόγραμμα τάξης 8:15 - 9:00Το σχολείο ξεκινά, παίρνουμε παρουσίες 9: :00Ανάγνωση και έκθεση 10: :00Ορθογραφία.
Ποσοτικές Μέθοδοι Έρευνας Αρχική μέθοδος στην οποία στηρίχτηκε η συγκρότηση της εμπειρικής ή πειραματικής παιδαγωγικής ήταν το πείραμα, κάτω από την επίδραση.
Ενότητα 7 : Ντετερμινιστικά Πεπερασμένα Αυτόματα, Κανονικές Πράξεις
ΤΟ ΔΙΑΔΙΚΤΥΟ ΚΑΙ Η ΚΟΙΝΩΝΙΑ
Η ΔΙΑΦΑΝΕΙΕΣ ΕΧΟΥΝ ΒΑΣΙΣΤΕΙ ΣΤΟ ΚΕΦΑΛΑΙΟ 9 (σελ
Εξόρυξη γνώσης Εισαγωγή
Σιακκαγιαννη Φωτεινη ΑΕΜ 696
Παρθενώνας: ένας ναός για την Αθηνά, το σύμβολο μιας πόλης
ΤΕΧΝΙΚΕΣ Αντικειμενοστραφουσ προγραμματισμου
Αντικειμενοστραφής Προγραμματισμός
Εργασίες 1. Συμπίεση κειμένου με τη μέθοδο της κωδικοποίησης Huffmann.
Η Epsilon Net σας καλωσορίζει
ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ.
Ενεργειακές Πρώτες Ύλες
Διοίκηση Απόδοσης Επιχειρηματικών Διαδικασιών
Ενότητα 1 : Σύνολα & Σχέσεις (1/2) Αλέξανδρος Τζάλλας
“Επιχειρηματικότητα σε περίοδο οικονομικής κρίσης”
Πελοπίδας, Φαίδωνας, Νεφέλη, Μαρία.
Εργασίες 1. Συμπίεση κειμένου με τη μέθοδο της κωδικοποίησης Huffmann.
ΕΛΛΗΝΙΚΗ ΕΤΑΙΡΕΙΑ ΠΑΙΔΙΑΤΡΙΚΗΣ ΝΟΣΗΛΕΥΤΙΚΗΣ
Μάνος Σατόπουλος Συντάκτης λευκωμάτων και λάτρης των τεχνών
ΜΕΡΟΣ ΙV: Καθοριστικοί παράγοντες και Εμπόδια υιοθέτησης ΤΠΕ
ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Διαδικαστικά.
Σχέδιο προσέγγισης και υλοποίησης online μαθημάτων
Σχεδιασμός και Ανάπτυξη Διαδικτυακών Εφαρμογών
Όνομα σχολείου Ημερομηνία
Υπηρεσίες και εφαρμογές Διαδικτύου
H Περαιτέρω Χρήση Πληροφοριών του Δημόσιου Τομέα
RIPASSO 3.
Τ.Ε.Ι. ΘΕΣΣΑΛΙΑΣ ΤμΗμα ΔιοΙκησηΣ &ΔιαχεΙρισηΣ Εργων
Ενότητα 8 : Πίνακες IΙ Αλέξανδρος Τζάλλας
Πολιτικη Αντιμετωπιςης spam ςε δικτυα voip
Ειδική Γραμματεία Ψηφιακού Σχεδιασμού
ΤΕΧΝΙΚΕΣ Αντικειμενοστραφουσ προγραμματισμου
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ
Εξωδικαστικός Μηχανισμός Ρύθμισης Οφειλών - Ελεύθεροι Επαγγελματίες
ΤΕΙ Σερρών Σχολή Διοίκησης & Οικονομίας Τμήμα Διοίκησης Επιχειρήσεων
Διαβάστε τα πάντα για αυτό Ειδήσεις του Microsoft SharePoint
“Τίτλος του άρθρου” Ονόματα συγγραφέων Ονόματα Φοιτητών.
ΓΕΝΙΚΟΣ ΚΑΝΟΝΙΣΜΟΣ ΠΡΟΣΤΑΣΙΑΣ ΠΡΟΣΩΠΙΚΩΝ ΔΕΔΟΜΕΝΩΝ 2016/679 ΕΕ (GDPR)
Ανακάλυψη Γνώσης (Knowledge Discovery)
ΓΕΩΡΓΙΟΣ ΣΤΕΦΑΝΟΠΟΥΛΟΣ – Σύμβουλος Υπουργείου Υγείας σε θέματα ΙΤ
ΤΙΤΛΟΣ ΤΗΣ ΕΚΔΗΛΩΣΗΣ ΣΑΣ
ΟΝΟΜΑ ΚΑΘΗΓΗΤΗ | ΑΡΙΘΜΟΣ ΜΑΘΗΜΑΤΟΣ
Καλώς ήλθατε, μαθητές! Όνομα δασκάλου.
Παιδαγωγικού Ινστιτούτου & Εκπαιδευτικής Πύλης του Υ.Π.Ε.Θ.
ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ
ΝΙΚΟΛΑΟΣ ΑΒΟΥΡΗΣ, κ.ά., PYTHON, Εισαγωγή στους υπολογιστές, ΠΕΚ 2016,
Μάρκετινγκ, εμπορική επικοινωνία
Ηλεκτρονικά βιβλία ΑΑΔΕ τι είναι, πως λειτουργούν, ποιος είναι ο σκοπός τους Αύγουστος 2019.
Ημερίδα Πρακτικής Άσκησης Εαρινό Εξάμηνο
Παράδειγμα στόχος Έμπνευση Ενέργειες/εργασίες Πόροι Σκέψεις
Μεταγράφημα παρουσίασης:

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Εισαγωγή

Συστάσεις Ι Ποιός είμαι εγώ: Γραφείο: Β.3 Προτιμώμενες ώρες γραφείου: 11:00-18:00 Ενδιαφέροντα Web mining, Social networks, User Generated Content Mobile applications, Mining of mobile data. Bioinformatics Συνδυασμός θεωρίας και πράξης

Συστάσεις ΙΙ Ποιοί είσαστε εσείς: Συμπληρώστε τη φόρμα με τα στοιχεία σας για την λίστα του μαθήματος.

Γενικές πληροφορίες για το μάθημα Διαλεξεις: Πέμπτη 10:00 – 13:00, αίθουσα Ι2 Οι διαφάνειες θα είναι στα αγγλικά, αλλά η διάλεξη θα γίνεται στα ελληνικά. Θα έχουμε και κάποια επιπλέον μαθήματα/αναπληρώσεις κάποιες εβδομάδες. Πότε σας βολεύει? Web: Ανακοινώσεις, ασκήσεις, υλικό για διάβασμα διαφάνειες από τις διαλέξεις Θα δημιουργηθεί και μια σελίδα στο ecourse. Βαθμολογία: Το μάθημα θα έχει 4 εργασίες. Μπορεί να υπάρχει προσωπική εξέταση. Οι εργασίες είναι απαλλακτικές. Δεν υπάρχει τελική εξέταση ούτε τον Ιανουάριο ούτε τον Σεπτέμβριο. Πολιτική για καθυστερημένες εργασίες: Μία μέρα καθυστέρηση -10%, δύο μέρες -20%, τρεις μέρες -40%, τέσσερεις μέρες -70%, πέντε μέρες -100%. Free pass policy: Έχετε 4 free passes τα οποία μπορείτε να χρησιμοποιήσετε όποτε θέλετε για να καθυστερήσετε την παράδοση μιας εργασίας. Το κάθε pass σας δίνει μία μέρα επιπλέον.

Ασκήσεις Οι ασκήσεις θα έχουν (συνήθως) δύο τύπους ερωτήσεων: θεωρητικές και προγραμματιστικές. Θεωρητικές: Θα σας ζητηθεί να σχεδιάσετε ένα αλγόριθμο, ή να αποδείξετε κάποια ιδιότητα Αλγοριθμικές: Θα σας ζητηθεί να σχεδιάσετε ένα μια λύση για ένα πρόβλημα. Προγραμματιστικές: Θα σας ζητηθεί να υλοποιήσετε ένα αλγόριθμο, ή να χρησιμοποιήσετε κάποιο έτοιμο εργαλείο σε κάποια δεδομένα. Αναφορά: Στις κάποιες ερωτήσεις θα πρέπει να παραδώσετε μία αναφορά. Η αναφορά αυτή μετράει ένα σημαντικό ποσοστό του βαθμού της ερώτησης και πρέπει να γίνεται προσεκτικά. Τις περισσότερες φορές σας ζητείται να εξηγήσετε τα αποτελέσματα κάποιου πειράματος. Προγραμματισμός: Η επεξεργασία μεγάλων ποσοτήτων δεδομένων απαιτεί έξυπνο και αποτελεσματικό προγραμματισμό. Πρέπει να αποφεύγετε δαπανηρές λειτουργίες. Πρέπει να χρησιμοποιείτε τις κατάλληλες δομές. Πρέπει να προσπαθείτε να χρησιμοποιείτε λίγη μνήμη. Κάποιες φορές το πρόγραμμα σας μπορεί να πάρει μερικές ώρες να τελειώσει.

«Προαπαιτούμενα» Δεν υπάρχουν προαπαιτούμενα αλλά καλό θα είναι να έχετε κάποια άνεση με: Αλγορίθμους: γνώση βασικών αλγορίθμων (π.χ., sorting), και σχεδίασης αλγορίθμων (greedy algorithms, dynamic programming). Δομές δεδομένων: χρήση βασικών δομών δεδομένων. Προγραμματισμός: γρήγορο prototyping για τρέχετε πειράματα (οποιαδήποτε γλώσσα); matlab Πιθανότητες: Γνώσεις πιθανοτήτων. Γραφήματα: βασικές έννοιες γραφημάτων Γραμμική άλγεβρα: πίνακες, διανύσματα, ιδιοδιανύσματα. Python: Φέτος θα χρησιμοποιήσουμε κάποια εργαλεία python για την επεξεργασία δεδομένων.

Στόχοι του μαθήματος Να μάθετε βασικές έννοιες του data mining, που καλύπτουν και τo θεωρητικό υπόβαθρο, και την εφαρμογή στην πράξη. Να καταλάβετε το είδος των προβλημάτων που μπορείτε να λύσετε χρησιμοποιώντας τεχνικές data mining. Να καταλάβετε τη θεωρία και τα μαθηματικά πίσω από τους αλγόριθμους και τις τεχνικές Να αποκτήσετε ένα σύνολο από εργαλεία (toolbox) για εξόρυξη δεδομένων. Να παίξετε με πραγματικά δεδομένα και να δείτε κάποια ενδιαφέροντα πραγματικά προβλήματα (ελπίζω). Να μάθετε κάτι ενδιαφέρον.

Μάθημα Η παρακολούθηση και συμμετοχή είναι απαραίτητες Κάνετε ερωτήσεις. Κάποια πράγματα δεν θα είναι ξεκάθαρα και θα πρέπει να τα επαναλάβω. Αν κάτι στηρίζεται σε παλαιότερη γνώση που δεν θυμάστε ζητήστε να κάνουμε μια (σύντομη) επισκόπηση. Αν υπάρχει πρόβλημα με αγγλική ορολογία και τις διαφάνειες μπορούμε να κάνουμε κάποιες ρυθμίσεις. Για τα εργαλεία που θα χρησιμοποιήσουμε θα προσπαθήσω να κάνουμε ένα ξεχωριστό φροντιστήριο.

Θέματα που θα καλύψουμε Κάποιο υποσύνολο από τα παρακάτω Frequent itemsets and association rules (συσχετισμοί) Definitions and Computation of Similarity Clustering (συσταδiοποίηση), co-clustering, compression Classification (κατηγοριοποίηση) Dimensionality Reduction Ranking (ιεραρχηση/ταξινόμηση) Recommendation systems Graph Analysis Covering problems Map-Reduce tools Time-series analysis Aggregation Privacy preserving data mining

Βιβλιογραφία (ελληνικά) P.-N. Tan, M. Steinbach and V. Kumar, Introduction to Data Mining Addison Wesley, 2006, Β. Βερύκιος και Σ. Σουραβλάς, Εκδόσεις Τζιόλα (2010). A. Rajaraman, J. D. Ullman. Εξόρυξη από Μεγάλα Σύνολα Δεδομένων, ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ, 2014 Μ. Βαζιργιάννης και Μ. Χαλκίδη, Εξόρυξη Γνώσης από Βάσεις Δεδομένων. Τυποθήτω, Νοέμβριος 2003 M. H. Dunham, Data Mining, Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης από Δεδομένα. Επιμέλεια Ελληνικής Έκδοσης: Β. Βερύκιος και Γ. Θεοδωρίδης. Εκδόσεις Νέων Τεχνολογιών, 2004.

P.-N. Tan, M. Steinbach and V. Kumar, Introduction to Data Mining, Addison Wesley, 2006Introduction to Data Mining J. Han and M. Kamber. Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006 Βιβλιογραφία (αγγλικά) Hand, Mannila, Smyth. Principles of Data Mining

Online βιβλία (αγγλικά) Toby Segaran, Programming Collective Intelligence. Building Smart Web 2.0 ApplicationsProgramming Collective Intelligence. Building Smart Web 2.0 Applications Anand Rajaraman, Jeff Ullman and Jure Leskovec Mining Massive DatasetsMining Massive Datasets. Διατίθεται δωρεάν online.

Υλικό Εκτός από βιβλία θα χρησιμοποιήσουμε υλικό και από δημοσιευμένα άρθρα Για τις διαφάνειες θα δανειστούμε από πολλές πηγές Εξόρυξη δεδομένων, Ε. Πιτρουρά Data Mining, E. Terzi Data Mining, Aris Anagnostopoulos P.-N. Tan, M. Steinbach and V. Kumar, Introduction to Data Mining, Addison Wesley, 2006 J. Han and M. Kamber. Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006 Anand Rajaraman and Jeff Ullman Mining Massive Datasets.Mining Massive Datasets

Ερωτηματολόγιο Σύντομο ερωτηματολόγιο για να δω τι ξέρετε Χρησιμεύει για να πάρω μια ιδέα του τι κενά μπορεί να χρειαστεί να καλύψουμε. Δεν επηρεάζει βαθμό ή κάτι άλλο.