ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Μηχανικών Πληροφορικής ΤΕ

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης
Advertisements

ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΕΙΚΟΝΕΣ
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Τ.Ε.Ι. ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ Επιβλέπων καθηγητής: Βακαλούδης Αλέξανδρος Σπουδαστής: Τσιαουσίδης Δημήτριος.
Ανακτηση Πληροφοριασ σε νεφη Υπολογιστων
ΓΡΗΓΟΡΟΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ FOURIER
Semantic Overlay Networks in P2P systems A. Crespo, H. Garcia-Molina Κρεμμυδάς Νίκος Σκυβαλίδας Πάνος Παππάς Θεοχάρης.
Εποπτεύων καθηγητής: Κος Σαράντος Καπιδάκης
Μηχανική Μάθηση και Εξόρυξη Γνώσης
1 Εισαγωγή στις Βάσεις Δεδομένων  Ανάγκη Αποθήκευσης και Διαχείρισης Δεδομένων  Συστήματα Αρχείων  Συστήματα Βάσεων Δεδομένων  Παραδοσιακές και Σύγχρονες.
Αναγνώριση Προτύπων.
Συνιστώσες δεδομένων  Αντίληψη(concept):το αντικείμενο μάθησης  Υπόδειγμα(instance):το ξεχωριστό και ανεξάρτητο παράδειγμα(example) ενός concept  Χαρακτηριστικό(attribute):η.
ΕΞΌΡΥΞΗ ΔΕΔΟΜΈΝΩΝ ΚΑΙ ΑΛΓΌΡΙΘΜΟΙ ΜΆΘΗΣΗΣ Κατηγοριοποίηση 4 ο Φροντιστήριο Σκούρα Αγγελική
ΕΥΡΕΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΕΚΤΟΠΩΝ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ
Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr
Ανάπτυξη και εκπαίδευση ιεραρχίας ταξινομητών για την κατηγοριοποίηση κειμένων Αβραμίδη Γεωργία 719.
Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης
ΑΝΑΠΤΥΞΗ ΤΑΞΙΝΟΜΗΤΗ ΗΛΕΚΤΡΟΝΙΚΗΣ ΑΛΛΗΛΟΓΡΑΦΙΑΣ ΜΑΛΕΖΑ ΣΟΦΙΑ ΑΕΜ:765.
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
Αυτόματη Ανάλυση & Οργάνωση Μουσικών Αρχείων Διδάσκων Καθηγητής: Καπιδάκης Σαράντος Σπουδαστής: Σιδέρης Νίκος Αθήνα2008.
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Learning to Learn: Algorithmic Inspirations from Human Problem Solving.
Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. K-means k-windows k-means: 2 φάσεις 1. Μια διαμέριση των στοιχείων σε k clusters 2. Η ποιότητα της διαμέρισης.
Επικοινωνία Ανθρώπου Μηχανής HTML CGI JAVASCRIPT Κουμπούλης Χρήστος Α.Μ. 921 Χαλαβαζής Βασίλης Α.Μ. 988.
Μετατροπή Μουσικών Συλλογών σε Ψηφιακές Βιβλιοθήκες Το Πρόγραμμα MUSESCAPE Ιόνιο Πανεπιστήμιο Ιανουάριος 2005 Χριστιανούδης Ιωάννης.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων.
Βελτίωση της πλατφόρμας ανάπτυξης συστημάτων πολλών πρακτόρων Agent Factory ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ Τμήμα Ηλεκτρολόγων.
Θεωρία Υπολογισμού Χρονική Πολυπλοκότητα και Μοντέλα.
WEIGHTED CLUSTERING ΠΡΟΗΓΜΕΝΗ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Μιχάλης Χριστόπουλος Μ Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence.
Γραφικό Περιβάλλον Συγγραφής Κανόνων στο Σημασιολογικό Διαδίκτυο Διπλωματική Εργασία της Βασιλικής Ζερβάκη Επιβλέπων Καθηγητής: Νικόλαος Βασιλειάδης Θεσσαλονίκη.
1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Ανακάλυψη Γνώσης από Βιολογικές Αλληλουχίες Αλεξανδρίδου Αναστασία.
Data Mining software Weka. Εισαγωγή Weka: Wekato Environment for knowledge Analysis Η weka είναι ένα software για εξόρυξη δεδομένων γραμμένο σε JAVA το.
Σύστημα αναγνώρισης κίνησης σε ελεγχόμενο χώρο με χρήση web camera και OpenCV Επιβλέπων:Δρ Γεώργιος Παυλίδης ΣΤΕΦΑΝΙΑ ΠΑΠΑΡΗΓΑ ΑΕΜ:1838 Τ.Ε.Ι. ΚΕΝΤΡΙΚΗΣ.
Εμμανουήλ-Μάνος Γεροθανάσης Ευάγγελος Μπέκος
Πρόβλεψη Θέσης Χρήστη σε Κινητά Δίκτυα - Ταξινομητής Βέλτιστης Παύσης Σπύρος Γεωργάκης Διπλωματική Εργασία.
1 Διαχείριση Γνώσης Μ. Γεργατσούλης Χ. Παπαθεοδώρου.
ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Δρ. Παναγιώτης Συμεωνίδης
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ
ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΗΣ ΣΥΛΟΓΗΣ ΔΕΔΟΜΕΝΩΝ ΑΠΟ ΔΥΚΤΙΑ ΚΟΙΝΩΝΙΚΟΥ ΙΣΤΟΥ Ανέστης Κυβράνογλου(1281) Επιβλέπων : Κ. Πεταλίδης Νικόλαος.
Μαθηματική διδακτική ιστοσελίδα Πτυχιακή εργασία των φοιτητών : Κουφάκη Ιωάννα Μπαταρλής Δημήτρης Επιβλέπων καθηγητής : Δρ. Βασίλειος Σάλτας Μάιος 2015.
ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ: ΤΑΞΙΝΟΜΗΣΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ ΜΕ ΧΩΡΙΚΗ-ΣΗΜΑΣΙΟΛΟΓΙΚΗ ΑΝΤΙΣΤΟΙΧΗΣΗ ΣΠΟΥΔΑΣΤΗΣ : ΦΩΤΙΑΔΗΣ ΚΥΡΙΑΚΟΣ Α.Μ ΕΠΙΒΛΕΠΩΝ : Δρ. ΝΙΚΟΛΑΙΔΗΣ.
TEΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ T.E. ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΗΣ ΓΙΑ ΗΛΕΚΤΡΟΝΙΚΕΣ.
Δρ. Αλέξανδρος Βακαλούδης.  Εξόρυξη δεδομένων (Data Mining)  Association Rules  Clustering  Classification  Στάδια για εξόρυξη δεδομένων  Επανάληψη.
ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ « Εξέλιξη FarmManager για παροχή βοηθητικών υπηρεσιών (Android εφαρμογή) » Σέρρες 2016 ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Μηχανικών Πληροφορικής.
Τ.Ε.Ι. Κεντρικής Μακεδονίας ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε Τίτλος Πτυχιακής Εργασίας: Κατασκευή διδακτικού πακέτου προσομοίωσης των μηχανικών ταλαντώσεων.
Αλγόριθμοι Ταξινόμησης – Μέρος 4 Μανόλης Κουμπαράκης Δομές Δεδομένων και Τεχνικές Προγραμματισμού 1.
Ασκήσεις WEKA Δέντρα αποφάσεων.
ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ ΜΕ ΧΡΗΣΗ JAVA: ΤΟ ΛΟΓΙΣΜΙΚΟ WEKA
Ασκήσεις WEKA.
ΤΙΤΛΟΣ ΕΡΓΑΣΙΑΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ανδρέου Βασίλης.
ΟΜΑΔΕΣ Δημιουργία Ομάδων
Ασκήσεις WEKA Νευρωνικά δίκτυα.
ΠΛΗΡΟΦΟΡΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ
Βάσεις Δεδομένων & Έμπειρα Συστήματα
Παρουσίαση Εκπαιδευτικού Λογισμικού
ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε.
ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ Εισαγωγή
Ασκήσεις WEKA.
TMHMA MHΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ
FIELD MAP ΧΑΡΤΟΓΡΑΦΙΚΟΣ ΟΔΗΓΟΣ ΧΩΡΑΦΙΟΥ ANDROID
Ανάπτυξη εφαρμογής με οπτικοποιημένο περιβάλλον για τους αλγόριθμους ταξινόμησης και αναζήτησης ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕ Γεωργιαδης νικολαοσ.
ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ
Φοιτητής: Τσακίρης Αλέξανδρος Επιβλέπων: Ευάγγελος Ούτσιος
Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κεντρικής Μακεδονίας
Εφαρμογή Μεθοδολογίας ICONIX
ΔΙΠΛΩΜΑΤΙΚΗ ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Γεώργιος Τζούμας (ΑΕΜ:45)  
Φοιτητής: Γκούλης Ευάγγελος ΑΕΜ: 3342
DATA MINING ΕΞΑΜΗΝΙΑΙΟ ΘΕΜΑ ΣΤΟ ΜΑΘΗΜΑ ‘ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ ΧΩΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΘΕΩΡΙΑ ΣΥΣΤΗΜΑΤΩΝ’
Ερωτήματα Επιλογής σε ACCESS
Σκοπός Η συνοπτική παρουσίαση
ΥΠΟΛΟΓΙΣΤΙΚΗ ΝΟΗΜΟΣΥΝΗ ΕΡΓΑΣΤΗΡΙΟ
Μεταγράφημα παρουσίασης:

ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Μηχανικών Πληροφορικής ΤΕ ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Μηχανικών Πληροφορικής ΤΕ Τίτλος Πτυχιακής Εργασίας Το λογισμικό Waikato Environment for Knowledge Analysis (WEKA) σε εφαρμογές Υπολογιστικής Νοημοσύνης Σπουδαστής: Ιωάννου Σταυρούλα (Α.Ε.Μ: 2162) Επιβλέπων καθηγητής : Δρ. Βαρσάμης Δημήτριος, Επίκουρος καθηγητής

Περιεχόμενα παρουσίασης Μελέτη αντικειμένου εξόρυξης γνώσης Το εργαλείο WEKA Explorer Experimenter Knowledge flow

Μελέτη αντικειμένου εξόρυξης γνώσης Ορισμός εξόρυξης γνώσης(Data Mining) : Ανακάλυψη και αξιοποίηση της γνώσης από μεγάλο όγκο δεδομένων με την χρήση διαφόρων μεθόδων. Εφαρμογές: Στον επιχειρηματικό και επιστημονικό τομέα με στόχο την πρόβλεψη. Διαδικασία εξόρυξης γνώσης

Μελέτη αντικειμένου εξόρυξης γνώσης Ταξινόμηση Υπό επίβλεψη Εξάγει μοντέλα δεδομένων που χρησιμοποιούνται για την επεξεργασία μελλοντικών δεδομένων Χρησιμοποιεί δέντρα απόφασης και διασταυρωμένη επικύρωση με κύριο στόχο την πρόβλεψη Training set, test set Ακρίβεια =   Αποτίμηση =

Μελέτη αντικειμένου εξόρυξης γνώσης Cross- Validation Προβλήματα πρόβλεψης Ένα σύνολο δεδομένων το οποίο χωρίζεται σε ισότιμα κομμάτια που θα χρησιμοποιηθούν για την εκπαίδευση και τον έλεγχο του ταξινομητή.

Μελέτη αντικειμένου εξόρυξης γνώσης Ομαδοποίηση Χωρίς επίβλεψη Διαχωρισμός των δεδομένων σε ομάδες έτσι ώστε για κάθε εγγραφή που περιλαμβάνει μία ομάδα η ομοιότητα της με οποιαδήποτε εγγραφή από την ίδια συστάδα να είναι μεγαλύτερη από άλλες συστάδες Δεν είναι γνωστή η κλάση στην οποία ανήκουν τα αντκείμενα Αλγόριθμοι ομαδοποίησης Μονοθετικοί Πολυθετικοί Απόλυτη ομαδοποίηση Σχετική ομαδοποίηση Επίπεδη ομαδοποίηση Ιεραρχική ομαδοποίηση

Μελέτη αντικειμένου εξόρυξης γνώσης Ιεραρχικοί αλγόριθμοι Είδη ιεραρχικών αλγόριθμων Συσσωρευτικοί Διαχωριστικοί Υπολογισμός απόστασης μεταξύ των συστάδων Ολικής Σύνδεσης (Complete link) Απλού Συνδέσμου (Single link) Μέσης Σύνδεσης (Average link) Απόσταση Κεντρικών σημείων (Centroids) Μέθοδος Ward

Μελέτη αντικειμένου εξόρυξης γνώσης K-means Παράγει πολυθετικές, επίπεδες και απόλυτες ομάδες. Ο αριθμός των ομάδων K καθορίζεται από τον χρήστη, άγνωστος αριθμός κλάσεων. Τοποθετεί Cj κέντρα στο σύνολο των δεδομένων Xi, όπου κάθε Xi ανατίθεται στο κέντρο Cj με την μικρότερη απόσταση.

Το εργαλείο WEKA Το WEKA δημιουργήθηκε στο πανεπιστήμιο Waikato της Νέας Ζηλανδίας και πήρε το όνομά του από τα αρχικά της φράσης Waikato Environment for Knowledge Analysis. Περιέχει αλγόριθμους εκμάθησης μηχανής και εργαλεία προεπεξεργασίας δεδομένων. Είναι γραμμένο σε γλώσσα Java και είναι συμβατό σχεδόν με κάθε λειτουργικό σύστημα. Αποτελείται από τέσσερεις διεπαφές Explorer Experimenter Knowledge flow Simple CLI

Το εργαλείο WEKA Explorer Preprocess Classify Cluster Associate Select Attributes Visualize

Το εργαλείο WEKA Αρχεία ARFF @relation weather @attribute outlook {sunny, overcast, rainy} @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} @data sunny,85,85,FALSE,no sunny,80,90,TRUE,no overcast,83,86,FALSE,yes rainy,70,96,FALSE,yes rainy,68,80,FALSE,yes ……………………… Δήλωση αντικειμένων Εισαγωγή δεδομένων

Φόρτωση συνόλου δεδομένων

1. Παράμετροι των φίλτρων 3. Εφαρμογή 2. Επιλογή πρώτου αντικειμένου προς αφαίρεση

Αναίρεση

Το εργαλείο WEKA Explorer Preprocess Classify Cluster Associate Select Attributes Visualize

Έναρξη ταξινόμησης

Κατάταξη Στοιχείων στις κλάσεις

Σωστά ταξινομημένα Λάθος ταξινομημένα

Κατάταξη Στοιχείων στις κλάσεις

Παράμετροι του J48

Αποτελέσματα J48 με training set Το σύνολο δεδομένων χρησιμοποιείται και για εκπαίδευση και έλεγχο του ταξινομητή. Παραπλανητικά αποτελέσματα. Correctly Classified Instances 1485 99% Incorrectly Classified Instances 15 1%   === Confusion Matrix === a b c d e f g <-- classified as 205 0 0 0 0 0 0 | a = brickface 0 220 0 0 0 0 0 | b = sky 1 0 205 0 2 0 0 | c = foliage 1 0 0 217 2 0 0 | d = cement 2 0 6 1 195 0 0 | e = window 0 0 0 0 0 236 0 | f = path 0 0 0 0 0 0 207 | g = grass

Αποτελέσματα J48 με Supplied test Δυνατότητα ορισμού test set διαφορετικό από το training set. Μεγαλύτερη ακρίβεια από την διασταυρωμένη επικύρωση (95,7333%) Correctly Classified Instances 779 96.1728% Incorrectly Classified Instances 31 3.8272 % === Confusion Matrix === a b c d e f g <-- classified as 124 0 0 0 1 0 0 | a = brickface 0 110 0 0 0 0 0 | b = sky 1 0 119 0 2 0 0 | c = foliage 1 0 0 107 2 0 0 | d = cement 1 0 12 7 105 0 1 | e = window 0 0 0 0 0 94 0 | f = path 0 0 1 0 0 2 120 | g = grass

Αποτελέσματα J48 με Percentage split Εκπαιδεύει τον αλγόριθμο με ένα ποσοστό του συνόλου δεδομένων και χρησιμοποιεί το υπόλοιπο για έλεγχο. Correctly Classified Instances 485 95.098% Incorrectly Classified Instances 25 4.902 % === Confusion Matrix === a b c d e f g <-- classified as 62 0 0 1 1 0 0 | a = brickface 0 81 0 0 0 0 0 | b = sky 1 0 66 0 6 0 0 | c = foliage 2 0 4 68 4 1 0 | d = cement 1 0 3 0 56 0 0 | e = window 0 0 0 0 0 80 0 | f = path 0 0 0 0 1 0 72 | g = grass

Το εργαλείο WEKA Explorer Preprocess Classify Cluster Associate Select Attributes Visualize

Το εργαλείο WEKA Explorer Preprocess Classify Cluster Associate Select Attributes Visualize

Επιλογή αλγόριθμου

Παράμετροι K-means

Αριθμός ομάδων. Θέτουμε ίσο με το 3

Ορισμός δημιουργίας ομάδων. Θέτουμε ίσο με το 2

Το εργαλείο WEKA Explorer Preprocess Classify Cluster Associate Select Attributes Visualize

Αλγόριθμος κανόνων συσχέτισης

Association 1. outlook=overcast 4 ==> play=yes 4 2. temperature=cool 4 ==> humidity=normal 4 3. humidity=normal windy=FALSE 4 ==> play=yes 4 4. outlook=sunny play=no 3 ==> humidity=high 3 5. outlook=sunny humidity=high 3 ==> play=no 3 6. outlook=rainy play=yes 3 ==> windy=FALSE 3 7. outlook=rainy windy=FALSE 3 ==> play=yes 3 8. temperature=cool play=yes 3 ==> humidity=normal 3 9. outlook=sunny temperature=hot 2 ==> humidity=high 2 10. temperature=hot play=no 2 ==> outlook=sunny 2

Το εργαλείο WEKA Explorer Preprocess Classify Cluster Associate Select Attributes Visualize

Αξιολόγηση αντικειμένων Αναζήτηση στον χώρο των αντικειμένων

Το εργαλείο WEKA Το εργαλείο WEKA Explorer Experimenter Knowledge flow

1. 3. 2.

Επιλογή συνόλου δεδομένων

Επιλογή αλγόριθμου

Έναρξη πειράματος

Το εργαλείο WEKA Το εργαλείο WEKA Explorer Experimenter Knowledge flow

Σας ευχαριστώ για τον χρόνο σας