Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεΣαναχάριβος Γερμανός Τροποποιήθηκε πριν 6 χρόνια
1
ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Μηχανικών Πληροφορικής ΤΕ
ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Μηχανικών Πληροφορικής ΤΕ Τίτλος Πτυχιακής Εργασίας Το λογισμικό Waikato Environment for Knowledge Analysis (WEKA) σε εφαρμογές Υπολογιστικής Νοημοσύνης Σπουδαστής: Ιωάννου Σταυρούλα (Α.Ε.Μ: 2162) Επιβλέπων καθηγητής : Δρ. Βαρσάμης Δημήτριος, Επίκουρος καθηγητής
2
Περιεχόμενα παρουσίασης
Μελέτη αντικειμένου εξόρυξης γνώσης Το εργαλείο WEKA Explorer Experimenter Knowledge flow
3
Μελέτη αντικειμένου εξόρυξης γνώσης
Ορισμός εξόρυξης γνώσης(Data Mining) : Ανακάλυψη και αξιοποίηση της γνώσης από μεγάλο όγκο δεδομένων με την χρήση διαφόρων μεθόδων. Εφαρμογές: Στον επιχειρηματικό και επιστημονικό τομέα με στόχο την πρόβλεψη. Διαδικασία εξόρυξης γνώσης
4
Μελέτη αντικειμένου εξόρυξης γνώσης Ταξινόμηση
Υπό επίβλεψη Εξάγει μοντέλα δεδομένων που χρησιμοποιούνται για την επεξεργασία μελλοντικών δεδομένων Χρησιμοποιεί δέντρα απόφασης και διασταυρωμένη επικύρωση με κύριο στόχο την πρόβλεψη Training set, test set Ακρίβεια = Αποτίμηση =
5
Μελέτη αντικειμένου εξόρυξης γνώσης Cross- Validation
Προβλήματα πρόβλεψης Ένα σύνολο δεδομένων το οποίο χωρίζεται σε ισότιμα κομμάτια που θα χρησιμοποιηθούν για την εκπαίδευση και τον έλεγχο του ταξινομητή.
6
Μελέτη αντικειμένου εξόρυξης γνώσης Ομαδοποίηση
Χωρίς επίβλεψη Διαχωρισμός των δεδομένων σε ομάδες έτσι ώστε για κάθε εγγραφή που περιλαμβάνει μία ομάδα η ομοιότητα της με οποιαδήποτε εγγραφή από την ίδια συστάδα να είναι μεγαλύτερη από άλλες συστάδες Δεν είναι γνωστή η κλάση στην οποία ανήκουν τα αντκείμενα Αλγόριθμοι ομαδοποίησης Μονοθετικοί Πολυθετικοί Απόλυτη ομαδοποίηση Σχετική ομαδοποίηση Επίπεδη ομαδοποίηση Ιεραρχική ομαδοποίηση
7
Μελέτη αντικειμένου εξόρυξης γνώσης Ιεραρχικοί αλγόριθμοι
Είδη ιεραρχικών αλγόριθμων Συσσωρευτικοί Διαχωριστικοί Υπολογισμός απόστασης μεταξύ των συστάδων Ολικής Σύνδεσης (Complete link) Απλού Συνδέσμου (Single link) Μέσης Σύνδεσης (Average link) Απόσταση Κεντρικών σημείων (Centroids) Μέθοδος Ward
8
Μελέτη αντικειμένου εξόρυξης γνώσης K-means
Παράγει πολυθετικές, επίπεδες και απόλυτες ομάδες. Ο αριθμός των ομάδων K καθορίζεται από τον χρήστη, άγνωστος αριθμός κλάσεων. Τοποθετεί Cj κέντρα στο σύνολο των δεδομένων Xi, όπου κάθε Xi ανατίθεται στο κέντρο Cj με την μικρότερη απόσταση.
9
Το εργαλείο WEKA Το WEKA δημιουργήθηκε στο πανεπιστήμιο Waikato της Νέας Ζηλανδίας και πήρε το όνομά του από τα αρχικά της φράσης Waikato Environment for Knowledge Analysis. Περιέχει αλγόριθμους εκμάθησης μηχανής και εργαλεία προεπεξεργασίας δεδομένων. Είναι γραμμένο σε γλώσσα Java και είναι συμβατό σχεδόν με κάθε λειτουργικό σύστημα. Αποτελείται από τέσσερεις διεπαφές Explorer Experimenter Knowledge flow Simple CLI
10
Το εργαλείο WEKA Explorer
Preprocess Classify Cluster Associate Select Attributes Visualize
11
Το εργαλείο WEKA Αρχεία ARFF
@relation outlook {sunny, overcast, temperature humidity windy {TRUE, play {yes, sunny,85,85,FALSE,no sunny,80,90,TRUE,no overcast,83,86,FALSE,yes rainy,70,96,FALSE,yes rainy,68,80,FALSE,yes ……………………… Δήλωση αντικειμένων Εισαγωγή δεδομένων
12
Φόρτωση συνόλου δεδομένων
17
1. Παράμετροι των φίλτρων
3. Εφαρμογή 2. Επιλογή πρώτου αντικειμένου προς αφαίρεση
18
Αναίρεση
19
Το εργαλείο WEKA Explorer
Preprocess Classify Cluster Associate Select Attributes Visualize
20
Έναρξη ταξινόμησης
22
Κατάταξη Στοιχείων στις κλάσεις
24
Σωστά ταξινομημένα Λάθος ταξινομημένα
27
Κατάταξη Στοιχείων στις κλάσεις
30
Παράμετροι του J48
32
Αποτελέσματα J48 με training set
Το σύνολο δεδομένων χρησιμοποιείται και για εκπαίδευση και έλεγχο του ταξινομητή. Παραπλανητικά αποτελέσματα. Correctly Classified Instances % Incorrectly Classified Instances % === Confusion Matrix === a b c d e f g <-- classified as | a = brickface | b = sky | c = foliage | d = cement | e = window | f = path | g = grass
33
Αποτελέσματα J48 με Supplied test
Δυνατότητα ορισμού test set διαφορετικό από το training set. Μεγαλύτερη ακρίβεια από την διασταυρωμένη επικύρωση (95,7333%) Correctly Classified Instances % Incorrectly Classified Instances % === Confusion Matrix === a b c d e f g <-- classified as | a = brickface | b = sky | c = foliage | d = cement | e = window | f = path | g = grass
34
Αποτελέσματα J48 με Percentage split
Εκπαιδεύει τον αλγόριθμο με ένα ποσοστό του συνόλου δεδομένων και χρησιμοποιεί το υπόλοιπο για έλεγχο. Correctly Classified Instances % Incorrectly Classified Instances % === Confusion Matrix === a b c d e f g <-- classified as | a = brickface | b = sky | c = foliage | d = cement | e = window | f = path | g = grass
35
Το εργαλείο WEKA Explorer
Preprocess Classify Cluster Associate Select Attributes Visualize
41
Το εργαλείο WEKA Explorer
Preprocess Classify Cluster Associate Select Attributes Visualize
43
Επιλογή αλγόριθμου
45
Παράμετροι K-means
46
Αριθμός ομάδων. Θέτουμε ίσο με το 3
50
Ορισμός δημιουργίας ομάδων.
Θέτουμε ίσο με το 2
55
Το εργαλείο WEKA Explorer
Preprocess Classify Cluster Associate Select Attributes Visualize
56
Αλγόριθμος κανόνων συσχέτισης
59
Association 1. outlook=overcast 4 ==> play=yes 4
2. temperature=cool 4 ==> humidity=normal 4 3. humidity=normal windy=FALSE 4 ==> play=yes 4 4. outlook=sunny play=no 3 ==> humidity=high 3 5. outlook=sunny humidity=high 3 ==> play=no 3 6. outlook=rainy play=yes 3 ==> windy=FALSE 3 7. outlook=rainy windy=FALSE 3 ==> play=yes 3 8. temperature=cool play=yes 3 ==> humidity=normal 3 9. outlook=sunny temperature=hot 2 ==> humidity=high 2 10. temperature=hot play=no 2 ==> outlook=sunny 2
60
Το εργαλείο WEKA Explorer
Preprocess Classify Cluster Associate Select Attributes Visualize
61
Αξιολόγηση αντικειμένων
Αναζήτηση στον χώρο των αντικειμένων
62
Το εργαλείο WEKA Το εργαλείο WEKA Explorer Experimenter Knowledge flow
63
1. 3. 2.
64
Επιλογή συνόλου δεδομένων
65
Επιλογή αλγόριθμου
68
Έναρξη πειράματος
74
Το εργαλείο WEKA Το εργαλείο WEKA Explorer Experimenter Knowledge flow
87
Σας ευχαριστώ για τον χρόνο σας
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.