Ασκήσεις WEKA
Άσκηση 1 Αφού μετατρέψετε το αρχείο Πείραμα.xls σε μορφή weka (.arff) και τρέξετε τους αλγόριθμους του πίνακα (χρησιμοποιήστε 10-fold cross validation επικύρωσης με 20 επαναλήψεις στο πείραμα) απαντήστε στα εξής: Ταξινομητής αναφοράς
Ποιος ταξινομητής (ες) εκτελούν στατιστικά χειρότερα από ό, τι ο ταξινομητής αναφοράς; Μήπως κάθε ταξινομητή (ες) εκτελούν στατιστικά καλύτερα από την ταξινομητή αναφοράς; Ποιος ταξινομητής (ες) ταξινομούν πιο σωστές περιπτώσεις; Ποιος ταξινομητής (ες) ταξινομούν τουλάχιστον σωστές περιπτώσεις; Πόσες σωστές περιπτώσεις έκανε ο ταξινομητής αναφοράς (επί τοις εκατό); Πόσες εσφαλμένες περιπτώσεις έκανε ο ταξινομητής αναφοράς (επί τοις εκατό); Μήπως κάποις ταξινομητή είχε αταξινόμητη περιπτώσεις; Συμπέρασμα: Ποιος ταξινομητής, κατά τη γνώμη σας (με βάση κάποιες μαρτυρίες), έχει υψηλότερη απόδοση για το σύνολο δεδομένων;
Άσκηση 2 Αφού μετατρέψετε τα αρχεία Πείραμα 2-test.xls (παράδειγμα εκπαίδευσης) και Πείραμα 2-train (παράδειγμα δοκιμής) σε μορφή weka (.arff) απαντήστε στα εξής: Κοιτάξτε τα αρχεία δεδομένων, π.χ., χρησιμοποιώντας WEKA ARFF viewer και υποθέste τουλάχιστον δύο ταξινομητές που νομίζετε ότι πρέπει να λειτουργήσουν καλά για αυτό το είδος του προβλήματος. Μπορείτε να δοκιμάσετε διάφορες μεθόδους προ-επεξεργασίας και τυχόν αλγορίθμων ταξινόμησης από WEKA. Δώστε μια λίστα ονομάτων των επιλεγμένων ταξινομητές. Συζήτηστε για τα αποτελέσματα των δύο επιλεγμένων ταξινομητών.