Συνιστώσες δεδομένων Αντίληψη(concept):το αντικείμενο μάθησης Υπόδειγμα(instance):το ξεχωριστό και ανεξάρτητο παράδειγμα(example) ενός concept Χαρακτηριστικό(attribute):η μετρήσιμη συνιστώσα ενός υποδείγματος Συνιστώσες δεδομένων Αντίληψη(concept):το αντικείμενο μάθησης Υπόδειγμα(instance):το ξεχωριστό και ανεξάρτητο παράδειγμα(example) ενός concept Χαρακτηριστικό(attribute):η μετρήσιμη συνιστώσα ενός υποδείγματος
Είδη μάθησης Ταξινόμηση (Classification)=πρόβλεψη διακριτής κατηγορίας Συσχέτιση (Association)=εντοπισμός συσχετίσεων μεταξύ χαρακτηριστικών Ομαδοποίηση (Clustering)=ανάδειξη ομάδων όμοιων υποδειγμάτων Αριθμητική πρόβλεψη (Numeric Prediction)=πρόβλεψη αριθμητικής ποσότητας Αντίληψη(concept) Υπόδειγμα(instance) Συνήθης μορφή δεδομένων :dataset (πίνακες υποδειγμάτων-χαρακτηριστικών) Χαρακτηριστικό(attribute): Ονομαστικά (nominal)-δεν υπάρχει συσχέτιση ή κατάταξη, π.χ: ”outlook” /sunny, rainy Τακτικά (ordinal)-ορίζεται διάταξη μεταξύ τιμών:”temperature”/”hot”>”mild”>”cold” Περιοδικά (interval)-διατεταγμένες τιμές + σταθερές και ισαπέχουσες μονάδες: “temperature”/Fahrenheit Αναλογικά(ratio)-η μέθοδος μέτρησης ορίζει σημείο 0:”απόσταση”(μηδενική απόσταση ανάμεσα σε ένα αντικείμενο και τον εαυτό του)
Οπτικοποίηση και εξερεύνηση Η ανακάλυψη γνώσης από δεδομένα προϋποθέτει εκτενή εφαρμογή της μεθόδου trial & error και αποτελεί εξ’ ορισμού πειραματική επιστήμη. Το περιβάλλον εργασίας WEKA Η τυποποίηση.ARFF αποτελεί τη φυσική μέθοδο αποθήκευσης δεδομένων του weka.