Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Τελική Εργασία Data Mining Μουτσανά Βασιλική.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Τελική Εργασία Data Mining Μουτσανά Βασιλική."— Μεταγράφημα παρουσίασης:

1 ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Τελική Εργασία Data Mining Μουτσανά Βασιλική

2 Προεπεξεργασία δεδομένων Το πρώτο στάδιο για την ανάλυση και επεξεργασία των δεδομένων μας είναι η αναζήτηση του «οικονομικότερου» υποσυνόλου χαρακτηριστικών που θα μας δώσει αξιόπιστα αποτελέσματα Δοκιμάζουμε διαφορετικές μεθόδους αποτίμησης και αναζήτησης χαρακτηριστικών ή υποσυνόλου χαρακτηριστικών CfsSubsetEval – BestFirst CfsSubsetEval – ScatterSearch CfsSubsetEval – GeneticSearch CfsSubsetEval – GreedyStepwise Attribute Evaluator Search Method Σύνολο Attribute για κάθε μία από τις προηγούμενες περιπτώσεις Για παράδειγμα:

3 Εφαρμογή αλγορίθμων εκμάθησης Correlation coefficient Mean absolute error Root mean squared error Relative absolute error % % % Root relative squared error % % % Total Number of Instances2528 Bagging Random Subspace Μ5 Rules Κάνοντας δοκιμές με τα προηγούμενα σύνολα attribute δεν καταλήγουμε σε ικανοποιητικά αποτελέσματα Έτσι συνεχίζουμε την επεξεργασία εισάγοντας στους αλγορίθμους εκμάθησης το αρχικό σύνολο των attribute Παρατηρούμε ότι δεν μπορούμε να χρησιμοποιήσουμε όλους τους αλγορίθμους εξαιτίας του γεγονότος ότι το target attribute είναι numeric Έτσι απαιτείται η μετατροπή του output από numeric σε nominal Παρακάτω φαίνονται τα αποτελέσματα για κάποιους αλγορίθμους έχοντας χρησιμοποιήσει numeric output Σχόλιο: Παρατηρούμε ότι οι συγκεκριμένοι αλγόριθμοι εμφανίζουν κάποιες μικρές διαφορές στα εξαγόμενα, ωστόσο το success rate και για τους τρεις είναι το ίδιο:

4 Αποτελέσματα αλγορίθμων μετά από εφαρμογή τους σε nominal output Correctly Classified Instances % % % % Incorrectly Classified Instances % % % % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % % % % Root relative squared error % % % % Total Number of Instances 2528 J48graftLadTree Bagging – Adaboost – Ladtree Bagging – Ladtree Success rate Κάποια από τα αποτελέσματα που προέκυψαν μετά από διάφορες δοκιμές έχοντας μετατρέψει το output σε nominal φαίνονται στον παρακάτω πίνακα Γενικά οι περισσότερες δοκιμές έγιναν περιλαμβάνοντας όλα τα attribute καθώς αφαιρώντας κάποια από αυτά μειώνονταν τα ποσοστά των επιτυχημένων προβλέψεων Ο αλγόριθμος Lad tree όταν χρησιμοποιείται με μετα – αλγορίθμους δίνει πραγματικά πολύ καλά αποτελέσματα Αξίζει να σημειώσουμε ότι:


Κατέβασμα ppt "ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Τελική Εργασία Data Mining Μουτσανά Βασιλική."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google