Ασκήσεις WEKA.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Bayes Classifiers.
Advertisements

Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης
ΔΙΔΑΚΤΙΚΕΣ ΔΥΣΚΟΛΙΕΣ ΣΤΟΥΣ ΠΙΝΑΚΕΣ ΠΕΚ ΠΕΙΡΑΙΑ Α΄φάση Επιμόρφωσης Εκπ/κών κλάδου ΠΕ19 Διδακτική της Πληροφορικής Ρόδος, Νοέμβρης 2007.
Πολυπλοκότητα Παράμετροι της αποδοτικότητας ενός αλγόριθμου:
Επιμέλεια Π. Τσάκωνας. 1. Ποια από τα ακόλουθα αποσπάσματα αλγόριθμων πραγματοποιούν σωστά την ταξινόμηση του πίνακα Α; ΓΙΑ i ΑΠΟ 2 ΜΕΧΡΙ Ν ΓΙΑ j ΑΠΟ.
Δομές Αναζήτησης TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A εισαγωγή αναζήτησηεπιλογή διατεταγμένος πίνακας.
Ακριβής Συμπερασμος σε δίκτυα Bayes με τη μέθοδο της Απαρίθμησης
Μπεϋζιανά & Νευρωνικά Δίκτυα
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
Αναγνώριση Προτύπων.
Συνιστώσες δεδομένων  Αντίληψη(concept):το αντικείμενο μάθησης  Υπόδειγμα(instance):το ξεχωριστό και ανεξάρτητο παράδειγμα(example) ενός concept  Χαρακτηριστικό(attribute):η.
Μάθημα 4ο Εισαγωγή στον τραπεζικό κίνδυνο. Τι είναι ο κίνδυνος Στο προηγούμενο μάθημα συσχετίσαμε τον κίνδυνο με το δανεισμό και τη διαφοροποίηση του.
ΕΞΌΡΥΞΗ ΔΕΔΟΜΈΝΩΝ ΚΑΙ ΑΛΓΌΡΙΘΜΟΙ ΜΆΘΗΣΗΣ Κατηγοριοποίηση 4 ο Φροντιστήριο Σκούρα Αγγελική
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
1 Χαρακτηριστικά ενός Μ/Μ/1 συστήματος : Αφίξεις κατανεμημένες κατά Poisson Εκθετικά κατανεμημένοι χρόνοι εξυπηρέτησης Οι χρόνοι εξυπηρέτησης είναι αμοιβαία.
Ανάλυση Παλινδρόμησης με Δεδομένα Χρονολογικών Σειρών
Ανάπτυξη και εκπαίδευση ιεραρχίας ταξινομητών για την κατηγοριοποίηση κειμένων Αβραμίδη Γεωργία 719.
ΑΝΑΠΤΥΞΗ ΤΑΞΙΝΟΜΗΤΗ ΗΛΕΚΤΡΟΝΙΚΗΣ ΑΛΛΗΛΟΓΡΑΦΙΑΣ ΜΑΛΕΖΑ ΣΟΦΙΑ ΑΕΜ:765.
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
Σχεδίαση Αλγορίθμων - Τμήμα Πληροφορικής ΑΠΘ - Εξάμηνο 4ο1 Ωμή Βία Είναι μία άμεση προσέγγιση που βασίζεται στην εκφώνηση του προβλήματος και τους ορισμούς.
Βασικές Αρχές Μέτρησης
2-1 Ανάλυση Αλγορίθμων Αλγόριθμος Πεπερασμένο σύνολο εντολών που, όταν εκτελεστούν, επιτυγχάνουν κάποιο επιθυμητό αποτέλεσμα –Δεδομένα εισόδου και εξόδου.
Identifying bullies with a computer game Juan F. Mancilla-Caceres,Wen Pu, Eyal Amir Department of Computer Science University of Illinois at Urbana-Champaign.
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Learning to Learn: Algorithmic Inspirations from Human Problem Solving.
ΑΣΚΗΣΗ 1η Μέτρηση διαφοράς φάσεως και συχνότητας
Διαχείριση έργου 14/1/2015 Κατερίνα Αδάμ, Μ.Sc., PhD
3/4/2015Μαθηματικές έννοιες και Φυσικές Επιστήμες 1 ΜΑΘΗΜΑΤΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΦΥΣΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Συνάντηση 5η.
ΚΕΦΑΛΑΙΟ 6 ΓΕΩΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ: ΣΗΜΕΙΑ
Εξόρυξη Δεδομένων: Ακ. Έτος ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗ II1 Κατηγοριοποίηση ΙΙ.
Δομές Δεδομένων 1 Θέματα Απόδοσης. Δομές Δεδομένων 2 Οργανώνοντας τα Δεδομένα  Η επιλογή της δομής δεδομένων και του αλγορίθμου επηρεάζουν το χρόνο εκτέλεσης.
Ταξινόμηση - Sorting.
1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Ανακάλυψη Γνώσης από Βιολογικές Αλληλουχίες Αλεξανδρίδου Αναστασία.
Data Mining software Weka. Εισαγωγή Weka: Wekato Environment for knowledge Analysis Η weka είναι ένα software για εξόρυξη δεδομένων γραμμένο σε JAVA το.
ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ
Αρχές επαγωγικής στατιστικής
Διάλεξη  Μέτρηση: Είναι μια διαδικασία κατά την οποία προσδίδουμε αριθμητικά δεδομένα σε κάποιο αντικείμενο, σύμφωνα με κάποια προκαθορισμένα.
ΕΙΣΑΓΩΓΗ Η επιδίωξη: βελτίωση ποιότητας με συνεχή βελτίωση των διεργασιών με βάση τις οποίες παράγονται τα προϊόντα Παράγοντες: ελεγχόμενες μεταβλητές.
ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ Γ. Σιδερίδης. ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ- ΜΕΘΟΔΟΛΟΓΙΑΣ Η στατιστική ως επιστήμη.....γιατί ακριβώς τη χρειαζόμαστε; Η στατιστική ως επιστήμη.....γιατί.
1.4 Καθορισμός απαιτήσεων Είναι η διαδικασία κατά την οποία πρέπει να κάνουμε: ✗ τον επακριβή προσδιορισμό των δεδομένων που παρέχει το πρόβλημα ✗ την.
Στατιστικές Υποθέσεις (Ερευνητικά Ερωτήματα / Υποθέσεις προς επιβεβαίωση)
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. –Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας.
Χρηματοοικονομική Ανάλυση …η διαδικασία άντλησης οικονομικών πληροφοριών από τα χρηματοοικονομικά στοιχεία μιας εταιρείας. Η χρηματοοικονομική ανάλυση.
ΜΑΘΗΜΑ: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ 2 ο ΕΡΓΑΣΤΗΡΙΟ: Μενού,Εντολές και Παράθυρα Διαλόγου Καθηγητής: Γρηγόριος Νικ. Καρατάσιος.
Test.
Test.
ΔΙΑΛΕΞΗ 11η Ποσοτική έρευνα υγείας
Ασκήσεις WEKA Δέντρα αποφάσεων.
ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ ΜΕ ΧΡΗΣΗ JAVA: ΤΟ ΛΟΓΙΣΜΙΚΟ WEKA
Στατιστικές Υποθέσεις
Μέτρα μεταβλητότητας ή διασποράς
Ασκήσεις WEKA Νευρωνικά δίκτυα.
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
5o Μάθημα: Το τεστ χ2 Κέρκυρα.
Πολυσυγγραμμικότητα Εξειδίκευση
Ανάπτυξη Μοντέλων Διακριτών Συστημάτων Μέρος Β
Παρουσίαση ευρείας οθόνης
Ασκήσεις WEKA.
Ασκήσεις WEKA Κανόνες συσχέτισης.
Από τα Δεδομένα στην Πληροφορία………………….
Ταξινόμηση Πολυφασματικών Εικόνων
ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Μηχανικών Πληροφορικής ΤΕ
Από τα Δεδομένα στην Πληροφορία………………….
Η τακτοποίηση των κόμβων μίας δομής με μία ιδιαίτερη σειρά είναι μία πολύ σημαντική λειτουργία που ονομάζεται ταξινόμηση (sorting) ή διάταξη (ordering).
Στατιστικές Υποθέσεις
ΤΑΞΙΝΟΜΗΣΗ ΠΡΟΤΥΠΩΝ ΜΕ ΣΥΝΑΡΤΗΣΕΙΣ ΑΠΟΣΤΑΣΗΣ Απλοί Ταξινομητές
Identifying bullies with a computer game
Εννοιολογική Χαρτογράφηση
Δεν μπορείς να βασίσεις τη φήμη σου σε αυτό που σκοπεύεις να κάνεις.
ΕΛΕΓΧΟΣ ΑΝΕΞΑΡΤΗΣΙΑΣ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ
Μεταγράφημα παρουσίασης:

Ασκήσεις WEKA

Ανοίξτε το WEKA και ενεργοποιήστε το περιβάλλον Explorer Ανοίξτε το dataset “weather.arff” Πόσα παραδείγματα περιλαμβάνει το dataset? Πόσα χαρακτηριστικά χρησιμοποιούνται για να παρουσιάσουμε τα παραδείγματα? Ποιος είναι ο τύπος κάθε χαρακτηριστικού που περιλαμβάνεται στο dataset? (e.g., numeric, nominal, etc.) Πόσες πιθανές τιμές έχει το κάθε χαρακτηριστικό?

Κατηγοριοποίηση – μέθοδος ZeroR Είναι η πιο απλή μέθοδος ταξινόμησης Βασίζεται στο στόχο Ο ταξινομητής ZeroR προβλέπει απλώς την πλειοψηφική τάξη. Αλγόριθμος: Κατασκευάστε ένα πίνακα συχνοτήτων για το στόχο και να επιλέγει την πιο συχνή τιμή του.

Κατηγοριοποίηση Μετατοπιστείται στην καρτέλα Classify. Επιλέξτε την κατηγοροποίηση ZeroR. Σαν δοκιμαστική λειτουργία επιλέξτε “Use training set”. Τρέξτε τον κατηγοριοποιητή και παρατηρήστε τα αποτελέσματα που εμφανίζονται στο παράθυρο “Classifier output” Πόσα παραδείγματα δεν είναι σωστά κατηγοροιοποιημένα? Τι μπορείτε να συμπεράνεται από τις πληροφορίες που εμφανίζονται στον πίνακα σύγχυσης?

Επιλέξτε τον τρόπο “Percentage split” (66% for training). Τρέξτε τον κατηγοριοποιητή ZeroR και παρατηρήστε τα αποτελέσματα στο παράθυρο “Classifier output” Πόσα παραδείγματα δεν είναι σωστά κατηγοριοποιημένα? Για πιο λόγο αυτός ο αριθμός είναι μικρότερος από το προηγούμενο test?

Κατηγοριοποίηση – μέθοδος NaiveBayes Ο ταξινομητής Naive Bayesian με βάση το θεώρημα του Bayes λειτουργεί με υποθέσεις ανεξαρτησία ανάμεσα στις προβλέψεις. Παρά την απλότητά του, η Naive Bayesian ταξινομητής συχνά λειτουργεί εκπληκτικά καλά και χρησιμοποιείται ευρέως Αλγόριθμος: Θεώρημα του Bayes παρέχει έναν τρόπο υπολογισμού της εκ των υστέρων πιθανότητα, P (c | x), P (c), P (x) και P (X | c). Naive Bayes ταξινομητής υποθέτει ότι η επίδραση της αξίας του προγνωστικού (x) σε μια δεδομένη κατηγορία (c) είναι ανεξάρτητα από τις τιμές των άλλων προγνωστικών. Αυτή η υπόθεση αποκαλείται τάξη ανεξαρτησίας υπό όρους.

Κατηγοριοποίηση – μέθοδος NaiveBayes Επιλέξτε την "cross-validation" (10 φορές) δοκιμαστική λειτουργία. Εκτελέστε το Naive Bayes ταξινομητή και παρατηρήστε τα αποτελέσματα που εμφανίζονται στο παράθυρο "εξόδου Κατηγοριοποιητή". Πόσες περιπτώσεις έχουν ταξινομηθεί εσφαλμένα; Συγκρίνετε αυτά τα αποτελέσματα με εκείνα που παρατηρήθηκαν για τον ταξινομητή Zeror Ποιος ταξινομητής, Zeror ή NaiveBayes, δείχνει μια καλύτερη πρόβλεψη επιδόσεις για το τρέχον σύνολο δεδομένων και τον τρόπο δοκιμής ενδοπιστοποίηση;

Επιλέξτε τη δοκιμαστική λειτουργία “Percentage split” (66% for training). Εκτελέστε το Naive Bayes ταξινομητή και παρατηρήστε τα αποτελέσματα που εμφανίζονται στο παράθυρο "εξόδου Κατηγοριοποιητή". Πόσες περιπτώσεις έχουν ταξινομηθεί εσφαλμένα; Να γίνει σύγκριση των αποτελεσμάτων του ταξινομητή Naive Bayes για τις 2 δοκιμές λειτουργίας. Σε ποια δοκιμαστική λειτουργία ο ταξινομητής παράγει ένα καλύτερο αποτέλεσμα (δηλαδή, ένα μικρότερο σφάλμα); Ποιος ταξινομητής, Zeror ή NaiveBayes, δείχνει μια καλύτερη απόδοση για την πρόβλεψη του τρέχον σύνολο δεδομένων;