Data Mining software Weka. Εισαγωγή Weka: Wekato Environment for knowledge Analysis Η weka είναι ένα software για εξόρυξη δεδομένων γραμμένο σε JAVA το.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Κατέβασμα αρχείων βίντεο και ήχου Με το Τι είναι το Real Player To Real Player είναι μια πολυδύναμη εφαρμογή με την οποία μπορούμε να παίξουμε βίντεο.
Advertisements

Εισαγωγή στο περιβάλλον εργασίας του
Πώς να χρησιμοποιήσετε τον λογαριασμό σας στο Gmail
Support.ebsco.com Εκπαιδευτικό μάθημα για τη δημιουργία τοπικής συλλογής.
Support.ebsco.com Η Λίστα αποτελεσμάτων EBSCOhost Εκπαιδευτικό μάθημα.
Support.ebsco.com Χρήση της Λειτουργίας ιστορικού αναζήτησης Εκπαιδευτικό μάθημα.
EPL003: Επιστήμη της Πληροφορικής και Πληροφοριακά Συστήματα
Έγινε επίδειξη και πρακτική εφαρμογή δύο δημοφιλών προγραμμάτων επεξεργασίας κειμένου (Microsoft Office, OpenOffice Writer). Μάθαμε πώς αλλάζουμε τη γλώσσα.
Εργαστήριο μαθήματος «Τεχνολογία Γνώσης» Σαντιπαντάκης Γιώργος
ΕΠΛ002: Εισαγωγή στην Επιστήμη της Πληροφορικής
Support.ebsco.com Εισαγωγή στο EBSCOhost Εκπαιδευτικό μάθημα.
Εκτέλεση Αλγορίθμων σε ψευδογλώσσα
Γυμνάσιο Νέας Κυδωνίας
Microsoft Excel 4.2 Κελιά Κίκα Χρυσοστόμου.
4o Μάθημα.
Μήτρες (templates)  Μία μήτρα είναι ένα κομμάτι κώδικα που περιέχει παραμέτρους οι οποίες δέχονται ως τιμές τύπους δεδομένων.  Είναι ένας μηχανισμός.
Visual Turtle: Μιά “μοντέρνα” Logo.
ΕΠ ΚτΠ – Μέτρο 1.2 «Εισαγωγή και Αξιοποίηση των Νέων Τεχνολογιών στην Εκπαίδευση» Πράξη «Δράσεις Επιμόρφωσης Εκπαιδευτικών Πληροφορικής» Ανάδοχος: Ερευνητικό.
ΕΝΟΤΗΤΑ Γ΄ Ελέγχω – Προγραμματίζω τον Υπολογιστή
Συνιστώσες δεδομένων  Αντίληψη(concept):το αντικείμενο μάθησης  Υπόδειγμα(instance):το ξεχωριστό και ανεξάρτητο παράδειγμα(example) ενός concept  Χαρακτηριστικό(attribute):η.
ΕΝΟΤΗΤΑ 3 – Κεφάλαιο 9: Ζωγραφική
Βάσεις Δεδομένων Μάθημα 4.
Δομές Δεδομένων στο Λ.Π.. Λίστες Λίστα είναι ένας όρος –Οι όροι αυτοί ορίζονται με τη βοήθεια μιας συνάρτησης: [ ] σταθερά για κενή λίστα – nil [t1| l]
ΑΝΑΠΤΥΞΗ ΤΑΞΙΝΟΜΗΤΗ ΗΛΕΚΤΡΟΝΙΚΗΣ ΑΛΛΗΛΟΓΡΑΦΙΑΣ ΜΑΛΕΖΑ ΣΟΦΙΑ ΑΕΜ:765.
Εργασία με παράθυρα.
1 ΧΡΗΣΗ Η/Υ, ΑΛΕΞΗΣ ΜΠΡΑΪΛΑΣ, 1998 Εφαρμογές Υπολογιστών.
Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. K-means k-windows k-means: 2 φάσεις 1. Μια διαμέριση των στοιχείων σε k clusters 2. Η ποιότητα της διαμέρισης.
Επικοινωνία Ανθρώπου Μηχανής HTML CGI JAVASCRIPT Κουμπούλης Χρήστος Α.Μ. 921 Χαλαβαζής Βασίλης Α.Μ. 988.
ΕΓΚΑΤΑΣΤΑΣΗ WINDOWS 8 ΟΜΑΔΑ: ΔΗΜΗΤΡΗΣ ΜΑΚΚΑΣ ΠΑΝΑΓΙΩΤΗΣ ΚΟΥΤΣΟΜΠΛΗΣ ΧΡΙΣΤΟΣ ΠΑΤΑΚΙΑΣ ΝΑΚΟΣ ΝΤΟΜΠΕΒ.
Γυμνάσιο Νέας Κυδωνίας
Εκπαιδευτικό μάθημα Δημιουργία Ειδοποιήσεων περιοδικών
ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Διδάσκοντες:Στάθης Ζάχος Νίκος Παπασπύρου
Microsoft PowerPoint Κίκα Χρυσοστόμου. Γραφικές Παραστάσεις Γραφικές Παραστάσεις (Charts):  Column (Στήλη)  Bar (Ράβδος)  Line (Γραμμή)  Pie (Πίτα)
ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ Διδάσκοντες:Στάθης Ζάχος Νίκος Παπασπύρου
Πολυωνυμικά Μοντέλα. Βήμα 1ο: Εισαγωγή των στοιχείων του Πίνακα 1 στο E-views από ένα αρχείο Excel. Από τη πτυσσόμενο μενού File επιλέγουμε New και Workfile.
ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Δρ. Παναγιώτης Συμεωνίδης
1. 1.Δημιουργία Νέου Αρχείου Επιλέγουμε καρτέλα File, πατούμε στην εντολή New και μετα αφου διαλέξουμε τον τύπo αρχείου (π.χ Blank Document), πατούμε.
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧ/ΣΕΩΝ ΕΡΓΑΣΤΗΡΙΟ #1 ΔΔΕ. Έναρξη (Start)  Προγράμματα (Programs)  Minitab 12 for Windows.
Οδηγίες για την άσκηση. Δημιουργούμε ένα φάκελο ο οποίος θα περιέχει : Το shape file derveni στο οποίο υπάρχουν οι ισοϋψείς ψηφιοποιημένες και τα αρχεία.
ΜΑΘΗΜΑ: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ 2 ο ΕΡΓΑΣΤΗΡΙΟ: Μενού,Εντολές και Παράθυρα Διαλόγου Καθηγητής: Γρηγόριος Νικ. Καρατάσιος.
ΜΑΘΗΜΑ: ΣΥΓΧΡΟΝΟ ΛΟΓΙΣΜΙΚΟ ΟΡΓΑΝΩΣΗ ΓΡΑΦΕΙΟΥ 5 ο ΕΡΓΑΣΤΗΡΙΟ: ΕΓΚΑΤΑΣΤΑΣΗ ΕΚΤΥΠΩΤΩΝ ΚΑΘΗΓΗΤΗΣ: ΓΡΗΓΟΡΙΟΣ Ν. ΚΑΡΑΤΑΣΙΟΣ.
Ασκήσεις WEKA Δέντρα αποφάσεων.
ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ ΜΕ ΧΡΗΣΗ JAVA: ΤΟ ΛΟΓΙΣΜΙΚΟ WEKA
Ασκήσεις WEKA.
ΕΝΟΤΗΤΑ 3 – Κεφάλαιο 9: Ζωγραφική
ΟΜΑΔΕΣ Δημιουργία Ομάδων
Ασκήσεις WEKA Νευρωνικά δίκτυα.
Prolog Επεξεργασία και Αναπαράσταση Γνώσης Εισαγωγή
Software Engineering for Web Applications
ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ Μετονομασία Φακέλων και Αρχείων
ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΠΡΟΧΩΡΗΜΕΝΕΣ ΤΕΧΝΙΚΕΣ
Εισαγωγή στο λογισμικό & αρχική περιήγηση
Πώς να φτιάξω το δικό μου
1. Πώς ανοίγουμε ένα αποθηκευμένο βιβλίο εργασίας;
Αρχεία και φάκελοι.
Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ
Οργάνωση αρχείων & φακέλων
Web Services στη C# Εργαστήριο 3
ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Μηχανικών Πληροφορικής ΤΕ
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Ανάπτυξη εκπαιδευτικής εφαρμογής.
1)Αφού ακολουθήσουμε τον σύνδεσμο βρισκόμαστε εδώ
DataStudio ένα πρόγραμμα
Γραφικές Μέθοδοι Σχεδιασμού με Η-Υ Εκπαιδευτικό Παράδειγμα 2
ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ
ΠΡΟΓΡΑΜΜΑ ΕΠΙΜΟΡΦΩΣΗΣ Β΄ΕΠΙΠΕΔΟ ΓΙΑ ΠΕ03
DATA MINING ΕΞΑΜΗΝΙΑΙΟ ΘΕΜΑ ΣΤΟ ΜΑΘΗΜΑ ‘ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ ΧΩΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΘΕΩΡΙΑ ΣΥΣΤΗΜΑΤΩΝ’
Ερωτήματα Επιλογής σε ACCESS
Οδηγίες χρήσης του προγράμματος WavePad
ΥΠΟΛΟΓΙΣΤΙΚΗ ΝΟΗΜΟΣΥΝΗ ΕΡΓΑΣΤΗΡΙΟ
ΕΝΟΤΗΤΑ 3 – Κεφάλαιο 9: Ζωγραφική
Μεταγράφημα παρουσίασης:

Data Mining software Weka

Εισαγωγή Weka: Wekato Environment for knowledge Analysis Η weka είναι ένα software για εξόρυξη δεδομένων γραμμένο σε JAVA το οποίο περιέχει υλοποιημένες μεθόδους για : Προεπεξεργασία Δεδομένων Ταξινόμηση Συσταδοποίηση Εύρεση Κανόνων Συσχέτισης

Εγκατάσταση To software είναι διαθέσιμο για εγκατάσταση από την ιστιοσελίδα : Για το περιβάλλον των windows, σε περίπτωση που κάποια έκδοση της java δεν είναι ήδη εγκατεστημένη, το εκτελέσιμο που θα αποθηκευτεί είναι η έκδοση (developers version) που περιλαμβάνει την java VM 5.0

Περιβάλλον weka Ανοίγοντας το πρόγραμμα, μέσω του μενού Application →Exporer→Open file δίνεται η δυνατότητα να επιλεγεί ένα σύνολο δεδομένων στο οποίο μπορούν να εφαρμοστούν τεχνικές που αφορούν : Preprocess Classify Cluster Associate Select Attributes Visualize Επιλέγοντας ένα σύνολο δεδομένων (αρχείο.arff ), εμφανίζονται γραφικά τα δεδομένα για καθένα από τα γνωρίσματα ξεχωριστά καθώς και στατιστικές πληροφορίες για αυτά. Εάν στο σύνολο δεδομένων δίνεται και κάποια κλάση στην οποία ταξινομούνται, τα δεδομένα που ανήκουν στην ίδια κλάση εμφανίζονται με το ίδιο χρώμα

Αρχεία.arff Τα αρχεία που περιέχουν το σύνολο δεδομένων πρέπει να έχουν συγκεκριμένο format και να αποθηκεύονται με την επέκταση.arff Στον φάκελο C:\Program Files\Weka-3-5\data περιέχονται κάποια παραδείγματα τέτοιων αρχείων. Δεδομένα μπορούν επίσης να δοθούν από ένα URL ή από μία SQL βάση.

age sex { female, chest_pain_type { typ_angina, asympt, non_anginal, cholesterol exercise_induced_angina { no, class { present, 63,male,typ_angina,233,no,not_present 67,male,asympt,286,yes,present 67,male,asympt,229,yes,present 38,female,non_anginal,?,no,not_present...

Οπτικοποίηση δεδομένων Από την καρτέλα visualize υπάρχει η δυνατότητα να εμφανιστεί η γραφική αναπαράσταση κάθε γνωρίσματος σε συνάρτηση με κάθε άλλο γνώρισμα.

Συσταδοποίηση δεδομένων Αφού έχει επιλεγεί ένα σύνολο δεδομένων είναι δυνατόν να γίνει συσταδοποίηση ( εύρεση ομάδων ‘ όμοιων ’ δεδομένων ). Από την καρτέλα cluster μπορεί να επιλεγεί ένας αλγόριθμος με βάση τον οποίο θα γίνει συσταδοποίηση και με το κουμπί start να αρχίσει η εκτέλεση του αλγορίθμου.

Επιλογή αλγορίθμου Οι αλγόριθμοι συσταδοποίησης που έχουν υλοποιηθεί είναι οι : Cobweb ( ιεραρχική συσταδοποίηση ) DBScan EM Farthest First OPTICS SimpleKmeans (K-means) Xmeans

Πληροφορίες σχετικά με τα αποτελέσματα του clustering στα δεδομένα

Παράμετροι Οι τιμές των παραμέτρων κάθε αλγορίθμου συσταδοποίησης ( όπως ο αριθμός των clusters στον kmeans, το eps και το MinPts στον DBScan) μπορούν να τροποποιηθούν από μία καρτέλα που εμφανίζεται με διπλό κλικ πάνω στο όνομα του αλγορίθμου όταν αυτός έχει επιλεγεί.

Οπτικοποίηση αποτελέσματος Με δεξί κλικ πάνω στο όνομα του αλγορίθμου που έχει ήδη εκτελεστεί στα δεδομένα ( από το result list) εμφανίζεται ένα μενού με την βοήθεια του οποίου μπορεί να εμφανιστεί η γραφική αναπαράσταση των δεδομένων, με βάση τις ομάδες που έχουν προκύψει από το clustering

Οπτικοποίηση αποτελέσματος