Ασκήσεις WEKA Κανόνες συσχέτισης.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
ΓΡΑΜΜΑΤΙΚΕΣ ΧΩΡΙΣ ΣΥΜΦΡΑΖΟΜΕΝΑ I
Advertisements

Εισαγωγή στους Αλγορίθμους
Εξόρυξη Δεδομένων.
H διαδικασία ανάπτυξης λογισμικού. Tι θα γνωρίσουμε •Τις φάσεις ανάπτυξης του λογισμικού. •Γιατί χρειάζεται να γίνει ανάλυση του προβλήματος. •Τι θα πρέπει.
Τ.Ε.Ι. ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ Επιβλέπων καθηγητής: Βακαλούδης Αλέξανδρος Σπουδαστής: Τσιαουσίδης Δημήτριος.
Ανάλυση προβλημάτων και Αλγόριθμοι
Ολυμπία Νίκου Α.Μ. Μ956 Διπλωματική Εργασία
Κανόνες Συσχέτισης IΙ Οι διαφάνειες στηρίζονται στο P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 2006.
Κανόνες Συσχέτισης IIΙ
Εισαγωγή στην επιστήμη των υπολογιστών
Ανάλυση Συσχέτισης IΙ Οι διαφάνειες στηρίζονται στο P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 2006.
Ο Αλγόριθμος FP-Growth. Αλγόριθμος FP-Growth Ο αλγόριθμος χρησιμοποιεί μια συμπιεσμένη αναπαράσταση της βάσης των συναλλαγών με τη μορφή ενός FP-δέντρου.
Ενότητα Η Δομή Επανάληψης
Επικαλύπτοντα Δέντρα και Σύνολα Τομής
Β΄ ΓΕΛ ΕισΑρχΕπ Η/Υ παρ – 2.2.5
Διαίρει-και-Βασίλευε
Ανάλυση Συσχέτισης Ι Οι διαφάνειες στηρίζονται στο P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 2006.
Ασκήσεις.
Κανόνες Συσχέτισης Ι Οι διαφάνειες στηρίζονται στο P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 2006.
Κανόνες Συσχέτισης Ι Οι διαφάνειες στηρίζονται στο P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 2006.
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΑΛΓΟΡΙΘΜΩΝ
ΒΕΣ 06: Προσαρμοστικά Συστήματα στις Τηλεπικοινωνίες © 2007 Nicolas Tsapatsoulis Προσαρμοστικοί Αλγόριθμοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων: Ο αναδρομικός.
Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. K-means k-windows k-means: 2 φάσεις 1. Μια διαμέριση των στοιχείων σε k clusters 2. Η ποιότητα της διαμέρισης.
Κανόνες Συσχέτισης Σκοπός: Σύνοψη βασικών τεχνικών παραγωγής Κανόνων Συσχέτισης Σύνοψη Προβλημάτων Κανόνων Συσχέτισης Αλγόριθμοι Κανόνων Συσχέτισης Apriori.
Kεφάλαιο 4 ΑΛΓΟΡΙΘΜΟΙ-ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ (αναλυτική προσέγγιση)
Ελάχιστο Συνδετικό Δέντρο
Computers: Information Technology in Perspective By Long and Long Copyright 2002 Prentice Hall, Inc. Προγραμματισμός Η / Υ 6 η Διάλεξη.
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. ΥΠΟΛΟΓΙΣΤΗΣ Μηχανή που μπορεί να φέρει σε πέρας πνευματικές εργασίες ρουτίνας με μεγάλη ταχύτητα.
Λεξικό, Union – Find Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων.
Προγραμματισμός Εισαγωγή στην έννοια του αλγορίθμου και στον Προγραμματισμό.
ΑΕΠΠ 3ο Κεφάλαιο Γεωργαλλίδης Δημήτρης Καθηγητής Πληροφορικής 1 Ο Λύκειο Ρόδου.
Ερωτήσεις & Φύλλο εργασίας
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Συναρτησιακές Εξαρτήσεις.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Συναρτησιακές Εξαρτήσεις.
Κανόνες Συσχέτισης IΙ Οι διαφάνειες στηρίζονται στο P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 2006.
Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 1 Εξόρυξη Δεδομένων.
ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Δρ. Παναγιώτης Συμεωνίδης
Συνδετικότητα γραφήματος (graph connectivity). α β Υπάρχει μονοπάτι μεταξύ α και β; Παραδείγματα: υπολογιστές ενός δικτύου ιστοσελίδες ισοδύναμες μεταβλητές.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
Δρ. Αλέξανδρος Βακαλούδης.  Εξόρυξη δεδομένων (Data Mining)  Association Rules  Clustering  Classification  Στάδια για εξόρυξη δεδομένων  Επανάληψη.
Διοίκηση Επιχειρήσεων Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας.
Ήπιες Μορφές Ενέργειας Ε306 Από τον άνεμο στην οικονομική βιωσιμότητα (εισαγωγικές έννοιες)
ΗΛΕΚΤΡΙΚΕΣ ΜΕΤΡΗΣΕΙΣ ΣΦΑΛΜΑΤΑ ΜΕΤΡΗΣΗΣ.
Σήματα και Συστήματα 11 10η διάλεξη. Σήματα και Συστήματα 12 Εισαγωγικά (1) Έστω γραμμικό σύστημα που περιγράφεται από τη σχέση: Αν η είσοδος είναι γραμμικός.
Ασκήσεις WEKA Δέντρα αποφάσεων.
Τέταρτο μάθημα Ψηφιακά Ηλεκτρονικά.
Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον
Ασκήσεις WEKA.
Τι μπορούμε να δούμε σε αυτό το ιστόγραμμα?
ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ
ΔΟΜΗ ΑΠΛΗΣ ΕΠΙΛΟΓΗΣ ΑΝ συνθήκη_ισχύει ΤΟΤΕ εντολές ΤΕΛΟΣ_ΑΝ
Η ΦΥΣΙΚΗ ΜΕ ΠΕΙΡΑΜΑΤΑ Α’ ΓΥΜΝΑΣΙΟΥ
ΣΤ΄ 1 ΤΑΞΗ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ
ΔΟΜΗ ΕΠΑΝΑΛΗΨΗΣ «ΓΙΑ» Για μτ από ατ μέχρι ττ [με_βήμα β] εντολές Τέλος_επανάληψης : περιοχή εντολών μτ : η μεταβλητή της.
Διάλεξη 9: Συνδυαστική λογική - Ασκήσεις Δρ Κώστας Χαϊκάλης
Επικαλύπτοντα Δέντρα και Σύνολα Τομής
Το Φαινόμενο του Θερμοκηπίου
14ο ΔΗΜΟΤΙΚΟ ΣΧΟΛΕΙΟ ΟΜΑΔΑ 6 ΟΜΑΔΑ ΕΡΓΑΣΙΑΣ ΚΩΣΤΑΣ Ρ. ΝΙΚΗ Β.
ΤΥΠΟΙ ΑΝΤΙΔΡΑΣΕΩΝ ΣΤΙΣ ΟΡΓΑΝΟΜΕΤΑΛΛΙΚΕΣ ΕΝΩΣΕΙΣ
ΑΝ Χ<> Α_Μ(Χ) ΤΟΤΕ ΓΡΑΨΕ “Λάθος” ΤΕΛΟΣ_ΑΝ
Κεντρικό πλαίσιο ανακοινώσεων
Βασικές έννοιες αλγορίθμων
Α. Νανόπουλος & Γ. Μανωλόπουλος Εισαγωγή στην Εξόρυξη & τις Αποθήκες Δεδομένων Κεφάλαιο 8: Κανόνες Συσχέτισης
Ασφάλεια και υγιεινή στο εργαστήριο
Ορισμοί support count () ενός στοιχειοσυνόλου
Μέρος 5ο: Μέθοδοι Επαύξησης της Απόληψης Πετρελαίου
Η ΑΝΑΠΝΟΗ ΤΟΥ ΑΝΘΡΩΠΟΥ ΑΝΑΠΝΕΥΣΤΙΚΟ ΣΥΣΤΗΜΑ.
ΜΠΟΡΕΙΣ ΝΑ ΜΕΙΩΣΕΙΣ ΤΟ ΦΑΙΝΟΜΕΝΟ ΤΟΥ ΘΕΡΜΟΚΗΠΙΟΥ
Μεταγράφημα παρουσίασης:

Ασκήσεις WEKA Κανόνες συσχέτισης

Εισαγωγή Το πρόβλημα: ∆εδομένου ενός συνόλου δοσοληψιών (transactions), βρες κανόνες που προβλέπουν την εμφάνιση στοιχείων (item) με βάση την εμφάνιση άλλων στοιχείων στις συναλλαγές Κανόνες συσχέτισης {Diaper} → {Beer}, {Milk, Bread} → {Eggs,Coke}, {Beer, Bread} → {Milk} Σημαίνει ότι εμφανίζονται μαζί, όχι ότι η εμφάνιση του ενός είναι η αιτία της εμφάνισης του άλλου (co-occurrence, not causality όχι έννοια χρόνου ή διάταξης) TID Items 1 Bread, Milk 2 Bread, Diaper, Beer, Eggs 3 Milk, Diaper, Beer, Coke 4 Bread, Milk, Diaper, Beer 5 Bread, Milk, Diaper, Coke

στοιχειοσύνολο (itemset): Ένα υποσύνολο του συνόλου των στοιχείων k-στοιχειοσύνολο (k-itemset): ένα στοιχειοσύνολο με k στοιχεία support count (σ) ενός στοιχειοσυνόλου: ο αριθμός εμφανίσεων του στοιχείου Υποστήριξη (Support (s)) ενός στοιχειοσυνόλου: Το ποσοστό των δοσοληψιών που περιέχουν ένα στοιχειοσύνολο Συχνό Στοιχειοσύνολο (Frequent Itemset): Ένα στοιχειοσύνολο του οποίου η υποστήριξη είναι μεγαλύτερη ή ίση από κάποια τιμή κατωφλίου minsup

Παράδειγμα: {Milk, Diaper} → {Beer} Κανόνας Συσχέτισης (Association Rule): Είναι μια έκφραση της μορφής X → Y, όπου X και Y είναι στοιχειοσύνολα Χ ⊆ Ι, Υ ⊆ Ι, Χ ∩ Υ = ∅ Παράδειγμα: {Milk, Diaper} → {Beer} Υποστήριξη Κανόνα Support (s) Το ποσοστό των δοσοληψιών που περιέχουν και το X και το Y(Χ ∪ Υ) Εμπιστοσύνη - Confidence (c) Πόσες από τις δοσοληψίες (ποσοστό) που περιέχουν το Χ περιέχουν και το Υ Πρόβλημα Εύρεση Κανόνων Συσχέτισης Είσοδος: Ένα σύνολο από δοσοληψίες T Έξοδος: Όλοι οι κανόνες με support ≥ minsup confidence ≥ minconf

Χωρισμός του προβλήματος σε δύο υπο-προβλήματα: ƒ Εύρεση όλων των συχνών στοιχειοσυνόλων (Frequent Itemset Generation) Εύρεση όλων των στοιχειοσυνόλων με υποστήριξη ≥ minsup ƒ ∆ημιουργία Κανόνων (Rule Generation) Για κάθε στοιχειοσύνολο, δημιούργησε κανόνες με μεγάλη υποστήριξη, όπου κάθε κανόνες είναι μια δυαδική διαμέριση του συχνού στοιχειοσυνόλου

Εύρεση συχνών στοιχειοσυνόλων

Εύρεση συχνών στοιχειοσυνόλων

Παραγωγή Κανόνων για τον Αλγόριθμο apriori

Άσκηση Θεωρείστε τον παρακάτω σύνολο δοσοληψιών και ελάχιστη υποστήριξη 4 (minsup = 40%). TID Στοιχεία Τ10 6, 1, 3 Τ20 1, 2, 4, 5, 3 Τ30 3, 2, 5 Τ40 6, 7 Τ50 1, 3, 2, 4, 5 Τ60 1, 3, 6 Τ70 1, 2, 5, 7 Τ80 2, 8, 5, 1 Τ9 4, 6 Τ100 1, 2, 5

(α) Εφαρμόστε τον αλγόριθμο Apriori για να βρείτε τα συχνά στοιχειοσύνολα. Δώστε το αρχικό δέντρο (θεωρείστε τα στοιχεία ταξινομημένα με βάση τη συχνότητα εμφάνισής τους), τα προθεματικά δέντρα καθώς και τα συχνά στοιχειοσύνολα και την υποστήριξη τους που προκύπτουν σε κάθε βήμα. (b) Από τα στοιχειοσύνολα που έχετε βρει στο (α) δώστε τους κανόνες με εμπιστοσύνη 100%. Για να υπολογίστε την εμπιστοσύνη κάθε κανόνα χρησιμοποιείστε την υποστήριξη που υπολογίσατε στο (α)