WEIGHTED CLUSTERING ΠΡΟΗΓΜΕΝΗ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Μιχάλης Χριστόπουλος Μ1260 2012-2013 Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Y ΠΟΛΟΓΙΣΜΟΣ Y ΠΟΛΟΓΙΣΜΟΣ ΤΗΣ Ε ΠΙΔΡΑΣΗΣ Ε ΠΙΔΡΑΣΗΣ ΤΩΝ ΤΩΝ Ε ΙΣΟΔΩΝ Χ ΑΡΑΚΤΗΡΙΣΤΙΚΩΝ Χ ΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΣΕ ΕΝΑ Ν ΕΥΡΩΝΙΚΟ Ν ΕΥΡΩΝΙΚΟ Δ ΙΚΤΥΟ Χάρης Παπαδόπουλος.
Advertisements

ΣΧΕΣΙΑΚΗ ΑΛΓΕΒΡΑ 2 ΜΑΘΗΜΑ 4.
Κληρονομικότητα. Εισαγωγή  Κληρονομικότητα (Inheritance) καλείται ο μηχανισμός με τον οποίο μία νέα κλάση που ονομάζεται παράγωγη (derived class) δημιουργείται.
Nikos Louloudakis Nikos Orfanoudakis Irini Genitsaridi
Εξόρυξη Γνώσης Από Χρονικά Δεδομένα
Αναγνώριση Προτύπων.
ΓΛΩΣΣΕΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ
Αναγνώριση Προτύπων.
Fluxplayer: A successful General Game Player (Stephan Schiffel, Michael Thielscher) Προηγμένη Τεχνητή Νοημοσύνη Νομικός Βαγγέλης 24/01/2008.
Γραφήματα & Επίπεδα Γραφήματα
ΔΤΨΣ 150: Ψηφιακή Επεξεργασία Εικόνας © 2005 Nicolas Tsapatsoulis Κατάτμηση Εικόνων: Κατάτμηση με βάση τις περιοχές Τμήμα Διδακτικής της Τεχνολογίας και.
Εξόρυξη Δεδομένων και Τεχνητά Νευρωνικά Δίκτυα
Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ» Β΄ τάξης Γενικού Λυκείου
ΕΥΡΕΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΕΚΤΟΠΩΝ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ
Σχεδίαση αλγορίθμων (2ο μέρος)
Hierarchical Organization and Description of Music Collections at the Artist Level Ιεραρχική Οργάνωση και Περιγραφή Μουσικών Συλλογών σε Επίπεδο Καλλιτέχνη.
Εισαγωγή στις αρχές της Επιστήμης των Η/Υ
ΕΠΛ 231 – Δομές Δεδομένων και Αλγόριθμοι12-1 Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Ο αλγόριθμος του Prim και ο αλγόριθμος του Kruskal.
Αλγόριθμοι Συσταδοποίησης και Κατηγοριοποίησης Βιολογικών Δεδομένων
ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ 2: ΘΕΜΑΤΑ ΘΕΩΡΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Η/Υ
Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2013 Διδάσκων: Δημήτριος Ι. Φωτιάδης Υπολογιστική Μοντελοποίηση στη Βιοϊατρική Τεχνολογία.
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
Generating Chinese Classical Poems with Statistical Machine Translation Models Jing He, Ming Zhou, Long Jiang Μαρία Κωστάκη Εθνικό & Καποδιστριακό Πανεπιστήμιο.
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Learning to Learn: Algorithmic Inspirations from Human Problem Solving.
Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. K-means k-windows k-means: 2 φάσεις 1. Μια διαμέριση των στοιχείων σε k clusters 2. Η ποιότητα της διαμέρισης.
1.5 Γλώσσες Προγραμματισμού
Γεώργιος Παπαϊωάννου, ΙΕΕΕ, ACM, SIGGRAPH member, Θεοχάρης Θεοχάρης, Εργαστήριο Γραφικών Τμήμα Πληροφορικής και Τηλεπικοινωνιών.
ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΥΛΟΠΟΙΗΣΗ ΚΑΙ ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ
Templates Standard Template Library (STL) Exceptions Μεταπτυχιακό Πρόγραμμα Σπουδών, Τμήμα Εφαρμοσμένης Πληροφορικής.
Γραμμικός Προγραμματισμός TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A AA A A Μια εταιρεία παράγει κέικ δύο κατηγοριών,
Θεωρία Γράφων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές Κεφάλαιο 4: Συνδεσμικότητα Data Engineering Lab 1.
Υπολογιστική Πολυπλοκότητα Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό.
Συσταδοποίηση I Εισαγωγή Ο αλγόριθμος k-means Αποστάσεις
1 ΤΜΗΜΑ ΜΠΕΣ Αλγόριθμοι Αναζήτησης Εργασία 1 Τυφλή Αναζήτηση.
Data Mining software Weka. Εισαγωγή Weka: Wekato Environment for knowledge Analysis Η weka είναι ένα software για εξόρυξη δεδομένων γραμμένο σε JAVA το.
Μοντελοθεωρητική Σημασιολογία για την Άρνηση στο Λογικό Προγραμματισμό Το Πρόβλημα: Η σημασιολογία της άρνησης στο Λογικό Προγραμματισμό (negation-as-failure)
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
Εισαγωγή στη Ρομποτική Ενότητα 11: Επίγεια Ρομποτικά Οχήματα Τζες Αντώνιος Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών.
Ιατρικά Συστήματα Τεχνητής Νοημοσύνης με την συνεργασία τεχνικών Ασαφούς Λογικής, Νευρωνικών Δικτύων και Γενετικών Αλγορίθμων. A.Τζαβάρας P.R.Weller B.
Στατιστική Ανάλυση. Ποιοτικές και ποσοτικές μέθοδοι Ποιες είναι οι διαφορές; Πότε χρησιμοποιούνται; Πότε κάνω στατιστική ανάλυση;
ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ ΜΕ ΧΡΗΣΗ JAVA: ΤΟ ΛΟΓΙΣΜΙΚΟ WEKA
Ευρετήρια Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
ΟΜΑΔΕΣ Δημιουργία Ομάδων
Data Warehouse – Data Mining
Παπαγεωργίου Ελένη ΑΕΜ : 2272
Εισαγωγή στα Νευρωνικά Δίκτυα
ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ Εισαγωγή
Το πρόβλημα της μέτρησης Μέτρηση είναι η ένταξη αριθμών σε αντικείμενα σύμφωνα με oρισμένους κανόνες και υπό την βασική προϋπόθεση ότι υπάρχει ακριβής.
Η ΕΝΝΟΙΑ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ
Βασικές Μέθοδοι Μηχανικής Μάθησης και Εξόρυξης Δεδομένων
ΔΙΑΓΩΝΙΣΜΟΣ ΓΙΑ ΤΗ ΔΙΑΦΥΛΙΚΗ ΙΣΟΤΗΤΑ
ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Μηχανικών Πληροφορικής ΤΕ
ΟΜΑΔΟΣΥΝΕΡΓΑΤΙΚΗ ΜΑΘΗΣΗ ΔΙΑΧΥΣΗ ΤΗΣ ΓΝΩΣΗΣ ΣΤΗΝ ΤΟΠΙΚΗ ΚΟΙΝΩΝΙΑ
Η ΘΕΩΡΙΑ ΤΗΣ ΚΟΙΝΩΝΙΚΟ- ΓΝΩΣΤΙΚΗΣ ΣΥΓΚΡΟΥΣΗΣ
RIPASSO 3.
ΔΙΟΙΚΗΣΗ ΟΛΙΚΗΣ ΠΟΙΟΤΗΤΑΣ ΚΑΙ ΔΙΑΧΕΙΡIΣΗ ΠΕΡΙΒΑΛΛΟΝΤΟΣ
Μεταπτυχιακή Διπλωματική Εργασία του Ταλαγκόζη Χρήστου
Φοιτητής: Τόντζος Φώτιος ΑΕΜ:(2896)
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ
ΤΕΙ Σερρών Σχολή Διοίκησης & Οικονομίας Τμήμα Διοίκησης Επιχειρήσεων
Ανακάλυψη Γνώσης (Knowledge Discovery)
Ιεραρχική σχεδίαση Καθορίζονται οι βασικές λειτουργίες σε ανώτερο επίπεδο και στη συνέχεια γίνεται διάσπαση σε όλο και μικρότερες λειτουργίες μέχρι το.
ΤΜΗΜΑ ΙΑΤΡΙΚΩΝ ΕΡΓΑΣΤΗΡΙΩΝ
ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ
Α1(2,2), Α2(2,1), Α3(1,2), Α4(2,3), Α5(3,2) & Α6(1,5) Β1(6,2), Β2(5,3), Β3(6,4), Β4(4,4), Β5(5,5), Β6(7,5), Β7(8,4) & Β8(8,1) C1(2,2) & C2(6,4)
Μάρκετινγκ, εμπορική επικοινωνία
Συμφωνία επί της ασφαλιστικής αξίας
Μεταγράφημα παρουσίασης:

WEIGHTED CLUSTERING ΠΡΟΗΓΜΕΝΗ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Μιχάλης Χριστόπουλος Μ Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence Paper of Margareta Ackerman, Shai Ben-David, Simina Branzei, David Loker

Τι είναι το clustering; Ομαδοποίηση δεδομένων με βάση κάποια συνάρτηση «ομοιότητας» (πχ ευκλείδεια απόσταση) Εφαρμογές σε machine learning, pattern recognition, data mining etc To πρόβλημα του facility allocation είναι ένα παράδειγμα clustering. Χρησιμοποιούνται αλγόριθμοι διαίρεσης ιεραρχικοί αλγόριθμοι

Weighted Clustering (?) Weighted Clustering είναι μια γενίκευση του προβλήματος clustering όπου κάθε «σημείο» έχει διαφορετική σημασία/βάρος. Οι ίδιοι αλγόριθμοι μπορούν εύκολα να εφαρμοστούν Όμως: Έχουν όλοι οι αλγόριθμοι clustering την ίδια συμπεριφορά όταν χρησιμοποιηθούν σε weighted δεδομένα; Πως θα επιλέξουμε τον κατάλληλο αλγόριθμο; Στο παρελθόν δεν έχει μελετηθεί εις βάθος.

Βασικές έννοιες w: X --> R +, domain: w[X], element: w(x) d: distance function, X*X --> R + U {0}, d(x,y)=0  x=y weighted data set: (w[X],d) K-clustering C = {C 1,C 2,…,C k }, 1<k<|X| (no one-cluster clusterings and no single-element clusters), U i C i =X |C| = number of clusters in C An algorithm A maps (w[X],d) and a 1<k<|X| to a k-clustering of X Dendrogram D=(T,M) Hierarchical algorithm maps a (w[X],d) to a dendrogram D.

Αλγόριθμοι clustering Partitional ◦Ratio-cut Spectral Clustering ◦K-Means ◦(k-medoids, k-median, min- sum, min-diameter, k-center) Hierarchical Average Linkage Ward’s method (Bisecting k-means, simple-linkage, complete- linkage) Weight responsive: υπάρχει w => Α(w[X],d)=C και υπάρχει w’ => Α(w’[X],d)≠C Weight sensitive: αν για όλα τα (Χ,d) και όλα τα C => weight responsive Weight Robust: δεν αλλάζει το αποτέλεσμα τους από τα βάρη Weight Considering: είναι responsive για κάποια (Χ,d) και C ενώ είναι robust για κάποια άλλα.

ΑΛΓΟΡΙΘΜΟΙ ΔΙΑΧΩΡΙΣΜΟΥ Ratio-cut spectral Clustering ◦Χρησιμοποιεί similarity function Πορίσματα ◦Perfect clustering: x1,x2,x3,x4  x1 ~C x2 and x3 ≁ C x4 => s(x1,x2) > s(x3,x4) ◦Separation-uniform clustering: υπάρχει λ ώστε για κάθε x,y є X αν x ≁ C y τότε s(x,y) = λ. ◦Ο Ratio-cut είναι weight responsive σε ένα clustering C αν και μόνο αν το C δεν είναι perfect ή δεν είναι separation-uniform. Διαφορετικά είναι weight robust.

ΑΛΓΟΡΙΘΜΟΙ ΔΙΑΧΩΡΙΣΜΟΥ 2 K-Means ◦Ο K-Means είναι weight separable

ΑΛΓΟΡΙΘΜΟΙ ΔΙΑΧΩΡΙΣΜΟΥ 3 Οι weight separable αλγόριθμοι ικανοποιούν μια ισχυρότερη συνθήκη από τους weight sensitive. ◦Τροποποιώντας τα βάρη μπορούν να διαχωρίσουν κάθε σύνολο σημείων. Για κάθε (X,d) και κάθε S  υποσύνολο του X, 2≤|S|≤k υπάρχει w  x ≁ A(w[x],d,k) y για κάθε x,y. ΚΑΘΕ weight separable είναι και weight sensitive. Παρόμοιοι αλγόριθμοι όπως οι k-median, k-medoids είναι επίσης weight separable.

ΙΕΡΑΡΧΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ Weight responsive : υπάρχει w ώστε ο A παράγει το clustering C και w’ ώστε ο A δεν παράγει το C. Οι υπόλοιποι ορισμοί βασίζονται στο παραπάνω. Nice Clustering: C is nice when x1 ~C x2 και x1 ≁ C x3 => d(x1,x2)<d(x1,x3) για κάθε x1,x2,x3 є X.

ΙΕΡΑΡΧΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ 2 Average-linkage ◦Βάζει κάθε σημείο σε δικό του cluster και συνεχίζει ενώνοντας κάθε «κοντινότερο» ζεύγος clusters. ◦Δημιουργείται έτσι ένα δενδρόγραμμα. ◦Χρησιμοποιεί μια συνάρτηση συνένωσης για να εντοπίσει τα κοντινότερα clusters. Ο Average Linkage είναι weight robust όταν ένα C είναι nice και weight responsive όταν δεν είναι nice. Άρα είναι weight-considering. Κάθε nice clustering εμφανίζεται στο δενδρόγραμμα του αλγόριθμου.

ΙΕΡΑΡΧΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ 3 Ward’s Method ◦Σε κάθε βήμα ενώνει τα clusters που θα επιφέρουν τη μικρότερη αύξηση του κ-means κόστους. ◦Είναι weight sensitive.

ΔΙΑΙΡΕΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ Ξεκινούν από όλα τα δεδομένα σε ένα cluster και το διαιρούν συνεχώς. ◦Χρησιμοποιούν bisecting k-means. P-Divisive: Χρησιμοποιεί έναν αλγόριθμο partitional clustering P, για να διαιρεί επαναληπτικά το dataset σε 2 clusters μέχρι να μείνουν όλα τα στοιχεία μόνα τους. Εάν ο P είναι weight separable τότε ο P-divisive είναι weight sensitive.

Αποτελέσματα PartitionalHierarchical Weight sensitiveK-means, k-medoids, k-median, min-sum Ward’s method, Bisecting k-means Weight consideringRatio-cutAverage-linkage Weight robustMin-diameter, k- center Single-linkage, Complete-linkage

Συμπεράσματα Οι αποδοτικοί αλγόριθμοι στα δεδομένα χωρίς βάρη τείνουν να είναι weight- responsive. ◦K-means Μπορούμε να επιλέξουμε αλγόριθμο ◦i.e Facility allocation problem  Τα βάρη είναι σημαντικά στο πρόβλημα  Ένας weight sensitive είναι ο καταλληλότερος

ΕΥΧΑΡΙΣΤΩ! 