Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεRita Hero Τροποποιήθηκε πριν 10 χρόνια
1
Αυτόματη Ομαδοποίηση Κινητών Χρηστών Βάσει Πληροφορίας Θέσης Επιβλέπων Καθηγητής: Χατζηευθυμιάδης Ευστάθιος Αθήνα, Ιούλιος 2012 Όνομα: Μπισμπίκης Γεώργιος / ΑΜ: Μ1100 ΠΜΣ: Επεξεργασία Σήματος για Επικοινωνίες και Πολυμέσα
2
Δομή Παρουσίασης 1. Περιγραφή Προβλήματος 2. Ιεραρχικοί Αλγόριθμοι 3. Κριτήριο Βέλτιστης Ομαδοποίησης 4. Μέθοδος Κατάδειξης Ύποπτων Ομάδων 5. Πειραματική Αποτίμηση
3
Περιγραφή Προβλήματος Στην παρούσα εργασία επικεντρωθήκαμε σε Location Based Services (LBS) Αυτού του είδους οι εφαρμογές στοχεύουν στη μεταφορά πληροφοριών σε κινούμενους χρήστες, οι οποίες είναι άμεσα συσχετισμένες με την περιοχή που βρίσκονται αυτοί Στόχος είναι η μείωση της αποστολής των μηνυμάτων εντός του δικτύου, διατηρώντας το ποσοστό της απώλειας πληροφορίας σε αποδεκτά επίπεδα
4
Ομαδοποίηση Το σύστημά μας θα πρέπει να είναι σε θέση να αναγνωρίζει αυτόματα τις ομάδες που υπάρχουν μέσα στην περιοχή που παρακολουθεί Οι αλγόριθμοι ομαδοποίησης χωρίζονται σε δύο κύριες κατηγορίες: A. Partitioning (k-means, k-medoids, KNN κα) B. Hierarchical (Agglomerative ή Divisive)
5
Ιεραρχικοί Αλγόριθμοι Ομαδοποίησης Χωρίζονται σε Συγχωνευτικούς(Agglomerative) και σε Διαιρετικούς(Divisive) Οι μεν Συγχωνευτικοί αλγόριθμοι ομαδοποιούν από κάτω προς τα πάνω(bottom-up) ενώ οι δε Διαιρετικοί από πάνω προς τα κάτω(top-down) Χτίζουν ένα δυαδικό δέντρο συσχετίσεων μεταξύ των ομάδων που δημιουργούνται κατά τις συγχωνεύσεις(ή διασπάσεις) που εκτελούνται στα βήματα του αλγορίθμου Ποιόν από τους δύο?
6
Συγχωνευτικός Ιεραρχικός Αλγόριθμος (1/2) Βήματα αλγορίθμου: 1. Τοποθέτηση κάθε σημείου του συνόλου των δεδομένων σε διαφορετική ομάδα 2. Επαναληπτικά συγχωνεύονται οι δύο ομάδες που βρίσκονται κοντινότερα, βάσει κάποιου κριτηρίου μέτρησης της απόστασης 3. Μέχρι όλα τα δεδομένα να βρίσκονται εν τέλει στην ίδια ομάδα Πολυπλοκότητα:
7
Συγχωνευτικός Ιεραρχικός Αλγόριθμος (2/2) Κάθε ένα επίπεδο του δυαδικού δέντρου που προκύπτει από το τρέξιμο του αλγορίθμου αποτελεί και μια κατάτμηση των δεδομένων σε ομάδες Ο αλγόριθμος αυτός δίνει μια ακολουθία ομαδοποιήσεων. Ποια από αυτές τις ομαδοποιήσεις είναι η καλύτερη? Η επιλογή της «καλύτερης» ομαδοποίησης μπορεί να γίνει με τους εξής τρόπους: 1. Βάσει του αριθμού των ομάδων (user defined) 2. Βάσει του αν η τιμή της (αν)ομοιότητας μεταξύ 2 ομάδων ξεπεράσει ένα προκαθορισμένο threshold (user defined) 3. Εύρεση του βήματος συγχώνευσης στο οποίο μεγιστοποιείται κάποιο κριτήριο μέτρησης της ποιότητας (αυτόματα)
8
Δενδρόγραμμα (1/2) Γραφική απεικόνιση των συγχωνεύσεων μεταξύ των ομάδων σε συνάρτηση με την (αν)ομοιότητα που εμφανίζουν μεταξύ τους Αποτελεί μια ερμηνεύσιμη αναπαράσταση των δεδομένων και των συσχετίσεων μεταξύ τους
9
Δενδρόγραμμα (2/2) Επιλογή της «καλύτερης ομαδοποίησης» από το χρήστη: Ιδανικά, θα θέλαμε ο αλγόριθμός μας να μπορεί να εντοπίσει ποια είναι η κατάτμηση των δεδομένων με το «μεγαλύτερο νόημα» αυτόματα, μέσω κάποιου κριτηρίου
10
Ομοιότητα μεταξύ των Ομάδων (1/2) Μέθοδοι για τον ορισμό της απόστασης μεταξύ ομάδων στα βήματα του αλγορίθμου: Single Linkage Complete Linkage
11
Ομοιότητα μεταξύ των Ομάδων (2/2) Average Linkage Centroid Linkage
12
Κριτήριο Βέλτιστης Ομαδοποίησης (1/2) Χρησιμοποιούμε τη μετρική του Κέρδους Ομαδοποίησης «Δ»* στο m-οστό βήμα του αλγορίθμου: όπου, k: το πλήθος των ομάδων που υπάρχουν σε αυτό το βήμα του αλγορίθμου : το πλήθος των αντικειμένων της j-οστής ομάδας : το ιδεατό κεντροειδές όλου του συνόλου δεδομένων : το ιδεατό κεντροειδές της j-οστής ομάδας * Y. Jung, H. Park, and D.Z. Du(2003): "A Decision Criterion for the Optimal Number of Clusters in Hierarchical Clustering", Journal of Global Optimization, vol. 25, pp. 91-111
13
Κριτήριο Βέλτιστης Ομαδοποίησης (2/2) Παίρνει τιμές μόνο μεγαλύτερες ή ίσες του μηδέν Θεωρούμε ως βέλτιστη την ομαδοποίηση που έχει προκύψει στο βήμα του αλγορίθμου με το μεγαλύτερο Δ, δηλαδή: + Φθηνό υπολογιστικά μέτρο + Εντοπίζει αυτόματα την καλύτερη ομαδοποίηση για το σύνολο των δεδομένων μας - Απαιτείται να τρέξει ο ιεραρχικός αλγόριθμος μέχρι τέλους για την εύρεση του μεγαλύτερου Δ
14
Παράδειγμα Εφαρμογής Κριτηρίου Εφαρμόζοντας το κριτήριο βέλτιστης ομαδοποίησης στο Συγχωνευτικό Ιεραρχικό Αλγόριθμο πήραμε ως αποτέλεσμα: Οι ομάδες που εντοπίστηκαν είναι 6, κάτι το οποίο φαίνεται και από την καμπύλη του Δ όπου:
15
Κατάδειξη Ύποπτων Ομάδων (1/3) Αν παρατηρήσουμε την καμπύλη του Δ λίγο καλύτερα θα δούμε πως δεν είναι συνεχώς αύξουσα μέχρι το βέλτιστο Δ Υπάρχουν δηλαδή και περιπτώσεις όπου:
16
Κατάδειξη Ύποπτων Ομάδων (2/3) Δηλαδή, ένας αυτόματος χαρακτηρισμός αυτής της μορφής:
17
Κατάδειξη Ύποπτων Ομάδων (3/3) Θετικά αυτής της κατάδειξης: + Εντοπίζονται ομάδες οι οποίες δεν είναι τόσο συμπαγείς + Με αυτό τον τρόπο μπορούμε να παρακολουθούμε και να στέλνουμε συνεχώς μηνύματα στους κόμβους των ύποπτων ομάδων + Για τις ομάδες που δεν χαρακτηρίστηκαν ως ύποπτες από τον αλγόριθμο, μπορούμε να στέλνουμε τα μηνύματα μόνο στους κόμβους που θεωρούνται ως εκπρόσωποι των ομάδων αυτών (ομοιότητα με VANET) + Το κέρδος στο φόρτο του δικτύου (network gain) είναι οι ομάδες για τις οποίες έχουμε μια σιγουριά πως θα παραμείνουν όπως προέκυψαν από τον αλγόριθμο
18
Καμπύλη Ποιότητας κατάδειξης Ύποπτων Ομάδων
19
Παραγωγή Συνόλων Δεδομένων Λόγω της έλλειψης κατάλληλων συνόλων δεδομένων κινούμενων χρηστών, δημιουργήσαμε συνθετικά δεδομένα με τη βοήθεια του προγράμματος MobiSim* Το μοντέλο που ακολουθήθηκε για την κίνηση των ομάδων είναι γνωστό ως Reference Point Group Mobility (RPGM) Σε αυτό το μοντέλο κάθε ομάδα έχει έναν ηγέτη, Group Leader(GL), ο οποίος εκτελεί κίνηση με τη βοήθεια του μοντέλου Random Way Point, και τα υπόλοιπα μέλη της ομάδας ακολουθούν την κίνησή του με μια μικρή διακύμανση όσον αφορά τη ταχύτητα και τη γωνία της τροχιάς τους * S. M. Mousavi, H. R. Rabiee, M. Moshref, and A. Dabirmoghaddam, "MobiSim: A Framework for Simulation of Mobility Models in Mobile Ad-Hoc Networks," in Proc. IEEE / WiMOB, White Plains, NY, USA, 2007
20
Demo από το MobiSim
21
Μετρικές False Negative: Το να έχουμε ορίσει έναν κόμβο τη χρονική στιγμή ως μη-ύποπτο αλλά σε κάποια επόμενη χρονική στιγμή να έχει αλλάξει ομάδα. Δικτυακά, αυτό θα σήμαινε απώλεια πληροφορίας. False Positive: Το να έχουμε ορίσει ένα κόμβο τη χρονική στιγμή ως ύποπτο αλλά σε κάποια επόμενη χρονική στιγμή να μην έχει αλλάξει ομάδα. Δικτυακά, αυτό σημαίνει επιπλέον αποστολή πληροφορίας. Network Load: Ορίζεται ως το ποσοστό των κόμβων που τελικά χρειάζεται να παρακολουθούμε αν εκτελούσαμε σε κάθε χρονική στιγμή τον αλγόριθμο που παρουσιάσαμε
22
Γραφική επεξήγηση για FN και FP
23
Πειραματικά Αποτελέσματα (1/3) Συνολικά ποσοστά για FΝ, FP και Network Gain στα datasets που χρησιμοποιήθηκαν για τα πειράματα: Όπου:,, με
24
Πειραματικά Αποτελέσματα (2/3) Έλεγχος των FP και FN τοπικά, για μια χρονική στιγμή της προσομοίωσης
25
Πειραματικά Αποτελέσματα (3/3) Διάγραμμα φόρτου στο δίκτυο(network load) με την εφαρμογή του αλγορίθμου κάθε χρονική στιγμή
26
Σύνοψη Παρουσιάσαμε ένα ιεραρχικό σχήμα ομαδοποίησης το οποίο είναι σε θέση να εντοπίζει αυτόματα τις ομάδες εντός μιας περιοχής βάσει της μετρικής του Κέρδους Ομαδοποίησης «Δ» Εκμεταλλευτήκαμε την παρακολούθηση της τιμής του Δ κατά τη διάρκεια των συγχωνεύσεων του αλγορίθμου για την κατάδειξη ύποπτων ομάδων Τέλος, έγινε μια πειραματική αποτίμηση του συστήματος βάσει των τιμών των μετρικών False Positive, False Negative και Network Load
27
Μελλοντική Εργασία 1. Ανάπτυξη μηχανισμού ο οποίος θα παρακολουθεί την κίνηση των ομάδων που προέκυψαν από τον παραπάνω αλγόριθμο για πιθανές διασπάσεις(ύποπτων ομάδων) ή επικαλύψεις 2. Εύρεση μιας περιόδου T κατά την οποία θα επαναλαμβάνουμε τον αλγόριθμο που παρουσιάστηκε, έτσι ώστε να αποφεύγονται περιπτώσεις περίεργης παρατεταμένης «ησυχίας» στις ομάδες καθώς και διαχωρισμού μη-ύποπτων ομάδων
28
ΕΥΧΑΡΙΣΤΩ ΠΟΛΥ ΕΡΩΤΗΣΕΙΣ ??
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.