Nikos Louloudakis Nikos Orfanoudakis Irini Genitsaridi HY-562 Assignment 2 Nikos Louloudakis Nikos Orfanoudakis Irini Genitsaridi
Task 1 Προτείνετε ιδέες για την επέκταση/τροποποίηση των αλγορίθμων που παρουσιάζονται στο άρθρο, ώστε διαφορετικές περιοχές στο χώρο των δεδομένων να αναπαρίστανται με διαφορετικό πλήθος αντικειμένων, π.χ., περισσότερο πυκνές περιοχές να αναπαρίστανται με περισσότερα αντικείμενα.
Task 1 Solution: Greedy Dense Disc Input: set από αντικείμενα P ακτίνα r: όριο απόστασης πάνω από το οποίο 2 αντικείμενα θεωρούνται diverse ακτινα r_min: οριο minimum ακτινας κυκλου στην εφαρμογη του αλγόριθμου density d: Το μέγιστο επιθυμητό όριο πυκνότητας στοιχείων στην επιφάνεια κύκλου ακτίνας r ώστε να καλύπτονται από ένα αντιπροσωπευτικο αποτελεσμα d= πλήθος στοιχείων κύκλου ακτίνας r / πr2 Output: Ένα diverse υποσύνολο R του P.
Greedy Dense Disc Zoom In Approach 1) Εφαρμόζω Greedy Disc στο Ρ και παράγω ένα diverse υποσύνολο S του P με βάση το r. 2) Εάν το r είναι μεγαλυτερο του r_min (πχ. r/16), επιλέγω τα μαύρα με density κύκλου μεγαλύτερο από το επιθυμητό d και τα κανω κόκκινα. 3) Για κάθε κόκκινο επελεξε ένα από τα παρακατω approaches να εφαρμοσεις 4) Επεστρεψε τα μαυρα στοιχεία Zoom In Approach Υπολογιζω την ακτινα r’: Μειώνω την ακτίνα r αλγοριθμικα (eg. r/2 or r-1) Κανουμε το κοκκινο μαυρο και τα στοιχεια μεταξυ r και r’ άσπρα Εφαρμοζουμε για τα ασπρα στοιχεια Greedy Dense Disc αναδρομικά με βάση την ακτινα r’ για να παρουμε ορισμένα νέα μαυρα στοιχεια
Greedy Dense Disc Greedy Disc Approach Υπολογιζω την ακτινα r’: Μειώνω την ακτίνα r αλγοριθμικα (eg. r/2 or r-1) Εφαρμοζουμε για τα ασπρα στοιχεια Greedy Dense Disc αναδρομικά με βάση την ακτινα r’ για να παρουμε νέα μαυρα στοιχεια Basic Disc Approach Όπως το Greedy Disc Approach, απλα στον αλγόριθμο Greedy Dense Disc οπου Greedy Disc εφαρμόζω Basic Disc
Greedy Dense Disc Naive Approach Idea Για κάθε κόκκινο Αντί να δώσουμε σαν input μόνο την maximum desired πυκνότητα, dinoume σαν input και το πλήθος αντιπροσωπευτικών αποτελεσμάτων που θέλουμε ανά συγκεκριμένο πλήθος στοιχείων (πχ θέλω 1 αντιπρόσωπο ανα 15 στοιχεία για περιοχές μεγάλης πυκνότητας) Επιλογή των αντιπροσώπων που αντιστοιχούν στο πλήθος των στοιχείων τυχαία ή με greedy λογική.
Greedy Sparse Disc Input: set από αντικείμενα P ακτίνα r: όριο απόστασης πάνω από το οποίο 2 αντικείμενα θεωρούνται diverse ακτινα r_max: οριο maximum ακτινας κυκλου στην εφαρμογη του αλγόριθμου density d: Το ελάχιστο επιθυμητό όριο πυκνότητας στοιχείων στην επιφάνεια κύκλου ακτίνας r ώστε να καλύπτονται από ένα αντιπροσωπευτικο αποτελεσμα d= πλήθος στοιχείων κύκλου ακτίνας r / πr2 Output: Ένα diverse υποσύνολο R του P
Greedy Sparse Disc 1) Εφαρμόζω Greedy Disc στο Ρ και παράγω ένα diverse υποσύνολο S του P με βάση το r. 2) Εάν το r είναι μικρότερο του r_max (πχ. r*16), επιλέγω τα μαύρα με density κύκλου μικρότερο από το επιθυμητό d και τα κανω κόκκινα. 3) Για κάθε κόκκινο εφαρμοσε το zoom-out approach 4) Επεστρεψε τα μαυρα στοιχεία Zoom -Out Approach (variation) Υπολογιζω την ακτινα r’: Αυξανω την ακτίνα r αλγοριθμικα (eg. r*2 or r+1) Κανουμε το κοκκινο μαυρο και τα στοιχεια μεταξυ r και r’ άσπρα (εάν τα στοιχεία αποτελούν τμήμα ενός άλλου κύκλου όπου τέμνει τον κύκλο που εξετάζουμε, τότε μαρκάρουμε τον αντιπρόσωπο άσπρο και όλα τα στοιχεία του άσπρα για να επανεξεταστούν και αυτά). Εφαρμοζουμε για τα ασπρα στοιχεια Greedy Sparse Disc αναδρομικά με βάση την ακτινα r’ για να παρουμε ορισμένα νέα μαυρα στοιχεια Και εδώ μπορούν να εφαρμοστούν παραλλαγές των Greedy και Basic Disc.
Task 2 Υποθέστε ότι κάθε αντικέιμενο σχετίζεται με ένα timestamp που δηλώνει την "ηλικία" του. Προτείνετε ένα τρόπο ώστε ο υπολογισμός των αποτελεσμάτων να λαμβάνει υπόψη την ηλικία των αντικειμένων, στοχεύοντας στο σύνολο επιστρεφομένων αντικειμένων με τη μέγιστη δυνατή "φρεσκάδα".
Task 2 Solution: Greedy Multi-Value Disc Input: ένα set από αντικείμενα P (κάθε αντικείμενο περιέχει timestamp) ακτίνα r (όριο απόστασης πάνω από το οποίο 2 αντικείμενα θεωρούνται diverse) Output: Ένα diverse and fresh υποσύνολο S του P.
Greedy Multi-Value Disc Approach A Βήμα 1ο Δημιουργούμε ένα δισδιάστατο πίνακα με 2 στήλες , το timestamp και το number of neighbors σε ακτίνα r και γραμμές όλα τα στοιχεία του Ρ. Βήμα 2ο Εκτελούμε τον Skyline αλγόριθμο για να αποκλείσουμε τα στοιχεία που χάνουν και στις 2 διαστάσεις από τουλάχιστον 1 άλλο στοιχείο. Βήμα 3ο Κάνω άσπρα όλα τα στοιχεία του Ρ και μετά κάνω κόκκινα τα στοιχεία του Skyline Βήμα 4ο Εκτελώ Greedy Disc με τη σειρά πρώτα στα κόκκινα στοιχεία ( Skyline winners) και μετά στα άσπρα (Skyline losers) - το δεύτερο γίνεται για ληφθούν υπόψιν όλοι οι diverse losers. Πρόβλημα αυτού του approach είναι ότι δεν λαμβάνει υπόψην το order για τα attributes timestamp και number of neighbors στο Skyline.
Greedy Multi-Value Disc Approach B Additional input: Scoring Function: (W1*number of neighbors) + (W2*timestamp) Βήμα 1ο Δημιουργούμε ένα ordered list με βάση το scoring function αποτελούμενο από τα στοιχεία του Ρ. Βήμα 2ο Κάνω όλα τα στοιχεία άσπρα Βήμα 3ο Εκτελώ Greedy Disc επιλέγοντας τα στοιχεία με βάση τη σειρά του ordered list Μπορει να εφαρμοστεί ο Greedy Multi-Value Disc αλγόριθμος στον Greedy Dense Disc Ωστόσο για το approach B, θα πρέπει να περαστεί σε αυτή την περίπτωση σαν όρισμα του Greedy Dense Disc και το απαιτούμενο scoring function από τον Greedy Multi-Value Disc Αλγόριθμο.
Basic Paper Algorithms
Greedy-Disc Input: ένα set από αντικείμενα P ακτίνα r (όριο απόστασης πάνω από το οποίο 2 αντικείμενα θεωρούνται diverse) Output: Ένα diverse υποσύνολο S του P. Κάνε όλα τα nodes άσπρα Για όσο υπάρχουν άσπρα nodes: Επέλεξε το άσπρο στοιχείο με το μεγαλύτερο πλήθος άσπρων γειτόνων σε ακτίνα r, και χρωμάτισέ το μαύρο. Χρωμάτισε Γκρι τα αντικείμενα σε ακτίνα r Επέστρεψε τα μαύρα στοιχεία.
Greedy Zoom-In Input: ένα set από αντικείμενα P ακτίνα r (προηγούμενο όριο απόστασης πάνω από το οποίο 2 αντικείμενα θεωρούνται diverse) ένα diverse υποσύνολο S του P με βάση το r (μαύρα). ακτινα r’ < r Output: Ένα diverse υποσύνολο S’ του P με βάση το r’. Κάνε όλα τα nodes μεταξύ του r και r’ άσπρα Τρέξε Greedy-Disc για τα άσπρα Επέστρεψε το αποτέλεσμα του Greedy-Disc (μαύρα) μαζί με το input diverse υποσύνολο S του P με βάση το r (μαύρα)
Greedy Zoom-Out Input: ένα set από αντικείμενα P ακτίνα r (προηγούμενο όριο απόστασης πάνω από το οποίο 2 αντικείμενα θεωρούνται diverse) ένα diverse υποσύνολο S του P με βάση το r (μαύρα). ακτινα r’ > r Output: Ένα diverse υποσύνολο S’ του P με βάση το r’. Κάνε τα μαύρα άλλο χρώμα πχ. Κόκκινο Κάνε τα γκρι άλλο χρώμα πχ Άσπρο Κάνε greedy disc στα πρώτα και μετά στα δεύτερα Επέστρεψε όλα τα μαύρα