Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
ΔημοσίευσεMelanctha Christou Τροποποιήθηκε πριν 10 χρόνια
1
Semantic Overlay Networks in P2P systems A. Crespo, H. Garcia-Molina Κρεμμυδάς Νίκος Σκυβαλίδας Πάνος Παππάς Θεοχάρης
2
Περιεχόμενα Κίνητρα SONs Κεντρική ιδέα Αρχική δόμηση Ιεραρχική δόμηση Generatiing SONs Κριτήρια Κατηγοριοποίησης Πηγές λαθών κατηγοριοποίησης Στρατηγικές κατάταξης κόμβων Layered SONs Γενικά Αναζήτηση στα layers Πειράματα
3
Κίνητρα Η αναμετάδοση των ερωτήσεων σε όλους τους κόμβους δεν ευνοεί το scaling P2P που βασίζονται σε hash functions έχουν καλό scaling, αλλά είναι δύσκολο να υποστηρίξουν πολύπλοκες ερωτήσεις Μη σαφείς ερωτήσεις Δύσκολο να απαντηθούν ερωτήσεις που απευθύνονται ευρύ φάσμα γνώσεων Δε μπορεί να γίνει αναζήτηση κειμένου Τα SONs δημιουργήθηκαν με τη λογική ότι: Καλύτερα να δρομολογούμε ερωτήσεις μόνο σε κόμβους που είναι πιο πιθανό να έχουν απαντήσεις Το υλικό που διαθέτει κάθε χρήστης στους υπόλοιπους συνήθως αποτελείται από αρχεία που το όνομά τους έχει μια συγκεκριμένη δομή(music, movies, scientific papers etc.)
4
Κεντρική Ιδέα Ομαδοποίηση των κόμβων Επικάλυψη ομάδων Η ερώτηση κατανέμεται σε σχετικές ομάδες μόνο Η κάθε ερώτηση δρομολογείται σε κάθε σχετική ομάδα μόνο Άσχετες ομάδες δεν καταναλώνουν πόρους σχετικά με την ερώτηση
5
Semantic Overlay Network (SON) Semantic Overlay Network Τεχνητά, ανεξάρτητα στρώματα επιλεγμένων κόμβων Πλεονεκτήματα Εισαγάγει σημασιολογικές όψεις στο φυσικό δίκτυο Μείωση του overflooding στο δίκτυο
6
Αρχική δόμηση του SON Το Semantic Overlay Network (SON) είναι ένα σύνολο τριάδων: { (n i,n j,L) } n i,n j - συνδεδεμένοι κόμβοι L- string (όνομα κατηγορίας) Κάθε SON L υλοποιεί συναρτήσεις: Join (n i ) Search (q) Leave (n i ) jazz country rock
7
SON: Ιεραρχική δομή Το SON είναι ένα δίκτυο ανωτέρου επιπέδου, που σχετίζεται με την ιδέα της ιεραρχικής κατηγοριοποίησης Για παράδειγμα, έχουμε 9 SONs για κατηγοριοποίηση της μουσικής με βάση το στυλ ή 4 SONs για κατηγοριοποίηση της μουσικής με βάση το ρυθμό Τα Documents ενός κόμβου πρέπει να συσχετιστούν με έννοιες, ώστε ο κόμβος να μπορεί να εισαχθεί στα αντίστοιχα SONs Styles Substyles Tones
8
Δημιουργία και χρήση των SONs
9
Κριτήρια καλής κατηγοριοποίησης Τα αρχεία κάθε κατηγορίας να ανήκουν σε ένα μικρό αριθμό κόμβων(πολλά επίπεδα ιεραρχίας + ίση δημοτικότητα) Οι κόμβοι να έχουν αρχεία σε μικρό αριθμό κατηγοριών Ο αλγόριθμος κατηγοριοποίησης να είναι γρήγορος και να κάνει όσο το δυνατόν λιγότερα λάθη
10
Πηγές λαθών Τα ονόματα των αρχείων μπορεί να μην ακολουθούν το αναμενόμενο standard Η οντολογία της κατηγοριοποίησης μπορεί να μην είναι συμβατή με τα αρχεία Οι χρήστες κάνουν «λαθάκια» στα ονόματα των αρχείων Αποτελέσματα πειραμάτων: ◦ Έτσι το 25% των μουσικών αρχείων κατηγοριοποιήθηκαν λανθασμένα ◦ Αλλά ο κόμβος μπορεί να κατηγοριοποιηθεί σωστά, ακόμη κι αν μερικά από τα documents που διαθέτει έχουν κατηγοριοποιηθεί λάθος! ◦ Τελικά, μόνο το 4% των κόμβων κατηγοριοποιήθηκαν λανθασμένα
11
Στρατηγικές κατάταξης των κόμβων Συντηρητική στρατηγική: τοποθετεί έναν κόμβο στο SON c, αν έχει έστω και ένα document κατηγοριοποιημένο στην έννοια c παράγει πάρα πολλές συνδέσεις Επιθετική στρατηγική: τοποθετεί έναν κόμβο στο SON c, αν έχει «σημαντικό» αριθμό εγγράφων, κατηγοριοποιημένα στην έννοια c Αποτρέπει την εύρεση όλων των εγγράφων
12
Layered SONs: Παράδειγμα ≥ 15 % Hierarchy of concepts I. Εφαρμογή της επιθετικής στρατηγικής με παράμετρο κατώτατου ορίου II. Συνδυασμός των “non-assigned” εννοιών, εισαγωγή του κόμβο σε SON ανωτέρου επιπέδου ≥ 15 %
13
Layered SONs: Αναζήτηση Η ερώτηση μπορεί να εισαχθεί σε: Έννοια-Φύλο, αν έχει κατηγοριοποιηθεί επακριβώς (σχήμα a) Έννοια ανωτέρου επιπέδου, μη επακριβής κατηγοριοποίηση (σχήματα b, c) Μη επακριβής κατηγοριοποίηση αυξάνει το κόστος αναζήτησης a c query b
14
Layered SONs: Πειράματα Η στρατηγική αυτή βοηθάει στο να ανήκουν οι κόμβοι σε λιγότερα SONs (αριστερό γράφημα) Επίσης βοηθά στη μείωση των κόμβων ανά SON (δεξί γράφημα- δημιουργία περισσότερων SONs με μικρό αριθμό κόμβων) 1800 peers / 16 SONs
15
Συγκριτικά πειράματα Τα Layered SONs επιτυγχάνουν τον ίδιο αριθμό από matches, με σημαντικά λιγότερο αριθμό μηνυμάτων από ότι ένα P2P όμοιο με τη Gnutella. Τα Layered SONs δεν επιτυγχάνουν 100% «ανάκληση» λόγω των λαθών κατηγοριοποίησης (μέσος όρος: 93%)
16
Ερωτήσεις?
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.