Optimizing Web Search Using Social Annotations Παρουσίαση: Λάζος Άγγελος.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
“Recommendation systems” Σπύρος Συρμακέσης, Επίκουρος Καθηγητής
Advertisements

ΑΞΙΟΛΟΓΗΣΗ ΕΙΣΑΓΩΓΗ Στη διδακτική διαδικασία ο διδάσκων θέτει στόχους, στη συνέχεια μεριμνά για την επίτευξή τους και τέλος αξιολογεί το έργο του, το υλικό.
Α. Αναλυτικό Α’ Γυμνασίου
Support.ebsco.com Η Λίστα αποτελεσμάτων EBSCOhost Εκπαιδευτικό μάθημα.
Βασικές κατηγορίες εκπαιδευτικού λογισμικού
ΑΞΙΟΠΟΙΗΣΗ – ΑΞΙΟΛΟΓΗΣΗ ΙΣΤΟΣΕΛΙΔΩΝ, ΙΣΤΟΧΩΡΩΝ ΚΑΙ ΠΥΛΩΝ
WEB PAGE VIA WEEBLY. Α’ ΦΑΣΗ •Ενημέρωση Β’ ΦΑΣΗ •Συντονισμός Γ’ ΦΑΣΗ •Συλλογή και επεξεργασία πληροφοριών Δ’ ΦΑΣΗ •Υλοποίηση.
Διαδίκτυο.
Case Study: Philly Dentistry Αποστολέρη Η., Ιωαννίδης Α., Ναζίρη Μ., Πεχλιβάνη Ε. S.E.M. & S.E.O.
ΠΜΣ ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Κατεύθυνση ΤΕΔΑ Τεχνολογίες Διαχείρισης Ασφάλειας Security Management Engineering Τμήμα Πληροφορικής ΠΑΝΕΠΙΣΤΗΜΙΟ.
Ασκήσεις Συνδυαστικής
Γεωργαλλίδης Δημήτρης Καθηγητής Πληροφορικής
ΣΤΟΙΧΕΙΑ ΨΕΥΔΟΚΩΔΙΚΑ ΒΑΣΙΚΕΣ ΔΟΜΕΣ ΒΑΣΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΩΝ
Ανακτηση Πληροφοριασ σε νεφη Υπολογιστων
 Αυδίκου Χριστίνα  Γιουμούκης Παναγιώτης  Κιντσάκης Θάνος  Πάπιστας Γιάννης.
Δ.Π.Θ. Συνδέοντας έγγραφα - 1 Συνδέοντας έγγραφα Μια σύνδεση στο Web (link) αποτελείται από δύο μέρη : Aυτό που βλέπουμε στη σελίδα και λέγεται άγκυρα.
Ανάκτηση Πληροφορίας Το Boolean μοντέλο.
1 Συλλογικοί Κατάλογοι & Διαδίκτυο Μιχάλης Σφακάκης.
Εισαγωγικές Έννοιες Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
1 Εισαγωγή στις Βάσεις Δεδομένων  Ανάγκη Αποθήκευσης και Διαχείρισης Δεδομένων  Συστήματα Αρχείων  Συστήματα Βάσεων Δεδομένων  Παραδοσιακές και Σύγχρονες.
Προσεγγιστικοί Αλγόριθμοι
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ Θέμα: Διοίκηση ανάπτυξης μη-κερδοσκοπικού ιστόπεδου (ιστόπεδου Δήμου Αγ.Παρασκευής)
ΕΥΡΕΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΕΚΤΟΠΩΝ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ
ΒΕΣ 06: Προσαρμοστικά Συστήματα στις Τηλεπικοινωνίες © 2007 Nicolas Tsapatsoulis Προσαρμοστικοί Αλγόριθμοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων: Παραλλαγές.
ΤΑΛΑΝΤΩΣΕΙΣ 1. Μεγέθη που χαρακτηρίζουν μια ταλάντωση
Διαχείριση μνήμης Υπόβαθρο Εναλλαγή Συνεχής κατανομή Σελιδοποίηση
Ανάκτηση Πληροφορίας (Information Retrieval – IR) Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχ. Η/Υ, Τηλ/νιών & Δικτύων Ακαδημαϊκό Έτος
1 Εισαγωγή στις Βάσεις Δεδομένων  Ανάγκη Αποθήκευσης και Διαχείρισης Δεδομένων  Συστήματα Αρχείων  Συστήματα Βάσεων Δεδομένων  Παραδοσιακές και Σύγχρονες.
1 MedioVis- Ένας φυλλομετρητής μεταδεδομένων MedioVis – A user-centred Library Metadata Browser Μάθημα: Ψηφιακές Βιβλιοθήκες Διδάσκων: Καπιδάκης Σαράντος.
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης
Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. K-means k-windows k-means: 2 φάσεις 1. Μια διαμέριση των στοιχείων σε k clusters 2. Η ποιότητα της διαμέρισης.
Σχεδίαση Εκπαιδευτικού Λογισμικού Σχέδιο Μαθήματος – Ανάπτυξη Εφαρμογών Γ’ Λυκείου Τεχνολογικής Κατεύθυνσης Ιωάννης Βλαχόπουλος – Μ1249 Αικατερίνη Δρόσου.
Επικοινωνία Ανθρώπου Μηχανής HTML CGI JAVASCRIPT Κουμπούλης Χρήστος Α.Μ. 921 Χαλαβαζής Βασίλης Α.Μ. 988.
Διδακτική της Πληροφορικής ΗΥ302 Εργασία :Παρουσίαση σχολικού βιβλίου Γ’ Λυκείου Τεχνολογικής Κατεύθυνσης «Ανάπτυξη εφαρμογών σε προγραμματιστικό περιβάλλον»
Λεξικό, Union – Find Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ- ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ Υπεύθυνος καθηγητής: κος. Σ. Καπιδάκης Επιμελήτρια: Παπαγιάννη Ανδρονίκη.
EXCEL – λογιστικά φύλλα. Χρήση επεξεργασία, αναπαράσταση και επικοινωνία αριθμητικών (η γενικότερα ποσοτικών) δεδομένων Ειδικότερα Εφαρμογή εκπαιδευτικών.
Διπλωματική Εργασία Πειραματική Αξιολόγηση της Μοναδιαίας Οκνηρής Συνέπειας Τόξου (Singleton Lazy Arc Consistency) Ιωαννίδης Γιώργος (ΑΕΜ: 491)
Βελτίωση της πλατφόρμας ανάπτυξης συστημάτων πολλών πρακτόρων Agent Factory ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ Τμήμα Ηλεκτρολόγων.
ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ §3.7 ΤΑΞΙΝΟΜΗΣΗ
Ασυμπτωτικός Συμβολισμός
Olympia Nikou1 Τίτλος Παρουσίασης: Προσεγγιστικός Υπολογισμός των λύσεων ενός προβλήματος με: Δειγματοληψία στον χώρο αναζήτησης των λύσεων.
Χρονική Πολυπλοκότητα
Data Management in p2p A Comparative Study of Pub/Sub Methods in Structured P2P Networks Μαρίνα Δρόσου – ΑΜ 135 Μυρτώ Ντέτσικα – ΑΜ 144 Γρηγόριος Τζώρτζης.
Πρόβλεψη Θέσης Χρήστη σε Κινητά Δίκτυα - Ταξινομητής Βέλτιστης Παύσης Σπύρος Γεωργάκης Διπλωματική Εργασία.
Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 1 Βάσεις Διαδικτύου.
ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ
Αυτόνομοι Πράκτορες Ενισχυτική Μάθηση (Q-learning algorithm) in PONG Χανιά, 4/3/2011 Μπαμπαλής Μπάμπης.
ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΥΡΕΤΙΚΕΣ ΜΕΘΟΔΟΥΣ Άπληστη Αναζήτηση και Αναζήτηση Α* ΣΠΥΡΟΣ ΛΥΚΟΘΑΝΑΣΗΣ, ΚΑΘΗΓΗΤΗΣ.
ΔΥΑΔΙΚΗ ΑΝΑΖΗΤΗΣΗ & ΤΑΞΙΝΟΜΗΣΗ ΜΕ ΣΥΓΧΩΝΕΥΣΗ. Δυαδική αναζήτηση (Binary search) ΔΕΔΟΜΕΝΟ: ένα μεγάλο αρχείο που περιέχει τιμές z [0,1,…,n-1] ταξινομημένες.
Γράφημα Συνδυαστικό αντικείμενο που αποτελείται από 2 σύνολα:
. 8η Διάλεξη Παρεμβολή Hermite
Προσαρμοστικοί Αλγόριθμοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων:
Κελεπούρη Μαρία Σπανός Βασίλειος Χρυσικού Χρυσάνθη ΒΟΛΟΣ, 31/05/2016
ΘΕΜΑΤΑ ΠΑΝΕΛΛΗΝΙΩΝ ΚΕΦΑΛΑΙΟ 1
Διδάσκων: Δρ. Τσίντζα Παναγιώτα
Εργασία στο μάθημα «Προγραμματισμός ΙΙ»
Διάλεξη 15: O αλγόριθμος SIMPLE
Εφαρμογές Πληροφορικής
Διάλεξη 6: Εξίσωση διάχυσης (συνέχεια)
ΚΕΦΑΛΑΙΟ 1 Ανάλυση προβλήματος.
Φοιτητής: Τσακίρης Αλέξανδρος Επιβλέπων: Ευάγγελος Ούτσιος
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ
ΑΞΙΟΠΟΙΗΣΗ – ΑΞΙΟΛΟΓΗΣΗ ΙΣΤΟΣΕΛΙΔΩΝ, ΙΣΤΟΧΩΡΩΝ ΚΑΙ ΠΥΛΩΝ
Μη Γραμμικός Προγραμματισμός
Προσαρμοστικοί Αλγόριθμοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων:
Εξωτερική Αναζήτηση Ιεραρχία Μνήμης Υπολογιστή Εξωτερική Μνήμη
Ενότητα A5.1.2γ (Αποθήκευση Αρχείων από το Διαδίκτυο )
Μεταγράφημα παρουσίασης:

Optimizing Web Search Using Social Annotations Παρουσίαση: Λάζος Άγγελος

Εισαγωγή  Πολλοί χρήστες αφιερώνουν κοινωνικά σχόλια σε ιστοσελίδες  Π.χ στο για το Amazonwww.del.icio.us  αγορά, μουσική, βιβλία κατάστημα  Εκμετάλλευση από τους SSR και SPR  SSR: Ομοιότητα μεταξύ σχολίων (similarity ranking)  SPR: Μέτρηση δημοτικότητας μιας σελίδας (static ranking)  Προηγούμενοι αλγόριθμοι:  Έμφαση σε: Anchor text, link analysis, click-thought data

Σκοπός  Η χρήση των κοινωνικών σχολίων στο web search  SSR:  Ορίζει την ομοιότητα μεταξύ των σχολίων  Λύνει το πρόβλημα του ακριβούς ταιριάσματος  SPR  Υπολογισμός της ποιότητας μιας σελίδας από τα σχόλια  Διαφορετικά σχόλια έχουν διαφορετικό βάρος

Αναζήτηση με τη χρήση κοινωνικών σχολίων  3 ομάδες χρηστών στο web  Δημιουργοί σελίδων  Σχολιαστές ( annotators )  Απλοί χρήστες  Κάθε μία παρέχει διαφορετική πληροφορία  Ενδιαφερόμαστε για την άποψη των annotator

Social Similarity Ranking  Απλοϊκή προσέγγιση των κοινωνικών σχολίων σύνολο σχολίων Α(p)={α1,.αn} ερώτηση q={q1,q2,...,qn}  Πρόβλημα στα συνώνυμα  O SSR λύνει το πρόβλημα

Social Similarity Ranking (συνέχεια)  NANA Πλήθος σχολίων ΝPΝP Πλήθος σελίδων ΝUΝU Πλήθος χρηστών Μ AP N A x N P πίνακας συσχέτισης μεταξύ σχολίων και σελίδων Μ AP (α x, p y )Πλήθος χρηστών που αναθέτουν το σχόλιο α x στη σελίδα p y SASA N A x N A πίνακας τα στοιχεία του οποίου S A (αi, α j ) δηλώνουν το σκορ ομοιότητας μεταξύ των σχολίων α i και α j SPSP N P x N P πίνακας ομοιότητας μεταξύ δύο σελίδων C A, C P Damping παράγοντες της διάδοσης της ομοιότητας για τα σχόλια και τις σελίδες αντίστοιχα (C A, C P = 0.7 ) PAPA Σύνολο σελίδων που χαρακτηρίζονται από το σχόλιο α i A(p j )Σύνολο σχολίων που αναφέρονται στη σελίδα p j P m (α i )Η mth σελίδα στην οποία αναφέρεται το σχόλιο α i Am(pi)Am(pi)Το mth σχόλιο που αναφέρεται στη σελίδα p i

Social Similarity Ranking (συνέχεια)  Για παράδειγμα τη σελίδα b χαρακτηρίζουν τα σχόλια “ubuntu” και “linux” από τους Ua και Ub αντίστοιχα.  Έτσι υπάρχει ένας βαθμός ομοιότητας μεταξύ τους.

Social Similarity Ranking (συνέχεια)  Πολυπλοκότητα αλγορίθμου  Για κάθε βήμα του αλγορίθμου Ο(Ν Α 2 Ν P 2 )  Η συνολική πολυπλοκότητα του αλγορίθμου ανάλογη με τα βήματα ώστε ο SSR να συγκλίνει.  Ομοιότητα ερώτησης-σελίδας βασισμένη στον SSR σύνολο σχολίων Α(p)={α1,.αn} ερώτηση q={q1,q2,...,qn}

Social Page Rank  Eνημερωμένοι χρήστες προτιμούν δημοφιλείς σελίδες, οι οποίες αποκομίζουν θερμά σχόλια ΝΑΝΑ Πλήθος σχολίων ΝUΝU Πλήθος χρηστών Μ PU Ο Ν P x Ν U πίνακας συσχέτισης μεταξύ σελίδων και χρηστών Μ AP Ο Ν A x Ν P πίνακας συσχέτισης μεταξύ σχολίων και σελίδων ΜUΑΜUΑ Ο Ν U x Ν A πίνακας συσχέτισης μεταξύ χρηστών και σχολίων Μ PU (p i, u j )Περιέχει το πλήθος των σχολίων του χρήστη u i για τη σελίδα p j Μ AP (p i, u j ), M UA (p i, u j ) Όμοια με Μ PU (p i, u j ) P0P0 Το διάνυσμα που περιέχει τα τυχαία αρχικοποιημένα SPR σκορ PiPi Το διάνυσμα δημοτικότητας μιας σελίδας στην i-οστή επανάληψη U i, A i Όμοια με το P i P i ΄, U i ΄, A i ΄Μέση τιμή

Social Page Rank(συνέχεια)  (5.1) η δημοτικότητα των χρηστών αντλείται από τις σελίδες που σχολιάζουν.  (5.2) η δημοτικότητα των σχολίων από τη δημοτικότητα των χρηστών.  (5.3)των σελίδων από των σχολίων.  (5.4) των σχολίων από των σελίδων.  (5.5)των χρηστών από των σχολίων.  (5.6) ξανά των σελίδων από των χρηστών.  Πολυπλοκότητα  Σε κάθε επανάληψη Ο(Ν U N P + Ν A N P + Ν U N A ).

Πειραματικά αποτελέσματα  Σύνολο σελίδων και σχολίων από το del.icio.us από το Μάιο του  Λέξεις με μη έγκυρη για τους αλγορίθμους μορφή  χωρισμός τους σε στάνταρ όρους με τη βοήθεια του WordNet πριν την εκτέλεση των πειραμάτων.  (π.χ. java.programming ή java/programming)

Εκτίμηση της ομοιότητας σχολίων με τον SSR  Για τον αλγόριθμο SSR χρειάστηκαν 12 επαναλήψεις ώστε να συγκλίνει.

Εκτίμηση των SPR αποτελεσμάτων  7 επαναλήψεις μέχρι τη σύγκλιση.  Το PageRank κάθε σελίδας υπολογίστηκε επίσης από το API του Google toolbar. Στις περισσότερες περιπτώσεις, είναι πιθανόν πολλοί χρήστες να αφιερώνουν πολλά σχόλια σε σελίδες με υψηλότερο PageRank

Εκτίμηση των SPR αποτελεσμάτων (συνέχεια) Σελίδες με PageRank 0 έχουν περισσότερα σχόλια και χρήστες από σελίδες με PageRank 10.

Δυναμική διάταξη με τη χρήση κοινωνικών σχολίων  Αποτελέσματα από σύνολα ερωτήσεων  Manual ή automatic  “DocSimilarity” ως baseline  MAP:  NDCG:

Δυναμική διάταξη με τη χρήση κοινωνικών σχολίων(συνέχεια) MAP

Παράδειγμα  Ερώτηση “airfare” Στο vacations.com/best-airfare- search-engine.html το kayak έρχεται πρώτο σε προτιμήσεις vacations.com/best-airfare- search-engine.html Top-4 από 318 Λόγω SSR ομοιότητα με “ticket”, ”flight”, ”hotel”, ”airline”. Επιπλέον σχετικές σελίδες

Πλεονεκτήματα-Μειονεκτήματα  Σημαντική βελτίωση των αποτελεσμάτων από την αναζήτηση  Οι δύο αλγόριθμοι συγκλίνουν γρήγορα  Λόγω των αραιών πινάκων  Πολυπλοκότητα πολύ μικρότερη από την εκτιμώμενη. ______________________________________________  Χρήστες και σχόλια έχουν εκθετικό ρυθμό ανάπτυξης  πιο αργή σύγκλιση των αλγορίθμων  Έλλειψη σχολίων για νέες σελίδες  Αδυναμία αποσαφήνισης σχολίων με δισημία

Επεκτάσεις  Βελτιστοποίηση του αλγορίθμου SSR για την αντιμετώπιση των εκθετικά αυξανόμενων σχολίων και χρηστών.  Για την αντιμετώπιση σχολίων spam θα μπορούσε πριν από την εκτέλεση των βασικών αλγορίθμων να γίνεται γλωσσολογική ανάλυση και αγνόηση τους.  Υλοποίηση αλγορίθμου για εύρεση ομοιότητας μεταξύ σχολίων και μεταδεδομένων από τον δημιουργό σελίδας.  π.χ. annotation – anchor text

Ερώτηση  Ποια η σημαντικότερη διαφορά των αλγορίθμων όπως ο PageRank με τον SPR;  Με ποιο τρόπο οι αλγόριθμοι SSR και SPR συνεισφέρουν στην αναζήτηση των σχετικών σελίδων για μία ερώτηση;