Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσμιο Ιστό με χρήση μεθόδων Συμπερασμού Γραμματικών Κορφιάτης Γιώργος Παλιούρας Γιώργος.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσμιο Ιστό με χρήση μεθόδων Συμπερασμού Γραμματικών Κορφιάτης Γιώργος Παλιούρας Γιώργος."— Μεταγράφημα παρουσίασης:

1 Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσμιο Ιστό με χρήση μεθόδων Συμπερασμού Γραμματικών Κορφιάτης Γιώργος Παλιούρας Γιώργος

2 Μάρτιος 20062 Αντικείμενο  Κατασκευή μοντέλου ικανού να περιγράψει την πλοήγηση των χρηστών στον Παγκόσμιο Ιστό  Χρήση του μοντέλου για πρόταση σελίδων

3 Μάρτιος 20063 Περιεχόμενα  Εξατομίκευση  Μέθοδοι Συμπερασμού Γραμματικών  Μέθοδος μοντελοποίησης της πλοήγησης στον Ιστό  Πειραματική Αξιολόγηση  Συμπεράσματα

4 Μάρτιος 20064 Παγκόσμιος Ιστός Ανεξάντλητη πηγή πληροφοριών αλλά…  Έλλειψη δομής  Υπερσυσσώρευση πληροφοριών  Χρήστες μη ειδικοί

5 Μάρτιος 20065 Παγκόσμιος Ιστός Ανάγκη υποβοήθησης του χρήστη στον εντοπισμό χρήσιμης πληροφορίας Λύση: Εξατομίκευση των υπηρεσιών

6 Μάρτιος 20066 Εξατομίκευση Σε επίπεδο ιστοχώρου:  Αναγνώριση χρήστη  Προσαρμογή ιστοσελίδας στα μέτρα του χρήστη  Καθοδήγηση (πρόταση συνδέσμων) Μοντελοποίηση χρήστη με τεχνικές Εξόρυξης Γνώσης από Δεδομένα (Data Mining)

7 Μάρτιος 20067 Ανακάλυψη Προτύπων Πλοήγησης  Στόχος η πρόταση συνδέσμων  Μοντελοποίηση της πλοήγησης  Διαδικασία εξόρυξης γνώσης από δεδομένα χρήσης

8 Μάρτιος 20068 Προσεγγίσεις  Ντετερμινιστικές  Εύρεση συχνά επαναλαμβανόμενων ακολουθιών σελίδων  Κανόνες διαδοχής, Κοινότητες χρηστών  Στοχαστικές  Κατασκευή μοντέλου πιθανοτήτων  Χρήση μαρκοβιανών μοντέλων  Χρήση Συμπερασμού Γραμματικών

9 Μάρτιος 20069 Προσεγγίσεις Κατάλληλες για έναν ιστοχώρο αλλά… Ακατάλληλες για τον Παγκόσμιο Ιστό  Μεγάλος όγκος  Ανομοιογένεια περιεχομένου

10 Μάρτιος 200610 Μοντελοποίηση της πλοήγησης σε όλο τον Παγκόσμιο Ιστό Τα δεδομένα χρήσης δεν επαρκούν Χρειάζεται επιπλέον πληροφορία π.χ. σύγκριση περιεχομένου των σελίδων

11 Μάρτιος 200611 Η προσέγγισή μας  Περιγραφή πλοήγησης με γραμματική  Χρήση μεθόδων Συμπερασμού Γραμματικών  Αξιοποίηση δεδομένων χρήσης και πληροφορίας για ομοιότητα περιεχομένου σελίδων

12 Μάρτιος 200612 Συμπερασμός Γραμματικών  Κλάδος της Μηχανικής Μάθησης  Επαγωγική εκμάθηση γραμματικής από δεδομένα G0G0 Παραγωγή Δεδομένα Συμπερασμός G

13 Μάρτιος 200613 Κανονικές Γραμματικές  Απλούστερη κλάση γραμματικών  Κανόνες της μορφής: A→aB | a | ε

14 Μάρτιος 200614 Πιθανοτικές Κανονικές Γραμματικές  Πιθανότητα εμφάνισης συμβολοσειράς  Πιθανότητες πάνω στις μεταβάσεις και στους κόμβους

15 Μάρτιος 200615 Μέθοδος Alergia  Συμπερασμός πιθανοτικής κανονικής γραμματικής (αυτομάτου)  Ξεκινά από δενδρική δομή (PPTA) Εφαρμογή: Σύμβολα ↔ Ιστοσελίδες Συμβολοσειρές ↔ Σύνοδοι χρήσης

16 Μάρτιος 200616 Alergia: Αρχικό PPTA

17 Μάρτιος 200617 Alergia  Συγχωνεύει κόμβους  Κριτήριο Συμβατότητας: όμοιες μεταβάσεις

18 Μάρτιος 200618 Alergia: Εκτέλεση

19 Μάρτιος 200619 Alergia: Εκτέλεση

20 Μάρτιος 200620 Alergia: Εκτέλεση

21 Μάρτιος 200621 Alergia: Εκτέλεση

22 Μάρτιος 200622 Alergia: Εκτέλεση

23 Μάρτιος 200623 Μέθοδος Blue Fringe  Παρόμοια με τον Alergia  Πιο έξυπνη επιλογή συγχωνεύσεων  Σύνολα κόκκινων και μπλε κόμβων  Βαθμολογεί τα ζευγάρια κόκκινων-μπλε  Επιλέγει το καλύτερο ζευγάρι  Μεγαλύτερη χρονική πολυπλοκότητα

24 Μάρτιος 200624 Blue Fringe: Εκτέλεση

25 Μάρτιος 200625 Blue Fringe: Εκτέλεση

26 Μάρτιος 200626 Blue Fringe: Εκτέλεση

27 Μάρτιος 200627 Blue Fringe: Εκτέλεση

28 Μάρτιος 200628 Blue Fringe: Εκτέλεση

29 Μάρτιος 200629 Αξιοποίηση για μοντελοποίηση πλοήγησης στον Ιστό ΣύμβολαΙστοσελίδες ΣυμβολοσειρέςΣύνοδοι χρήσης Συγχώνευση κόμβωνΔημιουργία ομάδων σελίδων Πιθανότητες στις μεταβάσεις Συχνότητα μετάβασης μεταξύ σελίδων / ομάδων

30 Μάρτιος 200630 Νέα μέθοδος CANUMGI Content-Aware Navigational User Modeling with Grammatical Inference  Τροποποίηση μεθόδων Alergia και Blue Fringe  Κατασκευή του μοντέλου off-line  Υπολογισμός συμβατότητας καταστάσεων  Μετρικό χρήσης (όμοιες μεταβάσεις)  Μετρικό περιεχομένου (ομοιότητα περιεχομένου σελίδων)

31 Μάρτιος 200631 Ομοιότητα περιεχομένου Ιστοσελίδες ↔ Διάνυσμα λέξεων-κλειδιών Χρήση μετρικού συνημιτόνου

32 Μάρτιος 200632 Ομοιότητα περιεχομένου Παράδειγμα:

33 Μάρτιος 200633 CANUMGI-A  Βασίζεται στον Alergia  Τα δύο μετρικά λογικές τιμές  Συνδυασμός μετρικών  Σύζευξη  Διάζευξη

34 Μάρτιος 200634 CANUMGI-B  Βασίζεται στον Blue Fringe  Τα δύο μετρικά πραγματικές τιμές  Συνδυασμός μετρικών  Ελάχιστη τιμή  Μέγιστη τιμή  Σταθμισμένο άθροισμα

35 Μάρτιος 200635 CANUMGI-C  Μείωση Διαστασιμότητας  Αρχική ομαδοποίηση των σελίδων ως προς το περιεχόμενο  Στόχος: Εκ των προτέρων χωρισμός σελίδων σε θεματικές κατηγορίες  Χρήση ομάδων αντί για σελίδες  Ακολουθεί η επαγωγική διαδικασία

36 Μάρτιος 200636 CANUMGI-C Παράδειγμα:

37 Μάρτιος 200637 CANUMGI-C PPTA χωρίς μείωση διαστασιμότητας

38 Μάρτιος 200638 CANUMGI-C PPTA με μείωση διαστασιμότητας

39 Μάρτιος 200639 Χρήση του μοντέλου  On-line λειτουργία  Εξατομικευμένη πλοήγηση  Πρόταση σελίδων στους χρήστες  Διαδικασία σε δύο στάδια:  Διάσχιση του γράφου  Επιλογή σελίδων

40 Μάρτιος 200640 Διάσχιση του γράφου  Αλληλουχία σελίδων ↔ μεταβάσεις στο γράφο  Αν δεν υπάρχει ρητή μετάβαση, επιλογή του πιο όμοιου κόμβου- παιδιού  Αν δεν υπάρχει αρκετά όμοιος κόμβος, επιστροφή στον κόμβο εκκίνησης

41 Μάρτιος 200641 Επιλογή σελίδων  Προσέγγιση 1  Επιλογή κόμβου-παιδιού με μεγαλύτερη πιθανότητα μετάβασης  Επιλογή σελίδων πιο κοντά στο κέντρο βάρους  Προσέγγιση 2 Επιλογή σελίδων με μεγαλύτερο γινόμενο πιθανότητας μετάβασης επί εγγύτητα στο κέντρο βάρους

42 Μάρτιος 200642 Πειραματική αξιολόγηση  Δεδομένα χρήσης από αρχεία καταγραφής εταιρείας ISP  Προεπεξεργασία  Χωρισμός σε συνόδους χρήσης  Εύρεση λέξεων-κλειδιών  Χωρισμός δεδομένων σε δύο σύνολα  Δείγμα εκπαίδευσης (κατασκευή μοντέλου)  Δείγμα ελέγχου (αξιολόγηση)

43 Μάρτιος 200643 Πειραματική αξιολόγηση Διαδικασία  Αξιοποίηση συνόδων χρήσης δείγματος ελέγχου  Αποκρύβουμε τελευταία σελίδα συνόδου χρήσης  Χρησιμοποιούμε τις υπόλοιπες για διάσχιση του γράφου και επιλογή σελίδων

44 Μάρτιος 200644 Πειραματική αξιολόγηση Μέτρο αξιολόγησης Αναμενόμενη χρησιμότητα της λίστας προτεινόμενων σελίδων ομοιότητα περιεχομένου για όλες τις προτεινόμενες σελίδες κρυμμένη σελίδα

45 Μάρτιος 200645 Πειραματική αξιολόγηση Βάση σύγκρισης  Απλό μοντέλο με δημιουργία ομάδων σελίδων βάσει ομοιότητας περιεχομένου  Πρόταση σελίδων  Εύρεση ομάδων πιο όμοιων με τις σελίδες που ήδη επισκέφτηκε ο χρήστης  Επιλογή των πιο χαρακτηριστικών σελίδων από τις ομάδες αυτές

46 Μάρτιος 200646 Πειραματική αξιολόγηση ΜέθοδοςΑναμ. Χρησιμότητα CANUMGI-A8.57 CANUMGI-B21.72 CANUMGI-C20.59 Βάση σύγκρισης24.25

47 Μάρτιος 200647 Συμπεράσματα  Η νέα μέθοδος δεν ξεπέρασε το μοντέλο σύγκρισης  Η γνώση της σειράς επίσκεψης μάλλον δε συμβάλλει στην πρόταση σελίδων Μεγάλη ανομοιογένεια δεδομένων χρήσης  Πλοήγηση μέσα σε μία θεματική κατηγορία

48 Μάρτιος 200648 Συμπεράσματα Αυτομεταβάσεις με υψηλή πιθανότητα

49 Μάρτιος 200649 Συμπεράσματα  CANUMGI-B αποδίδει καλύτερα από τις άλλες Πιο έξυπνη επιλογή κόμβων  Η μείωση διαστασιμότητας δε βελτίωσε τα αποτελέσματα Δε βοηθά η ομαδοποίηση  Η γνώση των λίγων προηγούμενων επισκέψεων πιο χρήσιμη

50 Μάρτιος 200650 Μελλοντικές Κατευθύνσεις  Δυναμικός προσδιορισμός παραμέτρων  Μελέτη του μετρικού αξιολόγησης  Προσεγγίσεις με μαρκοβιανά μοντέλα  Επιλεκτική χρησιμοποίηση δεδομένων χρήσης + μοντέλο με βάση το περιεχόμενο  Χρήση πιθανοτικών γραμματικών υπερκειμένου (HPG)


Κατέβασμα ppt "Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσμιο Ιστό με χρήση μεθόδων Συμπερασμού Γραμματικών Κορφιάτης Γιώργος Παλιούρας Γιώργος."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google