Κωνσταντίνος Μ. Κολομβάτσος

Κωνσταντίνος Μ. Κολομβάτσος
Αυτόματες Διαπραγματεύσεις Υπολογιστικά Νοημόνων Οντοτήτων σε Ηλεκτρονικές Αγορές Κωνσταντίνος Μ. Κολομβάτσος Τριμελής Συμβουλευτική Επιτροπή: Ε. Χατζηευθυμιάδης, Επίκ. Καθηγητής ΕΚΠΑ Μ. Κουμπαράκης, Καθηγητής ΕΚΠΑ Γ. Βούρος, Καθηγητής Παν. Πειραιώς

Περιεχόμενα Αντικείμενο Διατριβής Ηλεκτρονικές Αγορές
Μοντελοποίηση Συμπεριφοράς Πωλητών Μοντελοποίηση Συμπεριφοράς Αγοραστών Σενάριο Αλληλεπίδρασης Πωλητών - Αγοραστών Μηχανισμός Λήψης Αποφάσεων Πωλητών Επιλογή Ενδιάμεσων Οντοτήτων & Προϊόντων Μηχανισμός Λήψης Αποφάσεων Αγοραστών Εφαρμογή Θεωρίας Βέλτιστης Παύσης Προσδιορισμός Επιπέδου Εμπιστοσύνης σε Ηλεκτρονικές Αγορές Μελλοντικές Προεκτάσεις

Αντικείμενο Διατριβής
Το κύριο πρόβλημα στις Ηλεκτρονικές Αγορές (ΗΑ) είναι η αβεβαιότητα. Μοντελοποίηση της αυτόματης αλληλεπίδρασης οντοτήτων κάτω από πλήρη άγνοια για τα χαρακτηριστικά της κάθε οντότητας. Ανάπτυξη μιας ευέλικτης τεχνικής για τον καθορισμό της συμπεριφοράς οντοτήτων κάτω από άγνοια. Αυτοματοποίηση της παραγωγής της βάσης γνώσης μιας οντότητας. Ανάπτυξη αποδοτικών και ευέλικτων τεχνικών για τον καθορισμό βασικών παραμέτρων που καθορίζουν τη συμπεριφορά μιας οντότητας. Ανάπτυξη μιας αποδοτικής στρατηγικής για την ταυτόχρονη αλληλεπίδραση με ένα πλήθος οντοτήτων.

Ηλεκτρονικές Αγορές (ΗΑ)
Εικονικές κοινότητες όπου άγνωστες οντότητες αλληλεπιδρούν για την ανταλλαγή προϊόντων. Δυναμικά περιβάλλοντα με μεταβαλλόμενα χαρακτηριστικά (ζήτηση, προσφορά). Μέλη Ηλεκτρονικών Αγορών: Πωλητές Αγοραστές Ενδιάμεσες οντότητες Μεσίτες (Brokers) Οντότητες ταιριάσματος (Matchmakers) Οντότητες Αγορών (Shopbots) Μηχανισμοί για εύρεση οντοτήτων, πληρωμών, ασφαλείας, κ.λπ.

Πωλητές (1/11) Έχουν στην ιδιοκτησία τους ένα σύνολο προϊόντων τα οποία διαθέτουν στο κοινό. Επιθυμούν την πώληση σε όσο το δυνατόν μεγαλύτερη τιμή. Εμπλέκονται σε διαπραγματεύσεις με ένα σύνολο αγοραστών. Ακολουθούν συγκεκριμένες στρατηγικές για την επίτευξη συμφωνίας.

Πωλητές (2/11) Χαρακτηριστικά:
Χρονικός Ορίζοντας Συμμετοχής (deadline) (Ts) Στο (Faratin et al., 1998) καθορίζεται δυναμικά αλλά με βάση το πλήθος των πελατών που αναμένουν. Κόστος του/ων προϊόντος/ων (c) Επιδιωκόμενο κέρδος (ε) Συντελεστής Απομείωσης (Discount Factor) (δs) Συνάρτηση Ωφέλειας (Utility Function) (Us) Καθορίζει το όφελος που ο πωλητής αποκομίζει από μια συμφωνία.

Πωλητές (3/11) Χαρακτηριστικά (συνέχεια): Τιμολογιακή στρατηγική (ps)
Υποδεικνύει τις προσφορές που ο πωλητής κάνει προς τους αγοραστές. Παράδειγμα: όπου c: κόστος, ps: τιμή, ε: κέρδος, i: γύρος διαπραγμάτευσης, Ts:χρονικός ορίζοντας συμμετοχής. Το k υποδηλώνει την τιμολογιακή πολιτική. k<1: υπομονετική. k>1: επιθετική.

Πωλητές (4/11) Προτείνουμε μια επιθετική τιμολογιακή στρατηγική η οποία βασίζεται αποκλειστικά στα χαρακτηριστικά των προϊόντων. Στο (Sheng, 2004) ορίζεται ο δείκτης δημοφιλίας που βασίζεται στο πλήθος των πελατών και στο ιστορικό των αγορών. Προτεινόμενη τιμολογιακή στρατηγική: με q  [0,1] να αποτελεί το λόγο δημοφιλίας με βάση το νόμο του Zipf (q = 1/mb, m είναι η θέση του αντικειμένου).

Πωλητές (5/11) Δυναμικός καθορισμός Ts
Ο πωλητής δεν μπορεί και δεν πρέπει να προτείνει τιμές επ’ άπειρον. Κάτω όριο προσφορών είναι το c. Ο χρονικός ορίζοντας καθορίζεται ως: Το α καθορίζει το πόσο κοντά θα φτάσει η τελευταία προσφορά στο κόστος (και άρα μεγαλύτερος θα είναι ο χρονικός ορίζοντας).

Πωλητές (6/11) Χρήση Ασαφούς Λογικής (Fuzzy Logic)
Για τον αποδοτικό προσδιορισμό του χρονικού ορίζοντα συμμετοχής. Καθορισμός της παραμέτρου α. Για τον καθορισμό ενός μηχανισμού λήψης αποφάσεων στην πλευρά του πωλητή. Για τον καθορισμό της κατάλληλης απόφασης σε κάθε γύρο μιας διαπραγμάτευσης. Βασιζόμαστε σε ένα σύνολο παραμέτρων για τη λήψη της απόφασης.

Πωλητές (7/11) Βιβλιογραφία Η χρήση της Ασαφούς Λογικής γίνεται για:
Τον καθορισμό των τιμών διαφόρων χαρακτηριστικών προϊόντων (Cheng et al., 2006; Carbo et al., 2003). Για τον καθορισμό περιορισμών στη διαδικασία λήψης απόφασης (Ragone et al., 2008; Kowalczyk & Buik, 2000). Για τον προσδιορισμό των προσφορών που πρόκειται να προταθούν (Jain & Benyoucef, 2007; Raeesy et al., 2007). Για πρόβλεψη των ορίων στις τιμές των οντοτήτων (Lin et al., 2006). Για τον προσδιορισμό του επιπέδου ικανοποίησης των οντοτήτων από τις προσφορές των αντιπάλων (Zuo & Sun, 2009; Wang et al., 2005). Για τον προσδιορισμό της απόφασης σε κάθε γύρο (Wang et al., 2006) – Μειονέκτημα: Βασίζεται μόνο σε δύο παραμέτρους (τιμή και ποιότητα)

Πωλητές (8/11) Χρήση Ασαφούς Λογικής για τον καθορισμό της παραμέτρου α. Τραπεζοειδής membership functions. Ένα σύνολο κανόνων ασαφούς λογικής εξάγουν την τιμή της παραμέτρου α. Οι κανόνες καθορίζονται από experts. Η παράμετρος α εξαρτάται από τη θέση του προϊόντος (δημοφιλία) και το κέρδος που επιδιώκει ο πωλητής

Πωλητές (9/11) Πειραματικά Αποτελέσματα ε q Ts (α=20) α (Χρήση FL)
5 1 6 89.4 10 0.4 8 275 23 7 15.8 31 0.7 9 15 0.2 12 588 56 20 14 42

Πωλητές (10/11) Αυτόματη εξαγωγή κανόνων
Ο fuzzy controller μαθαίνει να εξάγει τους βέλτιστους κανόνες για τον υπολογισμό της παραμέτρου α. Χρήση δεδομένων που ορίζουν οι experts. Οι experts πιο εύκολα καθορίζουν αριθμητικές τιμές και καλύπτουν ευκολότερα ένα μεγαλύτερο πλήθος σεναρίων. Χρήση αλγορίθμων συσταδοποίησης. Χρήση των: Subtractive Clustering. Fuzzy C-Means Clustering.

Subtractive clustering
Πωλητές (11/11) Πειραματικά Αποτελέσματα ε q Ts (α = 50) Χρήση Ασαφούς Λογικής Subtractive clustering Fuzzy C-Means Τιμή του α 1 0.2 6 588 20 999 25 430 17 5 89.4 168 7 152 10 18 56 511 53 396 47 12 116 13 118 50 38 117 109 54 246 79 15.8 100 52 275 113 77 58.2 22 15

Αγοραστές (1/2) Χαρακτηριστικά
Χρονικός Ορίζοντας Συμμετοχής (deadline) (Tb) Αποτίμηση του/ων προϊόντος/ων (Valuation)(V) Συντελεστής Απομείωσης (Discount Factor) (δb) Συνάρτηση Ωφέλειας (Utility Function) (Ub) Καθορίζει το όφελος που ο αγοραστής αποκομίζει από μια συμφωνία. Βαθμός Συσχέτισης (relevance factor) (r) Δείχνει το πόσο ‘ταιριάζει’ το προϊόν με τους στόχους του αγοραστή.

Αγοραστές (2/2) Χαρακτηριστικά (συνέχεια): Τιμολογιακή στρατηγική (pb)
Υποδεικνύει τις προσφορές που ο αγοραστής κάνει προς τους πωλητές. Παράδειγμα: όπου p0: αρχική τιμή, pb: τιμή, V: αποτίμηση, i: γύρος διαπραγμάτευσης, Tb:χρονικός ορίζοντας συμμετοχής. Το k υποδηλώνει την τιμολογιακή πολιτική. k>1: υπομονετική. k<1: επιθετική.

Σενάριο Αλληλεπίδρασης
Σενάριο αλληλεπίδρασης Διαπραγμάτευση με αγοραστές για ένα ή πολλαπλά χαρακτηριστικά των προϊόντων. Οι δύο οντότητες έχουν συγκεκριμένα όρια τιμών τα οποία δεν ξεπερνούν: Ο πωλητής επιθυμεί όσο το δυνατόν μεγαλύτερη τιμή ενώ ο αγοραστής επιθυμεί όσο το δυνατόν μικρότερη τιμή. Και οι δύο έχουν χρονικούς ορίζοντες συμμετοχής Η συμφωνία μπορεί να επιτευχθεί στο διάστημα [c, V] (ζώνη συμφωνίας) εφόσον δεν είναι κενό και σε χρόνο t ≤ min(Tb, Ts). Σε κάθε γύρο οι οντότητες αποφασίζουν: {Accept, Reject and Counter Propose, Quit}

Διαπραγματεύσεις (1/4) Μοντελοποίηση:
Χρήση εννοιών από την θεωρία παιγνίων και ενός ασαφούς συστήματος. Γιατί; Στη θεωρία παιγνίων: Τα περισσότερα μοντέλα υποθέτουν γνώση για κάποια από τα χαρακτηριστικά των οντοτήτων (Kraus, 2001; Rubistein, 1982; Fatima et al., 2002; Fatima et al., 2004; Da Jun & Xian, 2002; Fatima et al., 2005; Shadholm & Vulcan, 1998; Fatima et al., 2006). Πολλές φορές η στρατηγική ισορροπίας είναι δύσκολο να βρεθεί. Τα μοντέλα που βασίζονται στον κανόνα του Bayes προϋποθέτουν τη γνώση μιας a priori πιθανότητας (Mudgal & Vassileva, 2000; Zeng & Sycara, 1998). Μοντέλα που βασίζονται σε ιστορικά δεδομένα μειονεκτούν όταν τα δεδομένα αυτά δεν είναι διαθέσιμα (Oshrat et al., 2009). Μοντέλα που βασίζονται σε μηχανισμούς μάθησης ή πρόβλεψης απαιτούν ένα στάδιο εκπαίδευσης (Oliver, 1997; Oshrat et al., 2009). Μοντέλα που βασίζονται στη θεωρία αποφάσεων απαιτούν αυξημένη επεξεργαστική ισχύ ειδικά όταν υπάρχει μεγάλο πλήθος οντοτήτων (Mudgal & Vassileva, 2000). Ευριστικές τεχνικές είναι προσανατολισμένες σε συγκεκριμένες εφαρμογές (Faratin et al., 1998)

Διαπραγματεύσεις (2/4) Ενέργειες των οντοτήτων: Αγοραστής Πωλητής

Διαπραγματεύσεις (3/4) Υποθέτουμε πλήρη άγνοια για τα χαρακτηριστικά των οντοτήτων. Απαιτούνται δύο εκτιμητές: Εκτιμητής χρόνου Χρήση ομοιόμορφης κατανομής Χρήση γραμμικής κατανομής Εκτιμητής τιμολογιακής στρατηγικής Χρήση Kernel Density Estimator Με χρήση Gaussian συνάρτησης εκτιμούμε την πιθανότητα να είναι η επόμενη τιμή του αντιπάλου είναι μικρότερη / μεγαλύτερη από το V / c. Παράδειγμα (αγοραστής):

Διαπραγματεύσεις (4/4) Στρατηγική ισορροπίας για τον αγοραστή:
Αποδοχή μόνο όταν: Μετά από πράξεις καταλήγουμε ότι πρέπει: Για χρήση ομοιόμορφης κατανομής (P= 1/ tmax)στον εκτιμητή χρόνου, tmax είναι ένα όριο πάνω από το οποίο θεωρούμε πως η λήξη του χρονικού ορίζοντα του πωλητή είναι ίση με 1.

Λήψη Αποφάσεων Πωλητών (1/6)
Προτεινόμενος μηχανισμός λήψης αποφάσεων Βάση του μηχανισμού αποτελεί ένα σύστημα ασαφούς λογικής. Εξάγει την κατάλληλη απόφαση σε κάθε γύρο της διαπραγμάτευσης. Ο μηχανισμός βασίζεται στις ακόλουθες παραμέτρους: t : η διαφορά του τρέχοντος γύρου από το Ts. d : η διαφορά των προσφορών μεταξύ αγοραστή – πωλητή. b : η πίστη για τη λήξη του ορίζοντα συμμετοχής του αγοραστή. N : το πλήθος των πελατών στο συγκεκριμένο πωλητή για το συγκεκριμένο προϊόν.

Χρησιμοποιούμε τραπεζοειδείς membership functions. Ένα σύνολο κανόνων ασαφούς λογικής εξάγουν τη βέλτιστη απόφαση. Οι κανόνες καθορίζονται από experts. Το αποτέλεσμα του συστήματος είναι η παράμετρος Acceptance Degree (AD).

Πειραματικά αποτελέσματα ε ~U(1,100) Όφελος Πωλητή Ι=1: ο αγοραστής αποδέχεται σε χρόνο t* Ι=0: ο πωλητής αποδέχεται σε χρόνο t#

Πειραματικά αποτελέσματα (συνέχεια) Πλήθος βημάτων για να κλείσει η συμφωνία

Πειραματικά αποτελέσματα (συνέχεια) Μεταβλητό κέρδος ε Ποσοστό συμφωνιών AG As είναι η ενέργεια του πωλητή σε χρόνο t*, Ab είναι η ενέργεια του αγοραστή σε χρόνο t# και R είναι το πλήθος των πειραμάτων

Σύγκριση με άλλες ερευνητικές προσπάθειες AG Η επιθετική στρατηγική οδηγεί σε AG > 75% για διάφορες τιμές του V. Στην πλειονότητα των σεναρίων επιτυγχάνουμε AG > 90% Το προτεινόμενο σύστημα έχει καλύτερη απόδοση από τα (An et al., 2006 – maximum 90%), (Cheng et al., 2005 – 88.1%), (Lee, – 50%) ενώ έχει παραπλήσια ή λίγο καλύτερη απόδοση από το (Faratin et al., 1998 – maximum 100%, minimum 45%). IU Απ’ ευθείας σύγκριση μπορεί να γίνει με το (Faratin et al., 1998) όπου στη συντριπτική πλειοψηφία των στρατηγικών το μέσο όφελος είναι περίπου 0.6 ενώ σε άκρως επιθετικές στρατηγικές είναι ίσο με 0.9.

Επιλογή Οντοτήτων (1/4) Μεθοδολογία επιλογής της πιο κατάλληλης οντότητας (πωλητών ή ενδιάμεσων) για αγορά προϊόντος. Γιατί; Τα μοντέλα που υπάρχουν στη βιβλιογραφία προτείνουν τη χρήση ενδιάμεσων οντοτήτων (οντότητες ταιριάσματος ή μεσίτες). Οι αγοραστές επιλέγουν μόνοι τους την οντότητα με βάση πληροφορίες που τις αφορούν. Οι πληροφορίες συλλέγονται από άλλους αγοραστές ή από ενδιάμεσες οντότητες. Ο αγοραστής χρησιμοποιεί τον Q-Learning αλγόριθμο Ο πίνακας Q-Table μας δίνει τη βέλτιστη κίνηση (επιλογή οντότητας – πωλητής ή μεσίτης).

Επιλογή Οντοτήτων (2/4) Ο Q-Table χτίζεται με βάση το βαθμό συσχέτισης r, την τιμή του προϊόντος, τον χρόνο απόκρισης της οντότητας και τον αριθμό των εναλλαγών στις κινήσεις. Κάθε στοιχείο του πίνακα υπολογίζεται ως εξής: όπου l είναι ο ρυθμός μάθησης, το R αποτελεί το όφελος που αποκομίζει ο αγοραστής, γ είναι ο συντελεστής απομείωσης, το Q() μας δίνει μια τιμή από τους Q-Πίνακες, st και at είναι η κατάσταση και η ενέργεια που κάνει ο αγοραστής σε χρόνο t.

Επιλογή Οντοτήτων (3/4) Υπολογισμός οφέλους
c είναι μια σταθερή τιμή, k είναι ο αριθμός των μετακινήσεων, Pr είναι η τιμή του προϊόντος, Tpr είναι ένα όριο τιμής, RT είναι ο χρόνος απόκρισης, Tt είναι ένα όριο χρόνου και wp, wt είναι τα βάρη για τον τελικό υπολογισμό του οφέλους για την τιμή και το χρόνο απόκρισης αντίστοιχα.

Επιλογή Οντοτήτων (4/4) Πειραματικά αποτελέσματα
5 προϊόντα η κάθε οντότητα προϊόντα η κάθε οντότητα

Επιλογή Προϊόντων (1/6) Η μέθοδος βασίζεται σε ένα μεγάλο πλήθος αλγορίθμων λεξικογραφικής ομοιότητας και σε περιγραφές των αιτημάτων και των προϊόντων με λέξεις κλειδιά και ελεύθερο κείμενο. Αιτία: Οι χρήστες δεν έχουν την ευχέρεια να καθορίσουν τα αιτήματα σε εξειδικευμένες γλώσσες περιγραφής στόχων. Τα shopbots δεν είναι δυνατόν να καλύψουν όλες τις ανάγκες για προϊόντα. Μεγάλο πλήθος προϊόντων αυξάνει το χρόνο απόκρισης. Οι πράκτορες συστάσεων απαιτούν ένα στάδιο ‘συζήτησης’ με τους χρήστες. Μοντέλα που υιοθετούν οντολογίες έχουν το πρόβλημα της ετερογένειας. Ελάχιστες τεχνικές λαμβάνουν υπόψιν QoS χαρακτηριστικά. Ο προτεινόμενος αλγόριθμος στοχεύει στο να χρησιμοποιηθεί από ένα αγοραστή ακριβώς πριν εμπλακεί σε διαπραγματεύσεις (απαιτείται ταχύτητα στην εξαγωγή του αποτελέσματος).

Επιλογή Προϊόντων (2/6) Αιτήματα Πληροφορία πλαισίου Περιγραφή
Περιορισμοί (όνομα, συνθήκη) Περιγραφές προϊόντων Χαρακτηριστικά (όνομα, τιμή) Χρησιμοποιούμε 15 αλγορίθμους λεξικογραφικής ομοιότητας. Δεν βασιζόμαστε σε σημασιολογική ομοιότητα διότι οι αλγόριθμοι απαιτούν χρόνο. Όταν η διακύμανση των αποτελεσμάτων υπερβαίνει ένα όριο τότε απορρίπτουμε τη μέγιστη και την ελάχιστη τιμή.

Επιλογή Προϊόντων (3/6) Ο νέος αλγόριθμος:
Εξετάζει ταυτόχρονα κοινά Ν-γράμματα όπου Ν = {1,2,3,…, min(s,t)} όπου s και t είναι τα μήκη των εξεταζόμενων συμβολοσειρών. Ο βαθμός ομοιότητας εξάγεται από την ακόλουθη εξίσωση: Τα QoS χαρακτηριστικά που εμπλέκονται στη διαδικασία υπολογισμού του r είναι: Η τιμή του προϊόντος ως ποσοστό της αποτίμησης V. Ο χρόνος παράδοσης (D). Ο βαθμός εμπιστοσύνης του πωλητή (T).

Επιλογή Προϊόντων (4/6) Ομοιότητα πληροφορίας πλαισίου.
Ομοιότητα των λέξεων κλειδιών (kFactor). Βαθμός ικανοποίησης των περιορισμών (cFactor). QoS χαρακτηριστικά (QoSFactor). ή Υπολογισμός τελικής τιμής του r με χρήση: Hard προσέγγισης Soft προσέγγισης

Επιλογή Προϊόντων (5/6) Precision Recall 100% 75% Precision Recall 70%
Πειραματικά αποτελέσματα (Hard Προσέγγιση) Dataset από και από Wikipedia για τα 44 πιο δημοφιλή βιβλία στην ιστορία. Dataset από την Χρυσή Ευκαιρία (προσφορά – ζήτηση αυτοκινήτων). Πειραματικά αποτελέσματα (SoftΠροσέγγιση) Χρόνος εκτέλεσης: 35s Χρόνος εκτέλεσης με χρήση ενός μόνο αλγορίθμου σημασιολογικής ομοιότητας: 19m 35s Άλλα συστήματα: iMatch: s, Decaf: s Precision Recall 100% 75% Precision Recall 70% Precision Recall 35% 94%

Επιλογή Προϊόντων (6/6) Σύγκριση hard (αριστερή στήλη) και Soft (δεξιά στήλη – βάρη 0.2, 0.4, 0.4) προσέγγισης: 100% ταιριάσματα 80% ταιριάσματα

Λήψη Αποφάσεων Αγοραστών (1/10)
Προτεινόμενος μηχανισμός λήψης αποφάσεων Βάση του μηχανισμού αποτελεί ένα σύστημα ασαφούς λογικής. Εξάγει την κατάλληλη απόφαση σε κάθε γύρο της διαπραγμάτευσης. Ο μηχανισμός βασίζεται στις ακόλουθες παραμέτρους: r : ο βαθμός συσχέτισης. t : η διαφορά του τρέχοντος γύρου από το Tb. d : η διαφορά των προσφορών μεταξύ αγοραστή – πωλητή. b : η πίστη για τη λήξη του ορίζοντα συμμετοχής του πωλητή. V : η αποτίμηση για το προϊόν. Έξοδος του συστήματος είναι η παράμετρος Acceptance Degree (AD).

Χρήση τραπεζοειδών membership functions. Χρήση ενός συνόλου κανόνων ασαφής λογικής. Απόδοση: Δείκτης σύγκλισης V (max value) CI 5 0.837 20 0.702 50 0.771 80 0.829 100 0.844 150 0.874 200 0.891

Πειραματικά αποτελέσματα Σύγκριση με ένα μοντέλο βέλτιστης παύσης (El Yaviv et al., 2001). Αποδοχή τιμής όταν μικρότερη από: , προσφορές στο διάστημα [m, M] Ορίζουμε τη διαφορά: Μικροί χρονικοί ορίζοντες Μεγάλοι χρονικοί ορίζοντες V (max value) ΔR 5 -43.61% 20 -32.14% 50 -15.71% 80 -2.96% 100 3.53% 150 23.18% 200 34.90% V (max value) ΔR 5 -55.77% 20 -35.78% 50 -18.85% 80 -8.05% 100 5.97% 150 22.69% 200 34.63%

Πειραματικά αποτελέσματα (συνέχεια) Τα αποτελέσματα για το IU είναι πολύ καλύτερα από το (Faratin et al., 1998) – η πλειοψηφία είναι κάτω από 0.6 ενώ το μέγιστο είναι 0.9. Για μεγάλες τιμές του χρονικού ορίζοντα το μέσο IU φτάνει το 0.99. V (max value) Μέσο IU 5 0.41 20 0.70 50 0.88 80 0.91 100 0.94 150 0.96 200 0.97

Εκμάθηση κανόνων ασαφούς λογικής. Η μέθοδος βασίζεται σε αριθμητικά δεδομένα που δίδονται από τους experts. Πλεονεκτήματα: Ευκολία στην εισαγωγή πολλών σεναρίων. Χρήση τεχνικών συσταδοποίησης και μάθησης. K-Means Fuzzy C-Means Subtractive Nearest Neighbor Learning from Examples Modified learning form Examples

Πειραματικά αποτελέσματα Κοινό όφελος JU (δείχνει το πόσο δίκαια είναι η τιμή συμφωνίας – μέγιστο = 0.25) Σενάριο Ζώνη συμφωνίας Μέσο JU Μέγιστο JU Αλγόριθμος 1 5 ΧΜ 0.08 0.24 FCM, K-Means 2 10 ΧΜ 0.14 3 20 ΧΜ 0.16 0.21 LFE 4 50 ΧΜ 0.247 5 250 ΧΜ 0.238 MLFE 6 450 ΧΜ 0.208 7 750 ΧΜ 0.17 0.172

Προτεινόμενο μοντέλο προσαρμογής συμπεριφοράς του αγοραστή. Στόχος είναι η προσαρμογή της διαπραγμάτευσης με βάση τις προσφορές του πωλητή. Προσδιορισμός της πίστης b για το πέρας της διαπραγμάτευσης και μιας νέας τιμολογιακής στρατηγικής k. Χρήση τεχνικών αυτόματης εξαγωγής κανόνων στο ασαφές σύστημα. Απόρριψη της μεγαλύτερης και της μικρότερης τιμής. Η τελική τιμή του AD είναι ο μέσος όρος αυτών που απομένουν. Χρήση τεχνικών πρόβλεψης της επόμενης προσφοράς του πωλητή. Χρήση ασαφή ελεγκτή για τον υπολογισμό του b και του k.

Μηχανισμός πρόβλεψης Λόγω της άγνοιας για την τιμολογιακή στρατηγική του πωλητή υιοθετούνται τρεις τεχνικές πρόβλεψης: Γραμμική πρόβλεψη (οι συντελεστές της εξίσωσης υπολογίζονται με χρήση του αλγορίθμου Levinson Durbin) Πολυωνυμική πρόβλεψη (μέθοδος Stoer Bulirsch – Richardson Extrapolation) Πρόβλεψη με Νευρωνικό Δίκτυο (οι είσοδοι είναι οι τρεις τελευταίες προσφορές του πωλητή και η έξοδος είναι η πρόβλεψη για την επόμενη προσφορά). Σε κάθε γύρο ο αγοραστής χρησιμοποιεί τους μηχανισμούς πρόβλεψης για τον υπολογισμό της επόμενης προσφοράς και στη συνέχεια υπολογίζει το σφάλμα και την μεταβολή του σφάλματος σε συνεχόμενους γύρους. Οι δυο τιμές του σφάλματος είναι οι είσοδοι στον ασαφή ελεγκτή (χρήση 12 κανόνων) ο οποίος εξάγει της τιμές του b και του k.

Πειραματικά αποτελέσματα (συνέχεια) Σύγκριση με το ‘απλό’ ασαφές μοντέλο. Ο πωλητής προτείνει τυχαίες τιμές στο διάστημα [c, c+ε].

Θεωρία Βέλτιστης Παύσης (1/8)
Προσφέρει μεθόδους για την εύρεση του κατάλληλου χρονικού σημείου ώστε να γίνει μια ενέργεια. Το προτεινόμενο μοντέλο δεν απαιτεί κανενός είδους γνώση για τα χαρακτηριστικά των αντιπάλων. Δεν απαιτείται καμία περίπλοκη μοντελοποίηση ούτε και κάποιου είδους βάση γνώσης. Το προτεινόμενο μοντέλο έχει εντελώς διαφορετική στόχευση: να βρει τον κατάλληλο χρόνο ώστε να ληφθεί η απόφαση αποδοχής ή μη. Τρία προτεινόμενα μοντέλα: Discounted Sum Burglar Problem Last Success Problem

Discounted Sum Problem Ο αγοραστής αποδέχεται προσφορές μόνο όταν είναι μικρότερες από V. Ένας δείκτης Xi δείχνει αν η προσφορά είναι στα αποδεκτά όρια Τα οφέλη Xi συσσωρεύονται με το πέρασμα των γύρων. Ένας συντελεστής απομείωσης β μειώνει το όφελος με το πέρασμα του χρόνου. Το τελικό όφελος είναι ίσο με: Το πρόβλημα είναι το πόσο μεγάλο θα γίνει το S προτού ο αγοραστής αποφασίσει να σταματήσει.

Discounted Sum Problem (συνέχεια) Αναζητούμε το χρονικό σημείο t* στο οποίο το όφελος του αγοραστή μεγιστοποιείται. Θεωρούμε την πιθανότητα: και αφού Παίρνουμε πως Τελικά ο αγοραστής σταματά όταν: Η πιθανότητα προσεγγίζεται με τον εκτιμητή KDE.

Τεχνικές που βασίζονται στη διαφορά τιμών Burglar Problem Το όφελος μεγαλώνει όταν Δt → 0 Συνάρτηση οφέλους Είναι υπαρκτός ο κίνδυνος ο πωλητής να εγκαταλείψει τη διαπραγμάτευση. Το τελικό όφελος είναι ίσο με: Ζi =1:ο πωλητής δεν έχει εγκαταλείψει, Ζi =0:ο πωλητής έχει εγκαταλείψει. Βασιζόμαστε στις πιθανότητες: P(Zi = 1) = β και P(Zi = 0) = 1 – β (με γνωστό β  (0,1)).

Burglar Problem (συνέχεια) Θεωρούμε πως: Μετά από πράξεις καταλήγουμε ότι ο αγοραστής σταματά όταν: Last Success Problem Βασιζόμαστε στο θεώρημα Odds. Χρησιμοποιούμε δείκτες k με πιθανότητες P(Ik = 1) και P(Ik = 0). Ik = 0: ο χρονικός ορίζοντας του πωλητή λήγει, Ik = 1: ο χρονικός ορίζοντας του πωλητή δεν εκπνέει. Λόγω της άγνοιας για τη στρατηγική του πωλητή, την προσεγγίζουμε με τη συνάρτηση: Δt ~ U(L, H) και συνεπώς ps→b ~ U(L, H)

Last Success Problem (συνέχεια) Όταν, f < h (h είναι ένα προκαθορισμένο κατώφλι), παίρνουμε πως Ik = 1 ενώ όταν f ≥ h έχουμε πως Ik = 0. Η παράμετρος αi.(ξ) όπου ξ = Δt ορίζεται ως η διαφορά ανάμεσα στην προτεινόμενη τιμή του αγοραστή και του πωλητή. Με χρήση της άρνησης Sugeno καταλήγουμε: Ο αλγόριθμος Odds αναμένει μέχρι το σημείο όπου μεγιστοποιείται η πιθανότητα να πάρουμε ένα επιτυχή δείκτη. Έτσι, ο κανόνας βέλτιστης παύσης είναι να σταματήσουμε στον πρώτο γύρο k ≥ s όπου Ik = 1 (εάν υπάρχει) και το s δίνεται από: χρήση Warm up περιόδου με pk = E(Ik) qk = 1 – pk

Πειραματικά αποτελέσματα

Πειραματικά αποτελέσματα (συνέχεια) Ο πωλητής προτείνει τυχαίες τιμές στο διάστημα [c, c+ε]. V DS (0.95) Last Success Burglar Fuzzy Logic AG Steps pA 50 44% 10.61 21 96% 39.98 14 99% 15.12 11 66% 20.27 12 100 8.32 30 98% 36.57 23 100% 6.67 17 88% 17.02 15 150 5.87 37 28.99 27 4.31 22 13.63 19

Ταυτόχρονες Διαπραγματεύσεις (1/3)
Βασιζόμαστε στον αλγόριθμο PSO. Η τοπική βέλτιστη θέση είναι η καλύτερη τιμή που έχει επιτύχει μέχρι στιγμής. Η ομαδική βέλτιστη θέση είναι η καλύτερη συμφωνία που έχει επιτευχθεί σε όλα τα νήματα. Όταν επιτευχθεί συμφωνία σε ένα νήμα, ειδοποιούνται τα υπόλοιπα και αλλάζουν στρατηγική εφόσον η ατομική τους θέση είναι χειρότερη από την ομαδική. Η ατομική θέση δεν είναι γνωστή στα υπόλοιπα νήματα παρά μόνο όταν επιτευχθεί συμφωνία.

Διαφορές με τη βιβλιογραφία Δεν απαιτεί χρήση συντονιστή όπως στα (Nguyen & Jennings, 2003a; Nguyen & Jennings, 2003b; Rahwan et al., 2002). Το προτεινόμενο μοντέλο απαιτεί μικρότερη ανταλλαγή μηνυμάτων ενώ προκαλεί μικρότερη επιβάρυνση στον αγοραστή. Μετά από υπολογισμούς η νέα στρατηγική (εφόσον υπάρχει ανάγκη για αλλαγή) δίνεται από την εξίσωση: με u να είναι η ταχύτητα μετάβασης του PSO (υπολογίζεται από την ατομική θέση και την ομαδική θέση) και e είναι ένα σφάλμα προσέγγισης.

Πειραματικά αποτελέσματα (e=2)

Υπολογισμός Εμπιστοσύνης (1/4)
Προτείνουμε ένα μηχανισμό για υπολογισμό του βαθμού εμπιστοσύνης μιας οντότητας. Γιατί; Πολλές ερευνητικές προσπάθειες υιοθετούν δυικές αποτιμήσεις για τις οντότητες (π.χ. Ebay; Josang, 2007;Wang et al., 2003; Zhang & Cohen, 2006). Πολλές εργασίες βασίζονται μόνο σε μια παράμετρο (π.χ. Josang, 2002; Lesani & Montazeri, 2009; Zhang & Cohen, 2006). Αρκετές εργασίες αντιμετωπίζουν μόνο το βαθμό εμπιστοσύνης και όχι την έλλειψη. Κάποιες εργασίες αντιμετωπίζουν την εξαγωγή της εμπιστοσύνης ως ένα γράφο όπου οι συνδέσεις καθορίζουν την εμπιστοσύνη ανάμεσα στις οντότητες.

Σύστημα ασαφούς λογικής Βασίζεται σε αναφορές χρηστών και προσωπικές αναφορές. (εμπειρίες). Βασικές παράμετροι των αναφορών: ποιότητα (Q), mχρόνος απόκρισης (C), χρόνος αποστολής (D). Τρία υποσυστήματα:

Social Trust Sub – System Individual Trust Sub – System Υπολογισμός βαρών

Υπολογισμός βαρών (συνέχεια) Είσοδοι Social Trust Individual Trust Διαφορά ανάμεσά τους Τελικός υπολογισμός Χρήση τριγωνικών membership functions Όσες αναφορές είναι παλιές δεν λαμβάνονται υπόψιν. Λαμβάνουμε υπόψιν ακόμη και το επίπεδο εμπιστοσύνης της οντότητας που κάνει μια αναφορά.

Μελλοντικές Προεκτάσεις
Πωλητές Χρήση περισσότερων παραμέτρων στον καθορισμό του χρονικού ορίζοντα (π.χ. πλήθος αγοραστών, είδος προϊόντος, κ.λπ.). Υπολογισμός της πίστης για τη λήξη του χρονικού ορίζοντα του αγοραστή. Δημιουργία της βάσης γνώσης με βάση πραγματικά δεδομένα που υπάρχουν από πραγματικές αγοραπωλησίες. Αγοραστές Ορισμός μεθοδολογίας για τον υπολογισμό του χρονικού ορίζοντα. Χρήση μιας πιο ‘έξυπνης’ μεθοδολογίας για τη χρήση των αποτελεσμάτων των αλγορίθμων αυτόματης εξαγωγής κανόνων αλλά και των αποτελεσμάτων λεξικογραφικής ομοιότητας. Διαπραγματεύσεις Ορισμός μιας μεθοδολογίας για τον υπολογισμό του tmax. Χρήση και άλλων κατανομών για την προσέγγιση της στρατηγικής των αντιπάλων. Χρήση μηχανισμών μάθησης ώστε δυναμικά να προσαρμόζονται οι membership functions στα ασαφή συστήματα.

Δημοσιεύσεις (accepted) (1/2)
Journals K. Kolomvatsos, and S. Hadjiefthymiades, ‘Product Relevance Factor Calculation for Buyer Agents Bargaining in Marketplaces’, to be published in Elsevier Electronic Commerce Research and Applications (ECRA), 2013. Kostas Kolomvatsos and Stathes Hadjiefthymiades, 'Buyer Behavior Adaptation Based on a Fuzzy Logic Controller and Prediction Techniques', Elsevier Fuzzy Sets and Systems (FSS), February 2012, pp K. Kolomvatsos, C. Anagnostopoulos, and S. Hadjiefthymiades, 'A Fuzzy Logic for Bargaining in Information Markets', ACM Transactions on Intelligent Systems and Technology (ACM TIST), February 2012, vol. 3(2), pp. art. No 32. Conferences G. Boulougaris, K. Kolomvatsos, and S. Hadjiefthymiades, 'Building the Knowledge Base of a Buyer Agent Using Reinforcement Learning Techniques', In Proc. of the 2010 IEEE World Congress on Computational Intelligence (WCCI 2010), IJCNN, July 18th - 23rd, Barcelona, Spain, pp R. Arapoglou, K. Kolomvatsos, and S. Hadjiefthymiades, 'Buyer Agent Decision Process Based on Automatic Fuzzy Rules Generation Methods', In Proc. of the 2010 IEEE World Congress on Computational Intelligence (WCCI 2010), FUZ-IEEE, July 18th - 23rd, Barcelona, Spain, pp Kostas Kolomvatsos and Stathes Hadjiefthymiades, 'Automatic Fuzzy Rules Generation for the Deadline Calculation of a Seller Agent', In Proc. of the 9th International Symposium on Autonomous Decentralized Systems (ISADS 2009), Athens, Greece, March 23-25, 2009, pp K. Kolomvatsos, C. Anagnostopoulos, and S. Hadjiefthymiades, 'On The Use of Fuzzy Logic in a Seller Bargaining Game', In Proc. of the 32nd Annual IEEE International Computer Software an Applications Conference (COMPSAC 2008), July 28th - August 1st, Turku, Finland, 2008, pp K. Kolomvatsos and S. Hadjiefthymiades, 'Implicit Deadline Calculation for Seller Agent Bargaining in Information Marketplaces', In Proc. of the 2nd International Conference on Cοmplex, Intelligent and Software Intensive Systems (CISIS 2008), March 4th - 7th, Polytechnic University of Catalonia, Barcelona, Spain, 2008, pp

Δημοσιεύσεις (accepted) (2/2)
Book Chapters Kostas Kolomvatsos and Stathes Hadjiefthymiades, 'On the Use of Fuzzy Logic in Electronic Marketplaces', in the book 'Cross Disciplinary Applications of Artificial Intelligence and Pattern Recognition: Advancing Technologies', ed. Vijay Mago, IGI Global, 2011. Kostas Kolomvatsos and Stathes Hadjiefthymiades, 'Defining Time Constraints for Sellers in Electronic Markets', in the 'Encyclopedia of E-Business Development and Management in the Global Economy', ed. In Lee, IGI Global, 2010. Kostas Kolomvatsos and Stathes Hadjiefthymiades, 'How Can We Trust Agents in Multi-Agent Environments?', Chapter in 'Intelligence Integration in Distributed Knowledge Management', eds D. Krol and N. T. Nguyen, IDEA Group Inc., 2008. Kostas Kolomvatsos and Stathes Hadjiefthymiades, 'Ontologies and Intelligent Agents: A Powerful Bond', Chapter in 'The Semantic Web for Knowledge and Data Management: Technologies and Practices', eds Z. Ma and H. Wang, IDEA Group Inc., 2008.

Δημοσιεύσεις (submitted)
Journals K. Kolomvatsos, C. Anagnostopoulos, and S. Hadjiefthymiades, ‘Fuzzy Logic – Based Reasoning in Buyer – Seller Bargaining Games’, submitted in Springer Journal on Electronic Commerce Research. K. Kolomvatsos, C. Anagnostopoulos and S. Hadjiefthymiades, ‘On the Use of Optimal Stopping Theory in Automated Negotiations’, submitted in IEEE Transactions of Systems, Man and Cybernetics – Part: Systems. K. Kolomvatsos and S. Hadjiefthymiades, ‘On the Use of Particle Swarm Optimization in Concurrent Negotiations’, submitted in ACM Transactions on Adaptive Systems and Technology (ACM TAAS).

Κωνσταντίνος Μ. Κολομβάτσος

Παρόμοιες παρουσιάσεις

Παρουσίαση με θέμα: "Κωνσταντίνος Μ. Κολομβάτσος"— Μεταγράφημα παρουσίασης:

Παρόμοιες παρουσιάσεις

Σχετικά με το έργο

Σχόλια

Είσοδος

Σύνδεση μέσω των κοινωνικών δικτύων:

Κωνσταντίνος Μ. Κολομβάτσος

Παρόμοιες παρουσιάσεις

Παρουσίαση με θέμα: "Κωνσταντίνος Μ. Κολομβάτσος"— Μεταγράφημα παρουσίασης:

Παρόμοιες παρουσιάσεις

Σχετικά με το έργο

Σχόλια