Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Θεωρία Παιγνίων και Εφαρμογές Θ. Κεχαγιάς Γενικό Τμήμα Πολυτεχνική Σχολή, ΑΠΘ.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Θεωρία Παιγνίων και Εφαρμογές Θ. Κεχαγιάς Γενικό Τμήμα Πολυτεχνική Σχολή, ΑΠΘ."— Μεταγράφημα παρουσίασης:

1 Θεωρία Παιγνίων και Εφαρμογές Θ. Κεχαγιάς Γενικό Τμήμα Πολυτεχνική Σχολή, ΑΠΘ

2 ΔΦ Live (3,3)(0,5) (5,0)(1,1) Μπλε Πράσινος C D C D

3 ΔΦ: Ανάλυση (3,3)(0,5) (5,0)(1,1) Μπλε Πράσινος C D C D Για τον Μπλέ: 3<5 και 0<1 άρα C

4 Το Αρχικό ΔΦ (2,2)(2,2)(5,0)(5,0) (0,5)(0,5)(4,4)(4,4) Μπλε Πράσινος C D C D Δύο ύποπτοι για ληστεία ανακρίνονται από την αστυνομία … Αν ομολογήσει μόνο ο ένας τον αφήνουν ελεύθερο ο άλλος τιμωρείται με 5 χρόνια φυλακή. Αν δεν ομολογήσει κανείς δεν μπορούν να αποδείξουν ότι έκαναν την ληστεία αλλά θα τους καταδικάσουν για παράνομη οπλοφορία, 2 χρόνια τον καθένα. Αν ομολογήσουν και οι δύο καταδικάζονται και οι δύο, σε 4 χρόνια φυλακή. Το Δίλημμα του Φυλακισμένου

5 Ένα Παίγνιο Διαφήμισης (3,3)(3,3)(0,5)(0,5) (5,0)(5,0)(2,2)(2,2) Μπλε Πράσινος C D C D Δύο εταιρείες πουλούν το ίδιο προϊόν, στην ίδια τιμή. Οι συνολικές πωλήσεις είναι 10 4 τεμάχια και αποφέρουν κέρδος 6· 10 4 Euro. Αν καμμία εταιρεία δεν κάνει διαφημιστική καμπάνια, οι αγοραστές μοιράζονται εξίσου μεταξύ των δύο. Αν μόνο η Πράσινη εταιρεία κάνει διαφημιστική καμπάνια όλοι οι αγοραστές θα προτιμήσουν το προϊόν της … αλλά η καμπάνια στοιχίζει 10 4 Euro. Αν και η Πράσινη και η Μπλε εταιρεία κάνει διαφημιστική καμπάνια, οι αγοραστές δεν θα αλλάξουν προμηθευτή.

6 Ένα Παίγνιο Τηλεπικοινωνιών (0,0)(0,0.9) (0.9,0)(-0.1,-0.1) Μπλε Πράσινος C D C D Τηλεπικοινωνίες (Channel Access) Δύο χρήστες θέλουν να στείλουν ο καθένας το δικό τους μήνυμα. Υπάρχει μόνο ένα διαθέσιμο κανάλι. Το κόστος αποστολής είναι 0.1 Euro. Αν μόνο ο Πράσινος στείλει το μήνυμα του, θα έχει κέρδος 1 Euro. Αν και ο Πράσινος και ο Μπλε στείλουν μήνυμα, το κανάλι θα μπλοκάρει και κανένα μήνυμα δεν θα περάσει.

7 Και Άλλα Παίγνια (1,1)(1,5) (5,1)(0,0) Μπλε Πράσινος C D C D (-1,-1)(-1,5) (5,-1)(-100,-100) Μπλε Πράσινος C D C D Η Μάχη των Φύλων Chicken

8 Παίγνια Μηδενικού Αθροίσματος (-2,2)(1,-1) (2,-2)(3,-3) Μπλε Πράσινος C D C D Μπλε Πράσινος C D C D

9 Παίγνια Μηδενικού Αθροίσματος Μπλε Πράσινος C D C D 1 1 Μπλε Πράσινος C D C D

10 Παίγνιο με Ν παίκτες

11 Το γενικό 2Χ2 Συμμετρικό Παίγνιο

12 Το γενικό MΧN Συμμετρικό Παίγνιο

13 Επαναλαμβανόμενο ΔΦ (3,3)(3,3)(0,5)(0,5) (5,0)(5,0)(1,1) Μπλε Πράσινος C D C D Εδώ είναι ο πίνακας για το παίγνιο που αποτελείται από δύο γύρους ΔΦ.

14 Θεωρία Παιγνίων Θεωρία Παιγνίων: Η μαθηματική θεωρία της σύγκρουσης και της συνεργασίας Ότι είναι η Θεωρία Πιθανοτήτων για τα παίγνια τύχης, είναι η Θεωρία Παιγνίων για τα στρατηγικά παίγνια

15 Θεωρία Παιγνίων Κεντρική Βελτιστοποίηση:Ενας «παίκτης» επιλέγει x 1, x 2 για να μεγιστοποιήσει την f(x 1, x 2 ) Κατανεμημένη Βελτιστοποίηση: Ο «παίκτης» 1 επιλέγει την x 1, για να μεγιστοποιήσει την f (x 1, x 2 ) και ο «παίκτης» 2 επιλέγει την x 2, για να μεγιστοποιήσει την f (x 1, x 2 ). Εγωιστική Βελτιστοποίηση: Ο «παίκτης» 1 επιλέγει την x 1, για να μεγιστοποιήσει την f 1 (x 1, x 2 ) και ο «παίκτης» 2 επιλέγει την x 2, για να μεγιστοποιήσει την f 2 (x 1, x 2 ).

16 Εφαρμογές της Θεωρίας Παιγνίων Οικονομία (καρτέλ, ολιγοπώλια, διαφημιστικές εκστρατείες) Κούρσα εξοπλισμών (π.χ. Ελλάδα-Τουρκία) Χρήση προηγμένων τεχνολογιών πληροφορικής (ΔΦ με Ν παίκτες, μεγάλο Ν). Linux vs. Windows C vs. Fortran Peer-To-Peer (να ανοίξω τον HD μου ή όχι?). Χρηματοδότηση έρευνας. Εκπαιδευτικές Εφαρμογές Κλέψιμο στις εξετάσεις. Πληθωρισμός βαθμών Κάθε περίπτωση στην οποία περισσότεροι του ενός παίκτες προσπαθούν να βελτιστοποιήσουν ο καθένας την δική του συνάρτηση κέρδους.

17 Διάφορα Παίγνια Φτηνές υπεραστικές κλήσεις μετά τις 23:00 και συμφόρηση γραμμών. Πότε να πάρω τηλέφωνο, πριν ή μετά τις 23:00? Pennypot: Δύο παίκτες εναλάσσονται, σε κάθε γύρο ο ένας εκ των δύο ή προσθέτει ένα ευρώ στην μπάνκα ή παίρνει όλα τα ευρώ. ΔΦ με ανταλλαγές αγαθών (Hofstadter 716) Γιατί στα στρατόπεδα συγκέντρωσης οι έγκλειστοι δεν επιτέθηκαν στου φρουρούς? Κανείς δεν θέλει να είναι στην πρώτη γραμμή σε μια διαδήλωση, αν όμως δεν σχηματιστεί πρώτη γραμμή δεν θα υπάρχει διαδήλωση. Κυκλοφοριακά: τήρηση/παραβίαση του κόκκινου, οδήγηση σε μια πλευρά του δρόμου. Γενικότερα: εγκαθίδρυση προτύπων, κανονισμών, (άγραφων) νόμων, ηθικής. Ειδικότερα: σταθεροποίηση γλώσσας. Παιχνίδια με μάθηση. Παιχνίδια με χωρική δομή.

18 Παίγνια Μηδενικού Αθροίσματος Μέγιστο ελάχιστο κέρδος του Α Ελάχιστη μέγιστη ζημία του Β Σαγματικό σημείο (saddle point)

19 Λύση Minimax με Καθαρές Στρατηγικές Παράδειγμα 1 (έχει Minimax λύση) Παράδειγμα 2 (ΔΕΝ έχει Minimax λύση)

20 Λύση Minimax με Μικτές Στρατηγικές Οι μικτές στρατηγικές είναι κατανομές πιθανοτήτων Το προσδοκώμενο κέρδος του Α είναι: Θεώρημα Minimax: Για κάθε παίγνιο μηδενικού αθροίσματος υπάρχουν p *,q * τ.ω. Η αξία του παιγνίου για τον Α ισούται με και επιτυγχάνεται όταν

21 Παράδειγμα με Μικτές Στρατηγικές Η αξία του παιγνίου για τον Α ισούται με =1/5=3/5 =17/5

22 Παίγνια Μη Μηδενικού Αθροίσματος: Ισορροπία Nash όπου: Κέρδος του παίκτη i στρατηγική του παίκτη i Η βέλτιστη απόκριση του παίκτη i στις στρατηγικές s -i είναι η στρατηγική s i η οποία ικανοποιεί: Σημείο ισορροπίας Nash : Ένα σύνολο αμοιβαία βέλτιστων αποκρίσεων Ένα παίγνιο μπορεί να έχει περισσότερα από ένα σημεία ισορροπίας Nash Μια στρατηγική είναι σημείο ισορροπίας Nash ανν για κάθε παίκτη i

23 Θεώρημα: Κάθε πεπερασμένο παίγνιο Ν παικτών έχει τουλάχιστον ένα σημείο ισορροπίας Nash (στον χώρο των μικτών στρατηγικών). Προσοχή: Ένα παίγνιο μπορεί να έχει περισσότερα από ένα σημεία ισορροπίας Nash

24 Παίγνια Μη Μηδενικού Αθροίσματος: Βελτιστότητα Pareto Μια στρατηγική s * είναι Pareto βέλτιστη ανν δεν υπάρχει στρατηγική s η οποία υπερέχει της s * κατά Pareto. Δηλ. ένα σημείο είναι Pareto βέλτιστο ανν κανείς παίκτης δεν μπορεί να βελτιώσει το κέρδος του χωρίς να ελαττώσει το κέρδος κάποιου άλλου παίκτη Μια στρατηγική s (1) υπερέχει κατά Pareto της s (2) ανν για κάθε παίκτη i

25 Εφαρμογή στο ΔΦ (3,3)(5,0)(5,0) (0,5)(0,5)(1,1) Μπλε Πράσινος C D C D Nash

26 Live: To Παίγνιο της Βαθμολόγησης

27 Βελτιστότητα στο Παίγνιο της Βαθμολόγησης (0, 0)(0, 1) (1, 0)(0, 0) Blue Green Δεν Θέλω Θέλω Δεν θέλω Θέλω Nash

28 Παίγνια σε Δίκτυα Ασύρματης Επικοινωνίας S1S1 S2S2 D1D1 D2D2

29 Το Δίλημμα της Προώθησης ? ? Blue Πράσινος (1-c, 1-c)(-c, 1) (1, -c)(0, 0) Μπλέ Πράσινος Forward Drop Forward Drop Το κόστος αποστολής είναι c, το κέρδος από επιτυχή μετάδοση είναι 1.

30 Το Δίλημμα της Προώθησης (1-c, 1-c)(-c, 1) (1, -c)(0, 0) Μπλέ Πράσινος Forward Drop Forward Drop Το αποτέλεσμα είναι η τραγωδία των βοσκοτόπων (Hardin, 1968) Η στρατηγική Drop επικρατεί της Forward, αν και η αμοιβαία Forward θα έδινα καλύτερο αποτέλεσμα.

31 Το Δίλημμα της Συνδυασμένης Προώθησης ? Μπλέ Πράσινος Πηγή Προορισμός ? Το κέρδος επιτυχούς μετάδοσης είναι 1 Το κόστος προώθησης είναι c (0 < c << 1) (1-c, 1-c)(-c, 0) (0, 0) Μπλέ Πράσινος Forward Drop Forward Drop Δεν υπάρχει επικρατούσα στρατηγική ….

32 Ισορροπία Nash (1-c, 1-c)(-c, 1) (1, -c)(0, 0) Μπλέ Πράσινος Forward Drop Forward Drop Το δίλημμα της προώθησης Το δίλημμα της συνδυασμένης προώθησης (1-c, 1-c)(-c, 0) (0, 0) Μπλέ Πράσινος Forward Drop Forward Drop

33 «Αποδοτικότητα» της Ισορροπίας Nash (1-c, 1-c)(-c, 0) (0, 0) Μπλέ Πράσινος Forward Drop Forward Drop Δύο σημεία Nash, το ένα είναι Pareto βέλτιστο …

34 Το Παιχνίδι Πολλαπλής Πρόσβασης (0, 0)(0, 1-c) (1-c, 0)(-c, -c) Μπλέ Πράσινος Quiet Transmit Quiet Transmit Time-division channel

35 Το Παιχνίδι Πολλαπλής Πρόσβασης p: Πιθανότητα να εκπέμψει ο Μπλε q: Πιθανότητα να εκπέμψει ο Πράσινος Σημείο Nash

36 Το Παιχνίδι Παρεμβολής Δεν υπάρχει σημείο Nash στις καθαρές στρατηγικές, αλλά το p=1/2, q=1/2 είναι σημείο Nash στις μικτές στρατηγικές Δύο κανάλια, C 1 και C 2 (-1, 1)(1, -1) (-1, 1) Μπλέ Πράσινος C1C1 C2C2 C1C1 C2C2 Πομπός Παρεμβολέας

37 Επανειλημμένη αλληλεπίδραση μεταξύ των παικτών Στρατηγική: προσδιορίζει την επόμενη κίνηση ως συνάρτηση των προηγούμενων Παίγνια πεπερασμένου ή άπειρου ορίζοντα Επαναλαμβανόμενα Παίγνια

38 Συνάρτηση Κέρδους σε Επαν. Παίγνια Μυωπική: Μακρόπνοη, πεπερασμένη: Ο συντελεστής απόσβεσης Μακρόπνοη, άπειρη: Μακρόπνοη, άπειρη, με απόσβεση:

39 Στρατηγικές σε Επαν. Παίγνια Συνήθως οι στρατηγικές εξαρτώνται από το προηγούμενο βήμα μόνο: –Την κίνηση του συμπαίκτη: –Την κίνηση του ίδιου του παίκτη: –Το κέρδος: Π.χ. στο Παίγνιο Προώθησης: Μπλε (t)Αρχική κίνηση FDΣτρατηγική Πράσινος (t+1) FFFAllC FFDTit-For-Tat (TFT) DDDAllD FDFAnti-TFT

40 Το Επαν. Παιχνίδι της Προώθησης (1-c, 1-c)(-c, 1) (1, -c)(0, 0) Μπλέ Πράσινος Forward Drop Forward Drop ? ? Μπλέ Πράσινος Κέρδος κάθε γύρου

41 Το Επαν. Παιχνίδι της Προώθησης Μπλε Στρατηγική Πρασινη Στρατηγική AllD TFT AllDAllC TFT Άπειρο παίγνιο με απόσβεση: Μπλε Κέρδος Πράσινο Κέρδος 00 1-c 1/(1-ω)-c/(1-ω) (1-c)/(1-ω)

42 Ανάλυση Το AllC έχει καλό κέρδος όταν παίζει με AllC και με TFT, αλλά το AllD εκμεταλλεύεται το AllC. Το AllD έχει μικρό κέρδος όταν παίζει με AllD. Το TFT πάει καλά με το AllC και με το AllD και εκδικείται το AllD Το TFT είναι η καλύτερη στρατηγική όταν το ω είναι κοντά στο 1! Μπλε Στρατηγική Πρασινη Στρατηγική AllD TFT AllDAllC TFT Μπλε Κέρδος Πράσινο Κέρδος 00 1-c 1/(1-ω)-c/(1-ω) (1-c)/(1-ω)

43 Ανάλυση Θεώρημα: Στο επαναλ. Παίγνιο προώθησης, το (AllD, AllD) είναι σημείο Nash. Θεώρημα: Στο επαναλ. Παίγνιο προώθησης, το (TFT, TFT) είναι σημείο Nash το οποίο είναι και Pareto βέλτιστο. Μπλε Στρατηγική Πρασινη Στρατηγική Μπλε Κέρδος Πράσινο Κέρδος AllD 00 TFT (1-c)/(1-ω)

44 Βιβλιογραφία 1.http://en.wikipedia.org/wiki/Game_theoryhttp://en.wikipedia.org/wiki/Game_theory 2.http://users.auth.gr/~kehagiat/GameTheory/index.htmlhttp://users.auth.gr/~kehagiat/GameTheory/index.html 3.J.D. Williams, The Compleat Strategyst, Γ. Βαρουφάκης, Θεωρία παιγνίων, R. Axelrod, The Evolution of Cooperation. 6.JW Weibull, Evolutionary game theory Μ. Felegyhazi + J.P. Hubaux, “Game Theory in Wireless Networks: a Tutorial”, IEEE, M Felegyhazi, M Cagalj, SS Bidokhti, “Noncooperative multi-radio channel allocation in wireless networks”, Proceedings of the IEEE, AB MacKenzie, SB Wicker. «Game theory and the design of self-configuring, adaptive wireless networks». IEEE Communications Magazine, Srivastava et al., “Using Game Theory to Analyze Wireless Ad Hoc Networks”, H.Tembine, E Altman, R El-Azouzi. “Multiple access game in ad-hoc network”, G Thamilarasu, R Sridhar, “Game Theoretic Modeling of Jamming Attacks in Ad hoc Networks”, Y Xiao, X Shan, Y Ren. «Game theory models for IEEE DCF in wireless ad hoc networks», IEEE Communications Magazine, 2005.


Κατέβασμα ppt "Θεωρία Παιγνίων και Εφαρμογές Θ. Κεχαγιάς Γενικό Τμήμα Πολυτεχνική Σχολή, ΑΠΘ."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google