Κατέβασμα παρουσίασης
Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε
1
Θεωρία Παιγνίων
2
Τι είναι η Θεωρία Παιγνίων;
Η ανάλυση ανταγωνιστικών (ή συγκρουσιακών) καταστάσεων με χρήση μαθηματικών μοντέλων Το πώς παίζεται το παίγνιο εξαρτάται από τη στρατηγική σχέδιο δράσης που καθορίζεται πριν ξεκινήσει το παίγνιο Μια λύση για το παίγνιο είναι η υιοθέτηση μιας στρατηγικής που δίνει συγκεκριμένο αποτέλεσμα Λύση σε περιβαλλοντικά προβλήματα λύση σε εξίσωση
3
Αντικείμενο της Θεωρίας Παιγνίων
Μελέτη της διαδικασίας λήψης αποφάσεων Ενασχόληση με τις επιλογές και τις στρατηγικές και όχι απαραίτητα με «βέλτιστες» λύσεις Αναζητά απαντήσεις στις ερωτήσεις: Ποιες στρατηγικές υπάρχουν; Ποια είδη λύσεων υπάρχουν; Π.χ., Σκάκι, οικονομικά-αγορές, πολιτική, εκλογές, οικογενειακές σχέσεις, κτλ
4
Θεωρία Παιγνίων Μελέτη του πώς τα άτομα αλληλεπιδρούν και λαμβάνουν αποφάσεις Μελέτη του πώς τα άτομα συμπεριφέρονται σε στρατηγικές καταστάσεις Στρατηγικές αποφάσεις: για να αποφασίσει κάθε άτομο τι να κάνει λαμβάνει υπόψη την ενδεχόμενη αντίδραση των άλλων ατόμων
5
Θεωρία Παιγνίων Αυτός ο ευρύς ορισμός ταιριάζει για την πλειοψηφία των κοινωνικών επιστημών, αλλά η θεωρία παιγνίων εφαρμόζει μαθηματικά μοντέλα σε αυτή την αλληλεπίδραση με την υπόθεση ότι η συμπεριφορά κάθε ατόμου επηρεάζει τα άλλα άτομα που συμμετέχουν στο παίγνιο Τα μοντέλα αυτά είναι συνήθως απλουστευμένες αφαιρέσεις αλληλεπιδράσεων του πραγματικού κόσμου
6
Η Θεωρία Παιγνίων βρίσκει εφαρμογή σε πολλά επιστημονικά πεδία
Economics Mathematics Psychology Ψυχολογία Μαθηματικά Θεωρία Παιγνίων Οικονομικά 6
7
Θεωρία παιγνίων: διαίσθηση
Αν η αγορά αποτελείται από μικρό αριθμό επιχειρήσεων, κάθε επιχείρηση πρέπει να ενεργεί στρατηγικά Κάθε επιχείρηση επηρεάζει τις τιμές αλλάζοντας την ποσότητα που παράγεται Έστω 2 επιχειρήσεις που η κάθε μία παράγει 100 μονάδες Αν μία από αυτές αποφασίσει να αυξήσει την παραγωγή κατά 10 μονάδες Θα υπάρξει αύξηση στην αγορά από 200 σε 210 μονάδες και η τιμή πρέπει να μειωθεί για να υπάρξει ισορροπία Επομένως, η απόφαση της επιχείρησης επηρεάζει το κέρδος και των άλλων επιχειρήσεων Κάθε επιχείρηση γνωρίζει ότι το κέρδος της εξαρτάται όχι μόνο από το πόσο παράγει η ίδια αλλά και από το πόσο παράγουν οι άλλες επιχειρήσεις
8
Τι είναι Παίγνιο; Κατάσταση στην οποία τα οφέλη των συμμετεχόντων (παικτών) εξαρτώνται όχι μόνο από τις δικές τους αποφάσεις αλλά και από τις αποφάσεις των αντιπάλων τους Εξελίσσεται μέσω στρατηγικών αλληλεπιδράσεων των παικτών: Οι βέλτιστες αποφάσεις ενός παίκτη εξαρτώνται από τις αποφάσεις των άλλων παικτών
9
Θεωρία Παιγνίων: εξέλιξη
Έννοιες της θεωρίας παιγνίων πρωτοεμφανίστηκαν χιλιάδες χρόνια πριν Τέχνη του Πολέμου του Sun Tzu (6ος αιώνας π.Χ.) Talmud (400 μ.Χ.) Η διατύπωση της σύγχρονης εκδοχής της θεωρία παιγνίων αποδίδεται στους John von Neumann και Oskar Morgenstern Theory of Games and Economic Behavior, Princeton University Press, 1944 Ο John Nash (“A Beautiful Mind”) θεμελίωσε τη σύγχρονη θεωρία παιγνίων
10
Θεωρία Παιγνίων: εξέλιξη
Ταλμούδ ογκώδης εξωβιβλική συλλογή εβραϊκών κειμένων και περιλαμβάνει όχι μόνο κείμενα που αφορούν την ερμηνεία του μωσαϊκού Νόμου αλλά και ποικίλο άλλο υλικό, νομικό, θεολογικό, ηθικό, επιστημονικό, ιστορικό, λαογραφικό,… Robert J. Aumann. Game Theory in the Talmud. Research Bulletin Series On Jewish Law and Economics, 2003. Aumann έλαβε το 2005 Βραβείο Nobel στα Οικονομικά
11
Θεωρία Παιγνίων: εξέλιξη
Η Τέχνη του Πολέμου κινεζική στρατιωτική πραγματεία που γράφτηκε κατά τη διάρκεια του 6ου αιώνα π.Χ. από τον Σουν Τσου (544 π.Χ π.Χ.) αποτελείται από 13 κεφάλαια, καθένα από τα οποία καταπιάνεται με μια πτυχή του πολέμου, έχει χαρακτηριστεί ως καθοριστικό έργο για τις στρατιωτικές στρατηγικές και τακτικές της εποχής του από τα αρχαιότερα βιβλία στρατιωτικής στρατηγικής στον κόσμο από τα πιο επιτυχημένα έργα για τη στρατηγική και άσκησε τεράστια επιρροή στην Ανατολική και Δυτική στρατιωτική σκέψη, σε επιχειρηματικές και διευθυντικές στρατηγικές και σε άλλους τομείς Emerson M. S. Niou (Department of Political Science, Duke University), Peter C. Ordeshook (Division of Social Sciences, California Institute of Technology). A Game-Theoretic Interpretation of Sun Tzu's: The Art of War. Journal of Peace Research, vol. 31, no 2, pp , 1994.
12
Θεωρία παιγνίων και πραγματικός κόσμος
Οικονομικά Καινοτόμες αντιμονοπωλιακές πολιτικές Δημοπρασίες αδειών ραδιοφάσματος Τοποθέτηση εκπαιδευόμενων γιατρών σε νοσοκομεία Επιστήμη Υπολογιστών Νέοι αλγόριθμοι και πρωτόκολλα δρομολόγησης Τεχνητή Νοημοσύνη Στρατιωτική στρατηγική Πολιτική για την πυρηνική ενέργεια και στρατηγική αποτροπή Προπονητική, Αθλητισμός Τακτική παικτών σε αγώνα Βιολογία Ποια είδη έχουν τη μεγαλύτερη πιθανότητα εξαφάνισης
13
Ενδιαφέροντα παίγνια Για εμάς ενδιαφέρον παρουσιάζουν παίγνια όπου:
Υπάρχουν 2 ή περισσότεροι παίκτες Υπάρχει επιλογή δράσεων στην οποία μετράει η στρατηγική Το παιχνίδι έχει μία ή περισσότερες δυνατές εκβάσεις, π.χ., κάποιος κερδίζει, κάποιος χάνει Η έκβαση του παιχνιδιού εξαρτάται από τις στρατηγικές που επιλέγουν οι παίκτες, δηλ., υπάρχει στρατηγική αλληλεπίδραση Ποια παιχνίδια δεν έχουν ενδιαφέρον; Αμιγώς τυχερά παίγνια, π.χ., λοταρίες (σε αυτά δε μετράει η στρατηγική) Παιχνίδια χωρίς στρατηγική αλληλεπίδραση μεταξύ των παικτών, π.χ., πασιέντζα (solitaire)
14
5 στοιχεία ενός παιγνίου
Παίκτες Πόσοι παίκτες υπάρχουν; Παίζει ρόλο η φύση/τύχη; Πλήρης περιγραφή του τι μπορούν να κάνουν οι παίκτες – το σύνολο όλων των πιθανών ενεργειών Η πληροφορία που έχουν στη διάθεσή τους οι παίκτες όταν επιλέγουν τις ενέργειές τους Μια περιγραφή του οφέλους για κάθε παίκτη για κάθε συνδυασμό ενεργειών που επέλεξαν όλοι οι παίκτες που συμμετέχουν στο παιχνίδι Μια περιγραφή των προτιμήσεων όλων των παικτών στα οφέλη
15
Το Δίλημμα του Κρατουμένου (The Prisoners' Dilemma Game)
2 παίκτες, οι κρατούμενοι 1, 2 Κάθε κρατούμενος διαθέτει 2 πιθανές ενέργειες Κρατούμενος 1: Δεν ομολογεί, Ομολογεί Κρατούμενος 2: Δεν ομολογεί, Ομολογεί Οι παίκτες επιλέγουν ενέργεια ταυτόχρονα χωρίς να γνωρίζουν την επιλογή του άλλου παίκτη Το όφελος ποσοτικοποιείται σε έτη φυλάκισης Αν κανένας δεν ομολογήσει, κάθε κρατούμενος καταδικάζεται σε 1 έτος φυλάκισης Αν και οι δύο ομολογήσουν, κάθε κρατούμενος καταδικάζεται σε 5 έτη φυλάκισης Αν μόνο ένας ομολογήσει, αυτός απελευθερώνεται και ο άλλος κρατούμενος καταδικάζεται σε 15 έτη φυλάκισης Λιγότερα έτη φυλάκισης = μεγαλύτερη ικανοποίηση μεγαλύτερο όφελος Στον πίνακα που ακολουθεί, αναφέρεται πρώτα το όφελος του Κρατουμένου 1 και μετά το όφελος του Κρατουμένου 2
16
Το Δίλημμα του Κρατουμένου σε “Κανονική” ή “Στρατηγική” Μορφή
Μη ομολογία Ομολογία 1,1 15,0 0,15 5,5
17
Το Δίλημμα του Κρατουμένου σε “Εκτεταμένη” Μορφή
Η γραμμή αυτή σημαίνει περιορισμό για την πληροφορία που έχει στη διάθεσή του ο Κρατούμενος 2: παίζει δεύτερος αλλά δεν ξέρει τι επέλεξε ο Κρατούμενος 1 Κρατούμενος 1 Μη ομολογία Ομολογία Κρατούμενος 2 Κρατούμενος 2 Μη ομολογία Μη ομολογία Ομολογία Ομολογία 1,0 15,0 5,5 0,15
18
Δίλημμα του Κρατουμένου: παράδειγμα παιγνίου Μη Μηδενικού Αθροίσματος
Σε ένα παίγνιο μηδενικού αθροίσματος, τα συμφέροντα των παικτών είναι αντικρουόμενα π.χ., στο ποδόσφαιρο, μία ομάδα κερδίζει και η άλλη χάνει: τα οφέλη αθροίζουν σε 0 Σε ένα παίγνιο μη μηδενικού αθροίσματος, τα συμφέροντα των παικτών δεν είναι πάντα αντικρουόμενα, οπότε υπάρχουν περιπτώσεις που μπορούν να κερδίσουν και οι δύο παίκτες π.χ., όταν και οι δύο παίκτες «παίζουν» Μη Ομολογία στο Δίλημμα του Κρατουμένου
19
Δίλημμα του Κρατουμένου: συμπέρασμα
Δίλημμα του Κρατουμένου: συμπέρασμα “Half a game-theory paradox, half a behavioral metaphor, the prisoner's dilemma has become a central model for psychologists, political scientists, biologists and economists trying to understand the dynamics of competition and - more important - cooperation.” “The most fertile legacy of Dr. Axelrod's original tournaments was the discovery of what is, in almost all circumstances, the best strategy for playing the prisoner's dilemma. It is called ''Tit for Tat,'' and it can be summed up this way: Do unto your opponent as he has just done unto you.” Marketing strategies – if two rival companies both offer small discounts then they may receive many customers and retain a good market share. What if they offer huge discounts?
20
Δίλημμα του Κρατουμένου: εφαρμογές σε άλλους τομείς
Δίλημμα του Κρατουμένου: εφαρμογές σε άλλους τομείς Ανάπτυξη πυρηνικού οπλοστασίου κρατών Επίλυση Διαφορών και η απόφαση να προσληφθεί δικηγόρος Διαφθορά / πολιτικές συνεισφορές μεταξύ εργοληπτών και πολιτικών Στρατηγικές marketing … Marketing strategies – if two rival companies both offer small discounts then they may receive many customers and retain a good market share. What if they offer huge discounts?
21
Ταυτόχρονες vs Ακολουθιακές κινήσεις στο παιχνίδι
Όταν οι παίκτες παίζουν ταυτόχρονα έχουμε παίγνια ταυτόχρονων κινήσεων Π.χ.: Δίλημμα του Κρατουμένου, Δημοπρασίες με σφραγισμένες προσφορές Πρέπει να προβλέψουμε τι θα κάνει ο αντίπαλος γνωρίζοντας ότι και αυτός σκέφτεται με τον ίδιο τρόπο Όταν οι παίκτες παίζουν με συγκεκριμένη σειρά έχουμε παίγνια ακολουθιακών κινήσεων Π.χ.: Σκάκι, Διαπραγματεύσεις Πρέπει να κοιτάμε μπροστά για να αποφασίσουμε πώς θα παίξουμε τώρα Πολλές στρατηγικές καταστάσεις περιλαμβάνουν και ακολουθιακές και ταυτόχρονες κινήσεις
22
Παιχνίδια ενός γύρου vs Επαναλαμβανόμενα Παιχνίδια
Παιχνίδια ενός γύρου: το παιχνίδι παίζεται μια φορά και συνήθως οι παίκτες δεν γνωρίζονται Π.χ., φιλοδωρήματα σε διακοπές Επαναλαμβανόμενα παιχνίδια: το παιχνίδι παίζεται πολλές φορές μεταξύ των ίδιων παικτών Παιχνίδια που επαναλαμβάνονται επ’ άπειρον ή για πεπερασμένο πλήθος φορών Μετράει η φήμη: ανακύπτουν ευκαιρίες για συνεργατική συμπεριφορά ΠΡΟΣΟΧΗ: Αν σκοπεύουμε να ακολουθήσουμε επιθετική στρατηγική, πρέπει να αναρωτηθούμε αν το παιχνίδι παίζεται μόνο μία φορά ή επαναλαμβάνεται Αν επαναλαμβάνεται, ΠΡΟΣΟΧΗ: ξανασκεφτόμαστε…!!
23
Στρατηγικές Η στρατηγική είναι ένα “ολοκληρωμένο σχέδιο δράσης”, ένας κανόνας λήψης αποφάσεων ή σύνολο οδηγιών για το ποιες ενέργειες πρέπει να κάνει ένας παίκτης με βάση το μέχρι ιστορικό του παιχνιδιού Φανταστείτε τη στρατηγική σαν «χαρτάκι με οδηγίες» που αφήνουμε όταν φεύγουμε για διακοπές όπου καθορίζουμε το τι θέλουμε να γίνει σε κάθε κατάσταση που μπορεί να προκύψει όσο απουσιάζουμε Οι στρατηγικές εξαρτώνται από το αν το παιχνίδι παίζεται μία ή πολλές φορές Παράδειγμα στρατηγικών για παιχνίδι ενός γύρου Δίλημμα του Κρατουμένου: Μη Ομολογία, Ομολογία Πώς αλλάζουν οι στρατηγικές όταν το παιχνίδι επαναλαμβάνεται;
24
Στρατηγικές σε επαναλαμβανόμενα παίγνια
Σε επαναλαμβανόμενα παίγνια, η ακολουθιακή φύση της σχέσης επιτρέπει την υιοθέτηση στρατηγικών συναρτήσει των ενεργειών που επιλέχθηκαν σε προηγούμενους γύρους του παιχνιδιού Οι περισσότερες εξαρτημένες στρατηγικές καλούνται στρατηγικές «ενεργοποίησης» Π.χ., στο Δίλημμα του Κρατουμένου αρχικά παίζουμε Μη Ομολογία αν ο αντίπαλος παίξει Ομολογία τότε στον επόμενο γύρο παίζουμε κι εμείς Ομολογία αν ο αντίπαλος παίξει Μη Ομολογία τότε στον επόμενο γύρο παίζουμε κι εμείς Μη Ομολογία Η στρατηγική αυτή είναι γνωστή ως «ανταποδοτική» ή «οφθαλμόν αντί οφθαλμού»
25
Πληροφόρηση Οι παίκτες έχουν πλήρη πληροφόρηση αν γνωρίζουν ακριβώς τι έχει συμβεί κάθε φορά που πρέπει να ληφθεί απόφαση, π.χ., στο σκάκι Αλλιώς, έχουν ημιτελή πληροφόρηση Π.χ.: Σε ένα επαναλαμβανόμενο παιχνίδι επενδύσεων, ο αποστολές και ο παραλήπτης μπορεί να έχουν διαφορετική πληροφόρηση για το αποτέλεσμα της επένδυσης Ο αποδέκτης μπορεί να γνωρίζει ότι το ποσό της επένδυσης πάντα τριπλασιάζεται, αλλά ο αποστολέας μπορεί να μην το γνωρίζει
26
Πληροφόρηση Τα οφέλη είναι γνωστά και καθορισμένα (δεν υπάρχει ρίσκο)
Η υπόθεση μπορεί να τροποποιηθεί ώστε να ληφθεί υπόψη και ενδεχόμενο ρίσκο Οι παίκτες συμπεριφέρονται ορθολογικά Αντιλαμβάνονται και επιδιώκουν να μεγιστοποιήσουν το όφελός τους Δεν κάνουν λάθη όταν υπολογίζουν ποιες ενέργειες θα μεγιστοποιήσουν το όφελός τους Οι κανόνες του παιχνιδιού είναι κοινή γνώση Κάθε παίκτης γνωρίζει το σύνολο των παικτών, τις στρατηγικές και τα οφέλη από όλους τους δυνατούς συνδυασμούς στρατηγικών: καλούμε αυτή την πληροφορία “X” Κάθε παίκτης γνωρίζει ότι όλοι οι παίκτες γνωρίζουν το X, ότι όλοι οι παίκτες γνωρίζουν ότι όλοι οι παίκτες γνωρίζουν το X, ότι όλοι οι παίκτες γνωρίζουν … επ’ άπειρον
27
Ισορροπία Η αλληλεπίδραση των στρατηγικών όλων των (ορθολογικών) παικτών καταλήγει σε ένα αποτέλεσμα που καλείται “ισορροπία” Στην ισορροπία, κάθε παίκτης παίζει τη στρατηγική που συνιστά “βέλτιστη απόκριση” στις στρατηγικές των άλλων παικτών Κανείς δεν έχει κίνητρο να αλλάξει τη στρατηγική του μονομερώς δεδομένων των στρατηγικών επιλογών των άλλων παικτών Η ισορροπία δεν είναι: Η καλύτερη δυνατή έκβαση Η ισορροπία στο Δίλημμα του Κρατουμένου που παίζεται μία φορά επιτυγχάνεται όταν και οι δύο κρατούμενοι παίξουν Ομολογία Κατάσταση στην οποία οι παίκτες επιλέγουν πάντα την ίδια ενέργεια Μερικές φορές η ισορροπία προϋποθέτει αλλαγή ενεργειών (και καλείται ισορροπία μικτής στρατηγικής)
28
Παραδείγματα Πέτρα-Χαρτί-Ψαλίδι QUAAK: Δίλημμα του Κρατουμένου:
QUAAK: Δίλημμα του Κρατουμένου:
29
Παράδειγμα: Deal 3 κλειστές πόρτες Ο παίκτης διαλέγει μία πόρτα
3 κλειστές πόρτες Πίσω από 1 πόρτα υπάρχει ένα καταπληκτικό δώρο Πίσω από 2 πόρτες υπάρχει ένα κατσικάκι Ο παίκτης διαλέγει μία πόρτα Ο οικοδεσπότης που γνωρίζει που είναι το δώρο ανοίγει μία από τις πόρτες που δεν επέλεξε ο παίκτης και εμφανίζει το κατσικάκι Μετά ρωτάει τον παίκτη αν θέλει να αλλάξει την επιλογή του Τι πρέπει να κάνει ο παίκτης;
30
Πιθανότητα Στις μικτές στρατηγικές, χρησιμοποιούμε πιθανότητα
Μετράει πόσο πιθανό είναι να πραγματοποιηθούν συγκεκριμένα ενδεχόμενα Πιθανότητα μια ζαριά να είναι 1 Πιθανότητα 2 τυχαία επιλεγμένα χαρτιά να έχουν άθροισμα 31
31
Διαγράμματα Venn http://www.stat.berkeley.edu/~stark/Java/Venn.htm
Πιθανότητα να συμβεί το ενδεχόμενο A δεδομένου ότι έχει συμβεί το ενδεχόμενο B Πιθανότητα να συμβεί και το A και το B Πιθανότητα να συμβεί το A ή το B Πιθανότητα με μία προσπάθεια να τραβήξουμε είτε ρήγα είτε σπαθί από μια τράπουλα με 52 φύλλα Αφού υπάρχουν 4 ρήγες και 13 σπαθιά στην τράπουλα, αλλά 1 φύλλο είναι ρήγας σπαθί: = 4/ /52 - 1/52 = 16/52
32
Πιθανότητες: παραδείγματα
Ρίχνουμε 2 ζάρια Υπάρχουν 6x6 = 36 πιθανά αποτελέσματα Ποια η πιθανότητα και τα 2 ζάρια να φέρουν το ίδιο νούμερο (Α); A={{1,1},{2,2},{3,3},{4,4},{5,5},6,6}} P(A) = 6/36 = 1/6 Ποια η πιθανότητα τα νούμερα που θα φέρουν τα 2 ζάρια να αθροίζουν σε 8 (Β); B = {{2,6},{3,5},{4,4},{5,3},{6,2}} P(B) = 5/36 Ποια η πιθανότητα να συμβεί ένα από τα A ή B; Συμβαίνουν και το Α και το Β όταν η ζαριά είναι {4,4} = 6/36 + 5/36 - 1/36 = 10/36
33
Ο κανόνας του Bayes (Μπέις)
Πώς να χρησιμοποιούμε νέα στοιχεία για να προσαρμόζουμε τις πεποιθήσεις μας Υποθέστε ότι ένας έλεγχος για χρήση ουσιών είναι 95% αποδοτικός (5 % λάθος θετικό, 5% λάθος αρνητικό) 5 % του πληθυσμού κάνει χρήση ουσιών Ο έλεγχος προκύπτει θετικός για κάποιο άτομο Ποια είναι η πιθανότητα το άτομο αυτό να κάνει πράγματι χρήση ουσιών; Α: θετικός έλεγχος Β: το άτομο είναι χρήστης ουσιών P(B|A) = P(A|B)P(B)/[P(A|B)P(B)+P(A|Bc)P(Bc)]= (0.95)(0.05)/(0.95)(0.05)+(0.05)(0.95)=0.50
34
Επιστροφή στο Deal Wi: το δώρο είναι πίσω από την πόρτα i
P(W1)=P(W2)=P(W3)=1/3 G: ο οικοδεσπότης επιλέγει κατσικάκι P(G)=1, P(G|Wi)=1 Έστω ότι ο παίκτης επιλέγει την πόρτα 1 και ο οικοδεσπότης ανοίγει την πόρτα 3 P(W2) ή P(W3) = 2/3, P(W3)=0 P(W2)=2/3 Κανόνας του Bayes: P(W1|G)=1/3, P(W2|G)=2/3 Επομένως, ο παίκτης πρέπει να αλλάξει επιλογή!
35
Επιστροφή στο Deal Έστω W(w,x,y,z) η περιγραφή του παιγνίου
Πολιτική σταθερής αλλαγής αρχικής επιλογής (το δώρο είναι πίσω από την πόρτα #1): S=[(1,2,3,L),(1,3,2,L),(2,3,1,W),(3,2,1,W)] Αφού αρχικά ο παίκτης επιλέγει στο 1/3 των περιπτώσεων την πόρτα #2 και στο 1/3 των περιπτώσεων την πόρτα #3, κερδίζει με πιθανότητα 1/3+1/3=2/3 Επομένως αλλάζει επιλογή! Δείτε και μόνοι σας:
36
Παίγνιο Κορώνα-Γράμματα (Matching pennies)
Κάθε παίκτης διαλέγει μία όψη ενός νομίσματος Αν οι επιλογές είναι οι ίδιες ο παίκτης 1 κερδίζει και παίρνει 1 ευρώ από τον παίκτη 2 Αν οι επιλογές είναι διαφορετικές ο παίκτης 2 κερδίζει και παίρνει 1 ευρώ από τον παίκτη 1
37
Matching Pennies: αναπαράσταση με πίνακα
Παίκτης 2 Κορώνα Γράμματα Παίκτης 1 1,-1 -1,1
38
Το παίγνιο Boeing-Airbus
Οι εταιρείες Boeing και Airbus πρέπει να αποφασίσουν αν θα επενδύσουν στην κατασκευή ενός Super Jumbo για ταξίδια μεγάλων αποστάσεων Αν και οι 2 κατασκευάσουν επιτυχώς το νέο μοντέλο, τα κέρδη τους θα μειωθούν κατά 50 εκατομμύρια/έτος Αν μόνο 1 κατασκευάσει το Super Jumbo, θα έχει επιπλέον κέρδη 80 εκατομμύρια/έτος ενώ τα κέρδη της άλλης εταιρείας θα μειωθούν κατά 30 εκατομμύρια/έτος Αν καμία εταιρεία δεν προχωρήσει στην κατασκευή όλα μένουν ως έχουν
39
Boeing-Airbus: αναπαράσταση με πίνακα
Κατασκευή ΟΧΙ κατασκευή Boeing -50,-50 80,-30 -30,80 0,0
40
Έκβαση του παιγνίου Για να προβλέψουμε ποια θα είναι η λύση/έκβαση του παιγνίου χρειαζόμαστε εργαλεία: Κυρίαρχες και κυριαρχούμενες στρατηγικές Ισορροπία Nash
41
Δίλημμα του Κρατουμένου
2 άτομα συλλαμβάνονται για κατοχή όπλων. Η αστυνομία υποπτεύεται ότι έχουν διαπράξει 10 ληστείες τραπεζών Αν κανείς δεν ομολογήσει, φυλακίζονται και τα δύο άτομα για 2 χρόνια Αν μόνο ένα άτομο ομολογήσει αυτό αφήνεται ελεύθερο και το άλλο άτομο φυλακίζεται για 40 χρόνια Αν και τα δύο άτομο ομολογήσουν φυλακίζονται για 16 χρόνια
42
Δίλημμα του Κρατουμένου: αναπαράσταση με πίνακα
Bonnie Ομολογεί ΔΕΝ ομολογεί Clyde 16,16 0,40 40,0 2,2
43
Πρόβλεψη για την έκβαση του παιγνίου
Υποθέτουμε ότι ο Clyde αποφασίζει να ομολογήσει. Ποια είναι η πιο συμφέρουσα απόφαση για τη Bonnie;
44
Πρόβλεψη για την έκβαση του παιγνίου
Υποθέτουμε ότι ο Clyde αποφασίζει να μην ομολογήσει. Ποια είναι η πιο συμφέρουσα απόφαση για τη Bonnie;
45
Κυρίαρχη και κυριαρχούμενη στρατηγική
Κυρίαρχη στρατηγική: Στρατηγική που δίνει μεγαλύτερο όφελος ανεξάρτητα από το τι κάνει ο αντίπαλος Κυριαρχούμενη στρατηγική: Υπάρχει άλλη στρατηγική που είναι κυρίαρχη Μέχρι τώρα για να προβλέψουμε την έκβαση του παιγνίου έχουμε υποθέσει μόνο ότι κάθε παίκτης είναι ορθολογικός Νοιάζεται για το δικό του συμφέρον χωρίς να τον ενδιαφέρει ο αντίκτυπος των ενεργειών του στον αντίπαλο
46
Πρόβλεψη για την έκβαση του παιγνίου
Υποθέτουμε ότι η Bonnie αποφασίζει να ομολογήσει. Ποια είναι η πιο συμφέρουσα απόφαση για τον Clyde ;
47
Πρόβλεψη για την έκβαση του παιγνίου
Υποθέτουμε ότι η Bonnie αποφασίζει να μην ομολογήσει. Ποια είναι η πιο συμφέρουσα απόφαση για τον Clyde ;
48
Έκβαση του παιγνίου
49
Τροποποιημένο Δίλημμα του Κρατουμένου: Ο Clyde είναι περήφανος που δεν ομολογεί
Bonnie Ομολογεί ΔΕΝ ομολογεί Clyde 16,16 0,40 36,0 -2,2
50
Πρόβλεψη για την έκβαση του παιγνίου
Υποθέτουμε ότι η Bonnie αποφασίζει να ομολογήσει. Ποια είναι η πιο συμφέρουσα απόφαση για τον Clyde ;
51
Πρόβλεψη για την έκβαση του παιγνίου
Υποθέτουμε ότι η Bonnie αποφασίζει να μην ομολογήσει. Ποια είναι η πιο συμφέρουσα απόφαση για τον Clyde ;
52
Κυρίαρχη και κυριαρχούμενη στρατηγική
Πλέον, δεν υπάρχει κυρίαρχη στρατηγική για τον Clyde Αλλά για τη Bonnie η ομολογία συνεχίζει να αποτελεί κυρίαρχη στρατηγική Υποθέτουμε ότι ο Clyde γνωρίζει πως η Bonnie είναι ορθολογική και θα επιλέξει να ομολογήσει Εφόσον ο Clyde γνωρίζει ότι η Bonnie θα επιλέξει να ομολογήσει, μπορούμε να καθορίσουμε την έκβαση του παιγνίου;
53
Πρόβλεψη για την έκβαση του παιγνίου
Η Bonnie θα αποφασίσει να ομολογήσει γιατί αυτή είναι κυρίαρχη στρατηγική για αυτήν. Ποια είναι η πιο συμφέρουσα απόφαση για τον Clyde ;
54
Έκβαση του παιγνίου
55
Ανυπαρξία κυρίαρχων στρατηγικών
Στα περισσότερα παίγνια δεν υπάρχουν κυρίαρχες στρατηγικές για όλους τους παίκτες Δε μπορούμε να χρησιμοποιήσουμε τη μέθοδο αυτή για πρόβλεψη της έκβασης του παιγνίου Παίκτης 2 L C R Παίκτης 1 T 0,7 7,0 5,3 M B 3,5 6,6
56
Ισορροπία Nash Οι αποφάσεις των παικτών συνιστούν ισορροπία Nash (Nash Equilibrium) αν κανένα άτομο δεν επιθυμεί να αλλάξει μονομερώς την επιλογή του Ή Κάθε παίκτης επιλέγει τη βέλτιστη στρατηγική δεδομένων των στρατηγικών που επιλέγουν οι άλλοι παίκτες
57
Ο John Nash, το άτομο που παρουσιάζεται στην ταινία “A Beautiful Mind”
58
John Nash Από τους πρώτους ερευνητές στη θεωρία παιγνίων
Η δουλειά του κατέληξε σε ένα είδος ισορροπίας που πήρε το όνομά του
59
Βασικά στοιχεία ενός παιγνίου
Παίκτες Δύο ή περισσότεροι για ενδιαφέροντα παίγνια Στρατηγικές διαθέσιμες σε κάθε παίκτη Οφέλη (Payoffs) Που βασίζονται στις αποφάσεις του παίκτη και στις αποφάσεις των άλλων παικτών
60
Πίνακας οφέλους Ο πίνακας οφέλους δείχνει το όφελος κάθε παίκτη ανάλογα με την ενέργεια που αποφασίζει να ακολουθήσει Παίκτης 2 Ενέργεια C Ενέργεια D Ενέργεια A 10, 2 8, 3 Ενέργεια B 12, 4 10, 1 Παίκτης 1
61
Πώς διαβάζουμε τον πίνακα οφέλους
Ο πρώτος αριθμός σε κάθε κελί καθορίζει το όφελος του Παίκτη 1 Ο δεύτερος αριθμός σε κάθε κελί καθορίζει το όφελος του Παίκτη 2 Παίκτης 2 Ενέργεια C Ενέργεια D Ενέργεια A 10, 2 8, 3 Ενέργεια B 12, 4 10, 1 Παίκτης 1
62
Πώς διαβάζουμε τον πίνακα οφέλους: παράδειγμα
Αν ο Παίκτης 1 επιλέξει την Ενέργεια A και ο Παίκτης 2 επιλέξει την Ενέργεια D, τότε ο Παίκτης 1 λαμβάνει όφελος 8 και ο Παίκτης 2 λαμβάνει όφελος 3 Παίκτης 2 Ενέργεια C Ενέργεια D Ενέργεια A 10, 2 8, 3 Ενέργεια B 12, 4 10, 1 Παίκτης 1
63
Ισορροπία Το είδος της ισορροπίας που μας ενδιαφέρει καλείται ισορροπία Nash (Nash equilibrium) Ισορροπία Nash: “Κάθε συνδυασμός στρατηγικών στον οποίο η στρατηγική κάθε παίκτη αποτελεί βέλτιστη επιλογή για τον παίκτη δεδομένων των επιλογών των άλλων παικτών” Η απόκλιση ακόμα κι ενός παίκτη από τη στρατηγική του κατά την ισορροπία Nash συνεπάγεται το ίδιο ή μικρότερο όφελος για τον παίκτη αυτόν
64
Πώς βρίσκουμε ισορροπία Nash;
Βήμα 1: Υποθέστε ότι είστε ένας από τους παίκτες Βήμα 2: Υποθέστε ότι ο «αντίπαλός» σας επιλέγει μια συγκεκριμένη ενέργεια Βήμα 3: Καθορίστε τη(ις) βέλτιστη στρατηγική(ές) σας, δεδομένης της ενέργειας του αντιπάλου Υπογραμμίστε κάθε βέλτιστη επιλογή στον πίνακα οφέλους Βήμα 4: Επαναλάβετε τα Βήματα 2 & 3 για κάθε άλλη στρατηγική του αντιπάλου Βήμα 5: Επαναλάβετε τα Βήματα 1 έως 4 για τον άλλον παίκτη Βήμα 6: Κάθε κελί του πίνακα με όλες του τις τιμές υπογραμμισμένες είναι ισορροπία Nash
65
Παράδειγμα: βήματα 1 και 2
Υποθέστε ότι είστε ο Παίκτης 1 Δεδομένου ότι ο Παίκτης 2 επιλέγει την Ενέργεια C, ποια είναι η βέλτιστη επιλογή για τον Παίκτης 1; Παίκτης 2 Ενέργεια C Ενέργεια D Ενέργεια A 10, 2 8, 3 Ενέργεια B 12, 4 10, 1 Παίκτης 1
66
Παράδειγμα: βήμα 3 Υπογραμμίστε το βέλτιστο όφελος, δεδομένης της επιλογής του άλλου παίκτη Επιλέξτε την Ενέργεια B, αφού 12 > 10 υπογραμμίστε το 12 Παίκτης 2 Ενέργεια C Ενέργεια D Ενέργεια A 10, 2 8, 3 Ενέργεια B 12, 4 10, 1 Παίκτης 1
67
Παράδειγμα: βήμα 4 Υποθέστε ότι ο Παίκτης 2 επιλέγει την Ενέργεια D
Τότε, επειδή 10 > 8 επιλέξτε και υπογραμμίστε το 10 Παίκτης 2 Ενέργεια C Ενέργεια D Ενέργεια A 10, 2 8, 3 Ενέργεια B 12, 4 10, 1 Παίκτης 1
68
Παράδειγμα: βήμα 5 Υποθέστε ότι είστε ο Παίκτης 2
Αν ο Παίκτης 1 επιλέγει A 3 > 2 υπογραμμίστε το 3 Αν ο Παίκτης 1 επιλέγει B 4 > 1 υπογραμμίστε το 4 Παίκτης 2 Ενέργεια C Ενέργεια D Ενέργεια A 10, 2 8, 3 Ενέργεια B 12, 4 10, 1 Παίκτης 1
69
Παράδειγμα: βήμα 6 Σε ποια κελιά είναι υπογραμμισμένοι και οι δύο αριθμοί; Ο Παίκτης 1 επιλέγει B και ο Παίκτης 2 επιλέγει C Αυτή είναι η μοναδική ισορροπία Nash Παίκτης 2 Ενέργεια C Ενέργεια D Ενέργεια A 10, 2 8, 3 Ενέργεια B 12, 4 10, 1 Παίκτης 1
70
Παράδειγμα: επαλήθευση
Τι θα γινόταν αν ο Παίκτης 1 αποκλίνει από την ισορροπία Nash; Θα μπορούσε να επιλέξει A με όφελος 10 Το όφελος του Παίκτη 1 είναι μικρότερο αν αποκλίνει Παίκτης 2 Ενέργεια C Ενέργεια D Ενέργεια A 10, 2 8, 3 Ενέργεια B 12, 4 10, 1 Παίκτης 1
71
Παράδειγμα: επαλήθευση
Τι θα γινόταν αν ο Παίκτης 2 αποκλίνει από την ισορροπία Nash; Θα μπορούσε να επιλέξει D με όφελος 1 Το όφελος του Παίκτη 2 είναι μικρότερο αν αποκλίνει Παίκτης 2 Ενέργεια C Ενέργεια D Ενέργεια A 10, 2 8, 3 Ενέργεια B 12, 4 10, 1 Παίκτης 1
72
Κυρίαρχη στρατηγική Στρατηγική που σίγουρα επιλέγεται ανεξάρτητα από τη στρατηγική του άλλου ατόμου Π.χ.: ο Παίκτης 1 έχει κυρίαρχη στρατηγική τη B Παίκτης 2 Ενέργεια C Ενέργεια D Ενέργεια A 10, 2 8, 3 Ενέργεια B 12, 4 10, 1 Παίκτης 1
73
Παράδειγμα Υποθέστε ότι δύο άτομα πρόκειται ταυτόχρονα να αποφασίσουν για το παρακάτω παίγνιο Βρείτε την(ις) ισορροπία(ες) Nash Παίκτης 2 ΝΑΙ ΟΧΙ 20, 20 5, 10 10, 5 10, 10 Παίκτης 1
74
Παράδειγμα: 2 πιθανές ισορροπίες Nash
Αν και η (ΝΑΙ, ΝΑΙ) είναι πιο αποδοτικό αποτέλεσμα, δεν έχουμε τρόπο να προβλέψουμε την τελική έκβαση Παίκτης 2 ΝΑΙ ΟΧΙ 20, 20 5, 10 10, 5 10, 10 Παίκτης 1
75
Πολλαπλές ισορροπίες Nash
Συμπληρωματική πληροφορία ή ενέργειες μπορεί να βοηθήσουν για τον καθορισμό της τελικής έκβασης Αν τα άτομα έπαιζαν ακολουθιακά αντί ταυτόχρονα, ισορροπία θα αποτελούσε το σημείο 20, 20
76
Ακολουθιακές αποφάσεις
Υποθέστε ότι οι αποφάσεις είναι δυνατόν να λαμβάνονται ακολουθιακά Πηγαίνοντας προς τα πίσω μπορούμε να καθορίσουμε πώς θα συμπεριφερθούν οι παίκτες Θα εξετάσουμε την τελευταία απόφαση αρχικά και μετά δουλέψουμε προς την πρώτη απόφαση Χρησιμοποιούμε ένα δένδρο αποφάσεων
77
Δένδρο αποφάσεων για ακολουθιακό παίγνιο: ο Παίκτης 1 παίζει πρώτος
A B C Παίκτης 1 επιλέγει ΝΑΙ Παίκτης 1 επιλέγει ΟΧΙ Παίκτης 2 επιλέγει ΝΑΙ Παίκτης 2 επιλέγει ΟΧΙ 20, 20 5, 10 10, 5 10, 10
78
Δένδρο αποφάσεων για ακολουθιακό παίγνιο: ο Παίκτης 1 παίζει πρώτος
A B C Παίκτης 1 επιλέγει ΝΑΙ Παίκτης 1 επιλέγει ΟΧΙ Παίκτης 2 επιλέγει ΝΑΙ Παίκτης 2 επιλέγει ΟΧΙ 20, 20 5, 10 10, 5 10, 10 Δεδομένου του σημείου B, ο Παίκτης 2 θα επιλέξει ΝΑΙ (20 > 10) Δεδομένου του σημείου C, ο Παίκτης 2 θα επιλέξει ΟΧΙ (10 > 5)
79
Δένδρο αποφάσεων για ακολουθιακό παίγνιο: ο Παίκτης 1 παίζει πρώτος
A B C Παίκτης 1 επιλέγει ΝΑΙ Παίκτης 1 επιλέγει ΟΧΙ Παίκτης 2 επιλέγει ΝΑΙ Παίκτης 2 επιλέγει ΟΧΙ 20, 20 5, 10 10, 5 10, 10 Αν ο Παίκτης 1 είναι ορθολογικός, θα αγνοήσει επιλογές που δεν θα κάνει ο Παίκτης 2 Π.χ.: Ο Παίκτης 2 δε θα επιλέξει ΝΑΙ αν ο Παίκτης 1 έχει ήδη επιλέξει ΟΧΙ
80
Δένδρο αποφάσεων για ακολουθιακό παίγνιο: ο Παίκτης 1 παίζει πρώτος
A B C Παίκτης 1 επιλέγει ΝΑΙ Παίκτης 1 επιλέγει ΟΧΙ Παίκτης 2 επιλέγει ΝΑΙ Παίκτης 2 επιλέγει ΟΧΙ 20, 20 5, 10 10, 5 10, 10 Αν ο Παίκτης 1 γνωρίζει ότι ο Παίκτης 2 είναι ορθολογικός, θα επιλέξει ΝΑΙ, αφού 20 > 10 Ο Παίκτης 2 αποφασίζει από το σημείο B και θα επιλέξει επίσης ΝΑΙ Όφελος: (20, 20)
81
Συμπέρασμα Θεωρία Παιγνίων Ταυτόχρονες αποφάσεις Ισορροπία Nash
82
Είδη στρατηγικής Πώς πρέπει να παίξουμε;
Μια στρατηγική είναι ένα πλάνο δράσης που δίνει στον παίκτη κανόνες για να καθορίσει πώς μπορεί να παίξει ανάλογα με την κατάσταση του παιγνίου Αμιγής στρατηγική: σε κάθε στάδιο του παιγνίου καθορίζει μια συγκεκριμένη κίνηση με βεβαιότητα (με πιθανότητα 1) Μικτή στρατηγική: επιλέγει με κάποια πιθανότητα τουλάχιστον μία κίνηση
83
Το παράδειγμα του ταξιδιώτη εργαζομένου
Παίκτης: εργαζόμενος που επιστρέφει σπίτι από τη δουλειά Στόχος: να επιστρέψει σπίτι το γρηγορότερο δυνατόν Διαθέσιμα μέσα μετακίνησης: τραίνο, λεωφορείο, μετρό Ένας εργαζόμενος που επιλέγει πάντα π.χ., το τραίνο ακολουθεί μια αμιγή στρατηγική Ένας εργαζόμενος που επιλέγει κάποιες φορές το τραίνο και κάποιες άλλες το λεωφορείο ακολουθεί μια μικτή στρατηγική Ενδιαφέρουσα ερώτηση: πρόκειται για παίγνιο με 1 παίκτη; Consider the traffic, the weather, … Comment: in practice, for complex games, it is not possible to determine a complete strategy. 83 83
84
Είδη παιγνίων: συνεργατικά – μη συνεργατικά
Περιγραφή: Χαρίζονται EUR άτομο/άτομα που επιλέγουν με μεγαλύτερο αριθμό Παίκτες: Κάθε άτομο ή ομάδα ατόμων Στόχος: Το μέγιστο δυνατό κέρδος Κανόνες Καμία επικοινωνία μεταξύ των παικτών Κάθε άτομο ή ομάδα επιλέγει έναν αριθμό N ≥1 και τον γράφει σε ένα χαρτάκι μαζί με το όνομα ατόμου ή ομάδας Το άτομο ή η ομάδα που επέλεξε το μεγαλύτερο N κερδίζει 1000 EUR Κανόνες Επιτρέπεται η επικοινωνία μεταξύ των παικτών Κάθε άτομο ή ομάδα επιλέγει έναν αριθμό N ≥1 και τον γράφει σε ένα χαρτάκι μαζί με το όνομα ατόμου ή ομάδας Το άτομο ή η ομάδα που επέλεξε το μεγαλύτερο N κερδίζει 1000 EUR Μη συνεργατικό παίγνιο Συνεργατικό παίγνιο
85
Είδη παιγνίων: συνεργατικά – μη συνεργατικά
Γενικά, η συνεργασία μπορεί να οδηγήσει σε μεγαλύτερα οφέλη Παραδείγματα: Κράτη που συνεργάζονται στο εμπόριο (μειωμένοι φόροι) αύξηση στις εξαγωγές Εθνικά sites κοινωνικής δικτύωσης που μοιράζονται τεχνικές γνώσεις αποκλείουν ανταγωνιστή από το εξωτερικό Cartel: δημιουργία μονοπωλίου από πολλούς οργανισμούς
86
Είδη παιγνίων: πλήρους – ατελούς πληροφόρησης
Παίγνιο πλήρους πληροφόρησης: οι παίκτες γνωρίζουν όλες οι κινήσεις που έχουν γίνει στο παίγνιο όταν αποφασίζουν τη δική τους κίνηση Αλλιώς έχουμε παίγνιο ατελούς πληροφόρησης Μια μεγάλη κατηγορία παιγνίων ατελούς πληροφόρησης είναι παίγνια που οι παίκτες παίζουν (αποφασίζουν) ταυτόχρονα χωρίς να γνωρίζουν τις κινήσεις των άλλων παικτών
87
Είδη παιγνίων: μηδενικού – μη μηδενικού αθροίσματος
Παίγνια μηδενικού αθροίσματος Ό,τι χάνει ο ένας παίκτης το κερδίζει ο άλλος Αθροίζοντας τα οφέλη των παικτών λαμβάνουμε 0 Δε δημιουργείται ούτε καταστρέφεται πλούτος Παίγνια μη μηδενικού αθροίσματος Αθροίζοντας τα οφέλη των παικτών λαμβάνουμε μη μηδενικό άθροισμα Δημιουργείται ή καταστρέφεται πλούτος Οι περισσότερες πραγματικές καταστάσεις (π.χ., οικονομίες κρατών) είναι παίγνιο μη μηδενικού αθροίσματος
88
Παραδείγματα παιγνίων
89
Το παιχνίδι της αφαίρεσης
2 παίκτες παίζουν ο ένας μετά τον άλλον απομακρύνοντας αντικείμενα από μια στοίβα Σε κάθε κίνηση κάθε παίκτης μπορεί να απομακρύνει ακριβώς 1 ή 2 αντικείμενα Νικητής είναι όποιος απομακρύνει το τελευταίο αντικείμενο Νικητήρια στρατηγική: κερδίζει όποιος αφήνει αντικείμενα με πλήθος πολλαπλάσιο του 3
90
Νικητήρια στρατηγική: απόδειξη
Έστω οι παίκτες A και B Σε κάθε κίνηση ο παίκτης μπορεί να απομακρύνει από 1 έως και c αντικείμενα Ο παίκτης έχει νικητήρια στρατηγική αν μπορεί να κάνει κίνηση αφήνοντας k(c+1) αντικείμενα στη στοίβα Αποδεικνύουμε για τον παίκτη Α χρησιμοποιώντας επαγωγή για το k Βασικό βήμα: k=1 Έστω ότι ο A αφήνει c+1 αντικείμενα Ο B μπορεί να απομακρύνει x αντικείμενα: από 1 έως και c απομένουν y = c+1-x με 1 ≤ y ≤ c Ο A απομακρύνει y αντικείμενα και κερδίζει
91
Νικητήρια στρατηγική: απόδειξη
Επαγωγική υπόθεση: έστω ότι η δήλωση ισχύει για k=n (n≥1) Αν ο A αφήσει n(c+1) αντικείμενα, κερδίζει Επαγωγικό βήμα: η δήλωση ισχύει και για k=n+1 Υποθέτουμε ότι ο A αφήνει (n+1)(c+1) αντικείμενα δηλ., αφήνει nc+n+c+1 αντικείμενα Αν ο B απομακρύνει x:1≤x≤c, μένουν nc+n+c+1-x αντικείμενα Τότε ο A απομακρύνει c+1-x αντικείμενα αφήνοντας n(c+1) αντικείμενα Με βάση την επαγωγική υπόθεση, ο Α είναι ο νικητής
92
Η μάχη των φύλων Ένα ζευγάρι προσπαθεί να αποφασίσει ποια ταινία θα δουν στον κινηματογράφο Το αγόρι θα προτιμούσε να δουν μια ταινία δράσης ενώ το κορίτσι θα προτιμούσε να δουν μια ρομαντική ταινία αλλά και οι δυο θα προτιμούσαν να είναι μαζί παρά να κάνουν μόνοι τους τις δραστηριότητες που προτιμούν Υποθέστε ότι η επιλογή 1 είναι η ταινία δράσης και η επιλογή 2 είναι η ρομαντική ταινία Ο πίνακας οφέλους θα είναι ως εξής: Κ1 Κ2 Α1 (2,1) (0,0) Α2 (1,2)
93
Ισορροπίες Nash με μικτές στρατηγικές
Μάχη των φύλων Το αγόρι επιλέγει με πιθανότητα p «Φονικό όπλο» και με 1-p «Θαυμαστή Αγάπη» Το κορίτσι πρέπει να λαμβάνει την ίδια μέση ανταμοιβή σε κάθε περίπτωση 2*p+0*(1-p)=0*p+1*(1-p) 2p=1-p 3p=1 p=1/3 Κορώνα ή γράμματα Ο B επιλέγει με πιθανότητα p «Κορώνα» και με 1-p «Γράμματα» Ο Α πρέπει να λαμβάνει την ίδια μέση ανταμοιβή σε κάθε περίπτωση 1*p+(-1)*(1-p)=(-1)*p+1*(1-p) p-1+p=-p+1-p 2p-1=1-2p 4p=2 p=1/2 Ανάλογα το παιχνίδι σκόρερ και τερματοφύλακα σε πέναλτυ Φονικό όπλο Θαυμαστή αγάπη 2,1 0,0 1,2
94
Συμπερασματικά… Παίγνια συμβαίνουν σε πολλές πραγματικές περιστάσεις
Η μαθηματική ανάλυση απαιτεί κατανόηση του εκάστοτε πλαισίου και των κανόνων Παιχνίδια που παίζονται με επαναλήψεις δίνουν διαφορετικά αποτελέσματα από παιχνίδια που παίζονται μόνο μία φορά Η ανθρώπινη ψυχολογία συνήθως οδηγεί σε απρόβλεπτη συμπεριφορά
95
Συμπεριφορική Θεωρία Παιγνίων: Τι κάνουν τα άτομα στα αλήθεια;
96
Συμπεριφορική Θεωρία Παιγνίων και Παίγνια στην πράξη
Θεωρία παιγνίων: πώς συμπεριφέρονται ορθολογικά άτομα Ποια είναι αυτά τα ορθολογικά άτομα; BGT: εξετάζει το πώς αλήθεια συμπεριφέρονται τα άτομα Πειραματισμός με πραγματικές οικονομικές περιστάσεις Συνυπολογισμός πραγματικών αποφάσεων ατόμων ανάλογα με τη κατάσταση Ακολουθείται η θεωρία παιγνίων όταν δουλεύει Μοντέλο που να ταιριάζει στις παρατηρήσεις, όχι στον “ορθολογισμό” 96
97
Διαγωνισμός ομορφιάς Ένας φανταστικός διαγωνισμός όπου οι συμμετέχοντες καλούνται να επιλέξουν τα 6 πιο ελκυστικά πρόσωπα από 100 φωτογραφίες. Αυτοί που επέλεξαν τα πιο δημοφιλή πρόσωπα παίρνουν βραβείο Σε ένα παίγνιο p-διαγωνισμού ομορφιάς (Moulin 1986), όλοι οι συμμετέχοντες καλούνται να επιλέξουν ταυτόχρονα έναν αριθμό μεταξύ 0 και 100. Νικητής είναι όποιος επέλεξε αριθμό που είναι πιο κοντά στο p φορές το μέσο όρο όλων των αριθμών που επιλέχθηκαν, όπου p είναι κάποιο κλάσμα, συνήθως 2/3 ή 1/2 Αν p<1 η μοναδική ισορροπία Nash είναι όλοι οι συμμετέχοντες να επιλέξουν 0 Αντίθετα, στην εκδοχή του Keynes, p=1 και υπάρχουν πολλές πιθανές ισορροπίες Nash
98
Διαγωνισμός ομορφιάς: ανάλυση
Κάποιοι παίκτες προσπαθούν να μαντέψουν έναν αριθμό που ισούται με τα 2/3 της μέσης «μαντεψιάς» Η λύση δε μπορεί να είναι μεταξύ 68 και 100 – δεν έχει νόημα η μαντεψιά σε αυτό το διάστημα Αλλά αν αποκλειστεί αυτό το διάστημα τιμών, η λύση δε μπορεί να είναι μεγαλύτερη από 44 Αλλά αν αποκλειστούν οι αριθμοί που είναι μεγαλύτεροι από 44, η λύση δε μπορεί να είναι μεγαλύτερη από 29… Όλοι θα πρέπει να μαντέψουν την τιμή 0!
100
Τελεσίγραφο Ο παίκτης που προτείνει έχει 10 ευρώ
Προσφέρει x στον παίκτη-αποδέκτη (κρατώντας 10-x ευρώ) Τι θα πρέπει να κάνει ο παίκτης-αποδέκτης; Ιδιοτελής: Να αποδεχθεί κάθε x > 0 Εμπειρικός: Να απορρίψει κάθε x = 2 ευρώ τις μισές φορές
101
Τελεσίγραφο: ισορροπία
Η ισορροπία Nash σε όλα αυτά τα παίγνια είναι απλή: Ο αποδέκτης θα πρέπει να αποδεχτεί κάθε θετική ποσότητα, αφού κάτι είναι προτιμότερο από τίποτα Ο παίκτης που προτείνει θα πρέπει να κρατήσει σχεδόν όλο το ποσό, μείον κάτι μικρό, αφού ο αποδέκτης θα δεχτεί κάθε προσφορά
102
Τελεσίγραφο: Πώς παίζουμε στα αλήθεια;
Χιλιάδες παιχνίδια έχουν διενεργηθεί πειραματικά… Σε διαφορετικούς πολιτισμούς Με διαφορετικά αντικείμενα προς διαμοιρασμό Με διαφορετικές αναλογίες ανδρών - γυναικών Με φοιτητές διαφορετικών αντικειμένων … Σχεδόν πάντα, δύο καταστάσεις αποδεικνύονται αληθείς: Ο Παίκτης 1 προσφέρει σχεδόν, αλλά λιγότερο από, το μισό (περίπου 40%) Ο Παίκτης 2 απορρίπτει χαμηλές προσφορές (20% ή λιγότερο) 102
103
Τελεσίγραφο: διαφορετικές κουλτούρες
Άτομα από όλον τον κόσμο συμμετείχαν στο «Τελεσίγραφο»! Οι πολιτισμικές διαφορές είναι σημαντικές και κυμαίνονται από ανταγωνιστική πλήρη προσφορά έως απροθυμία μοιράσματος σε κοινωνίες που γενικά μοιράζονται
104
Τελεσίγραφο σε διάφορες κοινωνίες (μέσος όρος σκιασμένος, πιο συχνά εμφανιζόμενη προσφορά ο μεγάλος κύκλος
105
Τελεσίγραφο: πίθηκοι Οι πίθηκοι συμπεριφέρονται σύμφωνα με την ισορροπία Nash. Προτείνουν μία άνιση μοιρασιά η οποία δεν απορρίπτεται (Jensen, Call, Tomasello 2007).
106
Συμπεριφορική Θεωρία Παιγνίων: σημεία - κλειδιά
Περιορισμένος ορθολογισμός: οι άνθρωποι δεν έχουν απεριόριστη υπολογιστική ικανότητα / ικανότητα συλλογισμών (Διαγωνισμός Ομορφιάς) Αποφυγή της ανισότητας: οι άνθρωποι συχνά αποκλίνουν από την ισορροπία για χάρη της "δικαιοσύνης" (τελεσίγραφο) Μικτές στρατηγικές: οι άνθρωποι δημιουργούν «τυχαίες» τιμές εντός ορίων - καλύτερες αν υπάρχει ανταμοιβή 106
Παρόμοιες παρουσιάσεις
© 2024 SlidePlayer.gr Inc.
All rights reserved.