Εκτεταμένα Παίγνια με τέλεια πληροφόρηση

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
ΣΧΕΔΙΑΣΜΟΣ (PLANNING)..και εφαρμογές σε video games! Τεχνητή Νοημοσύνη ΙΙ Εαρινό Εξάμηνο
Advertisements

21 ΔΕΚΕΜΒΡΙΟΥ 2010 Game Theory for networks - OVERVIEW - Μενέλαος Γιαννόπουλος Χρήστος Μαρτίδης.
§ 40. Электр кедергісінің температураға тәуелділігі. Асқын өткізгіштік
Η σημασία της σχέσης παιδιού-περιβάλλοντος Είναι αποδεδειγμένο ότι τα παιδιά είναι ευαίσθητα απέναντι στο δομημένο χώρο. Οι διάφορες αρχιτεκτονικές μορφές.
Η 25 η Μαρτίου Σχέδιο Εργασίας Δ’ Δημοτικό Σχολείο Λεμεσού Κωνσταντίνου Άντρη Νικολάου Πολύμνια Στυλιανού Μαριλένα.
Πρόγραμμα Αγωγής Υγείας «Τρώω σωστά,μεγαλώνω σωστά» Σχολικό έτος ο Νηπιαγωγείο Πατρών.
1 Ζαρικάκη Ελισάβετ. 2 Διακόσμηση τάξης και δημιουργία παραμυθογωνιάς και βιβλιοθήκης μέσα στην τάξη Με μαξιλάρια, χαλάκι και παραμυθάκια που έφεραν τα.
ΠΥΡΙΤΙΟ Το πυρίτιο (Si) έχει ατομικό αριθμό 14. Είναι ένα μεταλλοειδές που ανήκει στην ομάδα IV A (14) του περιοδικού πίνακα μαζί με τον Άνθρακα, το Γερμάνιο,
Η ΑΚΡΟΠΟΛΗ ΑΘΗΝΩΝ ΜΑΡΙΑ ΠΗΓΗ Δ2’. ΑΚΡΟΠΟΛΗ ΕΡΕΧΘΕΙΟ ΝΑΟΣ ΤΗΣ ΑΘΗΝΑΣ ΝΙΚΗΣ ΠΡΟΠΥΛΑΙΑ ΠΑΡΘΕΝΩΝΑΣ ΧΑΛΚΟΘΗΚΗ ΝΑΟΣ ΤΟΥ ΔΙΑ.
 Καταργείται η θεώρηση (ή αλλιώς η διάτρηση) των βιβλίων, είτε αυτά τηρούνται χειρόγραφα, είτε μηχανογραφικά.  Καταργείται και δεν θα ενημερώνεται πλέον.
Είναι ο κλάδος της Χημείας που ασχολείται με δύο κύρια ερωτήματα που αφορούν τις χημικές αντιδράσεις. Το πρώτο είναι το πως γίνεται μια αντίδραση, δηλαδή.
ΣΧΗΖΟΦΡΕΝΕΙΑ !!! 1)ΘΕΤΙΚΑ ΚΑΙ ΑΡΝΗΤΙΚΑ ΣΥΜΠΤΩΜΑΤΑ 2)ΚΟΙΝΩΝΙΑ ΚΑΙ ΠΟΛΙΤΙΣΜΟΣ 3)ΑΙΤΙΑ 4)ΚΑΤΑΧΡΗΣΗ ΟΥΣΙΩΝ.
ΣΧΟΛ. ΕΤΟΣ Τάξη:Τμήμα: KΑΘΗΓΗΤΗΣ………………………………………………… ΕΤΗΣΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Της διδακτέας ύλης στο μάθημα…………………………………………… Η ύλη αυτή κατανέμεται.
Τεχνικές Εξοικονόμησης Χρόνου Αναφέρετε κάποιες τεχνικές που μπορούν να βοηθήσουν στην εξοικονόμηση χρόνου.
ΣΥΣΚΕΥΑΣΙΑ Αγροδιατροφικών Προϊόντων. Συσκευασία ενός πρωτογενούς αγροτικού προϊόντος ονομάζεται η περικάλυψη του από κάποιο ειδικό υλικό που χρησιμοποιείται.
1.  Τα κύματα δημιουργούνται όταν ένα σύστημα διαταράσσεται από την κατάσταση ισορροπίας και η ενέργεια ταξιδεύει από μια περιοχή του συστήματος σε.
ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΣΥΣΤΗΜΑΤΩΝ ΕΦΟΔΙΑΣΜΟΥ ΑΡΧΕΣ ΛΟΓΙΣΤΙΚΗΣ ΚΑΘΗΓΗΤΗΣ: Δρ ΠΑΝΑΓΙΩΤΗΣ ΚΩΤΣΙΟΣ ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ 2015/2016.
ΑΝΑΚΥΚΛΩΣΙΜΑ ΥΛΙΚΑ Νίκος Σελλας, Μελετητής Workshops Αλεξανδρούπολη 15 Ιανουαρίου 2016.
Παιχνιδοκεντρική Μάθηση
Χρηματοοικονομικές Αγορές*
Βασικές Έννοιες της Πληροφορικής
Εισαγωγή στην Στατιστική
ΠΥΡΟΠΡΟΣΤΑΣΙΑ.
Ειδικά θέματα σε κινητά και ασύρματα δίκτυα
Χαράλαμπος Πουλόπουλος
ΚΕΦΑΛΑΙΟ 2. ΕΝΑΛΛΑΚΤΙΚΕΣ ΔΗΜΟΣΙΕΣ ΣΥΜΒΑΣΕΙΣ (CONTRACTING OUT)
Το ευρωπαϊκό θέατρο του 20ού αιώνα ( )
Προσεγγίσεις στην απόδειξη
ΝΟΣΗΛΕΥΤΙΚΗ ΦΡΟΝΤΙΔΑ ΑΣΘΕΝΟΥΣ
ΑΣΚΗΣΕΙΣ ΚΙΝΗΜΑΤΙΚΗΣ.
Αναγνώριση Προτύπων (Pattern Recognition)
Θεωρία & Αλγόριθμοι Γράφων Αντιστοιχίσεις και Καλύμματα
Δένδρο-σωρός Ένα δένδρο-σωρός ή απλώς σωρός είναι ένα πλήρες δυαδικό δένδρο με διατεταγμένους τους κόμβους του έτσι, ώστε η τιμή του στοιχείου κάθε κόμβου.
Εξίσωση αρμονικού κύματος (Κυματοσυνάρτηση)
Το να γίνεις ευτυχισμένος
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ
ΑΛΚΗ ΖΕΗ.
ΕΡΩΤΗΣΗ 1 Ως μέρος μιας επιδημιολογικής μελέτης, 2 ομάδες γυναικών ρωτήθηκαν (με συνέντευξη) για την ύπαρξη ναυτίας και στομαχικού πόνου. Σε μια σύγκριση.
«Ανάπτυξη εφαρμογής για τη διαχείριση μεθόδων αναζήτησης σε οπτικοποιημένο περιβάλλον»  Μπλάγας Χρήστος.
Αντικείμενα Συμπεριφορές Γεγονότα
Συμβολή κυμάτων.
ΑΝΤΙΛΗΨΕΙΣ ΚΑΙ ΣΧΕΣΕΙΣ ΕΠΑΓΓΕΛΜΑΤΙΩΝ ΥΓΕΙΑΣ ΣΤΟ ΧΩΡΟ ΤΟΥ ΝΟΣΟΚΟΜΕΙΟΥ
1ο Γυμνάσιο Ανατολής 28 0κτώβρη 2016.
Πληροφοριακά Συστήματα και επιχείρηση
Δίκαιο Επιχειρήσεων ΙΙ
Κλασικό τμήμα Σχολικό έτος «Η Αγγελική και ο Αλέξης παντρεύονται» Μια ιστορία που συνέθεσαν τα νήπια βλέποντας τους πίνακες του λαϊκού ζωγράφου.
ΣΥΝΟΠΤΙΚΟΣ ΟΔΗΓΟΣ RACES
Kλυτία, η νύμφη που έγινε ηλιοτρόπιο
Εφαρμογή της Θεωρίας Παιγνίων σε Αγορές Ηλεκτρικής Ενέργειας
Είναι η ύπαρξη της αγάπης.
العنوان الحركة على خط مستقيم
توازن جسم صلب خاضع لقوتين Equilibre d’un corps solide soumis à deux forces نشاط 1: شرطي التوازن القوتين المؤثرتين على الحلقة لهما نفس خط التأثير, ومنحيين.
Κεφάλαιο 2 Φυσικές έννοιες & Κινητήριες Μηχανές
Ένα γεγονός που συγκλονίζει τη Βυζαντινή Αυτοκρατορία
ΟΜΑΔΑ Ομαδική εργασία Τζιάτζιος Δημήτριος Ψουρούκα Ευαγγελία
Ηλεκτρικά δίπολα Όλες οι ηλεκτρικές συσκευές που χρησιμοποιούμε
Σταθερά ΚΕΣΠΕΜ Κομοτηνής Εκπαιδευτικός: Κυριακή Ζαφείράκη Επιστημονική Υπεύθυνη: Μαρία Ζωγραφάκη Επόπτρια: Μαρία Γραμματίκα Τάξη: Στ Αριθμός Παιδιών:
Υδρομηχανικές διεργασίες
Τεχνολογία & εφαρμογές μεταλλικών υλικών
Ұйымдастыру: Оқушылардың сабаққа дайындығын тексеру, олардың
Αγαπημένο μου παιδί....
Αρχες διοικησησ & διαχειρισησ εργων
Онтологи ба сайэнс “Сайэнсийн тэори” Проф. С. Молор-Эрдэнэ Лэкц 4
ΑΣΦΑΛΕΙΑ ΣΤΟΝ ΨΗΦΙΑΚΟ ΚΟΣΜΟ
РАДИОАКТИВТІК.
2. EYΘΥΓΡΑΜΜΕΣ ΚΙΝΗΣΕΙΣ.
2ο ΕΡΓΑΣΤΗΡΙΟ – ΡΟΕΣ ΚΟΣΤΟΥΣ
ΠΑΡΟΥΣΙΑΣΗ ΤΟΥ ΤΜΗΜΑΤΟΣ ΕΠΙΣΤΗΜΩΝ ΠΡΟΣΧΟΛΙΚΗΣ ΑΓΩΓΗΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗΣ
«ΜΑΡΚΕΤΙΝΓΚ ΑΓΡΟΤΙΚΩΝ ΠΡΟΙΟΝΤΩΝ ΚΑΙ ΤΡΟΦΙΜΩΝ»
Το Εικονογραφημένο Βιβλίο στην Προσχολική Εκπαίδευση
Μεταγράφημα παρουσίασης:

Εκτεταμένα Παίγνια με τέλεια πληροφόρηση

Πεποιθήσεις Παικτών Σε μια ισορροπία Nash, κάθε παίκτης επιλέγει μια στρατηγική που μεγιστοποιεί την αναμενόμενη απολαβή του γνωρίζοντας τις στρατηγικές των άλλων παικτών. Άτυπα, ο τρόπος που αποκτά ένας παίκτης αυτή την γνώση είναι η εμπειρία του από το παίξιμο του παίγνιου.

Περίγραμμα Παίγνια Εκτεταμένης Μορφής με Πλήρη Πληροφόρηση (Extensive Form Games with Perfect Information) Προς τα πίσω επαγωγή (Backward Induction) και Τέλεια Ισορροπία Nash σε Υποπαίγνιο (Subgame Perfect Nash Equilibrium) Αρχικές εφαρμογές απόκλισης σε ένα στάδιο (One-stage Deviation Principle Application)

Παίγνια Εκτεταμένης Μορφής (1/2) Έχουμε μελετήσει τα παιχνίδια στρατηγικής μορφής τα οποία χρησιμοποιούνται για να μοντελοποιήσουν τα παίγνια ενός γύρου (one-shot games) όπου κάθε παίκτης επιλέγει τη δράση του μια για πάντα ταυτόχρονα. Τα παίγνια εκτεταμένης μορφής αποτελούν μοντέλο διαδοχικών αποφάσεων πολλαπλών παραγόντων.

Παίγνια Εκτεταμένης Μορφής (2/2) Η εστίασή μας θα είναι σε παίγνια πολλαπλών σταδίων με παρατηρούμενες ενέργειες (multi-agent sequential games with observed actions) όπου: Καταγράφονται όλες οι προηγούμενες ενέργειες, δηλαδή κάθε παίκτης είναι πλήρως ενημερωμένος για όλα τα προηγούμενα γεγονότα. Μερικοί παίκτες μπορούν να κινούνται ταυτόχρονα σε κάποιο στάδιο k. Εκτεταμένες μορφές παίγνιων μπορούν εύκολα να αναπαριστώνται από δέντρα παιγνίων (game trees). Πρόσθετο στοιχείο του μοντέλου είναι οι ιστορίες (histories), δηλαδή, ακολουθίες από προφίλ δράσης.

Παράδειγμα 1: Παίγνιο Απαγόρευσης Εισόδου Υπάρχουν δύο παίκτες. Ο παίκτης 1, ο εισερχόμενος, μπορεί να επιλέξει να εισέλθει στην αγορά ή να παραμείνει έξω. Ο παίκτης 2, ο αξιωματούχος, αφού παρακολουθεί τη δράση του εισερχόμενου, επιλέγει να τον φιλοξενήσει ή να πολεμήσει μαζί του. Οι αποδόσεις για κάθε ένα από τα προφίλ δράσης (ή τα ιστορικά) δίνονται από το ζευγάρι (x, y) στα φύλλα του δέντρου παίγνιου: x δηλώνει την απολαβή του παίκτη 1 (ο νεοεισερχόμενος) και y δηλώνει την πληρωμή του παίκτη 2 ο κατεστημένος φορέας).

Παράδειγμα 2: Επένδυση σε Δυοπώλειο Υπάρχουν δύο παίκτες στην αγορά. Ο παίκτης 1 μπορεί να επιλέξει να επενδύσει ή να μην επενδύσει. Αφού ο παίκτης 1 επιλέξει τη δράση του, και οι δύο παίκτες συμμετέχουν σε έναν αγώνα Cournot. Εάν ο παίκτης 1 επενδύσει, τότε θα συμμετάσχουν σε ένα παιχνίδι Cournot με c1 = 0 και c2 = 2. Διαφορετικά, θα συμμετάσχουν σε ένα παιχνίδι Cournot με c1 = c2 = 2. Μπορούμε επίσης να υποθέσουμε ότι υπάρχει σταθερό κόστος f για τον παίκτη 1 να επενδύσει.

Μοντέλο Παίγνιου Εκτεταμένης Μορφής (1/2) Ένα σύνολο παικτών, I = {1,...,I}. Histories: Ένα σύνολο H από σειρές που μπορεί να είναι πεπερασμένο ή όχι. h0 = ∅ αρχικό ιστορικό a0 = (a10, . . . , aI0) το προφίλ ενεργειών στο στάδιο 0 h1 = a0 το ιστορικό μετά το στάδιο 0 ⋮ ⋮ hk+1 = (a0,a1,...,ak) ιστορικό μετά το στάδιο k Αν το παίγνιο έχει ένα πεπερασμένο αριθμό (K+1) σταδίων, τότε είναι παίγνιο πεπερασμένου ορίζοντα. Έστω ότι Hk = {hk} είναι ένα σύνολο όλων των δυνατών ιστορικών K σταδίων Τότε HK+1 είναι ένα σύνολο όλων των δυνατών τερματικών ιστορικών, και H = ∪K+1Hk είναι το σύνολο όλων των δυνατών ιστορικών.

Μοντέλο Παίγνιου Εκτεταμένης Μορφής (2/2) Οι καθαρές στρατηγικές για τον παίκτη i ορίζονται ως σχέδιο έκτακτης ανάγκης για κάθε πιθανό ιστορικό hk. Έστω ότι Si (Hk ) = ∪hk ∈Hk Si (hk ) είναι το σύνολο των ενεργειών που είναι διαθέσιμες για τον παίκτη i στο στάδιο k. Έστω ότι sik : Hk → Si(Hk) τέτοιο ώστε si(hk) ∈ Si(hk). Τότε, η καθαρή στρατηγική για τον παίκτη i είναι το σύνολο των σειρών si = {sik}k=0K , π.χ., η καθαρή στρατηγική ενός παίκτη είναι μια συλλογή απεικονίσεων από όλα τα πιθανά ιστορικά στις διαθέσιμες ενέργειες. Παρατηρείστε ότι το μονοπάτι των προφίλ στρατηγικών s θα είναι a0 = s0(h0), a1 = s1(a0), a2 = s2(a0, a1), και προχωράει με αυτό τον τρόπο. Οι Προτιμήσεις ορίζονται στην έκβαση του παίγνιου HK+1. Μπορούμε να αναπαρίσουμε τις προτιμήσεις του παίκτη i με μία συνάρτηση χρησιμότητας ui : HK+1 → R. Αφού το προφίλ στρατηγικών s καθορίζει το μονοπάτι a0, . . . , ak και ως εκ τούτου το hK +1, θα συμβολίσουμε με ui(s) την απόδοση του παίκτη i κάτω από το προφίλ στρατηγικών s.

Στρατηγικές σε Παίγνια Εκτεταμένης Μορφής (1/6) Παράδειγμα: Στρατηγικές του Παίκτη 1: s1 : H0 = ∅ → S1 = {C,D}; δύο πιθανές στρατηγικές: C,D Στρατηγικές του Παίκτη 2: s2 : H1 = {{C},{D}} → S2; τέσσερις πιθανές στρατηγικές: τις οποίες μπορούμε να αναπαραστήσουμε ως EG, EH, FG και FH. Αν s = (C,EG), τότε η έκβαση θα είναι{C,E}. Από την άλλη πλευρά, αν η στρατηγική είναι s = (D,EG), η έκβαση θα είναι {D,G}.

Στρατηγικές σε Παίγνια Εκτεταμένης Μορφής (2/6) Θεωρείστε την ακόλουθη έκδοση δύο σταδίων σε εκτεταμένη μορφή του παίγνιου κορόνα-γράμματα. Πόσες στρατηγικές έχει ο παίκτης 2;

Στρατηγικές σε Παίγνια Εκτεταμένης Μορφής (3/6) Ανάκληση: η στρατηγική πρέπει να είναι ένα πλήρες σχέδιο έκτακτης ανάγκης. Επομένως: ο παίκτης 2 έχει τέσσερις στρατηγικές: κεφαλές που ακολουθούν κεφαλές, κεφαλές μετά από ουρές HH. κεφαλές που ακολουθούν κεφαλές, ουρές μετά από ουρές HT. ουρές που ακολουθούν κεφαλές, ουρές μετά από ουρές TT. ουρές μετά από κεφαλές, κεφαλές μετά από ουρές TH.

Στρατηγικές σε Παίγνια Εκτεταμένης Μορφής (4/6) Ως εκ τούτου, από το εκτεταμένο παίγνιο μπορούμε να πάμε στην αναπαράσταση σε στρατηγική μορφή. Για παράδειγμα: Τότε τι θα συμβεί στο παίγνιο αυτό;

Στρατηγικές σε Παίγνια Εκτεταμένης Μορφής (5/6) Μπορούμε να προχωρήσουμε από την αναπαράσταση σε στρατηγική μορφή στην αναπαράσταση σε μια εκτεταμένη μορφή; Για να γίνει αυτό, πρέπει να εισαγάγουμε σύνολα πληροφοριών (information sets): Τα σύνολα πληροφοριών μοντελοποιούν τις πληροφορίες που έχουν οι παίκτες όταν επιλέγουν τις ενέργειές τους. Μπορούν να θεωρηθούν ως γενίκευση της ιδέας ενός ιστορικού. Τα σύνολα πληροφοριών, h ∈ H, χωρίζουν τους κόμβους του δέντρου του παίγνιου: η ερμηνεία του συνόλου πληροφοριών h (x) που περιέχει τον κόμβο x είναι ότι ο παίκτης που επιλέγει μια ενέργεια στο x είναι αβέβαιος αν είναι στο x ή σε κάποιο άλλο x’ ∈ h (x). Υποθέτουμε ότι εάν x’ ∈ h (x), τότε ο ίδιος παίκτης μετακινείται στο x και στο x΄ και επίσης ότι A (x) = A (x΄). Ένα παιχνίδι έχει τέλειες πληροφορίες (perfect information) αν όλα τα σύνολα πληροφοριών του είναι singletons (δηλαδή, όλοι οι κόμβοι βρίσκονται στο δικό τους σύνολο πληροφοριών).

Στρατηγικές σε Παίγνια Εκτεταμένης Μορφής (6/6) Τα ακόλουθα δύο εκτεταμένα παίγνια είναι αναπαραστάσεις της ταυτόχρονης μετακίνησης στο παίγνιο κορόνα-γράμματα. Οι βρόχοι αντιπροσωπεύουν τα σύνολα πληροφοριών των παικτών που κινούνται σε αυτό το στάδιο. Αυτά είναι παίγνια ατελούς πληροφόρησης. Αυτά τα παίγνια αναπαριστούν ακριβώς την ίδια κατάσταση στρατηγικής: κάθε παίκτης επιλέγει τη δράση του χωρίς να γνωρίζει την επιλογή του αντιπάλου του. Σημείωση: Για λόγους συνέπειας, ο πρώτος αριθμός εξακολουθεί να είναι η απόδοση του παίκτη 1.

Παίγνιο Απαγόρευσης Εισόδου Η ισοδύναμη αναπαράσταση σε στρατηγική μορφή: Δύο καθαρές ισορροπίες Nash: (In,A) και (Out,F).

Είναι αυτές οι Ισορροπίες Λογικές; Η ισορροπία (Out, F) διατηρείται από μια μη αξιόπιστη απειλή του μονοπωλίου. Η έννοια της ισορροπίας για εκτεταμένα παίγνια: Subgame Perfect (Nash) Equilibrium. Απαιτεί η στρατηγική κάθε παίκτη να είναι "βέλτιστη" όχι μόνο στην αρχή του παιχνιδιού αλλά και μετά από κάθε ιστορικό. Για παίγνια με πεπερασμένο ορίζοντα, που βρέθηκαν από την προς τα πίσω επαγωγή. Για απεριόριστα παίγνια ορίζοντα, χαρακτηρισμός από την άποψη της αρχής της απόκλισης ενός σταδίου.

Υποπαίγνια (Subgames) (1/2) Για να ορίσουμε τυπικά την τελειότητα του υποπαίγνιου, πρώτα ορίζουμε την ιδέα ενός υποπαίγνιου. Ανεπίσημα, ένα υποπαίγνιο είναι ένα τμήμα ενός παίγνιου που μπορεί να αναλυθεί ως ένα παίγνιο από μόνο του. Θυμηθείτε ότι ένα παίγνιο G αναπαριστάται από ένα δέντρο παίγνιου. Δηλώνεται το σύνολο των κόμβων του G από την VG. Θυμηθείτε ότι το ιστορικό hk υποδηλώνει το γύρο ενός παίγνιου μετά από k στάδια. Σε ένα παίγνιο τέλειας πληροφόρησης, κάθε κόμβος x ∈ VG αντιστοιχεί σε ένα μοναδικό ιστορικό hk και αντιστρόφως. Αυτό δε συμβαίνει αναγκαστικά σε παίγνια ατελούς πληροφόρησης.

Υποπαίγνια (Subgames) (2/2) Ορισμός Ένα υποπαίγνιο G΄ ενός παίγνιου σε εκτεταμένη μορφή G αποτελείται από ένα μοναδικό κόμβο και όλους τους ακόλουθούς του στο G, με την ιδιώτητα ότι αν x΄ στο VG΄ and x΄΄ ∈ h(x), τότε x΄΄ ∈ VG΄. Τα σύνολα πληροφοριών και οι αποδόσεις του υποπαίγνιου κληρονομούνται από το αρχικό παίγνιο. Ο ορισμός απαιτεί όλοι οι διάδοχοι ενός κόμβου να βρίσκονται στο subgame και ότι το subgame δεν "κόβει" κανένα σύνολο πληροφοριών. Αυτό εξασφαλίζει ότι ένα υποπαίγνιο μπορεί να αναλυθεί από μόνο του. Αυτό υπονοεί ότι ένα υποπαίγνιο ξεκινά με έναν κόμβο x με ένα σύνολο πληροφοριών singleton, δηλαδή h (x) = x. Σε παίγνια τέλειας πληροφόρησης, τα subgames συμπίπτουν με τους κόμβους ή το ιστορικό hk του στάδιου k του παιχνιδιού. Σε αυτή την περίπτωση, χρησιμοποιούμε τη σημείωση hk ή G (hk) για να υποδηλώσουμε το subgame. Ένας περιορισμός μιας στρατηγικής s στο subgame G΄ , s|G είναι το προφίλ δράσης που υποδηλώνεται από το s στο subgame G΄.

Υποπαίγνια: Παραδείγματα Ανακαλέστε την έκδοση δύο επιπέδων εκτεταμένης μορφής του παίγνιου κορόνα-γράμματα. Σε αυτό το παιχνίδι, υπάρχουν δύο σωστά subgames και το ίδιο το παιχνίδι που είναι επίσης ένα subgame, και έτσι ένα σύνολο τριών subgames.

Τέλεια Ισορροπία Υποπαίγνιου (Subgame Perfect Equilibrium) Ορισμός (Τέλεια Ισορροπία Υποπαίνιου) Ένα προφιλ στρατηγικών s∗ είναι μία Τέλεια Ισορροπία Nash Υποπαίγνιου (Subgame Perfect Nash equilibrium - SPE) στο παίγνιο G αν για κάθε υποπαίγνιο G΄ του G, s∗|G΄ είναι μία ισορροπία Nash του G’. H τελειότητα του υποπαίγνιου θα εξαλείψει τις απειλές που δεν είναι αξιόπιστες, καθώς αυτές δεν θα είναι ισορροπία Nash στα κατάλληλα υποπαίγνια. Στο παιχνίδι αποτροπής εισόδου, μετά την είσοδο, το F δεν είναι η καλύτερη απόκριση και επομένως δεν υπάρχει ισορροπία Nash του αντίστοιχου υποπαίγνιου. Επομένως, (Out, F) δεν είναι SPE. Πώς να βρείτε SPE; Θα μπορούσαμε να βρούμε όλες τις ισορροπίες Nash, όπως για παράδειγμα στο παιχνίδι της αποτροπής εισόδου, και στη συνέχεια να εξαλείψουμε εκείνους που δεν είναι τέλεια υποπαίγνια. Αλλά υπάρχουν πιο οικονομικοί τρόποι να το κάνετε.

Προς τα πίσω επαγωγή (Backward Induction) (1/2) Η προς τα πίσω επαγωγή αναφέρεται στην εκκίνηση από τα τελευταία υποπαίγνια ενός πεπερασμένου παιχνιδιού, στη συνέχεια στην εύρεση των προφίλ στρατηγικής βέλτιστης απόκρισης ή τις ισορροπίες Nash στα υποπαίγνια, στη συνέχεια εκχωρώντας αυτά τα προφίλ στρατηγικών και τις σχετικές αποδόσεις να είναι υποπαίγνια και προχωρώντας διαδοχικά προς την αρχή του παιχνιδιού.

Προς τα πίσω επαγωγή (Backward Induction) (2/2) Θεώρημα Η προς τα πίσω επαγωγή δίνει ολόκληρο το σύνολο των SPE. Απόδειξη: η προς τα πίσω επαγωγή εξασφαλίζει ότι στον περιορισμό του εν λόγω προφίλ στρατηγικής σε οποιοδήποτε υποπαίγνιο υπάρχει μία ισορροπία Nash. Η προς τα πίσω επαγωγή είναι απλή για παίγνια με τέλεια πληροφόρηση και πεπερασμένο ορίζοντα. Για παίγνια ατελούς πληροφόρησης, η προς τα πίσω επαγωγή προχωρεί παρομοίως: εντοπίζουμε τα υποπαίγνια ξεκινώντας από τα φύλλα του δέντρου του παίγνιου και το αντικαθιστούμε με μία από τις αποδόσεις ισορροπίας Nash στο υποπαίγνιο. Για παίγνια απεριόριστου ορίζοντα: θα βασιστούμε σε ένα χρήσιμο χαρακτηρισμό των τέλειων ισορροπιών του υποπαίγνιου που δίνεται από την αρχή της "απόκλισης ενός σταδίου".

Ύπαρξη Τέλειων Ισορροπιών Υποπαίγνιου Θεώρημα Κάθε πεπερασμένο εκτεταμένης μορφής παίγνιο τέλειας πληροφόρησης G έχει μία τέλεια ισορροπία υποπαίγνιου (Subgame Perfect Equilibrium - SPE) καθαρής στρατηγικής. Απόδειξη: Ξεκινήστε από το τέλος με την προς τα πίσω επαγωγή και σε κάθε βήμα μια στρατηγική είναι η καλύτερη απόκριση. Κάθε πεπερασμένο εκτεταμένης μορφής παίγνιο G έχει μία τέλεια ισορροπία υποπαίγνιου (Subgame Perfect Equilibrium - SPE). Απόδειξη: Το ίδιο επιχείρημα με το προηγούμενο θεώρημα, εκτός από το ότι ορισμένα subgames δεν χρειάζεται να έχουν τέλειες (πλήρεις) πληροφορίες και μπορεί να έχουν ισορροπία μικτής στρατηγικής.