ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΘΕΩΡΙΑΣ ΠΑΙΓΝΙΩΝ Τρίλιζα, Pacman, Age of Empires ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΘΕΩΡΙΑΣ ΠΑΙΓΝΙΩΝ Τρίλιζα, Pacman, Age of Empires Αλέξης Γελαστόπουλος, Βάσω.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Καταδίωξη / Διαφυγή. Οι κανόνες • Ένας «φυγάς», ένας ή περισσότεροι «κυνηγοί» • Κινούνται πάνω σε ένα γράφημα • Στην πιο απλή περίπτωση, μία κίνηση ο.
Advertisements

Αξέχαστα... Ποιος δεν θα ήθελε να επιστρέψει στα χρόνια που:
Ανταλλαγή Μηνυμάτων και Προσδιορισμός Ρόλων μέσω Στρατηγικών
Πώς μπορείς να μάθεις να χρησιμοποιείς τις πιθανότητες.
Το Μπριτζ είναι ένα παιχνίδι στατιστικής και η τεχνική της εμπάς ταιριάζει πολύ Οι πρωταθλητές προσπαθούν να ακολουθούν κάθε φορά το πλάνο με τις.
Aυτόνομοι Πράκτορεσ Ενισχυτική μαθηση σto Peg Solitaire
Ο ΣΥΓΧΡΟΝΟΣ ΤΡΟΠΟΣ ΕΚΠΑΙΔΕΥΣΗΣ ΤΩΝ ΕΠΑΓΕΛΜΑΤΙΩΝ ΥΓΕΙΑΣ Κοντές Ιωάννης ( ΑΕΜ :30650, γ εξάμηνο ) Τσιονάς Ιωάννης ( ΑΕΜ :30694, γ εξάμηνο )
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΠΛΗ513: ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ Othello – TD Learning Μαντάκος Γιώργος Καθηγητής: Μιχαήλ Γ. Λαγουδάκης.
ΕΡΓΑΣΙΑ Α΄ ΤΡΙΜΗΝΟΥ Κ ΕΊΜΕΝΑ Ν ΕΟΕΛΛΗΝΙΚΉΣ Λ ΟΓΟΤΕΧΝΊΑΣ Μ ΑΡΊΑ Μ ΟΥΡΚΟΚΏΣΤΑ Τ ΜΉΜΑ Α'2 Το σοφό σπουργίτι.
Παραδοσιακά παιχνίδια
Age of Empires 2. Το θυμάστε; Αν η απάντησή σας είναι «1», τότε τα παρακάτω θα σας αρέσουν! Για λίγη ώρα ας μείνουμε στο κομμάτι της τεχνητής νοημοσύνης.
Ο αλγόριθμος του Ukkonen Βεργούλης Θανάσης Το suffix trie Το suffix trie του string D=“book” b o o k o o k k k $ $ $ $
Κοινωνίες και συνεργασία
Project Εξαμήνου 2008 Χρήση Ενισχυτικής Μάθησης Για Την Εύρεση Πολιτικών Του Παιχνιδιού Με Χαρτιά Poker. Μιχάλης Τρουλλινός ΑΜ:
Εισαγωγικές Έννοιες Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
Αποτελέσματα Axelrod Η στρατηγική Tit-for-Tat επικράτησε μετά από πολλές γενιές Όταν όλοι παίζουν Tit-for-Tat έχουμε σημείο ισορροπίας Φαινόταν ότι το.
Fluxplayer: A successful General Game Player (Stephan Schiffel, Michael Thielscher) Προηγμένη Τεχνητή Νοημοσύνη Νομικός Βαγγέλης 24/01/2008.
Πιθανότητες ΜυριάννηΝάσια Δημοτικό Σχολείο Αγίου Αντωνίου.
Προσεγγιστικοί Αλγόριθμοι
ΔΙΔΑΚΤΙΚΗ ΓΝΩΣΕΩΝ, ΣΤΑΣΕΩΝ ΚΑΙ ΔΕΞΙΟΤΗΤΩΝ ΠΡΟΦΟΡΙΚΗ ΕΞΕΤΑΣΗ Σπύρος Κίντζιος.
Ιωάννης Γ. Κοντοχριστόπουλος Τμήμα Ηλεκτρολόγων Μηχανικών & Τεχνολογίας Υπολογιστών Επιβλέπων: Επ. Καθηγητής Κ. Σγάρμπας Τετάρτη 10 Οκτωβρίου 2012.

Η ΓΛΩΣΣΑ C ΜΑΘΗΜΑ 2.
Τυχαιοκρατικοί Αλγόριθμοι TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA Πιθανότητες και Αλγόριθμοι Ανάλυση μέσης.
Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση.
ΨΗΦΙΑΚΑ ΕΚΠΑΙΔΕΥΤΙΚΑ ΠΑΙΧΝΙΔΙΑ
Διδακτική της Πληροφορικής Παρουσίαση εκπαιδευτικών παιχνιδιών με σκοπό την κατανόηση βασικών αρχών της πληροφορικής Αντωνακάκη Δέσποινα Α.Μ 933 Καντεράκης.
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
Alpha-Beta Pruning for Games with Simultaneous Moves Abdallah Saffidine, Hilmar Finnsson, Michael Buro Παρουσίαση: Βάλβης Δημήτριος Εργασία στο μάθημα.
2η Διάλεξη: Μαθηματική Ανάλυση, Διαπραγματεύσεις, Δικαιοσύνη
Προηγμένη Τεχνητή Νοημοσύνη Solving Dots-And-Boxes Joseph K. Barker and Richard E. Korf Μεταπτυχιακός Φοιτητής: Ιωάννης Σίδερης (Μ1068) 1/500.
Impasse Finesse Sorpasso Snit Εμπάς Κατάλαβα ξέρεις ξένες γλώσσες! Να παίζεις όμως bridge μπορείς; Η εμπάς (η αλλιώς τυλιχτή) είναι κόλπο του εκτελεστή!
Θεωρία Υπολογισμού Εισαγωγή (μέρος 3 ο ). Χρειαζόμαστε Μοντέλα Εμπρός πατάκι Πίσω πατάκι Πόρτα ΚλειστόΑνοιχτό.
Ελάχιστο Συνδετικό Δέντρο
Θεωρία Παιγνίων και Εφαρμογές
Searching Game Trees. The top-level statement play(Game) :- initialize(Game,Position,Player), display_game(Position,Player), play(Position,Player,Result).
Το θεωρητικό πλαίσιο των εννοιών της “Μακρο-Κουλτόυρας” (Macroculture) και της “Περιορισμένης Ορθολογικότητας” (Bounded Rationality) Μακρο-κουλτούρα: Σύστημα.
ΒΑΣΕΙΣ ΚΑΝΟΝΩΝ Οι άνθρωποι συνήθως/μάλλον δεν παίζουν με minimax! Πολλές φορές παίζουμε ένα παιχνίδι χρησιμοποιώντας απλούς κανόνες. Π.χ. στην τρίλιζα:
Διακριτά Μαθηματικά Ι Γιώργος Γεωργιάδης (σύμφωνα με τις παραδόσεις του Λευτέρη Κυρούση) Σημειώσεις του μαθήματος Διάλεξη 8η.
Μηχανική Μάθηση σε Συστήματα Πολλαπλών Πρακτόρων Παπαλιάς Κωνσταντίνος Τμήμα Πληροφορικής.
Αυτόνομοι Πράκτορες Ενισχυτική Μάθηση (Q-learning algorithm) in PONG Χανιά, 4/3/2011 Μπαμπαλής Μπάμπης.
Δρ. Πολύκαρπος Ευριπίδου Η πρωτη βοηθεια είναι το συνολο των ενεργειων που θα παρασχεθουν σε ένα τραυματια η έναν ασθενη πριν την επεμβαση του.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ Παραδείγματα BP.
1 Κ ΕΦΑΛΑΙΟ 14 ο: Θεωρία παιγνίων Παρακίνηση: Honda και Toyota 2. Ισορροπία κατά Nash 3. Το δίλημμα του φυλακισμένου 4. Ισορροπία με κυρίαρχη στρατηγική.
ΜΠΕΜΠΕΤΣΟΣ ΕΥΑΓΓΕΛΟΣ Ph.D.. ΤΙ ΕΙΝΑΙ;; «Είναι Ένα Από Τα Μικρά Μυστικά Του Ελέγχου Της Σκέψης. Ο Θετικός Αυτοδιάλογος Βοηθάει Τους Αθλητές/τριες Να Βρίσκονται.
Η ΕΚΠΑΙΔΕΥΣΗ ΥΓΕΙΑΣ ΣΤΗΝ ΚΟΙΝΟΤΗΤΑ. Βήματα ανάπτυξης εκπαιδευτικού προγράμματος στην κοινότητα Εντοπισμός μιας ειδικής για ένα πληθυσμό ανάγκης για μάθηση.
 Παίζοντας οι ίδιοι παραδοσιακά παιχνίδια ( Μακριά γαϊδούρα, τυφλόμυγα, κυνηγητό) και διακινδυνεύοντας τα σχόλια των συμμαθητών μας!!!  Ρωτώντας.
ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΣΥΣΤΗΜΑΤΩΝ ΕΦΟΔΙΑΣΜΟΥ ΑΡΧΕΣ ΛΟΓΙΣΤΙΚΗΣ ΚΑΘΗΓΗΤΗΣ: Δρ ΠΑΝΑΓΙΩΤΗΣ ΚΩΤΣΙΟΣ ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ 2015/2016.
ΜΑΘΗΜΑ 11: ΑΜΟΙΒΕΣ, ΠΟΙΝΕΣ ΚΑΙ ΕΣΩΤΕΡΙΚΑ ΚΙΝΗΤΡΑ ΣΤΗ ΦΥΣΙΚΗ ΑΓΩΓΗ ΙΕΚ ΑΙΓΕΑΣ ΠΡΟΠΟΝΗΤΗΣ ΑΘΛΗΜΑΤΩΝ Μουστάκα Φρίντα Καθηγήτρια Φυσικής Αγωγής, MSc, Med,
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ
Η πλατφόρμα Βασίλης Γαργανουράκης Υπεύθυνος 2ου ΕΚΦΕ Ηρακλείου
ΗΘΙΚΗ & ΗΘΙΚΗ ΑΝΑΠΤΥΞΗΣ
Βελτιστοποίηση σε τρίλιζα Καταδίωξη/διαφυγή
Αναζήτηση με Αντιπαλότητα
Αραμπατζή Ερασμία_537 Γρηγοριάδου Δέσποινα_538 Ρόγκου Ευφροσύνη_544
ΠΟΛΥΩΝΥΜΙΚΗ ΚΑΤΑΝΟΜΗ Στη θεωρία των πιθανοτήτων η πολυωνυμική κατανομή είναι μια γενίκευση της διωνυμικής κατανομής. Η διωνυμική κατανομή είναι η κατανομή.
Αλληλεπιδράσεις πρακτόρων
Η Ρομποτική στην Εκπαίδευση
Στρατηγικές πληροφορημένης αναζήτησης
Αντικείμενα Συμπεριφορές Γεγονότα
Παιχνίδια από το παρελθόν
Αξέχαστα....
Kλυτία, η νύμφη που έγινε ηλιοτρόπιο
ΟΜΑΔΑ Ομαδική εργασία Τζιάτζιος Δημήτριος Ψουρούκα Ευαγγελία
Σταθερά ΚΕΣΠΕΜ Κομοτηνής Εκπαιδευτικός: Κυριακή Ζαφείράκη Επιστημονική Υπεύθυνη: Μαρία Ζωγραφάκη Επόπτρια: Μαρία Γραμματίκα Τάξη: Στ Αριθμός Παιδιών:
Ποτέ μόνοι μας… Χρησιμοποιούμε το Διαδίκτυο για να ακούσουμε μουσική, να δούμε ταινίες, να παίξουμε παιχνίδια, αλλά ΜΑΖΙ με τα αδέρφια και τους φίλους.
Προσέγγιση στην επαλληλία των κινήσεων
ΑΞΕΧΑΣΤΑ.....
Μεταγράφημα παρουσίασης:

ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΘΕΩΡΙΑΣ ΠΑΙΓΝΙΩΝ Τρίλιζα, Pacman, Age of Empires ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΘΕΩΡΙΑΣ ΠΑΙΓΝΙΩΝ Τρίλιζα, Pacman, Age of Empires Αλέξης Γελαστόπουλος, Βάσω Καλαϊτζίδου, Θανάσης Κεχαγιάς 1 η Διάλεξη: Εισαγωγή, Δέντρο Παιχνιδιού, Παιχνίδια με γύρους 2 η Διάλεξη: Βελτιστοποίηση 3 η Διάλεξη: Βάσεις Κανόνων (και Age of Empires!!!)

ΕΙΣΑΓΩΓΗ

Περί της Θεωρίας Παιγνίων Θεωρία Παιγνίων: “Η μαθηματική θεωρία της σύγκρουσης και της συνεργασίας” “ Ότι είναι η Θεωρία Πιθανοτήτων για τα παίγνια τύχης, είναι η Θεωρία Παιγνίων για τα στρατηγικά παίγνια”. Βασικές Έννοιες Minimax (Εγωιστική) Βελτιστοποίηση Μάθηση

Το Δίλημμα του Φυλακισμένου (Γενίκευση)

D D C 3 0 C ΔΦ: Το Δέντρο του Παιχνιδιού D C =min(3,0)1=min(5,1) 1=max(0,1)

Δίλημμα του Φυλακισμένου σε 2 Γύρους CC CD DCDD CC CD DCDD CC CD DCDD CC CD DCDD DC DD =max(min(6,3),min(8,4))

Τρίλιζα (Ένα παιχνίδι με γύρους και εναλλαγή κινήσεων.)

Τρίλιζα: το Δέντρο του Παιχνιδιού

Τρίλιζα: Βέλτιστη Στρατηγική Μπορούμε να γράψουμε το δέντρο των κινήσεων. Άρα μπορούμε να υπολογίσουμε την βέλτιστη κίνηση για κάθε παίκτη και για κάθε κατάσταση του παιχνιδιού. Άρα υπάρχει μια βέλτιστη στρατηγική για κάθε παίκτη. Χ t = F(X t-1, u t ) u t = g(X t-1 ) Χ t = F(X t-1, g(X t-1 ) ) = H(X t-1 )

Τρίλιζα με Υπολογιστή (και Zillions of Games)

Άλλα παιχνίδια με γύρους: Σκάκι, Ντάμα, … ΣΚΑΚΙ Μπορούμε (θεωρητικά) να γράψουμε το δέντρο των κινήσεων. Μπορούμε (θεωρητικά) να υπολογίσουμε την βέλτιστη κίνηση u t =g(X t-1 ) για κάθε X t-1. Άρα υπάρχει (για κάθε παίκτη) βέλτιστη στρατηγική στο σκάκι. ΝΤΑΜΑ: το ίδιο.

Άλλο ένα παιχνίδι με γύρους

Άλλο ένα παιχνίδι με γύρους: NeoPacman (computer demo) Πώς βρίσκει ο υπολογιστής την βέλτιστη στρατηγική?

Ένα γράφημα: G = (V,E) V το σύνολο των κόμβων Ε το σύνολο των ακμών

Άλλο ένα παιχνίδι με γύρους: Καταδίωξη / Διαφυγή

Άλλο ένα παιχνίδι με γύρους: Καταδίωξη / Διαφυγή (computer demo)

Καταδίωξη / Διαφυγή : Εφαρμογή στην Ρομποτική (εδώ βίντεο)

 Ανάλυση και game tree  Κανόνες  Βελτιστοποίηση Νέα έννοια:  Εκμάθηση (learning)

 Ντάμα (Samuels, 1959 IBM)  Τρίλιζα (Μichie, 1961 UoE)  Pacman  Σκάκι;

Χωρίς συνεργασία 1 ή περισσότεροι γύροι Πολλές επαναλήψεις

 Της δίνουμε τους κανόνες  Σε κάθε πιθανή κίνηση για κάθε θέση παιχνιδιού αντιστοιχίζουμε μια ‘’αξία’’  Η επιλογή της κάθε κίνησής της θα γίνεται ΤΥΧΑΙΑ με μία συνάρτηση random( ) ανάμεσα από όλες τις δυνατές κινήσεις με συντελεστή βαρύτητας την ’’αξία’’ τους.

 Αν χάσει, την τιμωρούμε μειώνοντας τις αξίες των κινήσεων που χρησιμοποίησε  Αν κερδίσει την επιβραβεύουμε αυξάνοντας τις αντίστοιχες αξίες

Μετά από πολλούς γύρους κάποιες κινήσεις θα έχουν ’’απορριφθεί’’ (αξία 0) ενώ κάποιες άλλες θα γίνουν αποκλειστικές Κάπου εκεί, ο υπολογιστής μας έχει γίνει αήττητος!

1. Επιβράβευση 2. Τιμωρία 3. Συνδυασμός Επιβράβευσης – Τιμωρίας Ποιο σύστημα είναι το πιο κατάλληλο;

Δεν κάνει ποτέ λάθη απροσεξίας Αναλύει κινήσεις και σκέφτεται πολύ πιο γρήγορα από τον άνθρωπο Θα μπορεί να βελτιώνει τις ικανότητές της χωρίς όρια

Μπορεί να φτιάξει κανείς ένα learning machine χωρίς να ξέρει προγραμματισμό Δε θα χρειαστεί ούτε καν… υπολογιστή!

 Για κάθε θέση παιχνιδιού υπήρχε ένα σπιρτόκουτο  Για κάθε κίνηση υπήρχε μέσα στο σπιρτόκουτο μια χρωματιστή μπίλια  Για να διαλέξει κίνηση, ανακάτευε τις μπίλιες και έπαιρνε μια τυχαία

 Υπήρχαν σειρές από σπιρτόκουτα για τον 3ο, 5ο, 7ο και 9ο γύρο του παιχνιδιού  Συνολικά χρειάστηκαν 300 σπιρτόκουτα (και πολύς ελεύθερος χρόνος) Κάτι πιο …οικονομικό είναι το HER (hexapawn educable robot)

 Φας όλα τα πιόνια του αντιπάλου  Φτάσει ένα από τα πιόνια σου στην απέναντι πλευρά  Έρθει η σειρά του αντιπάλου και δεν μπορεί να κάνει κίνηση

1η κίνηση υπολογιστή (2 σπιρτόκουτα) Θέση Α Θέση Β

4 ος γύρος (2 η κίνηση του her)

6 ος γύρος (3 η κίνηση του her)

Νέα μηχανή: ΗΙΜ (hexapawn instructable machine) Τι θα γίνει αν τις βάλουμε να παίξουν μεταξύ τους;