Fluxplayer: A successful General Game Player (Stephan Schiffel, Michael Thielscher) Προηγμένη Τεχνητή Νοημοσύνη Νομικός Βαγγέλης 24/01/2008.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Καταδίωξη / Διαφυγή. Οι κανόνες • Ένας «φυγάς», ένας ή περισσότεροι «κυνηγοί» • Κινούνται πάνω σε ένα γράφημα • Στην πιο απλή περίπτωση, μία κίνηση ο.
Advertisements

Βασικές έννοιες αλγορίθμων
Δομές Δεδομένων και Αλγόριθμοι
ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING Τεχνολογία Ορθογραφικής Διόρθωσης Κειμένων Ν.Γλάρος Δρ. Ηλ/γος Μηχανικός.
ΙΣΤΙΟΤΟΠΟΙ-internet ΙΣΤΙΟΤΟΠΟΙ-internet Πως μπορούν οι γονείς να προστατέψουν τα παιδιά ( μέρος1 ).  Οι γονείς πρέπει να προσέχουν τα παιδιά τους την.
Φύση :Mια φίλη ζητά βοήθεια
Project in XSB Prolog Επεξεργασία και Αναπαράσταση Γνώσης Άνοιξη 2008 Τμήμα Επιστήμης Υπολογιστών Πανεπιστημίου Κρήτης.
27 Ιουνίου 2014 ΔΙΑΦΑΝΕΙΑ 1 ΤΥΠΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΛΥΣΗΣ ΣΥΣΤΗΜΑΤΩΝ ΤΜ. ΠΛΗΡΟΦΟΡΙΚΗΣ Α.Π.Θ. – ΔΙΔΑΣΚΩΝ: Π. ΚΑΤΣΑΡΟΣ ΑΥΤΟΜΑΤΑ Ι Αυτόματο ελέγχου πρόσβασης με.
Διαχείριση Έργου Οργάνωση, σχεδιασμός και προγραμματισμός έργων ανάπτυξης λογισμικού.
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΠΛΗ513: ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ Othello – TD Learning Μαντάκος Γιώργος Καθηγητής: Μιχαήλ Γ. Λαγουδάκης.
Πιθανοκρατικοί Αλγόριθμοι
MUltilingual Subtitling of multimediA content
ΕΙΣΑΓΩΓΗ ΣΤΑ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ
Μηχανική Μάθηση και Εξόρυξη Γνώσης
Ανάκτηση & Εξαγωγή Πληροφορίας στο Διαδίκτυο Γιώργος Παλιούρας Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Ε.Κ.Ε.Φ.Ε.
Project Εξαμήνου 2008 Χρήση Ενισχυτικής Μάθησης Για Την Εύρεση Πολιτικών Του Παιχνιδιού Με Χαρτιά Poker. Μιχάλης Τρουλλινός ΑΜ:
Κεφάλαιο 2ο Πεπερασμένα αυτόματα.
ΔΙΔΑΚΤΙΚΗ ΓΝΩΣΕΩΝ, ΣΤΑΣΕΩΝ ΚΑΙ ΔΕΞΙΟΤΗΤΩΝ ΠΡΟΦΟΡΙΚΗ ΕΞΕΤΑΣΗ Σπύρος Κίντζιος.
Ιωάννης Γ. Κοντοχριστόπουλος Τμήμα Ηλεκτρολόγων Μηχανικών & Τεχνολογίας Υπολογιστών Επιβλέπων: Επ. Καθηγητής Κ. Σγάρμπας Τετάρτη 10 Οκτωβρίου 2012.
Η προσομοίωση 11/12/2014 Υοu 4 Teachers Πώς οι εκπαιδευτικοί αντιλαμβάνονται την προσομοίωση  Συζήτηση και καταγραφή εκπαιδευτικών εμπειριών 11/12/2014.
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Κεφ.1 Εισαγωγη στην εννοια του Αλγοριθμου και στον Προγραμματισμο
Εισαγωγή στις αρχές της Επιστήμης των Η/Υ
Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση.
Σχεδίαση Αλγορίθμων. Διεργασίες (1/2) Μία διεργασία αλληλεπιδρά με το περιβάλλον της δεχόμενη είσοδο και παράγοντας έξοδο.
Generating Chinese Classical Poems with Statistical Machine Translation Models Jing He, Ming Zhou, Long Jiang Μαρία Κωστάκη Εθνικό & Καποδιστριακό Πανεπιστήμιο.
Alpha-Beta Pruning for Games with Simultaneous Moves Abdallah Saffidine, Hilmar Finnsson, Michael Buro Παρουσίαση: Βάλβης Δημήτριος Εργασία στο μάθημα.
Μάϊος 2013 Π.Μ.Σ. Πληροφορικής.
Προηγμένη Τεχνητή Νοημοσύνη Solving Dots-And-Boxes Joseph K. Barker and Richard E. Korf Μεταπτυχιακός Φοιτητής: Ιωάννης Σίδερης (Μ1068) 1/500.
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Learning to Learn: Algorithmic Inspirations from Human Problem Solving.
1.5 Γλώσσες Προγραμματισμού
Κατανόηση (δεδομένα – ζητούμενα) Ανάλυση σε απλούστερα προβλήματα Επίλυση με οργανωμένα, απολύτως καθορισμένα, πεπερασμένα βήματα ΑΛΓΟΡΙΘΜΟΣ.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών – Τμήμα Πληροφορικής και Τηλεπικοινωνιών 1 Κεφάλαιο 3 Η Σημασιολογία των Γλωσσών Προγραμματισμού Προπτυχιακό.
Θεωρία Υπολογισμού Πεπερασμένα Αυτόματα. Υπολογισμοί Γλώσσα που αποδέχεται ένας υπολογιστής: Το σύνολο των λέξεων τα οποία οδηγούν σε κατάσταση αποδοχής.
ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ 2: ΘΕΜΑΤΑ ΘΕΩΡΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Η/Υ
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΑΛΓΟΡΙΘΜΩΝ
Project in XSB Prolog Επεξεργασία και Αναπαράσταση Γνώσης Άνοιξη 2009 Τμήμα Επιστήμης Υπολογιστών Πανεπιστημίου Κρήτης.
Διαγνώσιμες και μη-διαγνώσιμες ασυμφραστικές γραμματικές και γλώσσες
Μηχανική Μάθηση σε Συστήματα Πολλαπλών Πρακτόρων Παπαλιάς Κωνσταντίνος Τμήμα Πληροφορικής.
Μεθοδολογικές προσεγγίσεις των κοινωνικών αναπαραστάσεων 1. Πειραματική μελέτη των κοινωνικών αναπαραστάσεων 2. Πειραματικές έρευνες- αναπαράσταση και.
SusCity: κατασκευάζοντας ψηφιακά παιχνίδια αειφόρων πόλεων Ν. Γιαννούτσου Μ. Δασκολιά Μ. Ξένος Εργαστήριο Εκπαιδευτικής Τεχνολογίας
Αθήνα, Νοέμβριος 2011 Το ηλεκτρο-δωμάτιο: ένα διαδραστικό παιχνίδι για τον ηλεκτρισμό Μαρίνα Τομαρά MEd, Εκπαιδευτικός, Φυσικός Ραδιοηλεκτρολόγος,
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
Μεταρρύθμιση Φορολογίας Εισοδήματος. Νέες Κλίμακες Φορολογίας Εισοδήματος Το εισόδημα από μισθούς ( συντάξεις ) και επιχειρηματική δραστηριότητα φορολογείται.
Ανοιχτές δεξιότητες Δεξιότητες που πραγματοποιούνται σε ένα μεταβαλλόμενο και απρόβλεπτο περιβάλλον και απαιτεί από τους εκτελεστές να προσαρμόσουν τις.
ΥΝ Ι: ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ 1 ΥΠΟΛΟΓΙΣΤΙΚΗ ΝΟΗΜΟΣΥΝΗ (Τεχνητά Νευρωνικά Δίκτυα και Γενετικοί Αλγόριθμοι) ΣΠΥΡΟΣ ΛΥΚΟΘΑΝΑΣΗΣ, ΚΑΘΗΓΗΤΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ.
ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΘΕΩΡΙΑΣ ΠΑΙΓΝΙΩΝ Τρίλιζα, Pacman, Age of Empires ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΘΕΩΡΙΑΣ ΠΑΙΓΝΙΩΝ Τρίλιζα, Pacman, Age of Empires Αλέξης Γελαστόπουλος, Βάσω.
Η αξία θέσης των ψηφίων στους φυσικούς αριθμούς. πόσες καρτέλες σαν αυτή;
Πληροφορική 2 Τεχνητή νοημοσύνη 1. Τι είναι τεχνητή νοημοσύνη;  Τεχνητή νοημοσύνη (AI=Artificial Intelligence) είναι η μελέτη προγραμματισμένων συστημάτων.
Η προγραμματιστική δραστηριότητα ως αντικείμενο εκπαίδευσης
ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΕΞΕΛΙΚΤΙΚΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ
Μοντελοποίηση υπολογισμού
Βελτιστοποίηση σε τρίλιζα Καταδίωξη/διαφυγή
Εισαγωγή στην Τεχνητή Νοημοσύνη
Εισαγωγή στα Νευρωνικά Δίκτυα
ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ Εισαγωγή
ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ
ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΕΞΕΛΙΚΤΙΚΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ
Η ΘΕΩΡΙΑ ΤΗΣ ΚΟΙΝΩΝΙΚΟ- ΓΝΩΣΤΙΚΗΣ ΣΥΓΚΡΟΥΣΗΣ
Η Νοτιοανατολική Ευρώπη υπό ξένη κυριαρχία
Τμήμα Μηχανικών Πληροφορικής Τ.Ε.
Η Νοτιοανατολική Ευρώπη υπό ξένη κυριαρχία ( )
Βασικές έννοιες αλγορίθμων
ΔΙΑΓΩΝΙΣΜΟΣ ΣΤΗΝ ΤΑΞΗ ΜΟΝΤΕΡΝΑ ΠΟΙΗΣΗ VS ΠΑΡΑΔΟΣΙΑΚΗ ΠΟΙΗΣΗ.
Εκπαιδευτικό Παιχνίδι Ανακύκλωσης για Mobile Συσκευές
ΝΈΟ ΟΡΓΑΝΟΓΡΑΜΜΑ (ΙΑΝ14) VS. ΕΓΚΡΙΘΕΝ ΟΡΓΑΝΟΓΡΑΜΜΑ (ΑΥΓ13)
ΠΛΗΡΟΦΟΡΙΚΗ Γ΄ Γυμνασίου Α΄ Τρίμηνο
Ζορμπάς – Καζαντζάκης Συναίσθημα – Λογική
ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΗΘΙΚΗ Ζ΄ ΕΞΑΜΗΝΟΥ ΜΕΘΟΔΟΛΟΓΙΑ ΤΗΣ ΗΘΙΚΗΣ
Μεταγράφημα παρουσίασης:

Fluxplayer: A successful General Game Player (Stephan Schiffel, Michael Thielscher) Προηγμένη Τεχνητή Νοημοσύνη Νομικός Βαγγέλης 24/01/2008

Η παρούσα κατάσταση… Το παράδειγμα –IBM: Deep Blue –Deep Blue vs Garry Kasparov (11 Μαΐου 1997) - (2-1-3) Μπορεί να παίξει τρίλιζα;;;;; Τι γνωρίζουμε - πληθώρα εξειδικευμένων συστημάτων Ιδιαιτερότητες - μη αυτόματη προσαρμογή σε αλλαγές κανόνων - αδυναμία για διαφορετικά παιχνίδια Ανθρώπινος Παράγοντας - κανόνες γνωστοί στον προγραμματιστή - ανάλυση του παιχνιδιού - χρήση συγκεκριμένων ευριστικών

Τι θα θέλαμε… Προσδοκίες –καμία προηγούμενη εμπειρία –όχι ανθρώπινη παρέμβαση –ικανό να παίζει τυχαία άγνωστα παιχνίδια –είσοδος η περιγραφή των κανόνων του παιχνιδιού Απαιτήσεις –συνεισφορά από πολλούς τομείς της ΑΙ –αναπαράσταση γνώσης –συλλογιστική –αναζήτηση με χρήση ευριστικών –κατάστρωση σχεδίου –μηχανική μάθηση

Fluxplayer - Η προσέγγιση Fluxplayer  a General Game Player  Successful: Νικητής του ΑΑΑΙ GGP 2006 – Έπαθλο $ Προσέγγιση 1.Αποδείκτης θεωρημάτων / Συλλογιστική 2.Αλγόριθμοι αναζήτησης 3.Ευριστικές συναρτήσεις 4.Αναγνώριση δομών (προσανατολισμός στην φύση του στόχου)

Αποδείκτης Θεωρημάτων - Συλλογιστική (1/3) Αξιωματική περιγραφή των κανόνων του παιχνιδιού Συμβολική αναπαράσταση καταστάσεων, κινήσεων Γλώσσα περιγραφής παιχνιδιών (GDL) Κατάλληλη για περιγραφή πεπερασμένων, ντετερμινιστικών, n-παικτών(ν>=1) παιχνιδιών τέλειας πληροφορίας Σύνολο δεσμευμένων λέξεων με προκαθορισμένη σημασία

H GDL - Εφαρμογή στην τρίλιζα (2/3) οι παίκτες - (role ?player) π.χ. (role xplayer), (role oplayer) αρχική κατάσταση - (init ?fact) π.χ. (init (cell 1 1 b)) νόμιμες κινήσεις - (legal ?p ?m) και (true ?fact) π.χ. (<= (legal ?w (mark ?x ?y)) (true (cell ?x ?y b)) (true (control ?w))) ενημερώσεις θέσης - (next ?fact) και (does ?player ?move) π.χ. (<= (next (cell ?m ?n x)) (does xplayer (mark ?m ?n)) (true (cell ?m ?n b))) τέλος του παιχνιδιού - terminal π.χ. (<= terminal (line x)) (<= terminal (not open)) το αποτέλεσμα – (goal ?player ?value) π.χ. (<= (goal xplayer 100) line(x)) (<= (goal xplayer 50) draw) (<= (goal xplayer 0) line(o))

Αποδείκτης Θεωρημάτων – Συλλογιστική (3/3) Απαιτήσεις –παραγωγή επιτρεπτών κινήσεων –καθορισμός επόμενων ενεργειών και των αποτελεσμάτων αυτών –καθορισμός του τέλους Η ιδέα –μετατροπή από GDL σε Prolog –επιτρέπει αποδοτική απόδειξη θεωρημάτων –χρήση του συστήματος FLUX για συλλογιστική

Αλγόριθμος αναζήτησης Τροποποιημένη επαναληπτική εμβάθυνση πρώτα κατά βάθος –πίνακες αντιμετάθεσης –ευριστικό της ιστορίας Βάθος >>>, μη-ομοιόμορφη πρώτα κατά βάθος αναζήτηση Χρήση τεχνικών κλαδέματος – τύπος παιχνιδιού - single-player vs. multi-player π.χ. alpha-beta κλάδεμα σε παιχνίδια με 2 παίκτες - zero-sum vs. non-zero-sum - turn-taking vs. simultaneous-moves π.χ σε turn-taking υπόθεση μεγιστοποίησης του κέρδους

Ευριστική Συνάρτηση (1/3) Η ανάγκη –περιορισμός του χώρου καταστάσεων –όχι εξαντλητική αναζήτηση –αξιολόγηση μη τερματικών καταστάσεων –αδυναμία χρήσης προκαθορισμένων ευριστικών Η ιδέα –αυτόματη παραγωγή ευριστικών σε χρόνο εκτέλεσης –χρήση ασαφής λογικής (fuzzy logic) –σε κάθε κατάσταση, υπολογισμός του βαθμού αληθείας για τα κατηγορήματα goal και terminal –αποφυγή τερματικών καταστάσεων όταν ο στόχος δεν ικανοποιείται

Ευριστική Συνάρτηση (2/3) Ο κόσμος των κύβων Βαθμός αληθείας κάθε όρου ξεχωριστά Επιλογή κατάλληλης t-νόρμας και t-co-νόρμας για υπολογισμό πολύπλοκων εκφράσεων Διαφορετική εκτίμηση συνάρτησης αξιολόγησης για πολλαπλούς στόχους Αναγωγή σε επιλογή κατάλληλης t-νόρμας

Ευριστική Συνάρτηση (3/3) Χρήση t-norm της οικογένειας του Yager Εξάρτηση από δομή εκφράσεων goal και terminal Αξιολόγηση όλων των πιθανών στόχων σε σχέση με τις τερματικές καταστάσεις Η τιμή της ευριστικής συνάρτησης για μια κατάσταση υπολογίζεται από τον συνδυασμό της εκτίμησης για κάθε στόχο ξεχωριστά επί την τιμή του στόχου αυτού

Αναγνώριση Δομών Η ιδέα –εντοπισμός συγκεκριμένων δομών (σχέσεις διαδοχής, διάταξης, ποσότητες, πίνακες παιχνιδιού) –συντακτική και σημασιολογική ανάλυση των κανόνων και των ιδιοτήτων τους –π.χ δυαδικές σχέσεις, μεταβατικές και αντι-συμμετρικές => σχέσεις διάταξης Πλεονεκτήματα: –διάκριση μεταξύ σημασιολογικά ισοδύναμων αλλά συντακτικά διαφορετικών περιγραφών ενός κατηγορήματος –βελτίωση της συνάρτησης αξιολόγησης

Αξιολόγηση (1/2) Το πρόβλημα –δυσκολία εύρεσης ενός δίκαιου σχήματος αξιολόγησης –εξάρτηση από πολλούς παράγοντες (το παιχνίδι που παίζεται, οι αντίπαλοι, ο χρόνος που δίνεται για ανάλυση κ.α) –ανυπαρξία προκαθορισμένων δοκιμασιών Η λύση –αποτελέσματα από >400 αγώνες (>70 για κάθε παίκτη) του ΑΑΑΙ GGP Competition 2006 Πλεονέκτημα –αναμέτρηση με πραγματικούς αντιπάλους –σύγκριση με «state of the art» συστήματα

Αξιολόγηση (2/2) Κατηγοριοποίηση παιχνιδιών βάσει ιδιοτήτων Παιχνίδια με παραπάνω από μία ιδιότητες Καμία κατηγορία υποσύνολο κάποιας άλλης Σύγκριση μέσου σκορ ανά τύπο παιχνιδιών με –συνολικό του μέσο σκορ –μέσο σκορ των 6 καλύτερων παικτών Το πλεονέκτημα: –Η αναγνώριση ποσοτήτων και σχέσεων διάταξης Το μειονέκτημα: –η εξάρτηση από την περιγραφή του στόχου

Συμπεράσματα Παραγωγή ευριστικών ταχύτερη από προσεγγίσεις μάθησης Εύκολη επέκταση σε παιχνίδια όχι τέλειας πληροφορίας Άφθονος χώρος για βελτιώσεις Μελλοντικές επεκτάσεις –χρήση τεχνικών αφαίρεσης και γενίκευσης –χρήση μεθόδων από την θεωρία παιγνίων –ανάλυση της επιρροής διαφορετικών συναρτήσεων αξιολόγησης στην απόδοση παιξίματος παιχνιδιών –ορισμός ρεαλιστικών μοντέλων αντιπάλων και συνόλων δοκιμασιών

Το ερώτημα… Τι νόημα έχουν τελικά όλα αυτά??? Κριτική: “Το παίξιμο παιχνιδιών είναι ασήμαντο” Απάντηση: “General Game Playing δεν είναι απλά ένα παιχνίδι! GGP is serious business!”

Αναφορές Kuhlmann, G.; Dresner, K.; and Stone, P Automatic heuristic construction in a complete general game player. In proc. Of AAAI, Schaeffer, J The history heuristic and alpha-beta search enhancements in practice. IEEE Transactions on Pattern Analysis and Machine Intelligence 11(11) Thielscher, M Reasoning Robots: The art and Science of Programming Robotic Agents. Applied Logic Series. Kluwer

Ευχαριστώ !!! Ερωτήσεις???