Αυτόνομοι Πράκτορες 2010 Project: Ms Pac-man Παπαδημητρίου Γεώργιος.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Aυτόνομοι Πράκτορεσ Ενισχυτική μαθηση σto Peg Solitaire
Advertisements

Εργασία στο μάθημα «Αυτόνομοι πράκτορες»
Σημασία δεδομένων, πληροφορίας και γνώσης
Παράδειγμα 2: Κινηματογράφοι Να γραφεί πρόγραμμα το οποίο:
Άλκης Γεωργόπουλος Δεκέμβριος 2002
Μαθηματικοί Υπολογισμοί Χειμερινό Εξάμηνο η Διάλεξη Επίλυση Εξισώσεων Νοέμβρη 2002.
ΠΛΗ513 – ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ ΕΡΓΑΣΙΑ ΕΞΑΜΗΝΟΥ 2012 Ακασιάδης Χαρίλαος.
Εκπαιδευτής: Tάσος Μπούντης Τμήμα Μαθηματικών Πανεπιστήμιο Πατρών
ΚΕΦΑΛΑΙΟ 2 ΕΥΘΥΓΡΑΜΜΗ ΚΙΝΗΣΗ
Project Εξαμήνου 2008 Χρήση Ενισχυτικής Μάθησης Για Την Εύρεση Πολιτικών Του Παιχνιδιού Με Χαρτιά Poker. Μιχάλης Τρουλλινός ΑΜ:
ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ Queuing Systems Διαδικασίες Γεννήσεων-Θανάτων (Birth-Death), Εξισώσεις Ισορροπίας, Συστήματα Αναμονής Μ/Μ/1 Β. Μάγκλαρης
ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ Διαδικασίες Γεννήσεων – Θανάτων (Birth-Death Processes)
Δυναμικός Προγραμματισμός
ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ Queuing Systems Κατανομή Poisson, Διαδικασίες Markov, Διαδικασίες Γεννήσεων-Θανάτων (Birth-Death) Β. Μάγκλαρης
ΕΚΠ 413 Αυτόνομοι Πράκτορες Παρουσίαση Εργασίας Εξαμήνου AIBO in Wumpus Cave Βασιλικός Βασίλης.
ANAKOINWSH H 2η Ενδιάμεση Εξέταση μεταφέρεται στις αντί για , την 24 Νοεμβρίου στις αίθουσες ΧΩΔ και 110 λόγω μη-διαθεσιμότητας.
ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ 11/04/13 Διαδικασίες Γεννήσεων-Θανάτων (Birth- Death), Εξισώσεις Ισορροπίας, Συστήματα Αναμονής Μ/Μ/1.
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
Διασκεδάζω Προγραμματίζοντας στο code.org
Γιάννης Σταματίου Αναδρομή και αναδρομικές σχέσεις
Grid World με αντίπαλο - κυνηγό ΠΛΗ513 ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ ΜΑΪΝΑΣ ΝΙΚΟΣ
ΜΑΘΗΜΑ: ΣΧΕΔΙΑΣΗ ΑΛΓΟΡΙΘΜΩΝ ΔΙΔΑΣΚΩΝ: Π. ΚΑΤΣΑΡΟΣ Παρασκευή, 3 Απριλίου 2015Παρασκευή, 3 Απριλίου 2015Παρασκευή, 3 Απριλίου 2015Παρασκευή, 3 Απριλίου 2015Τμ.
Τι άλλαξε στα νέα αναλυτικά προγράμματα;. Βασικοί άξονες του νέου Αναλυτικού Προγράμματος Βασικοί άξονες του νέου Αναλυτικού Προγράμματος Ένα συνεκτικό.
ΒΕΣ 06: Προσαρμοστικά Συστήματα στις Τηλεπικοινωνίες © 2007 Nicolas Tsapatsoulis Προσαρμοστικοί Αλγόριθμοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων: Ο αλγόριθμος.
Διάλεξη 8η: Διαγραμματική επίλυση προβλημάτων ελαχίστου κατά την εφαρμογή του γραμμικού προγραμματισμού στη γεωργική παραγωγή 1.Στην περίπτωση των κλάδων.
Αυτόνομοι Πράκτορες ( Εργασία Εξαμήνου ) Απόδραση TUC_Robot από λαβύρινθο ! Χρίστος Παρασκευά
ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ 07/05/09 Εκθετική Κατανομή, Διαδικασίες Birth-Death.
ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ 13/06/07 Διαδικασίες Γεννήσεων Θανάτου Εξισώσεις Ισορροπίας.
Μηχανική Μάθηση σε Συστήματα Πολλαπλών Πρακτόρων Παπαλιάς Κωνσταντίνος Τμήμα Πληροφορικής.
Διάλεξη 14: Εισαγωγή στη ροή ρευστών
Εύρεση Ακμών σε Ψηφιακές Εικόνες αποχρώσεων του γκρι
ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ 23/04/12 Διάγραμμα Μετάβασης Καταστάσεων, Εξισώσεις Ισορροπίας, Συστήματα Αναμονής Μ/Μ/1.
ΦΥΣΙΚΟ ΚΑΙ ΚΟΙΝΩΝΙΚΟ ΠΕΡΙΒΑΛΛΟΝ
Αυτόνομοι Πράκτορες Ενισχυτική Μάθηση (Q-learning algorithm) in PONG Χανιά, 4/3/2011 Μπαμπαλής Μπάμπης.
Αναστοπούλου Μαριάννα Καθηγήτρια Μουσικής και Σχολικού Επαγγελματικού Προσανατολισμού.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
Σχολικό έτος B’ Λυκείου  Μαθήματα  Ομάδες προσανατολισμού Γ’ Λυκείου  Ομάδες προσανατολισμού  Επιστημονικά Πεδία
Αντιρατσιστική Εκ π αίδευση Βασικές αρχές ΣΧΟΛΕΙΟ ΧΩΡΙΣ ΡΑΤΣΙΣΜΟ ΣΧΟΛΕΙΟ ΜΕ ΑΝΕΚΤΙΚΟΤΗΤΑ.
Project Α’ Τετραμήνου Β’ Λυκέιου. Εισαγωγή  Μανιτάρι ονομάζεται κοινώς το ορατό μέρος πολυκύτταρων μυκήτων με τη χαρακτηριστική, συνήθως ομβρελοειδή.
Λήψη σύνθετων αποφάσεων. Ακολουθιακά προβλήματα αποφάσεων Η χρησιμότητα του αποτελέσματος κάθε ενέργειας, που μπορεί να επιλέξει σε μια χρονική στιγμή.
Συστήματα Υποστήριξης Αποφάσεων Θεωρία Αποφάσεων.
ΓΕΝΙΚΟ ΛΥΚΕΙΟ ΛΟΥΤΡΩΝ ΑΙΔΗΨΟΥ Ερευνητική Εργασία (Project) Ομάδα 1 Αναστασιάδη Ανδριανή Στεργίου Μαρία - Ιωάννα Χασάϊ Φιορίντα Χουλιαράκη Αλεξάνδρα Ομάδα.
1 Ο ΕΠΑΛ ΣΤΑΥΡΟΥΠΟΛΗΣ ΣΧΟΛ. ΕΤΟΣ Α΄ΤΕΤΡΑΜΗΝΟ ΜΑΘΗΜΑ ΕΡΕΥΝΗΤΙΚΗ ΕΡΓΑΣΙΑ ( PROJECT) ΥΠΕΥΘΥΝΕΣ ΚΑΘΗΓΗΤΡΙΕΣ : ΠΑΛΑΙΟΛΟΓΟΥ ΒΙΚΤΩΡΙΑ ΑΜΠΕΡΙΑΔΟΥ ΔΕΣΠΟΙΝΑ.
AΘΛΗΤΙΣΜΟΣ 1.Ο αθλητισμός στην Αρχαία Ελλάδα Οι ρίζες του ελληνικού αθλητισμού μπορούν να αναζητηθούν στην Εποχή του Χαλκού. Στους ιστορικούς χρόνους οι.
Όνομα εκπαιδευτικών που συμμετέχουν :, Καλλιόπη Κάμπουρα. Γεωργία Κάσπαρη, Ανδριάνα Μπακόλα. Σχολική Μονάδα : 2 ο και 6 ο Νηπιαγωγείο Χίου. Σχολική τάξη.
Θέμα Εργασίας : ΙΡΙΔΙΣΜΟΣ Project : 5 Μανιφάβα Αλεξάνδρα.
ΖΑΧΑΡΙΑΣ ΠΑΠΑΝΤΩΝΙΟΥ ΤΑ ΨΗΛΑ ΒΟΥΝΑ PROJECT Α’ ΛΥΚΕΙΟΥ.
Σήματα και Συστήματα 11 10η διάλεξη. Σήματα και Συστήματα 12 Εισαγωγικά (1) Έστω γραμμικό σύστημα που περιγράφεται από τη σχέση: Αν η είσοδος είναι γραμμικός.
Labyrinth Project : AIBO and Labyrinth. Βασική Ιδέα Απόδραση του ΑΙΒΟ από λαβύρινθο Χρηση αλγορίθμου Left Wall Following Καταγραφή των κελιών που πέρασε.
Λήψη αποφάσεων Ληψη Αποφαςεων Γ. Καμπουρίδης.
Ερευνητική εργασία της Α΄ τάξης του ΓΕΛ Λουτρών Αιδηψού
Επίλυση Προβλημάτων με Αναζήτηση
Project για την κολύμβηση για όλες τις ηλικίες και κατηγορίες ατόμων
Λήψη Απλών Αποφάσεων 16/12/2017 Λήψη Απλών Αποφάσεων.
Ερωτήσεις 1. Στην ευθύγραμμη ομαλά επιταχυνόμενη κίνηση: α. η ταχύτητα είναι σταθερή β. ο ρυθμός μεταβολής της ταχύτητας είναι σταθερός γ. ο ρυθμός μεταβολής.
ΧΠΕ - ΟΙ ΠΟΡΟΙ ΣΤΟ MS PROJECT
2η ΔΙΑΛΕΞΗ ΕΡΓΟ.
Η ΕΙΡΗΝΗ ΣΤΟΝ ΚΟΣΜΟ ΠΡΟΤΥΠΟ ΠΕΙΡΑΜΑΤΙΚΟ ΓΥΜΝΑΣΙΟ ΕΥΑΓΓΕΛΙΚΗΣ ΣΧΟΛΗΣ ΣΜΥΡΝΗΣ ΤΑΞΗ-ΤΜΗΜΑ: Α’2 ΣΧΟΛΙΚΟ ΕΤΟΣ: ΜΑΘΗΜΑ: ΘΡΗΣΚΕΥΤΙΚΑ ΥΠΕΥΘΥΝΟΣ ΚΑΘΗΓΗΤΗΣ:
Project: ΟΙ ΜΙΚΡΟΕΛΕΓΚΤΕΣ στη ζωΗ μαΣ
ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ΠΡΟΤΖΕΚΤ (PROJECT)
Νοήμονες Πράκτορες.
Ονοματεπώνυμο Σπουδάστριας: Ευαγγελία Δάπκα
Βασίλης Μάγκλαρης 16/3/2016 ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ Queuing Systems Ιδιότητες Κατανομής Poisson & Εκθετικής Κατανομής Διαδικασίες Γεννήσεων.
ΤΑΛΑΝΤΩΣΕΙΣ.
Τμήμα Μηχανικών Πληροφορικής Τ.Ε.
Γενική μεθοδολογία στις κινήσεις (1)
Δένδρα αποφάσεων (Decision trees)
Κινήσεις και γραφικές παραστάσεις
الشـــغل والطـــاقة الشغل
Δένδρα αποφάσεων (Decision trees)
Μεταγράφημα παρουσίασης:

Αυτόνομοι Πράκτορες 2010 Project: Ms Pac-man Παπαδημητρίου Γεώργιος

Πρόβλημα: Ο πράκτορας πρέπει να αποφασίζει κάθε στιγμή ποιά κατεύθυνση θα ακολουθήσει μέσα στο λαβύρινθο. Πρόβλημα ακολουθιακής λήψης αποφάσεων. Κάθε ακολουθία αποφάσεων έχει και μια διαφορετική συνολική χρησιμότητα για τον πράκτορα. Ο πράκτορας γνωρίζει κάθε στιγμή την κατάσταση του λαβύρινθου στον οποίο κινείται. Ο πράκτορας έχει ως απώτερο σκοπό να καταναλώσει όλα τα χάπια που υπάρχουν στο λαβύρινθο.

Πρόβλημα: Ποιά ακολουθία αποφάσεων θα μας δώσει το μέγιστο κέρδος? Ο πράκτορας δεν μπορεί να προβλέψει τις κινήσεις των φαντασμάτων. Ο πράκτορας δεν μπορεί να «αργήσει» για να πάρει μια απόφαση.(Χρονικό όριο)

Μοντελοποίηση προβλήματος Για την μοντελοποίηση του προβλήματος και την εξαγωγή των δεδομένων απο το παιχνίδι χρησιμοποιήθηκε η τεχνική screen capture. Φωτογραφίζουμε την κατάσταση του κόσμου κάθε 5ms. Αναλύουμε τα pixels της εικόνας και δημιουργούμε έναν δισδιάστατο πίνακα που αναπαριστά τον λαβύρινθο του πράκτορα.

Μοντελοποίηση προβλήματος Πρόσεγγίζουμε το κάθε στιγμιότυπο του πρόβληματος σαν MDP (Markov Decision Process). Κάθε νέα κατάσταση του κόσμου είναι ένα ανεξάρτητο (απο το ιστόρικό καταστάσεων ) γεγονός. Κάθε νέα κατάσταση του κόσμου προκύπτει με πιθανότητα 1. Σε κάθε κατάσταση του κόσμου αντιστοιχίζεται μια τιμή κέρδους για τον πράκτορα.

Επίλυση προβλήματος: Εξισώσεις Bellman και Value Iteration Για την επίλυση του προβλήματος χρησιμοποιήθηκε ο αλγόριθμος επανάληψης αξιών (Εξισώσεις βελτιστότητας Βellman). Ο πράκτορας μπορεί να πάρει 4 αποφάσεις ( Πάνω,Κάτω,Δεξιά,Αριστερά). Προκύπτουν 4 εξισώσεις για κάθε κατάσταση του κόσμου.

Προβλήματα Μεγάλη εισαγωγή θορύβου. Πολύ δύσκολη εύρεση μίας ικανοποιητικής συνάρτησης αξιολόγησης του GameState. Έλλειψη πληροφορίας κατά την διάρκεια της διαδρομής στο tunnel. Πλήρης αλλαγή του χώρου καταστάσεων μετά το Power Pill. Συνεχής χώρος καταστάσεων.

Eυχαριστώ!!!