Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Γραφήματα & Επίπεδα Γραφήματα
Advertisements

Ερωτηματολόγιο Συλλογής Απαιτήσεων Εφαρμογών Υψηλών Επιδόσεων
Αμπαλάκης Στέλιος Διδακτικοί σκοποί  Στο σύνταγμα κάθε χώρας καθορίζονται οι γενικοί σκοποί της εκπαίδευσης  Με βάση τον γενικό σκοπό.
Διαδίκτυο: ο νέος δρόμος Μιχάλης Βαφόπουλος,
Μάρτιος 2011 Βαρόμετρο ΕΒΕΘ - Καταναλωτές. “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι.
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Ανάπτυξη Μοντέλου Ρομποτικού Οχήματος Σταθερής Τροχιάς, για Αποθήκη Κέντρου Διανομής Λιανεμπορίου ή Υπηρεσιών Logistics Γκρέμος Αναστάσιος ΠΛΣ Διπλωματική.
Αλέξανδρος Σαχινίδης, ΜΒΑ, Ph.D. ΙΟΥΝΙΟΣ 2009
ΣΧΕΔΙΑΣΜΟΣ (PLANNING)..και εφαρμογές σε video games! Τεχνητή Νοημοσύνη ΙΙ Εαρινό Εξάμηνο
ΜοντελοποίησηΈργα ΜαθήματαΑξιολόγηση Αναστοχασμος Μαθήματα.
Best Practices of the Best Agents RE/MAX Europe 5 th Convention – Gil Li-ran, VP of Marketing RE/MAX Israel Οι καλύτερες πρακτικές από τους καλύτερους.
Διαχείριση Έργου Οργάνωση, σχεδιασμός και προγραμματισμός έργων ανάπτυξης λογισμικού.
Πιθανοκρατικοί Αλγόριθμοι
Τα στοιχειώδη περί γεωδαιτικών υπολογισμών
Σύστημα Εργαστηριακών Εγγραφών βάσει Προτιμήσεων (ΣΕΕΠ) με τη βοήθεια Εμπείρου Συστήματος Πτυχιακή Εργασία Δημοσθένης Νικούδης (051092) 14/4/2011.
Χρήση και αξιοποίηση των ΤΠΕ κατά τη διδασκαλία των μαθηματικών στη δευτεροβάθμια ελληνική εκπαίδευση Δρ. Σάλτας Βασίλειος, Ιωαννίδου Ευφροσύνη Τμήμα.
Πως Γράφω Σωστά Επιστημονικές Ερμηνείες - Πως Γράφω Σωστά Επιστημονικές Ερμηνείες Βασίλης Γαργανουράκης
Τεχνητή Νοημοσύνη Κώστας Στεργίου Επίκουρος Καθηγητής
Καλή και δημιουργική χρονιά.
Διαδίκτυο: ο νέος δρόμος Μιχάλης Βαφόπουλος,
Ευφυείς πράκτορες.
Ανάλυση του λευκού φωτός και χρώματα
-17 Προσδοκίες οικονομικής ανάπτυξης στην Ευρώπη Σεπτέμβριος 2013 Δείκτης > +20 Δείκτης 0 a +20 Δείκτης 0 a -20 Δείκτης < -20 Σύνολο στην Ευρωπαϊκή Ένωση:
Μηχανική Μάθηση και Εξόρυξη Γνώσης
Βαρόμετρο ΕΒΕΘ - Καταναλωτές Σεπτέμβριος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι.
Αναγνώριση Προτύπων.
Fluxplayer: A successful General Game Player (Stephan Schiffel, Michael Thielscher) Προηγμένη Τεχνητή Νοημοσύνη Νομικός Βαγγέλης 24/01/2008.
Κεφάλαιο 2ο Πεπερασμένα αυτόματα.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Συναρτησιακές Εξαρτήσεις.
ΙΣΟΛΟΓΙΣΜΟΣ ΒΑΣΕΙ Δ.Λ.Π. (ΕΝΑΡΞΗΣ)
Αποκεντρωμένη Διοίκηση Μακεδονίας Θράκης ∆ιαχείριση έργων επίβλεψης µε σύγχρονα µέσα και επικοινωνία C2G, B2G, G2G Γενική Δ/νση Εσωτερικής Λειτουργίας.
Η επιρροή του χώρου εργασίας των σχολικών τάξεων στη μάθηση
Βαρόμετρο ΕΒΕΘ Μάρτιος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι του Νομού Θεσσαλονίκης”
Βάσεις Δεδομένων II Διαχείριση Δοσοληψιών Πάνος Βασιλειάδης Σεπτέμβρης 2002
13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών – Κέρκυρα Οκτωβρίου 2004 Το σύστημα COINE για την προβολή της πολιτιστικής κληρονομιάς και την υποστήριξη.
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Προγραμματισμός ΙΙ Διάλεξη #6: Απλές Δομές Ελέγχου Δρ. Νικ. Λιόλιος.
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Τρίτο Συστήματα.
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΟΘΗΚΟΝΟΜΙΑΣ Αναζητώντας πρότυπα αλληλεπίδρασης χρηστών για ψηφιακές βιβλιοθήκες Εργασία στο Μάθημα: Ψηφιακές.
Ενιαίο Πλαίσιο Προγράμματος Σπουδών Πληροφορικής.
Δομές Δεδομένων 1 Στοίβα. Δομές Δεδομένων 2 Στοίβα (stack)  Δομή τύπου LIFO: Last In - First Out (τελευταία εισαγωγή – πρώτη εξαγωγή)  Περιορισμένος.
Συνδυαστικά Κυκλώματα
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
1 Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Πανεπιστήμιο Πατρών ΟΝΤΟΚΕΝΤΡΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΙΙ (C++) Κληρονομικότητα.
Ανάπτυξη Πρωτοτύπου Λογισμικού
2-1 Ανάλυση Αλγορίθμων Αλγόριθμος Πεπερασμένο σύνολο εντολών που, όταν εκτελεστούν, επιτυγχάνουν κάποιο επιθυμητό αποτέλεσμα –Δεδομένα εισόδου και εξόδου.
Βαρόμετρο ΕΒΕΘ - Καταναλωτές Μάρτιος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι.
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών – Τμήμα Πληροφορικής και Τηλεπικοινωνιών 1 Κεφάλαιο 3 Η Σημασιολογία των Γλωσσών Προγραμματισμού Προπτυχιακό.
Δομές Δεδομένων - Ισοζυγισμένα Δυαδικά Δένδρα (balanced binary trees)
ΒΑΣΙΚΕΣ ΟΙΚΟΝΟΜΙΚΕΣ ΕΝΝΟΙΕΣ
Βαρόμετρο ΕΒΕΘ Σεπτέμβριος “Η καθιέρωση ενός αξιόπιστου εργαλείου καταγραφής του οικονομικού, επιχειρηματικού και κοινωνικού γίγνεσθαι του Νομού.
ΡΑΛΛΕΙΑ ΣΧΟΛΕΙΑ: 155 ΧΡΟΝΙΑ ΙΣΤΟΡΙΑΣ ΚΑΙ ΠΡΟΣΦΟΡΑΣ.
Μηχανική Μάθηση σε Συστήματα Πολλαπλών Πρακτόρων Παπαλιάς Κωνσταντίνος Τμήμα Πληροφορικής.
Τεχνολογία ΛογισμικούSlide 1 Τεχνολογία Απαιτήσεων u Καθορίζει τι θέλει ο πελάτης από ένα σύστημα λογισμικού.
Εισαγωγή στην Έννοια του Αλγορίθμου και στον Προγραμματισμό
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΡΆΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΥΠΕΥΘΥΝΗ ΚΑΘΗΓΉΤΡΙΑ Δρ. ΤΣΙΝΤΖΑ ΠΑΝΑΓΙΩΤΑ Οι παρουσιάσεις του μαθήματος βασίζονται στο.
Πληροφορική 2 Τεχνητή νοημοσύνη 1. Τι είναι τεχνητή νοημοσύνη;  Τεχνητή νοημοσύνη (AI=Artificial Intelligence) είναι η μελέτη προγραμματισμένων συστημάτων.
ΕΝΟΤΗΤΑ 1. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΕΦΑΛΑΙΟ 1.1 ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ 1.
Εισαγωγή στην Τεχνητή Νοημοσύνη
Επίλυση Προβλημάτων με Αναζήτηση
Ανάλυση κρίσιμου συμβάντος
Νοήμονες Πράκτορες.
Εισαγωγή στην Τεχνητή Νοημοσύνη
Νοήμονες Πράκτορες.
Εισαγωγή στην Τεχνητή Νοημοσύνη
ΠΛΗΡΟΦΟΡΙΚΗ Γ΄ Γυμνασίου Α΄ Τρίμηνο
Μεταγράφημα παρουσίασης:

Τεχνητή Νοημοσύνη Γεώργιος Βούρος Καθηγητής Τμήμα Ψηφιακών Συστημάτων Πανεπιστήμιο Πειραιώς e-mail: georgev@unipi.gr Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Επισκόπηση Μαθήματος Κατά τη διάρκεια του μαθήματος θα δοθούν εργασίες. Οι φοιτητές υποχρεούνται στην παράδοση εργασιών Βαθμολόγηση Εργασίες. Τελικός Βαθμός = Μέσος Όρος Βαθμών Εργασιών Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Επισκόπηση Μαθήματος Οντολογίες Νοήμονες πράκτορες. Αβεβαιότητα Θέματα Νοήμονες πράκτορες. Αλγόριθμοι αναζήτησης και εξερεύνησης λύσεων Αναπαράσταση γνώσης με Λογική. Οντολογίες Αβεβαιότητα Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Επισκόπηση Μαθήματος - Βιβλιογραφία Προτεινόμενα βιβλία Τεχνητή Νοημοσύνη: Μια Σύγχρονη Προσέγγιση Russell & Norvig Τεχνητή Νοημοσύνη: Βλαχάβας, Κεφαλάς, Βασιλειάδης, Κόκκορας, Σακελλαρίου Άλλες πηγές Artificial Intelligence: A Modern Approach, Russell & Norvig http://www.cs.berkeley.edu/~russell/aima.html http://aima.cs.berkeley.edu/ Artificial Intelligence: A New Synthesis, Nilsson Essentials of Artificial Intelligence: Ginsberg Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Γιατί Τεχνητή Νοημοσύνη? Η μελέτη της ανθρώπινης νόησης, του ανθρώπινου τρόπου σκέψης είναι πολύ σημαντικό ζήτημα που απασχολεί πολλές επιστήμες για χιλιάδες χρόνια κι ακόμα δεν έχουμε καταλήξει κάπου... Η Τεχνητή Νοημοσύνη πάει ένα βήμα πιο μακριά: προσπαθεί να κατασκευάσει νοήμονες οντότητες Υπάρχει ως κλάδος περίπου για 60 χρόνια άρα έχει πολύ μέλλον! συνδυάζει τεράστια ποικιλία επιμέρους πεδίων Μάθηση και αντίληψη, απόδειξη μαθηματικών θεωρημάτων, διάγνωση ασθενειών, πρόβλεψη καιρού, σκάκι, κτλ., κτλ., κτλ... Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Τι είναι η Τεχνητή Νοημοσύνη (ΤΝ)? ΤΝ είναι η περιοχή της επιστήμης που προσπαθεί να κατανοήσει και να κατασκευάσει ευφυή συστήματα Η ΤΝ ξεκίνησε “επίσημα” το 1956 Τι είναι ένα ευφυές σύστημα ? Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Τι είναι η Τεχνητή Νοημοσύνη (ΤΝ)? Οι ορισμοί που δίνονται στα βιβλία ΤΝ ανήκουν στις παρακάτω κατηγορίες: ΤΝ είναι η περιοχή της επιστήμης που προσπαθεί να κατασκευάσει συστήματα που δρουν όπως οι άνθρωποι ... που σκέφτονται όπως οι άνθρωποι ... που σκέφτονται ορθολογικά ... που δρουν ορθολογικά Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Δρώντας όπως οι άνθρωποι Παράδειγμα: το τεστ Turing Για να περάσει το τεστ Turing ένας Η/Υ πρέπει να έχει τις παρακάτω ικανότητες: επεξεργασία φυσικής γλώσσας (natural language processing) αναπαράσταση γνώσης (knowledge representation) αυτοματοποιημένο συλλογισμό (automated reasoning) μηχανική μάθηση (machine learning) τεχνητή όραση (computer vision) ρομποτική (robotics) Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Σκεπτόμενοι όπως οι άνθρωποι Πως σκέφτονται οι άνθρωποι ? Υπάρχουν δύο τρόποι για να το ανακαλύψουμε: Αυτοανάλυση Ψυχολογικά πειράματα Παράδειγμα: το GPS πρόγραμμα των Newell και Simon (1961) Η ψυχολογία και η γνωστική επιστήμη (cognitive science) είναι πολύ σχετικές Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Σκεπτόμενοι Ορθολογικά Ποιοι είναι οι νόμοι της σκέψης? Αυτή η ερώτηση πηγάζει από τους συλλογισμούς του Αριστοτέλη Ο τομέας της λογικής στην ΤΝ έχει ακολουθήσει αυτή την προσέγγιση π.χ. οι πρώτες δουλειές στην απόδειξη θεωρημάτων (theorem proving) Η έμφαση δίνεται στη σωστή συλλογιστική Σχετική δουλειά στην φιλοσοφία είναι πολύ σημαντική Προβλήματα? Αναπαράσταση γνώσης με λογική Συλλογιστική Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Δρώντας Ορθολογικά Το να δρα κάποιος λογικά σημαίνει να δρα έτσι ώστε να πετύχει τους στόχους του (goals) με δεδομένες τις αντιλήψεις του. Σε αυτή την προσέγγιση το βασικό πρόβλημα είναι ο σχεδιασμός λογικών πρακτόρων (rational agents) Ένας πράκτορας είναι ένα σύστημα που αντιλαμβάνεται και δρα Η μελέτη της ΤΝ ως σχεδιασμός λογικών πρακτόρων είναι πιο γενική από την προσέγγιση της λογικής σκέψης πιο “εύκολη” από τις προσεγγίσεις που βασίζονται στην ανθρώπινη σκέψη και συμπεριφορά Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Σύγχρονη Τεχνολογία

Αυτόνομος σχεδιασμός και χρονοπρογραμματισμός ενεργειών (Autonomous planning & scheduling) Το πείραμα Remote Agent της NASA υλοποίησε το πρώτο αυτόνομο πρόγραμμα σχεδιασμού ενεργειών (planning program) για τον έλεγχο των λειτουργιών ενός διαστημοπλοίου (1998-2001). Το πρόγραμμα: παρήγαγε πλάνα ενεργειών για την επίτευξη στόχων που του καθορίζονταν από τη γη (π.χ. φωτογράφιση κομητών), παρακολουθούσε την εκτέλεσή τους, προέβαινε στις απαραίτητες διορθωτικές ενέργειες, όταν διαπίστωνε αποκλίσεις. http://ic.arc.nasa.gov/projects/ remote-agent/

Παιχνίδια (Game Playing) Ο υπολογιστής της IBM Deep Blue έγινε ο πρώτος που νίκησε τον παγκόσμιο πρωταθλητή στο σκάκι Garry Kasparov με σκορ 3.5-2.5, σε αγώνα επίδειξης το 1997. http://www.research.ibm.com/deepblue/

Αυτόνομος έλεγχος (Autonomous control) Το ALVINN είναι ένα σύστημα μηχανικής όρασης το οποίο μαθαίνει να οδηγεί ένα όχημα, παρακολουθώντας έναν άνθρωπο-οδηγό. Το ALVINN αποτελείται από ένα νευρωνικό δίκτυο ενός κρυμμένου στρώματος. Το σύστημα δέχεται ως είσοδο από τις κάμερες πάνω στο όχημα. Η έξοδος είναι η κατεύθυνση προς την οποία πρέπει να κινηθεί το όχημα για να παραμείνει μέσα στο δρόμο. Ταξίδευσε 2850 χλμ στις ΗΠΑ διατηρώντας αυτονομία στο 98% του ταξιδιού! http://www-2.cs.cmu.edu/afs/cs/project/alv/www/navlab_home_page.html

Διάγνωση (Diagnosis) Ιατρικά προγράμματα διάγνωσης ασθενειών που βασίζονται σε πιθανοτική ανάλυση έχουν αποκτήσει τις ικανότητες έμπειρων θεραπευτών σε πολλές ειδικότητες. Κάποια από αυτά διατίθενται ελεύθερα στο διαδίκτυο, π.χ. http://easydiagnosis.com/ (ελεύθερη/δοκιμαστική χρήση για κάποιες περιπτώσεις).

Σχεδιασμός ενεργειών για προβλήματα Logistics (Logistics planning) Κατά τη διάρκεια του πολέμου του Περσικού Κόλπου (1991), οι Η.Π.Α. χρησιμοποίησαν το πρόγραμμα D.A.R.T. (Dynamic Analysis and Replanning Tool) για αυτοματοποιημένο σχεδιασμό και χρονοπρογραμματισμό ενεργειών για τις μεταφορές τους. Το πρόγραμμα διαχειρίστηκε 50.000 οχήματα, φορτία και ανθρώπους. Παρήγαγε πλάνα σε μερικές ώρες, αντί για εβδομάδες που χρειάζονται οι προηγούμενες μέθοδοι. Η υπηρεσία D.A.R.P.A. (Defense Advanced Research Project Agency) δήλωσε ότι η συγκεκριμένη εφαρμογή απέφερε περισσότερο από τις επενδύσεις των Η.Π.Α. στην Τ.Ν. τα τελευταία 30 χρόνια. http://www.rl.af.mil/div/IFT/IFTB/arpi/arpi.html

Ρομποτική (Robotics) (1/2) Ρομποτικοί βοηθοί χρησιμοποιούνται σε μικρο-εγχειρήσεις. Το σύστημα HipNav (1996) αναπτύχθηκε στο Carnegie Mellon Univ. με σκοπό τη μείωση του κινδύνου λάθος τοποθέτησης σε εγχειρίσεις πλήρους αντικατάστασης γοφού. http://www.mrcas.ri.cmu.edu/projects/hipnav.html

Ρομποτική (2/2) Σημαντική πρόοδος έχει γίνει και στην κατασκευή ανθρωποειδών ρομπότ. http://world.honda.com/robot/ Διαγωνισμοί ποδοσφαίρου RoboCup Φιλόδοξος στόχος για το 2050. http://www.robocup.org/

Κατανόηση Λόγου Verbmobil: Σύστημα αυτόματης μετάφρασης, εξαρτημένης από τα συμφαζόμενα, σε πραγματικό χρόνο. Γλώσσες: Γερμανικά-Αγγλικά-Ιαπωνικά http://verbmobil.dfki.de/

Ευφυείς Πράκτορες (Intelligent Agents) Τι είναι ένας πράκτορας ? Πως πρέπει να δρουν οι πράκτορες ? Η δομή των ευφυών πρακτόρων Περιβάλλοντα πρακτόρων Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Τι είναι ένας Πράκτορας ? Πράκτορας (Agent) είναι οτιδήποτε μπορεί μπορεί να θεωρηθεί ότι αντιλαμβάνεται το περιβάλλον του μέσα από αισθητήρες (sensors) και δρα σε αυτό το περιβάλλον μέσα από μηχανισμούς δράσης (effectors ή actuators) Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Παραδείγματα Πρακτόρων Ανθρώπινοι Πράκτορες (human agents) Sensors? Effectors ? Ρομποτικοί Πράκτορες (robotic agents) Λογισμικοί Πράκτορες (software agents) Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Πως πρέπει να δρουν οι πράκτορες ? Οι πράκτορες πρέπει να δρουν ορθολογικά να εκτελούν τις ενέργειες που προσφέρουν τη μεγαλύτερη επιτυχία Αυτό εξαρτάται από τα παρακάτω κριτήρια: Το μέτρο της απόδοσης που ορίζει το βαθμό επιτυχίας Ποιος το καθορίζει αυτό? Όλα όσα έχει αντιληφθεί ο πράκτορας Η ακολουθία αντιλήψεων (percept sequence) Την προηγούμενη γνώση του περιβάλλοντος Που του είχε δώσει ο σχεδιαστής Τις πράξεις που είναι διαθέσιμες στον πράκτορα Δεν μπορεί να κάνει τα πάντα! Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Ορίζοντας τους ορθολογικούς πράκτορες Για κάθε πιθανή ακολουθία αντίληψης, ένας ιδανικός ορθολογικός πράκτορας θα πρέπει να διαλέξει όποια διαθέσιμη πράξη αναμένεται να μεγιστοποιήσει το μέτρο της απόδοσης, με βάση τη γνώση που προκύπτει από την ακολουθία αντίληψης και όποια προηγούμενη γνώση έχει ο πράκτορας Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Ορθολογισμός vs. Πλήρους Γνώσης Ένας πράκτορας πλήρους γνώσης (omniscient agent) γνωρίζει το πραγματικό αποτέλεσμα κάθε πιθανής πράξης και μπορεί να δράσει ανάλογα Αυτό δεν είναι δυνατό στον πραγματικό κόσμο Η ορθολογική συμπεριφορά μεγιστοποιεί την αναμενόμενη απόδοση ενώ η πλήρης γνώση μεγιστοποιεί την πραγματική απόδοση Η πλήρης γνώση είναι μια ιδιότητα που δε θα απαιτούμε να έχουν οι πράκτορες μας. Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Μάθηση και Αυτονομία Αν οι πράξεις ενός πράκτορα βασίζονται πλήρως σε ήδη υπάρχουσα (built in) γνώση τότε ο πράκτορας δεν έχει αυτονομία Ένας πράκτορας είναι αυτόνομος όταν η συμπεριφορά του εξαρτάται από τις δικές του εμπειρίες Οι εμπειρίες αποκτούνται μέσω της μάθησης (learning) του περιβάλλοντος Είναι πολύ αυστηρό να απαιτούμε πλήρη αυτονομία Κάποια αρχική built in γνώση πάντα βοηθάει Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Ένα Παράδειγμα Είδος Πράκτορα Μέτρο Απόδοσης Περιβάλλον Μηχανισμοί Δράσης Αισθητήρες Οδηγός ταξί Ασφάλεια, Ταχύτητα, Νομιμότητα, Άνεση στη διαδρομή, Μεγιστοποίηση κέρδους Δρόμοι, Πεζοί, Άλλα αυτοκίνητα, Πελάτες Τιμόνι, Γκάζι, Φρένο, Κόρνα, Κιβώτιο ταχυτήτων Κάμερες, Μετρητής ταχύτητας, σένσορες μηχανής, GPS, σόναρ Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Περισσότερα Παραδείγματα Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Περιβάλλοντα Είδη περιβάλλοντος: Πλήρως παρατηρήσιμο και μερικώς παρατηρήσιμο Αν οι αισθητήρες ενός πράκτορα του δίνουν πρόσβαση στη πλήρη κατάσταση του περιβάλλοντος την κάθε χρονική στιγμή, το περιβάλλον ονομάζεται πλήρως παρατηρήσιμο (fully observable) Αιτιοκρατικό (ντετερμινιστικό) και στοχαστικό Αν η επόμενη κατάσταση του περιβάλλοντος ορίζεται μόνο από την τωρινή κατάσταση και τις πράξεις που κάνουν οι πράκτορες τότε το περιβάλλον είναι αιτιοκρατικό (deterministic) Επεισοδιακό και μη επεισοδιακό Σε ένα επεισοδιακό περιβάλλον, η εμπειρία του πράκτορα χωρίζεται σε επεισόδια που δεν εξαρτώνται μεταξύ τους Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Περιβάλλοντα Είδη περιβάλλοντος: Στατικό, ημιδυναμικό και δυναμικό Αν το περιβάλλον μπορεί να αλλάζει καθώς ο πράκτορας συλλογίζεται τότε είναι δυναμικό για αυτόν τον πράκτορα, αλλιώς είναι στατικό Αν το περιβάλλον δεν αλλάζει με την πάροδο του χρόνου αλλά αλλάζει το μέτρο απόδοσης του πράκτορα, τότε είναι ημιδυναμικό Διακριτό και συνεχές Αν υπάρχει ένας περιορισμένος αριθμός διακριτών, καθαρά ορισμένων πραγμάτων που μπορεί να αντιληφθεί ο πράκτορας καθώς και πράξεων που μπορεί να πράξει τότε το περιβάλλον είναι διακριτό (discrete) Μονοπρακτορικά και πολυπρακτορικά ανταγωνιστικό και συνεργατικό Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Περιβάλλοντα Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Δομή των Πρακτόρων Πράκτορας = Αρχιτεκτονική + Πρόγραμμα Η αρχιτεκτονική κάνει τις αντιλήψεις από τους αισθητήρες διαθέσιμες στο πρόγραμμα, τρέχει το πρόγραμμα, και προωθεί τις επιλογές πράξεων στους μηχανισμούς δράσης καθώς δημιουργούνται από το πρόγραμμα Θα ασχοληθούμε μόνο με προγράμματα πρακτόρων Αυτή είναι κυρίως η δουλειά της ΤΝ!!! Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Προγράμματα Πρακτόρων Πως μπορούμε να υλοποιήσουμε το πρόγραμμα για έναν πράκτορα? Με χρήση πίνακα (table look-up) ? Μειονεκτήματα: Τεράστιος πίνακας (10150 για πράκτορα που παίζει σκάκι) Έλλειψη αυτονομίας Ακόμα κι αν προστεθεί μηχανισμός μάθησης το μέγεθος του πίνακα είναι προβληματικό function TableDrivenAgent (percept) returns action static percepts, μια ακολουθία αρχικά κενή table, ένας πίνακας από ακολουθίες αντιλήψεων πρόσθεσε το percept στο τέλος του percepts action  LookUp (percepts, table) return action Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Απλά Αντιδραστικοί Πράκτορες (Simple Reflex Agents) αισθητήρες ΠΡΑΚΤΟΡΑΣ Η αντίληψη του κόσμου τώρα Περιβάλλον Κανόνες Προϋπόθεσης - Δράσης Τι ενέργεια πρέπει να κάνω? μηχανισμοί δράσης Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Παράδειγμα – Ο Πράκτορας Καθαριστής Η συμπεριφορά αυτού του πράκτορα εξαρτάται μόνο από την αντίληψη του περιβάλλοντος που έχει κάθε δεδομένη στιγμή φιλοσοφία ερεθίσματος - αντίδρασης Στα περισσότερα περιβάλλοντα αυτό δεν είναι αρκετό function ReflexVacuumCleanerAgent ([location,status]) returns an action if status = dirty then return clean else if location = A then return move right else if location = B then return move left Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Υλοποίηση Απλά Αντιδραστικών Πρακτόρων function SimpleReflexAgent (percept) returns action static rules, ένα σύνολο από κανόνες προϋπόθεσης-δράσης state, μια μετάφραση της δεδομένης αντίληψης (percept) state  InterpretInput (percept) rule  RuleMatch (state,rules) action  RuleAction (rule) return action Ο πράκτορας βρίσκει έναν κανόνα του οποίου η προϋπόθεση ταιριάζει με την τωρινή κατάσταση και μετά εκτελεί την πράξη που συνδέεται με αυτόν τον κανόνα Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Αντιδραστικοί Πράκτορες με Εσωτερικό Μοντέλο (Model-based Reflex Agents) ΠΡΑΚΤΟΡΑΣ αισθητήρες Κατάσταση Η αντίληψη του κόσμου τώρα Πως εξελίσσεται το περιβάλλον Τι κάνουν οι πράξεις μου Περιβάλλον Κανόνες Προϋπόθεσης - Δράσης Τι ενέργεια πρέπει να κάνω? μηχανισμοί δράσης Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Υλοποίηση Αντιδραστικών Πρακτόρων με Εσωτερικό Μοντέλο Υλοποίηση Αντιδραστικών Πρακτόρων με Εσωτερικό Μοντέλο Οι πράκτορες με εσωτερικό μοντέλο παρακολουθούν την εξέλιξη της κατάστασης του περιβάλλοντος. Αυτό βοηθάει πολύ! Πως μπορεί να αναπαρασταθεί γνώση σχετικά με το περιβάλλον σε έναν πράκτορα ? function ReflexAgentWithInternalState (percept) returns action static rules, ένα σύνολο από κανόνες προϋπόθεσης-δράσης state, μια μετάφραση της δεδομένης αντίληψης (percept) state  UpdateState (state,percept) rule  RuleMatch (state,rules) action  RuleAction (rule) state  UpdateState (state,action) return action Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Πράκτορες βασισμένοι σε στόχους (Goal-based Agents) ΠΡΑΚΤΟΡΑΣ αισθητήρες Κατάσταση Η αντίληψη του κόσμου τώρα Πως εξελίσσεται το περιβάλλον Τι κάνουν οι πράξεις μου Τι θα γίνει αν κάνω την ενέργεια Α ? Περιβάλλον Τι ενέργεια πρέπει να κάνω? Στόχοι μηχανισμοί δράσης Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Goal-based Agents vs. Reflex Agents Η συλλογιστική που βασίζεται σε στόχους διαφέρει ουσιαστικά από την συλλογιστική που βασίζεται στην αντίδραση με βάση κανόνες Η συλλογιστική που βασίζεται σε στόχους σημαίνει συλλογισμό για το μέλλον Τι θα γίνει αν κάνω την πράξη Α ? Στη συλλογιστική που βασίζεται στην αντίδραση με βάση κανόνες ο σχεδιαστής έχει προϋπολογίσει τη σωστή πράξη για μερικές ενδιαφέρουσες περιπτώσεις Η συλλογιστική που βασίζεται σε στόχους είναι υπολογιστικά πιο δύσκολη αλλά πολύ πιο λειτουργική Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Πράκτορες βασισμένοι στη χρησιμότητα (Utility-based Agents) αισθητήρες ΠΡΑΚΤΟΡΑΣ Η αντίληψη του κόσμου τώρα Κατάσταση Πως εξελίσσεται το περιβάλλον Τι θα γίνει αν κάνω την ενέργεια Α ? Τι κάνουν οι πράξεις μου Περιβάλλον Πόσο ικανοποιημένος θα είμαι ? Χρησιμότητα Τι ενέργεια πρέπει να κάνω? μηχανισμοί δράσης Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Πράκτορες βασισμένοι στη χρησιμότητα (Utility-based Agents) Πράκτορες που βασίζονται στη χρησιμότητα μπορούν να αποφασίσουν λογικά για πράξεις ακόμα κι όταν υπάρχουν αλληλοσυγκρουόμενοι στόχοι ή όταν υπάρχουν στόχοι που δεν είναι σίγουρο ότι μπορεί να επιτευχθούν Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Επισκόπηση μαθήματος ξανά Θέματα Ευφυείς Πράκτορες Επίλυση Προβλημάτων με Αναζήτηση Προβλήματα Ικανοποίησης Περιορισμών Προτασιακή Λογική Σχεδιασμός Ενεργειών Μηχανική Μάθηση Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Ευφυείς Πράκτορες ΠΡΑΚΤΟΡΑΣ Περιβάλλον αισθητήρες Η αντίληψη του Κατάσταση Η αντίληψη του κόσμου τώρα Πως εξελίσσεται το περιβάλλον Τι κάνουν οι πράξεις μου Περιβάλλον Κανόνες Προϋπόθεσης - Δράσης Τι ενέργεια πρέπει να κάνω? μηχανισμοί δράσης Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Επίλυση Προβλημάτων με Αναζήτηση Η αντίληψη του κόσμου τώρα αισθητήρες Τι ενέργεια πρέπει να κάνω? μηχανισμοί δράσης Στόχοι ΠΡΑΚΤΟΡΑΣ Περιβάλλον Κατάσταση Πως εξελίσσεται το περιβάλλον Τι κάνουν οι πράξεις μου Τι θα γίνει αν κάνω την ενέργεια Α ? Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Προτασιακή Λογική ΠΡΑΚΤΟΡΑΣ Περιβάλλον αισθητήρες Η αντίληψη του κόσμου τώρα αισθητήρες Τι ενέργεια πρέπει να κάνω? μηχανισμοί δράσης Στόχοι ΠΡΑΚΤΟΡΑΣ Περιβάλλον Κατάσταση Πως εξελίσσεται το περιβάλλον Τι κάνουν οι πράξεις μου Τι θα γίνει αν κάνω την ενέργεια Α ? Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Σχεδιασμός Ενεργειών ΠΡΑΚΤΟΡΑΣ Περιβάλλον αισθητήρες Η αντίληψη του κόσμου τώρα αισθητήρες Τι ενέργεια πρέπει να κάνω? μηχανισμοί δράσης Στόχοι ΠΡΑΚΤΟΡΑΣ Περιβάλλον Κατάσταση Πως εξελίσσεται το περιβάλλον Τι κάνουν οι πράξεις μου Τι θα γίνει αν κάνω την ενέργεια Α ? Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς

Ανακεφαλαίωση Η μελέτη της ΤΝ ως σχεδιασμός λογικών πρακτόρων Τι είναι ένας πράκτορας ? Πως πρέπει να δρουν οι πράκτορες ? Περιβάλλοντα πρακτόρων Η δομή ορισμένων ειδών ευφυών πρακτόρων Τμήμα Ψηφιακών Συστημάτων – Πανεπιστήμιο Πειραιώς