Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Learning to Learn: Algorithmic Inspirations from Human Problem Solving Ashish Kapoor, Bongshin Lee, Desney Tan, Eric Horvitz Παρουσίαση ΠΜΣ 508 Ολυμπία Κρεμμύδα ΠΡΟΗΓΜΕΝΗ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Χειμερινό Εξάμηνο
2/14 Στόχος Αυτοματοποίηση της βελτίωσης της μηχανικής μάθησης ● Χωρίς την παρέμβαση του ανθρώπου ● Αλλά προσεγγίζοντας την διορατικότητά του. Για την βελτιστοποίηση της απόδοσης των ταξινομητών.
3/14 Αξιοποίηση του ανθρώπινου παράγοντα ( σε προηγούμενες έρευνες ) ● Τροποποίηση παραμέτρων κατά τη διαδικασία μάθησης ● Παροχή υποδείξεων σε ● Δέντρα αποφάσεων ● Απλά -Bayes ● SVMs ● HMMs ● Όμως, στόχος τους η ακρίβεια των αποτελεσμάτων. ● Όχι η ανάπτυξη καλύτερων συστημάτων.
4/14 Αξιοποίηση του ανθρώπινου παράγοντα ( σε αυτή την έρευνα ) ● Παρατηρήθηκαν οι ενέργειες των ανθρώπων ● Χρήση του εργαλείου EnsembleMatrix ● Τα στοιχεία αξιοποιήθηκαν στη διαδικασία της μηχανικής μάθησης.
5/14 EnsembleMatrix (1/2) ● Εργαλείο που από πολλούς ταξινομητές κατασκευάζει έναν ταξινομητή από τον συνδυασμό τους. ● Αναπαράσταση ταξινομητών : – Γραφικός χάρτης θερμότητας του πίνακα σύγχυσης ● Μηχανισμοί : – Γραμμικός συνδυασμός – Διαμερισμός – Επιλογή Βαρών
6 /14 EnsembleMatrix (2/2)
Περίπτωση Μελέτης ● Προβλήματα : ➢ Θεματική κατηγοριοποίηση αρχείων (Newsgroup – 3000 παραδείγματα, 20 κλάσεις ) ➢ Αναγνώριση προσώπων (Multipie – 3000 παραδείγματα, 150 κλάσεις ) ➢ Κατηγοριοποίηση εικόνων (Caltech-101 – 3030 παραδείγματα, 101 κλάσεις ) ● Για κάθε πρόβλημα, 4 διαφορετικοί ταξινομητές. ● Διαχωρισμός 50 – 50 συνόλου εκπαίδευσης και δοκιμών. ● Εφαρμογή 10-fold cross-validation. ● 10 συμμετέχοντες με διαφορετικό υπόβαθρο στην ΤΝ. 7 /14
8 /14 Ανθρώπινες Επιδώσεις ● Μοντέλα που κατασκεύασαν οι άνθρωποι Vs ● Μη - ιεραρχικός ταξινομητής (Flat Average)
9 /14 Κύρια σημεία αποφάσεων ● Τρόπος διαμερισμού – Ισομεγέθεις διαχωρισμοί, φέρνουν χειρότερα αποτελέσματα. ● Συμβιβασμός μεταξύ δομής και ακρίβειας – Η ανοχή στην ακρίβεια, παράγει πιο καθαρό οπτικά διαχωρισμό. – Αντίθετα, η προσήλωση σε αυτήν, έχει ως αποτέλεσμα πιο αδύναμα μοντέλα. ● Τερματισμός – Ο έγκαιρος τερματισμός οδηγεί σε μοντέλα με καλύτερη ικανότητα γενίκευσης.
10 /14 Μονάδες επιλογής αποφάσεων ● Δείγμα από το σύνολο των βαρών ● Παραγωγή διαμερισμών με έναν αλγόριθμο spectral clustering. ● Μια πρόταση διαμερισμού για κάθε σετ βαρών. ● Αξιολόγηση με την συνάρτηση Quality(.) – Ανθρώπινη συμβολή – Εκπαίδευση ταξινομητή (BPM) που να αποφασίζει αν είναι καλός διαχωρισμός.
11 /14 Τελική επιλογή βαρών ● Αφού έχει επιλεγεί ο τελικός διαμερισμός ● Εύρεση πιθανότητας για κάθε δεδομένο να ανήκει σε ένα Cluster. ● Μεγιστοποίηση της διαφοροποίησης των cluster ● Βέλτιστο βάρος :
12 /14 Κριτήριο Τερματισμού ● Έλεγχος αν για τις παραπάνω επιλογές, αληθεύει το κριτήριο Stop(.) – Εκπαίδευση κριτηρίου μέσω δυαδικού ταξινομητή. – Χρήση των δεδομένων των χρηστών που έφτιαξαν καλούς ταξινομητές. ● Έξοδος Πιθανότητα η τρέχουσα κατάσταση να είναι η τελική.
13 /14 Πειράματα και Αποτελέσματα
Ευχαριστώ !
Βιβλιογραφία Learning to Learn: Algorithmic Inspirations from Human Problem Solving Ashish Kapoor, Bongshin Lee, Desney Tan, Eric Horvitz Learning to Learn: Algorithmic Inspirations from Human Problem Solving EnsembleMatrix: Interactive Visualization to Support Machine Learning with Multiple Classifiers EnsembleMatrix: Interactive Visualization to Support Machine Learning with Multiple Classifiers Talbot J., Lee B., Kapoor A. and Tan D. Imitation Learning of Whole-Body Grasps Kaijen Hsiao and Tomás Lozano-Perez Interactive machine learning: letting users build classifiers Ware M., Frank E., Holmes G. Hall, M. and Witten I. Reinforcement Learning (Book Review) Reinforcement Learning (Book Review) Sutton R. S. and Barto A. G. (Reviewed by C.R. Gallistel)