Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Πόσο ασφαλή είναι (ή πρέπει να είναι) τα γεωτεχνικά έργα
Advertisements

Y ΠΟΛΟΓΙΣΜΟΣ Y ΠΟΛΟΓΙΣΜΟΣ ΤΗΣ Ε ΠΙΔΡΑΣΗΣ Ε ΠΙΔΡΑΣΗΣ ΤΩΝ ΤΩΝ Ε ΙΣΟΔΩΝ Χ ΑΡΑΚΤΗΡΙΣΤΙΚΩΝ Χ ΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΣΕ ΕΝΑ Ν ΕΥΡΩΝΙΚΟ Ν ΕΥΡΩΝΙΚΟ Δ ΙΚΤΥΟ Χάρης Παπαδόπουλος.
Nikos Louloudakis Nikos Orfanoudakis Irini Genitsaridi
Αυτο-συσχέτιση (auto-correlation)
Ασκήσεις Συνδυαστικής
Πιθανότητες & Τυχαία Σήματα Συσχέτιση
Δομές Αναζήτησης TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A εισαγωγή αναζήτησηεπιλογή διατεταγμένος πίνακας.
Μια Μπεϋζιανή Μέθοδος για την Επαγωγή Πιθανοτικών Δικτύων από Δεδομένα ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧ/ΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ B. Μεγαλοοικονόμου, Χ. Μακρής.
ΠΡΟΒΛΗΜΑΤΑ ΜΕΤΑΦΟΡΑΣ Β. Κώστογλου – Τμήμα Πληροφορικής ΑΤΕΙ-Θ
Εισαγωγικές Έννοιες Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
Επιλογή Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο.
Διάλεξη 5η: Σύνταξη της μήτρας του γραμμικού προγραμματισμού κατά την εφαρμογή του στη γεωργική παραγωγή Η μήτρα είναι ένας πίνακας που παρουσιάζει τους.
Αναγνώριση Προτύπων.
Αναγνώριση Προτύπων.
Μοντέλο Διδασκαλίας Φυσικών Επιστήμων, για την Υποχρεωτική Εκπαίδευση, στην Κατεύθυνση της Ανάπτυξης Γνώσεων και Ικανοτήτων. Π. Κουμαράς.
Γραμμικός Προγραμματισμός
ΕΥΡΕΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΕΚΤΟΠΩΝ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
ΧΩΡΟΘΕΤΗΣΕΙΣ-ΚΑΤΑΝΟΜΕΣ. Η βασική αρχή του οικονομικού σχεδιασμού είναι η δημιουργία οικονομικών και κοινωνικών στόχων για το μέλλον, εκφρασμένων σε ποσοτικοποιημένα.
Βασικές Αρχές Μέτρησης
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Learning to Learn: Algorithmic Inspirations from Human Problem Solving.
ΒΕΣ 06: Προσαρμοστικά Συστήματα στις Τηλεπικοινωνίες © 2007 Nicolas Tsapatsoulis Προσαρμοστικοί Αλγόριθμοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων: Ο αναδρομικός.
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ Τμήμα Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών Εργαστήριο Τηλεπικοινωνιών και Πληροφορίας & Δικτύων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ “Χρονοπρογραμματισμός.
Δυναμικά Σύνολα TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A AA A A Δυναμικό σύνολο Tα στοιχεία του μεταβάλλονται.
Δέσποινα Μαγγίνα M1175 Κωνσταντίνος Γαργάνης Μ1172 Δήμητρα Μαρία Χαρακλιά Μ1206 Ιωάννης Παπαδάκης Μ1171 Αλέξανδρος Νικολόπουλος Μ1182 Δημήτριος Μπαϊρακτάρης.
Διδακτική της Πληροφορικής ΗΥ302 Εργασία :Παρουσίαση σχολικού βιβλίου Γ’ Λυκείου Τεχνολογικής Κατεύθυνσης «Ανάπτυξη εφαρμογών σε προγραμματιστικό περιβάλλον»
Κ. Μόδη: Γεωστατιστική και Εφαρμογές της (Κεφάλαιο 4) 1 Από κοινού κατανομή πολλών ΤΜ Ορίζεται ως από κοινού συνάρτηση κατανομής F(x 1, …, x n ) n τυχαίων.
ΘΕΩΡΙΕΣ ΚΑΙ ΥΠΟΘΕΣΕΙΣ: Διατύπωση Αναπτυξιακών Ερωτημάτων
Χρονική Πολυπλοκότητα και Μοντέλα
Αλγόριθμοι - Τμήμα Πληροφορικής ΑΠΘ - 4ο εξάμηνο1 Ανάλυση Αλγορίθμων b Θέματα: Ορθότητα Χρονική αποδοτικότητα Χωρική αποδοτικότητα Βελτιστότητα b Προσεγγίσεις:
Διπλωματική Εργασία Πειραματική Αξιολόγηση της Μοναδιαίας Οκνηρής Συνέπειας Τόξου (Singleton Lazy Arc Consistency) Ιωαννίδης Γιώργος (ΑΕΜ: 491)
Olympia Nikou1 Τίτλος Παρουσίασης: Προσεγγιστικός Υπολογισμός των λύσεων ενός προβλήματος με: Δειγματοληψία στον χώρο αναζήτησης των λύσεων.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Επεξεργασία Ερωτήσεων.
Χρονική Πολυπλοκότητα
Μηχανική Μάθηση σε Συστήματα Πολλαπλών Πρακτόρων Παπαλιάς Κωνσταντίνος Τμήμα Πληροφορικής.
Ενότητα: Ελεγκτές - Controllers
Advanced Data Indexing (Προηγμένη ευρετηρίαση δεδομένων) Ροές Δεδομένων (3 ο Μέρος)
Προγραμματισμός και Διαχείριση Επιχειρηματικών Πόρων - ERP Μάθημα 6: Η διαδικασία του MRP.
ΕΙΣΑΓΩΓΗ Η επιδίωξη: βελτίωση ποιότητας με συνεχή βελτίωση των διεργασιών με βάση τις οποίες παράγονται τα προϊόντα Παράγοντες: ελεγχόμενες μεταβλητές.
1 Διαχείριση Έργων Πληροφορικής Διάλεξη 7 η Διαχείριση Πόρων.
Σχεδιασμός των Μεταφορών Ενότητα #6: Μοντέλα κατανομής μετακινήσεων – Distribution models. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ Παραδείγματα BP.
ΗΛΕΚΤΡΙΚΕΣ ΜΕΤΡΗΣΕΙΣ ΣΦΑΛΜΑΤΑ ΜΕΤΡΗΣΗΣ.
Σήματα και Συστήματα 11 10η διάλεξη. Σήματα και Συστήματα 12 Εισαγωγικά (1) Έστω γραμμικό σύστημα που περιγράφεται από τη σχέση: Αν η είσοδος είναι γραμμικός.
ΤΕΙ Αθήνας: Σχολή ΤΕΦ: Τμήμα Ναυπηγικής Εφαρμογές Η/Υ στην Ναυπηγική ΙΙ ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ NA0703C39 Εξάμηνο Ζ’ Διδάσκων Κωνσταντίνος Β. Κώστας Παρουσίαση.
ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ II Καθ. Πέτρος Π. Γρουμπός Διάλεξη 8η Στοχαστικά Σήματα - 1.
Ηλεκτρική Οικονομία Σταμάτης Νικολόπουλος ΑΜ: 868 ΑΣΠΑΙΤΕ, 2015.
ΔΙΕΘΝΕΙΣ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΕΣ ΑΓΟΡΕΣ
Ασκήσεις WEKA Δέντρα αποφάσεων.
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Προσαρμοστικοί Αλγόριθμοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων:
Δυναμικός Κατακερματισμός
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΧΡΟΝΙΚΟυ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟυ ΕΡΓΩΝ
Επίλυση Προβλημάτων με Αναζήτηση
Πολυκριτήριος Γραμμικός Προγραμματισμός
ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΕΞΕΛΙΚΤΙΚΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ
Προσομοίωση και Μοντέλα Συστημάτων (Μέρος B)
Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης
Διδάσκων: Δρ. Τσίντζα Παναγιώτα
Πολυσυγγραμμικότητα Εξειδίκευση
Αλγόριθμοι για ανάθεση συχνοτήτων και έλεγχο αποδοχής κλήσεων σε κυψελικά ασύρματα δίκτυα (μέρος ΙIΙ)
ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΕΞΕΛΙΚΤΙΚΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ
Δυναμικός Προγραμματισμός
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΧΡΟΝΙΚΟυ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟυ ΕΡΓΩΝ
Φοιτητής: Τσακίρης Αλέξανδρος Επιβλέπων: Ευάγγελος Ούτσιος
ΥΠΟΛΟΓΙΣΜΟΣ ΚΑΘΑΡΟΥ ΚΕΡΔΟΥΣ ΑΠΌ ΤΗΝ ΑΓΡΟΤΙΚΗ ΔΡΑΣΤΗΡΙΟΤΗΤΑ
Λήψη απόφασης για Ενεργειακό Σχεδιασμό
‘Δομημένος Εξελικτικός Αλγόριθμος’ Επιβλέπων: Κυριάκος Χ. Γιαννάκογλου
Εισαγωγή στα Προσαρμοστικά Συστήματα
Προσαρμοστικοί Αλγόριθμοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων:
Μεταγράφημα παρουσίασης:

Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη

Εισαγωγή Οι μέχρι τώρα έρευνες έχουν εστιάσει στο πρόβλημα της ενεργής επιλογής μοντέλου. Πρόβλημα επιλογής μοντέλου: Δεδομένου ενός συνόλου δεδομένων απαιτείται επιλογή των παραδειγμάτων με τη μέγιστη ποσότητα πληροφορίας για την επιλογή του βέλτιστου από μία προκαθορισμένη οικογένεια μοντέλων με όσο το δυνατόν μικρότερο αριθμό παραδειγμάτων εκπαίδευσης (παραδειγμάτων για την κατασκευή του μοντέλου) Στόχος: βελτιστοποίηση απόδοσης του χρησιμοποιούμενου αλγόριθμου μηχανικής μάθησης. Ιδέα κλειδί: επιλογή παραδειγμάτων με τη μεγαλύτερη αβεβαιότητα ταξινόμησης

Ενεργή επιλογή αλγορίθμου-Το πρόβλημα Ορισμός: Δεδομένου ενός συνόλου δεδομένων και ενός συνόλου αλγορίθμων μηχανικής μάθησης για δυαδική ταξινόμηση ο στόχος είναι η αναγνώριση του βέλτιστου αλγορίθμου με χρήση του ελάχιστου αριθμού παραδειγμάτων. Μήπως ο μικρός αριθμός παραδειγμάτων μειώνει την απόδοση του αλγορίθμου ; Απάντηση Έχει αποδειχτεί ότι η προσεχτική επιλογή των παραδειγμάτων που χρησιμοποιούνται δεν επηρεάζει τον αλγόριθμο που επιλέγεται ως βέλτιστος.

Προηγούμενη εργασία στον τομέα Ενεργή μάθηση: ευρέως μελετημένο πρόβλημα στην εκμάθηση μηχανών. - επαναληπτικοί αλγόριθμοι - σε κάθε επανάληψη επιλογή παραδείγματος με τη μέγιστη ποσότητα πληροφορίας και πρόσθεσή του στο σύνολο εκπαίδευσης. - τερματισμός με την επίτευξη ικανοποιητικής ακρίβειας ταξινόμησης. Αλγόριθμος Μέγιστης Διάκρισης Εντροπίας: επεκτάθηκε για υπολογισμό βαρών κάθε αλγορίθμου σε συνδυασμό τους. Αλγόριθμος Hedge: συνδυάζει πολλά μοντέλα για να βελτιστοποιήσει την ακρίβεια ταξινόμησης.

Προηγούμενη εργασία στον τομέα- Έννοιες αλγόριθμου Hedge(1) Έστω Μ= {Μ 1, Μ 2, …,Μ s } μοντέλα δυαδικής ταξινόμησης και y t {-1,1} ετικέτες κλάσεων ταξινόμησης Συνδυασμός μοντέλων και ανάθεση βάρους σε αυτά για περισσότερη ακρίβεια ταξινόμησης Συνάρτηση απώλειας μοντέλου: Έστω l(y,y’) η συνάρτηση απώλειας μεταξύ της τιμής- «ετικέτα» που αντιστοιχεί στην πραγματική κλάση και σε αυτή που αντιστοιχεί στην προβλεπόμενη από το μοντέλο. Συνολικό σφάλμα ταξινόμησης για συνδυασμό μοντέλων

Προηγούμενη εργασία στον τομέα- Έννοιες αλγόριθμου Hedge(2) Παράγοντας ποινής β: ορίζεται για τον καθορισμό της μείωσης του βάρους ενός μοντέλου για κάθε λάθος πρόβλεψη Βάρος μοντέλου (για περισσότερη ακρίβεια ταξινόμησης) 1. Αρχικά ομοιόμορφη κατανομή των βαρών 2. Για κάθε παράδειγμα :

Ενεργή επιλογή αλγορίθμου – Min-Max πλαίσιο Εκτέλεση των δοθέντων αλγορίθμων πάνω σε σύνολο παραδειγμάτων D -> Μ={Μ 1,Μ 2,…, Μ s } Σε κάθε επανάληψη επιλέγεται για ταξινόμηση x που μεγιστοποιεί τη συνάρτηση απώλειας βάρους: Το βάρος ενός μοντέλου μπορεί να θεωρηθεί η πιθανότητα να επιλεγεί. Αν p(y|x,M): πιθανότητα του x να ταξινομηθεί στην κλάση y από το μοντέλο M

Πληροφορίας συνάφειας παραδειγμάτων Μειονέκτημα MinMax: αντιμετωπίζει ανεξάρτητα τα παραδείγματα Εισαγωγή πίνακα P συσχέτισης ανά ζεύγους: - P ij : πιθανότητα x i και x j στην ίδια κλάση - Υπολογίζεται από προβλέψεις μοντέλων στο M Τότε το πρόβλημα βελτιστοποίησης γράφεται ως εξής: για P ij = προκύπτει το προηγούμενο πρόβλημα

Εκτίμηση βαρών συνδυασμού παραδειγμάτων Πρόβλημα σε υπολογισμό βαρών αλγορίθμου Hedge: ίδιο β για κάθε μοντέλο Απαίτηση: μικρό β για παραδείγματα με μεγάλη ποσότητα πληροφορίας και αντίστροφα Λύση: Υπολογισμός w από το πρόβλημα βελτιστοποίησης: γ:συντελεστής τη σημασία ενός λαθών ταξινόμησης Ο αλγόριθμος τείνει να αποδώσει πιο μικρά βάρη σε αλγορίθμους που κάνουν περισσότερα λάθη

Πειραματική αξιολόγηση(1) Τα πειράματα αφορούσαν τους εξής τομείς: – ανίχνευση φαρμάκων – προώθηση προϊόντων – αναγνώριση ψηφίων Χρησιμοποιήθηκαν 10 διαφορετικοί αλγόριθμοι Για κάθε σύνολο δεδομένων μοναδικός βέλτιστος σημαντικά καλύτερος αλγόριθμος από τους υπόλοιπους.

Πειραματική αξιολόγηση(2) Τρεις παραλλαγές του αλγορίθμου: – Αλγόριθμος Hedge με β=0.7 – Αλγόριθμος Hedge + Correlation με β=0.7 – MED+Correlation και δύο «αφελείς» αλγόριθμοι – Τυχαία επιλογή παραδειγμάτων – Ισότιμοι αλγόριθμοι, επιλογή παραδειγμάτων τη μεγαλύτερη ασυμφωνία σε προβλέψεις Μέτρηση απόδοσης αλγορίθμων με : – Αριθμός απαιτούμενων παραδειγμάτων για επικράτηση αλγορίθμου – Ακρίβεια αλγορίθμου για συγκεκριμένο αριθμό παραδειγμάτων

Αποτελέσματα Ο αλγόριθμος Hedge και οι δύο απλοί τρόποι δεν έχουν σημαντικά χειρότερη απόδοση από τους άλλους MED+Correlation καλύτερος από τον Hedge+ Correlation γιατί προσαρμόζει τους συντελεστές βt Προτιμάται η χρήση του βέλτιστου αλγορίθμου από το συνδυασμό τους (για μικρά σύνολα εκπαίδευσης μικρή διαφορά απόδοσης).

Σύνοψη και μελλοντική έρευνα Το πρόβλημα: επιλογή του βέλτιστου από ένα καθορισμένο σύνολο αλγορίθμων μάθησης με τον ελάχιστο αριθμό παραδειγμάτων Προτείνεται αλγόριθμος βασισμένος σε αλγόριθμο του Hedge και την αρχή MaxMin. Επέκταση: εκμετάλλευση πληροφορίας συνάφειας μεταξύ των παραδειγμάτων και αυτόματος υπολογισμός των βαρών τους Μελλοντική έρευνα: καλύπτονται περιπτώσεις όπου δεν υπάρχει σημαντική διαφορά μεταξύ της απόδοσης των δύο πρώτων αλγορίθμων αλλά και περιπτώσεις όπου πάνω από ένας αλγόριθμοι είναι βέλτιστοι.

Ερωτήσεις