Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΕΚΕΦΕ «ΔΗΜΟΚΡΙΤΟΣ» Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Η μηχανική μάθηση στην αντιμετώπιση της Υπερπληροφόρησης Γεώργιος Παλιούρας

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΕΚΕΦΕ «ΔΗΜΟΚΡΙΤΟΣ» Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Η μηχανική μάθηση στην αντιμετώπιση της Υπερπληροφόρησης Γεώργιος Παλιούρας"— Μεταγράφημα παρουσίασης:

1 ΕΚΕΦΕ «ΔΗΜΟΚΡΙΤΟΣ» Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Η μηχανική μάθηση στην αντιμετώπιση της Υπερπληροφόρησης Γεώργιος Παλιούρας WWW: Ο.Π.Α., 2 Φεβρουαρίου 2001

2 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 2 Μηχανική Μάθηση Στόχος: Απόκτηση γνώσης από παραδείγματα. Στόχος: Απόκτηση γνώσης από παραδείγματα. Προσέγγιση: Αναζήτηση στο χώρο των μοντέλων που καλύπτουν τα παραδείγματα. Προσέγγιση: Αναζήτηση στο χώρο των μοντέλων που καλύπτουν τα παραδείγματα. Εφαρμογή: Δημιουργία και βελτίωση ευφυών συστημάτων. (π.χ. Επεξεργασία Φυσικής Γλώσσας, Μοντελοποίηση Χρηστών). Εφαρμογή: Δημιουργία και βελτίωση ευφυών συστημάτων. (π.χ. Επεξεργασία Φυσικής Γλώσσας, Μοντελοποίηση Χρηστών).

3 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 3 Πληροφορία στον Παγκόσμιο Ιστό Ο Παγκόσμιος Ιστός μεγαλώνει: Ο Παγκόσμιος Ιστός μεγαλώνει:  Περίπου χρήστες,  νέες σελίδες κάθε μέρα.  600 GB αλλάζουν κάθε μέρα....δημιουργώντας υπερπροσφορά πληροφορίας: «Το 99% της πληροφορίας δεν ενδιαφέρει το 99% των χρηστών.»

4 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 4 Υπερπληροφόρηση …ο αυξανόμενος αριθμός χρηστών... …οδηγεί στην αύξηση της παρεχόμενης πληροφορίας... …ελκύοντας περισσότερους χρήστες... …οδηγώντας στην υπερπληροφόρηση των χρηστών... …αυξάνοντας περισσότερο την ποσότητα της πληροφορίας...

5 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 5 Τρέχουσα κατάσταση Πολλές υπηρεσίες πρόσβασης στην πληροφορία... … είναι όμως αποτελεσματικές ;

6 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 6 Ευφυής διαχείριση πληροφορίας Φιλτράρισμα πληροφορίας (information filtering). Φιλτράρισμα πληροφορίας (information filtering).  Φιλτράρισμα ανεπιθύμητων ηλεκτρονικών μηνυμάτων (spam mail filtering). Εξαγωγή πληροφορίας (information extraction) Εξαγωγή πληροφορίας (information extraction)  Αναγνώριση ονομάτων οντοτήτων (named-entity recognition). Μοντελοποίηση χρηστών (user modelling). Μοντελοποίηση χρηστών (user modelling).  Συνεργατικό φιλτράρισμα πληροφορίας (collaborative filtering).

7 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 7 Φιλτράρισμα ανεπιθύμητων ηλεκτρονικών μηνυμάτων Πηγή: Διαφημίσεις, που αποστέλλονται μαζικά σε χιλιάδες παραλήπτες. Πηγή: Διαφημίσεις, που αποστέλλονται μαζικά σε χιλιάδες παραλήπτες. Εκτίμηση (1998): 10% της εισερχόμενης αλληλογραφίας σε επιχειρησιακά δίκτυα. Εκτίμηση (1998): 10% της εισερχόμενης αλληλογραφίας σε επιχειρησιακά δίκτυα. Προβλήματα που δημιουργεί: Προβλήματα που δημιουργεί:  Χάσιμο χρόνου και υπολογιστικών πόρων.  Οικονομικό κόστος για dial-up συνδέσεις.  Έκθεση σε ενοχλητικό περιεχόμενο.

8 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 8 Φιλτράρισμα ανεπιθύμητων ηλεκτρονικών μηνυμάτων Φιλτράρισμα: κατηγοριοποίηση μηνυμάτων σε επιθυμητά και μη. Φιλτράρισμα: κατηγοριοποίηση μηνυμάτων σε επιθυμητά και μη. Υπάρχοντα συστήματα: «μαύρες λίστες» αποστολέων και λέξεις κλειδιά. Υπάρχοντα συστήματα: «μαύρες λίστες» αποστολέων και λέξεις κλειδιά. Ανάγκη για προσαρμοζόμενα ευφυή συστήματα φιλτραρίσματος. Ανάγκη για προσαρμοζόμενα ευφυή συστήματα φιλτραρίσματος. Η προσέγγισή μας: εκπαίδευση στατιστικού ταξινομητή. Η προσέγγισή μας: εκπαίδευση στατιστικού ταξινομητή.

9 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 9 Φιλτράρισμα ανεπιθύμητων ηλεκτρονικών μηνυμάτων Γλωσσική προεπεξεργασία: αφαίρεση κοινών λέξεων και εύρεση λημμάτων. Γλωσσική προεπεξεργασία: αφαίρεση κοινών λέξεων και εύρεση λημμάτων. Επιλογή χαρακτηριστικών (info gain): Επιλογή χαρακτηριστικών (info gain): Μοντέλο ταξινόμησης: Μοντέλο ταξινόμησης:

10 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 10 Αναγνώριση ονομάτων οντοτήτων Προεπεξεργασία Διαχ. λεκτικών μονάδων Διαχ. προτάσεων Μορφολογικός αναλυτής Εύρεση μ.τ.λ. Domain Specific Modules Εξειδίκευση στη θεματική περιοχή Λεξικό Κατάλογοι γνωστών ονομάτων Γραμματική (Επιφανειακή) συντακτική ανάλυση Κατασκευή με μηχανική μάθηση

11 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 11 Αναγνώριση ονομάτων οντοτήτων Δεδομέναεκπαίδευσης Εύρεση καλύτερου χαρα- κτηριστικού για τον δια- χωρισμό των κατηγοριών Πρόσω πα Οργανι σμοί Όχι ονόματα οντοτήτων Χαρ N Χαρ 3 Χαρ 2 Χαρ 1 Χαρ 2 X Χαρ N X = A X = BX = Γ X ;

12 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 12 Εξατομικευμένο φιλτράρισμα πληροφορίας πηγές εξυπηρετητής παραλήπτες

13 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 13 Συνεργατικό φιλτράρισμα πληροφορίας Φιλτράρισμα με βάση τις επιλογές ομάδων με κοινά ενδιαφέροντα. Φιλτράρισμα με βάση τις επιλογές ομάδων με κοινά ενδιαφέροντα. Τεχνικές φιλτραρίσματος με χρήση απομνημόνευσης (memory-based CF). Τεχνικές φιλτραρίσματος με χρήση απομνημόνευσης (memory-based CF). Τεχνικές φιλτραρίσματος με βάση μοντέλα κοινοτήτων (model-based CF). Τεχνικές φιλτραρίσματος με βάση μοντέλα κοινοτήτων (model-based CF). Ατομικό μοντέλο: Ατομικό μοντέλο:

14 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 14 Συνεργατικό φιλτράρισμα πληροφορίας πολιτικά αθλητικά 01 1

15 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 15 Συνεργατικό φιλτράρισμα πληροφορίας πολιτικά αθλητικά 01 1

16 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 16 Συμπεράσματα Η υπερπληροφόρηση εντείνεται με την ραγδαία εξάπλωση του Διαδικτύου. Η υπερπληροφόρηση εντείνεται με την ραγδαία εξάπλωση του Διαδικτύου. Απαραίτητα τα ευφυή συστήματα διαχείρισης πληροφορίας. Απαραίτητα τα ευφυή συστήματα διαχείρισης πληροφορίας. Η μηχανική μάθηση βοηθά στην απόκτηση γνώσης και τη δημιουργία εξατομικευμένων συστημάτων φιλτραρίσματος πληροφορίας. Η μηχανική μάθηση βοηθά στην απόκτηση γνώσης και τη δημιουργία εξατομικευμένων συστημάτων φιλτραρίσματος πληροφορίας.

17 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 17 Βιβλίο για μηχανική μάθηση Έκδοση βιβλίου το 2001, με θέμα “Machine Learning and Applications” Έκδοση βιβλίου το 2001, με θέμα “Machine Learning and Applications” Βασίζεται σε διαλέξεις και ημερίδες από το διεθνές θερινό σχολείο ACAI’99, που διοργανώθηκε στα Χανιά, από την Ελληνική Εταιρία Τεχνητής Νοημοσύνης, με την υποστήριξη του ECCAI. Βασίζεται σε διαλέξεις και ημερίδες από το διεθνές θερινό σχολείο ACAI’99, που διοργανώθηκε στα Χανιά, από την Ελληνική Εταιρία Τεχνητής Νοημοσύνης, με την υποστήριξη του ECCAI.

18 © Γεώργιος Παλιούρας (Φεβρουάριος 2001) 18 Βιβλίο για μηχανική μάθηση Κεφάλαια από διαλέξεις: Κεφάλαια από διαλέξεις: Μ. van Someren, R. Michalskι, Y. Kodratoff, P. Langley, R. L. de Mantaras, I. Bratko, L. de Raedt, J. Shapiro, Σ. Θεοδωρίδης, L. Saitta. Αναφορές από ημερίδες σε εφαρμογές μηχανικής μάθησης: ιατρική, οικονομικά, ενεργειακή βιομηχανία, περιβάλλον, επεξεργασία φυσικής γλώσσας, ευφυείς διαμεσολαβητές, μοντελοποίηση χρηστών,... Αναφορές από ημερίδες σε εφαρμογές μηχανικής μάθησης: ιατρική, οικονομικά, ενεργειακή βιομηχανία, περιβάλλον, επεξεργασία φυσικής γλώσσας, ευφυείς διαμεσολαβητές, μοντελοποίηση χρηστών,...


Κατέβασμα ppt "ΕΚΕΦΕ «ΔΗΜΟΚΡΙΤΟΣ» Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Η μηχανική μάθηση στην αντιμετώπιση της Υπερπληροφόρησης Γεώργιος Παλιούρας"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google