Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Ανακάλυψη Κανόνων Συσχέτισης στο Σημασιολογικό Ιστό: Μια Επαγωγική Μέθοδος Ολυμπία Νίκου Α.Μ. Μ956 Διπλωματική Εργασία Επιβλέποντες: Ευστάθιος Χατζηευθυμιάδης.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Ανακάλυψη Κανόνων Συσχέτισης στο Σημασιολογικό Ιστό: Μια Επαγωγική Μέθοδος Ολυμπία Νίκου Α.Μ. Μ956 Διπλωματική Εργασία Επιβλέποντες: Ευστάθιος Χατζηευθυμιάδης."— Μεταγράφημα παρουσίασης:

1 Ανακάλυψη Κανόνων Συσχέτισης στο Σημασιολογικό Ιστό: Μια Επαγωγική Μέθοδος Ολυμπία Νίκου Α.Μ. Μ956 Διπλωματική Εργασία Επιβλέποντες: Ευστάθιος Χατζηευθυμιάδης Βασίλειος Παπαταξιάρχης Απρίλιος 2012

2 Δομή Παρουσίασης  Εισαγωγή  Ανάπτυξη Συστήματος  Αξιολόγηση Συστήματος  Συμπεράσματα

3 Οντολογία (1/2)  Επίσημη, ακριβής περιγραφή μιας εννοιολογικής θεώρησης ενός φαινομένου (Formal, explicit specification of a shared conceptualization)  Επίσημη: Κατανοητή από υπολογιστή  Ακριβής: Έννοιες/Συσχετίσεις/Περιορισμοί ορίζονται ακριβώς  Φαινόμενο: Αφηρημένο μοντέλο περιγραφής ενός πραγματικού φαινομένου  Βασικός τρόπος αναπαράστασης γνώσης στο Σημασιολογικό Ιστό  Web Ontology Language (OWL)

4 Οντολογία (2/2)  Περιλαμβάνει:  Κλάσεις  Συσχετίσεις (Object Properties)  Συσχετίσεις Χαρακτηριστικών (Datatype Properties)  Εξαγωγή συμπερασμάτων:  Έλεγχος συνέπειας (check consistency), ταξινόμηση (classification)  Κανόνες (Rules)

5 Ανακάλυψη Γνώσης  Χρονοβόρα διαδικασία εξαγωγής έγκυρης, άγνωστης, πιθανώς χρήσιμης και απόλυτα κατανοητής πληροφορίας για τα δεδομένα (Fayyad)  Χρονοβόρα διαδικασία: Πολλαπλές διαδικασίες  Έγκυρη: Αποδεδειγμένα μοντέλα/πρότυπα  Άγνωστη: Προηγουμένως άγνωστη πληροφορία  Χρήσιμη: Εξαγωγή συμπεράσματος ή ως είσοδος σε διαδικασίες  Κατανοητή: Από άνθρωπο/υπολογιστή Αρχικά Δεδομένα Εκτέλεση Αλγορίθμου Εξόρυξης Δεδομένων Γενικά πρότυπα Δεδομένα υψηλής αφαίρεσης/γενίκευσης

6 Κίνητρα και Στόχοι  Μη εφικτή η κλασική εφαρμογή της Ανακάλυψης Γνώσης στα δεδομένα του Σημασιολογικού Ιστού.  Ανομοιογένεια, δυναμικότητα, σημασιολογικές συσχετίσεις  Αλλαγή δεδομένων Σημασιολογικού Ιστού Αλλαγή χρήσιμων χαρακτηριστικών νέας γνώσης.  Αλγόριθμοι Ανακάλυψης Γνώσης: Στατικοί και μη-επεκτάσιμοι  Σημασιολογική ενοποίηση δεδομένων διαφορετικών πηγών  Στόχοι  Προσαρμογή διαδικασίας ανακάλυψης γνώσης στα δεδομένα του Σημασιολογικού Ιστού  Αυτόματη παραγωγή νέας γνώσης από τα δεδομένα του ΣΙ.

7 Δομή Παρουσίασης  Εισαγωγή  Ανάπτυξη Συστήματος  Αξιολόγηση Συστήματος  Συμπεράσματα

8 Αρχιτεκτονική Συστήματος Μηχανή Συμπερασμού Μηχανή Παραγωγής Κανόνων Οντολογία (OWL2) Κανόνες SWRL Διεπαφή Συστήματος Ενημέρωση Οντολογίας Βάση Γνώσης

9 Διεπαφή Συστήματος  Επιλογή Οντολογίας  Επιλογή Διαδικασίας Συμπερασμού  Καθορισμός Κριτηρίων Κανόνων: Υποστήριξη Εμπιστοσύνη Θόρυβος  Μέγιστο πλήθος στοιχείων στο σώμα των κανόνων

10 Μηχανή Παραγωγής Κανόνων – Μετρικές Συστήματος (1/3)  Βάση Γνώσης  Female(?x), Person(?y) isDaughterOf(?x,?y)  Υποστήριξη (Support) TBox Person, Female Person ABox Person(mary), Person(ann), Person(tom), Person(eve), Female(mary), Female(ann), Female(eve), isDaughterOf(mary, ann), isDaughterOf(eve, tom) HeadBody (mary,ann) (eve,tom) (mary,ann) (eve,tom) S = 2/2 = 1 Εκφράζει τη βαρύτητα του κανόνα

11 Μηχανή Παραγωγής Κανόνων – Μετρικές Συστήματος (2/3)  Female(?x), Person(?y) isDaughterOf(?x,?y)  Εμπιστοσύνη (Confidence) BodyHead (ann,ann) (ann, mary) (ann,tom) (ann,eve) (mary,ann) (mary, mary) (mary,tom) (mary,eve) (eve,ann) (eve,mary) (eve,tom) (eve,eve) (mary,ann) (eve,tom) Δηλώνει πόσο ισχυρός είναι ο κανόνας C = 2/12 = 0.17

12 Μηχανή Παραγωγής Κανόνων – Μετρικές Συστήματος (3/3)  Θόρυβος Καθορίζει το μέγιστο επιτρεπτό πλήθος στιγμιοτύπων κεφαλής που δεν καλύπτονται από τον κανόνα Η τιμή του καθορίζεται από την ορθότητα της βάσης γνώσης. Προκαθορισμένη τιμή θορύβου = 0%

13 Μηχανή Παραγωγής Κανόνων – Αλγόριθμος  Συνδυασμός Κατά Πλάτος & Κατά Βάθος Αναζήτηση  Πρώτο Επίπεδο: Κατά Πλάτος  Υψηλότερα Επίπεδα: Κατά Βάθος  (+) Σωστή διαχείριση πόρων συστήματος  (-) Εκθετικός χρόνος αναζήτησης όλων των λύσεων  Περικοπή χώρου αναζήτησης:  Τιμή Υποστήριξης & Θορύβου  Πλήθος στοιχείων στο σώμα του κανόνα  Όχι unsafe κανόνες  Person(?x) hasChild(?x,?y)

14 SWRL Κανόνες S(%)C(%)Κανόνας 2711 EconomicsModule(?x) ^ Staff(?y) -> teaches(?y,?x) ComputerScienceModule(?x) ^ Person(?y) -> isTaughtBy(?x,?y) Module(?x) -> MathsModule(?x) S(%)C(%)Κανόνας 2711 AcademicStaff(?y) ^ EconomicsModule(?x) -> teaches(?y,?x) ComputerScienceModule(?x) ^ Person(?y) -> teaches(?y,?x) MathsModule(?x) -> Module(?x) Περιττοί Κανόνες Μόνο μετά τη διαδικασία συμπερασμού Χρήσιμοι Κανόνες

15 Λειτουργικότητα Συστήματος Χρήσιμοι Κανόνες Περιττοί Κανόνες Οντολογία SWRL Κανόνες Ενημέρωση Βάσης Γνώσης Συμπερασμός? Αρχική Οντολογία Οντολογία μετά από Reasoning ΝΑΙ Προτιμήσεις Χρήστη Διαδικασία Συμπερασμού Παραγωγή Κανόνων Συνεπής?

16 Δομή Παρουσίασης  Εισαγωγή  Ανάπτυξη Συστήματος  Αξιολόγηση Συστήματος  Συμπεράσματα

17 Αξιολόγηση Επιδόσεων (1/5)  Μετρικές Συστήματος Ελάχιστη Τιμή Υποστήριξης (Support Threshold) = 100% Ελάχιστη Τιμή Εμπιστοσύνης (Confidence Threshold) = 100% Μέγιστη Επιτρεπτή Τιμή Θορύβου (Noise Threshold) = 5% Μέγιστο πλήθος στοιχείων σώματος κανόνα = 5

18 Αξιολόγηση Επιδόσεων (2/5)  Οντολογία Μοντελοποίησης Μαθημάτων – Ιεραρχία εννοιών οντολογίας

19 Αξιολόγηση Επιδόσεων (3/5)  SWRL Κανόνες χωρίς διαδικασία συμπερασμού S (%)C (%)Κανόνας 100 AcademicStaff(?x) ^ Module(?y) ^ teaches(?x,?y) -> isTaughtBy(?y,?x) 100 isTaughtBy(?x,?y) -> teaches(?y,?x) 100 isTaughtBy(?x,?y) -> AcademicStaff(?y) Σύνολο Κανόνων: 3 Χρόνος Απόκρισης: 188 ms

20 Αξιολόγηση Επιδόσεων (4/5)  SWRL Κανόνες μετά τη διαδικασία συμπερασμού S(%)C(%)Κανόνας 100 AcademicStaff(?x) ^ Module(?y) ^ teaches(?x,?y) -> isTaughtBy(?y,?x) 100 isTaughtBy(?x,?y) -> teaches(?y,?x) 100 isTaughtBy(?x,?y) -> AcademicStaff(?y) 100 isTaughtBy(?x,?y) -> Module(?x) 100 isTaughtBy(?x,?y) -> Staff(?y) 100 Student(?x) -> UndergraduateStudent(?x) 100 Staff(?x) -> AcademicStaff(?x)

21 Αξιολόγηση Επιδόσεων (5/5)  SWRL Περιττοί Κανόνες μετά τη διαδικασία συμπερασμού S(%)C(%)Κανόνας 100 UndergraduateStudent(?x) -> Student(?x) 100 AcademicStaff(?x) -> Staff(?x) Σύνολο Κανόνων = 7 Σύνολο Περιττών Κανόνων = 2 Χρόνος Απόκρισης = 750 ms

22 Rules Discovery vs ILP Systems ΣύστημαΠλήθος Κανόνων FOIL4 GOLEM6 PROGOL8 ALEPH7 Rules Discovery47  Μετατροπή οντολογίας σε κατάλληλη μορφή για κάθε ILP Σύστημα  Παραγωγή unsafe κανόνων  Δημιουργία πάντα αληθών κανόνων  Εμφάνιση παραδειγμάτων της Βάσης Γνώσης ως κανόνες

23 Δομή Παρουσίασης  Εισαγωγή  Ανάπτυξη Συστήματος  Αξιολόγηση Συστήματος  Συμπεράσματα

24 Συμπεράσματα  Εφαρμογή μεθοδολογιών ανακάλυψης γνώσης στο Σημασιολογικό Ιστό.  Δημιουργία κανόνων συσχέτισης από οντολογία.  Παραγωγή νέας γνώσης σε μορφή SWRL κανόνων.  Δυνατότητα ενημέρωσης της βάσης γνώσης  Δυνατότητα ικανοποίησης κριτηρίων (υποστήριξη, εμπιστοσύνη) από τους κανόνες

25 Ανοικτά Θέματα  Εφαρμογή μεθόδου σε πραγματικές εφαρμογές  Ορισμός μέγιστου χρόνου εκτέλεσης διαδικασίας  Ορισμός συγκεκριμένου πλήθους κανόνων  Εφαρμογή μεθόδου σε υποσύνολο της οντολογίας  Τμηματοποιημένη μεταφορά οντολογίας στη μνήμη

26 Ευχαριστώ πολύ για το χρόνο σας!!!


Κατέβασμα ppt "Ανακάλυψη Κανόνων Συσχέτισης στο Σημασιολογικό Ιστό: Μια Επαγωγική Μέθοδος Ολυμπία Νίκου Α.Μ. Μ956 Διπλωματική Εργασία Επιβλέποντες: Ευστάθιος Χατζηευθυμιάδης."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google