Χαράλαμπος Ευτ. Τσουρακάκης

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Δομές Δεδομένων και Αλγόριθμοι
Advertisements

1. Εισαγωγή Ορισμοί:  VOD  NVOD  Live Streaming.
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Λογικός Σχεδιασμός Σχεσιακών Σχημάτων: Αποσύνθεση.
Εισαγωγή στο Προγραμματισμό
ΣΤΟΙΧΕΙΑ ΨΕΥΔΟΚΩΔΙΚΑ ΒΑΣΙΚΕΣ ΔΟΜΕΣ ΒΑΣΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΠΙΝΑΚΩΝ
Πιθανότητες & Τυχαία Σήματα Συσχέτιση
Ανακτηση Πληροφοριασ σε νεφη Υπολογιστων
Βάσεις Δεδομένων 1 T.Manavis– N.Kyritsis.
 Αυδίκου Χριστίνα  Γιουμούκης Παναγιώτης  Κιντσάκης Θάνος  Πάπιστας Γιάννης.
Peer-to-Peer Systems Ευθυμία Ρόβα Βίκυ Τζιοβάρα Μαρία Χριστοδουλίδου.
Μηχανική Μάθηση και Εξόρυξη Γνώσης
Αναγνώριση Προτύπων.
Παραγωγή τυχαίων γεωμετρικών δομών Παναγιώτης Τίγκας Ενδιάμεση εξέταση πτυχιακής εργασίας.
Αναγνώριση Προτύπων.
Κεφάλαιο 2ο Πεπερασμένα αυτόματα.
Κ. Μόδη: Γεωστατιστική και Εφαρμογές της (Κεφάλαιο 5) 1 Τυχαία συνάρτηση Μία τυχαία συνάρτηση (ΤΣ) είναι ένας κανόνας με τον οποίο σε κάθε αποτέλεσμα ζ.
ΣΧΕΣΙΑΚΟ ΜΟΝΤΕΛΟ ΜΑΘΗΜΑ 3.
ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ
Δημήτρης Γαβρίλης, Κωνσταντία Κακάλη Βιβλιοθήκη & Υπηρεσία Πληροφόρησης, Πάντειο Πανεπιστήμιο.
Δεδομένα, Πληροφορίες και Ηλεκτρονικοί Υπολογιστές
ΕΥΡΕΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΕΚΤΟΠΩΝ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Ευστάθεια Συστημάτων Αυτομάτου Ελέγχου:
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
Σχεδίαση Αλγορίθμων. Διεργασίες (1/2) Μία διεργασία αλληλεπιδρά με το περιβάλλον της δεχόμενη είσοδο και παράγοντας έξοδο.
2-1 Ανάλυση Αλγορίθμων Αλγόριθμος Πεπερασμένο σύνολο εντολών που, όταν εκτελεστούν, επιτυγχάνουν κάποιο επιθυμητό αποτέλεσμα –Δεδομένα εισόδου και εξόδου.
PHP/MYSQL ΠΑΡΟΥΣΙΑΣΗ ΣΤΑ ΠΛΑΙΣΙΑ ΤΟΥ ΜΑΘΗΜΑΤΟΣ ΕΠΟΙΚΟΙΝΩΝΙΑ ΑΝΘΡΩΠΟΥ-ΜΗΧΑΝΗΣ ΤΥΡΟΛΟΓΟΥ ΓΛΥΚΕΡΙΑ ΑΜ 875 ΡΙΖΟΥ ΔΕΣΠΟΙΝΑ ΑΜ 816.
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Information Extraction.
ΒΕΣ 06: Προσαρμοστικά Συστήματα στις Τηλεπικοινωνίες © 2007 Nicolas Tsapatsoulis Προσαρμοστικοί Αλγόριθμοι Υλοποίησης Βέλτιστων Ψηφιακών Φίλτρων: Ο αναδρομικός.
Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. K-means k-windows k-means: 2 φάσεις 1. Μια διαμέριση των στοιχείων σε k clusters 2. Η ποιότητα της διαμέρισης.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεδιασμός Σχεσιακών Σχημάτων.
Διδακτική της Πληροφορικής ΗΥ302 Εργασία :Παρουσίαση σχολικού βιβλίου Γ’ Λυκείου Τεχνολογικής Κατεύθυνσης «Ανάπτυξη εφαρμογών σε προγραμματιστικό περιβάλλον»
Θεωρία Υπολογισμού Κλειστότητα κανονικών γλωσσών Μη-κανονικές γλώσσες.
Θεωρία Υπολογισμού Λήμμα της Άντλησης. Είναι οι παρακάτω γλώσσες κανονικές; L = {0 n 1 n | n ≥ 0} L = { w | w ίδιο πλήθος 0 και 1} L = { w | w ίδιο πλήθος.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεσιακό Μοντέλο.
Προηγμένη Εφαρμογή Ιστού Διαχείρισης Δεδομένων Βιοεπιστημών Διπλωματική Εργασία του Γεωργίου Πρέκα ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ.
ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ 2: ΘΕΜΑΤΑ ΘΕΩΡΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Η/Υ
ΚΕΦΑΛΑΙΟ 6 ΓΕΩΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ: ΣΗΜΕΙΑ
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων.
Network Inference Μπαλάφα Κασιανή - Αδριανή Πλασταρά Κατερίνα.
Template-Independent News Extraction Based on Visual Consistency  Shuyi Zheng  Ruihua Song  Ji-Rong Wen Παπαντωνίου.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Λογικός Σχεδιασμός Σχεσιακών Σχημάτων.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεδιασμός Σχεσιακών Σχημάτων.
Βάσεις Δεδομένων ΙΙ Ευαγγελία Πιτουρά 1 Βάσεις Διαδικτύου.
Advanced Data Indexing (Προηγμένη ευρετηρίαση δεδομένων) Ροές Δεδομένων (3 ο Μέρος)
Αρχές επαγωγικής στατιστικής
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. –Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας.
Έλεγχος Υποθέσεων Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης, Κατά την εκτέλεση ενός στατιστικού ελέγχου,
ΥΝ Ι: ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ 1 ΥΠΟΛΟΓΙΣΤΙΚΗ ΝΟΗΜΟΣΥΝΗ (Τεχνητά Νευρωνικά Δίκτυα και Γενετικοί Αλγόριθμοι) ΣΠΥΡΟΣ ΛΥΚΟΘΑΝΑΣΗΣ, ΚΑΘΗΓΗΤΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ.
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΕΠΙΒΛΕΠΟΝΤΕΣ: Καθ. ΙΩΑΝΝΗΣ ΜΠΑΚΟΥΡΟΣ Δρ. ΕΛΠΙΔΑ ΣΑΜΑΡΑ ‘‘ΣΥΓΚΡΙΣΗ ΠΡΟΓΡΑΜΜΑΤΩΝ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΗ ΝΟΤΙΟ-ΑΝΑΤΟΛΙΚΗ ΕΥΡΩΠΗ & ΣΤΑΤΙΣΤΙΚΗ.
Δημιουργοί ΝΑΤΣΙΟΥΛΗΣ ΓΕΩΡΓΙΟΣ ΠΑΠΑΣ ΑΘΑΝΑΣΙΟΣ ΤΟΣΙΟΣ ΧΡΗΣΤΟΣ
Ασκήσεις WEKA.
Βασική Στατιστική Επεξεργασία. Ερμηνεία Δεδομένων.
Το Σχεσιακό Μοντέλο Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Προσομοίωση και Μοντέλα Συστημάτων (Μέρος B)
Κανονικότητα Μια από τις υποθέσεις του υποδείγματος της γραμμικής παλινδρόμησης είναι ότι ο διαταρακτικός όρος κατανέμεται κανονικά με μέσο μηδέν και σταθερή.
5o Μάθημα: Το τεστ χ2 Κέρκυρα.
Αρχεσ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ Η/Υ ΤΑξη Β΄
Το Σχεσιακό Μοντέλο Βάσεις Δεδομένων Ευαγγελία Πιτουρά.
Ταξινόμηση Πολυφασματικών Εικόνων
Παράδειγμα a Έστω ότι θέλουμε να υπολογίσουμε το μήκος της λωρίδας αριστερών στροφών σε μια διασταύρωση, ωστε να περιέχει με πιθανότητα 96%, τα οχήματα.
ΚΑΤΑΝΟΜΕΣ Δ. Τσιπλακίδης
Επαγωγική Στατιστική Συσχέτιση – Συντελεστής συσχέτισης Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Σχεσιακεσ βασεισ δεδομενων
Συγγραφέας: Ζαγκότας Στεφανος Επιβλέπων Καθηγητής: Ούτσιος Ευάγγελος
Εννοιολογική Χαρτογράφηση
Επαγωγική Στατιστική Συσχέτιση – Συντελεστές συσχέτισης Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Μεταγράφημα παρουσίασης:

Χαράλαμπος Ευτ. Τσουρακάκης WRAPPER MAINTENANCE Διπλωματική Εργασία Χαράλαμπος Ευτ. Τσουρακάκης Ακαδημαϊκό Έτος:2005-2006

ΑΞΟΝΕΣ ΠΑΡΟΥΣΙΑΣΗΣ Τι είναι wrapper,πώς παράγεται, ορισμός wrapper maintenance προβλήματος. Σύντομη παρουσίαση ορισμένων εργασιών σε wrapper verification και σε wrapper reinduction. Παρουσίαση της εργασίας μας: Ιδέα , αποτελέσματα. Συμπεράσματα-μελλοντική εργασία.

Το 80% των ιστοσελίδων περιέχουν δεδομένα τα οποία προέρχονται από μία ΒΔ.

Tι είναι ο web wrapper? Web wrapper είναι ένα πρόγραμμα το οποίο με βάση ένα σύνολο κανόνων εξάγει αυτόματα πληροφορία από ιστοσελίδες και την αποθηκεύει σε μία δομημένη μορφή. To σύνολο των κανόνων βασίζεται στην κανονικότητα που υπάρχει στην παρουσίαση της πληροφορίας στον χρήστη (layout).

Data Integration & wrappers

Τρόποι παραγωγής wrappers 1ος τρόπος Πρόγραμμα σε κάποια γλώσσα. Ασύμφορο…. 2ος τρόπος Wrapper Induction System Είσοδος:Σύνολο ιστοσελίδων με παραδείγματα επιθυμητής πληροφορίας. Έξοδος: wrapper

Wrapper Maintenance Οι ιστοσελίδες αρκετά συχνά αλλάζουν layout, ακόμα και περιεχόμενο. Το σύνολο των κανόνων εξαγωγής του wrapper παύει να εξάγει την επιθυμητή πληροφορία. Wrapper Maintenance= Wrapper verification+ Wrapper reinduction

ΑΞΟΝΕΣ ΠΑΡΟΥΣΙΑΣΗΣ Τι είναι wrapper,πώς παράγεται, ορισμός wrapper maintenance προβλήματος. Σύντομη παρουσίαση ορισμένων εργασιών σε wrapper verification και σε wrapper reinduction. Παρουσίαση της εργασίας μας: Ιδέα , αποτελέσματα. Συμπεράσματα-μελλοντική εργασία.

STRAWMAN

RAPTURE Πρώτη content based μέθοδος [Kushmerick] Πυκνότητα HTML χαρακτήρων = Τ.Μ που ακολουθεί την κανονική κατανομή Για τις testing σελίδες υπολογίζει με βάση τις εκτιμήτριες μ1,σ1 τις πιθανότητες για κάθε γνώρισμα τα εξαγόμενα δεδομένα ανά attribute να παίρνουν τις τιμές τους. Testing probability με βάση μ2,σ2 Σύγκριση testing probability με threshold Από την verified πληροφορία υπολογίζει τις εκτιμήτριες μ1,σ1 καθώς και τις πιθανότητες τα εξαγόμενα δεδομένα για το κάθε attribute να παίρνουν τις τιμές τους. Verified probability και υπολογισμός μ2,σ2 Άλλα γνωρίσματα : Πυκνότητα γραμμάτων, πυκνότητα ψηφίων, πυκνότητα χαρακτήρων στίξης,πλήθος tokens,μήκος tokens.

Wrapper Verification (Lerman,Minton,Knoblock) Βελτίωση RAPTURE αλγόριθμου. DATAPROG αλγόριθμος εύρεσης patterns πληροφορίας. Στατιστικός έλεγχος Pearson. Για κάθε κοινό pattern προσθέτει έναν όρο της μορφής N=#tuples training attribute, n=#tuples testing attribute, ri=#tuples που ακολουθούν το pattern pi

WRAPPER REINDUCTION (Raposo, Pan, Viña, Álvarez ) Αποθήκευση αποτελεσμάτων queries κατά τη διάρκεια της ορθής λειτουργίας του wrapper σε ΒΔ. Εξεύρεση παραδειγμάτων στις αλλαγμένες ιστοσελίδες. «Τροφοδότηση» WI συστήματος με αλλαγμένες ιστοσελίδες και παραδείγματα.

ΑΞΟΝΕΣ ΠΑΡΟΥΣΙΑΣΗΣ Τι είναι wrapper,πώς παράγεται, ορισμός wrapper maintenance προβλήματος. Σύντομη παρουσίαση ορισμένων εργασιών σε wrapper verification και σε wrapper reinduction. Παρουσίαση της εργασίας μας: Ιδέα , αποτελέσματα. Συμπεράσματα-μελλοντική εργασία.

Γιατί δόθηκε έμφαση στο wrapper verification? Ένα καλό reinduction σύστημα χωρίς ένα καλό verification σύστημα δεν αποδίδει καλά. Η ανάγκη για αυτοματοποίηση του verification μέρους είναι μεγαλύτερη από του reinduction λόγω της ύπαρξης WI systems.

ARMAGEDDON ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ VERIFICATION module Content based σύστημα. Σύνθετος αλγόριθμος:εκμεταλλεύεται όσο περισσότερο τη δομή την εξαγόμενης πληροφορίας. Εύρωστο. Πολύ καλή απόδοση στο verification task. ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ REINDUCTION module Απλή ιδέα Καλή απόδοση σε σελίδες με στατικό περιεχόμενο. Βοηθητικό εργαλείο για τον χρήστη. Να τονίσω γιατί δόθηκε ιδιαίτερη έμφαση στο verification σύστημα!

Verification System Είσοδοι: Training attribute , Testing Attribute. Άρα παρόμοια δομή και παρόμοια patterns !!!

Στάδια Verification αλγορίθμου

Κατασκευή Διανυσμάτων Μεταπληροφορίας

Παράδειγμα διανύσματος Παράδειγμα διανύσματος Είσοδος 12 Aiginitoy Street 11 Antifylou Street 42 Hrwwn Polytexneiou Street 25 Laodikeias Street 53 Papagou Avenue Διάνυσμα <address,5,1, *INTEGER* *CAPITALIZED* *CAPITALIZED*,5, 0.101, 0.111, 0.707,0,5.6875,3.2>

Μάθηση Patterns Κατασκευή ιεραρχίας token types. CS123 ALPHANUM 12 INTEGER 12.3 DECIMAL DATABASE ALLUPPERCASE course ALLLOWERCASE ! PUNCT Alice CAPITALIZED TheBook ALPHABETIC

Μάθηση Patterns Προσδιορισμός μήκους starting patterns με βάση το μέσο πλήθος λεκτικών μονάδων ανά εγγραφή. Null Hypothesis Testing. Κεντρικό οριακό θεώρημα. Ζ-test

Πώς λειτουργεί? (1) Θέση 1: Ο τύπος CAPITALIZED δεν είναι στατιστικά σημαντικός (null hypothesis). Αν απορριφθεί η μηδενική υπόθεση:

Πώς λειτουργεί? (2) Θέση 2: Ο τύπος ΑLPHANUMERIC δεν είναι στατιστικά σημαντικός μετά το τύπο CAPITALIZED(null hypothesis). Αν απορριφθεί η μηδενική υπόθεση:

Πώς λειτουργεί? (3) Παράγεται ένα PATTERN tree. βάθος=f(μέσο πλήθος tokens/εγγραφή). Διάσχιση του δένδρου δίνει τα starting patterns!

Έλεγχος Pearson (goodness of fit method) Training (ver) και testing (test) διανύσματα μεταπληροφορίας. Έλεγχος ομοιότητας διανυσμάτων. Για digDen(x1),..,averNumOfTokensPerLine(x6):

Σύστημα ποινών Αν q<Χ όπου Χ=χ^2(freedomDegrees-1,0.05) τότε το σύστημα εισέρχεται σε ένα σύστημα ποινών. ΠΟΙΝΗ γιατί q αυξάνεται χωρίς να αυξάνονται αντίστοιχα οι βαθμοί ελευθερίας. Σύνθετο σύστημα Ίδια σημασιολογία  παρόμοια patterns

Βασικές έννοιες του συστήματος ποινών (1) Ομάδες συσχετιζόμενων token types. Ομάδα1={“*”,”ALPHANUM”}, Ομάδα2={“ALPHABETIC”,”ALLUPPERCASE”,”ALLLOWERCASE”,”CAPITALIZED”,”*”} Ομάδα3={“INTEGER”,”DECIMAL”,”*”} Συσχετιζόμενα patterns. Αν υπάρχει 1-1 αντιστοιχία μεταξύ των token types σε τουλάχιστον ένα πλήθος θέσεων, το οποίο είναι συνάρτηση της πολυπλοκότητας του πλήθους tokens του μικρότερου pattern. Συσχετιζόμενα σύνολα patterns P1={p11,..,p1m},P2={p21,..,p2n}. Αν κάθε pattern p1i είναι συσχετιζόμενο με κάποιο p2j και αντιστρόφως.

Βασικές έννοιες του συστήματος ποινών (2) Πλήθος εγγραφών στο training attribute που μας επιτρέπουν να έχουμε αυξημένη πεποίθηση ότι έχουμε δει τα περισσότερα από τα patterns κατά την εκπαίδευση. Διάκριση περιπτώσεων για τη σχέση των συνόλων patterns Pver & Ptest.

Βασικές έννοιες του συστήματος ποινών (3) Άλλες παράμετροι που λαμβάνονται υπ’όψιν είναι: Πληθικότητες Pver & Ptest & Pcommon Ποσοστό εγγραφών του Ptest που καλύπτονται από τα κοινά patterns.

Reinduction System Προσαρμοσμένο στην υλοποίηση του STALKER που διαθέταμε (single και όχι multi slot extractor). Brute force αλγόριθμος αναζήτησης παραδειγμάτων ορθής πληροφορίας στις αλλαγμένες ιστοσελίδες. Έξοδος : annotation files στο format που θέλει ο STALKER.

Ενδεχόμενα λειτουργίας verification συστήματος α = Το σύστημα συμπεραίνει ότι ο wrapper λειτουργεί σωστά b = Στην πραγματικότητα ο wrapper λειτουργεί σωστά 4 ενδεχόμενα λειτουργία του συστήματος b !b α TP FP !α FN TN TP=true positive, FP=false positive, FN=false negative, TN= true negative

Μετρικές αξιολόγησης Verification συστήματος ac=accuracy=(TP+TN)/(TP+FP+FN+TN) up=unchanged precision= TP/(TP+FP) cp=changed precision= TN/(TN+FN) ur=unchanged recall= TP/(TP+FN) cr=changed recall= TN/(TN+FP) Fchanged=(2*cr*cp)/(cr+cp) Funchanged=(2*ur*up)/(ur+up)

RAPTURE DATASET 16 query-able web sites Ενδεικτικά αναφέρουμε : www.altavista.com, www.uk.lycos.de, www.thriveonline.com , www.news.com, www.usnews.com Από κάθε site κάναμε εξαγωγή πληροφορίας από 1 έως και 8 attributes.

WEB SITE επίπεδο ATTRIBUTE επίπεδο Fchanged=99.82% b !b α 21 !α 7 b !b ac=100%,up=100%, cp=100%,ur=100%, cr=100%, Fchanged=100% Funchanged=100% ATTRIBUTE επίπεδο ac=99.37%,up=100% cp=96.55%,ur=99.23%, cr=100%, Fchanged=99.82% Funchanged=99.61% b !b α 21 !α 7 b !b α 129 !α 1 28

Αξιολόγηση wrapper reinduction συστήματος Web site Attributes Πόσα βρέθηκαν σωστά Σχόλια Altavista τίτλος υπερσύνδεσμος 2/2 Ο.Κ Webcrawler % σχετικότητα με query 0/2 Τίτλοι είχαν αλλάξει,% δεν υπήρχε Cinemachine τίτλος ταινίας 1/1 Lycos 2/3 % δεν υπήρχε People yahoo Internet domain(Ι.D) Ονοματεπώνυμο 1/2 I.D δεν υπήρχε

Παρατήρηση To reinduction σύστημα μπορεί να χρησιμοποιηθεί για να διευκολύνει το χρήστη να παράγει έναν σωστό wrapper πολύ εύκολα…

ΑΞΟΝΕΣ ΠΑΡΟΥΣΙΑΣΗΣ Τι είναι wrapper,πώς παράγεται, ορισμός wrapper maintenance προβλήματος. Σύντομη παρουσίαση ορισμένων εργασιών σε wrapper verification και σε wrapper reinduction. Παρουσίαση της εργασίας μας: Ιδέα , αποτελέσματα. Συμπεράσματα-μελλοντική εργασία.

Συμπεράσματα Ανάπτυξη εύρωστου,content based συστήματος για wrapper verification. Δεν βασίζεται καθόλου σε HTML πυκνότητες όπως τα προηγούμενα… Έμφαση στη σημασιολογία. Παρατηρήθηκε ότι η ιδέα ότι τα ποσοστά των εγγραφών που ακολουθούν κάποιο κοινό pattern να είναι ίδια στο verified & στο training attribute!

Μελλοντική εργασία Εφαρμογή της μεθόδου σε άλλα προβλήματα. Εκτενή πειράματα για αξιολόγηση wrapper verification συστήματος. Ανάπτυξη συνθετότερου reinduction συστήματος.