Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr"— Μεταγράφημα παρουσίασης:

1 Αυτόματο Σύστημα Εύρεσης και Κατηγοριοποίησης Ευκαιριών Εργασίας Μηχανικών (ΕΥΡΗΚΑ)
Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr Βασίλης Κατσάρης, telia.co.gr

2 Σύνοψη Το σύστημα ΕΥΡΗΚΑ σαν κομμάτι του ΔΑΣΤΑ Αρχιτεκτονική
Σύστημα Αλγόριθμος Εμφάνιση στο ΔΑΣΤΑ RSS FEED Ερωτήσεις στην Βάση Διαχείριση Συστήματος Αναφορές

3 Το ΕΥΡΗΚΑ Δεν Είναι Google
Ρομπότ στοχευμένης αναζήτησης Συνεχή παρακολούθηση νέας πληροφορίας αυτό-στιγμή (λαμβάνεται υπόψη η χρονολογική παλαιότητα) Γλωσσική ανάλυση & Φιλτράρισμα της πληροφορίας με βάση εξειδικευμένα κριτήρια για τις αγγελίες εργασίας Παραμετροποιημένη Ομαδοποίηση της πληροφορίας Δυνατότητα λειτουργίας σε πολλαπλές γλώσσες

4 Αρχιτεκτονική

5 Αλγόριθμος - Χαρακτηριστικά
Επισκέπτεται συνεχώς δικτυακούς τόπους που του έχουμε ορίσει. Μπορεί να διακρίνει σε κάθε δικτυακό τόπο, ποια σελίδα αφορά περιεχόμενο, ή γενικές πληροφορίες κλπ. Αναλύει το σχετικό περιεχόμενο γλωσσικά και δημιουργεί αντιστοιχεί λέξεις ή φράσεις σε XML tags. Κατηγοριοποιεί το περιεχόμενο σε δυναμικά οριζόμενες κατηγορίες και με βάση τα XML tags. Η κατηγοριοποίηση αφορά κατηγορίες που είτε είναι ορισμένες από τους δικτυακούς τόπους (πχ αγγελίες μηχανικών) είτε τις ορίζει μόνος του ο χρήστης. Τοποθετεί όλο το περιεχόμενο από όλους τους δικτυακούς τόπους σε κατάλληλα διαμορφωμένη βάση δεδομένων Ομαδοποιεί αυτόματα το περιεχόμενο των καταχωρήσεων με βάση την σχετικότητά τους. Ελέγχει την μοναδικότητα της πληροφορίας.

6 Εξειδικευμένα Χαρακτηριστικά
Τίτλος Αλγορίθμου Λειτουργία Αλγορίθμου Γλώσσα Αλγόριθμος συλλογής και επεξεργασίας περιεχομένου Αλγόριθμος συλλογής περιεχομένου από κάθε συγκεκριμένη πηγή. Συλλέγει όλο το πρωτογενές περιεχόμενο PHP Αλγόριθμος συλλογής περιεχομένου από html πηγές Αλγόριθμος συλλογής περιεχομένου από html πηγές. Μπορεί να διακρίνει την μορφή του περιεχομένου το οποίο μπορεί να προέρχεται από διαφορετικό κάθε φορά τύπο πηγής Αλγόριθμος επεξεργασίας περιεχομένου από html πηγές Αλγόριθμος επεξεργασίας περιεχομένου: ορισμός ημερομηνίας καταχώρησης, ορισμός τίτλου καταχώρησης κλπ. Αλγόριθμος διαχείρισης εργασιών ρομπότ Αλγόριθμος διαχείρισης όλων των επιμέρους αλγορίθμων: δημιουργία σειράς λειτουργιών, if and then σεναρίων κλπ. Αλγόριθμος ορισμού γλώσσας περιεχομένου και κωδικοποίησης κειμένου Αλγόριθμος έξυπνου ορισμού γλώσσας περιεχομένου. Ο αλγόριθμος μπορεί να διακρίνει και να ομαδοποιεί το περιεχόμενο όχι μόνο βάση της γλώσσας που έχει γραφεί αυτό αλλά και της κωδικοποίησης κειμένου που έχει χρησιμοποιηθεί. Αλγόριθμος δημιουργίας κατηγοριών για το περιεχόμενο Αλγόριθμος δημιουργίας κατηγοριών για το περιεχόμενο με βάση λέξεις κλειδιά. Κατηγορίες μπορούν να οριστούν ακόμη και αν δεν έχει μεριμνήσει για τούτο ο δικτυακός τόπος πηγή. Αλγόριθμος ελέγχου και διορθώσεως κατηγοριών περιεχομένου Αλγόριθμος ελέγχου και διορθώσεων κατηγοριών περιεχομένου Αλγόριθμος αναγνώρισης όμοιου περιεχομένου Αλγόριθμος αναγνώρισης ομοίου περιεχομένου. Μπορεί να διακρίνει όμοιο περιεχόμενο με φίλτρα ομοιότητας που δεν αφορούν μόνο τον τίτλο του περιεχομένου αλλά το περιεχόμενο καθεαυτό χρησιμοποιώντας για τον σκοπό αυτό εργαλεία αποκοπής καταλήξεων

7 Εμφάνιση στην Ιστοσελίδα ΔΑΣΤΑ
RSS FEED των πιο πρόσφατων ανακοινώσεων

8 Αναζήτηση στην Εργασίας
Χαρακτηριστικά Αναζήτησης Free form text στο Επάγγελμα Μπορεί φυσικά μονολεκτικά Περιλαμβάνει τις κατηγορίες Μηχανικών όπως τις ορίζει το ΤΕΕ

9 Αποτελέσματα Αναζήτησης

10 Σύνθετη Αναζήτηση

11 Διαχείριση Συστήματος

12 Διαχείριση: Εισαγωγή / Αλλαγή Πηγών

13 Λειτουργία στο γραφείο ΔΑΣΤΑ του ΕΜΠ 20-6-2012

14 Αναπτύσσονται… Σύνθετη Αναζήτηση Αναφορές Χρήσης Στατιστικών
Ανά Κατηγορία Ανά Έτος

15 Ευχαριστούμε το ΕΜΠ για την συνεργασία
ΕρωΤΗΣειΣ


Κατέβασμα ppt "Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google