Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Τεχνολογίες ανάκτησης και εξαγωγής δεδομένων με γλωσσική υποστήριξη - Εφαρμογές στο e-government και e-business - Εφαρμογές στο e-government και e-business.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Τεχνολογίες ανάκτησης και εξαγωγής δεδομένων με γλωσσική υποστήριξη - Εφαρμογές στο e-government και e-business - Εφαρμογές στο e-government και e-business."— Μεταγράφημα παρουσίασης:

1 Τεχνολογίες ανάκτησης και εξαγωγής δεδομένων με γλωσσική υποστήριξη - Εφαρμογές στο e-government και e-business - Εφαρμογές στο e-government και e-business Στέλιος Πιπερίδης Ινστιτούτο Επεξεργασίας Λόγου spip@ilsp.gr

2 Ιεραρχία Πληροφορίας... Γνώση πληροφορία που έχουμε αντιληφθεί (ανάγνωση[κείμενο] / ακοή[φωνή] / όραση[εικόνα, κίνηση]) και κατανοήσει Πληροφορία δεδομένα οργανωμένα και παρουσιασμένα με συγκεκριμένο τρόπο Δεδομένα ανεπεξέργαστο υλικό

3 Διαχείριση Περιεχομένου   Γιατί χρησιμοποιείται κυρίως η γλώσσα επειδή η γλώσσα είναι ένα λειτουργικό σύστημα που βασίζεται σε αυτο-ρυθμιζόμενες μονάδες, δηλ. έκτυπα που χωρίζονται μεταξύ τους από κενά   Τεχνικές διαχείρισης περιεχομένου μετατροπή όλων των μέσων περιεχομένου σε κείμενο

4 Διαχείριση Περιεχομένου   Διαχείριση περιεχομένου μέσω κειμένου διαχείριση σε επίπεδο εγγράφου έγγραφα και μονάδες τους, π.χ. παράγραφοι ανάκτηση πληροφορίας διαχείριση σε επίπεδο περιεχομένου προτάσεις και σχέσεις τους μέσα στα έγγραφα εξαγωγή πληροφορίας

5 Ανάκτηση και Εξαγωγή Πληροφορίας Ανάκτηση Πληροφορίας (Information Retrieval) ΕΡΩΤΗΣΗΑνάκτηση ΕΓΓΡΑΦΩΝ Εξαγωγή Πληροφορίας (Information Extraction) Προκαθορισμένο ΠΛΑΙΣΙΟΕξαγωγή ΠΛΗΡΟΦΟΡΙΑΣ από ΕΓΓΡΑΦΑ

6 Παράδειγμα Ανάκτησης Πληροφορίας Ανάκτηση Πληροφορίας ΕΡΩΤΗΣΗ : ενίσχυση επιχειρηματικότητας ΑΝΑΚΤΗΣΗ : έγγραφα t001.txt…\…\δράσεις ενίσχυσης επιχειρηματικότητας t002.txt…\…\ επιχειρηματικότητα νέων t003.txt…\επιχειρηματικότητα γυναικών...... \…\… Βασικά προβλήματα : σιωπήκαι θόρυβος

7 Κανονικοποίηση μορφής  η πλούσια κλίση και παραγωγή της Ελληνικής γλώσσας απαιτεί ενισχυμένη υποδομή με ειδικά λεξικά θεμάτων και καταλήξεων των λέξεων  τρεις διαφορετικές τεχνικές λύσεις  λημματοποίηση (lemmatisation)  αποκοπή καταλήξεων (stemming)  συγχώνευση όρων (term conflation)  έτσι, μπορούμε να ‘ταυτίσουμε’ τις λέξεις πληροφορία, πληροφοριών, πληροφοριακό κλπ

8 Ευρετηρίαση κειμένων (με γλωσσική τεχνολογία)  ευρετηρίαση λέξεων-κλειδιών εξαγωγή όρων από ή όρων (term indexing)κείμενα π.χ. νέα οικονομία, παραγωγικές τάξεις, κοινωνία της πληροφορίας  ευρετηρίαση με θησαυρούςκατασκευή θησαυρών (thesaurus indexing)από κείμενα π.χ. πληροφορική>τεχνολογία των πληροφοριών>διαδίκτυο> κοινωνία της πληροφορίας

9 Ευρετηρίαση κειμένων (με γλωσσική τεχνολογία)  ευρετηρίαση ονομάτων αναγνώριση και (name indexing)κατηγοριοποίηση ονοματικών οντοτήτων π.χ. Υπουργείο Δικαιοσύνης (:-οργανισμός), Βόρειος Ελλάδα(:-τόπος), Τζορτζ Μπους(:-πρόσωπο) Πλανητάρχης(  Τζορτζ Μπους:-πρόσωπο)

10 Ευρετηρίαση και Ανάλυση Περιεχομένου ευρετ/αση όρων ευρετ/αση ονομάτων ευρετ/αση με θησαυρό ευφυής ευρετηρίαση η ευφυής ευρετηρίαση εξασφαλίζει υψηλά ποσοστά ανάκλησης : ελάχιστη σιωπή ακρίβειας : χαμηλός θόρυβος Εφαρμογές σε όλο το φάσμα της Δημόσιας Διοίκησης

11 Ευρετηρίαση κειμένων (με γλωσσική τεχνολογία)  κατηγοριοποίηση απόδοση θεματικής και δρομολόγηση κειμένων κατηγορίας,(κλειστή ή (text classification)ανοιχτή λίστα)  κατασκευή περίληψηςεξαγωγή σημαντικών (text summarisation)προτάσεων από κείμενα Εφαρμογές -αυτόματη υπηρεσιακή διανομή σύμφωνα με το προφίλ του χρήστη -περίληψη αλληλογραφίας (σημαντικές προτάσεις) σύμφωνα με τις ανάγκες του χρήστη

12 Παράδειγμα Εξαγωγής Πληροφορίας Εξαγωγή Πληροφορίας ΠΡΟΚΑΘΟΡΙΣΜΕΝΟ ΠΛΑΙΣΙΟ ΓΕΓΟΝΟΤΩΝ : <οργανισμός,πρόγραμμα,δικαιούχοι, ηλικία δικαιούχων, ποσοστό χρηματοδότησης, όριο χρηματοδότησης,…> ΠΛΗΡΟΦΟΡΙΑ ΑΠΟ ΕΓΓΡΑΦΑ := οργανισμός :- ‘Υπουργείο Ανάπτυξης’ πρόγραμμα :- ‘ΕΠΑΝ’ δικαιούχοι :- ‘νέες γυναίκες’ ηλικία δικαιούχων:- ‘μέχρι 35 ετών’ ποσοστό χρηματοδότησης :- ‘50%’ όριο χρηματοδότησης: ‘100εκ. Ευρώ’...

13 Σήμανση ονομάτων σε οικονομικό ρεπορτάζ

14 Ανάκτηση και Εξαγωγή πληροφορίας ΔΙΑΔΙΚΤΥΟ Σύστημα ΕΠ 1 ΒΔ 1 Σύστημα ΕΠ 2 ΒΔ 2 Σύστημα ΕΠ 3 ΒΔ N Ταξινόμηση και δρομολόγηση πληροφορίας

15 Προϋποθέσεις Η τεχνολογία των πληροφοριών και η υλοποίηση της Κοινωνίας της Πληροφορίας δημιουργούν ευκαιρίες και ανοίγουν νέες προοπτικές για την ελληνική κοινωνία, τους πολίτες, τη διοίκηση και τους λειτουργούς της. Βασική προϋπόθεση για την επιτυχία του εγχειρήματος είναι η υλοποίηση Τεχνολογίας φιλικής προς τον χρήστη Η φιλικότητα εξασφαλίζεται από την υιοθέτηση από μεριάς τεχνολογίας του τρόπου με τον οποίο ήδη επικοινωνούμε και ανταλλάσσουμε πληροφορίες, δηλ. τον λόγο Βασική προϋπόθεση για την φιλικότητα πρόσβασης στην ‘ηλεκτρονική’ Πληροφορία, είναι η προετοιμασία του πληροφοριακού (ενημερωτικού, εκπαιδευτικού, πολιτισμικού, κλπ) υλικού με ελληνικό και ευρωπαϊκό ενδιαφέρον σε κατάλληλη ψηφιακή μορφή

16 Εφαρμογές Αναγνώριση όρων, λέξεων-κλειδιών και ονοματικών οντοτήτων με σκοπό την έξυπνη ευρετηρίαση και την ακριβέστερη ανάκτησή τους π.χ σε κείμενα ειδήσεων σύνδεση ονομάτων και ιδιοτήτων τους με σκοπό την αύξηση της ανακτησιμότητας Αυτόματη ταξινόμηση και δρομολόγηση εγγράφων π.χ. στην εισερχόμενη ηλεκτρονική αλληλογραφία, απόφαση για το ποια αφορούν την διεύθυνση Α, ποιά την διεύθυνση Β, κλπ. Εξαγωγή σημαντικότερων προτάσεων - περίληψης από κείμενα π.χ. παρουσίαση δημοσίου περιεχομένου σε περιβάλλον κινητής τηλεφωνίας

17 Εφαρμογές Εξαγωγή πληροφορίας από κείμενα συγκεκριμένου θεματικού περιεχομένου με σκοπό την συμπλήρωση ενός προκαθορισμένου πλαισίου π.χ. σε εφαρμογές e-commerce αναγνώριση προϊόντων και ιδιοτήτων τους, σε οικονομικά κείμενα αποδελτίωση συγκεκριμένων οικονομικών οντοτήτων και στοιχείων και σχέσεων μεταξύ τους Ανάκτηση κειμένων σε πολυγλωσσικό περιβάλλον με σκοπό την πληρέστερη πολυγλωσσική ενημέρωση π.χ. αναζήτηση δυνατοτήτων «ενίσχυσης επιχειρηματικότητας» σε ελληνικές και αγγλικές ιστοσελίδες και δυνατότητα (ημι-)αυτόματης μετάφρασης τους


Κατέβασμα ppt "Τεχνολογίες ανάκτησης και εξαγωγής δεδομένων με γλωσσική υποστήριξη - Εφαρμογές στο e-government και e-business - Εφαρμογές στο e-government και e-business."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google