Ανάκτηση & Εξαγωγή Πληροφορίας στο Διαδίκτυο Γιώργος Παλιούρας Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Ε.Κ.Ε.Φ.Ε.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
«Πρόγραμμα Αναμόρφωσης Προπτυχιακών Προγραμμάτων Σπουδών Γ.Π.Α.» Σεμινάριο Επιμόρφωσης Διδακτικού Προσωπικού Οι τεχνολογίες της Πληροφορικής και των Επικοινωνιών.
Advertisements

Τεχνολογίες ανάκτησης και εξαγωγής δεδομένων με γλωσσική υποστήριξη - Εφαρμογές στο e-government και e-business - Εφαρμογές στο e-government και e-business.
ΧΡΗΣΗ ΕΚΠ/ΚΟΥ ΛΟΓΙΣΜΙΚΟΥ
Ινστιτούτο Επεξεργασίας του Λόγου Βέλτιστες Πρακτικές στη Γλωσσική Τεχνολογία Βέλτιστες Πρακτικές στη Γλωσσική Τεχνολογία Εβδομάδα Επιστήμης & Τεχνολογίας.
Διακρατική συνάντηση EQUAL Σάμος, 25 – 26 Σεπτεμβρίου 2003
ΙΔΡΥΜΑ ΤΕΧΝΟΛΟΓΙΑΣ & ΕΡΕΥΝΑΣ ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΚΗΣ Παρουσίαση λογισμικών για εξ αποστάσεως εκπαίδευση και πιστοποίηση προσαρμοσμένα στις ιδιαιτερότητες.
ΔΙ.ΟΡΓΑΝΩ.ΣΗ Σύστημα ΔΙαχείρισης ΟΡΓΑΝΩσιακής ΓνώΣΗς για τις ελληνικές επιχειρήσεις. Μπίμπη Σταματία1 Σαμολαδάς Ιωάννης1 Σταμέλος Ιωάννης1 Κατσιαδάκης.
Εισαγωγή στην Τεχνολογία Επικοινωνιών
ΕΝΟΤΗΤΑ 4 – Κεφάλαιο 12: Ο Παγκόσμιος Ιστός – Εισαγωγή στην έννοια του Υπερκειμένου Λέξεις Κλειδιά: Διαδίκτυο, Παγκόσμιος Ιστός (World Wide Web), ιστοσελίδα.
Δημιουργία ιστοσελίδων στο διαδίκτυο με Dreamweaver, PHP, MySQL και Apache ΠΛΗΡΟΦΟΡΙΚΗ Ι (Β ή Γ Λυκείου) ΜΑΘΗΜΑ ΕΝΔΙΑΦΕΡΟΝΤΟΣ(2ωρο) [Στην περίπτωση που.
Ιδέες Συνεργασιών Η παρουσίαση αυτή απευθύνεται κυρίως στους χρήστες που έχουν εγγραφεί στην πλατφόρμα eTwinning αλλά δεν έχουν συνάψει ακόμα συνεργασία.
Γιάννα Αντωνίου Δρ Γλωσσολόγος - Ερευνήτρια ΙΕΛ Τεχνολογίες λογισμικών πολυμέσων για εκπαίδευση και πολιτισμό Δράσεις και Προοπτικές ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ.
ο Σύστημα Ψηφιακής Διαδραστικής Ξενάγησης σε ανοικτούς χώρους Το Xenagos city είναι ένα ισχυρό εργαλείο που αναβαθμίζει την αξία του Ασύρματου δικτύου.
Διαχείριση πληροφοριών και επικοινωνίες Ονομ/νυμο Επιμορφωτή Επιμορφωτής: Ονομ/νυμο Επιμορφωτή ΥΠΕΠΘ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΠΡΟΓΡΑΜΜΑ «ΚΟΙΝΩΝΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ»
Στόχοι, μεθοδολογία, διαδικασίες Μιχάλης Μεταξάς Innovatia ΕΠΕ, Σύμβουλος Διαχείρισης Έργου.
Τμήμα Εκπαιδευτικής Τεχνολογίας (ΤΕΤ) Ινστιτούτο Επεξεργασίας του Λόγου Φιλογλωσσία Διδασκαλία της Ελληνικής ως ξένης γλώσσας (2η Δράση του ΙΕΛ στην Γλωσσική.
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
Δευτέρα 25/9/2006 ΤΕΙ Λάρισας Παρουσίαση Web-site – Θεματικής Πύλης (Elektra.teilar.gr) και Λογισμικού Ασύγχρονης και Σύγχρονης Τηλε-εκπαίδευσης (E-Presence.
Η διδασκαλία ως διαδικασία διαμόρφωσης εγγράμματων ταυτοτήτων
Πρόγραμμα Επιμόρφωσης Β΄ Επιπέδου Ειδικό Μέρος Πρωτοβάθμιας Εκπαίδευσης (κλάδοι ΠΕ60-70) ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΣΤΗ ΧΡΗΣΗ ΚΑΙ ΑΞΙΟΠΟΙΗΣΗ ΤΩΝ ΤΠΕ ΣΤΗΝ.
ΗΥ-566 Διαχείρηση Γνώσης στο Διαδίκτυο1 SWRC Ontology Κτιστάκης Γιώργος Μπούτσικα Κατερίνα Παπαδάκης Μύρων.
Μηχανική Μάθηση και Εξόρυξη Γνώσης
Η μηχανική μάθηση στην αντιμετώπιση της Υπερπληροφόρησης
Xαρτογράφηση Εννοιών Εννοιολογικοί Χάρτες και οι εφαρμογές τους στη διδασκαλία των Φυσικών Επιστημών.
Πρακτική Εκπαίδευση Εκπαιδευτικών Πληροφορικής Υπηρεσία Συζητήσεων (Forums) Διαχειριστής EAITY Στόχος της υπηρεσίας είναι η δημιουργία.
Η ποιότητα της πληροφορίας στο εκπαιδευτικό υλικό που χρησιμοποιείται ή διανέμεται μέσω του Internet Χρήστος Σαβρανίδης Πανεπιστήμιο Ιωαννίνων Τμήμα ΦΠΨ.
1 ΠΛΗΡΟΦΟΡΙΑΚΑ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Γιώργος Γιαγλής Οικονομικό Πανεπιστήμιο Αθηνών Τμήμα Διοικητικής Επιστήμης & Τεχνολογίας.
. Εννοιολογικοί χάρτες.
ΗΜΕΡΙΔΑ Η Ηλεκτρονική Μάθηση στην Εκπαίδευση και Δια Βίου Κατάρτιση των Α.Μ.Ε.Α. Τρίτη 2 Νοεμβρίου 2010, Συνεδριακό Κέντρο Ε.Κ.Ε.Φ.Ε. «Δημόκριτος» Τίτλος.
ΚΕΝΤΡΟ ΠΟΛΙΤΙΣΜΙΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ I ΔΡΥΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΡΕΥΝΑΣ IΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΚΗΣ Σύστημα Τεκμηρίωσης, Διαχείρισης και.
ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΓΙΑ ΤΗΝ ΑΞΙΟΠΟΙΗΣΗ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΩΝ ΤΠΕ ΣΤΗ ΔΙΔΑΚΤΙΚΗ ΠΡΑΞΗ ΤΜΗΜΑ Π 2 ΓΟΓΟΥΛΟΥ ΑΓΟΡΙΤΣΑ ΓΕΝΙΚΟ ΜΕΡΟΣ ΕΝΟΤΗΤΑ 5.4 ΠΑΡΟΥΣΙΑΣΗ, ΕΞΕΡΕΥΝΗΣΗ.
Παρουσίαση Protégé-2000 Αλέξανδρος Βαλαράκος Αλέξανδρος Βαλαράκος, Γεώργιος Παλιούρας NCSR “Demokritos”, Inst. of Informatics & Telecommunications, SKEL.
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ Θέμα: Διοίκηση ανάπτυξης μη-κερδοσκοπικού ιστόπεδου (ιστόπεδου Δήμου Αγ.Παρασκευής)
ΕΝΟΤΗΤΑ 4 – Κεφάλαιο 12: Ο Παγκόσμιος Ιστός – Εισαγωγή στην έννοια του Υπερκειμένου Το 1989 ο Τιμ Μπέρνερς μέλος του κέντρου cern επινόησε τον παγκόσμιο.
Διαδικτυακή εφαρμογή ανάλυσης και επεξεργασίας δεδομένων κυβερνητικών διαβουλεύσεωνgov.insight Η. Ζαβιτσάνος, Γ. Γιαννακόπουλος, Γ. Παλιούρας Ινστιτούτο.
ΕΚΕΦΕ «Δημόκριτος» Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Κοινωνία της Πληροφορίας & Τεχνητή Νοημοσύνη Δρ. Κωνσταντίνος Δ. Σπυρόπουλος Δντής Έρευνας.
Μεταφορά ενός Ερευνητικού Εργαστηρίου στη Σχολική Αίθουσα για τη Διδασκαλία των Φ.Ε. Η περίπτωση του Εκπαιδευτικού Αστρονομικού Εργαστηρίου ΕΥΔΟΞΟΣ Ανδρικόπουλος.
ΠΟΛΥΜΝΙΑ - Ολοκληρωμένο Σύστημα Εργαλείων Μουσικής και Μουσική Πύλη
ΑΝΑΠΤΥΞΗ ΤΑΞΙΝΟΜΗΤΗ ΗΛΕΚΤΡΟΝΙΚΗΣ ΑΛΛΗΛΟΓΡΑΦΙΑΣ ΜΑΛΕΖΑ ΣΟΦΙΑ ΑΕΜ:765.
E X a M p L e Αξιοποιώντας την τεχνολογία XML στη διαχείριση της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών.
Η διδασκαλία ως διαδικασία διαμόρφωσης εγγράμματων ταυτοτήτων Ειδικό Μέρος Ενότητα Ι, 2.4.
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Information Extraction.
Η επιστήμη του Web.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
Μετατροπή Μουσικών Συλλογών σε Ψηφιακές Βιβλιοθήκες Το Πρόγραμμα MUSESCAPE Ιόνιο Πανεπιστήμιο Ιανουάριος 2005 Χριστιανούδης Ιωάννης.
EContent Στέλιος Πιπερίδης Εθνικός Εκπρόσωπος eContent
Ειδική Ημερίδα για Ανάκτηση και Εξαγωγή Πληροφορίας Ειδική Ημερίδα για Ανάκτηση και Εξαγωγή Πληροφορίας Συζήτηση στρογγυλής τραπέζης.
1 ΠΛΗΡΟΦΟΡΙΑΚΑ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Γιώργος Γιαγλής Οικονομικό Πανεπιστήμιο Τμήμα Διοικητικής Επιστήμης & Τεχνολογίας.
Πρόγραμμα Σπουδών ΤΠΕ-Τεχνολογίες Πληροφορίας Επικοινωνίας Δ’ τάξης.
Καλέμας Απόστολος, ΚΣΕ ΔΗΜΗΤΡΑ, Λάρισα Μάιος 2008 Επιμόρφωση εκπαιδευτικών στη χρήση και αξιοποίηση των ΤΠΕ στην εκπαιδευτική διδακτική διαδικασία Αναλυτικό.
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Λογισμικό Λειτουργικό σύστημα Λογισμικό συστήματος
Διδακτική προσέγγιση βασισμένη σε δραστηριότητες αξιοποιώντας το διαδίκτυο.
ΠΑΡΟΥΣΙΑΣΗ ΤΟΥ COLLATE PROJECT COLLATE:Collaboratory for Annotaton,Indexing and Retrieval of Digitized Historical Archive Material(συνεργασία για σχολιασμό,
Template-Independent News Extraction Based on Visual Consistency  Shuyi Zheng  Ruihua Song  Ji-Rong Wen Παπαντωνίου.
Ηλεκτρονική Δημοσίευση The Goddard Library Web Capture Project Χριστιανούδης Ιωάννης Π.Μ.Σ. Κέρκυρας Μάιος 2005.
Λογισμικό Εκπαίδευσης M- Pedia Ελευθέριος Μιχαηλίδης Διευθύνων Σύμβουλος, M-Data
Τεχνολογία ΛογισμικούSlide 1 Τεχνολογία Απαιτήσεων u Καθορίζει τι θέλει ο πελάτης από ένα σύστημα λογισμικού.
Ο Μαθητικός Υπολογιστής των 100$
ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΣΩΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ.
Πληροφορική 2 Τεχνητή νοημοσύνη 1. Τι είναι τεχνητή νοημοσύνη;  Τεχνητή νοημοσύνη (AI=Artificial Intelligence) είναι η μελέτη προγραμματισμένων συστημάτων.
Διαδικασία Μάθησης Γνωστικές Δεξιότητες
Βάσεις Δεδομένων & Έμπειρα Συστήματα
Παραγωγή Ηλεκτρονικού Προϊόντος – ψηφιακός πίνακας ανακοινώσεων
ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ
Web, Web 2.0, Web 3.0 και Web X.0 ΚΕΦΑΛΑΙΟ 9.
ΣΧΕΔΙΑΣΗ ΕΚΠΑΙΔΕΥΤΙΚΟΥ ΛΟΓΙΣΜΙΚΟΥ
Πληροφοριακό σύστημα Πληροφοριακό Σύστημα μιας επιχείρησης/οργανισμού είναι ένα σύστημα που αποτελείται από ανθρώπους, διαδικασίες και εξοπλισμό (Υλικό,
ΕΝΟΤΗΤΑ 4 – Κεφάλαιο 12: Ο Παγκόσμιος Ιστός – Εισαγωγή στην έννοια του Υπερκειμένου Λέξεις Κλειδιά: Διαδίκτυο, Παγκόσμιος Ιστός (World Wide Web), ιστοσελίδα.
Εννοιολογική Χαρτογράφηση
Διαχείριση πληροφοριών και επικοινωνίες
Μεταγράφημα παρουσίασης:

Ανάκτηση & Εξαγωγή Πληροφορίας στο Διαδίκτυο Γιώργος Παλιούρας Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Ε.Κ.Ε.Φ.Ε. «Δημόκριτος»

Περιεχόμενα Γιατί χρειάζεται η ανάκτηση και εξαγωγή πληροφορίας στο Διαδίκτυο. Το σύστημα CROSSMARC. Ενδιαφέροντα θέματα.

Περιεχόμενα Γιατί χρειάζεται η ανάκτηση και εξαγωγή πληροφορίας στο Διαδίκτυο. Το σύστημα CROSSMARC. Ενδιαφέροντα θέματα.

Διαδίκτυο: Το πολύτιμο χάος Παράδοση Ευκολία! Επιλογές!; Χάος; Διαδίκτυο

Νέα προβλήματα – Νέες λύσεις Παρατήρηση: Η επικοινωνία στο Διαδίκτυο γίνεται μέσω προγραμμάτων. Απαίτηση: Τα προγράμματα να γίνουν πιο έξυπνα και φιλικά προς τον χρήστη. Παρατήρηση: Μεγάλο μέρος των δεδομένων που μεταφέρονται είναι κείμενα. Απαίτηση: Έξυπνα προγράμματα επεξεργασίας φυσικής γλώσσας.

Προσεγγίζοντας τη λύση Ανάκτηση ενδιαφερόντων ιστιακών τόπων. (focused crawling) Ανάκτηση ενδιαφερουσών ιστοσελίδων. (intelligent spidering) Εξαγωγή ενδιαφέρουσας πληροφορίας από ιστοσελίδες σε διάφορες γλώσσες. (cross- lingual information extraction) Εξατομικευμένη παρουσίαση αποτελεσμάτων. (personalization)

Εξαγωγή Πληροφορίας ΑγοραστήςΑγοραζόμενοςΠοσοστόΈκδοση Albio ΒιοκαρπέτΠέρσικα ΑΕ100%04/10/01 Groupe DanoneStonyField Farm40%04/10/01 … Γεγονός: Εξαγορές Επιχειρήσεων...

Περιεχόμενα Γιατί χρειάζεται η ανάκτηση και εξαγωγή πληροφορίας στο Διαδίκτυο. Το σύστημα CROSSMARC. Ενδιαφέροντα θέματα.

Στοιχεία για το έργο Έργο IST (3/2001 – 9/2003) CROSSMARC: CROSS-lingual Multi- Agent Retail Comparison Αντικείμενο: Πρωτότυπο σύστημα ανάκτησης και εξαγωγής πληροφορίας από ιστοσελίδες που περιγράφουν προϊόντα σε διάφορες γλώσσες.

Η κοινοπραξία ΦορέαςΤύποςΧώρα Ε.Κ.Ε.Φ.Ε. «Δημόκριτος» CEL VeltiNet A.E. PEL University of Edinburgh PUK Universita di Roma Tor Vergata PI Lingway PF

CROSSMARC: Χαρακτηριστικά Έμφαση σε: Καινοτόμες τεχνολογίες ανάκτησης και εξαγωγής πληροφορίας. Διαγλωσσική επεκτάσιμη αρχιτεκτονική. Ταχεία προσαρμογή σε νέες θεματικές περιοχές. Εξατομικευμένη διεπαφή.

CROSSMARC: Εποπτεία domain ontology named-entity recognition and matching fact extraction annotated pages Extraction interesting pages database XML records domain- specific spidering focused crawling Retrieval interesting Web sites Personalized interface user profiles

Focused crawling Εκκίνηση από γνωστούς καταλόγους. Αναγνώριση γλώσσας κειμένου. Κατασκευή ταξινομητών ιστοσελίδων με χρήση μηχανικής μάθησης.

Domain-specific spidering Εξαγωγή υπερσυνδέσμων από τις ιστοσελίδες. Πλοήγηση με βάση την αξία των συνδέσμων. Κατασκευή εκτιμητή αξίας συνδέσμων με χρήση μηχανικής μάθησης. Κατασκευή ταξινομητή ιστοσελίδων με χρήση μηχανικής μάθησης. Χρήση της οντολογίας και των λεξικών για κάθε γλώσσα.

Domain-specific ontology Τρία επίπεδα εξειδίκευσης: Product -> Features Feature -> Attributes Attribute -> Values Τρία επίπεδα εξειδίκευσης: Product -> Features Feature -> Attributes Attribute -> Values

Language-specific lexicons Ένα λεξικό για κάθε γλώσσα. Αναφέρεται σε έννοιες της οντολογίας. Περιέχει συνώνυμα και κανονικές εκφράσεις.  Ontology concept reference Intel Pentium III Pentium III P3 PIII (Intel|INTEL)?(S)?(Pentium|PENTIUM|P|Pent|PENT)(S)?[\.]?[\-]?(S)?(3|III)  Ontology concept reference Intel Pentium III Pentium III P3 PIII (Intel|INTEL)?(S)?(Pentium|PENTIUM|P|Pent|PENT)(S)?[\.]?[\-]?(S)?(3|III)

Named-entity recognition Χρήση της οντολογίας και των λεξικών. Δυνατότητα ενσωμάτωσης διαφορετικών συστημάτων για κάθε γλώσσα (προκαθορισμένη είσοδος και έξοδος). Δύο εκδόσεις του Ελληνικού συστήματος αναγνώρισης ονομάτων (χειρονακτικά και με μηχανική μάθηση)

Fact extraction Συνδυασμός τεχνικών wrapper induction με παραδοσιακά συστήματα εξαγωγής πληροφορίας. Δυνατότητα ενσωμάτωσης διαφορετικών συστημάτων για κάθε γλώσσα. Αξιολόγηση διαφόρων τεχνικών wrapper induction.

Περιεχόμενα Γιατί χρειάζεται η ανάκτηση και εξαγωγή πληροφορίας στο Διαδίκτυο. Το σύστημα CROSSMARC. Ενδιαφέροντα θέματα.

Ενδιαφέροντα θέματα Πιο αποτελεσματικά συστήματα ανάκτησης χρήσιμης πληροφορίας (crawling και spidering). Ανοιχτά συστήματα εξαγωγής πληροφορίας για διαγλωσσικές εφαρμογές. Ταχεία (ημι-αυτόματη) προσαρμογή σε νέες θεματικές περιοχές. Πιο ευέλικτες μέθοδοι wrapper induction.

Ανάκτηση & Εξαγωγή Πληροφορίας στο Διαδίκτυο Γιώργος Παλιούρας Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών Ε.Κ.Ε.Φ.Ε. «Δημόκριτος»