Περίληψη Κειμένου με Διεύρυνση Κειμένου (Single Document Summarization with Document Expansion) Xiaojun Wan and Jianwu Yang Institute of Computer Science.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Παράδειγμα 2: Φοίτηση στο πανεπιστήμιο Εκφώνηση: Ζητάμε το έτος κάθε φοιτητή κάποιου τμήματος κάποιας σχολής που έχει διαφορετικό αριθμό φοιτητών ανά έτος,
Advertisements

Διδασκαλία της Ευθύγραμμης Ομαλής Κίνησης
 Παρουσιάζοντας πολιτισμικό υλικό στα σχολεία
Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
Εφαρμογές της Θεωρίας της Πληροφορίας σε διαδικασίες ανάκτησης εικόνας Μακεδόνας Ανδρέας Μεταδιδακτορικός Ερευνητής Τμ. Φυσικής, Εργαστήριο Ηλεκτρονικής.
Επιμέλεια Π. Τσάκωνας. 1. Ποια από τα ακόλουθα αποσπάσματα αλγόριθμων πραγματοποιούν σωστά την ταξινόμηση του πίνακα Α; ΓΙΑ i ΑΠΟ 2 ΜΕΧΡΙ Ν ΓΙΑ j ΑΠΟ.
Robustness in Geometric Computations Christoph M. Hoffmann.
Γενική Διεύθυνση Απασχόλησης, Κοινωνικών Υποθέσεων και Ίσων Ευκαιριών
Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας.
Ανάκτηση Πληροφορίας Το Boolean μοντέλο.
Ανάκτηση 3Δ Μοντέλων βάσει Περιεχομένου: Μια Υβριδική Προσέγγιση Παπαδάκης Παναγιώτης.
Συγγραφή Ερευνητικής Εργασίας Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης.
Παραγωγή τυχαίων γεωμετρικών δομών Παναγιώτης Τίγκας Ενδιάμεση εξέταση πτυχιακής εργασίας.
Αναγνώριση Προτύπων.
Στάδια της έρευνας 1. Τίτλος της έρευνας 2
Henric Johnson1 Κεφάλαιο 3 Κρυπτογραφία δημόσιου κλειδιού και πιστοποίηση αυθεντικότητας μηνυμάτων Henric Johnson Blekinge Institute of Technology, Sweden.
Ενότητα 6 Γράφω το δικό μου άρθρο Δασκάλα: Ευρυδίκη Παπαγεωργίου.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΠΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ: ΥΠΗΡΕΣΙΕΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΕ ΨΗΦΙΑΚΟ ΠΕΡΙΒΑΛΛΟΝ» Εργασία για το μάθημα:
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
Αποσαφήνιση Λέξεων με Βάση τα Google 5-grams Πολυξένη Π. Κατσιούλη ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ.
ΠΙΝΑΚΑΣ ΕΝΤΟΛΩΝ ΨΕΥΔΟΚΩΔΙΚΑ
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
ΕΚΔΟΣΗ ΣΧΟΛΙΚΗΣ ΕΦΗΜΕΡΙΔΑΣ ΠΡΟΓΡΑΜΜΑ ΔΡΑΣΗΣ «ΔΗΜΙΟΥΡΓΙΚΟΤΗΤΑ ΚΑΙ ΚΑΙΝΟΤΟΜΙΑ ΕΝΑΝΤΙΑ ΣΤΙΣ ΔΙΑΚΡΙΣΕΙΣ»
Σχεδίαση Αλγορίθμων - Τμήμα Πληροφορικής ΑΠΘ - Εξάμηνο 4ο1 Ωμή Βία Είναι μία άμεση προσέγγιση που βασίζεται στην εκφώνηση του προβλήματος και τους ορισμούς.
CALIS (China Academic Library and Information System) Κοινοπραξία ακαδημαϊκών βιβλιοθηκών της Κίνας Σύστημα παροχής πληροφοριών 1998.
Generating Chinese Classical Poems with Statistical Machine Translation Models Jing He, Ming Zhou, Long Jiang Μαρία Κωστάκη Εθνικό & Καποδιστριακό Πανεπιστήμιο.
This project has been funded with support from the European Commission. Mathematical literacy and basic competences in science and technology Μαθηματική.
Δεκέμβριος 2014 Γιώτα Γιαννοπούλου – Αθηνά Μακροπόδη Αρσάκεια –Τοσίτσεια Δημοτικά Σχολεία της Φιλεκπαιδευτικής Εταιρείας Γιώτα Γιαννοπούλου – Αθηνά Μακροπόδη.
Mathematical literacy and basic competences in science and technology Το σχέδιο αυτό χρηματοδοτήθηκε με την υποστήριξη της Ευρωπαϊκής Επιτροπής. Η παρούσα.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ: «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΜΑΘΗΜΑ: ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΕΡΓΑΣΙΑ: MULTI-DOCUMENT SUMMARIZATIONS.
ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ1 ΚΑΤΑΡΤΙΣΜΟΣ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΕΞΕΤΑΣΤΙΚΩΝ ΔΟΚΙΜΙΩΝ ΝΕΑ ΕΛΛΗΝΙΚΑ ΛΥΚΕΙΟ.
Ερευνητικές Εργασίες: Πόσο
«Συμπίεση με απώλειες, χωρίς απώλειες και βέλτιστη κατανομή τριγώνων σε σκηνές 3δ πλεγμάτων» «Συμπίεση με απώλειες, χωρίς απώλειες και βέλτιστη κατανομή.
Μοντέλα - Αλγόριθμοι – Ταξινόμηση Advanced Data Indexing (Προηγμένη ευρετηρίαση δεδομένων)
Επιμόρφωση Εκπαιδευτικών Πληροφορικής
Kεφάλαιο 4 ΑΛΓΟΡΙΘΜΟΙ-ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ (αναλυτική προσέγγιση)
Κλασσικά Μοντέλα Ανάκτησης Πληροφορίας Βασική πηγη το βιβλίο και οι διαφάνειες R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval, Addison Wesley,
«Υλοποίηση παρουσίασης στo PowerPoint»
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΑΛΓΟΡΙΘΜΩΝ
IΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ: «ΔΙΟΙΚΗΣΗ & ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ.
Επέκταση Ερωτημάτων Βάσει Σωμάτων Κειμένου σε Ανοιχτούς Καταλόγους Ελεύθερης Πρόσβασης βασισμένο στο άρθρο των Jeffry Komarjaya, Danny C.C. Poo, and Min-Yen.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Συναρτησιακές Εξαρτήσεις.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά1 Συναρτησιακές Εξαρτήσεις.
ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΑΚΑΔΗΜΑΪΚΗ ΔΗΜΟΣΙΕΥΣΗ ΚΑΙ ΠΕΡΙΠΤΩΣΕΙΣ ΗΛΕΚΤΡΟΝΙΚΩΝ ΠΕΡΙΟΔΙΚΩΝ ΒΛΙΣΙΔΟΥ ΕΥΔΟΚΙΑ ΚΕΡΚΥΡΑ, ΙΟΥΝΗΣ 2006.
Θεωρία Γραφημάτων Θεμελιώσεις-Αλγόριθμοι-Εφαρμογές
Innovation Culture and Creativity for a new Economy.
ΣΚΟΠΟΣ ΤΟΥ ΕΡΓΑΣΤΗΡΙΟΥ “Επιστημονική εργασία” Εύρεση πηγών Άξονες δομής επιστημονικού άρθρου (αναγνώριση) Κανόνες γραφής επιστημονικού άρθρου (αναγνώριση)
ΠΕΡΙΦΕΡΕΙΑΚΑ ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΟΔΗΓΟΣ ΕΦΑΡΜΟΓΗΣ ΓΙΑ ΤΑ ΚΕΝΤΡΑ ΚΟΙΝΟΤΗΤΑΣ Χρήστος Κύρκογλου Προϊστάμενος Μονάδας Β΄ ΕΥΣΕΚΤ.
 Κύριο αντικείμενο της μελέτης είναι ο καθορισμός της μεθοδολογίας, των προτύπων (standards) και των διαδικασιών (procedures) για τις πρώτες και πιο.
► ► Η συγγραφή μιας ερευνητικής εργασίας ► ► Επιστημονικά κείμενα ► ► Οδηγίες για την συγγραφή και δημοσίευση εργασίας σε επιστημονικά περιοδικά ► ► Οδηγίες.
Leonardo da Vinci- Πολυμερή σχέδια για την Μεταφορά Καινοτομίας Ημερίδα Πληροφόρησης & Ενημέρωσης για την Υποβολή προτάσεων 2009 Ίδρυμα Κρατικών Υποτροφιών.
Μεθοδολογία και Κριτήρια Επιλογής Πράξεων Ενημερωτική ημερίδα δυνητικών δικαιούχων Χανιά 26 Ιανουαρίου 2016.
ΝΕΟΕΛΛΗΝΙΚΗ ΛΟΓΟΤΕΧΝΙΑ ΗΜΕΡΗΣΙΟΥ ΚΑΙ ΕΣΠΕΡΙΝΟΥ ΓΥΜΝΑΣΙΟΥ ΟΔΗΓΙΕΣ ΔΙΔΑΣΚΑΛΙΑΣ Μαρία Νέζη Σχολική Σύμβουλος Πειραιά
ΕΝΟΤΗΤΑ 1. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΕΦΑΛΑΙΟ 1.1 ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ 1.
ΜΕΘΟΔΟΛΟΓΙΑ ΕκπαιδευτικΗς ΕΡΕΥΝΑΣ: Συγγραφη εργασιας
Το θηρίο έγινε αρνάκι; Όχι ακριβώς!!
ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ
Η προσθήκη της Τεχνολογίας στα μαθήματα που περιλαμβάνονται στο Γενικό Μέσο Όρο, μεγέθυνε την αξία της δίκαιης και αντικειμενικής αξιολόγησης των μαθητικών.
Δομή μιας επιστημονικής εργασίας
“Αξιολόγηση Αυτοκινήτων”
ΠΟΛΥΜΕΣΑ Αρχές Πλοήγησης.
Σχεδιασμός προϊόντων και υπηρεσιών
Μεθοδολογία Έρευνας Διάλεξη 9η Σύνταξη Πτυχιακής Εργασίας
ΔΟΜΗ ΑΠΛΗΣ ΕΠΙΛΟΓΗΣ – ΑΣΚΗΣΗ 1
Διευθυντής Παιδιατρικής Κλινικής «Μποδοσάκειο» Νοσοκομείου Πτολεμαΐδας
Ways of Worldmaking Goodman Nelson
Επαναληπτική Διάλεξη Διοίκηση ΜΜΕ και Επιχειρηματικότητα (2017 – 18)
ΜΕΘΟΔΟΛΟΓΙΕΣ ΕΡΕΥΝΑΣ ΚΡΙΤΙΚΗ ΕΠΙΣΚΟΠΗΣΗ ΒΙΒΛΙΟΓΡΑΦΙΑΣ
Τεχνολογίες προστασίας πνευματικών δικαιωμάτων στον ψηφιακό κόσμο
Μεταγράφημα παρουσίασης:

Περίληψη Κειμένου με Διεύρυνση Κειμένου (Single Document Summarization with Document Expansion) Xiaojun Wan and Jianwu Yang Institute of Computer Science and Technology Peking University, Beijing, China

Σχετική εργασία Μέθοδοι περίληψης κειμένου  Βάσει εξαγωγής Κάθε πρόταση βαθμολογείται και ταξινομείται  Βάσει γράφου ταξινόμησης Γράφημα ομοιότητας  βαρύτητα πρότασης Η περίληψη βασίζεται σε πληροφορίες του ίδιου του κειμένου. Δεν γίνεται χρήση συγγενών κειμένων.

Προτεινόμενη Προσέγγιση 1. Διεύρυνση Κειμένου (document): Document d 0  Document Set D = {d 1, d 2, d 3,..., d κ } Document d 0  Document Set D = {d 1, d 2, d 3,..., d κ } 2. Περίληψη Κειμένου: a) Γράφημα Συνάφειας προτάσεων των d+1 κειμένων b) Υπολογισμός πληροφοριακότητας κάθε πρότασης c) Αφαίρεση περιττής πληροφορίας Θέλουμε τις προτάσεις με υψηλή πληροφοριακότητα και περιορισμένη περιττή πληροφορία.

1. Διεύρυνση Κειμένου D d0d0 d 0  D = {d 1, d 2, d 3,..., d κ } d 0  D = {d 1, d 2, d 3,..., d κ } Αξιολόγηση ομοιότητας κειμένων βάσει Cosine Measure: Αξιολόγηση ομοιότητας κειμένων βάσει Cosine Measure:

2. Περίληψη Κειμένου Σφαιρικό Γράφημα συνάφειας προτάσεων Συνολο Προτάσεων, S: Βάρος Συνάφειας 2 Προτάσεων: - - Αν sim >0  Σύνδεση 2 προτάσεων - - Αλλιώς δεν δημιουργείται σύνδεση S0S0 S1S1 S3S3 L1 L2 Σφαιρικό Γράφημα Συνάφειας Τιμές πίνακα συνάφειας λ = 1  ενδοκειμενική λ = sim(d k,d l )  διακειμενική

2. Περίληψη Κειμένου Σφαιρικό Γράφημα συνάφειας προτάσεων Σφαιρικό γράφημα, ενδοκειμενικές και διακειμενικές συνδέσεις G ~ M Ενδο-κειμενικό γράφημα συνάφειας G intra ~ M intra Δια-κειμενικό γράφημα συνάφειας G inter ~ M inter

2. Περίληψη Κειμένου Υπολογισμός πληροφοριακότητας κάθε πρότασης Βαθμός Πληροφοριακότητας πρότασης S i ο πίνακας που προκύπτει.... και οι μέθοδοι που προκύπτουν... UniformLinkIFScore( S i ) = IFScore all ( S i ) InterLinkIFScore( S i ) = IFScore inter ( S i ) IntraLinkIFScore( S i ) = IFScore intra ( S i )

2. Περίληψη Κειμένου Αφαίρεση περιττής πληροφορίας Εξαγωγή από το σφαιρικό γράφημα G ενός υπογραφήματος G d 0 Δημιουργία πίνακα συνάφειας, M d 0 Χρήση MMR αλγορίθμου για μείωση Β.Π. των λιγότερο πληροφοριακών προτάσεων έναντι αυτών με μεγαλύτερο Β.Π. Τελικά η περίληψη βασίζεται στις προτάσεις με τον υψηλότερο Β.Π. οι οποίες είναι πλούσιες σε πληροφορίες και πρωτότυπες.

Πλαίσιο αξιολόγησης Κείμενα: DUC 2002 task1 και TREC-9 Μέθοδος: ROUGE (Lin & Hovy, 2003) Κριτήρια ποιότητας περίληψης βάσει ROUGE:  n-gram  Ακολουθίες λέξεων  Ζεύγη λέξεων Φόρμουλα αξιολόγησης:

Αποτελέσματα Δια + Ενδο Δια-Κειμ. Ενδο-Κειμ.

Πόσα κείμενα στο σύνολο D;