Ανάδραση Σχετικότητας (Relevance Feedback ή RF)

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Advertisements

Αλγόριθμοι σχεδίασης βασικών 2D σχημάτων (ευθεία)
Γραφήματα & Επίπεδα Γραφήματα
ΑΠΟΤΙΜΗΣΗ ΑΠΟΔΟΣΗΣ ΔΙΚΤΥΩΝ ΠΟΥ ΧΡΗΣΙΜΟΠΟΙΟΥΝ ΑΞΙΟΠΙΣΤΑ ΠΡΩΤΟΚΟΛΛΑ ΜΕΤΑΦΟΡΑΣ ΚΑΙ ΑΞΙΟΠΙΣΤΑ ΠΡΩΤΟΚΟΛΛΑ ΣΥΝΔΕΣΗΣ Ιωάννης Κόμνιος Μεταπτυχιακή Διατριβή Τμήμα.
Ερωτηματολόγιο Συλλογής Απαιτήσεων Εφαρμογών Υψηλών Επιδόσεων
Μετά από έρευνα που διενήργησε εταιρεία ερευνών, διαπιστώθηκε πως στην εταιρεία μας οι εργαζόμενοι χρησιμοποιούν μεταξύ τους ένα λεξιλόγιο κάπως ανάρμοστο.
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Ανάλυση Πολλαπλής Παλινδρόμησης
-Στοίβα-Ουρά - Πλεονεκτήματα πινάκων -Δομές δεδομένων δευτερεύουσας μνήμης -Πληροφορική και δεδομένα -Παραδείγματα-Προβλήματα ψευδοκώδικα.
Αντισταθμιστική ανάλυση Κατά τη διάρκεια εκτέλεσης του Α η Δ πραγματοποιεί μία ακολουθία από πράξεις. Θεωρήστε έναν αλγόριθμο Α που χρησιμοποιεί μια δομή.
Πιθανοκρατικοί Αλγόριθμοι
Τα στοιχειώδη περί γεωδαιτικών υπολογισμών
ΕΠΛ432: Κατανεμημένοι Αλγόριθμοι
Εκτέλεση Αλγορίθμων σε ψευδογλώσσα
Προγραμματισμός PASCAL Πληροφορική Γ' Λυκείου μέρος γ
Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας.
Ανάκτηση Πληροφορίας Το Boolean μοντέλο.
Λανθάνουσα Σημασιολογική Ανάλυση (Latent Semantic Analysis)
Ανάκτηση Πληροφορίας Το Διανυσματικό μοντέλο.
Τμήμα Πληροφορικής ΑΠΘ
Page  1 Ο.Παλιάτσου Γαλλική Επανάσταση 1 ο Γυμνάσιο Φιλιππιάδας.
ΝΕΟ ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ Α’, Β’, & Γ’ ΓΥΜΝΑΣΙΟΥ ΟΜΑΔΑ ΕΡΓΑΣΙΑΣ Ανδρέας Σ. Ανδρέου (Αναπλ. Καθηγητής ΤΕΠΑΚ - Συντονιστής) Μάριος Μιλτιάδου, Μιχάλης Τορτούρης.
Ανάλυση του λευκού φωτός και χρώματα
© GfK 2012 | Title of presentation | DD. Month
-17 Προσδοκίες οικονομικής ανάπτυξης στην Ευρώπη Σεπτέμβριος 2013 Δείκτης > +20 Δείκτης 0 a +20 Δείκτης 0 a -20 Δείκτης < -20 Σύνολο στην Ευρωπαϊκή Ένωση:
Εισαγωγικές Έννοιες Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης Επιμέλεια διαφανειών: Δ. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο.
1 Εισαγωγή στις Βάσεις Δεδομένων  Ανάγκη Αποθήκευσης και Διαχείρισης Δεδομένων  Συστήματα Αρχείων  Συστήματα Βάσεων Δεδομένων  Παραδοσιακές και Σύγχρονες.
Αναγνώριση Προτύπων.
Κεφάλαιο 2ο Πεπερασμένα αυτόματα.
Γραφήματα & Επίπεδα Γραφήματα
Μοντελοποίηση Έργα Μαθήματα Αξιολόγηση Αναστοχασμός Αναστοχασμός.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Συναρτησιακές Εξαρτήσεις.
ΙΣΟΛΟΓΙΣΜΟΣ ΒΑΣΕΙ Δ.Λ.Π. (ΕΝΑΡΞΗΣ)
1 Θεματική Ενότητα Γραφήματα & Επίπεδα Γραφήματα.
Προσεγγιστικοί Αλγόριθμοι
Αποκεντρωμένη Διοίκηση Μακεδονίας Θράκης ∆ιαχείριση έργων επίβλεψης µε σύγχρονα µέσα και επικοινωνία C2G, B2G, G2G Γενική Δ/νση Εσωτερικής Λειτουργίας.
1 Συλλογή Στοιχείων 24 Νοεμβρίου έως 5 Δεκεμβρίου 2005 Κοινωνικό, πολιτικό & οικονομικό περιβάλλον 1 1 ΚΟΙΝΩΝΙΚΟ, ΠΟΛΙΤΙΚΟ & ΟΙΚΟΝΟΜΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ( Δείκτες.
Βάσεις Δεδομένων II Διαχείριση Δοσοληψιών Πάνος Βασιλειάδης Σεπτέμβρης 2002
13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών – Κέρκυρα Οκτωβρίου 2004 Το σύστημα COINE για την προβολή της πολιτιστικής κληρονομιάς και την υποστήριξη.
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
6 MRB, Συλλογή στοιχείων: 24 Νοεμβρίου έως 5 Δεκεμβρίου 2005 Εξωτερική Πολιτική: Τουρκία – Κυπριακό – ΠΓΔΜ - Κοσσυφοπέδιο 1 6 ΕΞΩΤΕΡΙΚΗ ΠΟΛΙΤΙΚΗ ( Τουρκία.
Δομές Αναζήτησης TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A Χειριζόμαστε ένα σύνολο στοιχείων όπου το κάθε.
Ανάλυση Πολλαπλής Παλινδρόμησης
Ηλεκτρονική Ενότητα 5: DC λειτουργία – Πόλωση του διπολικού τρανζίστορ
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Τρίτο Συστήματα.
Ανάκτηση Πληροφορίας (Information Retrieval – IR) Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχ. Η/Υ, Τηλ/νιών & Δικτύων Ακαδημαϊκό Έτος
Μεταθέσεις & Συνδυασμοί
Τεχνολογία ΛογισμικούSlide 1 Αλγεβρική Εξειδίκευση u Καθορισμός τύπων αφαίρεσης σε όρους σχέσεων μεταξύ τύπων λειτουργιών.
1 Εισαγωγή στις Βάσεις Δεδομένων  Ανάγκη Αποθήκευσης και Διαχείρισης Δεδομένων  Συστήματα Αρχείων  Συστήματα Βάσεων Δεδομένων  Παραδοσιακές και Σύγχρονες.
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
ANAKOINWSH H 2η Ενδιάμεση Εξέταση μεταφέρεται στις αντί για , την 24 Νοεμβρίου στις αίθουσες ΧΩΔ και 110 λόγω μη-διαθεσιμότητας.
Ανάπτυξη Πρωτοτύπου Λογισμικού
Στατιστική Ι Παράδοση 9 Ο Δείκτης Συσχέτισης.
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
Διδάσκοντες: Σ. Ζάχος, Δ. Φωτάκης
1 Νέα Θεωρία Μεγέθυνσης Ενδογενής μεγέθυνση. 2 Συνάρτηση παραγωγής προϊόντος Υ t = Y(K, L, A) Y t = [(1-α k )·K t ] α · [(1-α L )·A t ·L t ] 1-α 0
Προχωρημένα Θέματα Τεχνολογίας και Εφαρμογών Βάσεων Δεδομένων Διαχείριση Συναλλαγών Πάνος Βασιλειάδης Μάρτιος 2014
Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. K-means k-windows k-means: 2 φάσεις 1. Μια διαμέριση των στοιχείων σε k clusters 2. Η ποιότητα της διαμέρισης.
ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ Συγγραφείς Α.Βακάλη Η. Γιαννόπουλος Ν. Ιωαννίδης Χ.Κοίλιας Κ. Μάλαμας Ι. Μανωλόπουλος Π. Πολίτης Γ΄ τάξη.
Βάσεις Δεδομένων Εργαστήριο ΙΙ Τμήμα Πληροφορικής ΑΠΘ
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών – Τμήμα Πληροφορικής και Τηλεπικοινωνιών 1 Κεφάλαιο 3 Η Σημασιολογία των Γλωσσών Προγραμματισμού Προπτυχιακό.
ΜΑΘΗΜΑ: ΣΧΕΔΙΑΣΗ ΑΛΓΟΡΙΘΜΩΝ ΔΙΔΑΣΚΩΝ: Π. ΚΑΤΣΑΡΟΣ Παρασκευή, 3 Απριλίου 2015Παρασκευή, 3 Απριλίου 2015Παρασκευή, 3 Απριλίου 2015Παρασκευή, 3 Απριλίου 2015Τμ.
Δομές Δεδομένων - Ισοζυγισμένα Δυαδικά Δένδρα (balanced binary trees)
Δομές Αναζήτησης TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: AA A A A Θέλουμε να υποστηρίξουμε δύο βασικές λειτουργίες:
Κλασσικά Μοντέλα Ανάκτησης Πληροφορίας Βασική πηγη το βιβλίο και οι διαφάνειες R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval, Addison Wesley,
+19 Δεκέμβριος 2014 Δείκτης > +20 Δείκτης 0 έως +20 Δείκτης 0 έως -20 Δείκτης < -20 Συνολικά της ΕΕ: +5 Δείκτης > +20 Δείκτης 0 έως +20 Δείκτης 0 έως -20.
ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΥΡΕΤΙΚΕΣ ΜΕΘΟΔΟΥΣ Άπληστη Αναζήτηση και Αναζήτηση Α* ΣΠΥΡΟΣ ΛΥΚΟΘΑΝΑΣΗΣ, ΚΑΘΗΓΗΤΗΣ.
Τμήμα Μηχανικών Πληροφορικής Τ.Ε.
Μεταγράφημα παρουσίασης:

Ανάδραση Σχετικότητας (Relevance Feedback ή RF) Ανάκτηση Πληροφορίας Ανάδραση Σχετικότητας (Relevance Feedback ή RF)

Τμήμα Πληροφορικής ΑΠΘ Περιεχόμενα Κίνητρο Τύποι ανάδρασης Τεχνικές ανάδρασης διανυσματικό μοντέλο πιθανοκρατικό μοντέλο Επεκτάσεις Μερικά αποτελέσματα Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Κίνητρο Τι θα πρέπει να γίνει αν ο χρήστης δεν είναι ικανοποιημένος από την απάντηση που έλαβε σε μία πληροφοριακή ανάγκη; Πιθανές λύσεις: Διατύπωση του ερωτήματος με διαφορετικό τρόπο. Προσαρμογή του ερωτήματος από το σύστημα. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Ορισμός Με τον όρο ανάδραση (feedback) εννοούμε εκείνες τις τεχνικές που έχουν ως στόχο να βελτιώσουν μια ερώτηση χρήστη και να διευκολύνουν την ανάκτηση πληροφορίας σχετικής με αυτή που ζητά ο χρήστης. Στόχος της βελτίωσης αυτής είναι να αυξηθεί η αποτελεσματικότητα και ο χρήστης να λάβει καλύτερες απαντήσεις σε σχέση με την προηγούμενη εκτέλεση. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Παράδειγμα Ανάδρασης Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Παράδειγμα Ανάδρασης Η πρώτη απάντηση Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Παράδειγμα Ανάδρασης Ανάδραση (επιλέγουμε τις εικόνες με πράσινο περίγραμμα) Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Παράδειγμα Ανάδρασης Αποτελέσματα μετά την ανάδραση Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Η Διαδικασία της Ανάδρασης Η διαδικασία της ανάδρασης μπορεί να επαναληφθεί περισσότερες φορές. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Τύποι Ανάδρασης Ανάλογα με τον τρόπο που λαμβάνεται η ανάδραση του χρήστη διακρίνουμε τους εξής τύπους ανάδρασης: άμεση ανάδραση: ο χρήστης επιλέγει τα σχετικά έγγραφα με άμεσο τρόπο (επιλογή) έμμεση ανάδραση: το σύστημα προσδιορίζει τα σχετικά για το χρήστη έγγραφα από τον τρόπο εξέτασης των αποτελεσμάτων από το χρήση (browising) ψευδοανάδραση: το σύστημα αναπροσαρμόζει μόνο του το ερώτημα με βάση τα πρώτα έγγραφα του αποτελέσματος χωρίς την παρέμβαση του χρήστη. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Τύποι Ανάδρασης Η μέθοδος ανάδρασης επηρεάζεται και από το μοντέλο ανάκτησης που χρησιμοποιείται. Θα εξετάσουμε την ανάδραση για τα πιο γνωστά μοντέλα ανάκτησης: Boolean Διανυσματικό Πιθανανοκρατικό Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Ανάδραση στο Boolean Μοντέλο Γενικά προτείνονται δυο μέθοδοι για υλοποίηση RF σε Boolean συστήματα : Παρουσίαση μιας λίστας από νέους πιθανούς όρους ερωτήματος (αυτούς που εμφανίζονται πιο συχνά στα σχετικά έγγραφα) και θα ήταν καλό να συμπεριληφθούν σε νέο ερώτημα Το σύστημα τροποποιεί αυτόματα τους όρους και τους λογικούς τελεστές με βάση τα έγγραφα που έχει επιλέξει ως σχετικά ο χρήστης. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Ανάδραση στο Διανυσματικό Μοντέλο Η πιο γνωστή μέθοδος ανάδρασης στο Διανυσματικό μοντέλο είναι η μέθοδος του Rocchio. Θέλουμε να μεγιστοποιήσουμε την ποσότητα Sim(Q, R) – Sim(Q, C-R) Το βέλτιστο ερώτημα που πρέπει να διατυπώσουμε ώστε να διαχωριστούν τα σχετικά έγγραφα από τα μη σχετικά είναι (όταν χρησιμοποιείται ομοιότητα συνημιτόνου): C: συλλογή εγγράφων, R: σύνολο σχετικών, NR: σύνολο μη σχετικών Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Ανάδραση στο Διανυσματικό Μοντέλο Έστω ότι έχουμε ένα μόνο σχετικό έγγραφο (έστω r) και ένα μόνο μη σχετικό έγγραφο (έστω nr). Για να μπορέσουμε να διαχωρίσουμε το ένα από το άλλο, το διάνυσμα του βέλτιστου ερωτήματος Qopt θα είναι (για συνημίτονο): vec(Qopt ) = vec(r) – vec(nr) Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Ανάδραση στο Διανυσματικό Μοντέλο Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Ανάδραση στο Διανυσματικό Μοντέλο x x x x o x x x x x x x x o x o x o x x  o o x x x μη σχετικά έγγραφα o σχετικά έγγραφα βέλτιστο ερώτημα (Qopt) Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Ανάδραση στο Διανυσματικό Μοντέλο Πρόβλημα: το βέλτιστο ερώτημα δεν μπορεί να βρεθεί στην πράξη. Γιατί? Διότι δε γνωρίζουμε εκ των προτέρων το σύνολο των σχετικών εγγράφων. Αν τα γνωρίζαμε ποιος ο λόγος να εκτελέσουμε το ερώτημα? Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Ανάδραση στο Διανυσματικό Μοντέλο Στην πράξη χρησιμοποιείται ο ακόλουθος τύπος για τη μεταβολή Του διανύσματος του αρχικού ερωτήματος. qm = μετασχηματισμένο ερώτημα q0 = αρχικό ερώτημα α,β,γ: βάρη R = σύνολο σχετικών εγγράφων NR = σύνολο μη σχετικών εγγράφων Το νέο ερώτημα θα είναι πιο κοντά στα σχετικά έγγραφα (από αυτά που επέλεξε ο χρήστης) και πιο μακριά από τα μη σχετικά έγγραφα. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Ανάδραση στο Διανυσματικό Μοντέλο αρχικό ερώτημα x x x o x x x  x x x x o x o x  x o x o o x x x x x μη σχετικά έγγραφα o σχετικά έγγραφα αναθεωρημένο ερώτημα Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Ανάδραση στο Διανυσματικό Μοντέλο Συνήθως,  <  αρχικό ερώτημα 4 8 4 8 (+) θετική ανάδραση 2 4 8 2 1 2 4 1 (-) 8 4 4 16 2 1 1 4 αρνητική ανάδραση νέο ερώτημα -1 6 3 7 -3 Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ 16

Ανάδραση στο Πιθανοκρατικό Μοντέλο Η συνάρτηση ομοιότητας του Πιθανοκρατικού μοντέλου είναι: Όπου η άθροιση αφορά στους όρους που βρίσκονται και στo ερώτημα και στο έγγραφο. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Ανάδραση στο Πιθανοκρατικό Μοντέλο Αρχικά θέτουμε τιμές στις πιθανότητες : pi = P(xi | R) = c ri = P(xi | R) = ni / N όπου: c είναι μία τυχαία σταθερά (π.χ., 0.5) ni είναι το πλήθος των εγγράφων που περιέχουν τον i- οστό όρο N πλήθος εγγράφων συλλογής Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Ανάδραση στο Πιθανοκρατικό Μοντέλο Είναι προφανές ότι η αυθαίρετη ανάθεση τιμών δεν μπορεί να οδηγεί πάντα σε ικανοποιητικά αποτελέσματα. Για τη βελτίωση της ποιότητας των αποτελεσμάτων οι πρώτες εφαρμογές του Πιθανοκρατικού μοντέλου χρειαζόταν την παρέμβαση του χρήστη για την αναπροσαρμογή των τιμών. Εναλλακτικά μπορεί να χρησιμοποιηθεί και αυτοματοποιη-μένος τρόπος. Αρχικά εκτελείται το ερώτημα με τις αρχικές εκτιμήσεις. Επιλέγονται τα k καλύτερα έγγραφα. Έστω ki ο αριθμός των εγγράφων που περιέχουν τον i-οστό όρο. Θέτουμε: pi = P(xi | R) = ki / k ri = P(xi | R) = (ni - ki) / (N - k) Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Εξάρτηση Όρων Τα vector space και probabilistic μοντέλα υποθέτουν ότι οι όροι είναι ανεξάρτητοι μεταξύ τους. Αυτό σημαίνει ότι η παρουσία ενός όρου σε ένα έγγραφο δεν επηρεάζει την πιθανότητα παρουσίας ενός άλλου στο ίδιο έγγραφο. Στην πραγματικότητα δεν ισχύει κάτι τέτοιο και η ενσωμάτωση της πληροφορίας συσχέτισης κάποιων όρων θα μπορούσε να βελτιώσει την αποτελεσματικότητα της ανάκτησης. Είναι δύσκολη η επιτυχής χρήση αυτής της πληροφορίας με αποδεκτό υπολογιστικά τρόπο. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Δυναμική Αναζήτηση Κατά ένα μεγάλο μέρος στη δουλειά που γίνεται για το RF υπάρχει η παραδοχή ότι η πληροφορία που αναζητεί ο χρήστης δε μεταβάλλεται κατά τη διάρκεια της αναζήτησης. Αν αυτό δεν συμβαίνει, τότε τα έγγραφα που χαρακτηρίστηκαν σχετικά στην αρχή της αναζήτησης μπορεί να μην είναι καλά παραδείγματα για το τι θεωρεί ο χρήστης σχετικό μετά. Με χρήση ageing component μπορεί να μειώνεται το βάρος ενός όρου όσο περνάει ο χρόνος ώστε να έχει μικρότερη επίδραση στην εύρεση εγγράφων. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Αρνητική Ανάδραση Η αρνητική ανάδραση είναι μια μορφή ανάδρασης που χρησιμοποιεί πληροφορία από έγγραφα που έχουν χαρακτηριστεί ως μη-σχετικά από το χρήστη. Η αρνητική ανάδραση θεωρείται προβληματική για τρεις λόγους: Πότε ένας χρήστης θα πρέπει να χαρακτηρίζει ένα έγγραφο ως μη-σχετικό; Είναι πιο δύσκολο από το χαρακτηρισμό ως σχετικό. Το να περιμένει κανείς από τους χρήστες να επιλέξουν έγγραφα ως μη-σχετικά στην αναζήτηση μπορεί να είναι δύσκολο στην υλοποίηση πρακτικά. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Σχετικά με την Ψευδοανάδραση Μια εναλλακτική προσέγγιση που είναι γνωστή ως pseudo, blind ή ad-hoc RF, χρησιμοποιεί τεχνικές RF για να βελτιώσει αυτόματα την κατάταξη πριν παρουσιαστούν τα έγγραφα στο χρήστη. Το σύστημα κατατάσσει τα έγγραφα από το αρχικό ερώτημα, επιλέγει λίγα από αυτά που είναι πρώτα στη κατάταξη και εκτελεί μια επανάληψη RF, θεωρώντας ως σχετικά τα έγγραφα που επέλεξε. Με το νέο ερώτημα που παράγεται εμφανίζεται στο χρήστη μια νέα κατάταξη εγγράφων που είναι βελτιωμένη σε σχέση με την αρχική. Η pseudo RF τεχνική λειτουργεί ικανοποιητικά για «καλά» αρχικά ερωτήματα αλλά είναι αναποτελεσματική για «κακά» αρχικά ερωτήματα. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Διαδραστική Επαύξηση Ερωτήματος Οι μέθοδοι για τροποποίηση ερωτήματος που έχουν περιγραφεί ως τώρα επιλέγουν αυτόματα όρους από έγγραφα και προσθέτουν κάποιους στο ερώτημα. Ένας εναλλακτικός τρόπος είναι οι χρήστες να επιλέγουν τους όρους που θα προστεθούν στο ερώτημα (IQE - interactive query expansion). Αναζητήσεις για τις οποίες ο χρήστης μπορεί να εντοπίσει εύκολα σχετική πληροφορία ωφελούνται περισσότερο από IQE. Αναζητήσεις σε περιπτώσεις που έχει ανακτηθεί λίγη σχετική πληροφορία ωφελούνται από IQE. Είναι πιο πιθανό οι χρήστες να χρησιμοποιήσουν IQE σε μια πολύπλοκη ή δύσκολη αναζήτηση. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Πειραματικά Αποτελέσματα Θα εξετάσουμε μερικά αποτελέσματα από την εργασία: Jürgen Koenemann and Nicholas J. Belkin. (1996) A Case For Interaction: A Study of Interactive Information Retrieval Behavior and Effectiveness. Proceedings of SIGCHI 1996 Conference on Human Factors in Computing Systems (CHI 1996). Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Πειραματικά Αποτελέσματα Opaque (black box) Ο χρήστης δεν μπορεί να δει τη διαδικασία ανάδρασης. Transparent Ο χρήστης μπορεί να δει τους όρους που δημιουργήθηκαν από την ανάδραση αλλά δεν μπορεί να μεταβάλει το ερώτημα. Penetrable Ο χρήστης μπορεί να μεταβάλει το ερώτημα. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Πειραματικά Αποτελέσματα Παρουσίαση των εννοιών στους συμμετέχοντες 64 αρχάριοι χρήστες Ο στόχος είναι η συνεχής μεταβολή του ερωτήματος έως η ακρίβεια να είναι σε ικανοποιητικά επίπεδα. Χρησιμοποιήθηκε το σύστημα INQUERY Τα δεδομένα που χρησιμοποιήθηκαν είναι από τη συλλογή TREC έγγραφα από τη Wall Street Journal. Δύο αντικείμενα αναζήτησης: Automobile Recalls Tobacco Advertising and the Young Η σχετικότητα των εγγράφων έχει καθοριστεί από το TREC και τον οργανωτή της πειραματικής μελέτης. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Πειραματικά Αποτελέσματα Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Πλεονεκτήματα Συνήθως, αυξάνει την ακρίβεια στα αποτελέσματα. Δίνει τη δυνατότητα να βρεθεί ένα καλύτερο ερώτημα χωρίς να απαιτείται από το χρήστη να διατυπώσει ένα νέο ερώτημα από την αρχή. Εύκολη υλοποίηση και εφαρμογή στα πιο δημοφιλή μοντέλα ανάκτησης (boolean, vector, probabilistic) Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Μειονεκτήματα Πολλές φορές οι χρήστες διστάζουν να χρησιμοποιήσουν ανάδραση. Ο χρόνος επεξεργασίας των ερωτημάτων προφανώς και αυξάνεται. Μερικές φορές δεν είναι προφανές για πιο λόγο έχει επιστραφεί ένα έγγραφο. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Χρήσιμοι Σύνδεσμοι Σύστημα ανάκτησης εικόνων με δυνατότητα ανάδρασης http://amazon.ece.utexas.edu/~qasim/cires.htm Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ

Τμήμα Πληροφορικής ΑΠΘ Σύνοψη Χρήση της ανάδρασης για την αύξηση της αποτελεσματικότητας. Στην άμεσα ανάδραση απαιτείται η παρέμβαση του χρήστη. Είδαμε τη χρήση της ανάδρασης στα πιο δημοφιλή μοντέλα και δόθηκε έμφαση στο Διανυσματικό. Ανάκτηση Πληροφορίας Τμήμα Πληροφορικής ΑΠΘ