Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
GB ( ) 5 1 ( ) ( ) ( /cm 2 ) 0.2 /30min·φ90 (5 /m 3 ) 0.4 /30min·φ90 (10 /m 3 ) /30min·φ90 (25 /m 3 )
Advertisements

Ανάδραση Σχετικότητας (Relevance Feedback ή RF)
Φροντιστήριο 2 Οκτώβριος  Querying  Lexicon access  Inverted file indexing – Inverted file compression 2.
ΑΠΟΤΙΜΗΣΗ ΑΠΟΔΟΣΗΣ ΔΙΚΤΥΩΝ ΠΟΥ ΧΡΗΣΙΜΟΠΟΙΟΥΝ ΑΞΙΟΠΙΣΤΑ ΠΡΩΤΟΚΟΛΛΑ ΜΕΤΑΦΟΡΑΣ ΚΑΙ ΑΞΙΟΠΙΣΤΑ ΠΡΩΤΟΚΟΛΛΑ ΣΥΝΔΕΣΗΣ Ιωάννης Κόμνιος Μεταπτυχιακή Διατριβή Τμήμα.
Πρωτογενής έρευνα Hi5, μία μόδα για νέους;. Μεθοδολογία - εργαλεία Η έρευνα διενεργήθηκε με την μέθοδο της συλλογής ερωτηματολογίων, τα οποία και συμπληρώνονταν.
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Introduction to Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 8α: Αξιολόγηση.
 Παρουσιάζοντας πολιτισμικό υλικό στα σχολεία
Αξιολόγηση Προγράμματος Assessment and Evaluation 1Polina Stavrou Athens 29/11/2012.
Το υλικό του Υπολογιστή
1 Μηχανές αναζήτησης στον Παγκόσμιο Ιστό Search Engines.
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Πρώτο Αρχιτεκτονική.
ΕΠΛ432: Κατανεμημένοι Αλγόριθμοι
Μεταγωγή (Switching) Λειτουργία: συνδέει εισόδους σε εξόδους, έτσι ώστε τα bits ή τα πακέτα που φτάνουν σε ένα σύνδεσμο, να φεύγουν από έναν άλλο επιθυμητό.
Μονάδα Διασφάλισης Ποιότητας του ΤΕΙ Σερρών
Ανάκτηση Πληροφορίας Το Boolean μοντέλο.
Λανθάνουσα Σημασιολογική Ανάλυση (Latent Semantic Analysis)
Ανάκτηση Πληροφορίας Το Διανυσματικό μοντέλο.
Τμήμα Πληροφορικής ΑΠΘ
Page  1 Ο.Παλιάτσου Γαλλική Επανάσταση 1 ο Γυμνάσιο Φιλιππιάδας.
ΝΕΟ ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ Α’, Β’, & Γ’ ΓΥΜΝΑΣΙΟΥ ΟΜΑΔΑ ΕΡΓΑΣΙΑΣ Ανδρέας Σ. Ανδρέου (Αναπλ. Καθηγητής ΤΕΠΑΚ - Συντονιστής) Μάριος Μιλτιάδου, Μιχάλης Τορτούρης.
1 Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Πανεπιστήμιο Πατρών ΟΝΤΟΚΕΝΤΡΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΙΙ (C++) Δομημένος Προγραμματισμός και Δομές.
© GfK 2012 | Title of presentation | DD. Month
-17 Προσδοκίες οικονομικής ανάπτυξης στην Ευρώπη Σεπτέμβριος 2013 Δείκτης > +20 Δείκτης 0 a +20 Δείκτης 0 a -20 Δείκτης < -20 Σύνολο στην Ευρωπαϊκή Ένωση:
Ανάκτηση 3Δ Μοντέλων βάσει Περιεχομένου: Μια Υβριδική Προσέγγιση Παπαδάκης Παναγιώτης.
Έρευνα για το Εθνικό Φορολογικό Σύστημα Αθήνα 9 Νοεμβρίου ο Πανελλήνιο Επιστημονικό Συνέδριο Ι.Ο.Φο.Μ. Ι.Ο.Φο.Μ. – Π.Μ.Σ. Φορολογία και Ελεγκτική.
1 4 Square Questions B A D C Κοιτάξτε προσεκτικά το διάγραμμα. Θα σας κάνω 4 ερωτήσεις γι’ αυτό το τετράγωνο. ΕΤΟΙΜΟΙ;
Συνέπεια Τόξου (Arc Consistency)
Entity-Relationship Παραδείγματα Πληροφοριακά Συστήματα και Βάσεις Δεδομένων Φροντιστήριο 1 Δαμιανός Χατζηαντωνίου.
Σχέση Απόδοσης- Κινδύνου στα Πλαίσια της Θεωρίας Χαρτοφυλακίου
Μετρικές Εκτίμησης Α π όδοσης. Κλασσικές Μετρικές ( Εκτίμηση Α π όδοσης ) Χωρικές / χρονικές π ολυ π λοκότητες δομών δεικτοδότησης Ε π ικοινωνία με το.
Α.Π.Θ. Π.Τ.Δ.Ε. Π.Μ.Σ Επιστήμες της Αγωγής-Κατεύθυνση Διδακτική των Φυσικών Επιστημών και Νέες Τεχνολογίες Διερεύνηση εφαρμογής.
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Ανάκτηση Πληροφορίας (Information Retrieval – IR) Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχ. Η/Υ, Τηλ/νιών & Δικτύων Ακαδημαϊκό Έτος
Εργαστήριο Δασικής Διαχειριστικής & Τηλεπισκόπησης Ασκήσεις Δασικής Διαχειριστικής Ι Διδάσκων Δημήτριος Καραμανώλης, Επίκουρος Καθηγητής Άσκηση 4.
Δομές Δεδομένων 1 Στοίβα. Δομές Δεδομένων 2 Στοίβα (stack)  Δομή τύπου LIFO: Last In - First Out (τελευταία εισαγωγή – πρώτη εξαγωγή)  Περιορισμένος.
Δημιουργικό Marketing συνθέσεις...με χρωματιστούς όγκους παιδικές.
Τεχνολογία ΛογισμικούSlide 1 Αλγεβρική Εξειδίκευση u Καθορισμός τύπων αφαίρεσης σε όρους σχέσεων μεταξύ τύπων λειτουργιών.
Προγραμματισμός ΙΙ Διάλεξη #5: Εντολές Ανάθεσης Εντολές Συνθήκης Δρ. Νικ. Λιόλιος.
“ Ἡ ἀ γάπη ἀ νυπόκριτος. ἀ ποστυγο ῦ ντες τ ὸ πονηρόν, κολλώμενοι τ ῷ ἀ γαθ ῷ, τ ῇ φιλαδελφί ᾳ ε ἰ ς ἀ λλήλους φιλόστοργοι, τ ῇ τιμ ῇ ἀ λλήλους προηγούμενοι.
Τα προϊόντα της EmGoldEx Τα προϊόντα της EmGoldEx Ράβδοι χρυσού 24k καθαρότητας 999,9 απο 1 έως 100 γραμμάρια Όλες οι ράβδοι χρυσού είναι πιστοποιημένες.
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Σχεσιακός Λογισμός.
An Implementation and Evaluation of WiFi Positioning Algorithms in Android Πανεπιστήμιο Κύπρου 2011 Προγραμματισμός Συστημάτων ΕΠΛ371 Γιώργος Κωνσταντίνου.
Ερευνητικές Εργασίες: Πόσο
Βάσεις Δεδομένων Εργαστήριο ΙΙI Τμήμα Πληροφορικής ΑΠΘ
Βάσεις Δεδομένων Εργαστήριο ΙΙ Τμήμα Πληροφορικής ΑΠΘ
Τα προβλήματα στην διαχείριση της πληροφορίας μέσα στην επιχείρηση
Browsing Τεχνικές που χρησιμοποιούνται για τη διευκόλυνση του χρήστη στην αναζήτηση κειμένων.
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Τρίτο Συστήματα.
1 Εισαγωγή στη Γραφική Στόχοι του μαθήματος – Γενική περιγραφή της περιοχής – Βασική ορολογία – Παραδείγματα εφαρμογών – Βασικά βήματα ανάπτυξης εφαρμογών.
1 Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Πανεπιστήμιο Πατρών ΟΝΤΟΚΕΝΤΡΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΙΙ (C++) Τάξεις και Αφαίρεση Δεδομένων.
ΕΡΕΥΝΑ ΚΕ.ΜΕ.ΤΕ. - Ο.Λ.Μ.Ε. (Απρίλης – Μάης 2008)
Αγγελική Γεωργιάδου- Αναστασία Πεκτέσογλου Δράμα 2006
ΠΛΕ70: Ανάκτηση Πληροφορίας
Μετρικές Εκτίμησης Απόδοσης
Αντικειμενοστραφής Προγραμματισμός ΙΙ
Διάλεξε τη σωστή απάντηση
ΜΥΕ03: Ανάκτηση Πληροφορίας
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ
Find: φ σ3 = 400 [lb/ft2] CD test Δσ = 1,000 [lb/ft2] Sand 34˚ 36˚ 38˚
aka Mathematical Models and Applications
Study in Holland: open to international minds
Study in Holland: open to international minds
Find: ρc [in] from load γT=110 [lb/ft3] γT=100 [lb/ft3]
Find: ρc [in] from load γT=106 [lb/ft3] γT=112 [lb/ft3]
Find: σ1 [kPa] for CD test at failure
Find: Force on culvert in [lb/ft]
Find: ρc [in] from load (4 layers)
РАДИОАКТИВТІК.
Μεταγράφημα παρουσίασης:

Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 2 Μέτρα Απόδοσης Precision = # σχετικών κειμένων που επιστρέφονται # κειμένων που επιστρέφονται Recall = # σχετικών κειμένων που επιστρέφονται # συνολικών σχετικών κειμένων Ο στόχος είναι να μεγιστοποιηθούν και τα δύο. Συνήθως, η σχετικότητα (Relevance) ενός κειμένου ως προς κάποιο ερώτημα είναι κάτι το υποκειμενικό

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 3 Μέτρηση Απόδοσης –Πόσο καλό είναι ένα σύστημα –Συγκρίσεις μεταξύ συστημάτων Τι πρέπει να μετρήσουμε –Πόσο είναι ικανοποιημένος ο χρήστης από το αποτέλεσμα –Κάλυψη πληροφορίας –Τρόπος παρουσίασης –Δυσκολία που υπάρχει –Αποδοτικό ως προς χρόνο και χώρο –Recall τμήμα των σχετικών κειμένων που ανακτώνται –Precision τμήμα των ανακτώμενων κειμένων που είναι σχετικά αποδοτικότητα Εισαγωγή

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 4 Εισαγωγή Πως μετράμε την απόδοση? –Test reference collections: TIPSTER/TREC CACM CISI Cystic Fibrosis

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 5 Ανάκληση και Ακρίβεια Recall = |Ra| / |R| Precision = |Ra| / |A| Collection Answer set (A) Relevant documents (R) relevant & retrieved (Ra)

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 6 Περιπτώσεις Ανάκλησης-Ακρίβειας

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 7 Σχετικότητα Εγγράφων Το σύνολο R δεν είναι γνωστό Relevance: –Υποκειμενική –Μπορεί να μετρηθεί μέχρι κάποιο βαθμό Πως ένα κείμενο χαρακτηρίζεται ως σχετικό προς το ερώτημα; –Σαφής απάντηση σε σαφές ερώτημα –Partial Matching –Προτείνεται πηγή για περισσότερες πληροφορίες –Πληροφορίες για το background

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 8 Precision/ Recall Καμπύλη Precision - Recall trade-off Μετρούμε το Precision σε διαφορετικά επίπεδα Recall precision recall x x x x

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 9 Precision/ Recall Καμπύλη Είναι δύσκολο να διακρίνουμε ποια από τις παρακάτω καμπύλες είναι η καλύτερη: precision recall x x x x

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 10 Παράδειγμα

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 11 Μέση Ακρίβεια Μέση ακρίβεια για κάθε επίπεδο ανάκλησης: - μέση ακρίβεια για το επίπεδο ανάκλησης r. N q - πλήθος ερωτημάτων P i (r) – ακρίβεια στο επίπεδο ανάκλησης r για το i-οστό ερώτημα.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 12 Επίπεδα Ανάκλησης Η καμπύλη δημιουργείται με 11 επίπεδα recall: 0%, 10%, 20%, …, 100% Έστω το j-ιοστό επίπεδο recall. Τότε,

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 13 Εφαρμογή παρεμβολής για τα 11 επίπεδα ανάκλησης Παρεμβολή

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 14 Κατώφλια Άλλος τρόπος υπολογισμού: –Σταθεροποιούμε τον αριθμό των κειμένων ανά επίπεδο: top 5, top 10, top 20, top 50, top 100, top 500 –Μέτρηση του precision για αυτά τα επίπεδα –Μέση τιμή Τρόπος να εστιάσουμε σε high precision

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 15 Μονότιμες Συνόψεις Average Precision vs Recall είναι χρήσιμες τιμές για την περιγραφή της απόδοσης ενός συστήματος σε ένα σύνολο ερωτημάτων. Πως θα μετρήσουμε την απόδοση για κάθε ερώτημα χωριστά; Single value measures: –Average Precision at Seen Relevant Documents; –R-Precision; –Precision Histograms; –Summary Table Statistics.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 16 Αρμονικός Μέσος The harmonic mean combines Recall & Precision into a single number ranging from 0 to 1: P(j) - precision of j-th document in ranking; r(j) – recall of j-th document in ranking; If F(j) = 0 – no relevant docs have been retrieved; If F(j) = 1 – all ranked docs are relevant; The harmonic mean assumes high value only when both recall & precision are high.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 17 E-Measure Combine Precision and Recall into one number and allow user to specify whether s/he is more interested in recall or precision: P(j) – precision of j-th document in ranking; r(j) – recall of j-th document in ranking; b - measure of relative importance of precision or recall: b > 1 emphasizes precision, b < 1 emphasizes recall

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 18 Μέτρα Προσανατολισμένα στο Χρήστη Different users might have a different interpretation of which document is relevant or not User-oriented measures: –Coverage ratio: –Novelty ratio: –Relative ratio – the ratio between the # of relevant docs found and the # of relevant docs the user expected to find –Recall effort – the ratio between the # of relevant docs the user expected to find and the # of docs examined in an attempt to find the expected relevant docs.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 19 Answer set (A) Relevant documents (R) Relevant Docs known to user (U) Relevant Docs known to user which were retrieved (Rk) Relevant Docs previously unknown to user which were retrieved (Ru) Μέτρα Προσανατολισμένα στο Χρήστη

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 20 Συλλογές Αναφοράς TREC collection (Text REtrieval Conference) – 5.8 GB, >1.5 Million Docs. CACM - computer science – 3024 articles. ISI (CISI) – library science – 1460 docs. Cystic Fibrosis (CF) - medicine – 1239 docs. CRAN – aeronautics – 1400 docs. Time – general articles – 423 docs. NPL – electrical engineering – docs. κλπ

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 21 Σύνοψη Βασικά μέτρα αποτίμησης της αποτελεσματικότητας ενός IR συστήματος: –Recall & Precision –Μονότιμες συνόψεις –Εναλλακτικά μέτρα –Μέτρα προσανατολισμένα στο χρήστη Συλλογές αναφοράς.