Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Πληροφορικής Ακαδημαϊκό Έτος 2008-2009 Ανάκτηση Πληροφορίας.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Ευρετήρια.
Advertisements

Ανάδραση Σχετικότητας (Relevance Feedback ή RF)
Ερωτηματολόγιο Συλλογής Απαιτήσεων Εφαρμογών Υψηλών Επιδόσεων
Διάγραμμα Παρουσίασης
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Computers: Information Technology in Perspective By Long and Long Copyright 2002 Prentice Hall, Inc. Λογισμικό Διάλεξη 5 η.
ΔΙ.ΟΡΓΑΝΩ.ΣΗ Σύστημα ΔΙαχείρισης ΟΡΓΑΝΩσιακής ΓνώΣΗς για τις ελληνικές επιχειρήσεις. Μπίμπη Σταματία1 Σαμολαδάς Ιωάννης1 Σταμέλος Ιωάννης1 Κατσιαδάκης.
ΕΠΛ 001: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Μηχανές αναζήτησης.
Πανελλήνιο Ψηφιακό Αποθετήριο Μαθησιακών Αντικειμένων
ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Εισαγωγή στις Βάσεις Δεδομένων για Μαθητές Λυκείων και Τεχνικών Σχολών Δημήτρης Ζεϊναλιπούρ Λέκτορας Τμήμα Πληροφορικής,
ΔΙΑΔΙΚΤΥΟ (INTERNET) Γκόγκου A. Μάρθα Msc Πληροφορικής.
HTML.
1 Μηχανές αναζήτησης στον Παγκόσμιο Ιστό Search Engines.
Οργάνωση και Αρχιτεκτονική Υπολογιστών Διάδρομοι Μεταφοράς Δεδομένων
Βάσεις Δεδομένων 1 T.Manavis– N.Kyritsis.
Ο Αντεστραμμένος Κατάλογος
Δεικτοδότηση και Αναζήτηση (Indexing & Searching)
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ.
Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας.
Ανάκτηση Πληροφορίας Το Boolean μοντέλο.
Λανθάνουσα Σημασιολογική Ανάλυση (Latent Semantic Analysis)
Ανάκτηση Πληροφορίας Το Διανυσματικό μοντέλο.
Τμήμα Πληροφορικής ΑΠΘ
Page  1 Ο.Παλιάτσου Γαλλική Επανάσταση 1 ο Γυμνάσιο Φιλιππιάδας.
1 iPac Μια πρώτη γνωριμία Κώστας Βίγλας ΥΚΒ. 26/6/2002 Ενημέρωση πάνω στις νέες ψηφιακές υπηρεσίες 2 Περιεχόμενα 1 iPac  Τί είναι το iPac  Δυνατότητες.
1 Εισαγωγή στις Βάσεις Δεδομένων  Ανάγκη Αποθήκευσης και Διαχείρισης Δεδομένων  Συστήματα Αρχείων  Συστήματα Βάσεων Δεδομένων  Παραδοσιακές και Σύγχρονες.
Αρχιτεκτονική Συστημάτων
Heal Link Η HEAL Link (Hellenic Academic Libraries Link) είναι ο Σύνδεσμος Ελληνικών Ακαδημαϊκών Βιβλιοθηκών και λειτουργεί υπό.
19 ο Συνέδριο Ελληνικών Ακαδημαϊκών Βιβλιοθηκών Αθήνα, Νοεμβρίου, 2010 HEAL-Link 2010: ο αγώνας για την επιβίωση μόλις έκλεισε τα 12 Κλωντίνη Δέρβου,
ΙΣΟΛΟΓΙΣΜΟΣ ΒΑΣΕΙ Δ.Λ.Π. (ΕΝΑΡΞΗΣ)
Αποκεντρωμένη Διοίκηση Μακεδονίας Θράκης ∆ιαχείριση έργων επίβλεψης µε σύγχρονα µέσα και επικοινωνία C2G, B2G, G2G Γενική Δ/νση Εσωτερικής Λειτουργίας.
ΈΝΑ ΗΛΕΚΤΡΟΝΙΚΟ ΕΚΘΕΤΗΡΙΟ ΓΙΑ ΤΙΣ ΝΕΕΣ ΠΡΟΣΚΤΗΣΕΙΣ ΒΙΒΛΙΩΝ ΤΗΣ ΒΙΒΛΙΟΘΗΚΗΣ ΤΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕΔΟΝΙΑΣ Κολοβός Φίλιππος Τσανακτσίδου ΕλισάβετΠαπαργύρη.
13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών – Κέρκυρα Οκτωβρίου 2004 Το σύστημα COINE για την προβολή της πολιτιστικής κληρονομιάς και την υποστήριξη.
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας: Διοίκηση & Οργάνωση Βιβλιοθηκών.
Ψηφιακή Βιβλιοθήκη ΤΕΕ
Προγραμματισμός ΙΙ Διάλεξη #6: Απλές Δομές Ελέγχου Δρ. Νικ. Λιόλιος.
Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr
1 Α. Βαφειάδης Αναβάθμισης Προγράμματος Σπουδών Τμήματος Πληροφορικής Τ.Ε.Ι Θεσσαλονίκης Μάθημα Προηγμένες Αρχιτεκτονικές Υπολογιστών Κεφαλαίο Τρίτο Συστήματα.
Ανάκτηση Πληροφορίας (Information Retrieval – IR) Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχ. Η/Υ, Τηλ/νιών & Δικτύων Ακαδημαϊκό Έτος
Ο ΗΛΕΚΤΡΟΝΙΚΟΣ ΥΠΟΛΟΓΙΣΤΗΣ
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
1 Εισαγωγή στις Βάσεις Δεδομένων  Ανάγκη Αποθήκευσης και Διαχείρισης Δεδομένων  Συστήματα Αρχείων  Συστήματα Βάσεων Δεδομένων  Παραδοσιακές και Σύγχρονες.
1 Ενότητα 5.3.1: Ερωτηματολόγια με τη χρήση του Διαδικτύου Διδάσκων: Χρήστος Κατσάνος - Πανεπιστημιακό κέντρο εκπαίδευσης επιμορφωτών.
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
Ανάπτυξη Πρωτοτύπου Λογισμικού
Δομές Δεδομένων (Data Structures) 3o Εξάμηνο Σπουδών Διδάσκων: Απόστολος Παπαδόπουλος και
Ψηφιακό Αρχείο Τύπου Δημοσιογραφικού Οργανισμού Λαμπράκη
Οριζόντιο Έργο Υποστήριξης Σχολείων, Εκπαιδευτικών και Μαθητών στο Δρόμο για το ΨΗΦΙΑΚΟ ΣΧΟΛΕΙΟ, νέες υπηρεσίες Πανελλήνιου Σχολικού Δικτύου και Στήριξη.
Ημέρα 1η.
Αυτόματη Ανάλυση & Οργάνωση Μουσικών Αρχείων Διδάσκων Καθηγητής: Καπιδάκης Σαράντος Σπουδαστής: Σιδέρης Νίκος Αθήνα2008.
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Information Extraction.
Residency Database Residency Database Project IFMSA Transnational project Από τηv Ελληνική Επιτροπή Διεθνών Σχέσεων και Ανταλλαγών Φοιτητών Ιατρικής (HelMSIC)
Βάσεις Δεδομένων Εργαστήριο ΙΙ Τμήμα Πληροφορικής ΑΠΘ
Μετατροπή Μουσικών Συλλογών σε Ψηφιακές Βιβλιοθήκες Το Πρόγραμμα MUSESCAPE Ιόνιο Πανεπιστήμιο Ιανουάριος 2005 Χριστιανούδης Ιωάννης.
Διοίκηση Πληροφοριακών Συστημάτων
Δομές Δεδομένων - Ισοζυγισμένα Δυαδικά Δένδρα (balanced binary trees)
Κλασσικά Μοντέλα Ανάκτησης Πληροφορίας Βασική πηγη το βιβλίο και οι διαφάνειες R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval, Addison Wesley,
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ TΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ «Επιστήμη της Πληροφορίας – Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες.
1 Βάσεις Δεδομένων ΙI Επιμέλεια: ΘΟΔΩΡΗΣ ΜΑΝΑΒΗΣ SQL (3 από 3) T Manavis.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ “ USING MILOS TO BUILD A MULTIMEDIA.
Ανάκτηση Πληροφορίας 1 Multimedia IR Multimedia IR Δεικτοδότηση και Αναζήτηση.
1 Η ΧΡΗΣΗ ΤΩΝ ΠΕΡΙΛΗΨΕΩΝ ΣΤΗΝ XML ΑΝΑΚΤΗΣΗ ΜΑΘΗΜΑ : ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ επιμέλεια : ΡΑΜΜΑ ΧΑΡΙΚΛΕΙΑ ΑΘΗΝΑ 2007 Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας –
Τεχνολογία Βάσεων Δεδομένων Εαρινό Εξάμηνο Διδάσκοντες: Απόστολος Παπαδόπουλος, Αναστάσιος Γούναρης Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή.
1 Διαχείριση Γνώσης Μ. Γεργατσούλης Χ. Παπαθεοδώρου.
ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΑΚΑΔΗΜΑΪΚΗ ΔΗΜΟΣΙΕΥΣΗ ΚΑΙ ΠΕΡΙΠΤΩΣΕΙΣ ΗΛΕΚΤΡΟΝΙΚΩΝ ΠΕΡΙΟΔΙΚΩΝ ΒΛΙΣΙΔΟΥ ΕΥΔΟΚΙΑ ΚΕΡΚΥΡΑ, ΙΟΥΝΗΣ 2006.
ΣΚΟΠΟΣ ΤΟΥ ΕΡΓΑΣΤΗΡΙΟΥ “Επιστημονική εργασία” Εύρεση πηγών Άξονες δομής επιστημονικού άρθρου (αναγνώριση) Κανόνες γραφής επιστημονικού άρθρου (αναγνώριση)
ΤΙΤΛΟΣ ΕΡΓΑΣΙΑΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ανδρέου Βασίλης.
Βάσεις Δεδομένων & Έμπειρα Συστήματα
Βάσεις Δεδομένων και Παγκόσμιος Ιστός
Μεταγράφημα παρουσίασης:

Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Πληροφορικής Ακαδημαϊκό Έτος Ανάκτηση Πληροφορίας Εισαγωγή

Τμήμα Πληροφορικής ΑΠΘ 2 Αντικείμενο IR Η Ανάκτηση Πληροφορίας (ΑΠ) (Information Retrieval - IR) μελετά προβλήματα που σχετίζονται με την: Αναπαράσταση Αποθήκευση Οργάνωση Προσπέλαση στοιχείων πληροφορίας (έγγραφα κειμένου, εικόνες, μουσικά αρχεία, βίντεο).

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 3 ΑΠ και ΒΔ  Οι περιοχή της Ανάκτησης Πληροφορίας (ΑΠ) έχει πολλά κοινά με την περιοχή των Βάσεων Δεδομένων (ΒΔ).  Οι δύο περιοχές για πολλά χρόνια εξελίσσονταν παράλληλα και έτσι η κάθε μία έχει αναπτύξει διαφορετικές τεχνικές.  Οι διαφορές οφείλονται στις διαφορές που έχουν τα δεδομένα και τα ερωτήματα.  Οι ερευνητές κατευθύνονται προς τη μελέτη συστημάτων που θα έχουν δυνατότητες ΣΔΒΔ και θα μπορούν να εκτελούν αποτελεσματικά και αποδοτικά τις λειτουργίες των συστημάτων ΑΠ.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 4 ΣΑΠ και ΣΔΒΔ ΧαρακτηριστικόΣΔΒΔΣΑΠ είδος δεδομένωναπολύτως δομημένααδόμητα, ημι-δομημένα τύπος δεδομένωναριθμητικά, αλφαριθμητικά έγγραφα (κειμένου) γλώσσα ερωτημάτωνSQL, QBEφυσική γλώσσα ερώτημασαφέςασαφές αποτελέσματαχωρίς βαθμολόγησηβαθμολογημένα

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 5 ΑΠ και ΒΔ κωδικόςόνομαδιάμετροςδορυφόροι 1Ερμής Αφροδίτη Γη Άρης Δίας Κρόνος Ουρανός Ποσειδώνας Πλούτωνας22743 SELECT όνομα FROM πλανήτες WHERE δορυφόροι = 0 OR δορυφόροι = 1 OR δορυφόροι = 2 Το ερώτημα είναι σαφές, προσδιορίζει επακριβώς τη συνθήκη που πρέπει να ικανοποιεί κάθε record που εμφανίζεται στην έξοδο. Ερώτημα SQL

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 6 ΑΠ και ΒΔ d 1 : Ο κομήτης του Χάλεϋ μας επισκέπτεται περίπου κάθε εβδομήντα έξι χρόνια. d 2 : Ο κομήτης του Χάλεϋ πήρε το όνομά του από τον αστρονόμo Έντμοντ Χάλεϋ. d 3 : Ένας κομήτης διαγράφει ελλειπτική τροχιά. d 4 : Ο πλανήτης Άρης έχει δύο φυσικούς δορυφόρους, το Δείμο και το Φόβο. d 5 : Ο πλανήτης Δίας έχει 63 γνωστούς φυσικούς δορυφόρους. d 6 : Ένας κομήτης έχει μικρότερη διάμετρο από ότι ένας πλανήτης. d 7 : Ο Άρης είναι ένας πλανήτης του ηλιακού μας συστήματος. Συλλογή εγγράφων Πληροφοριακή ανάγκη (ερώτημα): πληροφορίες για τον κομήτη του Χάλεϋ Διαισθητικά αντιλαμβανόμαστε ότι τα έγγραφα d1 και d2 σχετίζονται περισσότερο με το ερώτημα απ’ ότι τα υπόλοιπα έγγραφα.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 7 Αναζήτηση και Περιήγηση Αναζήτηση (Search) Η δυνατότητα εύρεσης πληροφορίας σχετική με την ερώτηση του χρήστη. Ο χρήστης εκφράζει την πληροφοριακή ανάγκη (ερώτημα) και το σύστημα επιστρέφει έγγραφα με μεγάλο βαθμό ομοιότητας ως προς το ερώτημα. Περιήγηση (Browsing) Η δυνατότητα μετακίνησης μεταξύ των αποτελεσμάτων ή όλων των εγγράφων της συλλογής (π.χ. Hypertext)

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 8 Αναζήτηση και Περιήγηση όροι αναζήτησης σχετικά έγγραφα περιήγηση έγγραφα που επιστρέφονται

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 9 Αναζήτηση Εγγράφων Η ανάκτηση εγγράφων τα οποία σχετίζονται με την ερώτηση του χρήστη, και η αποφυγή ανάκτησης εγγράφων που δε σχετίζονται με την ερώτηση του χρήστη. Τα τελικά αποτελέσματα ταξινομούνται ανάλογα με το ποσοστό συσχέτισης (relevance) δηλαδή το βαθμό ομοιότητας.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 10

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 11

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 12

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 13

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 14

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 15

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 16 Ταξινόμηση και Βαθμολόγηση Όταν ένας χρήστης υποβάλλει ένα ερώτημα σε ένα σύστημα ανάκτησης, το σύστημα επιστρέφει ένα σύνολο αποτελεσμάτων. Εάν η συλλογή κειμένων είναι μεγάλη, ενδέχεται και τα αποτελέσματα να είναι πολλά (π.χ. αναζήτηση σε μία μηχανή αναζήτησης). Επομένως, έχει μεγάλη σημασία η σειρά εμφάνισης των αποτελεσμάτων. Υπάρχουν τρεις μέθοδοι: Ταξινόμηση των αποτελεσμάτων π.χ. ως προς την ημερομηνία Βαθμολόγηση των αποτελεσμάτων ως προς την ομοιότητα με το ερώτημα. Βαθμολόγηση των αποτελεσμάτων ως προς τη σημαντικότητά τους

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 17 Χρήση Καταλόγων συλλογή εγγράφων Τα συστήματα ανάκτησης σπάνια αναζητούν την πληροφορία απευθείας στη συλλογή εγγράφων. Συνήθως, χρησιμοποιούνται κατάλογοι οι οποίοι επιταχύνουν τη διαδικασία αναζήτησης. δημιουργία καταλόγου αναζήτηση καταλόγου

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 18 Αναπαράσταση Εγγράφων 1.Πλήρες κείμενο 2.Απαλοιφή άρθρων και συνδέσμων 3.Απαλοιφή επιθέτων, ρημάτων, κλπ. 4.Άλλοι μετασχηματισμοί 5.Χαρακτηριστικές Λέξεις (Keywords) Πολλές φορές μας ενδιαφέρει και η δομή (structure) του κειμένου (π.χ. αναπαράσταση με XML)

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 19 Αναπαράσταση Εγγράφων document structure recognition accents spacing etc. stopwords noun groups stemming automatic or manual indexing structurefull textindex terms text + structure text

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 20 Δομή ενός ΣΑΠ

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 21 Περιστασιακή Αναζήτηση και Φιλτράρισμα Ένα ερώτημα μπορεί να ανήκει σε μία από δύο κατηγορίες. Η πρώτη κατηγορία αφορά σε ερωτήματα που εκτελούνται μία φορά, ενώ η δεύτερη κατηγορία αφορά σε ερωτήματα που εκτελούνται συνεχώς για κάποιο χρονικό διάστημα που συνήθως προσδιορίζεται από το χρήστη. Η πρώτη κατηγορία αναζήτησης καλείται περιστασιακή ή εξειδικευμένη (ad-hoc), ενώ η συνεχής επεξεργασία ενός ερωτήματος καλείται και φιλτράρισμα (filtering) ή δρομολόγηση (routing) των εγγράφων.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 22 Περιστασιακή Αναζήτηση

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 23 Φιλτράρισμα ή Δρομολόγηση

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 24 Χθες και Σήμερα Τα πρώτα διαθέσιμα συστήματα IR χρησιμοποιήθηκαν από βιβλιοθήκες για αναζήτηση βιβλίων με βάση τον τίτλο, το συγγραφέα, τον εκδοτικό οίκο, κλπ. Αργότερα, προστέθηκε η δυνατότητα να πραγματοποιείται ανάκτηση με βάση τίτλους κεφαλαίων, λέξεις κλειδιά και δυνατότητα επεξεργασίας πολύπλοκων ερωτήσεων (π.χ. AND, OR, NOT). Σήμερα η έρευνα και ανάπτυξη στο χώρο προσανατολίζεται σε πιο εξελιγμένα user interfaces, πιο γρήγορες μηχανές αναζήτησης, ανοιχτή αρχιτεκτονική.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 25 Ιστορική Αναδρομή ’s: –Αναζήτηση σε μικρές συλλογές κειμένων σχετικές με επιστημονικά άρθρα και νομικά κείμενα –Ανάπτυξη των βασικών μοντέλων boolean και vector. –Από τους σημαντικότερους ερευνητές στο χώρο είναι ο καθ. Salton και οι συνεργάτες του στο Πανεπιστήμιο Cornell.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 26 Ιστορική Αναδρομή 1980’s: –Ανάπτυξη μεγάλων συστημάτων ανάκτησης, πολλά από τα οποία διαχειρίζονται από εταιρίες: Lexis-Nexis Dialog MEDLINE

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 27 Ιστορική Αναδρομή 1990’s: –Αναζήτηση κειμένων στο Internet μέσω FTP Archie WAIS –Αναζήτηση στο World Wide Web Lycos Yahoo Altavista

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 28 Ιστορική Αναδρομή 1990’s συνέχεια: –Διαγωνισμοί NIST TREC –Recommender Systems Ringo Amazon NetPerceptions –Αυτόματη κατάταξη και ομαδοποίηση κειμένων

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 29 Ιστορική Αναδρομή 2000’s –Ανάλυση συνδέσμων (link analysis) Google –Αυτόματη εξαγωγή πληροφορίας Whizbang Fetch Burning Glass –Απάντηση ερωτήσεων (question answering) TREC Q/A track

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 30 Ιστορική Αναδρομή 2000’s συνέχεια: –Ανάκτηση πολυμεσικών δεδομένων (Multimedia IR) Image Video Audio and music –Cross-Language IR DARPA Tides –Document Summarization

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 31 Σύγχρονες Τάσεις  Παγκόσμιος Ιστός  Γεωγραφική Ανάκτηση Πληροφορίας  Πολυμεσικά Δεδομένα  Ολοκλήρωση Τεχνικών Ανάκτησης και Βάσεων Δεδομένων  Ομότιμα Συστήματα (P2P systems)

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 32 Περιεχόμενα Διαλέξεων Μοντέλα ανάκτησης πληροφορίας Προεπεξεργασία εγγράφων Αποτίμηση αποτελεσματικότητας συστημάτων Κατάλογοι για αποδοτική ανάκτηση Συμπίεση εγγράφων Επεξεργασία ερωτημάτων Ανάδραση σχετικότητας Παράλληλη και κατανεμημένη ανάκτηση Ανάκτηση πολυδιάστατων δεδομένων Ανάκτηση πληροφορίας στον παγκόσμιο ιστό Ειδικά θέματα

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 33 Συνέδρια  Text Retrieval Conference (TREC)  ACM Special Interest Group on Information Retrieval (SIGIR) Conference  European Conference on Information Retrieval (ECIR)  European Conference on Research and Advanced Technology for Digital Libraries (ECDL)  Joint Conference on Digital Libraries (JCDL)  ACM International Workshop on Multimedia Information Retrieval (MIR)  International Symposium on Music Information Retrieval (ISMIR), και άλλα. Ακόμη, πολλά από τα μεγάλα συνέδρια που αναφέρονται στη διαχείριση δεδομένων έχουν ειδικές συνεδρίες για την Ανάκτηση Πληροφορίας. Χαρακτηριστικά αναφέρουμε:  ACM Conference on Information and Knowledge Management (CIKM)  ACM Special Interest Group on Management of Data (SIGMOD) Conference  International Conference on Very Large Databases (VLDB).

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 34 Περιοδικά Τέλος, αναφέρουμε και επιστημονικά περιοδικά που εστιάζουν στην περιοχή:  ACM Transactions on Information Systems  Information Retrieval  Information Processing and Management  Information Systems  International Journal on Digital Libraries, και άλλα.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 35 Βιβλιογραφία - βιβλία  Manning, C.D. and Raghavan, P. and Schutze, H., "An Introduction to Information Retrieval", Cambridge University Press",  Baeza-Yates, R. and Ribeiro-Neto, B., "Modern Information Retrieval", Addison Wesley,  Witten, I.H and Moffat, A. and Bell, T.C., "Managing Gigabytes: Compressing and Indexing Documents and Images", Morgan Kaufmann,  Korfhage, R., "Information Storage and Retrieval", John Wiley & Sons,  Frakes, W.B. and Baeza-Yates (eds), "Information Retrieval: Data Structures and Algorithms", Prentice Hall, Englewood Cliffs, NJ,  van Rijsbergen, C.J., "Information Retrieval", Butterworths, 1979.

Ανάκτηση ΠληροφορίαςΤμήμα Πληροφορικής ΑΠΘ 36 Χρήσιμοι Ιστότοποι        