T OPICAL CRAWLING FOR BUSINESS INTELLIGENCE Θ ΕΜΑΤΙΚΟ C RAWLING ΓΙΑ ΤΙΣ ΕΠΙΧΕΙΡΗΣΙΑΚΕΣ ΟΝΤΟΤΗΤΕΣ Μάθημα: Ηλεκτρονική Δημοσίευση Διδάσκων: Καπιδάκης Σαράντος.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Πέτσας Δημήτριος Παρουσίαση στο μάθημα: Ψηφιακές Βιβλιοθήκες
Advertisements

ΔΙ.ΟΡΓΑΝΩ.ΣΗ Σύστημα ΔΙαχείρισης ΟΡΓΑΝΩσιακής ΓνώΣΗς για τις ελληνικές επιχειρήσεις. Μπίμπη Σταματία1 Σαμολαδάς Ιωάννης1 Σταμέλος Ιωάννης1 Κατσιαδάκης.
Ηλεκτρονική Δημοσίευση
ΑΞΙΟΠΟΙΗΣΗ – ΑΞΙΟΛΟΓΗΣΗ ΙΣΤΟΣΕΛΙΔΩΝ, ΙΣΤΟΧΩΡΩΝ ΚΑΙ ΠΥΛΩΝ
Πανελλήνιο Ψηφιακό Αποθετήριο Μαθησιακών Αντικειμένων
Αλέξανδρος Σαχινίδης, ΜΒΑ, Ph.D. ΙΟΥΝΙΟΣ 2009
Κίνητρα & Στόχοι εργασίας
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΜΑΘΗΜΑ : ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ.
Σχεδιαστικά εργαλεία Διαχείριση σελίδων Βιβλιοθήκες αντικειμένων Διαχείριση αντικειμένων Επιφάνεια ψηφιακής μελάνης Πληκτρολόγιο οθόνης ΟΦΕΛΗ Αναγνώριση.
Ημερίδα Χαροκοπείου Πανεπιστημίου με θέμα:
Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.
1 Μηχανές αναζήτησης στον Παγκόσμιο Ιστό Search Engines.
Ειδικά & Υβριδικά Εργαλεία Αναζήτησης. Εισαγωγή  Υπάρχει μια πλειάδα από ειδικά και υβριδικά εργαλεία αναζήτησης που αξίζουν ιδιαίτερης αναφοράς.  Αυτά.
Μεθοδολογία αναζήτησης. Χαρακτηριστικά των ερευνητών του διαδικτύου.
Οι ιστοσελίδες ως πηγές πληροφόρησης και η αξιοπιστία τους
Eyetracking III Μάθημα: Ηλεκτρονική Δημοσίευση Διδάσκοντες καθηγητές: Μ. Γεργατσούλης Σ. Καπιδάκης Παπαχριστόπουλος Λεωνίδας Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας.
Πνευματικό κέντρο Ερμουπόλεως Σύρου
Αρχειοθέτηση του Ιστού Nordic Web Archive Toolset Ηλεκτρονική δημοσίευση Διδάσκοντες : Σ. Καπιδάκης, Μ. Γεργατσούλης Μαρίνα Κομπολύτη Εαρινό εξάμηνο 2003/2004.
1 Συλλογικοί Κατάλογοι & Διαδίκτυο Μιχάλης Σφακάκης.
Εποπτεύων καθηγητής: Κος Σαράντος Καπιδάκης
Στο λειτουργικό σύστημα Windows, υπάρχουν εικονίδια (icons) τα οποία αναπαριστούν τις διάφορες οντότητες (φυλαγμένες πληροφορίες, προγράμματα που κάνουν.
ΕΠΙΜΕΛΕΙΑ ΕΡΓΑΣΙΑΣ: ΧΡΙΣΤΙΝΑ ΜΠΛΑΝΑ ΔΙΔΑΣΚΩΝ: ΣΑΡΑΝΤΟΣ ΚΑΠΙΔΑΚΗΣ ΕΞΑΜΗΝΟ: ΕΑΡΙΝΟ ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ- ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ.
Μοντέλο Διδασκαλίας Φυσικών Επιστήμων, για την Υποχρεωτική Εκπαίδευση, στην Κατεύθυνση της Ανάπτυξης Γνώσεων και Ικανοτήτων. Π. Κουμαράς.
Heal Link Η HEAL Link (Hellenic Academic Libraries Link) είναι ο Σύνδεσμος Ελληνικών Ακαδημαϊκών Βιβλιοθηκών και λειτουργεί υπό.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ- ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ ΕΞΑΜΗΝΟ ΣΤ’ Θέμα: Η Ψηφιακή Βιβλιοθήκη της Τζόρτζια (Digital.
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ Θέμα: Διοίκηση ανάπτυξης μη-κερδοσκοπικού ιστόπεδου (ιστόπεδου Δήμου Αγ.Παρασκευής)
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας: Διοίκηση & Οργάνωση Βιβλιοθηκών.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ –ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ : ΥΠΗΡΕΣΙΕΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΕ ΨΗΦΙΑΚΟ ΠΕΡΙΒΑΛΛΟΝ ΠΡΟΤΥΠΟ MPEG-4 ΕΠΙΒΛΕΠΩΝ.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΘΕΜΑ «ΤΟ ΕΘΝΙΚΟ ΚΕΝΤΡΟ ΤΕΚΜΗΡΙΩΣΗΣ» ΚΑΝΤΑΡΕΛΗ ΑΙΚΑΤΕΡΙΝΗ.
Λάζαρος Πολυμενάκος, καθηγητής ΑΙΤ Ηρακλής Καπρίτσας, telia.co.gr
η σημασία & ο ρόλος τους»
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΟΘΗΚΟΝΟΜΙΑΣ Αναζητώντας πρότυπα αλληλεπίδρασης χρηστών για ψηφιακές βιβλιοθήκες Εργασία στο Μάθημα: Ψηφιακές.
ΤΜΗΜΗ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ ΘΕΜΑ: iVia ΣΥΣΤΗΜΑ ΑΝΟΙΚΤΗΣ ΠΗΓΗΣ ΕΙΚΟΝΙΚΗΣ ΒΙΒΛΙΟΘΗΚΗΣ ΦΟΙΤΗΤΡΙΑ: ΜΩΡΑΪΤΗ.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ –ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ : ΥΠΗΡΕΣΙΕΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΕ ΨΗΦΙΑΚΟ ΠΕΡΙΒΑΛΛΟΝ ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ.
Για τη διδασκαλία των πολυμέσων1/18 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Ομάδα Ανάπτυξης Ομάδα Ανάπτυξης: Φίλιππος Δεληγιάννης, Παναγιώτης Κωστάκης, Δημήτριος Λαγός, Αναστάσιος.
1 Υπηρεσίες Πληροφόρησης σε Ψηφιακό Περιβάλλον Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας & Βιβλιοθηκονομίας, Κέρκυρα Ηλεκτρονική Δημοσίευση Θέμα: Τεχνολογίες.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας Υπηρεσίες Πληροφόρησης σε Ψηφιακό.
Μοντέλα Συστημάτων Παρουσιάσεις των συστημάτων των οποίων οι απαιτήσεις αναλύονται.
1 MedioVis- Ένας φυλλομετρητής μεταδεδομένων MedioVis – A user-centred Library Metadata Browser Μάθημα: Ψηφιακές Βιβλιοθήκες Διδάσκων: Καπιδάκης Σαράντος.
Οριζόντιο Έργο Υποστήριξης Σχολείων, Εκπαιδευτικών και Μαθητών στο Δρόμο για το ΨΗΦΙΑΚΟ ΣΧΟΛΕΙΟ, νέες υπηρεσίες Πανελλήνιου Σχολικού Δικτύου και Στήριξη.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ – ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ Εργασία 6ου εξαμήνου ΑΡΧΗ ΠΡΟΣΤΑΣΙΑΣ ΔΕΔΟΜΕΝΩΝ ΚΑΡΑΚΑΤΣΑΝΗΣ ΑΛΕΞΑΝΔΡΟΣ ΜΠΑΜΠΑΤΣΙΚΟΣ.
ΣΚΕΛΕΤΟΣ ΜΑΘΗΜΑΤΟΣ Παρουσίαση για το μάθημα “Στρατηγική και Οικονομική των Π.Σ.” Καραμιχάλη Ιφιγένεια Κολλιάρου Μαρία-Ελένη.
1 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη της Πληροφορίας "Διοίκηση & Οργάνωση.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ " Διοίκηση και Οργάνωση Βιβλιοθηκών.
Αυτόματη Ανάλυση & Οργάνωση Μουσικών Αρχείων Διδάσκων Καθηγητής: Καπιδάκης Σαράντος Σπουδαστής: Σιδέρης Νίκος Αθήνα2008.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ: «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΜΑΘΗΜΑ: ΗΛΕΚΤΡΟΝΙΚΗ ΔΗΜΟΣΙΕΥΣΗ ΕΡΓΑΣΙΑ: MULTI-DOCUMENT SUMMARIZATIONS.
Διερεύνηση γραφήματος. Ένας αλγόριθμος διερεύνησης γραφήματος επισκέπτεται τους κόμβους του γραφήματος με μια καθορισμένη στρατηγική, π.χ. κατά εύρος.
ΟΡΓΑΝΩΣΗ ΔΙΟΙΚΗΣΗ & ΑΞΙΟΛΟΓΗΣΗ ΤΩΝ ΨΗΦΙΑΚΩΝ ΒΙΒΛΙΟΘΗΚΩΝ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΥΠΗΡΕΣΙΕΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΕ.
ΜΑΘΗΜΑ: ΣΧΕΔΙΑΣΗ ΑΛΓΟΡΙΘΜΩΝ ΔΙΔΑΣΚΩΝ: Π. ΚΑΤΣΑΡΟΣ Πέμπτη, 2 Απριλίου 2015Πέμπτη, 2 Απριλίου 2015Πέμπτη, 2 Απριλίου 2015Πέμπτη, 2 Απριλίου 2015Τμ. Πληροφορικής,
1 Μελέτη κανόνων συμμετοχής σε ομότιμα δίκτυα επικοινωνίας μέσω προσομοίωσης Φοιτητής : Χρήστος Ι. Καρατζάς Επιβλέποντες Καθηγητές : Γ. Πολύζος – Κ. Κουρκουμπέτης.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΚΑΙ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΠΣ: «Επιστήμη Της Πληροφορίας: Διοίκηση Και Οργάνωση Βιβλιοθηκών Με Έμφαση Στις Νέες Τεχνολογίες.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΤΕΥΘΥΝΣΗ: «Διοίκησης και Οργάνωσης.
Tο project από τα μάτια των μαθητών  ΕΓΩ ΚΑΙ ΕΝΑ ΚΑΙΝΟΥΡΙΟ ΜΑΘΗΜΑ Tο σχολείο χώρισε τους μαθητές της Α’ Λυκείου σε 9 διαφορετικά project, ανάλογα με το.
ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΤΕΥΘΥΝΣΗ «Υπηρεσίες Πληροφόρησης σε Ψηφιακό Περιβάλλον» ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ « Ηλεκτρονική Δημοσίευση.
IΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ: «ΔΙΟΙΚΗΣΗ & ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΗΣ ΕΙΔΙΚΕΥΣΗΣ «ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» «Διοίκηση και Οργάνωση Βιβλιοθηκών.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Βρίσκοντας κατάλληλα αντικείμενα μάθησης:
DSpace:ένα ψηφιακό αποθετήριο ανοικτής πρόσβασης Φοιτήτρια : Νικολέττα Μπίζου Μάθημα: Ηλεκτρονική δημοσίευση Διδάσκοντες: Σαράντος Καπιδάκης Μανώλης Γεργατσούλης.
Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Εργασία στο υποχρεωτικό μάθημα του ΣΤ’εξαμήνου Θέμα: Oxford Digital Library.
CALIFORNIA DIGITAL LIBRARY CALIFORNIA DIGITAL LIBRARY ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ «ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ» ΣΤ΄ ΕΞΑΜΗΝΟ ΣΤ΄ ΕΞΑΜΗΝΟ Μαρία Καραδήμα Μαρία Καραδήμα.
Ηλεκτρονική Δημοσίευση The Goddard Library Web Capture Project Χριστιανούδης Ιωάννης Π.Μ.Σ. Κέρκυρας Μάιος 2005.
ΕΝΟΤΗΤΑ 3 – Κεφάλαιο 7: Υπηρεσίες Αναζήτησης στον Παγκόσμιο Ιστό Λέξεις Κλειδιά: Διεύθυνση Ιστοσελίδας (URL), Θεματικοί Κατάλογοι, Λέξεις Κλειδιά (Key.
Τμήμα Αρχειονομίας και Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Μεταπτυχιακό Πρόγραμμα στην Επιστήμη της Πληροφορίας Ψηφιακές Βιβλιοθήκες Διδάσκων: Σαράντος.
ΤΕΙ ΣΤΕΡΕΑΣ ΕΛΛΑΔΑΣ ΠΡΑΞΗ ΑΡΧΙΜΗΔΗΣ ΙΙΙ – ΤΕΙ ΛΑΜΙΑΣ.
Το Παιχνίδι των Ανοικτών Εκπαιδευτικών Πόρων. Επισκόπηση Φάση Α’: Αναζητώντας ΑΕΠ – Προετοιμασία – Παιχνίδι Αναζήτησης ΑΕΠ – Ανάδειξη νικητή Φάση Β’:
Διοίκηση ολοκληρωμένης επικοινωνιακής στρατηγικής
Γυμνάσιο Νέας Κυδωνίας
Που και πως ψάχνουμε.
ΑΞΙΟΠΟΙΗΣΗ – ΑΞΙΟΛΟΓΗΣΗ ΙΣΤΟΣΕΛΙΔΩΝ, ΙΣΤΟΧΩΡΩΝ ΚΑΙ ΠΥΛΩΝ
Οι ιστοσελίδες ως πηγές πληροφόρησης και η αξιοπιστία τους
Μεταγράφημα παρουσίασης:

T OPICAL CRAWLING FOR BUSINESS INTELLIGENCE Θ ΕΜΑΤΙΚΟ C RAWLING ΓΙΑ ΤΙΣ ΕΠΙΧΕΙΡΗΣΙΑΚΕΣ ΟΝΤΟΤΗΤΕΣ Μάθημα: Ηλεκτρονική Δημοσίευση Διδάσκων: Καπιδάκης Σαράντος Επιμέλεια: Σαββανή Λουίζα Κέρκυρα, 2007 ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ & ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ 1

Σ ΚΟΠΟΣ ΕΡΓΑΣΙΑΣ Να μελετήσει τη χρήση των θεματικών crawlers στη δημιουργία μικρών συλλογών εγγράφων που βοηθούν στην εύρεση επιχειρησιακών οντοτήτων η εύρεση τρόπων crawling και χτισίματος μιας μικρής και αποτελεσματικής συλλογής για την εύρεση επιχειρησιακών οντοτήτων Να μελετήσει και να αξιολογήσει τα αποτελέσματα 4 crawlers 2

B USINESS I NTELLIGENCE (BI) ένα δημοφιλές και δυνατό concept εφαρμογής πολλών τεχνολογιών μετατρέπει τα δεδομένα σε πληροφορία καλύπτει ένα ευρύ φάσμα των αναγκών των εταιρικών δεδομένων  Διαχείρηση προϋπολογισμού  Έξυπνες στρατηγικές 3

Μηχανές αναζήτησης  Περιορισμένο εύρος ζώνης  Περιορισμένη αποθήκευση  Περιορισμένοι υπολογιστικοί πόροι o Crawlers  Εξαγωγή κειμένου  Ευρετηρίαση  Αποφασίζουν για την καταλληλότητα των σελίδων  Είναι ιδανικοί για πολλές από τις εφαρμογές του Ιστού 4

C RAWLERS 1. Εξερευνούν τη δομή του ιστού για να ανακτήσουν καινούριες σελίδες, διασχίζοντας καινούρια links μέσω των προηγούμενων που έχουν ανακτήσει. 2. Όταν εξάγονται οι σελίδες, τα links τους προστίθενται σε μια λίστα με σελίδες τις οποίες δεν έχουν επισκεφθεί προηγουμένως 5

Θ ΕΜΑΤΙΚΟΙ C RAWLERS Καλύπτουν ειδικά θέματα σε μεγαλύτερο βάθος, τα οπόια ανανεώνονται συνεχώς καθώς κάθε crawler έχει μικρό τμήμα να καλύψει Αποτελούνται από έναν επιβλέποντα θεματικό ταξινομητή που ελέγχει την προτεραιότητα του link Στόχος: είναι να ξεκινήσει από κόμβους σχετικούς με το θέμα και να εξερευνήσει links ώστε να συλλέξει ιστοσελίδες για το θέμα 6

Τ Ο ΠΕΙΡΑΜΑ (1) Χρειάστηκε ένας αριθμός θεμάτων Χρειάστηκαν αντίστοιχες λίστες επιχειρήσεων Χρησιμοποίησαν τις ιεραρχικές κατηγορίες του Open Directory Project (ODP) 1. Οι σχεδιαστές βρήκαν κατηγορίες που τελειώνουν με μία από τις λέξεις: companies, consultants, manufacturers 2. συνέλεξαν μόνο τις κατηγορίες που έχουν πάνω από 20 URLs 3. προσπέρασαν τις κατηγορίες που είχαν σαν πρώτο επίπεδο ή σαν υποκατηγορία τις λέξεις «τοπικός», «κόσμος» ή «διεθνής». Βρέθηκαν 159 κατηγορίες. 4. χώρισαν τα URLs κάθε κατηγορίας σε 2 ομάδες: σε «σπόρους» (seeds) και σε «στόχους» (targets) 7

Τ Ο ΠΕΙΡΑΜΑ (2) 5. οι λέξεις-κλειδιά που καθοδηγούν τους crawlers δημιουργήθηκαν από την αλφαριθμητική αλληλουχία των συμβόλων στην ODP ιεραρχία 6. σε κάθε crawler έχει παραχθεί μια ομάδα λέξεων- κλειδιών και οι αντίστοιχοι «σπόροι» ώστε να ξεκινήσουν να ψάχνουν 7. κάθε crawler είναι ελεύθερος να βρει μέχρι σελίδες, ξεκινώντας από τους «σπόρους» 8. η διαδικασία επαναλαμβάνεται για κάθε ένα από τα 159 θέματα του πειράματος 9. σαν αποτέλεσμα μπορούν να υπάρξουν πάνω από ενάμιση εκατομμύριο σελίδες μόνο για τον ένα crawler 8

Ο Ι 4 C RAWLERS 1. Breadth-First crawler  αποτελεί τη βάση για τα πειράματα με τους crawlers  κάθε υπολογισμός του crawler συλλέγει τα URLs που βρίσκονται πρώτα στην ουρά  προσθέτει καινούρια URLs που δεν έχει επισκεφθεί στο πίσω μέρος της ουράς  προσθέτει URLs που δεν έχει επισκεφθεί στην ουρά μόνο όταν το μέγεθος τους είναι μικρότερο από το ανώτερο επιτρεπτό 2. Naive Best-First crawler  τοποθετεί σε σειρά προτεραιότητας τα links  βασίζεται στην ομοιότητα μεταξύ των ερωτημάτων και της σελίδας όπου βρέθηκε το link  προσθέτει τα URLs με σειρά προτεραιότητας στην ουρά του crawler  εισάγει τα URLs που δεν έχει επισκεφθεί ο crawler στις κατάλληλες θέσεις στην ουρά προτεραιότητας FIFO 9

3. DOM (Document Object Model) crawler  χρησιμοποιεί τη δομή μιας HTML ιστοσελίδας, δηλ. τη δενδροειδή παρουσίασή της  το ένα link συνδέεται με το άλλο  ό,τι υπάρχει στη δενδροειδή μορφή κάτω από το link είναι περιεχόμενό του  ο crawler υπολογίζει την ομοιότητα μεταξύ όλου του περιβάλλοντος και των δοθέντων λέξεων-κλειδιών και βάζει τις σελίδες με σειρά προτεραιότητας 4. Hub seeking crawler  είναι επέκταση του DOM crawler  εξερευνά μελλοντικούς διανομείς  τα URL’s κρίνονται σύμφωνα με το περιεχόμενο τους ότι είναι σχετικά με το θέμα  ο crawler καθορίζει ότι μία σελίδα που συνδέεται με πολλά από τα παραπάνω URL’s είναι ένας καλός διανομέας 10

Α ΠΟΔΟΣΗ ΤΩΝ CRAWLERS 1 ος ο Hub seeking crawler 2 ος ο DOM crawler 3 ος ο Naive Best-First crawler 4 ος ο Breadth-First crawler 11

Β ΕΛΤΙΩΣΗ ΤΗΣ ΑΠΟΔΟΣΗΣ χρήση της υπηρεσίας API του google εντοπισμός μέσω μιας μηχανής αναζήτησης καλών διανομέων ώστε να βελτιώσουν το crawling βρέθηκαν διανομείς μόνο για τα 94 από τα 159 θέματα πειράματος χρησιμοποίησαν τους διανομείς που βρήκαν για να φτιάξουν μια αυξανόμενη σειρά από «σπόρους», που χρησιμοποιούνται για να ξεκινήσει το crawling για κάθε ένα από τα 94 θέματα  σαν αποτέλεσμα, όλοι οι crawlers καλυτερεύουν την απόδοσή τους  και οι μηχανές αναζήτησης βοηθούν τους crawlers στο να κάνουν μια καλή αρχή που επηρεάζει τη συνολική τους απόδοση. 12

Σ ΥΜΠΕΡΑΣΜΑΤΑ η διαθεσιμότητα των «καλών» διανομέων κατά τη διάρκεια του crawling βελτιώνει την απόδοση των crawlers παρέχοντας διανομείς, οι μηχανές αναζήτησης βοηθούν τους crawlers στο να κάνουν μια καλή αρχή που επηρεάζει τη συνολική τους απόδοση 13

Σ ΧΕΤΙΚΕΣ ΕΡΕΥΝΕΣ πραγματοποιούνται εδώ και 15 περίπου χρόνια οι ερευνητές χρησιμοποιούν ποικίλες μετρήσεις για να κατανοήσουν την απόδοση των τοπικών crawlers μια μελέτη του Menczer κ. ά. πάνω στην αξιολόγηση τοπικών crawlers ερευνά τον αριθμό των τρόπων σύγκρισης διαφορετικών crawlers ένα πιο γενικό πλαίσιο για την αξιολόγηση τοπικών crawlers παρουσιάζεται από τον Srinivasan κ.ά 14

Ε ΥΧΑΡΙΣΤΩ ! 15