To διαδίκτυο ως πηγή πληροφοριών Ανδρέας Βέγλης
Εξέλιξη του WWW Το World Wide Web η πιο γρήγορα αναπτυσσόμενη υπηρεσία του διαδικτύου. ύπαρξη παγκοσμίως αρκετών εκατοντάδων εκατομμυρίων ιστοσελίδων. τεράστιος όγκος πληροφοριών + αναρχία που επικρατεί στο διαδίκτυο μηχανισμός αναζήτησης ιστοσελίδων Το World Wide Web είναι η πιο γρήγορα αναπτυσσόμενη υπηρεσία του διαδικτύου. Αυτό έχει ως αποτέλεσμα την ύπαρξη παγκοσμίως αρκετών εκατοντάδων εκατομμυρίων ιστοσελίδων. Ο τεράστιος όγκος πληροφοριών σε συνδυασμό με την αναρχία που επικρατεί στο διαδίκτυο δημιούργησαν την επιτακτική ανάγκη για την ύπαρξη ενός μηχανισμού που θα επιτρέπει στον χρήστη να αναζητάει και να βρίσκει ιστοσελίδες με τα θέματα που τον ενδιαφέρουν.
Αράχνες Προγράμματα που ερευνούν συστηματικά το διαδίκτυο για ιστοσελίδες εξερευνώντας όλες τις συνδέσεις από ένα δικτυακό τόπο εκκίνησης, που περιλαμβάνει πολλές συνδέσεις με άλλες ιστοσελίδες. Η ιδέα = κάθε ιστοσελίδα πρέπει να συνδέεται με κάποια άλλη. Αυτά τα προγράμματα ερευνούν συστηματικά το διαδίκτυο για ιστοσελίδες εξερευνώντας όλες τις συνδέσεις από ένα δικτυακό τόπο εκκίνησης, που περιλαμβάνει πολλές συνδέσεις με άλλες ιστοσελίδες. Η ιδέα ήταν ότι εξ ορισμού κάθε ιστοσελίδα πρέπει να συνδέεται με κάποια άλλη. Ερευνώντας ένα μεγάλο αριθμό ιστοσελίδων και ακολουθώντας όλες τις συνδέσεις, ένας χρήστης θα ανακαλύψει νέες ιστοσελίδες που περιλαμβάνουν άλλες συνδέσεις. Η ιδέα είναι ότι το μεγαλύτερο τμήμα του διαδικτύου μπορεί να εξερευνηθεί επαναλαμβάνοντας την παραπάνω διαδικασία.
Αντιδράσεις Πολλές αντιδράσεις Τεράστια κίνηση στο δίκτυο Οι περισσότεροι διαχειριστές τα αντιμετώπιζαν εχθρικά Οι προγραμματιστές δημιουργούσαν όλο και περισσότερες αράχνες. Έως το Δεκέμβριο του 1993 είχαν εμφανιστεί τρεις μηχανές αναζήτησης που χρησιμοποιούσαν αράχνες: JumpStation, the world Wide Web Worm, Repository Software Engineering (RBSE) spider. Αυτή διαδικασία προκάλεσε πολλές αντιδράσεις καθώς ορισμένες όχι σωστά προγραμματισμένες αράχνες προκαλούσαν τεράστια κίνηση στο δίκτυο επειδή επισκέπτονταν πολλές φορές τις ίδιες ιστοσελίδες. Οι περισσότεροι διαχειριστές τα αντιμετώπιζαν εχθρικά και οι προγραμματιστές δημιουργούσαν όλο και περισσότερες αράχνες. Έως το Δεκέμβριο του 1993 είχαν εμφανιστεί τρεις μηχανές αναζήτησης που χρησιμοποιούσαν αράχνες: JumpStation, the world Wide Web Worm, Repository Software Engineering (RBSE) spider.
Google (1/2) Το 1995 Sergey Brin και Larry Page υποψήφιοι διδάκτορες της Επιστήμης των Υπολογιστών στο πανεπιστήμιο Stanford αναπτύσουν νέα τεχνολογία αναζήτησης To 1997 δημιούργησαν τη μηχανή αναζήτησης BackRub που ήταν ο πρόγονος του Google.
Google (2/2) To 1998 ξεκινούν το Google. 10.000 αιτήσεις για αναζήτηση κάθε μέρα. Το 1999 η μηχανή αναζήτησης δεχόταν πλέον 3 εκατομμύρια αιτήσεις για αναζήτηση κάθε μέρα. Το 2000 οι αιτήσεις έφταναν πλέον τα 60 εκατομμύρια ενώ το ευρετήριο του περιελάμβανε 1,3 δισεκατομμύρια ιστοσελίδες. Το 2001 οι αιτήσεις ανέρχονταν σε 100 εκατομμύρια ενώ το ευρετήριο της μηχανής περιελάμβανε πλέον ιστοσελίδες σε 40 διαφορετικές γλώσσες, μεταξύ των οποίων και τα ελληνικά. Ξεκίνησε η δυνατότητα αναζήτησης γραφικών. To 1998 σταματούν τις σπουδές τους και με ένα εκατομμύριο δολάρια ξεκινούν το Google. Η εταιρία διέθετε τέσσερις υπαλλήλους. Ο Google δεχόταν 10.000 αιτήσεις για αναζήτηση κάθε μέρα. Το PC Magazine είχε συμπεριλάβει το Google (που ήταν ακόμη σε δοκιμαστική λειτουργία) στις κορυφαίες 100 μηχανές αναζήτησης για το 1998. Το 1999 η μηχανή αναζήτησης δεχόταν πλέον 3 εκατομμύρια αιτήσεις για αναζήτηση κάθε μέρα. Το 2000 οι αιτήσεις έφταναν πλέον τα 60 εκατομμύρια ενώ το ευρετήριο του περιελάμβανε 1,3 δισεκατομμύρια ιστοσελίδες. Το 2001 οι αιτήσεις ανέρχονταν σε 100 εκατομμύρια ενώ το ευρετήριο της μηχανής περιελάμβανε πλέον ιστοσελίδες σε 40 διαφορετικές γλώσσες, μεταξύ των οποίων και τα ελληνικά. Επίσης της ίδια χρονιά ξεκίνησε η δυνατότητα αναζήτησης γραφικών.
Αναζήτηση & πλοήγηση Δύο μέθοδοι εύρεσης πληροφοριών. Πλοήγηση: ο χρήστης ακολουθεί ένα μονοπάτι υπερ-συνδέσεων μεταξύ διαφορετικών ιστοσελίδων. Αναζήτηση: ειδικό λογισμικό ταιριάζει τις λέξεις που εισάγει ο χρήστης με σχετικά έγγραφα στο διαδίκτυο.
Πλοήγηση Κατάλληλη όταν το διαδίκτυο ήταν σχετικά μικρό Κατάλληλη όταν το διαδίκτυο ήταν σχετικά μικρό Σήμερα χρονοβόρο Μικρή πιθανότητα εύρεσης των πληροφοριών
Μηχανές αναζήτησης & Θεματικοί κατάλογοι Οι μηχανές αναζήτησης συλλέγουν μόνες τους πληροφορίες από το διαδίκτυο. Διαθέτουν τεράστια ευρετήρια με τακτική ανανέωση χωρίς την παρέμβαση ανθρώπου. Οι θεματικοί κατάλογοι επιτρέπουν την καταχώριση ιστοσελίδων από ανθρώπους. Διαθέτουν πολύ καλή οργάνωση αλλά αρκετά λιγότερο υλικό από τις μηχανές αναζήτησης.
Μηχανές αναζήτησης & Θεματικοί κατάλογοι
Μηχανές αναζήτησης και θεματικοί κατάλογοι Οι θεματικοί κατάλογοι προσφέρουν ένα πλαίσιο βασισμένο στο περιεχόμενο για δομημένη πλοήγηση Οι μηχανές αναζήτησης επιτρέπουν την αναζήτηση για καθορισμένες από το χρήστη λέξεις κλειδιά ή φράσεις. θεματικός κατάλογος - περιεχόμενα ενός βιβλίου Μηχανή αναζήτησης - ευρετήριο.
Δομή κατηγοριών θεματικού καταλόγου Κατηγορία υποκατηγορία
Ευρετήριο μηχανής αναζήτησης γάτα υπολογιστής πλανήτης 3,4;9,2;1,2.. 2,4;14,2;7,3.. 8,4;19,1;6,2.. λέξη κλειδί έγγραφο, θέση
Ορισμός μηχανής αναζήτησης Είναι προγράμματα που επιτρέπουν την αναζήτηση με λέξεις-κλειδιά (keywords) σε τεράστιες βάσεις δεδομένων αρχείων του διαδικτύου. Οι βάσεις δεδομένων περιέχουν αντίγραφα εκατομμυρίων ιστοσελίδων του World Wide Web που συλλέγονται αυτόματα από ειδικά προγράμματα, τα οποία μπορεί να έχουν διάφορες ονομασίες (spider, crawler, robot κλπ.), αλλά εκτελούν ουσιαστικά την ίδια εργασία. Από τον τίτλο τους, το πλήρες κείμενο, το μέγεθος, το URL, κ.λ.π. δημιουργείται ένα ευρετήριο. Οι μηχανές αναζήτησης είναι προγράμματα που επιτρέπουν την αναζήτηση με λέξεις-κλειδιά (keywords) σε τεράστιες βάσεις δεδομένων αρχείων του διαδικτύου. Αυτές οι βάσεις δεδομένων περιέχουν αντίγραφα εκατομμυρίων ιστοσελίδων του World Wide Web που συλλέγονται αυτόματα από ειδικά προγράμματα, τα οποία μπορεί να έχουν διάφορες ονομασίες (spider, crawler, robot κλπ.), αλλά εκτελούν ουσιαστικά την ίδια εργασία. Από τα αρχεία που συγκεντρώνονται και ειδικότερα από τον τίτλο τους, το πλήρες κείμενο, το μέγεθος, το URL, κ.λ.π. δημιουργείται ένα ευρετήριο.
Μέρη μηχανής αναζήτησης Spider (ή Crawler ή Robot κλπ.) Ευρετήριο (Index) Μηχανισμό αναζήτησης Spider (ή Crawler ή Robot κλπ.): ένα ειδικό αυτόματο πρόγραμμα που επισκέπτεται ιστοσελίδες, τις «διαβάζει» και έπειτα ακολουθεί τις υπερσυνδέσεις (hyperlinks) των ιστοσελίδων αυτών προς άλλες ιστοσελίδες. Ευρετήριο (Index): μία τεράστια βάση δεδομένων που περιέχει αντίγραφα όλων των ιστοσελίδων που επισκέφτηκε και «διάβασε» ο spider. Μηχανισμό αναζήτησης: το πρόγραμμα που ερευνάει το ευρετήριο για να βρει ιστοσελίδες που ταιριάζουν στις λέξεις-κλειδιά της αναζήτησης που έθεσε ο χρήστης.
Λειτουργία μηχανής αναζήτησης
Τρόπος λειτουργίας μηχανής αναζήτησης Διαθέτουν τον δικό τους δικτυακό τόπο στο διαδίκτυο. Ο χρήστης πληκτρολογεί τις λέξεις-κλειδιά Η μηχανή αναζήτησης επιστρέφει τα αποτελέσματα: Οι μηχανές αναζήτησης διαθέτουν τον δικό τους δικτυακό τόπο στο διαδίκτυο. Σε ειδικά πεδία (search forms) ο χρήστης μπορεί να πληκτρολογεί τις λέξεις-κλειδιά προς αναζήτηση και η μηχανή αναζήτησης επιστρέφει τα αποτελέσματα: τους τίτλους ιστοσελίδων, συνήθως με ένα μικρό απόσπασμα του κειμένου της ιστοσελίδας (ή σπανιότερα μία μικρή περιγραφή), καθώς και με μία υπερσύνδεση που οδηγεί σε αυτήν.
Κόστος Συνεχή αύξηση της υπολογιστικής ισχύος Τακτική αναβάθμιση του εύρους των συνδέσεων της με το διαδίκτυο. Χώρος αποθήκευσης ιστοσελίδων Κόστος του μηχανισμού αναζήτησης Κόστος της αράχνης Συνεχή αύξηση της υπολογιστικής ισχύος ώστε να μπορεί να καλύπτει την εκρηκτική ανάπτυξη του WWW. Τακτική αναβάθμιση του εύρους των συνδέσεων της με το διαδίκτυο. Κάθε ιστοσελίδα που κατεβαίνει και αποθηκεύεται στη βάση δεδομένων της μηχανής αναζήτησης έχει κάποιο κόστος. Κόστος του μηχανισμού αναζήτησης, αλλά γενικά το κόστος της αράχνης είναι το πιο σημαντικό στη λειτουργία μίας μηχανής αναζήτησης.
Τρόποι περιορισμού κόστους Περιορισμός του συνολικού αριθμού των ιστοσελίδων στο ευρετήριό τους. Περιορισμός της συχνότητας των επισκέψεων στις ίδιες σελίδες Περιορισμός της αράχνης σε ορισμένες περιοχές του διαδικτύου Περιορισμός του συνολικού αριθμού των ιστοσελίδων στο ευρετήριό τους, διαγράφοντας κάθε φορά τις πιο παλιές (χρονολογικά) ιστοσελίδες όταν ανακαλύπτουν νέες. Περιορισμός της συχνότητας των επισκέψεων στις ίδιες σελίδες και αυτό έχει σαν αποτέλεσμα το ευρετήριο να περιλαμβάνει ιστοσελίδες που δεν υπάρχουν πλέον ή έχουν τροποποιηθεί. Περιορισμός της αράχνης σε ορισμένες περιοχές του διαδικτύου που πιστεύουν ότι περιέχουν αξιόπιστες πληροφορίες.
Αποτελέσματα των περιορισμών Ιστοσελίδες που θα μπορούσαν να περιληφθούν στο ευρετήριο αγνοούνται. Το WWW περιλαμβάνει μεγάλο όγκο πολλαπλών ιστοσελίδων με το ίδιο περιεχόμενο καθώς και ιστοσελίδες με κακόβουλο περιεχόμενο. Εξισορρόπηση μεταξύ της απόρριψης προβληματικών ιστοσελίδων και της βεβαιότητας ότι όλες οι ιστοσελίδες με κατάλληλο υλικό θα ανεβρεθούν σε μία αναζήτηση Καμία μηχανή δε θα μπορέσει ποτέ να καταγράψει πλήρως το διαδίκτυο.
Χρόνος καταχώρισης ιστοσελίδας Μεσολαβεί συνήθως κάποιο χρονικό διάστημα από τη στιγμή που δημοσιευτεί μία ιστοσελίδα στο διαδίκτυο, έως ότου η αράχνη την ανακαλύψει. Μεσολαβεί κάποιο χρονικό διάστημα από τη στιγμή που η αράχνη ανακαλύψει για πρώτη φορά μία ιστοσελίδα, έως ότου την επισκεφτεί ξανά αναζητώντας τυχόν νέο περιεχόμενο.
Απαιτήσεις και προσόντα χρήστη Υπερβολικές προσδοκίες από τις ικανότητες των μηχανών αναζήτησης καθώς και από τις πληροφορίες που περιλαμβάνουν. Χρήση μόνο λίγων λέξεων κλειδιών σε μία αναζήτηση. Στατιστικά η πλειοψηφία των χρηστών εκτελεί δύο ή τρεις αναζητήσεις με λέξεις κλειδιά. Σπάνια χρησιμοποιούνται τα ειδικά χαρακτηριστικά περιορισμού και ελέγχου των αποτελεσμάτων, που προσφέρουν όλες οι μηχανές αναζήτησης.
Τεχνικές μηχανών αναζήτησης Σύνολο από προκαθορισμένα από πριν αποτελέσματα για τις πιο δημοφιλείς αναζητήσεις. Ρύθμιση/Ταξινόμηση των αποτελεσμάτων έτσι ώστε οι πιο δημοφιλείς ιστοσελίδες να εμφανίζονται στην κορυφή των αποτελεσμάτων της μηχανής. Σε περίπτωση που ο χρήστης ασχοληθεί συστηματικά με τον τρόπο λειτουργίας των μηχανών αναζήτησης και μάθει να χρησιμοποιεί όλα τα χαρακτηριστικά τους, τα αποτελέσματα των αναζητήσεων του θα βελτιωθούν θεαματικά.
Γρήγορα – σωστά αποτελέσματα. Όλοι οι χρήστες περιμένουν αστραπιαία απόκριση από τις μηχανές αναζήτησης. Για να ικανοποιήσουν αυτή την απαίτηση οι μηχανές αναζήτησης σπάνια επιτελούν ακριβή ανάλυση των αποτελεσμάτων που δίδουν. Αυτό έχει σαν αποτέλεσμα περικοπή και παράλειψη πολλές φορές, σημαντικών αποτελεσμάτων. Οι αυξήσεις όμως στην υπολογιστική ισχύ των μηχανών αναζήτησης καθώς και της ταχύτητας σύνδεσης τους με το διαδίκτυο, επιτρέπουν τις μηχανές αναζήτησης να χρησιμοποιούν πιο αποδοτικές τεχνικές χωρίς να θυσιάζουν την ταχύτητα παράδοσης των αποτελεσμάτων τους.
Κατηγοριοποίηση υπηρεσιών αναζήτησης Με κριτήριο τον τρόπο παρουσίασης των αποτελεσμάτων, οι υπηρεσίες αναζήτησης διακρίνονται σε: Μηχανές αναζήτησης πρώτης γενεάς Μηχανές αναζήτησης δεύτερης γενεάς Μηχανές αναζήτησης πρώτης γενεάς: Είναι οι μηχανές οι οποίες παραθέτουν τα αποτελέσματα ιεραρχημένα σύμφωνα με το ποσοστό συνάφειας των αποτελεσμάτων σε σχέση με τους όρους της έρευνας. Μηχανές αναζήτησης δεύτερης γενεάς: Είναι οι μηχανές οι οποίες μπορούν να παρουσιάσουν ή να ιεραρχήσουν τα αποτελέσματα με ποικίλους και πολλές φορές ιδιαίτερα καινοτόμους τρόπους.
Τρόποι ιεράρχησης αποτελεσμάτων στις μηχανές αναζήτησης δεύτερης γενεάς Να ομαδοποιήσουν τα αποτελέσματα σύμφωνα με το περιεχόμενο των δικτυακών τόπων. Να ιεραρχήσουν τα αποτελέσματα σύμφωνα με τη δημοτικότητα των τόπων. Να ομαδοποιήσουν τις ιστοσελίδες κάτω από την αρχική ιστοσελίδα ενός δικτυακού τόπου. Να ιεραρχήσουν τα αποτελέσματα σύμφωνα με το είδος ή τον τύπο των τεκμηρίων. Να δεχθούν ερωτήσεις σε φυσική γλώσσα και να δώσουν σαν αποτέλεσμα έτοιμες εκ των προτέρων απαντήσεις.
Διευθύνσεις μηχανών αναζήτησης 1ης γενεάς Alta Vista http://www.altavista.com Excite http://www.excite.com Lycos http://www.lycos.com 2ης γενεάς Google http://www.google.com Ask http://www.ask.com
Κριτήρια ιεράρχησης αποτελεσμάτων σε μηχανή αναζήτησης (1/3) Ιεραρχούν τα αποτελέσματα υπολογίζοντας την συνάφεια, το ποσοστό δηλαδή που δείχνει πόσο σχετικό είναι το περιεχόμενο μιας ιστοσελίδας με τις λέξεις-κλειδιά της αναζήτησης, ακολουθώντας μία σειρά από κανόνες, γνωστούς ως αλγόριθμους. Σε αντίθεση με τους ανθρώπους οι μηχανές αναζήτησης δεν διαθέτουν κρίση ή εμπειρία στην οποία να στηριχτούν για την ιεράρχηση των αποτελεσμάτων μιας αναζήτησης.
Κριτήρια ιεράρχησης αποτελεσμάτων σε μηχανή αναζήτησης (2/3) Να περιέχουν τον όρο της αναζήτησης στον τίτλο, στην πρώτη επικεφαλίδα ή στις πρώτες παραγράφους κειμένου. Συχνότητα με την οποία εμφανίζονται οι όροι της αναζήτησης σε μία ιστοσελίδα σε σχέση με άλλες λέξεις. Τα meta tags (εντολές της γλώσσας προγραμματισμού HTML) δεν εξασφαλίζουν μια υψηλή θέση στην ιεράρχηση των αποτελεσμάτων. Πιο σχετικές θεωρούνται οι ιστοσελίδες που περιέχουν τον όρο της αναζήτησης στον τίτλο, στην πρώτη επικεφαλίδα ή στις πρώτες παραγράφους κειμένου. Μεγάλη σημασία έχει η συχνότητα με την οποία εμφανίζονται οι όροι της αναζήτησης σε μία ιστοσελίδα σε σχέση με άλλες λέξεις. Τα meta tags (εντολές της γλώσσας προγραμματισμού HTML) δεν εξασφαλίζουν μια υψηλή θέση στην ιεράρχηση των αποτελεσμάτων. Υπάρχουν μάλιστα μηχανές αναζήτησης που δεν τα «διαβάζουν» καν. Ακόμη και από αυτές που το κάνουν, δεν τους δίνουν όλες την ίδια βαρύτητα.
Κριτήρια ιεράρχησης αποτελεσμάτων σε μηχανή αναζήτησης (3/3) Αναλύοντας πως οι ιστοσελίδες συνδέονται μεταξύ τους, η μηχανή αναζήτησης μπορεί να προσδιορίσει το θέμα μιας σελίδας και πόσο σημαντική θεωρείται. Δημοτικότητα ιστοσελίδας. Σημαντικό ρόλο παίζει η ανάλυση υπερσυνδέσεων. Αναλύοντας πως οι ιστοσελίδες συνδέονται μεταξύ τους, η μηχανή αναζήτησης μπορεί να προσδιορίσει το θέμα μιας σελίδας και πόσο σημαντική θεωρείται. Άλλο κριτήριο είναι η δημοτικότητα μιας ιστοσελίδας, δηλαδή πόσες επισκέψεις δέχεται μία ιστοσελίδα για μία συγκεκριμένη αναζήτηση.
Τύποι αρχείων Σημαντική βοήθεια στη μείωση του αριθμού των αποτελεσμάτων που δίνει μία μηχανή αναζήτησης είναι ο περιορισμός των τύπων των αρχείων καθώς και της γλώσσας.
Περιορισμός γλώσσας Ο περιορισμός της γλώσσας είναι επίσης μία πολύ σημαντική παράμετρος, ειδικά όταν οι λέξεις κλειδιά που εισάγουμε είναι αγγλικές. Ο περιορισμός για αναζητήσεις μόνο σε αρχεία στα αγγλικά οδηγεί στο σημαντικό περιορισμό των αποτελεσμάτων, καθώς απορρίπτονται αρχεία σε διαφορετική γλώσσα που περιλαμβάνουν τις λέξεις κλειδιά.
Χρήση τελεστών Επιλογή των σωστών όρων σε μία αναζήτηση. Επιλογή των σωστών όρων σε μία αναζήτηση. Η λογική των τελεστών (Boolean logic) Εξίσου σημαντική με την επιλογή των σωστών όρων σε μία αναζήτηση είναι και ο σωστός συνδυασμός τους, που μπορεί να αυξήσει κατακόρυφα την αποτελεσματικότητα μιας αναζήτησης. Η λογική των τελεστών (Boolean logic) είναι μία μέθοδος που επιτρέπει τον συνδυασμό όρων σε μία αναζήτηση, χρησιμοποιώντας λογικές πράξεις με τελεστές τις λέξεις AND, OR, NOT και NEAR.
Τελεστές Η λογική τελεστών χρησιμοποιείται για την κατασκευή ερωτημάτων αναζήτησης με τη βοήθεια των λογικών τελεστών, με αυστηρά προκαθορισμένη σύνταξη.
Τελεστές Boolean Τελεστής Boolean and Οδηγεί στην ανάκτηση μόνο ιστοσελίδων που περιέχουν όλους τους όρους της αναζήτησης. Ακριβείς αναζητήσεις Μειώνει σημαντικά τον αριθμό των αποτελεσμάτων που πρέπει να ερευνήσει ο χρήστης. Μερικές μηχανές δεν δέχονται τον τελεστή and, αλλά επιτρέπουν την χρήση του λογικού συμβόλου + που ισοδυναμεί με το and. Συγκεκριμένες μηχανές τον δέχονται μόνο όταν είναι γραμμένος με κεφαλαία γράμματα. Η χρήση του τελεστή and σε έναν συνδυασμό λέξεων οδηγεί στην ανάκτηση μόνο ιστοσελίδων που περιέχουν όλους τους όρους της αναζήτησης. Αυτό επιτρέπει να διενεργούνται ακριβείς αναζητήσεις, ενώ παράλληλα μειώνει σημαντικά τον αριθμό των αποτελεσμάτων που πρέπει να ερευνήσει ο χρήστης. Μερικές μηχανές δεν δέχονται τον τελεστή and, αλλά επιτρέπουν την χρήση του λογικού συμβόλου + που ισοδυναμεί με το and. Υπάρχουν μηχανές που δέχονται και τα δύο, ενώ άλλες απαιτούν την χρήση του τελεστή and. Συγκεκριμένες μηχανές τον δέχονται μόνο όταν είναι γραμμένος με κεφαλαία γράμματα.
Παράδειγμα χρήσης του τελεστή AND
Περιορισμός αποτελεσμάτων με τον τελεστή AND
Τελεστής Boolean or Οδηγεί στην ανάκτηση ιστοσελίδων που περιέχουν οποιονδήποτε από τους όρους της αναζήτησης. μεγάλο αριθμό αποτελεσμάτων. συνίσταται μόνο στην αναζήτηση συνώνυμων όρων Πολλές μηχανές πραγματοποιούν μία τέτοια αναζήτηση όταν ο χρήστης αφήνει κενά ανάμεσα στις λέξεις, ενώ άλλες απαιτούν την χρήση του τελεστή or. Συγκεκριμένες μηχανές πάλι τον δέχονται μόνο όταν είναι γραμμένος με κεφαλαία γράμματα. Η χρήση του τελεστή or σε έναν συνδυασμό λέξεων οδηγεί στην ανάκτηση ιστοσελίδων που περιέχουν οποιονδήποτε από τους όρους της αναζήτησης. Βέβαια, αυτό οδηγεί σε έναν μεγάλο αριθμό αποτελεσμάτων. Για το λόγο αυτό η χρήση του τελεστή or συνίσταται μόνο στην αναζήτηση συνώνυμων όρων, στην περίπτωση δηλαδή που αυτό που ζητάει ο χρήστης μπορεί να εμφανίζεται στις ιστοσελίδες με διάφορες ονομασίες. Πολλές μηχανές πραγματοποιούν μία τέτοια αναζήτηση όταν ο χρήστης αφήνει κενά ανάμεσα στις λέξεις, ενώ άλλες απαιτούν την χρήση του τελεστή or. Συγκεκριμένες μηχανές πάλι τον δέχονται μόνο όταν είναι γραμμένος με κεφαλαία γράμματα. Απαιτείται προσοχή βέβαια, γιατί υπάρχουν και μηχανές αναζήτησης που αντιλαμβάνονται το κενό ανάμεσα στις λέξεις ως τον τελεστή and.
Παράδειγμα χρήσης του τελεστή OR
Αύξηση αποτελεσμάτων με τον τελεστή OR
Τελεστής Boolean not Οδηγεί στην ανάκτηση ιστοσελίδων που περιέχουν έναν συγκεκριμένο όρο, αλλά δεν περιέχουν κάποιες άλλες λέξεις που επιλέγει ο χρήστης. Βοηθάει στον περιορισμό των αποτελεσμάτων, αποκλείοντας κάποιους όρους που διευρύνουν πολύ το πεδίο της αναζήτησης Μπορεί να οδηγήσει στον αποκλεισμό ορισμένων χρήσιμων για τον χρήστη ιστοσελίδων. Η χρήση του τελεστή not σε έναν συνδυασμό λέξεων οδηγεί στην ανάκτηση ιστοσελίδων που περιέχουν έναν συγκεκριμένο όρο, αλλά δεν περιέχουν κάποιες άλλες λέξεις που επιλέγει ο χρήστης. Ο τελεστής not βοηθάει στον περιορισμό των αποτελεσμάτων, αποκλείοντας κάποιους όρους που διευρύνουν πολύ το πεδίο της αναζήτησης, αποτελεί ωστόσο δίκοπο μαχαίρι, γιατί μπορεί να οδηγήσει στον αποκλεισμό ορισμένων χρήσιμων για τον χρήστη ιστοσελίδων. Μερικές μηχανές δεν δέχονται τον τελεστή not, αλλά επιτρέπουν την χρήση του λογικού συμβόλου - που ισοδυναμεί με το not. Υπάρχουν μηχανές που δέχονται και τα δύο, ενώ άλλες απαιτούν την χρήση του τελεστή not. Συγκεκριμένες μηχανές πάλι τον δέχονται μόνο όταν είναι γραμμένος με κεφαλαία γράμματα.
Παράδειγμα χρήσης του τελεστή NOT
Μείωση αποτελεσμάτων με τον τελεστή ΝΟΤ
Επισημάνσεις για την αποτελεσματική χρήση των μηχανών αναζήτησης (1/8) πολλές υπερσυνδέσεις οδηγούν στις ίδιες ιστοσελίδες που έχει ήδη επισκεφτεί ο spider υπάρχουν ιστοσελίδες στις οποίες δεν έχουν πρόσβαση οι spiders, καθώς δεν είναι συνδεδεμένες με άλλες ιστοσελίδες υπάρχουν δικτυακοί τόποι και βάσεις δεδομένων στο διαδίκτυο που δεν επιτρέπουν την πρόσβαση σε μηχανές αναζήτησης.
Επισημάνσεις για την αποτελεσματική χρήση των μηχανών αναζήτησης (2/8) Η μεγαλύτερη μηχανή αναζήτησης καλύπτει μόλις το ένα τρίτο του World Wide Web. Το σύνολο των μηχανών αναζήτησης καλύπτει ένα μεγαλύτερο ποσοστό Προτείνεται στον χρήστη η πραγματοποίηση της ίδιας αναζήτησης σε περισσότερες μηχανές. Σύμφωνα με μελέτες ακόμη και η μεγαλύτερη μηχανή αναζήτησης καλύπτει μόλις το ένα τρίτο του World Wide Web. Βέβαια, το σύνολο των μηχανών αναζήτησης καλύπτει ένα μεγαλύτερο ποσοστό, καθώς κάποιες μηχανές έχουν στο ευρετήριό τους ιστοσελίδες που δεν υπάρχουν σε άλλες. Για το λόγο αυτό και επειδή κάθε μηχανή έχει το δικό της τρόπο ευρετηρίασης των ιστοσελίδων και ιεράρχησης των αποτελεσμάτων συνίσταται στον χρήστη η πραγματοποίηση της ίδιας αναζήτησης σε περισσότερες μηχανές.
Επισημάνσεις για την αποτελεσματική χρήση των μηχανών αναζήτησης (3/8) Οδηγίες χρήσης ή συμβουλές που δίνουν οι ίδιες οι μηχανές αναζήτησης. Οι οδηγίες μπορούν να απαλλάξουν τον χρήστη από την χρονοβόρα διαδικασία να ανακαλύψει πως ακριβώς λειτουργεί μία μηχανή αναζήτησης προτού μπορέσει να την χρησιμοποιήσει αποτελεσματικά. Καλό θα ήταν πριν προχωρήσει στην αναζήτηση να κάνει τον κόπο να διαβάσει τις οδηγίες χρήσης ή τις συμβουλές που δίνουν οι ίδιες οι μηχανές αναζήτησης. Το πιο χαρακτηριστικό παράδειγμα είναι ότι κάποιες μηχανές αντιλαμβάνονται το κενό ανάμεσα σε περισσότερες λέξεις-κλειδιά ως τον τελεστή and, ενώ άλλες ως τον τελεστή or (λογική των τελεστών). Οι οδηγίες μπορούν να απαλλάξουν τον χρήστη από την χρονοβόρα διαδικασία να ανακαλύψει πως ακριβώς λειτουργεί μία μηχανή αναζήτησης προτού μπορέσει να την χρησιμοποιήσει αποτελεσματικά.
Επισημάνσεις για την αποτελεσματική χρήση των μηχανών αναζήτησης (4/8) Οι περισσότερες μηχανές αναζήτησης προσφέρουν και ένα περιβάλλον για πιο σύνθετες έρευνες. Τεράστιος αριθμός αποτελεσμάτων. Στις μηχανές που ευρετηριάζουν το πλήρες κείμενο μιας ιστοσελίδας μπορεί να ανακτηθούν και σελίδες που περιέχουν τον όρο της αναζήτησης μόνο μια φορά σε ολόκληρο το κείμενο, χωρίς αυτό να αποτελεί το βασικό θέμα τους. Επίσης, μπορεί στα αποτελέσματα να περιλαμβάνονται πολλές ιστοσελίδες από τον ίδιο δικτυακό τόπο, καθώς περιέχουν όλες τον όρο της αναζήτησης. Οι περισσότερες μηχανές αναζήτησης προσφέρουν και ένα περιβάλλον για πιο σύνθετες έρευνες. Συνίσταται στον χρήστη να εκμεταλλευτεί τις δυνατότητες που του δίνει μία σύνθετη αναζήτηση προτού προχωρήσει στην επόμενη μηχανή. Τεράστιος αριθμός αποτελεσμάτων. Στις μηχανές που ευρετηριάζουν το πλήρες κείμενο μιας ιστοσελίδας μπορεί να ανακτηθούν και σελίδες που περιέχουν τον όρο της αναζήτησης μόνο μια φορά σε ολόκληρο το κείμενο, χωρίς αυτό να αποτελεί το βασικό θέμα τους. Επίσης, μπορεί στα αποτελέσματα να περιλαμβάνονται πολλές ιστοσελίδες από τον ίδιο δικτυακό τόπο, καθώς περιέχουν όλες τον όρο της αναζήτησης.
Επισημάνσεις για την αποτελεσματική χρήση των μηχανών αναζήτησης (5/8) Ομαδοποίηση αποτελεσμάτων, όπου όλα τα αποτελέσματα από έναν τόπο συνενώνονται. Αναζήτηση μέσα στα αποτελέσματα της πρώτης έρευνας, δίνοντας έτσι τη δυνατότητα στον χρήστη να τα περιορίσει. Ορισμένες μηχανές αναζήτησης έχουν αναπτύξει μία τεχνική που ονομάζεται ομαδοποίηση αποτελεσμάτων, όπου όλα τα αποτελέσματα από έναν τόπο συνενώνονται. Άλλες μηχανές επιτρέπουν την αναζήτηση μέσα στα αποτελέσματα της πρώτης έρευνας, δίνοντας έτσι τη δυνατότητα στον χρήστη να τα περιορίσει.
Επισημάνσεις για την αποτελεσματική χρήση των μηχανών αναζήτησης (6/8) Η επιλογή των σωστών λέξεων-κλειδιών που χρησιμοποιούνται για την αναζήτηση. Ο χρήστης να αναλογιστεί τι ακριβώς ψάχνει και να επιλέξει την πιο κατάλληλη λέξη που να το εκφράζει. Όσο πιο ασυνήθιστος ή εξειδικευμένος είναι ο όρος τόσο πιο συγκεκριμένα θα είναι τα αποτελέσματα. Ακόμη πιο αποτελεσματική είναι η χρήση (όπου αυτό είναι δυνατό) μιας φράσης, που συνήθως πρέπει να εσωκλείεται σε εισαγωγικά (“…”), καθώς και ο συνδυασμός όρων χρησιμοποιώντας την λογική των τελεστών Καθοριστικής σημασίας, όχι μόνο για να περιορίζεται ο αριθμός των αποτελεσμάτων, αλλά και για να είναι τα αποτελέσματα αυτά πιο σωστά, είναι η επιλογή των σωστών λέξεων-κλειδιών που χρησιμοποιούνται για την αναζήτηση. Το σημαντικότερο είναι ο χρήστης να αναλογιστεί τι ακριβώς ψάχνει και να επιλέξει την πιο κατάλληλη λέξη που να το εκφράζει. Όσο πιο ασυνήθιστος ή εξειδικευμένος είναι ο όρος τόσο πιο συγκεκριμένα θα είναι τα αποτελέσματα. Ακόμη πιο αποτελεσματική είναι η χρήση (όπου αυτό είναι δυνατό) μιας φράσης, που συνήθως πρέπει να εσωκλείεται σε εισαγωγικά (“…”), καθώς και ο συνδυασμός όρων χρησιμοποιώντας την λογική των τελεστών
Επισημάνσεις για την αποτελεσματική χρήση των μηχανών αναζήτησης (7/8) Πρώτα αναζήτηση του όρου στον τίτλο της ιστοσελίδας. Συνίσταται η χρήση μικρών γραμμάτων, καθώς ορισμένες μηχανές διαχωρίζουν μεταξύ μικρών και κεφαλαίων. Εξαίρεση στον κανόνα αποτελεί η περίπτωση που γίνεται έρευνα για ονόματα, γεωγραφικές τοποθεσίες και τίτλους βιβλίων ή ταινιών, οπότε η χρήση κεφαλαίων αποφέρει καλύτερα αποτελέσματα. Ορθογραφικό ή τυπογραφικό λάθος Όταν η μηχανή αναζήτησης δίνει στον χρήστη τη δυνατότητα, καλό θα ήταν να κάνει πρώτα αναζήτηση του όρου στον τίτλο της ιστοσελίδας. Είναι πιο πιθανό μία ιστοσελίδα με την λέξη στον τίτλο να περιέχει αυτό που ζητάει. Επίσης σε γενικές γραμμές συνίσταται η χρήση μικρών γραμμάτων, καθώς ορισμένες μηχανές διαχωρίζουν μεταξύ μικρών και κεφαλαίων. Εξαίρεση στον κανόνα αποτελεί η περίπτωση που γίνεται έρευνα για ονόματα, γεωγραφικές τοποθεσίες και τίτλους βιβλίων ή ταινιών, οπότε η χρήση κεφαλαίων αποφέρει καλύτερα αποτελέσματα. Τέλος, όταν η αναζήτηση δεν έχει κανένα αποτέλεσμα αυτό συχνά οφείλεται σε ορθογραφικό ή τυπογραφικό λάθος, οπότε συμφέρει τον χρήστη να το ελέγξει αυτό προτού προχωρήσει σε άλλη μηχανή ή εγκαταλείψει την έρευνα.
Επισημάνσεις για την αποτελεσματική χρήση των μηχανών αναζήτησης (8/8) Τα προσφερόμενα χαρακτηριστικά και οι διάφορες τεχνικές αναζήτησης δεν λειτουργούν πάντοτε επιτυχώς. Συχνά η αναζήτησή του δεν θα έχει τα αναμενόμενα αποτελέσματα ή θα χρειαστεί να ψάξει μέσα από εκατοντάδες ιστοσελίδες μέχρι να βρει αυτό που θέλει. Ακόμη και η καλύτερη μηχανή αναζήτησης δεν μπορεί να βρει κάτι που δεν υπάρχει. Ωστόσο, ο χρηστής των μηχανών αναζήτησης πρέπει να γνωρίζει ότι τα προσφερόμενα χαρακτηριστικά και οι διάφορες τεχνικές αναζήτησης δεν λειτουργούν πάντοτε επιτυχώς. Συχνά η αναζήτησή του δεν θα έχει τα αναμενόμενα αποτελέσματα ή θα χρειαστεί να ψάξει μέσα από εκατοντάδες ιστοσελίδες μέχρι να βρει αυτό που θέλει. Ανεξάρτητα από αυτό, ακόμη και η καλύτερη μηχανή αναζήτησης δεν μπορεί να βρει κάτι που δεν υπάρχει. Το Internet δεν περιέχει όλη την ανθρώπινη γνώση ούτε είναι πάντα η πιο έγκυρη πηγή πληροφοριών. Ο χρήστης πρέπει να είναι σε θέση να αναγνωρίζει πότε να απευθυνθεί αλλού.
Οι αδυναμίες των μηχανών αναζήτησης Μη χρήση των κατάλληλων λέξεων κλειδιά. Οι περισσότερες μηχανές αναζήτησης δεν μπορούν να προσπελάσουν το αόρατο WWW. Καθορισμός της αναζήτησης - η εισαγωγή απλά ορισμένων λέξεων κλειδιά δεν επαρκεί. Χιλιάδες ιστοσελίδες των αποτελεσμάτων. Οι μηχανές αναζήτησης χρησιμοποιούν διάφορες μεθόδους συντακτικής βαθμολόγησης για την κατάταξη των αποτελεσμάτων τους (όπως page rank), αλλά προσφέρουν πολύ λίγη βοήθεια στον επανακαθορισμό της αναζήτησης.
Θεματικοί κατάλογοι
Ορισμός (1/2) Συλλογές υπερ-συνδέσεων οργανωμένες θεματικά. Συλλογές υπερ-συνδέσεων οργανωμένες θεματικά. Ιεραρχική δομή Μεγάλες θεματικές περιοχές - μικρότερες πιο ειδικές υποκατηγορίες. Συλλογές υπερ-συνδέσεων σε ιστοσελίδες και δικτυακούς τόπους, οργανωμένες θεματικά. Έχουν συνήθως ιεραρχική δομή και είναι οργανωμένοι σε δομές που κατατάσσουν τις πληροφορίες κατά θέμα, με παρόμοιο τρόπο όπως οι παραδοσιακές βιβλιοθήκες οργανώνουν τα βιβλία τους. Περιλαμβάνουν μεγάλες θεματικές περιοχές που χωρίζονται σε μικρότερες πιο ειδικές υποκατηγορίες.
Ορισμός (2/2) Μονοπάτι που οδηγεί μέσα από κατηγορίες και υποκατηγορίες, ιεραρχικά δομημένες, σε μία ιστοσελίδα. Θεματική κατηγορία πιο ειδική υποκατηγορία συγκεκριμένη ιστοσελίδα. Εργαλεία για την εξεύρεση πληροφοριών μέσω περιήγησης. Εκμεταλλεύονται τις ιδιότητες του υπερκειμένου, δημιουργώντας ένα μονοπάτι που οδηγεί μέσα από κατηγορίες και υποκατηγορίες, ιεραρχικά δομημένες, σε μία ιστοσελίδα. Δίνεται τη δυνατότητα στο χρήστη να εισχωρήσει από μία μεγάλη θεματική κατηγορία σε μία πιο ειδική υποκατηγορία και τελικά σε μία συγκεκριμένη ιστοσελίδα. Αποτελούν ιδανικά εργαλεία για την εξεύρεση πληροφοριών μέσω περιήγησης.
Μοντέλα Κλειστό μοντέλο Ανοικτό μοντέλο
Κλειστό μοντέλο Μικρές ομάδες ατόμων Επιλέγουν και σχολιάζουν υπερ-συνδέσεις για κάθε κατηγορία. Ο βαθμός εξειδίκευσης των ατόμων διαφέρει Μηχανισμός ποιοτικού ελέγχου. Αυτού του τύπου οι θεματικοί κατάλογοι συντηρούνται από μικρές ομάδες ατόμων (π.χ. υπαλλήλων σε κάποια εταιρεία), τους συντάκτες, οι οποίοι επιλέγουν και σχολιάζουν υπερ-συνδέσεις για κάθε κατηγορία. Ο βαθμός εξειδίκευσης των ατόμων διαφέρει και γενικά προβλέπεται μηχανισμός ποιοτικού ελέγχου που εγγυάται τη συνάφεια του καταλόγου
Ανοικτό μοντέλο Συντάκτες εθελοντές. Προβλήματα ποιοτικού ελέγχου. Πολύ δημοφιλείς στους χρήστες του WWW. Σε αυτή τη περίπτωση ο κατάλογος συντηρείται από συντάκτες εθελοντές. Αυτού του τύπου οι κατάλογοι τείνουν να αντιμετωπίζουν πολλά προβλήματα ποιοτικού ελέγχου. Επειδή όμως έχουν ελάχιστο κόστος και τα δεδομένα διατίθενται δωρεάν σε όποιον θέλει να τους χρησιμοποιήσει, είναι πολύ δημοφιλείς στους χρήστες του WWW.
Παραδείγματα θεματικών καταλόγων κατά τύπο Κλειστού τύπου http://dir.yahoo.com http://www.about.com Ανοικτού τύπου http://www.dmoz.org http://www.zeal.com
Περιήγηση Αρκετά εύκολη διαδικασία Κανόνες περιήγησης Ισχύουν σχεδόν σε όλους του θεματικούς καταλόγους. Η διαδικασία της περιήγησης στους θεματικούς καταλόγους είναι μία αρκετά εύκολη διαδικασία, αρκεί ο χρήστης να έχει υπόψη του ορισμένους κανόνες περιήγησης οι οποίοι ισχύουν σχεδόν σε όλους του θεματικούς καταλόγους.
Θεματικές κατηγορίες Λίστα με τις βασικές θεματικές κατηγορίες. Συνήθως αυτή η λίστα βρίσκεται σε κεντρική θέση Οι βασικές κατηγορίες συνήθως είναι γύρω στις 14. Επιλέγοντας μία από αυτές ο χρήστης μεταφέρεται μέσα στην κατηγορία όπου εμφανίζονται οι υποκατηγορίες της. Δίπλα από κάθε υποκατηγορία εμφανίζεται ένας αριθμός που υποδηλώνει τον αριθμό των καταχωρήσεων που περιλαμβάνει η υποκατηγορία.
Περιήγηση στις κατηγορίες Στο πάνω μέρος του παραθύρου εμφανίζεται η διαδρομή που έχει ακολουθήσει έως τώρα ο χρήστης ώστε να φτάσει σε αυτό το σημείο του θεματικού καταλόγου. Ο χρήστης γνωρίζει πάντοτε σε πιο σημείο στην ιεραρχία του καταλόγου βρίσκεται.
Τελικό επίπεδο στην ιεραρχία των κατηγοριών Η τελική ιστοσελίδα στην ιεραρχία περιλαμβάνει ιστοσελίδα με υπερ- συνδέσεις σε εξωτερικές ιστοσελίδες. Δίπλα από κάθε υπερ-σύνδεση εμφανίζεται σύντομος σχολιασμός της ιστοσελίδας όπου παραπέμπει η υπερ-σύνδεση.
Αναζήτηση (1/3) Η πλειοψηφία των θεματικών καταλόγων περιλαμβάνει κάποιου τύπου αναζήτηση μέσα στις κατηγορίες τους Αυτή η αναζήτηση είναι συνήθως ένα απλό πλαίσιο διαλόγου.
Αναζήτηση (2/3) Συνήθως περιλαμβάνεται και πλαίσιο προχωρημένης αναζήτησης Δυνατότητα λογικής Boolean όχι όμως απευθείας εισάγοντας τελεστές, αλλά πληκτρολογώντας λέξεις κλειδιά στα κατάλληλα πλαίσια.
Αναζήτηση (3/3) Υπάρχουν και ειδικές επιλογές περιορισμού στις αναζητήσεις. Ο μηχανισμός αναζήτησης των θεματικών καταλόγων αναζητεί τις λέξεις κλειδιά που εισάγουν οι χρήστες στις λέξεις των υπερ- συνδέσεων και του σχολιασμού και όχι στο κείμενο της ιστοσελίδας όπου παραπέμπουν αυτές. Υπάρχουν και ειδικές επιλογές περιορισμού στις αναζητήσεις. Όπως για παράδειγμα στο Yahoo! μπορούμε να θέσουμε περιορισμούς στη διαδικτυακή περιοχή (domain), στη γλώσσα, κ.α. Ο μηχανισμός αναζήτησης των θεματικών καταλόγων αναζητεί τις λέξεις κλειδιά που εισάγουν οι χρήστες στις λέξεις των υπερ-συνδέσεων και του σχολιασμού και όχι στο κείμενο της ιστοσελίδας όπου παραπέμπουν αυτές.
Προχωρημένη αναζήτηση στο Yahoo!
Μέγεθος (1/2) Η διαδικασία της εύρεσης κατάλληλων διευθύνσεων καθώς και η επισύναψη του κατάλληλου σχολιασμού είναι μία αρκετά χρονοβόρα διαδικασία. Έχουν γενικά περιορισμένο μέγεθος, σε σχέση με τις μηχανές αναζήτησης Συνήθως περιλαμβάνουν υπερ-συνδέσεις σε ποιοτικές ιστοσελίδες. Περιεκτικός σχολιασμός των υπερ-συνδέσεων.
Μέγεθος (2/2) Ο σχολιασμός που προσφέρουν ορισμένες μηχανές αναζήτησης παράγεται αυτόματα από το κείμενο της ιστοσελίδας. Οι κατάλογοι είναι πολύ εστιασμένοι, διευκολύνοντας το χρήστη καθώς του προσφέρουν λίγες υπερ-συνδέσεις αποτελεσμάτων. Βέβαια αυτό μπορεί να οφείλεται και σε άλλους παράγοντες, όπως έλλειψη ικανού αριθμού προσωπικού ή εξειδικευμένου προσωπικού ή ακόμη και χρόνου.
Πολιτική Διαφορετικά κριτήρια επιλογής των υπερ- συνδέσεων Οι περισσότεροι θεματικοί κατάλογοι ανακοινώνουν τα κριτήρια επιλογής των περιεχομένων τους Υπάρχουν και άλλοι παράγοντες που επηρεάζουν αυτή την επιλογή. Συσχετισμοί ισορροπιών ανάμεσα στους συντάκτες μπορεί να προβάλουν ή να υποβαθμίζουν την εργασία ενός συντάκτη. Έλεγχος για τυχόν σημάδια προκατάληψης.
Επικαιρότητα Τακτική συντήρηση και ενημέρωση Ανθρώπινος παράγοντας – χρονοβόρα διαδικασία. Ύπαρξη ανενεργών υπερ-συνδέσεων. Έλεγχος των υπερ-συνδέσεων αποτελεί μία σημαντική διαδικασία για τη διατήρηση της επικαιρότητας του θεματικού καταλόγου, που όμως δεν τηρείται επιμελώς σε όλους τους θεματικούς καταλόγους.
Αξιοπιστία Δικτυακοί τόποι με απαγορευμένο περιεχόμενο. Προσπαθούν να ξεγελάσουν τους συντάκτες. Ο εντοπισμός τέτοιων ιστοσελίδων δεν είναι εύκολη υπόθεση Πρέπει να παραπονεθούν οι χρήστες του καταλόγου, πράγμα που συνήθως το αποφεύγουν. Βλάπτουν σημαντικά την αξιοπιστία ενός θεματικού καταλόγου.
Ασύμμετρη κάλυψη Υπάρχουν κατηγορίες που περιλαμβάνουν πληθώρα υπερ-συνδέσεων, πράγμα που οφείλεται στο γεγονός ότι η πολιτική του θεματικού καταλόγου Αυτό καθιστά εξαιρετικά δύσκολη της εξεύρεση της κατάλληλης υπερ-σύνδεσης. Υπάρχουν κατηγορίες που περιλαμβάνουν ελάχιστες υπερ-συνδέσεις Δεν υπάρχουν οι κατάλληλοι συντάκτες Δεν υπάρχουν αξιόλογες, σύμφωνα με την πολιτική του καταλόγου, ιστοσελίδες για να συμπεριληφθούν.
Παράδειγμα ασύμμετρης κάλυψης
Χρέωση Έχει παρατηρηθεί μία τάση να απαιτείται κάποια χρέωση από τη μεριά των θεματικών καταλόγων για να συμπεριληφθούν ιστοσελίδες στον κατάλογό τους. Πολλοί οργανισμοί και ανεξάρτητοι δημιουργοί ιστοσελίδων δεν το αποδέχονται το θεωρούν μη αποδεκτό. Αυτό έχει σαν αποτέλεσμα να εξαιρούνται από τους θεματικούς καταλόγους πάρα πολλοί καλοί δικτυακοί τόποι.
Τύποι θεματικών καταλόγων Υπάρχουν δύο βασικοί τύποι θεματικών καταλόγων: οι ακαδημαϊκοί και επαγγελματικοί θεματικοί κατάλογοι που έχουν δημιουργηθεί και συντηρούνται από ειδικούς με σκοπό να υποστηρίξουν τις ανάγκες ερευνητών και οι εμπορικοί θεματικοί κατάλογοι που απευθύνονται στο ευρύ κοινό και ανταγωνίζονται για την προσέλκυση περισσοτέρων χρηστών.
Ακαδημαϊκοί και επαγγελματικοί κατάλογοι Οι Ακαδημαϊκοί και επαγγελματικοί θεματικοί κατάλογοι δημιουργούνται συνήθως από βιβλιοθηκονόμους ή ειδικούς επιστήμονες και σχετίζονται συνήθως με βιβλιοθήκες και ακαδημαϊκά ιδρύματα. Διευκόλυνση της ερευνητικής διαδικασίας Διαδικασία επιλογής ιδιαίτερα αυστηρή Σχολιασμός Μη κερδοσκοπικοί χωρίς διαφημίσεις
Εμπορικοί θεματικοί κατάλογοι. Ο εμπορικοί θεματικοί κατάλογοι δημιουργούνται συνήθως με σκοπό το κέρδος και απευθύνονται σε όσο το δυνατόν ευρύτερο κοινό. θέματα ψυχαγωγίας, εμπορίου, αθλητισμού, ταξιδιών και άλλου τέτοιου είδους ενδιαφερόντων. Διαφημίσεις - πρόσθετες υπηρεσίες. Δεν αξιολογούν απλά τις κατατάσσουν Ο Yahoo! αποτελεί ένα παράδειγμα Εμπορικού Θεματικού Καταλόγου.
Μηχανή αναζήτησης – θεματικός κατάλογος (1/2) Δεν υπάρχουν σαφείς διαχωριστικές γραμμές ανάμεσα στους θεματικούς καταλόγους και στις μηχανές αναζήτησης. Στον ίδιο δικτυακό τόπο με μία μηχανή αναζήτησης υπάρχει παράλληλα και ένας θεματικός κατάλογος και σε αρκετές περιπτώσεις το περιεχόμενο του θεματικού καταλόγου ερευνάται ταυτόχρονα με το περιεχόμενο της βάσης δεδομένων της μηχανής αναζήτησης.
Μηχανή αναζήτησης – θεματικός κατάλογος (2/2) Οι περισσότερες σύγχρονες υπηρεσίες αναζήτησης στο διαδίκτυο είναι υβριδικές μορφές, μεταξύ μηχανής αναζήτησης και θεματικού καταλόγου. Παρά τα ασαφή σύνορα μεταξύ των δικτυακών τόπων των μηχανών αναζήτησης και των θεματικών καταλόγων που οφείλονται κυρίως στη προσπάθεια των δημιουργών τους να προσελκύσουν όλο και περισσότερους χρήστες, οι διαφορές εξακολουθούν να είναι σημαντικές.
Διαφορές μηχανών αναζήτησης και θεματικών καταλόγων
Ειδικά & Υβριδικά Εργαλεία Αναζήτησης
Εισαγωγή Υπάρχει μια πλειάδα από ειδικά και υβριδικά εργαλεία αναζήτησης που αξίζουν ιδιαίτερης αναφοράς. Αυτά τα εργαλεία διατίθενται σε διάφορες μορφές. Επεκτείνουν ή βελτιώνουν τις δυνατότητες των μηχανών αναζήτησης και των θεματικών καταλόγων.
Πλεονεκτήματα και μειονεκτήματα Μικρά σε μέγεθος και εστιάζουν την έρευνα σε ειδικές κατηγορίες ή πηγές πληροφοριών. Μεγάλη αξιοπιστία και σταθερότητα. Μεγάλη συχνότητα κυκλοφορίας νέων εκδόσεων Κάλυψη σε μεγαλύτερο βάθος του θέματος της έρευνας. Απαιτούν από το χρήστη κάποιο χρόνο εκμάθησης. Περιλαμβάνουν αρκετές επιλογές ρυθμίσεων και ειδικές εντολές, μοναδικές για κάθε εργαλείο. Ο χρήστης πρέπει να αφιερώσει σημαντικό χρόνο, προκειμένου να είναι σε θέση να χρησιμοποιεί ικανοποιητικά το κάθε εργαλείο.
Μεταμηχανές αναζήτησης Δεν διαθέτουν δικό τους ευρετήριο, αλλά αντλούν τα αποτελέσματά τους από τα ευρετήρια άλλων μηχανών αναζήτησης. Στέλνουν τις λέξεις-κλειδιά ταυτόχρονα σε μία σειρά από προκαθορισμένες υπηρεσίες αναζήτησης και παρουσιάζουν ένα μέρος από τα αποτελέσματα που λαμβάνουν. Συνήθως ανακτούν μόνο το 10% των αποτελεσμάτων από κάθε βάση.
Ο δικτυακός τόπος του Metacrawler
Προβλήματα (1/2) Η ιδέα της μετα-μηχανής είναι πολύ καλή Η υλοποίηση της όμως δεν φέρνει πάντα τόσο καλά αποτελέσματα. Ο χρήστης έχει την εντύπωση ότι κερδίζει πολύ χρόνο χρησιμοποιώντας μόνο την μετα-μηχανή αντί πολλές ανεξάρτητες μηχανές αναζήτησης. Οι μετα-μηχανές προσφέρουν γρήγορα αλλά όχι πάντα καλά αποτελέσματα. Πολλοί χρήστες αποφεύγουν τη χρήση τους.
Προβλήματα (2/2) Όχι τον Google Τροποποιούν τη λίστα των μηχανών αναζήτησης Δεν χειρίζονται σωστά τις λέξεις κλειδιά και τους τελεστές Boolean. Δεν δίνεται η δυνατότητα στο χρήστη να βελτιώσει την αναζήτηση σε περίπτωση που δεν είναι ικανοποιητικά τα αποτελέσματα. Δεν παραδίδουν όλα τα αποτελέσματα που δίνουν οι μηχανές αναζήτησης.
Διαπιστώσεις Ενδείκνυται για απλές αναζητήσεις Είναι πολύ πιθανό να χαθεί ένα μεγάλο μέρος των αποτελεσμάτων.
Καθορισμός υπηρεσιών αναζήτησης στην Ixquick
Διευθύνσεις μεταμηχανών Meta Crawler http://www.metacrawler.com Dogpile http://www.dogpile.com Highway61 http://highway61.com Ixquick http://www.ixquick.com
Κατάλογοι ειδικού σκοπού (Targeted Directories) Είναι οδηγοί του WWW που δημιουργήθηκαν από ανθρώπους και αναφέρονται σε ένα ειδικό θέμα ή περιοχή πληροφοριών. Οι δημιουργοί τους είναι ειδικευμένο προσωπικό με κύρια προτεραιότητα την υψηλή ποιότητα και την αξιοπιστία των πηγών που συμπεριλαμβάνουν στον κατάλογο ειδικού σκοπού. Τα ποιοτικά πρότυπα τους είναι ανώτερα από αυτά ενός γενικού καταλόγου. Συνήθως περιλαμβάνουν εκτεταμένα σχόλια (περιλήψεις) για κάθε πηγή WWW, σε αντίθεση με τους γενικούς καταλόγους που προσφέρουν συνήθως ελάχιστο σχολιασμό.
Πλεονεκτήματα Περιεκτική κάλυψη θέματος. Ενημερωμένες λίστες. Κάλυψη των νέων πηγών.
Μηχανές αναζήτησης ειδικού σκοπού Επικεντρώνονται σε ορισμένα θέματα. Προσπαθούν να βρουν και να καταγράψουν όσες περισσότερες ιστοσελίδες αναφέρονται σε ορισμένο θέμα, επισκεπτόμενες ένα περιορισμένο αριθμό δικτυακών τόπων που καλύπτουν το συγκεκριμένο θέμα.
Ιστοσελίδα μηχανής αναζήτησης για εκπαιδευτικά θέματα
Χαρακτηριστικά Περιδιαβαίνουν τους δικτυακούς τόπους πιο σχολαστικά και πιο συχνά από τις συνηθισμένες μηχανές αναζήτησης. Χαμηλό κόστος συντήρησής. Ο καθορισμός των δικτυακών τόπων που επισκέπτονται γίνεται από ειδικό προσωπικό. Περιορίζει τον αριθμό των ακατάλληλων αποτελεσμάτων Ανακαλύπτουν και περιλαμβάνουν στους καταλόγους τους πιο γρήγορα νέες ιστοσελίδες από τις μηχανές αναζήτησης
Μηχανές αναζήτησης ειδικού σκοπού
Πράκτορες περιηγητών (browser agents) Είναι προγράμματα που εργάζονται σε συνδυασμό με τις εφαρμογές περιήγησης για να βελτιώσουν και να επεκτείνουν τις δυνατότητές τους. Ο τρόπος λειτουργίας τους διαφοροποιείται από αυτό των εργαλείων αναζήτησης με τη βοήθεια λέξεων κλειδιών. Τα εργαλεία αυτά προσπαθούν να αυτοματοποιήσουν τις διαδικασίες αναζήτησης, αναλύοντας και προσφέροντας επιλεγμένες πηγές.
Πράκτορες περιηγητών (browser agents) Ανεξάρτητες εφαρμογές Κατέβασμα από το διαδίκτυο Εκτελούνται παράλληλα - προβλήματα στη λειτουργία του υπολογιστή - ασυμβατότητα λογισμικού. Επιλογή μίας ή δύο
Εργαλεία αναζήτησης πελάτες Τα εργαλεία αναζήτησης πελάτες (ή πράκτορες) εγκαθίστανται στον υπολογιστή του χρήστη ή στο τοπικό δίκτυο. Είναι ειδικό λογισμικό που προσαρμόζεται στις ανάγκες του εκάστοτε χρήστη. Τα εργαλεία αυτά περιλαμβάνουν ορισμένα χαρακτηριστικά που δεν συναντώνται στους θεματικούς καταλόγους και τις μηχανές αναζήτησης.
Χαρακτηριστικά Ερευνούν ταυτόχρονα σε πολλούς δικτυακούς τόπους, οι οποίοι επιλέγονται από τον χρήστη. Διαγράφουν τις ανενεργές υπερ-συνδέσεις από τα αποτελέσματα. Επιτρέπουν την τοπική αποθήκευση των ιστοσελίδων των αποτελεσμάτων, για περαιτέρω επεξεργασία και ταχύτερη περιήγηση. Περιλαμβάνουν πολύπλοκα εργαλεία επανακαθορισμού της αναζήτησης. Μπορούν να παράγουν, να αποθηκεύσουν και να ανανεώσουν αναφορές έρευνας. Μπορούν, σε κάποιο βαθμό, να προσπελάσουν το αόρατο WWW που είναι απροσπέλαστο από τις μηχανές αναζήτησης.
http://www.copernic.com
Μεθοδολογία αναζήτησης
Χαρακτηριστικά των ερευνητών του διαδικτύου Οι ερευνητές δεν έχουν κάποιο καθορισμένο στυλ έρευνας. Άλλωστε δεν υπάρχει κάποιος σωστός τρόπος έρευνας. Τα στυλ έρευνας είναι πολλά και επεκτείνονται από τη μεθοδική έρευνα που έχει σαν σκοπό να βρει το ακριβές αποτέλεσμα με την πρώτη προσπάθεια έως το στυλ όπου ο ερευνητής κάνει άλματα από θέμα σε θέμα. Υπάρχει μόνο ένα σημαντικό ζήτημα, να βρεις τα αποτελέσματα που επιθυμείς. Με βάση τα παραπάνω η ορθότερη στρατηγική έρευνας είναι αυτή που αποδίδει γρηγορότερα.
Χρόνος που απαιτείται για μία μέση έρευνα Οι παραπάνω χρόνοι είναι συνήθως μικρότεροι από τους πραγματικούς. Έρευνες έχουν δείξει ότι ο μέσος χρόνος για την εύρεση αρχείου με ικανοποιητικό περιεχόμενο είναι 2,4 λεπτά
Παράγοντες που αυξάνουν τον χρόνο έρευνας Μη επιθυμητά αποτελέσματα Κατέβασμα και επισκόπηση αποτελεσμάτων Μεγάλες λίστες αποτελεσμάτων Αλλαγή ερωτήματος Μεγάλο ποσοστό των αποτελεσμάτων των υπηρεσιών αναζήτησης δεν θα είναι τα επιθυμητά. Ο χρόνος λήψης των αποτελεσμάτων είναι συνήθως μικρός. Το κατέβασμα και επισκόπηση των αποτελεσμάτων είναι χρονοβόρα διαδικασία. Οι μεγαλύτερες λίστες αποτελεσμάτων απαιτούν μεγαλύτερο χρόνο επισκόπησης. Η δημιουργία του ερωτήματος απαιτεί πολύ λίγο χρόνο. Οποιαδήποτε αλλαγή με στόχο την πιο ακριβή περιγραφή του ερωτήματος έχει σαν αποτέλεσμα λιγότερα αρχεία για επισκόπηση και συνολικά λιγότερο χρόνο εύρεσης επιθυμητών αποτελεσμάτων.
Συμπέρασμα Απαιτείται χρόνος για την κατανόηση του τρόπου διατύπωσης ερωτημάτων καθώς και της λειτουργίας της υπηρεσίας αναζήτησης.
Τεχνικές αναζήτησης Γενική αναζήτηση. Ειδική αναζήτηση. Προσαρμοζόμενη αναζήτηση. Αναζήτηση μέρους λέξης. Αναζήτηση Search and Jump. Αναζήτηση κατηγορίας. Αναζήτηση και κατάταξη.
Μία γενική αναζήτηση χρησιμοποιεί τον τελεστή OR για να συνδυάσει λέξεις κλειδιά, ζητώντας από την υπηρεσία αναζήτησης να εντοπίσει ιστοσελίδες που περιλαμβάνουν οποιαδήποτε από τις εναλλακτικές λέξεις κλειδιά. Όσο αυξάνεται ο αριθμός των λέξεων κλειδιών, που εισάγει ο χρήστης, τόσο η έρευνα διευρύνεται και αυξάνει σημαντικά ο αριθμός των αποτελεσμάτων. Το πρόβλημα είναι ότι πολλά από τα αποτελέσματα δεν είναι σωστά. Γενική αναζήτηση
Μία ειδική αναζήτηση χρησιμοποιεί τον τελεστή AND για να συνδυάσει λέξεις κλειδιά, ζητώντας από την υπηρεσία αναζήτησης να εντοπίσει ιστοσελίδες που περιλαμβάνουν όλες τις λέξεις - κλειδιά. Όσο αυξάνεται ο αριθμός των λέξεων κλειδιών που εισάγει ο χρήστης, τόσο μειώνεται το εύρος της έρευνας και μειώνεται ο αριθμός των αποτελεσμάτων. Η πιθανότητα να δώσει η μηχανή αποτελέσματα μειώνεται, αλλά αν δώσει τότε σίγουρα αυτά θα είναι πολύ κοντά σ’ αυτό που αναζητεί ο χρήστης. Ειδική αναζήτηση
Προσαρμοζόμενη αναζήτηση Η προσαρμοζόμενη αναζήτηση επιτρέπει στο χρήστη να μειώνει και να αυξάνει σταδιακά το εύρος της αναζήτησης, έως ότου φτάσει στο επιθυμητό αποτέλεσμα. Αυτό συνεπάγεται αλλαγή των λέξεων – κλειδιών ανάλογα με τα αποτελέσματα των προηγούμενων αναζητήσεων. Σε αυτή τη περίπτωση ο χρήστης πρέπει να είναι αρκετά πεπειραμένος στις αναζητήσεις. Η διαδικασία αυτή κρίνεται εξαιρετικά χρονοβόρα. Προσαρμοζόμενη αναζήτηση
Αναζήτηση μέρους λέξης Η αναζήτηση αυτή επιτρέπει στο χρήστη να ερευνήσει την ύπαρξη μίας ακολουθίας γραμμάτων σε οποιαδήποτε λέξη. Αυτή η διαδικασία απλοποιεί την έρευνα αλλά υπάρχει μεγάλη πιθανότητα να δώσει μη σχετικά αποτελέσματα. Αναζήτηση μέρους λέξης
Αναζήτηση Search and Jump Κατά την αναζήτηση αυτή ο χρήστης χρησιμοποιεί το πλήκτρο Αναζήτηση του περιηγητή. Σε ορισμένες περιπτώσεις μπορεί να καθορίσει και τη μηχανή αναζήτησης που θα χρησιμοποιήσει, τον αριθμό των αποτελεσμάτων που θα δεχθεί, ακόμη και να εκτελέσει αναζήτηση μέσα σε μία ιστοσελίδα αποτελεσμάτων. Αυτή η διαδικασία τις περισσότερες φορές είναι χρονοβόρα. Αναζήτηση Search and Jump
Σε αυτή την τεχνική ο χρήστης ερευνά σε θεματικούς καταλόγους, με τη βοήθεια των κατηγοριών. Δεν απαιτείται η διατύπωση ερωτήματος. Ο περιορισμός σε αυτή την περίπτωση είναι ότι πολλές φορές ο τρόπος οργάνωσης των κατηγοριών δεν ταιριάζει στον τρόπο σκέψης του χρήστη. Αναζήτηση κατηγορίας
Αναζήτηση και κατάταξη Ορισμένες μηχανές αναζήτησης κατατάσσουν τα αποτελέσματά τους ανάλογα με τη σχετικότητά τους. Το πρόβλημα είναι ότι ακόμη δεν έχουν εμφανιστεί αποτελεσματικές τεχνικές κατάταξης. Αναζήτηση και κατάταξη
Λέξεις κλειδιά Το πιο σημαντικό στοιχείο σε μία έρευνα είναι οι λέξεις κλειδιά. Στη συνέχεια γίνεται μία περιγραφή της μεθόδου καθορισμού των λέξεων κλειδιών με βάση το θέμα της έρευνας. Ένα από τα μεγαλύτερα λάθη που ένας χρήστης είναι να μην χρησιμοποιήσει αρκετές λέξεις κλειδιά. Κατά μέσο όρο οι χρήστες χρησιμοποιούν 1,5 λέξεις κλειδιά σε κάθε έρευνα. Ο αριθμός αυτός είναι τελείως ανεπαρκής. Σε περίπτωση που είστε αρχάριος στην έρευνα στο διαδίκτυο καλό είναι σαν πρώτο βήμα να σημειώσετε σε ένα χαρτί τις πληροφορίες που αναζητείτε. Με αυτό τον τρόπο θα καθορίσετε επακριβώς το θέμα που αναζητείται. Αφού αποκτήσετε κάποια εμπειρία στις αναζητήσεις μπορείτε να παραλείπετε αυτό το βήμα.
Παράδειγμα (Βήμα 1) Θέλουμε να βρούμε πληροφορίες σχετικά με μία τρομοκρατική επίθεση στην Ελλάδα
Κατηγορίες ερωτήσεων WHO / WHAT? - ΠΟΙΟΣ / ΠΟΙΟ; WHERE? – ΠΟΥ; WHEN? – ΠΟΤΕ; HOW? – ΠΩΣ; WHY? – ΓΙΑΤΙ; Φυσικά οι παραπάνω κατηγορίες δεν έχουν εφαρμογή όλες σε κάθε περίπτωση αλλά προσαρμόζονται ανάλογα με την περίπτωση.
Παράδειγμα (Βήμα 2) ερωτήσεων ΠΟΙΟΣ : η πρεσβεία των Η.Π.Α. ΠΟΥ; Στην λεωφόρο Β.Σοφίας, κέντρο Αθηνών ΠΟΤΕ; Οκτώβριος του 1986 ΠΩΣ; Εκτόξευση ρουκέτας ΓΙΑΤΙ; Διαμαρτυρία για την εξωτερική πολιτική των Η.Π.Α
Κατακερματισμός του ερωτήματος Επικέντρωση στα ουσιαστικά και αντικείμενα Οι ερωτήσεις περιλαμβάνουν και αρκετές λέξεις που είναι άχρηστες στις μηχανές αναζήτησης. Αυτές συνήθως περιλαμβάνουν: and, about, the, of, a, in, as, if, not, why, never, before, is, it. Αυτές οι λέξεις ονομάζονται λέξεις stoplist. Συνήθως οι μηχανές αναζήτησης τις αγνοούν γιατί έχουν μηδαμινή αξία και περιλαμβάνονται σε πολλές σελίδες. Οι μηχανές αναζήτησης διαθέτουν λίστες με περίπου 600 λέξεις stoplist. Σχεδόν πάντοτε οι βασικές λέξεις κλειδιά είναι ουσιαστικά. Οι πιο ακριβείς όροι που υπάρχουν στις γλώσσες είναι τα αντικείμενα. Τα ρήματα και τα επίθετα έχουν πολλά συνώνυμα και μπορούν να χρησιμοποιηθούν με ποικίλους τρόπους. Γενικά προσπαθήστε να αποφύγετε να συμπεριλάβετε στο ερώτημα ρήματα και επίθετα. Σε ορισμένες βέβαια περιπτώσεις ένα επίθετο μπορεί να προσδιορίζει ακριβώς ένα αντικείμενο, οπότε επιβάλλεται η χρήση του.
Παράδειγμα (Βήμα 3) πρεσβεία Η.Π.Α. λεωφόρο Β.Σοφίας κέντρο Αθηνών Οκτώβριος 1986 εκτόξευση ρουκέτα διαμαρτυρία εξωτερική πολιτική Αντικείμενο Πρεσβεία Η.Π.Α. Β.Σοφίας Ρουκέτα Πολιτική Ενέργεια εκτόξευση Προσδιοριστικό Εξωτερική Οκτώβριος 1986
Περικοπή λέξεων και χρήση χαρακτήρων μπαλαντέρ Όταν ψάχνουμε για ένα θέμα που περιγράφεται από ένα ουσιαστικό βάζοντας το σαν λέξη κλειδί μόνο στον ενικό αποκλείουμε από την αναζήτηση όλα τα έγγραφα που περιλαμβάνουν την λέξη στον πληθυντικό. Η λύση θα ήταν να βάλουμε την λέξη σαν λέξη κλειδί και στον ενικό και στον πληθυντικό, αυτό όμως έχει σαν αποτέλεσμα την απώλεια δύο θέσεων κλειδιών καθώς ο αριθμός των λέξεων κλειδιών που μπορούμε να εισάγουμε σε μία αναζήτηση είναι περιορισμένος. Η λύση είναι η χρήση του χαρακτήρα μπαλαντέρ * που ισοδυναμεί με πολλά οποιαδήποτε γράμματα (π.χ. αετός, αετοί αετ*). Αυτή η μέθοδος έχει περισσότερο ευρεία εφαρμογή στα αγγλικά παρά στα ελληνικά όπου τα δύο γένη διαφέρουν συνήθως μόνο κατά ένα s. Το πρόβλημα που παρουσιάζεται με αυτή τη μέθοδο είναι ότι χρησιμοποιώντας τον αστερίσκο περιλαμβάνουμε πολλές φορές στην έρευνα και λέξεις που έχουν την ίδια ρίζα, αυξάνοντας έτσι τον αριθμό των μη σχετικών αποτελεσμάτων.
Παράδειγμα (Βήμα 4) Πρεσβεί* Ρουκέτ* Πολιτικ*
Εύρεση του κατάλληλου επιπέδου Ένα από τα πιο σημαντικά προβλήματα σε όλες τις έρευνες είναι ο εύρεση του κατάλληλου επιπέδου καθορισμού για τις λέξεις κλειδιά του ερωτήματος. Καθορισμός ευρείας περιοχής οδηγεί σε πάρα πολλά αποτελέσματα, ενώ καθορισμό στενής περιοχής έχει σαν αποτέλεσμα ελάχιστα αποτελέσματα. Υπάρχουν αρκετοί άλλοι τρόποι οργάνωσης πληροφοριών. Για παράδειγμα ας δούμε την κατηγοριοποίηση της δομής του Βασιλείου των Ζώων:
Συνώνυμα Πολλές φορές ερευνούμε για κάποιο θέμα αλλά δεν παίρνουμε πολλά αποτελέσματα γιατί δεν χρησιμοποιούμε τις κατάλληλες λέξεις κλειδιά αλλά κάποιες άλλες συνώνυμες λέξεις. Αυτό είναι κάτι που πρέπει να το λαμβάνουμε πάντοτε υπόψη. Η χρήση πολλών συνώνυμων λέξεων καλύπτει πλήρως το θέμα που ερευνούμε.
Φράσεις Για παράδειγμα παίρνουμε διαφορετικά αποτελέσματα αν εκτελέσουμε μία αναζήτηση με τη φράση “ηλιακό σύστημα” και διαφορετικά με τις λέξεις κλειδιά ηλιακό AND σύστημα. Η πιο ισχυρή λέξη κλειδί είναι η φράση. Οι φράσεις είναι συνδυασμοί λέξεων που πρέπει να βρεθούν στα αρχεία με ακριβώς την ίδια σειρά. Συνήθως οι φράσεις εισάγονται μέσα σε εισαγωγικά. Ορισμένες μηχανές αναζήτησης δεν δέχονται φράσεις. Οι φράσεις δεν είναι ανάγκη να αποτελούνται από πολλές λέξεις. Πολλές φορές χρησιμοποιούμε φράσεις δύο λέξεων.
Αξιολόγηση Πηγών Πληροφόρησης
Σωστό ή λάθος? Η κίνηση του διαδικτύου διπλασιάζεται κάθε 100 ημέρες. Η κίνηση του διαδικτύου διπλασιάζεται κάθε 100 ημέρες. Στο διαδίκτυο οφείλεται το 8% της ηλεκτρικής κατανάλωσης στις Η.Π.Α.
Κριτήρια αξιολόγησης Η αξιολόγηση των πηγών του διαδικτύου πρέπει να βασίζεται σε ορισμένα κριτήρια Πηγή Περιεχόμενο Ύφος και λειτουργικότητα
Πηγή Σε ποιους απευθύνεται η ιστοσελίδα; Αναλογιστείτε την πηγή. Ο συγγραφέας της ιστοσελίδας είναι αναγνωρίσιμος; Ο συγγραφέας είναι ειδικός πάνω στο θέμα που διαπραγματεύεται η ιστοσελίδα; Περισσότερες πληροφορίες Που ανήκει η ιστοσελίδας; Υπάρχει διεύθυνση ηλεκτρονικής αλληλογραφίας για υποβολή ερωτήσεων; Αναλογιστείτε σε ποιους απευθύνεται η ιστοσελίδα ανάλογα με το περιεχόμενο, τον τόνο και το στυλ της. Ανταποκρίνεται στις ανάγκες σας; Αναλογιστείτε την πηγή. Οι μηχανές αναζήτησης συχνά συσσωρεύουν πληθώρα αποτελεσμάτων, πολλά από τα οποία είναι περιθωριακού ενδιαφέροντος ή τελείως άχρηστα. Ο συγγραφέας της ιστοσελίδας είναι αναγνωρίσιμος; Ο συγγραφέας είναι ειδικός πάνω στο θέμα που διαπραγματεύεται η ιστοσελίδα; Ίσως χρειαστεί να ελεγχθεί για περισσότερες πληροφορίες ο βασικός δικτυακός τόπος μέσα στον οποίο ανήκει η ιστοσελίδα. Ανήκει η ιστοσελίδα σε δικτυακό τόπο κατάλληλο για το περιεχόμενό της; Υπάρχει διεύθυνση ηλεκτρονικής αλληλογραφίας για υποβολή ερωτήσεων;
Περιεχόμενο Αναζητήστε προσωπικές γνώμες και σημεία προκατάληψης. Οι πηγές από όπου προέρχονται οι πληροφορίες πρέπει να εμφανίζονται Το βάθος της πληροφορίας πρέπει επίσης να ελέγχεται. Το περιεχόμενο καλύπτει μία ορισμένη χρονική περίοδο ή μία μόνο πτυχή του θέματος; Χρησιμοποιείστε επιπλέον έντυπο και ηλεκτρονικό υλικό για να συμπληρώστε τις πληροφορίες. Ελέγξτε αν η ιστοσελίδα έχει ανανεωθεί πρόσφατα βάση της ημερομηνίας της ιστοσελίδας Η ακρίβεια του περιεχομένου είναι μία πολύ σημαντική παράμετρος που πρέπει να διερευνηθεί. Ποτέ δεν πρέπει να δεχόμαστε για δεδομένες τις πληροφορίες που περιλαμβάνει μία ιστοσελίδα. Οι ιστοσελίδες σπάνια ελέγχονται αναλυτικά όπως τα περιοδικά και τα βιβλία. Αναζητήστε προσωπικές γνώμες και σημεία προκατάληψης. Οι πηγές από όπου προέρχονται οι πληροφορίες πρέπει να εμφανίζονται είτε η δουλειά είναι αυθεντική ή δανεισμένη από αλλού. Το βάθος της πληροφορίας πρέπει επίσης να ελέγχεται. Καθορίστε αν το περιεχόμενο καλύπτει μία ορισμένη χρονική περίοδο ή μία μόνο πτυχή του θέματος. Χρησιμοποιείστε επιπλέον έντυπο και ηλεκτρονικό υλικό για να συμπληρώστε τις πληροφορίες. Ελέγξτε αν η ιστοσελίδα έχει ανανεωθεί πρόσφατα βάση της ημερομηνίας της ιστοσελίδας
Ύφος και λειτουργικότητα Υπάρχουν υπερσυνδέσεις σχετικές και κατάλληλες. Είναι οι δικτυακοί τόποι που παραπέμπουν οι υπερσυνδέσεις είναι οι καταλληλότεροι; Διερευνείστε επιπλέον δικτυακούς τόπους πάνω στο θέμα. Ο δικτυακός τόπος πρέπει να είναι καθαρά και λογικά οργανωμένος σε υποενότητες. Το στυλ του κειμένου πρέπει να είναι κατάλληλο για το ακροατήριο που απευθύνεται. Εύκολη πλοήγηση - Εσωτερικές υπερσυνδέσεις στις μεγάλες ιστοσελίδες - εξωτερικές υπερσυνδέσεις πρέπει να είναι όλες ενεργές - αναζήτηση. Πρέπει να υπάρχουν υπερσυνδέσεις σχετικές και κατάλληλες. Μην θεωρείστε ότι οι δικτυακοί τόποι που παραπέμπουν οι υπερσυνδέσεις είναι οι καταλληλότεροι που υπάρχουν. Διερευνείστε επιπλέον δικτυακούς τόπους πάνω στο θέμα. Ο δικτυακός τόπος πρέπει να είναι καθαρά και λογικά οργανωμένος σε υποενότητες. Το στυλ του κειμένου πρέπει να είναι κατάλληλο για το ακροατήριο που απευθύνεται. Ο δικτυακός τόπος πρέπει να είναι εύκολος στην πλοήγηση και να περιλαμβάνει πλήκτρα πίσω, εμπρός, αρχικής σελίδα κ.λ.π. Πρέπει να υπάρχουν εσωτερικές υπερσυνδέσεις στις μεγάλες ιστοσελίδες. Οι εξωτερικές υπερσυνδέσεις πρέπει να είναι όλες ενεργές. Σε περίπτωση που ο δικτυακός τόπος είναι μεγάλος πρέπει να παρέχεται εσωτερική αναζήτηση.
Κατηγορίες ιστοσελίδων Οι ιστοσελίδες μπορούν να χωριστούν σε 5 βασικές κατηγορίες: Πληροφοριακές ιστοσελίδες Ειδησεογραφικές ιστοσελίδες Προσωπικές ιστοσελίδες Προπαγανδιστικές ιστοσελίδες (οργανισμοί, κόμματα, κινήματα, οργανώσεις) Εμπορικές ιστοσελίδες
Βασικά κριτήρια Παραδείγματα Εγκυρότητα Ακρίβεια Αντικειμενικότητα Επικαιρότητα Κάλυψη Παραδείγματα
Πληροφοριακή ιστοσελίδα (1/5) Μία πληροφοριακή ιστοσελίδα έχει σαν σκοπό να παρουσιάσει τεκμηριωμένη πληροφόρηση. H διεύθυνση της ιστοσελίδας έχει συνήθως κατάληξη .edu ή .gov (για ιστοσελίδες των Η.Π.Α.), καθώς οι περισσότερες ιστοσελίδες ανήκουν σε δικτυακούς τόπους εκπαιδευτικών ιδρυμάτων ή κυβερνητικών υπηρεσιών. Για παράδειγμα τέτοιου τύπου ιστοσελίδες περιλαμβάνουν λεξικά, θησαυροί, οδηγοί, δρομολόγια, παρουσιάσεις προγραμμάτων κ.λ.π.
Πληροφοριακή ιστοσελίδα (2/5)
Πληροφοριακή ιστοσελίδα (3/5)
Πληροφοριακή ιστοσελίδα (4/5)
Πληροφοριακή ιστοσελίδα (5/5)
Ειδησεογραφική ιστοσελίδα (1/5) Μία ειδησεογραφική ιστοσελίδα έχει σαν πρωταρχικό σκοπό την παροχή εξαιρετικά πρόσφατης πληροφόρησης. Η διεύθυνση της συνήθως τελειώνει σε .com.
Ειδησεογραφική ιστοσελίδα (2/5)
Ειδησεογραφική ιστοσελίδα (3/5)
Ειδησεογραφική ιστοσελίδα (4/5)
Ειδησεογραφική ιστοσελίδα (5/5)
Προσωπική ιστοσελίδα (1/3) Μία προσωπική ιστοσελίδα ιστοσελίδα περιλαμβάνει πληροφορίες για έναν ιδιώτη. Συνήθως βρίσκεται κάτω από τον δικτυακό τόπο ενός παροχέα ή ενός οργανισμού, εκπαιδευτικού ιδρύματος κ.λ.π.
Προσωπική ιστοσελίδα (2/3)
Προσωπική ιστοσελίδα (3/3)
Χρήσιμες συνδέσεις Βιβλιογραφία http://searchenginewatch.com/ http://www.searchengineguide.com/ Βιβλιογραφία Έρευνα & Συλλογή Πληροφοριών στο Διαδίκτυο, Εκδόσεις Τζιόλα, 2004.