Άσκηση1 (Vector Space ) Q = gold silver truck Documents D1 = Shipment of gold damaged in a fire D2 = Delivery of silver arrived in a silver truck D3 = Shipment of gold arrived in a truck Έχουμε την παρακάτω λίστα κειμένων : Εισάγουμε το Query: Ranking ? Ranking ?
Πρέπει να υπολογίσω το παρακάτω για όλα τα κείμενα
Q = gold silver truck Documents D1 = Shipment of gold damaged in a fire D2 = Delivery of silver arrived in a silver truck D3 = Shipment of gold arrived in a truck Terms shipment/ of/ gold /damaged /in /a /fire /delivery /silver /arrived / truck
Terms shipment/ of/ gold /damaged /in /a /fire /delivery /silver /arrived / truck TermQD1D2D3 niN/niidfiWi,qWi,D1Wi,D2Wi,D ,50, ,50, , , ,50, ,50,1761 0
Ranking doc 2 doc 3 doc 1 Ranking doc 2 doc 3 doc 1
Άσκηση 2 (Περικοπη IF) Α) Έστω ότι περικόπτουμε το I F κατά 75% στο I P1 και μπορεί να ικανοποιήσει 40% των ερωτήσεων. Β) Έστω ότι περικόπτουμε το I F κατά 50% στο I P2 και μπορεί να ικανοποιήσει 80% των ερωτήσεων. Α) Έστω ότι περικόπτουμε το I F κατά 75% στο I P1 και μπορεί να ικανοποιήσει 40% των ερωτήσεων. Β) Έστω ότι περικόπτουμε το I F κατά 50% στο I P2 και μπορεί να ικανοποιήσει 80% των ερωτήσεων. Μηχανή Αναζήτησης δέχεται ένα σύνολο από 5000 queries/sec. Το I F μπορεί να αποθηκευθεί σε 4 μηχανήματα. Ένα αντίγραφο του I F εξυπηρετεί 1000 queries/sec. Ποιο πρέπει να προτιμήσουμε ;
Επίπεδο 1 Επίπεδο 2 Ip1 A)
Επίπεδο 1 Επίπεδο 2 Ip2 B)
Επίπεδο 1 Επίπεδο 2 Ip2 B) A) 17 μηχανήματα B) 14 μηχανήματα A) 17 μηχανήματα B) 14 μηχανήματα