Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Okapi Formula (BM25) Γιαννάκης Παναγιώτης (Α.Μ. 181) Κωλέτσου Ευτυχία (Α.Μ. 185) Πιλαλίδου Αλεξάνδρα (Α.Μ. 174)

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Okapi Formula (BM25) Γιαννάκης Παναγιώτης (Α.Μ. 181) Κωλέτσου Ευτυχία (Α.Μ. 185) Πιλαλίδου Αλεξάνδρα (Α.Μ. 174)"— Μεταγράφημα παρουσίασης:

1 Okapi Formula (BM25) Γιαννάκης Παναγιώτης (Α.Μ. 181) Κωλέτσου Ευτυχία (Α.Μ. 185) Πιλαλίδου Αλεξάνδρα (Α.Μ. 174)

2 Εισαγωγή (1/2) Αναπτύχθηκε στο City University London. Αρχικά σχεδιάστηκε για μικρούς καταλόγους με κείμενα μικρού μεγέθους. Πειραματικά έχει πετύχει καλά αποτελέσματα στο TREC

3 Εισαγωγή (2/2) Βασίζεται στο πιθανοκράτικο μοντέλο. Επηρεάζεται από την συχνότητα εμφάνισης των όρων και το μήκος των εγγράφων. Μοντελοποιεί την συχνότητα εμφάνισης των λέξεων σαν μια μεικτή κατανομή Poisson δύο όρων. Η μία κατανομή είναι τα σχετικά έγγραφα και η άλλη είναι τα μη σχετικά.

4 OKAPI τύπος Αναζήτησης idf-weighting (1/2). Είναι απλούστερος τρόπος αναζήτησης των εγγράφων που περιέχουν τους όπως του ερωτήματος. N: πλήθος εγγράφων df t : πλήθος εγγράφων που περιέχουν τον όρο t

5 OKAPI τύπος Αναζήτησης idf-weighting (2/2). Αν ένας όρος υπάρχει σε παραπάνω από τα μισά έγγραφα της συλλογής, προκύπτει αρνητικό απότέλεσμα.

6 OKAPI τύπος Αναζήτησης χρήση tf td και L d/ave. tf td : συχνότητα εμφάνισης του όρου t στο έγγραφο d. k 1 : παράμετρος που επηρεάζει την tf td b: παράμετρος που επηρεάζει το μήκος του εγγράφου L d : μήκος εγγράφου d L ave : μέσος όρος του μήκους των εγγράφων

7 OKAPI τύπος Αναζήτησης χρήση tf tq. tf tq : συχνότητα εμφάνισης του όρου t στην ερώτηση q. k 3 : παράμετρος που επηρεάζει την tf tq

8 OKAPI τύπος Αναζήτησης πλήρης τύπος. Πειραματικά έχει επιδεχθεί ότι αποδοτικές τιμές για τις παραμέτρους είναι: 1.2=

9 Άσκηση Documents d1: a, b d2: a, b, a, b d3: a, b, a, b, c d4: a, b, c d5: a, a, c Queries q1: a, b q2: a q3: c q4: a, c

10 Κάνοντας πράξεις έχουμε: ΕρώτημαS a,bd1, d2, d3 ad2, d3, d4, d5 cd1, d3, d5 a,cd2, d3, d5 Ssasa sbsb scsc caca cbcbc q1333-log(7/5) - q242--log3-- q log(10/6) q433-2log(7/5)-log(10/6) Επιπλέον N=5 df a =5, df b =4, df c =3

11 Παραδείγματα εφαρμογής Για q=a, b υπολογίζουμε αναλυτικά των τύπο ομοιότητας tf ad1= 1, tf bd1= 1, tf aq1= 1, tf bq1= 1 k1=1.5, k3=1.5, b=0.75, L d = 2, L ave = 3.4

12 q1: a, b dDocument vectors dl abc q Sim(d1,q1)=1,17 Sim(d2,q1)=1,29 Sim(d3,q1)=1,19 Sim(d4,q1)=1,01 Sim(d5,q1)=0,71

13 q2: a dDocument vectors dl abc q21.01 Sim (d1,q2)= 1,92 Sim (d2,q2)= 2,13 Sim (d3,q2)= 1,95 Sim (d4,q2)= 1,66 Sim (d5,q2)= 2,33

14 q3: c dDocument vectors dl abc q31.01 Sim (d1,q3)= 0 Sim (d2,q3)= 0 Sim (d3,q3)= 0,6 Sim (d4,q3)= 0,77 Sim (d5,q3)= 0,77

15 q4: a, c Sim (d1,q4)= 0,63 Sim (d2,q4)= 0,83 Sim (d3,q4)= 1,45 dDocument vectors dl abc q Sim (d4,q4)= 1,32 Sim (d5,q4)= 1,89

16 Ευχαριστούμε για την προσοχή σας!! για την προσοχή σας!!


Κατέβασμα ppt "Okapi Formula (BM25) Γιαννάκης Παναγιώτης (Α.Μ. 181) Κωλέτσου Ευτυχία (Α.Μ. 185) Πιλαλίδου Αλεξάνδρα (Α.Μ. 174)"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google