Ενότητα 11 : Ο αλγόριθμος PageRank της Google Δρ. Γκόγκος Χρήστος

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Τέλος Ενότητας.
Advertisements

Ενότητα 7 : Ισορροπία αγοράς Καραμάνης Κωνσταντίνος
1 Μικροοικονομική Ενότητα 9 : Παραγωγική διαδικασία Καραμάνης Κωνσταντίνος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
Χρηματοοικονομική των Επιχειρήσεων, Ενότητα : Βέλτιστη Κεφαλαιακή Δομή, ΤΜΗΜΑ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΉΣ ΚΑΙ ΛΟΓΙΣΤΙΚΗΣ, ΤΕΙ ΗΠΕΙΡΟΥ – Ανοικτά Ακαδημαϊκά Μαθήματα.
Χρηματοοικονομική των Επιχειρήσεων, Ενότητα : Βέλτιστη Κεφαλαιακή Δομή, ΤΜΗΜΑ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΉΣ ΚΑΙ ΛΟΓΙΣΤΙΚΗΣ, ΤΕΙ ΗΠΕΙΡΟΥ – Ανοικτά Ακαδημαϊκά Μαθήματα.
1 Αρχές Μάρκετινγκ Δημιουργία και Δέσμευση Αξίας Πελατών Στάδιο 3 ο Προετοιμασία ενός σχεδίου και προγράμματος ολοκληρωμένου Μάρκετινγκ Τριάρχη Ειρήνη.
1 Διεθνή Λογιστικά Πρότυπα Διανομή – Διακοπείσες Δραστηριότητες Χύτης Ευάγγελος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
1 Διεθνή Λογιστικά Πρότυπα Ασώματα Πάγια Χύτης Ευάγγελος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
1 Αντικειμενοστραφής Προγραμματισμός Ενότητα 12 : Επαναληπτικές Ασκήσεις (3/3) Ιωάννης Τσούλος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
1 Διεθνή Λογιστικά Πρότυπα Κατασκευαστικά Έργα Χύτης Ευάγγελος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
Μακροοικονομική Ενότητα : Οικονομική μεγέθυνση (Μέρος Α) Καραμάνης Κωνσταντίνος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
1 Ενοποιημένες Χρηματοοικονομικές Καταστάσεις Δομή ομίλου Εταιρειών και προσδιορισμός του ποσοστού συμμετοχής Δρ. Χύτης Ευάγγελος Ελληνική Δημοκρατία Τεχνολογικό.
1 Μηχανογραφημένη Λογιστική ΙI Διαφύλαξη Λογιστικών Αρχείων (Άρθρο 7) Χύτης Ευάγγελος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
ΕΙΣΑΓΩΓΗ ΣΤΗ ΛΟΓΙΣΤΙΚΗ ΕΝΟΤΗΤΑ :Ισοζύγιο Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
Εισαγωγή στη λογιστική, Ενότητα : Ημερολογιακές εγγραφές, ΤΜΗΜΑ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΉΣ ΚΑΙ ΛΟΓΙΣΤΙΚΗΣ ΤΕΙ ΗΠΕΙΡΟΥ – Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ηπείρου.
1 Διεθνή Λογιστικά Πρότυπα Παραδείγματα της λογιστικής του Leasing σύμφωνα με το ελληνικό θεσμικό πλαίσιο και τα ΔΛΠ Χύτης Ευάγγελος Ελληνική Δημοκρατία.
1 Μηχανογραφημένη Λογιστική Ι Ενότητα 13: Αυθεντικότητα Τιμολογίου Άρθρο 15 Χύτης Ευάγγελος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
1 Πληροφορική Ι Ενότητα 10 : Ασφάλεια Δρ. Γκόγκος Χρήστος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
1 Ενοποιημένες Χρηματοοικονομικές Καταστάσεις Το θεσμικό πλαίσιο στην Ελλάδα Δρ. Χύτης Ευάγγελος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
1 Ενοποιημένες Χρηματοοικονομικές Καταστάσεις Λογιστικές Διαδικασίες για την κατάρτιση ΕΟΚ Δρ. Χύτης Ευάγγελος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό.
1 Οικονοµική Εργασίας και Εργασιακές Σχέσεις Εργατικά Σωματεία Καραµάνης Κώστας Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
1 Οικονοµική Εργασίας και Εργασιακές Σχέσεις Εργατικά Σωματεία Καραµάνης Κώστας Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
ΕΙΣΑΓΩΓΗ ΣΤΗ ΛΟΓΙΣΤΙΚΗ ΕΝΟΤΗΤΑ :Λογιστική ισότητα και ισολογισμός Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
Τμήμα Τεχνολόγων Γεωπόνων Τίτλος Μαθήματος: ΚΑΛΛΩΠΙΣΤΙΚΑ ΔΕΝΤΡΑ ΚΑΙ ΘΑΜΝΟΙ Ενότητα 12: Οδηγίες δημιουργίας φυτολογίου Γρηγόριος Βάρρας Αν. Καθηγητής Άρτα,
ΗΛΕΚΤΡΟΝΙΚΟ ΕΜΠΟΡΙΟ Ενότητα 12 : Η χρήση της MySQL στο Ηλεκτρονικό εμπόριο (ΙΙI) Ιωάννης Τσούλος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου.
Εισαγωγή στη λογιστική, Ενότητα :Προσδιοριστικοί παράγοντες του λογιστικού αποτελέσματος, ΤΜΗΜΑ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΉΣ ΚΑΙ ΛΟΓΙΣΤΙΚΗΣ, ΤΕΙ ΗΠΕΙΡΟΥ – Ανοικτά.
Εισαγωγή στη λογιστική, Ενότητα :Μεταβολές της οικονομικής κατάστασης, ΤΜΗΜΑ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΉΣ ΚΑΙ ΛΟΓΙΣΤΙΚΗΣ, ΤΕΙ ΗΠΕΙΡΟΥ – Ανοικτά Ακαδημαϊκά Μαθήματα.
Προγραμματισμός κινητών συσκευών
Ενότητα 7 : Χρήση Πινάκων στο Ηλεκτρονικό εμπόριο (I) Ιωάννης Τσούλος
Μακροοικονομική Ενότητα: Χρήμα και νομισματικό σύστημα (Μέρος Δ)
Μηχανογραφημένη Λογιστική Ι
Προγραμματισμός κινητών συσκευών
Προγραμματισμός Διαδικτύου
Ανοιχτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ηπείρου
Προγραμματισμός κινητών συσκευών
Λειτουργικά Συστήματα
Ενότητα 3 : Αναπαράσταση αριθμών στο δυαδικό σύστημα
Ενοποιημένες Χρηματοοικονομικές Καταστάσεις
Ενότητα 5 : Δομές Δεδομένων και αφηρημένοι
Προγραμματισμός Διαδικτύου
Ενότητα 3 : Αναπαράσταση αριθμών στο δυαδικό σύστημα
Λειτουργικά Συστήματα
Προγραμματισμός Διαδικτύου
Μάθημα : Ενοποιημένες Χρηματοοικονομικές Καταστάσεις
Διεθνή Λογιστικά Πρότυπα
Χρηματοοικονομική των Επιχειρήσεων
Ανοιχτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ηπείρου
Διεθνή Λογιστικά Πρότυπα
Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Ενότητα 10 : Κατασκευή ΝΠΑ Αλέξανδρος Τζάλλας
Ενότητα 9 : Παραγωγική διαδικασία Καραμάνης Κωνσταντίνος
Ενότητα 4 : Τελεστές της γλώσσας PHP Ιωάννης Τσούλος
Ενότητα 2 : Το σύστημα βάσεων δεδομένων MySQL (II) Ιωάννης Τσούλος
Προγραμματισμός κινητών συσκευών
Διεθνή Λογιστικά Πρότυπα
Εισαγωγή στις εικαστικές τέχνες
Προγραμματισμός κινητών συσκευών
Ενότητα 7 : Ισορροπία αγοράς Καραμάνης Κωνσταντίνος
Διεθνή Λογιστικά Πρότυπα
Λιθογραφία – Όφσετ (Θ) Ενότητα 8.2: Εκτυπωτική Διαδικασία Μηχανής
Διεθνή Λογιστικά Πρότυπα
Γεωργική Χημεία Ενότητα 1 : Γενικές αρχές χημείας, άτομα και μόρια
Γεωργική Χημεία Ενότητα 6: Οξέα, βάσεις, pH, γινόμενο διαλυτότητας
ΕΙΣΑΓΩΓΗ ΣΤΗ ΛΟΓΙΣΤΙΚΗ
Προγραμματισμός Διαδικτύου
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ
Προγραμματισμός κινητών συσκευών
Ενότητα 1: ……………….. Όνομα Επώνυμο Τμήμα __
Προγραμματισμός κινητών συσκευών
Μεταγράφημα παρουσίασης:

Ενότητα 11 : Ο αλγόριθμος PageRank της Google Δρ. Γκόγκος Χρήστος Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Πληροφορική Ι Ενότητα 11 : Ο αλγόριθμος PageRank της Google Δρ. Γκόγκος Χρήστος

Ανοιχτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ηπείρου Τμήμα Χρηματοοικονομικής & Ελεγκτικής (Παράρτημα Πρέβεζας) Πληροφορική Ι Ενότητα 11 : Ο αλγόριθμος PageRank της Google Δρ. Γκόγκος Χρήστος Επίκουρος Καθηγητής Άρτα, 2015

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς.

Χρηματοδότηση Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο TEI Ηπείρου» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα.

Η μηχανή αναζήτησης Google Το Google ξεκίνησε σαν μια κολεγιακή εργασία από τον Larry Page και τον Sergey Brin το 1996 με σκοπό την κατασκευή μιας μηχανής αναζήτησης Το όνομα Google είναι παραφθορά του Googol = 10100 (1 μονάδα ακολουθούμενη από 100 μηδενικά) Το όνομα της εταιρείας έχει γίνει ρήμα (Google it!) Αριθμός υπαλλήλων: 28768 (2011-06-30)

Work in Progress Κάθε χρόνο η Google πραγματοποιεί περί τις 500 βελτιώσεις στην μηχανή αναζήτησής της. Κάθε 2 περίπου χρόνια η Google κάνει μια σημαντική αναβάθμιση στην μηχανή αναζήτησης της. Το γεγονός ότι η αναβάθμιση γίνεται ενώ η μηχανή αναζήτησης είναι σε λειτουργία αποτελεί μεγάλη τεχνολογική πρόκληση.

Google’s Mission Statement Οργάνωση της πληροφορίας όλου του κόσμου. Google’s slogan: Don’t be evil.

Ανταγωνιστές Yahoo! Microsoft Bing: Δυναμικές εξαγορές (π.χ. FlatRate) και συμφωνίες (Yahoo). Εστιάζει σε κάθετες αγορές (π.χ. αεροπορικά εισιτήρια, υγεία) Ask HotBot Altavista

Ιστορία της μηχανής αναζήτησης Google (1997-2009) Σεπτέμβριος 1997. Η μηχανή αναζήτησης ονομάζεται Google από Backrub. Κατατάσσει τις σελίδες με βάση τον αριθμό και την ποιότητα των εισερχόμενων συνδέσμων Αύγουστος 2001. Ο αλγόριθμος γράφετε από την αρχή για να είναι εύκολη η προσθήκη νέων κριτηρίων Φεβρουάριος 2003. Η Google λαμβάνει την πρώτη της πατέντα για την «τοπική ανάλυση συνδεσιμότητας» (local connectivity analysis) σύμφωνα με την οποία δίνεται μεγαλύτερη βαρύτητα σε σημαντικές ιστοσελίδες. Καλοκαίρι 2003. Fritz. Ο κώδικας αναβαθμίζεται έτσι ώστε να ενημερώνει τους καταλόγους συνεχώς και όχι σε δέσμες. Ιούνιος 2005. Διάθεση αποτελεσμάτων που εξαρτώνται από προηγούμενες αναζητήσεις του χρήστη. Δεκέμβριος 2005. Αναβάθμιση κώδικα έτσι ώστε να γίνεται αναλυτικότερη αναζήτηση για πληροφορίες που μπορούν να συλλεχθούν από το διαδίκτυο. Μάιος 2007. Αναζήτηση με ταυτόχρονη παρουσίαση αποτελεσμάτων σε ιστοσελίδες, εικόνες, βίντεο, ειδήσεις και βιβλία Δεκέμβριος 2009. Αναζήτηση σε πραγματικό χρόνο. Εμφάνιση σελίδων από blogs και Twitter μόλις ανέβουν στο Internet

Web search Προγράμματα της Google (spiders) περιφέρονται στον παγκόσμιο ιστό και συλλέγουν τα περιεχόμενα όλων των σελίδων που είναι προσπελάσιμες. Τα δεδομένα αυτά ταξινομούνται σε ένα ευρετήριο οργανωμένο κατά λέξη. Κάθε φορά που ο χρήστης κάνει μια αναζήτηση εντοπίζονται στο ευρετήριο σχετικές σελίδες δημιουργώντας μια λίστα με μέγεθος εκατοντάδων, χιλιάδων ή και εκατομμυρίων σελίδων. Το απαιτητικότερο έργο είναι η κατάταξη των αποτελεσμάτων έτσι ώστε να αποφασιστεί ποια θα είναι τα αποτελέσματα που θα φαίνονται πρώτα στην λίστα.

Αλγόριθμος PageRank Αν και η Google έχει δημοσιοποιήσει κάποια γενικά στοιχεία για τον αλγόριθμο οι λεπτομέρειες υλοποίησης του είναι εταιρικό μυστικό. Ο αλγόριθμος αναθέτει σε κάθε σελίδα που επιστρέφεται ως αποτέλεσμα μια βαθμολογία συνάφειας (relevancy score) που την ονομάζει pagerank και η οποία εξαρτάται: Την συχνότητα και την θέση των λέξεων κλειδιών στην ιστοσελίδα. Αν οι λέξεις κλειδιά εμφανίζονται λίγες φορές λαμβάνει χαμηλό βαθμό. Πόσο χρόνο υπάρχει η σελίδα. Βαθμολογούνται υψηλότερα οι σελίδες με καθιερωμένη παρουσία στο Internet. Τον αριθμό από άλλες σελίδες που δείχνουν προς την σελίδα υπό εξέταση. Μεγάλος αριθμός τέτοιων σελίδων ανεβάζει την βαθμολογία της σελίδας. Εκτός από τους παραπάνω παράγοντες υπάρχουν περίπου 200 άλλοι παράγοντες που συνδιαμορφώνουν την βαθμολογία της κάθε σελίδας.

Συλλογική Νοημοσύνη του Pagerank Η σελίδα C έχει μεγαλύτερο pagerank από την σελίδα Ε παρά το ότι έχει λιγότερες συνδέσεις προς αυτήν. Ο μοναδικός σύνδεσμος που έχει η σελίδα C προέρχεται από μια δημοφιλή ιστοσελίδα και αυτό της δίνει μεγαλύτερη βαθμολογία.

Υπολογισμοί Pagerank Για κάθε κόμβο σχηματίζεται η εξίσωση: PR(A) = (1-d) + d*(PR(t1)/C(t1) + ... + PR(tn)/C(tn)) όπου t1 έως tn είναι οι κόμβοι που δείχνουν προς τον κόμβο Α και C(ti) είναι ο αριθμός των συνδέσμων προς τα έξω που έχει ο κόμβος ti. d είναι ένας συντελεστής με τιμή 0,85 Δημιουργείται ένα σύστημα εξισώσεων. Η λύση του δίνει το pagerank κάθε κόμβου σε σχέση με τους υπόλοιπους κόμβους.

Απλό παράδειγμα Pagerank a = 0,15 + 0,85 (c + b) b = 0,15 + 0,85 (a/2) c = 0,15 + 0,85 (a/2) a 1,4594 48,65% b 0,7702 25,68% c SUM 2,9998  

Παράδειγμα Pagerank A = 0,15 + 0,85 (S + D) B = 0,15 + 0,85 (A/2) Είσοδοι Έξοδοι Alpha 2 Beta 1 Gamma 3 Delta Sigma Rho A = 0,15 + 0,85 (S + D) B = 0,15 + 0,85 (A/2) G = 0,15 + 0,85 (B/2) D = 0,15 + 0,85 (B/2 + G/3) S = 0,15 + 0,85 (A/2 + G/3) R = 0,15 + 0,85 (G/3) A 1,411 32,09% B 0,7499 17,06% G 0,4687 10,66% D 0,6015 13,68% S 0,8827 20,08% R 0,2828 6,43% SUM 4,3966  

Πηγές http://www.wired.com/magazine/2010/02/ff_ google_algorithm/all/1 http://en.wikipedia.org/wiki/Google http://computer.howstuffworks.com/internet/ basics/google.htm http://en.wikipedia.org/wiki/PageRank http://www.webworkshop.net/pagerank.html http://www.sirgroane.net/google-page-rank/

Βιβλιογραφία Forouzan B., Mosharaf F. Εισαγωγή στην επιστήμη των υπολογιστών. Εκδόσεις Κλειδάριθμος (2010) Καρολίδης Δ., Ξαρχάκος Κ.. Εισαγωγή στην πληροφορική και στο διαδίκτυο. Εκδόσεις Άβακας (2008). Σφακιανάκης Μ. Εισαγωγή στην πληροφορική σκέψη. Εκδόσεις Κλειδάριθμος (2003). Τσιτμηδέλης Σ., Τικτοπούλου Ε. Εισαγωγή στην πληροφορική. Πανεπιστημιακές εκδόσεις Αράκυνθος (2009). Γιαγλής Γ. Εισαγωγή στην πληροφορική. Γκιούρδας εκδοτική (2009). Αβούρης Ν., Κουφοπαύλου Ο., Σερπάνος Δ. Εισαγωγή στους υπολογιστές. Εκδόσεις typorama (2004). Biermann A. Σπουδαίες ιδέες στην επιστήμη των υπολογιστών. Πανεπιστημιακές εκδόσεις Κρήτης (2008). Brookshear J.G. Η επιστήμη των υπολογιστών, μια ολοκληρωμένη παρουσίαση. Εκδόσεις Κλειδάριθμος (2009). Ceruzzi P.E. Ιστορία της υπολογιστικής τεχνολογίας. Από τον ENIAC μέχρι το διαδίκτυο. Εκδόσεις Κάτοπτρο (2006).

Σημείωμα Αναφοράς Copyright Τεχνολογικό Ίδρυμα Ηπείρου. Δρ. Γκόγκος Χρήστος. Πληροφορική Ι. Έκδοση: 1.0 Άρτα, 2015. Διαθέσιμο από τη δικτυακή διεύθυνση: http://eclass.teiep.gr/OpenClass/courses/ACC136/ ΔΙΑΤΑΡΑΧΕΣ ΦΩΝΗΣ, Ενότητα 0, ΤΜΗΜΑ ΛΟΓΟΘΕΡΑΠΕΙΑΣ, ΤΕΙ ΗΠΕΙΡΟΥ - Ανοιχτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ηπείρου

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές [1] ή μεταγενέστερη. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, Διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. [1] http://creativecommons.org/licenses/by-nc-nd/4.0/deed.el

Τέλος Ενότητας Επεξεργασία: Ευάγγελος Καρβούνης Άρτα, 2015

Ο αλγόριθμος PageRank της Google Τέλος Ενότητας Ο αλγόριθμος PageRank της Google