Μιχάλης Βαφόπουλος Thermi Link, 2011 Aristotle University, Department of Mathematics Master in Web Science supported by Municipality of Veria
Ξέραμε ότι ήταν τεράστιο, αλλά...
δεν πιστεύαμε ότι...
Το νέο οικοσύστημα 1. Μια εφαρμογή του Internet Web=Hypertext+ (HTML,URI, HTTP) +Internet 2. Ένα πληροφοριακό σύστημα Web+χρήστες 3. Το νέο ΟΙΚΟ-σύστημα Αλλάζει η καθημερινή ζωή των χρηστών Δημιουργεί πραγματικότητα
Τι άλλαξε • εμπειρία πλοήγησης σε γνώση, ειδήσεις, πληροφορίες, ανθρώπους, γεγονότα • το μοναδικό σύστημα χωρίς αδειοδότηση από κεντρική αρχή για την συμμετοχή μας • Μηδενικό κόστος αποκεντρωμένης και συλλογικής δια-δημιουργικότητας • Παραγωγή χωρίς τιμή, ιδιοκτησία, αυθεντία 5
Τι άλλαξε • Συλλογική ευφυία • Νέα επιχειρηματικά μοντέλα – Εξέλιξη παλαιών πχ διαφήμιση – Νέοι τρόποι παραγωγής και διάθεσης προϊόντων • Από την μαζική στη δικτυακή κατανάλωση πληροφορίας 6
Νέα διακυβέρνηση • Web foundation (ομπρέλα) – W3Consurtium (τεχνολογίες) – Web Science (επιστημονική μελέτη) – Web in Society (δράση στις τρίτες χώρες) 7
Τεχνολογίες • Υποδομή – (IPv6, Future Internet, Internet of things) • HTML 5 • Linked Data 8
Σήμερα: Web of Documents • Λειτουργεί ως: οικουμενικό σύστημα εγγράφων Είναι σχεδιασμένο για: ανθρώπινη κατανάλωση • Κύρια μέρη: έγγραφα • Σύνδεσμοι μεταξύ: εγγράφων (ή μέρη τους) • Δομή μερών: χαλαρή, ευρεία • νοηματοδότηση αρχείων & συνδέσμων: έμμεση, από ανθρώπους 9
Web of Documents • Απλό, μεγάλο, αδόμητο & οργανωμένο σε σιλό • Αλλά, οι άνθρωποι: – θέλουμε να κάνουμε πράγματα – τα οποία δεν είναι μόνο σε έγγραφα – και διαθέτουμε περιορισμένη ικανότητα άντλησης νοήματος 10
αύριο: Web of Data • Λειτουργεί ως: οικουμενική βάση δεδομένων • Είναι σχεδιασμένο για: πρώτα μηχανές, μετά εμείς • Κύρια μέρη: πράγματα (ή περιγραφή τους) • Σύνδεσμοι μεταξύ: πραγμάτων • Δομή μερών: συμπαγής • νοηματοδότηση αρχείων & συνδέσμων: άμεση 11
The Web of Data. Γιατί και πως; γιατί • ενθαρρύνει την επαναχρησιμοποίηση • μεγιστοποιεί τη δυνατότητα διασύνδεσης • αυξάνει το θετικό αποτέλεσμα δικτύου πως – Resource Description Framework (RDF) – “RDMS with URI” – Linked data = internet + http + RDF 12
The Web of Data. ποιος; • Με εκθετικούς ρυθμούς...όλοι • Data.gov (Ομπάμα) • Data.gov.uk • Europeana • Wikipedia • Australia • Europe • City of London, Berlin… • Google • …. 13
η επιστήμη του Διαδικτύου (Web Science) εξετάζει το Web ως ένα ΟΙΚΟ-σύστημα με σκοπό την: • κατανόηση • διάδοση • κοινωνική συνεισφορά του. Βασίζεται στην διεπιστημονική ανάλυση και δημιουργεί νέα προγράμματα σπουδών.
Web Science Trust • Ξεκίνησε από CSAIL/MIT & University of Southampton • Σήμερα διεθνές 15
Web science timeline 3/18
Πρώτο παγκόσμιο συνέδριο στην Αθήνα
Two magics of Web Science 18
Web 19
Linked Data 20
Web science Γενικό ερώτημα Τι πρέπει να αλλάξει για να γίνει το Διαδίκτυο πιο χρήσιμο Επιστημονική βάση Μαθηματικά, τεχνολογία, οικονομία, συμπεριφορά Ζητήματα • Απειλή: ολιγοπώλια (πχ Google, Facebook) – Ουδετερότητα, ιδιωτικότητα, information accounting • Ευκαιρία: ανάπτυξη – Νέα επιχειρηματικότητα – αναπτυγμένες χώρες: mobile, linked data, συμμετοχή – αναπτυσσόμενες χώρες: βασικές λειτουργίες 3/18
Ευχαριστώ πολύ. ερωτήσεις; 22
Extra material 23
Computational social science • The capacity to collect and analyze massive amounts of data has transformed such fields as biology and physics (i.e. CERN experiment). • This not the case for “computational social science” has been much slower (i.e. economics, sociology, and political science) • But computational social science is happening in Web business (i.e. Google) and governments (i.e. CIA) • How will be emerged in the open academic environment ? 3/18
The Modigliani Test • Show me all the locations of all the original paintings of Modigliani • Daniel Koller showed that you can find this with a SPARQL query on DBpedia Thanks Richard MacManus - ReadWriteWeb
Results of the Modigliani Test • Atanas Kiryakov from Ontotext • Used LDSR – Linked Data Semantic Repository – Dbpedia – Freebase – Geonames – UMBEL – Wordnet Published April 26, 2010:
The Web of Data: why? 29 – encourages reuse – reduces redundancy – maximises its (real and potential) inter- connectedness – enables network effects to add value to data
The Web of Data: how? 30 – current state on the Web • Relational Databases • APIs • XML • CSV • XLS (see EXHIBIT) Computers can’t consume data because: • Different formats & models • Not inter-connected
The Web of Data: how? 31 – we need to create a standard way of publishing Data on the Web (like HTML for docs) This is the Resource Description Framework (RDF) (a simple example here from Juan F. Sequeda), more next semester!)Juan F. Sequeda
Resource Description Framework (RDF) • A data model – A way to model data – Inspired form Relational databases and Logic • RDF is a triple data model • Labeled Graph (semantic networks) • Subject, Predicate, Object
Example: Document on the Web
Databases back up documents IsbnTitleAuthorPublisherIDReleasedData Programming the Semantic Web Toby Segaran1July 2009 …………… PublisherIDPublisherName 1O’Reilly Media …… This is a THING: A book title “Programming the Semantic Web” by Toby Segaran, … THINGS have PROPERTIES: A Book as a Title, an author, …
Data representation in RDF book Programming the Semantic Web Toby Segaran Publisher O’Reilly title name author publisher isbn IsbnTitleAuthorPublisherIDReleasedData Programming the Semantic Web Toby Segaran 1July 2009 PublisherIDPublisherName 1O’Reilly Media
Everything on the web is identified by a URI!
link the data to other data sbn978 Programming the Semantic Web Toby Segaran ublisher1 O’Reilly title name author publisher isbn
consider the data from Revyu.com sbn978 review1 Awesome Book reviewer Juan Sequeda hasReview reviewer description name
start to link data sbn978 Programming the Semantic Web Toby Segaran ublisher1 O’Reilly title name author publisher isbn sbn978 sameAs review1 Awesome Book reviewer Juan Sequeda hasReview hasReviewer description name
Juan Sequeda publishes data too queda.com/id livesIn Juan Sequeda name
Let’s link more data sbn978 review1 Awesome Book reviewer Juan Sequeda queda.com/id hasReview hasReviewer description name sameAs livesIn Juan Sequeda name
And more sbn978 Programming the Semantic Web Toby Segaran ublisher1 O’Reilly title name author publisher isbn sbn978 sameAs review1 Awesome Book reviewer Juan Sequeda queda.com/id hasReview hasReviewer description name sameAs livesIn Juan Sequeda name
Linked data = internet + http + RDF
Linked Data Principles 1.Use URIs as names for things 2.Use URIs so that people can look up (dereference) those names. 3.When someone looks up a URI, provide useful information. 4.Include links to other URIs so that they can discover more things.
Web as a database Linked Data makes the web exploitable as ONE GIANT HUGE GLOBAL DATABASE! Is there any query language like sql? SPARQL… (next semester)
History of LD • Linked Data Design Issues by TimBL July 2006 • Linked Open Data Project WWW2007 • First LOD Cloud May 2007 • 1 st Linked Data on the Web Workshop WWW2008 • 1 st Triplification Challenge 2008 • How to Publish Linked Data Tutorial ISWC2008 • BBC publishes Linked Data 2008 • 2 nd Linked Data on the Web Workshop WWW2009 • NY Times announcement SemTech ISWC09 • 1 st Linked Data-a-thon ISWC2009 • 1 st How to Consume Linked Data Tutorial ISWC2009 • Data.gov.uk publishes Linked Data 2010 • 2 st How to Consume Linked Data Tutorial WWW2010 • 1 st International Workshop on Consuming Linked Data COLD2010 • El.dbpedia.org
What is a Linked Data application/service? Software system that makes use of data on the Web from multiple datasets and that benefits from links between the datasets
Characteristics of Linked Data Applications • Consume data that is published on the web following the Linked Data principles: an application should be able to request, retrieve and process the accessed data • Discover further information by following the links between different data sources: the fourth principle enables this. • Combine the consumed linked data with data from sources (not necessarily Linked Data) • Expose the combined data back to the web following the Linked Data principles • Offer value to end-users
the 5 stars of open linked data ★ make your stuff available on the Web (whatever format) ★★ make it available as structured data (e.g. excel instead of image scan of a table) ★★★ non-proprietary format (e.g. csv instead of excel) ★★★★ use URLs to identify things, so that people can point at your stuff ★★★★★ link your data to other people’s data to provide context
Examples • Data.gov.uk • Swisstrain.ch • LOC • Greece – not in Linked Data! • Fuelprices.gr • E-prices.gr • Et.diavgeia.gov.gr
More Examples • • • • • •
The new Web of Data, Linked Data 52
Two magics of Web Science 53
54
Web 55
Web science core • The transdisciplinary field of Web science is taking the Web as its primary object of study. • One of the envelope questions of Web Science could be what technological and other changes need to be made in order for the Web to work better for more people? • Mathematics and statistics is the base • Enhanced logging system • URI • Business oligopoly • Computational social science arguments 3/18
Computational social science • The capacity to collect and analyze massive amounts of data has transformed such fields as biology and physics (i.e. CERN experiment). • This not the case for “computational social science” has been much slower (i.e. economics, sociology, and political science) • But computational social science is happening in Web business (i.e. Google) and governments (i.e. CIA) • How will be emerged in the open academic environment ? 3/18
Web science epistemology
Science Subject Categorization • What? Autonomous taxonomic trees (i.e. ACM, PACS) • Why? Organize and Communicate scientific knowledge • How? doc, pdf, XML, Ontologies (Systems Biology) • When? Updates every 10 years • Our proposal: – Semantic representation (i.e. SKOS) – Linked to other Science Subject Categorizations – Wiki discussion 59
Top Level A.General B.Web History and Methodology C.Teaching the Web D.Web Technologies E.Web Data and Analysis F.Web Society 60
Web science epistemology
B. Web History and Methodology B.1.General B.2.Forerunners B.3.Pre-Web technologies B.4.Standards B.5.Epistemology B.6.Web Science Theory 62
C. Teaching the Web C.1.General C.2.Pre-college C.3.Undergraduate C.4.Graduate C.5.Other …. 63
D. Web Technologies D.1. General D.2 Web Milieux D.3 Basic Web Architecture D.4 Web 2.0 D.5 Semantic Web/Linked Data D.6 Internet/Web of Things 64
E. Web Data and Analysis E.1. General E.2 Mathematical and Quantitative Methods (early draft) 65
F. Web Society F.1.Economics and Business F.2. Social Engagement and Social Science F.3. Personal Engagement and Psychology F.4.Law F.5.Politics and Governance 66
Two “magics” of WS • keynote-tbl/#%283%29 keynote-tbl/#%283%29 67
Limited SEARCH capacity Search for: Football Players who went to the University of Texas at Austin, played for the Dallas Cowboys as Cornerback (Juan F. Sequeda) 68
Google, Bing, yahoo! irrelevant 69
Wikipedia through LD: relevant 70
Ερευνητική υπόθεση: ιδιωτικότητα 15/18
πως γεννήθηκε 72
See also