Πλαίσιο Υπηρεσιών για τη Χρήση του Κοινωνικού Διαδικτύου σαν Δίκτυο Αισθητήρων : Αναγνώριση Γεγονότων σε Πραγματικό Χρόνο με τη Χρήση Χωρικών, Χρονικών και Σημασιολογικών Αναφορών A Services’ Framework for Using the Social Web as Sensor Web: Identifying Events in Real Time using Spatial, Temporal and Semantic References (SUSS) Επιστημονικώς Υπεύθυνη : Λ. Θεοδωρίδου, ΚΟΕ : Γ. Αντωνίου, Δ. Κοτζίνος, Δ. Πλεξουσάκης, Ν. Σπυράτος, Β. Χριστοφίδης ΟΕΣ : Γ. Καριώτης, Π. Καζάκης, Σ. Κλεισαρχάκη, Ν. Πεταλίδης
Βασική ιδέα 2 Προτείνεται ένα νέο μοντέλο υπηρεσιών του ιστού πάνω από ιστοτόπους κοινωνικής δικτύωσης βασισμένο στα γεγονότα. Η επικρατούσα κατάσταση : ατομοκεντρικό μοντέλο η πληροφορία περιστρέφεται γύρω από το άτομο που κάνει την καταχώριση Πρόταση : γεγονοκεντρικό μοντέλο όπου το σημαντικότερο ρόλο τον έχει το γεγονός που εξελίσσεται σε πραγματικό χρόνο και το οποίο φέρει και όλη την πληροφορία που το αφορά, ανεξάρτητα αν αυτή προέρχεται από διαφορετικούς χρήστες.
Διάρθρωση του έργου – Πακέτα Εργασίας 1 & 2 3 ΠΕ 1: Ανάλυση της υπάρχουσας βιβλιογραφίας και εφαρμογών καθώς και των δυνατοτήτων που παρέχουν οι διάφορες υπηρεσίες κοινωνικής δικτύωσης ΠΕ 1 Δ 1: Βιβλιογραφική Ανασκόπηση - Χρονική Διάρκεια : 06 μήνες ΠΕ 1 Δ 2: Ανάλυση των δυνατοτήτων που παρέχουν οι διάφορες προγραμματιστικές διεπαφές (APIs) των εφαρμογών και ιστοτόπων κοινωνικής δικτύωσης και οι δυνατότητες χρήσης τους. - Χρονική Διάρκεια : 06 μήνες ΠΕ 2: Σχεδίαση και Ανάπτυξη του Πλαισίου Αναγνώρισης Γεγονότων σε Πραγματικό Χρόνο με βάση καταχωρίσεις σε κοινωνικά δίκτυα ΠΕ 2 Δ 1: Λειτουργικές προδιαγραφές - Χρονική Διάρκεια : 06 μήνες ΠΕ 2 Δ 2: Ανάλυση Απαιτήσεων - Χρονική Διάρκεια : 06 μήνες ΠΕ 2 Δ 3: Υλοποίηση του Πλαισίου με τη μορφή Υπηρεσιών Διαδικτύου - Χρονική Διάρκεια : 12 μήνες ΠΕ 2 Δ 4: Παροχή προγραμματιστικής διεπαφής (API) για τη χρήση του πλαισίου από προγράμματα - πελάτες - Χρονική Διάρκεια : 03 μήνες
Διάρθρωση του έργου – Πακέτα Εργασίας 3 & 4 4 ΠΕ 3: Διεπαφή Χρήσης (UI) του πλαισίου για τον τελικό χρήστη ΠΕ 3 Δ 1: Χρηστικές προδιαγραφές της διεπαφής χρήστη (UI) - Χρονική Διάρκεια : 03 μήνες ΠΕ 3 Δ 2: Ανάπτυξη της διεπαφής χρήστη (UI) - Χρονική Διάρκεια : 06 μήνες ΠΕ 4: Δοκιμή, Έλεγχος και Διόρθωση Λαθών του Λογισμικού και Παράδοσή του σε Δημόσια Χρήση ΠΕ 4 Δ 1: Έλεγχος και Διόρθωση Λαθών - Χρονική Διάρκεια : 09 μήνες ΠΕ 4 Δ 2: Αξιολόγηση του λογισμικού - Χρονική Διάρκεια : 03 μήνες
Διάρθρωση του έργου – Παραδοτέα Ολοκληρωμένα 5 Π 1.1: Βιβλιογραφική αναφορά για τη χρήση των εφαρμογών κοινωνικής δικτύωσης σαν δίκτυο αισθητήρων και τις δυνατότητες χρήσης σχημάτων για την χωρική, χρονική και σημασιολογική ανάλυση των δεδομένων τους. Αναφορά και αξιολόγηση των διαφορετικών APIs με γνώμονα τη χρήση τους σαν βάση για την κατασκευή ενός προγραμματιστικού πλαισίου κοινωνικών αισθητήρων. Π 2.1: Περιγραφή των λειτουργικών προδιαγραφών και των απαιτήσεων του πλαισίου αναγνώρισης γεγονότων από τις καταχωρίσεις των χρηστών. Π 2.2: Ένα σύνολο από υπηρεσίες διαδικτύου (web services) υλοποιημένες σαν ενδιάμεσο λογισμικό και ανοικτές προς όλους : θα διατίθεται το λογισμικό σαν λογισμικό ανοικτού κώδικα αλλά και θα υπάρχει μια διεπαφή χρήσης του από οποιονδήποτε χωρίς να απαιτείται εγκατάσταση των υπηρεσιών. Θα είναι η έκδοση 1.0 του λογισμικού. Π 2.3: Τεκμηρίωση της προγραμματιστικής διεπαφής πρόσβασης στο πλαίσιο ( με μορφή ανάλογη του περιβάλλοντος ανάπτυξης που θα χρησιμοποιηθεί /Javadocs) Π 3.1: Η έκδοση 1.0 του λογισμικού της διεπαφής χρήστη (UI).
Διάρθρωση του έργου – Παραδοτέα 6 Π 4.1: Η έκδοση 2.0 τόσο του ενδιάμεσου λογισμικού των υπηρεσιών όσο και της διεπαφής (UI). Π 4.2: Ιστότοπος με την τεκμηρίωση και τον κώδικα τόσο του πλαισίου όσο και της εφαρμογής χρήστη. (*) Π 4.1 και Π 4.2 παραδίδονται στο τέλος του έργου.
Διάρθρωση του έργου 7
Ομάδα Εργασίας 8 Επιστημονικώς Υπεύθυνη : Λίλα Θεοδωρίδου, Καθηγήτρια, ΤΕΙ Κεντρικής Μακεδονίας Κύρια Ερευνητική Ομάδα Γ. Αντωνίου, Καθηγητής, University of Huddersfield, UK Δ. Κοτζίνος, Καθηγητής, University of Cergy Pontoise, FR Δ. Πλεξουσάκης, Καθηγητής, Πανεπιστήμιο Κρήτης, Ελλάδα Ν. Σπυράτος, Καθηγητής, University of Paris Sud, FR Β. Χριστοφίδης, Καθηγητής, Πανεπιστήμιο Κρήτης, Ελλάδα Ομάδα Εξωτερικών Συνεργατών Γ. Καριώτης, Καθ. Εφαρμογών, ΤΕΙ Κεντρικής Μακεδονίας Π. Καζάκης, ΕΤΠ, ΤΕΙ Κεντρικής Μακεδονίας Σ. Κλεισαρχάκη, Ν. Πεταλίδης
Προϋπολογισμός HellasGI 2014, 11 – 12 December Δαπάνες Ανθρώπινου Δυναμικού : ,00 € ΚΟΕ : ,00 € ΟΕΣ : ,00 € Εξοπλισμός : ,00 € Μετακινήσεις : ,00 € Σύνολο : ,00 € Συνεισφορά στο Ίδρυμα : ,00 €
Δημοσιεύσεις 10 2 δημοσιεύσεις σε συνέδρια 2 ακόμη δημοσιεύσεις υπό εξέλιξη 1 πτυχιακή εργασία
Τεχνικά Στοιχεία του Έργου 11
Introduction to Social Media 12 Social media are internet-based applications that build on the foundations of Web 2.0 for supporting increasing social interaction Creation and exchange of User Generated Content (UGC) Social media enabling us to achieve near-real time information awareness Twitter is a famous micro-blogging application
Twitter 13 users tweets/day searches/day new accounts/day 1.500% annual growth API requests/day
Tweets’ Categories 14 Status Answer to “what are you doing now?” Pass Along ReTweet Endorsement (e.g. url) Conversational Response Referral Thematic (#) Hash-tags Spam
Users’ Categories 15 Based on status updates Based Followers versus Followings Receivers Transmitters Conversationalists Observers Famous Personalities Friends
Social Media Analytics Emerging Trends Monitoring: look for words or phrases of high co-occurrence Real World Events Detection: some related words would show an increase in the usage when an event is happening In most of the cases are formulated as a clustering problem: Several machine learning (ML) clustering algorithms have been proposed E.g. k-means, hierarchical, TStream 16
System Architecture HellasGI 2014, 11 – 12 December Presentation Layer User Interactive Interface Service Analytic & Application Layer Main Memory Stream Analysis Model Event Detection Service User Alert Service Data Layer
Relational Model of Twitter HellasGI 2014, 11 – 12 December
Focusing on Content versus Tags 19 Reasons of filtering on content Relate different tags of the same topic Distinction of subtopics Distinction of spams versus non spams Group of tweets without having the same tag Match tweets to a tag
Events 20 Tweets around a common theme Does the language play a role? Spatial and temporal dimension: Happens in a specific place at a specific time Can we identify events that are reported on twitter before being reported by conventional media? Analysis Tweet clustering What is the required threshold to consider a topic interesting? Proportional to: time (duration), cluster, cluster evolution, space, etc.
Usage example and information flow 21
Conclusions 22 Identifying events from social networks can provide real time information the same way sensor deployed on the road or in a building provide real time information on various variables We can rely on information from social networks since it comes from a variety of sources (independence) Information from social networks is multivariable so much harder to manage than sensor based information Fusing information from multiple social networks complicates things even further
Acknowledgements 23 This research is implemented through the Operational Program "Education and Lifelong Learning" and is co- financed by the European Union (European Social Fund) and Greek national funds.
Thank You! 24