Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Τεχνογλωσσία 8 Βασιλική Πουλή Υπεύθυνος : Ευτυχία ΤριανταφύλλουΓεώργιος Μικρός.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Τεχνογλωσσία 8 Βασιλική Πουλή Υπεύθυνος : Ευτυχία ΤριανταφύλλουΓεώργιος Μικρός."— Μεταγράφημα παρουσίασης:

1 Τεχνογλωσσία 8 Βασιλική Πουλή Υπεύθυνος : Ευτυχία ΤριανταφύλλουΓεώργιος Μικρός

2  Κίνητρα  Προηγούμενες έρευνες  Δική μας συνεισφορά  Προσωπικότητα (BFM) – Πολιτικές πεποιθήσεις  Υλοποίηση  Αποτελέσματα  Μελλοντική έρευνα

3  Πρότερη έρευνα αποδεικνύει σχέση προσωπικότητας και γλωσσικών χαρακτηριστικών.  Ισχύει το ίδιο και για τους χρήστες του Facebook (FB);  Τι υποδηλώνουν τα FB status updates για προσωπικότητα;  Μπορούν FB status updates να δώσουν στοιχεία για τις πολιτικές πεποιθήσεις του χρήστη;

4 ●Δημοφιλέστερη ιστοσελίδα κοινωνικής δικτύωσης παγκοσμίως  > 1 δισεκατομμύριο μέλη ●2η θέση δημοτικότητας παγκοσμίως μετά την Google ●Η σελίδα είναι προσβάσιμη σε 70 γλώσσες ➢ ψηφιακή πλατφόρμα: παροχή τεράστιου όγκου δεδομένων έρευνες κοινωνικής υφής, Οικονομικής επιστήμης, Ψυχολογίας ➢ Αποθηκευμένα δεδομένα σε πίνακες βάσης FB → συγκεκριμένα queries & επεξεργασία → συμπεράσματα για τον κάθε χρήστη.

5  Προσωπικότητα:  Συσχετισμός προσωπικότητας με δραστηριότητες στο FB  Συσχετισμός προσωπικότητας με γλωσσικά χαρακτηριστικά σε FB, blogs, γραπτά κείμενα και συνομιλία  Πολιτικές πεποιθήσεις  Αυτόματη ή μη ανάλυση μανιφέστων ή FB Likes.  Δεν υπάρχει συσχετισμός πολιτικών πεποιθήσεων με FB status updates.

6  Σύγκριση αποτελεσμάτων με προηγούμενες μελέτες. LIWC γλωσσικές κατηγορίες (concepts) N-γράμματα (μορφοσυντακτικά χαρακτηριστικά) FB status updates Προσωπικότητα Big5 Πολιτικές κατηγορίες

7 Personality: Openness Conscientiousness Extraversion Agreeableness Neuroticism

8 Openness ενδιαφέρονται για νέες απόψεις καλή επίγνωση των συναισθημάτων Conscientiousness Αξιολογεί το βαθμό της οργάνωσης και της κινητοποίησης προς έναν στόχο. Extraversion Σχετίζεται με την ποσότητα και την ένταση των διαπροσωπικών σχέσεων. Agreeableness Το είδος των διαπροσωπικών σχέσεων που το άτομο προτιμά, από τη συμπάθεια έως τον ανταγωνισμό Neuroticism Aξιολογεί την προσαρμογή σε αντίθεση προς τη συναισθηματική αστάθεια.

9 FB εφαρμογή 2007-2012. 1.FB χρήστες : συμπλήρωση ερωτηματολογίου (πρόβλεψη Big5, πολιτικών, θρησκευτικών…) 2.Άδεια πρόσβασης στα δεδομένα του λογαριασμού τους για συλλογή. 3.20+ εκατομμύρια χρήστες 4.Δεδομένα: Likes, psychometric tests' scores, FB status updates, Big5, πολιτικές

10 FB Status Updates MyPersonality (3GB) 7000 χρήστες με 5 πολιτικές κατηγορίες Political (154) 20ΜΒ 140.000 LIWC 45ΜΒ 145.000 Big5 250ΜΒ 3.000.000 48GB RAM 14 μέρες τελικό δείγμα 1-2 μέρες κάθε πείραμα

11 LIWC 64 γλωσσικές και ψυχολογικές διεργασίες εξαρτάται από γλώσσα, δεν έχει για ελληνικά - Σημασιολογικά χαρακτηριστικά Πολυεπίπεδα ν-γράμματα αυξανομένου μήκους Ανεξάρτητα γλώσσας – μορφοσυντακτικά χαρακτηριστικά Σε FB status updates (~3-15 λέξεις ) ν ={2,3}, επίπεδα λέξης / χαρακτήρων, σύνολο 2000 ν - γράμματα Mikros & Perifanos (2013) σε συγγραφικά κείμενα, emails, blogs, Twitter ( μεγάλο μήκος )

12  Αποδοτική μέθοδος μελέτης προσωπικότητας  Εφαρμογή ανάλυσης κειμένου λέξη - λέξη LIWC Βασικές γλωσσικές διαστάσεις (π.χ. ποσοστό αντωνυμιών, άρθρων κ.τ.λ.). Κατηγορίες που αφορούν προσωπικές υποθέσεις (π.χ. εργασία, σπίτι, δραστηριότητες αναψυχής) Κατηγορία σημείων στίξης (τελείες, κόμματα κ.τ.λ). Κατηγορίες λέξεων ψυχολογικών παραγόντων (+/- συναισθήματα, οικογένεια, φίλοι…)

13 Χαρακτήρες (μορφολογία) Λέξεις (σύνταξη) Επίπεδα Γεια σου τι κάνεις Γεια σου ΓεγειΓεια σου τιγεια ν=2 ν=3 ν=2 ν=4

14 Big5 προσωπικότητα Openness Agreeableness Extraversion Conscientiousness Neuroticism Πολιτικές κατηγορίες Democratic Republican Liberal None Anarchy/anarchist

15 BIG5 – ΓΡΑΜΜΙΚΉ ΠΑΛΙΝΔΡΌΜΗΣΗ ΠΟΛΙΤΙΚΈΣ ΤΑΞΙΝΟΜΗΤΉΣ SVM  Επικαλυπτόμενες : Κάθε χρήστης μπορεί να ανήκει σε μία η περισσότερες κατηγορίες  Συσχέτιση των γλωσσικών χαρακτηριστικών (LIWC & ν - γράμματα ) που τις επηρεάζουν  Μη επικαλυπτόμενες : Τ αξινόμηση σε κάποια από όλες, αποκλείοντας τις υπόλοιπες  Συσχέτιση των γλωσσικών χαρακτηριστικών ( LIWC & ν - γράμματα ) που τις επηρεάζουν Liberal Democrat Republica n Anarchy None

16 ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΠΡΟΒΛΕΨΗ BIG5 SCORES SVM ΤΑΞΙΝΟΜΗΤΗΣ ΔΙΑΧΩΡΙΣΜΟΣ ΠΟΛΙΤΙΚΩΝ ΚΑΤΗΓΟΡΙΩΝ Liberal Democratic

17

18 Σύμφωνα με προηγούμενους χρησιμοποιούν πολλά παροντικά και παρελθοντικά ρήματα. χρήση γνωστικών ρημάτων (know, ought) λέξεις με αρνητικό συναιθηματικά περιεχόμενο (hurt, ugly) Αντίθετα με προηγούμενους συχνές αυτοαναφορές (χρήση αντωνυμιών α΄ προσώπου).

19 Σύμφωνα με προηγούμενους λέξεις με θετικό συναισθηματικά περιεχόμενο (love, sweet), λέξεις που αναφέρονται στη δουλειά (job), συνδέσμους, προσωπικές αντωνυμίες α΄ και γ΄ προσώπου και ρήματα παροντικών και μελλοντικών χρόνων. Αντίθετα με προηγούμενους κάνουν αυτοαναφορές (χρήση προσωπικών αντωνυμιών α΄ προσώπου) δεν προτιμούν ρήματα παρελθοντικού χρόνου.

20 Σύμφωνα με προηγούμενους χρήση πολλών ρημάτων παροντικού χρόνου λέξεις που δηλώνουν βεβαιότητα λέξεις με θετικό συναισθηματικά περιεχόμενο & κοινωνικό περιεχόμενο Αντίθετα με προηγούμενους δεν χρησιμοποιούν ρήματα παρελθοντικού και μελλοντικού χρόνου (εκτός των Gill et al.) επιλέγουν λέξεις και με αρνητικό συναισθηματικά περιεχόμενο (hurt, ugly). χρησιμοποιούν λέξεις που αναφέρονται στην εργασία (job, xerox).

21 Αντίθετα με προηγούμενους δεν επιλέγουν θετικές συναισθηματικά λέξεις (love, sweet) ούτε αυτοαναφορές Επιπλέον στοιχεία ρήματα παρελθοντικού χρόνου, ρήματα γνωστικά, δοξαστικά (think, consider), modals (should, would, could). Εμβόλιμους τύπους και φθόγγους ή συνδυασμό φθόγγων κενού περιεχομένου (hm, umm, er).

22 Σύμφωνα με προηγούμενους πολλές αυτοαναφορές χρήση λέξεων που δηλώνουν άγχος και ανησυχία. Αντίθετα με προηγούμενους δεν επιλέγουν λέξεις με αρνητικό σημασιολογικά περιεχόμενο (hurt, ugly), αλλά με θετικό (love, sweet) δεν κάνουν χρήση μόνο προσωπικών αντωνυμιών α΄ προσώπου αλλά και των άλλων δύο ενικού αριθμού.

23

24  Τοπ -3 ν - γράμματα  ready for the (3word291) ready for the dance!!! (κινητοποίηση)  I can t (3word38) I can t do the job (αξιοπιστία) . My (2word130) installing new lighting...My lower back already hurts (πειθαρχία, φιλοδοξία, εργατικότητα)

25  Τοπ -2 ν - γράμματα  tm (2char168) got you something shinny for Christmas merry Christmas to everyone!! Im secretly batman nightmare revisited best cd EVA!!!  ΤΗ (2char274) HAPPY BIRTHDAY JOHN LENNON I LOVE THE RAIN!! CONGRATULATIONS TO THE WAUTOMA FOOTBALL TEAM

26  Για τις υπόλοιπες 3 κατηγορίες (Openness, Neuroticism, Agreeableness) το μοντέλο δεν έκανε καλή προσαρμογή  Δεν προέκυψαν στατιστικά σημαντικά ν - γράμματα για τον καθορισμό της

27

28 Top-5 LIWC για πολιτικές (37%) pronoun (I, them, itself) bio (biological processes: eat, blood, pain) past (past tense: Went, ran, had) we ( 1st pers plural) inhib (inhibition: block, constrain, stop) Αναρχικοί -> όλα Υπόλοιποι -> αντωνυμίες

29

30 Τοπ N- γράμματα για πολιτικές κατηγορίες (35%) 1... (2 τελείες) (waiting for years……!) 2. in ( I need,..ing, kind, in…) 3. om (some, tomorrow, from, computer, boredom, random) 4. … (3 τελείες) (merely tired…) ● Μ0 (democratic): 100% από ‘om’ ● Μ1 (republican): όλα εξίσου ● Μ2 (liberal): ‘...’,‘..’ [‘in’, ‘om’]. ● Μ4 (anarchy/anarchist): 1 00% ‘in’ ● Μ3 (none): ‘in’, ‘om’.

31 Big5LIWC8.8%Ngrams29% ΠολιτικέςLIWC37%Ngrams35% Πολιτικές LIWC Big5 N- γράμματα Ικανοποιητικό ποσοστό ακρίβειας για εξαιρετικά μικρού μεγέθους κείμενα όπως status updates (5-10 λέξεις κατά μέσο όρο).

32  Συσχέτιση πολιτικών πεποιθήσεων με Big5  Εφαρμογή και σε άλλα κειμενικά είδη ή σε λεγόμενα άλλων κοινωνικών δικτύων (Twitter).  Εφαρμογή επιπλέον υφομετρικών στοιχείων (πχ πολιτικών χαρακτηριστικών).  Υλοποίηση εναλλακτικών μεθόδων μάθησης και σύγκριση αποτελεσμάτων.

33


Κατέβασμα ppt "Τεχνογλωσσία 8 Βασιλική Πουλή Υπεύθυνος : Ευτυχία ΤριανταφύλλουΓεώργιος Μικρός."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google