ΗΛΕΚΤΡΟΝΙΚΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ ΓΙΑ ΤΗ ΓΛΩΣΣΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΔΙΔΑΣΚΑΛΙΑ

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Α. Αναλυτικό Α’ Γυμνασίου
Advertisements

ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH PROCESSING Τεχνολογία Ορθογραφικής Διόρθωσης Κειμένων Ν.Γλάρος Δρ. Ηλ/γος Μηχανικός.
Γιάννα Αντωνίου Δρ Γλωσσολόγος - Ερευνήτρια ΙΕΛ Τεχνολογίες λογισμικών πολυμέσων για εκπαίδευση και πολιτισμό Δράσεις και Προοπτικές ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ.
ΑΤΟΜΙΚΗ ΕΡΕΥΝΗΤΙΚΗ ΕΡΓΑΣΙΑ
Μετρήσεις στη γλώσσα και ανάλυση του λόγου Γ. Μικρός, Γ. Ταμπουρατζής, Σ. Μαρκαντωνάτου ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ INSTITUTE FOR LANGUAGE & SPEECH.
Επιμόρφωση Εκπαιδευτικών Μέσης Εκπαίδευσης για τα Νέα Αναλυτικά Προγράμματα Πληροφορικής και Επιστήμης Η/Υ Διδακτικές προσεγγίσεις στο μάθημα της Πληροφορικής.
Τμήμα Εκπαιδευτικής Τεχνολογίας (ΤΕΤ) Ινστιτούτο Επεξεργασίας του Λόγου Φιλογλωσσία Διδασκαλία της Ελληνικής ως ξένης γλώσσας (2η Δράση του ΙΕΛ στην Γλωσσική.
ΟΡΟΛΟΓΙΑ Στην ΚτΠ: Χρησιμότητα στον Δημόσιο Τομέα ή Η σημασία της γνώσης των όρων για αποτελεσματική πρόσβαση στην πληροφορία Γ. Καραγιάννης Καθηγητής.
«Γραμματική Ε΄ και Στ΄ Δημοτικού»
Πρόγραμμα Επιμόρφωσης Β΄ Επιπέδου Ειδικό Μέρος Πρωτοβάθμιας Εκπαίδευσης (κλάδοι ΠΕ60-70) ΕΠΙΜΟΡΦΩΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΣΤΗ ΧΡΗΣΗ ΚΑΙ ΑΞΙΟΠΟΙΗΣΗ ΤΩΝ ΤΠΕ ΣΤΗΝ.
Εισηγητής:Στέφανος Μέτης
Μοντέλο Διδασκαλίας Φυσικών Επιστήμων, για την Υποχρεωτική Εκπαίδευση, στην Κατεύθυνση της Ανάπτυξης Γνώσεων και Ικανοτήτων. Π. Κουμαράς.
 Να δούμε το υλικό  Διδακτικοί στόχοι  Διδακτικές στρατηγικές  Αλληλεπίδραση στην τάξη  Τι είναι φυσική, χημεία, βιολογία;  Αξιολόγηση μαθητών και.
Ο επικοινωνιακός ρόλος του εκπαιδευτικού σε συμβατικά, υπολογιστικά και δικτυακά περιβάλλοντα μάθησης Μαρία Κορδάκη, Ph.D, M.ED.
Κεφ. 8 ο : Εκπαιδευτικό Λογισμικό Γενικοί ορισμοί: Γενικοί ορισμοί: (software): –Λογισμικό (software): οι καταγραφές σε υλικό –Υλικό hardware –Υλικό (hardware):
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
5. Χαρακτηρισμός των μαθηματικών γνώσεων των μαθητών.
Διδασκαλία γλώσσας και περιεχομένου
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου.
Ανάπτυξη της γλώσσας Η ανάπτυξη της γλωσσικής ικανότητας περνάει από συγκεκριμένα στάδια απόκτησης γλωσσικών επιπέδων. Ο στόχος ενός παιδιού που μαθαίνει.
ΜΕΘΟΔΟΙ ΔΙΔΑΣΚΑΛΙΑΣ Δομιστική προσέγγιση (Ι)
ΔΙΑΤΑΡΑΧΕΣ ΛΟΓΟΥ ΣΤΗΝ ΠΡΟΣΧΟΛΙΚΗ ΗΛΙΚΙΑ
ΑΝΑΠΤΥΞΗ ΔΟΚΙΜΙΩΝ ΣΤΑ ΝΕΑ ΕΛΛΗΝΙΚΑ
Μεταπτυχιακές Σπουδές στη Βρετανία Δεκέμβριος 2007.
ΠΛΗΡΟΦΟΡΙΚΗ Α’ ΓΥΜΝΑΣΙΟΥ
ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Information Extraction.
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1ο Εισαγωγή στη Γλωσσική Τεχνολογία
ΠΜΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ The Digital Library and Computational Philology: The BAMBI Project Γόντικα Ειρήνη.
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΝΟΜΙΑΣ - ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Πρόγραμμα Μεταπτυχιακών Σπουδών: Διοίκηση & Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες.
6/12/2012 Παρουσίαση: Μιμηγιάννης Δημήτρης
Ταξίδι στον κόσμο της Γλώσσας Β’ Δημοτικού
ΤΠΕ - ΔΙΔΑΣΚΑΛΙΑ ΓΛΩΣΣΑΣ
Τι άλλαξε στα νέα αναλυτικά προγράμματα;. Βασικοί άξονες του νέου Αναλυτικού Προγράμματος Βασικοί άξονες του νέου Αναλυτικού Προγράμματος Ένα συνεκτικό.
Μάθημα 6: Γλώσσα και περιεχόμενο Διδάσκουσα: Βασιλάκη Ευγενία ΠΤΔΕ, Πανεπιστήμιο Θεσσαλίας.
Διδακτική Πληροφορικής
Διδακτική Πληροφορικής Ενότητα 3: Η Πληροφορική στην Εκπαίδευση. Διδάσκων: Γεώργιος Σούλτης, Επίκουρος Καθηγητής. Τμήμα Μηχανικών Πληροφορικής, Τεχνολογικής.
 Ηλεκτρονικό κείμενο ονομάζουμε ένα κείμενο που έχει ψηφιοποιηθεί.  Η νέα τεχνολογία επιτρέπει την ψηφιοποίηση του ήχου, της εικόνας και της οπτικο-ακουστικής.
Πρακτικές Σχεδιασμού Μαθήματος. Πρακτικές καλού σχεδιασμού μαθήματος Η συγκέντρωση του εκπαιδευτικού υλικού και η οργάνωση στο eclass γίνεται πλέον σε.
1 ΕΞΕΤΑΣΕΙΣ ΞΕΝΩΝ ΓΛΩΣΣΩΝ ΣΤΟ ΓΥΜΝΑΣΙΟ Μαυρομμάτη Ευφημία Σχολική Σύμβουλος.
Γιάννης Τζωρτζάκης Σχολικός Σύμβουλος ΠΕ12 Αξιολόγηση με Πίνακες Διαβαθμισμένων Κριτηρίων (rubrics) στη Δευτεροβάθμια Εκπαίδευση.
ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΑ ΙΣΤΟΡΙΑ ΝΕΑ ΕΛΛΗΝΙΚΑ
Δεκαπενθήμερο Ενημέρωσης για την Πρόσβαση στην Εκπαίδευση, Οκτωβρίου 2015 «Προσβάσιμο Εκπαιδευτικό και Εποπτικό Υλικό για Κωφούς και Βαρήκοους Μαθητές»
Διαδίκτυο και Διδακτική της Γλώσσας Δυνατότητες Αξιοποίησης στη Διδασκαλία του Γλωσσικού Μαθήματος Διονύσης Αρκαδιανός.
1 ΚΡΙΤΙΚΗ ΑΝΑΛΥΣΗ ΛΟΓΟΥ (Critical Discourse Analysis) ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ.
1 Μαθησιακές Δυσκολίες: δυγλωσσία και πολυγλωσσικό περιβάλλον Ενότητα 7: Η/Υ και μαθησιακές δυσκολίες Ζακοπούλου Βικτωρία Ελληνική Δημοκρατία Τεχνολογικό.
ΑΝΩΤΑΤΗ ΣΧΟΛΗ ΠΑΙΔΑΓΩΓΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΓΕΝΙΚΟ ΤΜΗΜΑ ΠΑΙΔΑΓΩΓΙΚΩΝ ΜΑΘΗΜΑΤΩΝ ΓΕΝΙΚΟ ΤΜΗΜΑ ΠΑΙΔΑΓΩΓΙΚΩΝ ΜΑΘΗΜΑΤΩΝ «Εκπαιδευτική Τεχνολογία-Πολυμέσα»
Ανάπτυξη της γλώσσας Η ανάπτυξη της γλωσσικής ικανότητας περνάει από συγκεκριμένα στάδια απόκτησης γλωσσικών επιπέδων. Ο στόχος ενός παιδιού που μαθαίνει.
Ανάλυση κρίσιμου συμβάντος
Διδακτική αρχαίων ελληνικών Α΄ λυκείου από πρωτότυπο κείμενο
ΝΕΑ ΕΛΛΗΝΙΚΑ.
Ορισμός στρατηγικής διδασκαλίας
ΠΑΡΑΛΛΗΛΑ ΚΑΙ ΣΥΓΚΡΙΣΙΜΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ
Οριζόντιο Έργο Υποστήριξης Σχολείων, Εκπαιδευτικών και Μαθητών στο Δρόμο για το ΨΗΦΙΑΚΟ ΣΧΟΛΕΙΟ, νέες υπηρεσίες Πανελλήνιου Σχολικού Δικτύου και Στήριξη.
…..finalmente (o alla fine)
Νεοελληνική Γλώσσα (ΝΠΣ)
Τι είναι η σχολική γραμματική;
Τεχνολογία Πολυμέσων Ενότητα # 2: Εφαρμογές πολυμέσων
ENNOIEΣ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Ι & ΑΝΑΠΑΡΑΣΤΑΣΕΙΣ ΤΟΥΣ
RICAPITOLAZIONE Della prima lezione.
ΟΙ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ
Μοντέλα διδασκαλίας της γλώσσας Σχετίζονται με εκάστοτε θεώρηση και αντίληψη για γλώσσα και παιδαγωγικές και διδακτικές τάσεις που επικρατούν. Η διδακτική.
ΗΛΕΚΤΡΟΝΙΚΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ ΓΛΩΣΣΙΚΗΣ ΕΚΜΑΘΗΣΗΣ
Εννοιολογική Χαρτογράφηση
ΓΛΩΣΣΙΚΗ ΕΡΕΥΝΑ ΣΤΑ ΗΣΚ
Η Συνθετική Δημιουργική Εργασία ως εναλλακτική μορφή αξιολόγησης της Αγγλικής Γλώσσας στο Γυμνάσιο: Ένα παράδειγμα Χριστίνα Κάλφογλου Πειραματικό Γυμνάσιο.
ΓΛΩΣΣΙΚΗ ΕΡΕΥΝΑ ΣΤΑ ΗΣΚ
ΗΛΕΚΤΡΟΝΙΚΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ ΓΙΑ ΤΗ ΓΛΩΣΣΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΔΙΔΑΣΚΑΛΙΑ
ΑΝΑΛΥΣΗ ΛΑΘΩΝ ΛΑΘΗ ΚΑΙ ΑΝΑΛΥΣΗ
ΗΛΕΚΤΡΟΝΙΚΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ ΓΛΩΣΣΙΚΗΣ ΕΚΜΑΘΗΣΗΣ
RICAPITOLAZIONE Della prima lezione.
Μεταγράφημα παρουσίασης:

ΗΛΕΚΤΡΟΝΙΚΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ ΓΙΑ ΤΗ ΓΛΩΣΣΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΔΙΔΑΣΚΑΛΙΑ ΠΡΩΤΗ ΕΝΟΤΗΤΑ 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

ΤΙ ΣΗΜΑΙΝΕΙ; ΗΛΕΚΤΡΟΝΙΚΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

ΚΕΙΜΕΝΑ : Περίπου είκοσι χρόνια πριν ο ερευνητής ο Gerry Knowles έγραφε: […] “θεώρησα δεδομένο ότι η γλώσσα εκτίθεται σε μορφή κειμένων, ότι οι γλωσσολόγοι, παραδοσιακά, αποθηκεύουν διάφορες γενικεύσεις σχετικά με τα κείμενα στα λεξικά, και οι γενικεύσεις αυτές, σχετικά με τα στοιχεία του λεξικού αποθηκεύτηκαν σε γραμματικές” 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

ΗΛΕΚΤΡΟΝΙΚΟ ΣΩΜΑ ΓΙΑΤΙ: …σήμερα οι γλωσσολόγοι αναζητούν όλο και περισσότερες αποδείξεις και η μελέτη των ΗΣΚ μπορεί να ανταποκριθεί σ’ αυτό H διαφορά, έγκειται στον πλούτο των αποδείξεων και στην εμπιστοσύνη που μπορούμε να έχουμε στη γενίκευση αυτών των αποδείξεων, όσον αφορά την εγκυρότητα και την αξιοπιστία τους (Kennedy 1998:8). 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

ΟΡΙΣΜΟΙ Το Ηλεκτρονικό Σώμα Κειμένων γενικής γλώσσας είναι ένα σώμα κειμένων το οποίο είναι κωδικοποιημένο για τυποποιημένες και ομοιογενείς εργασίες ανάκτησης γλωσσικής πληροφορίας. Τα γλωσσικά τμήματα που περιέχει περιλαμβάνουν πληροφορίες για την προέλευσή τους και την εξωγλωσσική λειτουργία τους (Μικρός & Φουντοπούλου 2002:49). Το Ηλεκτρονικό Σώμα Κειμένων γενικής γλώσσας στην σύγχρονη γλωσσολογία μπορεί να περιγραφεί ως ένα σώμα με πεπερασμένο αριθμό κειμένων σε ηλεκτρονική μορφή, τα οποία έχουν επιλεγεί με τρόπο, ώστε να αποτελούν όσο το δυνατόν πιο αντιπροσωπευτικά δείγματα της γλωσσικής ποικιλίας που μελετάται (McEnery & Wilson 1996:24). 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Μη Ηλεκτρονικά Σώματα Κειμένων Το Βρετανικό παράδειγμα: Βίβλος ως ΣΚ (συμφράσεις του Cruden) Dictionary of the English Language (150.000 φράσεις→40.000 λήματα) Oxford English Dictionary (50 εκατ. Λέξεις, από το 1000μΧ έως 1923 έτος έκδοσης) 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Μη Ηλεκτρονικά Σώματα Κειμένων Η Αμερικανική προσέγγιση: Thornidike Corpus: 4,5 εκατ. λέξεις (Βίβλος+Επιστολές+Εφημερίδες+ Σχολικά αναγνώσματα) American English Grammar (Σώμα επιστολών προς την κυβέρνηση) το Survey of English Usage (SEU) Corpus (προφορικός και γραπτός λόγος) 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Πρώτη γενιά των Ηλεκτρονικών Σωμάτων Κειμένων (1) Brown Corpus: αποτελούνταν από 500 δείγματα των 2.000 λέξεων περίπου και δεν στόχευε στην αντιπροσωπευτικότητα κάποιου συγκεκριμένου κειμενικού είδους, αλλά στο να αποτελέσει μία σταθερά για συγκριτικές έρευνες και αναλύσεις στην σύγχρονη Αγγλική γλώσσα. http://www.hit.uib.no/icame/brown/bcm.html#bc3 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Πρώτη γενιά των Ηλεκτρονικών Σωμάτων Κειμένων (2) Lancaster-Oslo/Bergen (LOB) Corpus : είχε ως σκοπό να αποτελέσει το βρετανικό κομμάτι του Brown Corpus. Το LOB περιελάμβανε περίπου ένα εκατομμύριο λέξεων που εκδόθηκαν το 1961. Οι κειμενικές κατηγορίες των δύο Σωμάτων ήταν όμοιες αν και υπήρχε μια μικρή διαφορά στον αριθμό των κειμένων σε κάποιες κατηγορίες http://www.hit.uib.no/icame/lobman/lob-cont.html http://clu.uni.no/icame/lob/lob-dir.htm#lob6 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Πρώτη γενιά των Ηλεκτρονικών Σωμάτων Κειμένων (3) London Lund Corpus (LLC) : Το SEU Corpus ψηφιοποιήθηκε από το Πανεπιστήμιο Lund της Σουηδίας και προστέθηκαν 13 κείμενα στα ήδη 87 προφορικά κείμενα του SEU. Σύνολο 100 κείμενα των 5.000 λέξεων Μισό εκατομμύριο λέξεις απάρτιζαν το μεγαλύτερο Σώμα προφορικού λόγου που υπήρχε έως τα μέσα της δεκαετίας του ’90. Παρόλα αυτά, τα κείμενα ήταν από ομιλητές υψηλού μορφωτικού επιπέδου και οι κειμενικές κατηγορίες δεν ήταν τόσο ποικίλες http://clu.uni.no/icame/manuals/LONDLUND/INDEX.HTM 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Πρώτη γενιά των Ηλεκτρονικών Σωμάτων Κειμένων (4) Lancaster/IBM Spoken English Corpus (SEC) : Ακολούθησε το παράδειγμα του London-Lund Corpus για τον προφορικό λόγο Προορισμένο για προσωδιακή ανάλυση Αποτελούνταν από 52.600 λέξεις από 11 κατηγορίες, με κείμενα τα οποία συγκεντρώθηκαν μεταξύ των ετών 1987 και 1989 http://www.comp.leeds.ac.uk/ccalas/tagsets/sec.html 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Δεύτερη γενιά των Ηλεκτρονικών Σωμάτων Κειμένων (τα μικρά) Cobuild project /Bank of English Ένα Corpus σχεδιασμένο για την δημιουργία του Cobuild Dictionary εμπλουτισμένο με 13 εκ. λέξεις για διδακτικούς κυρίως, σκοπούς. http://www.collins.co.uk/page/The+Collins+Corpus Longman Corpus Network Αποτελούμενο από: Longman/Lancaster English Language Corpus (LLELC), Longman Spoken Corpus (LSC) Longman Corpus of Learners http://www.pearsonlongman.com/Dictionaries/corpus/index.html 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Δεύτερη γενιά των Ηλεκτρονικών Σωμάτων Κειμένων (τα μεγάλα) British National Corpus : Η βρετανική κυβέρνηση το χρηματοδότησε κατά το ήμισυ και συνεργάστηκαν για την κατασκευή του τα Πανεπιστήμια της Οξφόρδης και του Λάνκαστερ, η Βρετανική Βιβλιοθήκη και οι εκδοτικοί οίκοι: Longman, Oxford University Press και W. and R. Chambers. Επιδίωξή τους ήταν να δημιουργήσουν ένα ΗΣΚ γενικής γλώσσας 100 εκατομμυρίων λέξεων http://www.natcorp.ox.ac.uk/ International Corpus of English (ICE): Ως σύνολο το ICE είναι ένα γιγαντιαίο ΗΣΚ, αλλά τα υποσύνολά του είναι μετρίου μεγέθους. Οι κατασκευαστές του οραματίστηκαν 20 παράλληλα ΗΣΚ γενικής γλώσσας που το καθένα θα αποτελείται από ένα εκατομμύριο λέξεις στην αγγλική γλώσσα http://ice-corpora.net/ICE/INDEX.HTM 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Χαρακτηριστικά των ΗΣΚ Ηλεκτρονική μορφή Αντιπροσωπευτικότητα Γλωσσική πληροφορία 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

ΗΣΚ δεν είναι: Αρχείο Βιβλιοθήκες ηλεκτρονικών κειμένων 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

ΠΑΡΑΔΕΙΓΜΑΤΑ: …είναι ΗΣΚ; ΠΑΡΑΔΕΙΓΜΑΤΑ: …είναι ΗΣΚ; Τα έγγραφα σε μια δημόσια υπηρεσία Το σύνολο της εμπορικής αλληλογραφίας μιας εταιρείας Τα sms στο κινητό μας Τα mail στο inbox μας Ο φάκελος με όλες τις εργασίες μας Δες τα χαρακτηριστικά στην διαφ. 14. 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Έλεγχος πριν οριστεί ένα ΗΣΚ: ποσότητα (έκταση σε αριθμό λέξεων) ποιότητα (αντιπροσωπευτικότητα και ισοκατανομή) ευκολία στην κωδικοποίηση αρχειοθέτηση (τα ακριβή στοιχεία για την προέλευση των κειμένων). 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

ΗΣΚ και Γλωσσολογική Ανάλυση Βασίζεται σε μεγάλο αριθμό κειμένων άρα επαληθεύεται με μεγαλύτερη αξιοπιστία η γλωσσική διαίσθηση Βασίζεται σε ηλεκτρονικά κείμενα άρα αποθηκευμένα και επεξεργασμένα με η/υ Βασίζεται σε αυθεντικά κείμενα άρα πραγματικές περιστάσεις γλώσσας 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Κατηγοριοποίηση των ΗΣΚ (μορφή κειμένων) Γραπτά Προφορικά Μεικτά Δες Δεύτερη Γενιά ΗΣΚ και βάλτα σε κατάταξη!! 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Κατηγοριοποίηση των ΗΣΚ (γλώσσα) Εθνικές Διαλεκτικές/ κοινωνιογλωσσολογικές ποικιλίες 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Κατηγοριοποίηση των ΗΣΚ (ιστορική διάσταση) Για συγκεκριμένο χρονικό διάστημα Ασυνεχώς ανανεούμενα 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

ΗΣΚ Γλωσσικής Εκμάθησης και ΗΣΚ Μητρικής Γλώσσας 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Δράσεις για την εκμετάλλευση/ χρήση των ΗΣΚ Δομικός Χαρακτηρισμός Ανάλυση μερών του λόγου Συντακτικός Χαρακτηρισμός Ληματοποίση Πίνακες Συμφράσεων 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Δομικός Χαρακτηρισμός του Κειμένου Στα πρώτα ΗΣΚ, ο Δομικός Χαρακτηρισμός του Κειμένου ήταν αυτοσχέδιος και βασίζονταν σε ένα υπόμνημα συμβόλων που καθόριζε ο ερευνητής (όπως στο London-Lund Corpus) Αργότερα, εφευρέθηκε ένας ηλεκτρονικός τύπος δομικού χαρακτηρισμού, διεθνώς αναγνωρίσιμο με τα αρχικά SGML (Standard Generalized Markup Language) Πιο πρόσφατα, κυκλοφόρησε μια βελτιωμένη έκδοση του SGML η οποία εφαρμόζεται στα κείμενα του διαδικτύου και ονομάζεται XML (Extensive Markup Language). 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Ανάλυση Μερών του Λόγου (Part-of-Speech Analysis) Η ανάλυση των Μερών του Λόγου γίνεται με τον «Μορφολογικό Αναλυτή» (‘‘tagger’’), ένα εργαλείο που δίνει το μορφολογικό χαρακτηρισμό στην κάθε λέξη με ένα συγκεκριμένο συμβολισμό. Ο Μορφολογικός Αναλυτής μπορεί να είναι αυτοματοποιημένος ή όχι. Το υπόμνημα όλων των συμβολισμών ονομάζεται ‘‘tagset’’ και καθορίζεται από την αρχή από τον κατασκευαστή του εργαλείου. 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Είδη Μορφολογικού Αναλυτή Μορφολογικός Αναλυτής, ο οποίος είναι βασισμένος σε κανόνες γραμματικής (rule based). Μορφολογικός Αναλυτής, ο οποίος είναι βασισμένος σε πιθανότητες (probabilistic), Μικτός τύπος (mixed type): είναι αυτός που στηρίζεται κυρίως σε κανόνες και όπου αποτυγχάνουν να δώσουν μια απάντηση εφαρμόζονται οι πιθανότητες για να δώσουν μια λύση. BNC rule based 77% “Brill Tagger Probabilistic Tree Tagger 96% 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

ΠΑΡΑΔΕΙΓΜΑ TAGGING >>> text = word_tokenize ("They refuse to permit us to obtain the refuse permit") >>> nltk.pos_tag (text) [('They', 'PRP'), ('refuse', 'VBP'), ('to', 'TO'), ('permit', 'VB'), ('us', 'PRP'), ('to', 'TO'), ('obtain', 'VB'), ('the', 'DT'), ('refuse', 'NN'), ('permit', 'NN')] 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Συντακτικός Χαρακτηρισμός (Parsing) Είναι τόσο άρρηκτα συνδεδεμένες οι δύο έννοιες (tagging και parsing) που πολλά προγράμματα συντακτικού χαρακτηρισμού ενέχουν και μορφολογικό αναλυτή 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Συντακτικός Αναλυτής Ο συντακτικός αναλυτής είναι το εργαλείο που πρέπει : να αναγνωρίσει τις λέξεις της πρότασης, να περιγράψει συντακτικά τη λέξη, να ομαδοποιήσει αυτές τις λέξεις σε μεγαλύτερες μονάδες που παρουσιάζονται ως βασικά στοιχεία της πρότασης, να ονομάσει κατάλληλα αυτά τα στοιχεία. 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Είδη Συντακτικού Χαρακτηρισμού Βασισμένος σε κανόνες (rule based) και βασισμένος σε πιθανότητες (probabilistic). Οι υποστηρικτές του δεύτερου είδους ισχυρίζονται ότι το μεγάλο πλεονέκτημά τους είναι η εφαρμογή τους σε οποιοδήποτε κείμενο. Αυτή η ικανότητα είναι κατά ένα μεγάλο βαθμό αποτέλεσμα της δημιουργίας των “Treebanks” (γλωσσικών δενδροειδών δομών). Στην περίπτωση αυτή συνδυάζονται τα πλεονεκτήματα των δύο μεθόδων για να εξαλειφθούν τα μειονεκτήματα: Με το χέρι είναι πολύ χρονοβόρο, αυτόματα δεν είναι πάντα επιτυχές. Ακολουθείται η αντίστροφη διαδικασία σε σχέση με τον μορφολογικό: Ξεκινάμε αυτόματα, επαληθεύουμε με τον κανόνα 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

ΠΑΡΑΔΕΙΓΜΑ PARSING: He came ,_, saw ,_, and conquered ._. The simplest case: conjoined intransitive verbs He came ,_, saw ,_, and conquered ._. ( (IP-MAT (NP-SBJ (PRO He)) (VBD (VBD came) (, ,) (VBD saw) (, ,) (CONJ and) (VBD conquered)) (. .))) 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Λημματοποίηση Η λημματοποίηση είναι άμεσα συνδεδεμένη με το μορφολογικό χαρακτηρισμό των λέξεων. Καταρτίζεται μια λίστα με λήμματα που προκύπτουν από το σύνολο των λέξεων ενός ΗΣΚ. Η επεξεργασία μπορεί να εφαρμοστεί τόσο σε ομαλούς όσο και σε ανώμαλους τύπους λημμάτων. Εξυπηρετεί κυρίως στη λεξικογραφία και στη λεξικολογία. 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Αναλυτής Πινάκων Συμφραζομένων (Concordancer) Ο αναλυτής πινάκων συμφραζομένων παρέχει μία εικόνα για την πυκνότητα συγκεκριμένων λέξεων που εμφανίζονται σε ένα ΗΣΚ. Έτσι: έχουμε πληροφορίες για τη φρασεολογία για τη συχνότητα μιας λέξης, αλλά και μιας φράσης, (διευκολύνει τον μαθητή στην εκμάθηση λεξιλογίου) για τη διασπορά μιας λέξης μέσα σ’ ένα ΗΣΚ. 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Παραδείγματα Συμφράσεων (1) word: interested. 1. Is Oxfam interested in disarmament? 2. But she was not interested in education for its own sake. 3. Parents are obviously interested in the various skills... 4. .. to change as more women become interested in outdoor pursuits. 5. In other words, he was not interested, as Singer was, in... 6. ..last month said a range of other interested parties had emerged,.. 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Παραδείγματα Συμφράσεων (2) La parola FINALMENTE: Una richiesta che ricevo , la sua , finalmente originale ! Presi la stessa direzione di quella donna e finalmente la intravidi.. Norma trovó finalmente il coraggio per guardare il figlio negli occhi. ..ora finalmente potevano compiacersi della rovina della vecchia. Domenico era finalmente riuscito nell ' intento di sistemare la motocarrozzeta " Ecco , é lei ! Finalmente ! La mia cavalla ! Vide finalmente , una volta che passato il palmo. Finalmente guardava a quella comunitá conchiusa. 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Εφαρμογές των ΗΣΚ Γλωσσική έρευνα Λεξικογραφία Γραμματική Μετάφραση (παράλληλα ΗΣΚ) Ορολογία Ιστορία της γλώσσας Διδακτική 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Διδακτική και ΗΣΚ Εφαρμογή στη διδασκαλία: Σε χαρακτηρισμένο ΗΣΚ, όταν ο διδάσκων παίρνει παραδείγματα από το ΗΣΚ και τα επεξεργάζεται ως άσκηση με τους μαθητές. Σε μη-χαρακτηρισμένο ΗΣΚ, όταν οι μαθητές ψάχνουν να βρουν τη χρήση μιας λέξης μόνοι τους. (Δεδομενοκεντρικής εκμάθησης/DDL: Data Driven Learning). Σε ΗΣΚ Γλωσσικής εκμάθησης (learner corpus) ο ένας μαθητής προσπαθεί να εξηγήσει στον άλλον τα λάθη του («αμοιβαία μάθηση»). 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Διδακτική και ΗΣΚ Εφαρμογή στην αξιολόγηση: Ως αρχείο γραπτών προερχόμενων από εξετάσεις Ως εργαλείο για να αναπτυχθεί υλικό αξιολόγησης Για να βελτιωθούν οι τεχνικές αξιολόγησης Για να βελτιωθεί η ποιότητα της βαθμολόγησης Για να σταθεροποιηθεί η μορφή των τεστ. ΓΙΑΤΙ: οι μαθητές είναι σε θέση να συγκρίνουν την απόδοσή τους με τη φυσική γλώσσα 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Διδακτική και ΗΣΚ Εφαρμογή στη δημιουργία αναλυτικών προγραμμάτων (Syllabuses) Με βάση την συχνότητα των φαινομένων Με βάση την συχνότητα των λέξεων ή φράσεων. 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Τι δεν είναι τα ΗΣΚ για την διδακτική: Προσέγγιση Μέθοδος Αντικαταστάτης του εκπαιδευτικού ΑΛΛΑ: Είναι εργαλείο, διευκολυντής, βοηθός… 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Μειονεκτήματα: Δεν μπορούν να χρησιμοποιηθούν για όλα τα επίπεδα και όλες τις ανάγκες Τα ΗΣΚ που είναι βασισμένα σε ενημερωτικά κείμενα δεν είναι κατάλληλα για μικρά επίπεδα Το υλικό μπορεί να φανεί δυσνόητο ή πολύπλοκο στο μαθητή και η έκτασή του να τον τρομάζει Το ΗΣΚ δεν δίνει πληροφορίες για τον επιτονισμό, χειρονομίες κ.λ.π. των ομιλητών και για το επικοινωνιακό περιβάλλον. Ο δάσκαλος έχει μειωμένο έλεγχο στη μαθησιακή διαδικασία. Μπορεί να δημιουργηθούν από το μαθητή περισσότερες ερωτήσεις και απορίες, γιατί εκτίθεται σε έναν πολύ μεγαλύτερο αριθμό γλωσσικών παραδειγμάτων Η επιμόρφωση των εκπαιδευτικών δεν θεωρείται πάντα δεδομένη, όπως και ο ανάλογος εξοπλισμός στο σχολικό περιβάλλον 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

ΑΝΑΚΕΦΑΛΑΙΩΣΗ Ας … Δώσουμε έναν ορισμό των ΗΣΚ Θυμηθούμε κάποια ΗΣΚ ή τους φορείς τους Πούμε κάποιες κατηγορίες ΗΣΚ Αναφέρουμε κάποιες εφαρμογές τους Μοιραστούμε τις απόψεις μας για την χρησιμότητα τους 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

COMPITO: Βρείτε στο διαδίκτυο ένα ιταλικό (κατά προτίμηση) ή ελληνικό ΗΣΚ Παράδειγμα/ δείγμα αυτού Αναφορά σε αυτό Ανακοίνωση ή άρθρο γι’ αυτό 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

Επικοινωνία Ώρες φοιτητών:Τρίτη 15:00-17:00 E-mail:kathyflorou@ill.uoa.gr 11/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ