ΗΛΕΚΤΡΟΝΙΚΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ ΓΛΩΣΣΙΚΗΣ ΕΚΜΑΘΗΣΗΣ Learner Corpora ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019
Πριν από οτιδήποτε άλλο… ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Πριν από οτιδήποτε άλλο… Τι είναι..; Κειμενική κατηγορία Συμφράσεις Αντιπροσωπευτικότητα Λημματοποίηση Tagger, tagset Parser
ΗΣΚ από την έρευνα στο μαθητή ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 ΗΣΚ από την έρευνα στο μαθητή Τα ΗΣΚ γλωσσικής εκμάθησης είναι συλλογές κειμένων, γραπτών ή προφορικών, που έχουν παραχθεί από τους ίδιους τους μαθητές της ξένης γλώσσας Είναι: α. ηλεκτρονικά (και άρα εύκολα στην ανάλυση) β. μεγάλα (και άρα αξιόπιστα)
ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Αυθεντικά; Τα ΗΣΚ Γλωσσικής Εκμάθησης αποτελούν πηγή αυθεντικού λόγου, μοναδική απόδειξη της διαγλώσσας των μαθητών κατά τη διαδικασία της εκμάθησης.
ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Διαγλώσσα; Η γλώσσα του μαθητή της Ξένης Γλώσσας διαφέρει από αυτήν του φυσικού ομιλητή. Τόσο ποσοτικά όσο και ποιοτικά έχει διαφορετική συχνότητα λέξεων, φράσεων και δομών, άλλα στοιχεία δεν χρησιμοποιούνται και άλλα χρησιμοποιούνται υπερβολικά. Ένα ΗΣΚ γλωσσικής εκμάθησης χαρακτηρίζεται από λάθη (αποκλίσεις) που βοηθούν στην κατανόηση της διαδικασίας της μάθησης
Ερωτήματα για τα Learner Corpora: ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Ερωτήματα για τα Learner Corpora: Πώς η παρεμβολή της μητρικής γλώσσας επηρεάζει τη μάθηση της Ξένης Γλώσσας; Πώς εμποδίζουν οι συνθήκες της τάξης τη γλωσσική παραγωγή του μαθητή; Ποια είναι τα πιο συνηθισμένα λάθη; Ποιες στρατηγικές αποφυγής υιοθετούν οι μαθητές σε σχέση με τις δομές που δεν υπάρχουν στη μητρική τους γλώσσα ή υπάρχουν σε λανθάνουσα μορφή; Σε ποιες περιπτώσεις γίνεται υπερβολική χρήση δομών ή φαινομένων και σε ποιες ελλιπής; Leech 1997: αρχή της ανάπτυξης των ΗΣΚ Γλ.Εκμ.
ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 ΑΛΛΑ: Χρήσιμο για τους μαθητές είναι να βλέπουν δείγματα λόγου από «ειδικούς» σε κειμενικά είδη που ανταποκρίνονται στις ανάγκες των μαθητών και στα ενδιαφέροντά τους, ώστε να στοχεύουν πάντα στην απόκτηση της καλύτερης δυνατής δεξιότητας. Tribble 1997
Μελέτη ως προς τη μορφή του λόγου: ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Μελέτη ως προς τη μορφή του λόγου: Δηλαδή, εάν πρόκειται για συλλογές γραπτών κειμένων, προφορικών ή μεικτών. Η πλειοψηφία των μέχρι τώρα ΗΣΚ γλωσσικής εκμάθησης βασίζεται στο γραπτό λόγο (ή κυρίως στο γραπτό λόγο), το γεγονός αυτό όμως δεν αφήνει περιθώρια για να ερευνηθούν περιοχές όπως η προφορά, ο επιτονισμός ή τα πραγματολογικά λάθη.
Μελέτη ως προς την διαθεσιμότητα χρήσης: ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Μελέτη ως προς την διαθεσιμότητα χρήσης: Το πρώτο είδος είναι ΗΣΚ γλωσσικής εκμάθησης που δημιουργήθηκαν με την πρωτοβουλία μεγάλων εκδοτικών οίκων και ορίζονται ως εμπορικά αξιοποιήσιμα ΗΣΚ γλωσσικής εκμάθησης. Τα πιο γνωστά αυτού του είδους: Longman Learners Corpus με περίπου 10 εκατομμύρια λέξεις Cambridge Learner Corpus με περίπου 16 εκατομμύρια λέξεις. Το δεύτερο είδος είναι τα ΗΣΚ γλωσσικής εκμάθησης με εκπαιδευτικούς στόχους. Αφορά σε συλλογές, είναι δηλαδή ΗΣΚ γλωσσικής εκμάθησης που έχουν δημιουργηθεί μέσα στο ακαδημαϊκό περιβάλλον. Τέτοιου είδους υπάρχουν πολλά για παράδειγμα: το HKUST του Hong Kong University of Science and Technology με 25.000.000 λέξεις, το MELD του Montclair State University των Ηνωμένων Πολιτειών που περιέχει 100.000 λέξεις, το International Corpus of Learner English του Πανεπιστημίου της Louvain-la-Neuve του Βελγίου με 25.000.000 λέξεις,
Μελέτη ως προς τη μητρική γλώσσα του μαθητή ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Μελέτη ως προς τη μητρική γλώσσα του μαθητή Τα μεγάλα ΗΣΚ γλωσσικής εκμάθησης που προαναφέρθηκαν βασίζονται σε παραγωγή λόγου από μαθητές της αγγλικής με καταγωγή που ποικίλλει. Τα περισσότερα από αυτά τα ΗΣΚ γλωσσικής εκμάθησης, όπως είναι λογικό, έχουν να επιδείξουν μία μεγάλη ποικιλία μητρικών γλωσσών. Υπάρχουν ΗΣΚ γλωσσικής εκμάθησης, που έχουν ως σκοπό να μελετήσουν την παραγωγή στην ξένη γλώσσα όπως διατυπώνεται από μαθητές με ένα συγκεκριμένο υπόβαθρο σ’ ό,τι αφορά τη μητρική τους γλώσσα.
Μελέτη ως προς τον τρόπο συλλογής του υλικού ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Μελέτη ως προς τον τρόπο συλλογής του υλικού Ανάλογα με τον τρόπο συλλογής του υλικού διαφέρει ο τρόπος μελέτης, αλλά και ο στόχος του ΗΣΚ γλωσσικής εκμάθησης. Στα ΗΣΚ γλωσσικής εκμάθησης μπορεί να μελετηθεί η πρόοδος του μαθητή εάν συλλεχθεί από το ίδιο κοινό, διαδοχικά, διαφορετικό υλικό ή, μπορούν να μελετηθούν τα χαρακτηριστικά της διαγλώσσας σ’ ένα συγκεκριμένο επίπεδο, σε μια συγκεκριμένη χρονική στιγμή συλλέγοντας υλικό από διαφορετικούς μαθητές.
Κατασκευάζοντας ένα Learner Corpus: (συμβουλές 1) ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Κατασκευάζοντας ένα Learner Corpus: (συμβουλές 1) Καταγραφή των δεδομένων των μαθητών της ξένης γλώσσας – και όχι των δεδομένων των μαθητών στη μητρική γλώσσα ή των φυσικών ομιλητών της ξένης γλώσσας (L2 Learner VS L1 Speakers and/or L2 speakers). Δεδομένα που θα προκύπτουν αυθόρμητα, να πρόκειται δηλαδή για αυθεντικό υλικό και όχι κατά τη διάρκεια ελεγχόμενης άσκησης (όπως για παράδειγμα κατά τη διάρκεια ενός παιχνιδιού ρόλων ή κατά την παραγωγή μίας περίληψης) (Naturalistic VS experimental). Το υλικό να είναι ελεύθερη παραγωγή και όχι περιορισμένη (για παράδειγμα απαντήσεις σε ερωτήσεις γραπτές ή προφορικές) (open-ended VS controlled). Περιλαμβάνονται ολόκληρα τα κείμενα παραγωγής των μαθητών και όχι απομονωμένες φράσεις ή λέξεις (whole text VS sentences/words).
Κατασκευάζοντας ένα Learner Corpus: (συμβουλές 2) ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Κατασκευάζοντας ένα Learner Corpus: (συμβουλές 2) Αντιπροσωπευτικό δείγμα από πολλούς μαθητές της ξένης γλώσσας και όχι πολλά δείγματα παραγωγής από τους ίδιους τους μαθητές (Representative of many speakers/writers VS handful of speakers/writers). Συστηματική συλλογή δεδομένων από τους μαθητές (με συγκεκριμένες παραμέτρους) και όχι η αναδρομή σε προηγούμενο παρόμοιο υλικό (Systematic collections VS archives). Μεγάλη συλλογή δεδομένων, παρά μικρά δείγματα της γλώσσας προς μελέτη. Κυρίως για την αντιπροσωπευτικότητά και την αξιοπιστία των αποτελεσμάτων που θα προκύψουν. Όσο μεγαλύτερο το μέγεθος τόσο περισσότερες οι πιθανότητες να καλύπτεται ένα μεγάλο κομμάτι της γλώσσας (Large collections VS small samples).
Σχεδιασμός Learner Corpus ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Σχεδιασμός Learner Corpus Aρχές σύμφωνα με τις οποίες θα συλλεχθεί το υλικό. Αυτό θα επιτρέψει τη σύγκριση αργότερα με άλλο υλικό ή με αντίστοιχο ΗΣΚ φυσικών ομιλητών της Ξένης Γλώσσας. Διατύπωση των στόχων. Το ΗΣΚ γλωσσικής εκμάθησης θα έχει κάποια συγκεκριμένη σκοπιμότητα για να εφαρμοστούν τα αποτελέσματά του σε κάποιον επιστημονικό τομέα. Καθορισμός του είδους του υλικού · δηλαδή εάν συλλέγονται γραπτά, προφορικά ή κείμενα και των δύο ειδών από τους μαθητές, τι περιεχομένου και από ποιες παραμέτρους ορίζονται. Το μέγεθος του ΗΣΚ γλωσσικής εκμάθησης θα πρέπει να οριστεί από την αρχή και ο στόχος που θα μπει για τον αριθμό των αντικειμένων να τηρηθεί, όχι γιατί υπάρχει μια συγκεκριμένη συνταγή για το μέγεθος, αλλά για να συντελέσει στην αντιπροσωπευτικότητα του ΗΣΚ γλωσσικής εκμάθησης. Η αντιπροσωπευτικότητα είναι μία έννοια στην οποία δεν μπορεί να γίνει κάποια προσέγγιση μόνο με αριθμούς. Θα πρέπει να συμπεριληφθεί και ο αριθμός των μαθητών, όπως επίσης και το μέγεθος των κειμένων και το πλήθος αυτών.
Παράμετροι που αφορούν στον μαθητή ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Παράμετροι που αφορούν στον μαθητή ηλικία, φύλο, μητρική γλώσσα, καταγωγή, περιβάλλον μάθησης, επίπεδο γλωσσομάθειας (για το οποίο πολλές φορές χρησιμοποιείται ένα είδος αξιολόγησης πριν από την παραγωγή και συλλογή υλικού), έκθεση του μαθητή στην ξένη γλώσσα, άλλες ξένες γλώσσες που γνωρίζει ο μαθητής.
Παράμετροι που αφορούν στο στόχο του υλικού ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Παράμετροι που αφορούν στο στόχο του υλικού είδος λόγου, επιστημονικό πεδίο στο οποίο μπορεί να αναφέρεται το κείμενο, είδος κειμένου (ορίζεται, ή όχι, από τους κατασκευαστές του ΗΣΚ γλωσσικής εκμάθησης), μήκος κειμένου (ποικίλλει ανάλογα με τον χρόνο αλλά και με το επίπεδο), θέμα του κειμένου (επηρεάζει και τις λεξιλογικές επιλογές), συνθήκες της συγκέντρωσης του υλικού, δηλαδή: ο χρόνος, εάν αποτελεί μέρος μιας εξέτασης και τα εργαλεία αναφοράς δηλαδή, τα λεξικά ή οι γραμματικές που χρησιμοποιήθηκαν από τους μαθητές.
Άλλες παράμετροι Βαθμός Περιβάλλον Εγχειρίδιο ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Άλλες παράμετροι Βαθμός Περιβάλλον Εγχειρίδιο
Χαρακτηρισμός του Learner Corpus ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Χαρακτηρισμός του Learner Corpus Φωνητική Μεταγραφή: αναπαράσταση της φωνητικής μορφής του κειμένου, σε γραπτή μορφή (είτε πρόκειται για γραπτό, είτε για προφορικό κείμενο). Προσωδιακός Χαρακτηρισμός: παράθεση των στοιχείων του επιτονισμού, της έντασης, των παύσεων και άλλων. Ανάλυση των Μερών του Λόγου ή Γραμματικός Χαρακτηρισμός: Με τους ίδιους αναλυτές που χρησιμοποιούνται και σε ένα ΗΣΚ φυσικών ομιλητών επιτυγχάνονται οι ίδιοι στόχοι και στο ΗΣΚ γλωσσικής εκμάθησης. Συντακτικός Χαρακτηρισμός (Parsing): η συνδρομή του ερευνητή είναι απαραίτητη, γιατί απολύτως αυτοματοποιημένος και επιτυχής συντακτικός αναλυτής δεν υπάρχει.
Χαρακτηρισμός του Learner Corpus ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Χαρακτηρισμός του Learner Corpus Σημασιολογικός Χαρακτηρισμός: Χρησιμοποιείται λιγότερο στα ΗΣΚ γλωσσικής εκμάθησης απ’ ότι στα ΗΣΚ. Πραγματολογικός και Κειμενικός Χαρακτηρισμός: Ένας χαρακτηρισμός που μόνο χειρωνακτικά θα μπορούσε να γίνει σε ένα ΗΣΚ γλωσσικής εκμάθησης. Χαρακτηρισμός των Λαθών: Αποτελεί μία νέα κατηγορία χαρακτηρισμού Τα παραδοσιακά είδη χαρακτηρισμού δεν εξυπηρετούν αυτό που πραγματώνει το μαρκάρισμα των λαθών, να εστιάσει δηλαδή στην προβληματική φύση της γλώσσας από την πλευρά του μαθητή Είναι μία διαδικασία που αφορά κυρίως τα ΗΣΚ γλωσσικής εκμάθησης και μπορεί να γίνει αυτόματα ή χειρωνακτικά.
Προγράμματα χαρακτηρισμού λαθών ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Προγράμματα χαρακτηρισμού λαθών Υπάρχουν συστήματα χαρακτηρισμού λαθών που αναγνωρίζουν το λάθος στο ΗΣΚ γλωσσικής εκμάθησης, το κατατάσσουν σε μία κατηγορία λαθών και στο αντίστοιχο Μέρος του Λόγου που ανήκει το λανθασμένο στοιχείο. Μπορούν για παράδειγμα να διακρίνουν τα λάθη σε: λεξιλογικά, συντακτικά, φωνητικά και άλλα λάθη που γίνονται σε όλα τα επίπεδα γλωσσομάθειας.
Εφαρμογές ΗΣΚ γλωσσικής εκμάθησης ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Εφαρμογές ΗΣΚ γλωσσικής εκμάθησης Για Παιδαγωγικούς σκοπούς Για τη Σύσταση Αναλυτικού Προγράμματος Για τη δημιουργία γραμματικών και λεξικών
Αντιπροσωπευτικά Learner Corpora ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Αντιπροσωπευτικά Learner Corpora ICLE ( International Corpus of Learner English) JEFLL CLEC (Chinese Learner English Corpus) Longman’s Learner Corpus (LLC) HKUST Corpus (Hong Kong University of Science and Technology Corpus) MELLD (Montclair Electronic Language Learner Database) CLC (Cambridge Learner Corpus) Progetto di Pavia
ΜΕ ΤΙ ΜΟΙΑΖΕΙ ΕΝΑ LEARNER CORPUS; ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 ΜΕ ΤΙ ΜΟΙΑΖΕΙ ΕΝΑ LEARNER CORPUS; Όταν συλλέγεται το υλικό Όταν χαρακτηρίζονται τα λάθη Όταν κατηγοριοποιούνται τα λάθη Όταν επεξεργάζονται τα λάθη και καταλήγουμε σε αποτέλεσμα. Δες κείμενα από IFLG kai excel.
Ανακεφαλαίωση Ας … Δώσουμε έναν ορισμό στα Learner Corpora ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 Ανακεφαλαίωση Ας … Δώσουμε έναν ορισμό στα Learner Corpora Θυμηθούμε δυο κατηγορίες Μιλήσουμε για την χρησιμότητά τους
ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ 21/4/2019 COMPITO: Σχεδιάστε ένα learner corpus 500 λέξεων με τον πιο γρήγορο/εύκολο/αποδεκτό τρόπο.