Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

ΗΛΕΚΤΡΟΝΙΚΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ ΓΛΩΣΣΙΚΗΣ ΕΚΜΑΘΗΣΗΣ

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "ΗΛΕΚΤΡΟΝΙΚΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ ΓΛΩΣΣΙΚΗΣ ΕΚΜΑΘΗΣΗΣ"— Μεταγράφημα παρουσίασης:

1 ΗΛΕΚΤΡΟΝΙΚΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ ΓΛΩΣΣΙΚΗΣ ΕΚΜΑΘΗΣΗΣ
Learner Corpora 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

2 Πριν από οτιδήποτε άλλο…
Τι είναι..; Κειμενική κατηγορία Συμφράσεις Αντιπροσωπευτικότητα Λημματοποίηση Tagger, tagset Parser 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

3 ΗΣΚ από την έρευνα στο μαθητή
Τα ΗΣΚ γλωσσικής εκμάθησης είναι συλλογές κειμένων, γραπτών ή προφορικών, που έχουν παραχθεί από τους ίδιους τους μαθητές της ξένης γλώσσας Είναι: α. ηλεκτρονικά (και άρα εύκολα στην ανάλυση) β. μεγάλα (και άρα αξιόπιστα) 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

4 Αυθεντικά; Τα ΗΣΚ Γλωσσικής Εκμάθησης αποτελούν πηγή αυθεντικού λόγου, μοναδική απόδειξη της διαγλώσσας των μαθητών κατά τη διαδικασία της εκμάθησης. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

5 Διαγλώσσα; Η γλώσσα του μαθητή της Ξένης Γλώσσας διαφέρει από αυτήν του φυσικού ομιλητή. Τόσο ποσοτικά όσο και ποιοτικά έχει διαφορετική συχνότητα λέξεων, φράσεων και δομών, άλλα στοιχεία δεν χρησιμοποιούνται και άλλα χρησιμοποιούνται υπερβολικά. Ένα ΗΣΚ γλωσσικής εκμάθησης χαρακτηρίζεται από λάθη (αποκλίσεις) που βοηθούν στην κατανόηση της διαδικασίας της μάθησης 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

6 Ερωτήματα για τα Learner Corpora:
Πώς η παρεμβολή της μητρικής γλώσσας επηρεάζει τη μάθηση της Ξένης Γλώσσας; Πώς εμποδίζουν οι συνθήκες της τάξης τη γλωσσική παραγωγή του μαθητή; Ποια είναι τα πιο συνηθισμένα λάθη; Ποιες στρατηγικές αποφυγής υιοθετούν οι μαθητές σε σχέση με τις δομές που δεν υπάρχουν στη μητρική τους γλώσσα ή υπάρχουν σε λανθάνουσα μορφή; Σε ποιες περιπτώσεις γίνεται υπερβολική χρήση δομών ή φαινομένων και σε ποιες ελλιπής; Leech 1997: αρχή της ανάπτυξης των ΗΣΚ Γλ.Εκμ. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

7 ΑΛΛΑ: Χρήσιμο για τους μαθητές είναι να βλέπουν δείγματα λόγου από «ειδικούς» σε κειμενικά είδη που ανταποκρίνονται στις ανάγκες των μαθητών και στα ενδιαφέροντά τους, ώστε να στοχεύουν πάντα στην απόκτηση της καλύτερης δυνατής δεξιότητας. Tribble 1997 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

8 Μελέτη ως προς τη μορφή του λόγου:
Δηλαδή, εάν πρόκειται για συλλογές γραπτών κειμένων, προφορικών ή μεικτών. Η πλειοψηφία των μέχρι τώρα ΗΣΚ γλωσσικής εκμάθησης βασίζεται στο γραπτό λόγο (ή κυρίως στο γραπτό λόγο), το γεγονός αυτό όμως δεν αφήνει περιθώρια για να ερευνηθούν περιοχές όπως η προφορά, ο επιτονισμός ή τα πραγματολογικά λάθη. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

9 Μελέτη ως προς την διαθεσιμότητα χρήσης:
Το πρώτο είδος είναι ΗΣΚ γλωσσικής εκμάθησης που δημιουργήθηκαν με την πρωτοβουλία μεγάλων εκδοτικών οίκων και ορίζονται ως εμπορικά αξιοποιήσιμα ΗΣΚ γλωσσικής εκμάθησης. Τα πιο γνωστά αυτού του είδους: Longman Learners Corpus με περίπου 10 εκατομμύρια λέξεις Cambridge Learner Corpus με περίπου 16 εκατομμύρια λέξεις. Το δεύτερο είδος είναι τα ΗΣΚ γλωσσικής εκμάθησης με εκπαιδευτικούς στόχους. Αφορά σε συλλογές, είναι δηλαδή ΗΣΚ γλωσσικής εκμάθησης που έχουν δημιουργηθεί μέσα στο ακαδημαϊκό περιβάλλον. Τέτοιου είδους υπάρχουν πολλά για παράδειγμα: το HKUST του Hong Kong University of Science and Technology με λέξεις, το MELD του Montclair State University των Ηνωμένων Πολιτειών που περιέχει λέξεις, το International Corpus of Learner English του Πανεπιστημίου της Louvain-la-Neuve του Βελγίου με λέξεις, 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

10 Μελέτη ως προς τη μητρική γλώσσα του μαθητή
Τα μεγάλα ΗΣΚ γλωσσικής εκμάθησης που προαναφέρθηκαν βασίζονται σε παραγωγή λόγου από μαθητές της αγγλικής με καταγωγή που ποικίλλει. Τα περισσότερα από αυτά τα ΗΣΚ γλωσσικής εκμάθησης, όπως είναι λογικό, έχουν να επιδείξουν μία μεγάλη ποικιλία μητρικών γλωσσών. Υπάρχουν ΗΣΚ γλωσσικής εκμάθησης, που έχουν ως σκοπό να μελετήσουν την παραγωγή στην ξένη γλώσσα όπως διατυπώνεται από μαθητές με ένα συγκεκριμένο υπόβαθρο σ’ ό,τι αφορά τη μητρική τους γλώσσα. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

11 Μελέτη ως προς τον τρόπο συλλογής του υλικού
Ανάλογα με τον τρόπο συλλογής του υλικού διαφέρει ο τρόπος μελέτης, αλλά και ο στόχος του ΗΣΚ γλωσσικής εκμάθησης. Στα ΗΣΚ γλωσσικής εκμάθησης μπορεί να μελετηθεί η πρόοδος του μαθητή εάν συλλεχθεί από το ίδιο κοινό, διαδοχικά, διαφορετικό υλικό ή, μπορούν να μελετηθούν τα χαρακτηριστικά της διαγλώσσας σ’ ένα συγκεκριμένο επίπεδο, σε μια συγκεκριμένη χρονική στιγμή συλλέγοντας υλικό από διαφορετικούς μαθητές. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

12 Κατασκευάζοντας ένα Learner Corpus: (συμβουλές 1)
Καταγραφή των δεδομένων των μαθητών της ξένης γλώσσας – και όχι των δεδομένων των μαθητών στη μητρική γλώσσα ή των φυσικών ομιλητών της ξένης γλώσσας (L2 Learner VS L1 Speakers and/or L2 speakers). Δεδομένα που θα προκύπτουν αυθόρμητα, να πρόκειται δηλαδή για αυθεντικό υλικό και όχι κατά τη διάρκεια ελεγχόμενης άσκησης (όπως για παράδειγμα κατά τη διάρκεια ενός παιχνιδιού ρόλων ή κατά την παραγωγή μίας περίληψης) (Naturalistic VS experimental). Το υλικό να είναι ελεύθερη παραγωγή και όχι περιορισμένη (για παράδειγμα απαντήσεις σε ερωτήσεις γραπτές ή προφορικές) (open-ended VS controlled). Περιλαμβάνονται ολόκληρα τα κείμενα παραγωγής των μαθητών και όχι απομονωμένες φράσεις ή λέξεις (whole text VS sentences/words). 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

13 Κατασκευάζοντας ένα Learner Corpus: (συμβουλές 2)
Αντιπροσωπευτικό δείγμα από πολλούς μαθητές της ξένης γλώσσας και όχι πολλά δείγματα παραγωγής από τους ίδιους τους μαθητές (Representative of many speakers/writers VS handful of speakers/writers). Συστηματική συλλογή δεδομένων από τους μαθητές (με συγκεκριμένες παραμέτρους) και όχι η αναδρομή σε προηγούμενο παρόμοιο υλικό (Systematic collections VS archives). Μεγάλη συλλογή δεδομένων, παρά μικρά δείγματα της γλώσσας προς μελέτη. Κυρίως για την αντιπροσωπευτικότητά και την αξιοπιστία των αποτελεσμάτων που θα προκύψουν. Όσο μεγαλύτερο το μέγεθος τόσο περισσότερες οι πιθανότητες να καλύπτεται ένα μεγάλο κομμάτι της γλώσσας (Large collections VS small samples). 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

14 Σχεδιασμός Learner Corpus
Διατύπωση των στόχων. Το ΗΣΚ γλωσσικής εκμάθησης θα έχει κάποια συγκεκριμένη σκοπιμότητα για να εφαρμοστούν τα αποτελέσματά του σε κάποιον επιστημονικό τομέα. Καθορισμός του είδους του υλικού · δηλαδή εάν συλλέγονται γραπτά, προφορικά ή κείμενα και των δύο ειδών από τους μαθητές, τι περιεχομένου και από ποιες παραμέτρους ορίζονται. Το μέγεθος του ΗΣΚ γλωσσικής εκμάθησης θα πρέπει να οριστεί από την αρχή και ο στόχος που θα μπει για τον αριθμό των αντικειμένων να τηρηθεί, όχι γιατί υπάρχει μια συγκεκριμένη συνταγή για το μέγεθος, αλλά για να συντελέσει στην αντιπροσωπευτικότητα του ΗΣΚ γλωσσικής εκμάθησης. Η αντιπροσωπευτικότητα είναι μία έννοια στην οποία δεν μπορεί να γίνει κάποια προσέγγιση μόνο με αριθμούς. Θα πρέπει να συμπεριληφθεί και ο αριθμός των μαθητών, όπως επίσης και το μέγεθος των κειμένων και το πλήθος αυτών. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

15 Παράμετροι που αφορούν στον μαθητή
ηλικία, φύλο, μητρική γλώσσα, καταγωγή, περιβάλλον μάθησης, επίπεδο γλωσσομάθειας (για το οποίο πολλές φορές χρησιμοποιείται ένα είδος αξιολόγησης πριν από την παραγωγή και συλλογή υλικού), έκθεση του μαθητή στην ξένη γλώσσα, άλλες ξένες γλώσσες που γνωρίζει ο μαθητής. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

16 Παράμετροι που αφορούν στο στόχο του υλικού
είδος λόγου, επιστημονικό πεδίο στο οποίο μπορεί να αναφέρεται το κείμενο, είδος κειμένου (ορίζεται, ή όχι, από τους κατασκευαστές του ΗΣΚ γλωσσικής εκμάθησης), μήκος κειμένου (ποικίλλει ανάλογα με τον χρόνο αλλά και με το επίπεδο), θέμα του κειμένου (επηρεάζει και τις λεξιλογικές επιλογές), συνθήκες της συγκέντρωσης του υλικού, δηλαδή: ο χρόνος, εάν αποτελεί μέρος μιας εξέτασης και τα εργαλεία αναφοράς δηλαδή, τα λεξικά ή οι γραμματικές που χρησιμοποιήθηκαν από τους μαθητές. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

17 Άλλες παράμετροι Βαθμός Περιβάλλον Εγχειρίδιο 12/11/2018
ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

18 Χαρακτηρισμός του Learner Corpus
Φωνητική Μεταγραφή: αναπαράσταση της φωνητικής μορφής του κειμένου, σε γραπτή μορφή (είτε πρόκειται για γραπτό, είτε για προφορικό κείμενο). Προσωδιακός Χαρακτηρισμός: παράθεση των στοιχείων του επιτονισμού, της έντασης, των παύσεων και άλλων. Ανάλυση των Μερών του Λόγου ή Γραμματικός Χαρακτηρισμός: Με τους ίδιους αναλυτές που χρησιμοποιούνται και σε ένα ΗΣΚ φυσικών ομιλητών επιτυγχάνονται οι ίδιοι στόχοι και στο ΗΣΚ γλωσσικής εκμάθησης. Συντακτικός Χαρακτηρισμός (Parsing): η συνδρομή του ερευνητή είναι απαραίτητη, γιατί απολύτως αυτοματοποιημένος και επιτυχής συντακτικός αναλυτής δεν υπάρχει. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

19 Χαρακτηρισμός του Learner Corpus
Σημασιολογικός Χαρακτηρισμός: Χρησιμοποιείται λιγότερο στα ΗΣΚ γλωσσικής εκμάθησης απ’ ότι στα ΗΣΚ. Πραγματολογικός και Κειμενικός Χαρακτηρισμός: Ένας χαρακτηρισμός που μόνο χειρωνακτικά θα μπορούσε να γίνει σε ένα ΗΣΚ γλωσσικής εκμάθησης. Χαρακτηρισμός των Λαθών: Αποτελεί μία νέα κατηγορία χαρακτηρισμού Τα παραδοσιακά είδη χαρακτηρισμού δεν εξυπηρετούν αυτό που πραγματώνει το μαρκάρισμα των λαθών, να εστιάσει δηλαδή στην προβληματική φύση της γλώσσας από την πλευρά του μαθητή Είναι μία διαδικασία που αφορά κυρίως τα ΗΣΚ γλωσσικής εκμάθησης και μπορεί να γίνει αυτόματα ή χειρωνακτικά. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

20 Προγράμματα χαρακτηρισμού λαθών
Υπάρχουν συστήματα χαρακτηρισμού λαθών που αναγνωρίζουν το λάθος στο ΗΣΚ γλωσσικής εκμάθησης, το κατατάσσουν σε μία κατηγορία λαθών και στο αντίστοιχο Μέρος του Λόγου που ανήκει το λανθασμένο στοιχείο. Μπορούν για παράδειγμα να διακρίνουν τα λάθη σε: λεξιλογικά, συντακτικά, φωνητικά και άλλα λάθη που γίνονται σε όλα τα επίπεδα γλωσσομάθειας. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

21 Εφαρμογές ΗΣΚ γλωσσικής εκμάθησης
Για Παιδαγωγικούς σκοπούς Για τη Σύσταση Αναλυτικού Προγράμματος Για τη δημιουργία γραμματικών και λεξικών 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

22 Αντιπροσωπευτικά Learner Corpora
ICLE ( International Corpus of Learner English) JEFLL CLEC (Chinese Learner English Corpus) Longman’s Learner Corpus (LLC) HKUST Corpus (Hong Kong University of Science and Technology Corpus) MELLD (Montclair Electronic Language Learner Database) CLC (Cambridge Learner Corpus) Progetto di Pavia 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

23 ΜΕ ΤΙ ΜΟΙΑΖΕΙ ΕΝΑ LEARNER CORPUS;
Όταν συλλέγεται το υλικό Όταν χαρακτηρίζονται τα λάθη Όταν κατηγοριοποιούνται τα λάθη Όταν επεξεργάζονται τα λάθη και καταλήγουμε σε αποτέλεσμα. Δες κείμενα από IFLG kai excel. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

24 Ανακεφαλαίωση Ας … Δώσουμε έναν ορισμό στα Learner Corpora
Θυμηθούμε δυο κατηγορίες Μιλήσουμε για την χρησιμότητά τους 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ

25 COMPITO: Σχεδιάστε ένα learner corpus 500 λέξεων με τον πιο γρήγορο/εύκολο/αποδεκτό τρόπο. 12/11/2018 ΑΙΚΑΤΕΡΙΝΗ ΦΛΩΡΟΥ


Κατέβασμα ppt "ΗΛΕΚΤΡΟΝΙΚΑ ΣΩΜΑΤΑ ΚΕΙΜΕΝΩΝ ΓΛΩΣΣΙΚΗΣ ΕΚΜΑΘΗΣΗΣ"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google