Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Δρ Μαρία Καμηλάκη, Διδάσκουσα Π.Δ. 407/80 Φιλοσοφική Σχολή

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Δρ Μαρία Καμηλάκη, Διδάσκουσα Π.Δ. 407/80 Φιλοσοφική Σχολή"— Μεταγράφημα παρουσίασης:

1 Εισαγωγή στην Ανάλυση Γλωσσικών Δεδομένων Eνότητα 6: Στοιχεία επαγωγικής στατιστικής
Δρ Μαρία Καμηλάκη, Διδάσκουσα Π.Δ. 407/80 Φιλοσοφική Σχολή Τμήμα Ιταλικής Γλώσσας & Φιλολογίας Εαρινό Εξάμηνο 2019

2 Ας συνδεθούμε με την προηγούμενη εβδομάδα…
Εξοικειωθήκαμε με εργαλεία της περιγραφικής στατιστικής, όπως είναι: η συχνότητα, οι δείκτες κεντρικής τάσης (μέσος όρος, δεσπόζουσα τιμή, διάμεσος) και οι δείκτες διασποράς (εύρος, διακύμανση, τυπική απόκλιση).

3 Η σημερινή μας «ατζέντα»
Να διεξέλθουμε βασικά στοιχεία επαγωγικής στατιστικής ανάλυσης.

4 ΣΤΟΙΧΕΙΑ ΕΠΑΓΩΓΙΚΗΣ ΣΤΑΤΙΣΤΙΚΗΣ

5 Επαγωγική στατιστική Ασχολείται με τους τρόπους γενίκευσης σε όλο τον πληθυσμό των συμπερασμάτων που εξάγονται από το δείγμα (Παρασκευόπουλος 1990:10). Διαφοροποιείται από την περιγραφική στατιστική, που αποσκοπεί στη συνθετική παρουσίαση συγκεκριμένων ομάδων ποσοτικών πληροφοριών. Συνήθως σε μια γλωσσολογική έρευνα χρησιμοποιείται αρχικά περιγραφική στατιστική για την έκθεση των αποτελεσμάτων που συλλέχθηκαν από τη δειγματοληπτική έρευνα και στη συνέχεια επαγωγική, για να γενικευτούν τα αποτελέσματα της έρευνας και να αναχθούν σε ευρύτερες ομοειδείς ομάδες.

6 Στόχοι της επαγωγικής στατιστικής
Εκτίμηση (estimation): διαδικασίες που επιτρέπουν την εκτίμηση των χαρακτηριστικών του πληθυσμού μέσω των παρατηρηθέντων χαρακτηριστικών του δείγματος Έλεγχος Σημαντικότητας (significance testing): αξιολόγηση του κατά πόσο οι διαφορές που εμφανίζονται σε διαφορετικές ομάδες ή μεταβλητές είναι πραγματικές ή προκύπτουν τυχαία.

7 Έλεγχος εμπιστοσύνης Το επίπεδο εμπιστοσύνης δηλώνει το ποσοστό της πιθανότητας ένα δεδομένο να είναι αληθές, να ανήκει δηλαδή στο διάστημα εμπιστοσύνης που έχει καθοριστεί. Για παράδειγμα, το επίπεδο εμπιστοσύνης 95% δηλώνει ότι υπάρχουν 95% πιθανότητες το αποτέλεσμα που έχει προκύψει από το δείγμα να είναι αξιόπιστο. 

8 Έλεγχος στατιστικής σημαντικότητας
Το επίπεδο σημαντικότητας δηλώνει το ύψος της πιθανότητας το αποτέλεσμα να αποδειχθεί εσφαλμένο στο απώτερο μέλλον. Στόχος είναι το επίπεδο στατιστικής σημαντικότητας να είναι «αυστηρό», ώστε να είναι δύσκολο να απορριφθεί η μηδενική υπόθεση και από την άλλη να γίνεται αποδεκτή με όσο πιο ισχυρά «τεκμήρια» γίνεται η εναλλακτική υπόθεση εργασίας. Αν το επίπεδο σημαντικότητας έχει οριστεί 5%, αυτό θα είναι και το ποσοστό του κινδύνου σφάλματος του αποτελέσματος.

9 Έλεγχος στατιστικής σημαντικότητας
Όταν ελέγχουμε την στατιστική σημαντικότητα στην ουσία ελέγχουμε την πιθανότητα μια υπόθεση που έχουμε διαμορφώσει για τα δεδομένα μας να βγει αληθινή ή να διαψευσθεί. Η υπόθεση που κάνουμε για τα δεδομένα μας λέγεται «ερευνητική υπόθεση» και συμβολίζεται με το Η1. Στην υπόθεση αυτή θεωρούμε ότι υπάρχει μια διαφορετική συμπεριφορά ομάδων ή μεταβλητών. Η εναλλακτική υπόθεση που θα ισχύσει για τα δεδομένα μας αν η ερευνητική δεν αποδειχθεί λέγεται «μηδενική υπόθεση» και συμβολίζεται με το Η0. Σε αυτήν την περίπτωση θεωρούμε ότι οι ομάδες που εξετάζουμε ή οι μεταβλητές δεν εμφανίζουν διαφορές.

10 Επίπεδο σημαντικότητας
Η πιθανότητα (p) που ο ερευνητής θέτει ως όριο για να απορρίψει την μηδενική υπόθεση ονομάζεται «επίπεδο σημαντικότητας» (significance level). Παραδοσιακά στις κοινωνικές και τις ανθρωπιστικές επιστήμες το επίπεδο σημαντικότητας τίθεται στο 0,05. Το επίπεδο σημαντικότητας σε άλλες επιστήμες μπορεί να διαφέρει σημαντικά αφού υπάρχουν επιστήμες (Ιατρική, Αστρονομία), όπου αβεβαιότητες της τάξης του 5% μεταφράζονται σε χαμένες ανθρώπινες ζωές. Έτσι τίθενται επίπεδα σημαντικότητας αρκετά μικρότερα (π.χ. 0,01 και 0,001).

11 Επίπεδο σημαντικότητας

12 Παραδείγματα υποθέσεων
Διαφορές Ομάδων Η1: Οι γυναίκες χρησιμοποιούν περισσότερα υποκοριστικά από τους άνδρες. Η0: Οι γυναίκες και οι άνδρες δεν εμφανίζουν διαφορές στη συχνότητα χρήσης υποκοριστικών. Σχέση μεταβλητών Η1: Το μέσο μήκος των λέξεων ενός κειμένου σχετίζεται με τη δυσκολία κατανόησής του. Η0: Το μέσο μήκος των λέξεων ενός κειμένου δεν σχετίζεται με την δυσκολία κατανόησής του.

13 Η βασική δομή της ερευνητικής διαδικασίας
Διατυπώνουμε την ερευνητική υπόθεση και την μηδενική υπόθεση. Διεξάγουμε την έρευνα. Ελέγχουμε την μηδενική υπόθεση: Θέτουμε το επίπεδο σημαντικότητας Επιλέγουμε στατιστικό τεστ και υπολογίζουμε την στατιστική τιμή Συγκρίνουμε την στατιστική τιμή με την κρίσιμη τιμή ενός τεστ

14 Διατυπώστε τη δική σας ερευνητική υπόθεση!!!

15 Είδη στατιστικού λάθους
Τύπου Ι (α λάθος): Συμβαίνει όταν ο ερευνητής απορρίπτει τη μηδενική υπόθεση και αποδέχεται την ερευνητική, όταν στην ουσία η μηδενική είναι ορθή και θα έπρεπε να γίνει αποδεκτή. Τύπου ΙΙ (β λάθος) ή λάθος αποδοχής: Αποτελεί το αντίθετο του α λάθους και συνίσταται στην αποδοχή της μηδενικής υπόθεσης όταν αυτή στην πραγματικότητα δεν ισχύει. Η0 ορθή Η0 λανθασμένη Αποδοχή Η0 Σωστό β λάθος Απόρριψη Η0 α λάθος

16 Ας θυμηθούμε… εξαρτημένες και ανεξάρτητες μεταβλητές
Οι ερευνητικές μεταβλητές στην ανάλυση της κοινωνιογλωσσικής ποικιλότητας

17 Ας θυμηθούμε… τα είδη στατιστικών δεδομένων
Αριθμητικά δεδομένα Μετρήσεις που οι τιμές τους είναι αριθμοί, π.χ. «αριθμός μη πρότυπων (non-standard) τύπων», «μήκος πρότασης», «λεξιλογική πυκνότητα», «διάρκεια άρθρωσης ενός φωνήεντος» κ.ά. Ποιοτικά δεδομένα Μετρήσεις που οι τιμές τους είναι ποιοτικές διαβαθμίσεις, π.χ. τιμές όπως «ελλιπής», «ικανοποιητική», «επαρκής» ως απαντήσεις για γλωσσική επάρκεια σε γλώσσα-στόχο, «αρνητική»/«θετική» για στάσεις προς τη χρήση λέξεων-ταμπού. Κατηγορικά δεδομένα Μετρήσεις που οι τιμές τους είναι ονοματικοί χαρακτηρισμοί που διαφέρουν σε είδος π.χ. τιμές όπως «άνδρας, γυναίκα», «κείμενα δημοσιογραφικού λόγου, λογοτεχνίας, επιστήμης», μέρος του λόγου: «άρθρο», «ουσιαστικό», «ρήμα» κ.ο.κ.

18 Στατιστικά τεστ Κατηγορικά δεδομένα: Ποιοτικά δεδομένα:
χ2 Ποιοτικά δεδομένα: Median test Mann-Whitney U test Kruskal-Wallis test Αριθμητικά δεδομένα T-test ANOVA

19 Κατηγορικά δεδομένα: χ2
Το χ2 εξετάζει διαφορές μεταξύ των κατηγοριών μιας ανεξάρτητης μεταβλητής σε σχέση με τις κατηγορίες μιας εξαρτημένης. Πληροφορεί τον ερευνητή για την ένταση της συσχέτισης μεταξύ των μεταβλητών, αλλά δεν δίνει καμία ένδειξη για την κατεύθυνση της συσχέτισης. Υπάρχουν δύο είδη: χ2 με μια μεταβλητή: εξετάζει διαφορές στις κατηγορίες μιας κατηγορικής μεταβλητής χ2 με δύο μεταβλητές: εξετάζει διαφορές στις κατηγορίες που εμφανίζονται σε δύο κατηγορικές εξαρτημένες ή ανεξάρτητες μεταβλητές

20 χ2 με μια μεταβλητή Το τεστ μετράει τη συχνότητα σε κάθε κατηγορία της μεταβλητής (ονομάζονται παρατηρημένες συχνότητες – observed frequencies). Στη συνέχεια υπολογίζεται η αναμενόμενη συχνότητα (expected frequency) στις σχετικές κατηγορίες. Αυτή είναι η συχνότητα που θα εμφανιζόταν αν ίσχυε η μηδενική υπόθεση. Το χ2 προκύπτει από τον ακόλουθο τύπο:

21 Παράδειγμα Διερεύνηση της χρήσης επιθέτων σε 5 θεματικά είδη κειμένων
Επιστήμη Ιστορία Πολιτική Οικονομία Σύνολο Παρατηρημένες συχνότητες (Ο) 48 41 27 13 129 Αναμενόμενες συχνότητες (Ε) 32,25

22 χ2 με δύο μεταβλητές Αποτελεί επέκταση της χρήσης του χ2 με μια μεταβλητή. Το μόνο που αλλάζει είναι ο υπολογισμός των αναμενόμενων συχνοτήτων. Αυτός προκύπτει από το γινόμενο του συνόλου της στήλης και του συνόλου της σειράς το οποίο διαιρείται από το συνολικό άθροισμα των συχνοτήτων του πίνακα:

23 Παράδειγμα εφαρμογής του χ2 με δύο μεταβλητές
Παράδειγμα εφαρμογής του χ2 με δύο μεταβλητές Διερεύνηση της χρήσης των επιθέτων και των ουσιαστικών σε διαφορετικά είδη κειμένων. Επίθετα Ουσιαστικά Άθροισμα σειράς Επιστήμη Ο 48 7 55 Ε 36,39 18,61 Οικονομικά 27 16 43 28,45 14,55 Ιστορία 13 22 35 23,16 11,84 Άθροισμα στήλης 88 45 133 Συνολικό άθροισμα

24 Αριθμητικά δεδομένα – t-test

25 Αριθμητικά δεδομένα: t-test
Παραμετρική στατιστική διαδικασία που ελέγχει τη στατιστική σημαντικότητα των διαφορών των μέσων όρων: α) δύο δειγμάτων στην ίδια περίσταση (ανεξάρτητα δείγματα-independent sample t-test) ή β) ενός δείγματος σε δύο διαφορετικές περιπτώσεις (εξαρτημένα δείγματα-related measures t-test)

26 t-test με ανεξάρτητα δείγματα
Ας υποθέσουμε ότι θέλουμε να μελετήσουμε τη χρήση λέξεων-ταμπού ως προς τη μεταβλητή φύλο, καθορίζοντας ως αρχική (μηδενική) υπόθεση (Η0) ότι δεν υπάρχει διαφορά μεταξύ μέσων όρων αγοριών και κοριτσιών. Αντιστοίχως καθορίζεται και η εναλλακτική υπόθεση (Η1) ότι τα αγόρια χρησιμοποιούν κατά μέσο όρο περισσότερες λέξεις-ταμπού από τα κορίτσια. Η ερευνητική υπόθεση μπορεί να είναι μονόδρομη (one-tailed) ή δίδρομη (two-tailed), δηλ. μπορεί να υποθέσει ότι τα αγόρια χρησιμοποιούν μεγαλύτερο ποσοστό από τις γυναίκες (μονόδρομη υπόθεση) ή να υποθέσει γενικά ότι άνδρες και γυναίκες χρησιμοποιούν διαφορετικά ποσοστά δίχως όμως να έχει συγκεκριμένη ιδέα για το ποιο φύλο χρησιμοποιεί περισσότερο το λεξιλόγιο ταμπού (δίδρομη υπόθεση).

27 t-test με ανεξάρτητα δείγματα
Στη συνέχεια, ορίζουμε το «επίπεδο στατιστικής σημαντικότητας» (statistical significance level). Η πιο συνηθισμένη τιμή είναι 5%. Με τη βοήθεια του κριτηρίου ελέγχου υπολογίζουμε την «τιμή p» (p-value), την πιθανότητα δηλαδή η διαφορά των μέσων όρων της βαθμολογίας αγοριών κοριτσιών, για παράδειγμα, να οφείλεται σε τυχαίους παράγοντες ή όχι. Αν η τιμή p που θα προκύψει είναι μικρότερη ή ίση από το καθορισμένο επίπεδο σημαντικότητας, τότε απορρίπτουμε την αρχική υπόθεση και θεωρούμε ότι υπάρχει «στατιστικώς σημαντική διαφορά» μεταξύ των μέσων όρων.

28 t-test με εξαρτημένα δείγματα
Ο έλεγχος Τ ενδείκνυται και στην περίπτωση σύγκρισης της στατιστικής σημαντικότητας των διαφορών των μέσων όρων ενός δείγματος σε δύο διαφορετικές χρονικές στιγμές (εξαρτημένα δείγματα). Π.χ. σύγκριση της αναγνωστικής ικανότητας των μαθητών μιας τάξης Α΄ Δημοτικού στην αρχή και στο τέλος της σχολικής χρονιάς. Πιο συγκεκριμένα, ας υποθέσουμε ότι οι ερευνητικές υποθέσεις είναι: (1) H0: Δεν υπάρχει διαφορά κατά μέσο όρο στην αναγνωστική ικανότητα των μαθητών στην αρχή και στο τέλος της σχολικής χρονιάς. (2) Η1: Στο τέλος της σχολικής χρονιάς η αναγνωστική ικανότητα των μαθητών έχει βελτιωθεί κατά μέσο όρο. Ο έλεγχος αυτός εξετάζει τις διαφορές μεταξύ των μέσων όρων δύο διαφορετικών χρονικών στιγμών. Αν η διαφορά που θα προκύψει είναι αρκετά κοντά στο 0, τότε θα θεωρήσουμε ότι δεν υπάρχει στατιστική διαφορά μεταξύ των μέσων όρων για τις δύο διαφορετικές χρονικές στιγμές.

29 Αριθμητικά δεδομένα – Ανάλυση Διακύμανσης (Analysis of Variance – ANOVA)
H ΑΔ είναι η πλέον χρησιμοποιημένη μέθοδος στις κοινωνικές επιστήμες. Συνδέεται εννοιολογικά με το t-test, με τη διαφορά ότι, ενώ το t-test εξετάζει τις διαφορές μεταξύ των μέσων δύο ομάδων, η ανάλυση διακύμανσης κατά ένα παράγοντα μπορεί να εξετάζει διαφορές στους μέσους όρους περισσότερων από δύο ομάδων. Προϋπόθεση για να εφαρμόσουμε την ANOVA είναι η ύπαρξη μιας εξαρτημένης αριθμητικής μεταβλητής και η ύπαρξη μιας ή περισσότερων ανεξάρτητων κατηγορικών μεταβλητών. Η ΑΔ επιτρέπει την σύγκριση πολλών μέσων όρων και λειτουργεί συγκρίνοντας την διακύμανση εντός της ομάδας και κατά μήκους των ομάδων. Ο λόγος των δύο διακυμάνσεων είναι η τιμή F η οποία έχει συγκεκριμένους βαθμούς ελευθερίας και η στατιστική σημαντικότητάς της ελέγχεται με βάσει σχετικούς πίνακες.

30 Αριθμητικά δεδομένα – Ανάλυση Διακύμανσης (Analysis of Variance – ANOVA)
Η ΑΔ εμφανίζει δύο γενικές μορφές: ΑΔ μιας μεταβλητής ΑΔ πολλών μεταβλητών

31 ANOVA μιας μεταβλητής Ο έλεγχος one–way ANOVA αναφέρεται στην επίδραση μιας κατηγορικής μεταβλητής επί μιας ποσοτικής μεταβλητής. Με άλλα λόγια αναφέρεται στην σύγκριση μέσων τιμών μιας ποσοτικής μεταβλητής που ανήκουν σε τρείς ή περισσότερες διαφορετικές ομάδες. Έστω ότι θέλουμε να εξετάσουμε αν το μορφωτικό επίπεδο των γονέων (με κατηγορίες «1=βασική εκπαίδευση», «2=μέση εκπαίδευση» και «3=ανώτατη εκπαίδευση») επηρεάζει τη χρήση λόγιων στοιχείων εκ μέρους των μαθητών/μαθητριών. Η προηγούμενη υπόθεση θα μπορούσε να διατυπωθεί εναλλακτικά: Διαφοροποιείται ο μέσος όρος χρήσης λόγιων στοιχείων από τους μαθητές/τις μαθήτριες, ανάλογα με το μορφωτικό επίπεδο των γονέων; Στην περίπτωση αυτή θα χρησιμοποιήσουμε μια ANOVA για να δούμε ποιες κατηγορίες εμφανίζουν διαφορετικούς μέσους όρους. Η τιμή F ωστόσο δε μας λέει ποιες κατηγορίες διαφέρουν από ποιες. Ειδικότερα χρειαζόμαστε να ξέρουμε ποιοι μέσοι όροι διαφέρουν στατιστικά σημαντικά από ποιους. Γι’ αυτό χρησιμοποιούμε τα τεστ πολλαπλής σύγκρισης (multiple comparison test), όπως π.χ.: Scheffe test Tukey HSD test Least Significant Difference (LSD) test

32 Το τεστ του Levene Μία από τις βασικές προϋποθέσεις για την εφαρμογή τόσο του t-test όσο και της ANOVA είναι η διεξαγωγή του ελέγχου ισότητας των πληθυσμιακών διακυμάνσεων των διαφόρων ομάδων με το τεστ του Levene (Levene’s test) • Το τεστ αυτό πρέπει να διεξάγεται πριν από τον κεντρικό έλεγχο των μέσων τιμών, προκειμένου να διασφαλίζεται η ακεραιότητα της ανάλυσης.

33 Σχέσεις μεταβλητών Εκτός από διαφορές ομάδων μπορούμε να μελετήσουμε τις σχέσεις διαφόρων μεταβλητών. Μπορούμε δηλ.να μελετήσουμε τη συμπεριφορά μιας μεταβλητής όταν μια άλλη μεταβλητή αλλάζει. Οι πιθανές σχέσεις δύο μεταβλητών μπορεί να είναι οι ακόλουθες: Σχέση Γραμμική Μη γραμμική Μη σχέση

34 Γραμμική σχέση δύο μεταβλητών
Η γραμμική σχέση εμφανίζεται γραφηματικά ως μια ευθεία γραμμή. Υπάρχουν δύο είδη γραμμικής συσχέτισης: Θετική γραμμική σχέση: Όταν μεγαλώνει η μία μεταβλητή μεγαλώνει και η άλλη. Αρνητική γραμμική σχέση: Όταν μεγαλώνει η μία μεταβλητή μικραίνει η άλλη. Ηλικία Μέγεθος πρότασης Ηλικία Χρόνος σύνταξης παραγράφου

35 Μη γραμμική σχέση δύο μεταβλητών
Όταν η σχέση δύο μεταβλητών δεν μπορεί να αναπαρασταθεί με μια ευθεία γραμμή τότε ονομάζεται μη γραμμική σχέση. Τα σημαντικότερα είδη μη γραμμικής σχέσης είναι: Καμπυλόγραμμη σχέση μορφής U Ανάστροφη καμπυλόγραμμη σχέση μορφής U Κύρος Ηλικία Απόδοση Άγχος

36 Συσχέτιση (correlation)
Η στατιστική έκφραση της σχέσης δύο μεταβλητών ονομάζεται συσχέτιση. Σκοπός της η διερεύνηση της σχέσης μεταξύ δύο συνεχών μεταβλητών.

37 Συντελεστής συσχέτισης - ΣΣ
Ο ΣΣ αποτελεί την αριθμητική έκφραση του τύπου και της ισχύος της σχέσης δύο μεταβλητών. Ισχύς: Ο ΣΣ παίρνει τιμές από 0 έως 1: Το 0 υποδηλώνει ότι δεν υπάρχει καμία σχέση μεταξύ των δύο μεταβλητών Το 1 υποδηλώνει ότι υπάρχει τέλεια σχέση μεταξύ των δύο μεταβλητών Τύπος: Ο τύπος εμφανίζεται ως πρόσημο στον συντελεστή: Το + υποδηλώνει θετική σχέση μεταξύ των μεταβλητών Το – υποδηλώνει αρνητική σχέση μεταξύ των μεταβλητών

38 Ερμηνεία των ΣΣ Δεν υπάρχει αντικειμενικός προσδιορισμός της ισχύος ενός ΣΣ. Ως γενικό οδηγό ωστόσο μπορούμε να ακολουθήσουμε τον παρακάτω πίνακα: < 0,20: Μικρή, σχεδόν ασήμαντη σχέση 0,20 – 0,40: Χαμηλή συσχέτιση, σίγουρη, αλλά μικρή σχέση 0,40 – 0,70: Μέτρια συσχέτιση, σημαντική σχέση 0,70 – 0,90: Υψηλή συσχέτιση, έντονη σχέση > 0,90: Πολύ υψηλή συσχέτιση, άμεσα εξαρτώμενη σχέση

39 Είδη ΣΣ Για αριθμητικές μεταβλητές: Για μεταβλητές ποιοτικών δεδομένων
Pearson product moment correlation ή Pearson’s r Για μεταβλητές ποιοτικών δεδομένων Spearman rho (rs): Διαδεδομένος ΣΣ όταν οι μεταβλητές που συγκρίνονται είναι κατατάξεις ως προς κάποιο χαρακτηριστικό. Συνήθως προτιμάται όταν οι κατατάξεις αυτές έχουν προκύψει από αριθμητικά δεδομένα. Kendall’s tau (τ): Όταν δύο κριτές έχουν κατατάξει την ίδια σειρά αντικειμένων. Για κατηγορικές μεταβλητές Phi (Φ) & Cramer’s V : Για πίνακες με κατηγορικά δεδομένα

40 Συντελεστής Καθορισμού - ΣΚ
Ο ΣΣ μας λέει αν και πόσο δυνατά σχετίζονται δύο μεταβλητές. Ωστόσο, δεν μας προσδιορίζει το ποσοστό της διακύμανσης μιας μεταβλητής που οφείλεται στην ύπαρξη της άλλης. Ο ΣΚ (ή r2) παίρνει τιμές από 0 – 1 και προκύπτει από το τετράγωνο του ΣΣ. Π.χ. αν ο ΣΣ της σχέσης του μεγέθους μιας πρότασης και της ταχύτητας με την οποία αυτή κατανοείται είναι 0,91, τότε ο ΣΚ είναι 0,83 Μέγεθος πρότασης r= 0,91 Ταχύτητα κατανόησης της πρότασης r2= 0,83

41 Βιβλιογραφικές αναφορές
Baroni, M. & Evert, S. (2009). Statistical methods for corpus exploitation. In A. Lüdeling & M. Kytö (eds), Corpus Linguistics: An International Handbook. Vol. 2. Berlin: de Gruyter, Γούτσος, Δ. & Φραγκάκη, Γ. (2015). Εισαγωγή στη Γλωσσολογία Σωμάτων Κειμένων. Ελληνικά ακαδημαϊκά ηλεκτρονικά συγγράμματα και βοηθήματα. Ζαχαροπούλου Χ. (1986). Στατιστική για οικονομολόγους. Τ. Α'. Θεσσαλονίκη. Mικρός, Γ. Εισαγωγή στην Ανάλυση Γλωσσικών Δεδομένων. Ενότητα 3: Επαγωγική στατιστική. Παρασκευόπουλος Ι. Ν. (1990). Στατιστική εφαρμοσμένη στις επιστήμες της συμπεριφοράς. Τ.2. Αθήνα: Βιβλιοπωλείο Γρηγόρη. Τσοπάνογλου Α. (20102). Μεθοδολογία της επιστημονικής έρευνας και εφαρμογές της στην αξιολόγηση της γλωσσικής κατάρτιση. Θεσσαλονίκη: Εκδ. Ζήτη. Thorndike R. L., Thorndike-Crist T. (2010). Measurement and Evaluation in Education and Psychology. Boston: Pearson.

42 Βιβλιογραφικές αναφορές
Mικρός, Γ. Εισαγωγή στην Ανάλυση Γλωσσικών Δεδομένων. Ενότητα 2: Περιγραφική στατιστική. Τσάντας Ν., Μωυσιάδης Χ., Μπαγιάτης Ν., Χατζηπαντελής Θ. (1999). Ανάλυση δεδομένων με τη βοήθεια στατιστικών πακέτων. Θεσσαλονίκη: Εκδ. Ζήτη. Ψωινός Δ. (1999). Στατιστική. Θεσσαλονίκη: Εκδ. Ζήτη. Guilford J. P., Fruchter B. (19816). Fundamental Statistics in Psychology and Education. Singapore: McGraw-Hill. Hatch E., Farhady H. (1982). Research Design and Statistics for Applied Linguistics. Rowley-London-Tokyo: Newbery House. Hays W. L. (19762). Statistics for the Social Sciences. London: Holt International. Wright D. B. (1997). Understanding Statistics. An Introduction for the Social Sciences. London: SAGE.


Κατέβασμα ppt "Δρ Μαρία Καμηλάκη, Διδάσκουσα Π.Δ. 407/80 Φιλοσοφική Σχολή"

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google