Εισαγωγή στην Στατιστική ΤΕΙ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ Εισαγωγή στην Στατιστική Κουκούμιαλος Στυλιανός «Εισαγωγή στην Στατιστική» / Συνοπτική Παρουσίαση Κεφάλαιο 9,10 05/10/2015 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 1
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ- ΣΥΣΧΕΤΙΣΗ 1.-Ανάλυση παλινδρόμησης- Συσχέτιση 2.- Απλή γραμμική παλινδρόμηση 3.-Εκτίμηση γραμμικού υποδείγματος με την Μέθοδο Ελαχίστων Τετραγώνων 4.- Ανάλυση διασποράς 5.- Συντελεστής προσδιορισμού –Τυπικό σφάλμα της εκτίμησης 6.- Έλεγχος σημαντικότητας -Διάστημα εμπιστοσύνης για την παράμετρο β1 7.- Ανάλυση υπολοίπων Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 2
Ανάλυση παλινδρόμησης Η ανάλυση παλινδρόμησης εφαρμόζεται για την εκτίμηση των τιμών μίας μεταβλητής Υ, με βάση τις τιμές μίας ή περισσότερων μεταβλητών Χ. Η μεταβλητή Υ, που δέχεται την επίδραση της Χ ονομάζεται εξαρτημένη μεταβλητή(Response variable). Η μεταβλητή Χ ονομάζεται ανεξάρτητη ή ερμηνευτική μεταβλητή (Predictor). Ο σκοπός είναι να προσδιορισθεί ένα μαθηματικό υπόδειγμα, που συνδέει τις δύο μεταβλητές. Από την εξίσωση που προσδιορίζεται, λαμβάνονται εκτιμήσεις των τιμών της μεταβλητής Υ για διάφορες τιμές της ανεξάρτητης μεταβλητής Χ. Οι εκτιμήσεις γίνονται με βάση τα δεδομένα ενός δείγματος, δηλαδή ζεύγη τιμών που επιλέγονται από τον στατιστικό πληθυσμό. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 3
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Η γραφική απεικόνιση των τιμών καλείται διάγραμμα διασποράς (Scatter plot). Η σχέση μεταξύ των μεταβλητών Χ και Υ δεν είναι συναρτησιακή, αλλά στατιστική, δηλαδή οι τιμές της Υ δεν ορίζονται μονοσήμαντα από τις αντίστοιχες τιμές της Χ. Π.χ η δαπάνη εταιρείας για την διαφήμιση προϊόντος, δεν καθορίζει μονοσήμαντα τις πωλήσεις, διότι οι πωλήσεις διαμορφώνονται και από άλλους παράγοντες, όπως τιμή προϊόντος, διαθέσιμο εισόδημα, μέση τιμή αγοράς. Παραδείγματα στατιστικών σχέσεων απεικονίζονται στα επόμενα διαγράμματα διασποράς. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Διαγράμματα διασποράς Συμπληρωματικά: Δύο ενδεχόμενα καλούνται συμπληρωματικά, όταν είναι ξένα και η ένωσή τους είναι ο δειγματικός χώρος. Ισχύει Α Β = και Α Β =Ω Διαφορά Α-Β: Είναι το ενδεχόμενο που πραγματοποιείται, όταν πραγματοποιείται το Α και όχι το Β. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 5
Συσχέτιση(Correlation) Η συσχέτιση εκφράζει την αλληλεξάρτηση δύο μεταβλητών που υφίστανται ταυτόχρονες αλλαγές. Συντελεστής συσχέτισης ρ: Μέτρο γραμμικής συσχέτισης για τον πληθυσμό, μετρά την ισχύ της γραμμικής σχέσης μεταξύ δύο μεταβλητών. Ο συντελεστής ρ δεν εκφράζεται σε μονάδες μέτρησης, και ισχύει -1≤ρ≤1. Ο συντελεστής ρ εκτιμάται από τον δειγματικό συντελεστή συσχέτισης rxy. Όσο πλησιέστερα στο 1, τόσο πιο ισχυρή η θετική συσχέτιση. Όσο πλησιέστερα στο -1, τόσο πιο ισχυρή η αρνητική συσχέτιση. Η τιμή rxy=0 δηλώνει είτε ότι δεν υπάρχει συσχέτιση ή υπάρχει μη γραμμική συσχέτιση (π.χ τετραγωνική, εκθετική). Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Διαγράμματα διασποράς για διάφορες τιμές του rxy Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Απλή γραμμική παλινδρόμηση Οι τιμές της μεταβλητής Υ δεν ορίζονται μονοσήμαντα, αλλά θεωρούμε ότι ι)Σε κάθε τιμή της μεταβλητής Χ αντιστοιχεί μία κατανομή πιθανότητας τιμών της μεταβλητής Υ. ιι) Οι μέσες τιμές των κατανομών πιθανότητας, μεταβάλλονται κατά κάποιο συστηματικό τρόπο με τις τιμές της μεταβλητής Χ. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 8
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Αν η σχέση μεταξύ Χ και Υ είναι γραμμική, το υπόδειγμα παλινδρόμησης είναι της μορφής: β0 : Σημείο τομής της ευθείας παλινδρόμησης με τον άξονα Υ β1 : Κλίση της ευθείας. Εκφράζει την κατά μέσον όρο μεταβολή της μεταβλητής Υ όταν η Χ μεταβάλλεται κατά μία μονάδα. εi : Όρος σφάλματος, εκφράζει την απόκλιση των τιμών γύρω από την ευθεία παλινδρόμησης. Ο όρος σφάλματος περιλαμβάνεται, διότι το υπόδειγμα είναι μία προσέγγιση της πραγματικής σχέσης μεταξύ των μεταβλητών. Συνάρτηση παλινδρόμησης εκφράζει την σχέση μεταξύ της μέσης τιμής Ε(Υ) της μεταβλητής Υ και της μεταβλητής Χ. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 9
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Υποθέσεις για το υπόδειγμα παλινδρόμησης 1.- Οι όροι σφάλματος είναι τυχαίες μεταβλητές, οι οποίες ακολουθούν κανονική κατανομή με μέση τιμή Ε(εi )=0. 2.-Η διακύμανση της κατανομής είναι σταθερή για κάθε τιμή της μεταβλητής Χ. Δ(εi )=σ2 Υπόθεση ομοσκεδαστικότητας 3.-Οι όροι σφάλματος εi είναι στατιστικά ανεξάρτητοι. Συνοπτικά εi ~Ν(0, σ2 ) στατιστικά ανεξάρτητα Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 10
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Εκτίμηση γραμμικού υποδείγματος με την Μέθοδο Ελαχίστων Τετραγώνων Οι παράμετροι β0, β1 στο υπόδειγμα παλινδρόμησης, είναι άγνωστες και λαμβάνονται οι εκτιμήσεις τους από τα δεδομένα του δείγματος. Η εξίσωση παλινδρόμησης για το δείγμα είναι της μορφής : =b0+b1 xi (1) Η διαφορά ei = yi - καλείται υπόλοιπο (residual)ή σφάλμα, όπου yi : παρατηρούμενη τιμή του Υ που αντιστοιχεί στην τιμή xi : εκτίμηση, από την εξίσωση (1), της τιμής yi που αντιστοιχεί στην τιμή xi Θα προσδιορισθεί η εξίσωση της ευθείας (1), με την βέλτιστη προσαρμογή στα δεδομένα, ισοδύναμα, θα προσδιορισθούν οι τιμές b0 και b1 για τις οποίες ελαχιστοποιούνται τα υπόλοιπα ei. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 11
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Επειδή , ελαχιστοποιείται το άθροισμα και προκύπτει σύστημα δύο εξισώσεων, από τη λύση του οποίου υπολογίζονται οι τιμές b0 , b1 , από τις σχέσεις: Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 12
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Ανάλυση διασποράς Η ολική μεταβλητότητα των τιμών yi εκφράζεται ως το άθροισμα Ολικό άθροισμα τετραγώνων Η μεταβλητότητα των τιμών yi, που ερμηνεύεται από την σχέση παλινδρόμησης των δύο μεταβλητών, εκφράζεται ως το άθροισμα Άθροισμα τετραγώνων παλινδρόμησης Η μεταβλητότητα των τιμών yi που δεν ερμηνεύεται από την σχέση παλινδρόμησης, και παραμένει ανερμήνευτη σαν υπόλοιπο, εκφράζεται ως το άθροισμα Άθροισμα τετραγώνων σφαλμάτων Ισχύει SST =SSR+SSE Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Η συνολική μεταβλητότητα των τιμών της μεταβλητής Υ εκφράζεται σαν άθροισμα δύο όρων: της μεταβλητότητας που ερμηνεύεται από την παλινδρόμηση (SSR) και της μεταβλητότητας που δεν ερμηνεύει η μεταβλητή Χ (SSE). Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Συντελεστής προσδιορισμού – Τυπικό σφάλμα της εκτίμησης Συντελεστής προσδιορισμού R2 (Coefficient of determination) Εκφράζει το ποσοστό της μεταβλητότητας της μεταβλητής Υ, που ερμηνεύεται από την ανεξάρτητη μεταβλητή Χ. Ισχύει 0≤ R2 ≤1 Τυπικό σφάλμα της εκτίμησης (Standard error of estimate) Εκφράζει την διασπορά των τιμών γύρω από την ευθεία παλινδρόμησης. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Έλεγχος σημαντικότητας –Διάστημα εμπιστοσύνης για την παράμετρο β1 Έλεγχος σημαντικότητας για την παράμετρο β1 Η0 : β1 =0 (στατιστικά μη σημαντική) Η1 : β1 ≠0 ( στατιστικά σημαντική) Κριτήριο ελέγχου όπου η τυπική απόκλιση της παραμέτρου β1. Περιοχή απόρριψης R ={t >tn-2;α/2 ή t <-tn-2;α/2 } (1-α) Δ.Ε για την παράμετρο β1 Όπου η κριτική τιμή της κατανομής t με n-2 βαθμούς ελευθερίας και επίπεδο σημαντικότητας α. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Ανάλυση υπολοίπων ( Residual analysis) Βασική τεχνική για τον έλεγχο της καταλληλότητας ενός υποδείγματος παλινδρόμησης. Αν ισχύουν οι υποθέσεις που διατυπώθηκαν για το υπόδειγμα που εκτιμήθηκε, οι γραφικές παραστάσεις των υπολοίπων θα απεικονίζουν τις ιδιότητες που υποθέσαμε για τους όρους σφάλματος. Οι γραφικές παραστάσεις των υπολοίπων είναι: Διάγραμμα κανονικότητας Ιστόγραμμα υπολοίπων Υπόλοιπα ei ως προς εκτιμήσεις Υπόλοιπα ei ως προς την ανεξάρτητη μεταβλητή Χ Υπόλοιπα ως προς την σειρά των αντίστοιχων παρατηρήσεων Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Παράδειγμα Οι τιμές των μεταβλητών Χ: μηνιαία δαπάνη διαφήμισης (χιλ. ευρώ) Υ: μηνιαίες πωλήσεις (χιλ. ευρώ) ενός προϊόντος, για ένα δείγμα n=10 μηνών, από τα αρχεία μίας εταιρείας, είναι: Διάγραμμα διασποράς Υ 150 140 165 180 135 123 139 112 137 157 Χ 18 12 15 20 11 9 13.5 16.5 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 18
Οι τιμές των b0 και b1 υπολογίζονται από τις σχέσεις (2) Ο σταθερός όρος b0 =70.2 εκφράζει το ύψος των πωλήσεων, αν δεν υπήρχε δαπάνη για διαφήμιση, δηλαδή αν x=0. Ο συντελεστής b1 =5.18 εκφράζει ότι αν η δαπάνη διαφήμισης αυξηθεί κατά 1 μονάδα, δηλαδή κατά 1000 ευρώ, οι πωλήσεις της εταιρείας θα αυξηθούν, σε μέσον όρο, κατά 5180 χιλιάδες ευρώ. Οι εκτιμήσεις υπολογίζονται από την εξίσωση παλινδρόμησης. Π.χ για x=17 η αξία των πωλήσεων εκτιμάται, κατά μέσον όρο, ίση με Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 19
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Στο διάγραμμα, τα ζεύγη τιμών απεικονίζονται σαν σημεία, σκορπισμένα γύρω από την ευθεία παλινδρόμησης. Η απόσταση κάθε σημείου yi από την ευθεία, είναι το αντίστοιχο υπόλοιπο, Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Πίνακας ανάλυσης διασποράς Συντελεστής προσδιορισμού ή R2 =76.7% Τυπικό σφάλμα Έλεγχος σημαντικότητας για την παράμετρο β1 για α=0.01 Κριτήριο ελέγχου t=5.18/1.009=5.13 Κριτική τιμή t8;0.005=3.3554 t=5.13> t8;0.005=3.3554 H0 απορρίπτεται, συνεπώς η β1 στατιστικά σημαντική. Πηγή μεταβολής Β.Ε Άθροισμα τετραγώνων Μέσο άθροισμα τετραγώνων Παλινδρόμηση 1 SSR=2745 MSR=2745/1=2745 Υπόλοιπο 8 SSE= 832.6 MSE=832.6/8=104 Ολικό 9 SST=3577.6 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 21
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Αποτελέσματα παλινδρόμησης με το στατιστικό πρόγραμμα Minitab The regression equation is (Εξίσωση παλινδρόμησης) Y = 70,2 + 5,19 X Predictor Coef StDev T P Constant 70,17 14,70 4,78 0,001 X 5,185 1,010 5,14 0,001 S = 10,20 R-Sq = 76,7% R-Sq(adj) = 73,8% Analysis of Variance (Πίνακας ανάλυσης διασποράς) Source DF SS MS F P Regression 1 2745,0 2745,0 26,38 0,001 Residual Error 8 832,6 104,1 Total 9 3577,6 Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 22
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Ανάλυση υπολοίπων Στο 1ο διάγραμμα, για τον έλεγχο κανονικότητας, παρατηρούμε ότι τα υπόλοιπα είναι κατά μήκος της διαγωνίου, άρα θεωρούμε ότι έχουν κανονική κατανομή. Στο 2ο διάγραμμα, τα υπόλοιπα είναι τυχαία σκορπισμένα γύρω από την μέση τιμή τους ,το 0. Στο 4ο διάγραμμα, δεν υπάρχουν ακραίες τιμές. Από τις γραφικές παραστάσεις των υπολοίπων, θεωρούμε ότι δεν υπάρχει απόκλιση από τις υποθέσεις του γραμμικού υποδείγματος. The mean of the data in the sample of 36 CK measurements is given by Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» 23
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 1.-Υπόδειγμα πολλαπλής παλινδρόμησης 2.- Συντελεστής πολλαπλού προσδιορισμού 3.-Έλεγχος σημαντικότητας του υποδείγματος πολλαπλής παλινδρόμησης 4.-Έλεγχοι σημαντικότητας –Διαστήματα εμπιστοσύνης των συντελεστών παλινδρόμησης 5.- Πολυσυγγραμμικότητα Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Υπόδειγμα πολλαπλής παλινδρόμησης Γενικό υπόδειγμα παλινδρόμησης με κ ερμηνευτικές μεταβλητές Όπου Υi : η τιμή της i- παρατήρησης Xji : η τιμή της ανεξάρτητης μεταβλητής Xj για την i- παρατήρηση j = 1,2,… κ β1, β2,… βκ : οι συντελεστές παλινδρόμησης των κ ανεξάρτητων μεταβλητών εi : όροι σφάλματος Οι παράμετροι β0, β1, β2 ,…βκ ερμηνεύονται ανάλογα όπως στην απλή γραμμική παλινδρόμηση. Η παράμετρος β0 είναι η μέση τιμή του Υ όταν Χj = 0 j = 1,2,… κ. Η ερμηνεία αυτή ισχύει αν το διάνυσμα (x1j=0, x2j=0, …xκj=0 )βρίσκεται μέσα στα όρια τιμών για τα οποία ισχύει το υπόδειγμα. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Η παράμετρος βj , εκφράζει την μεταβολή στη μέση τιμή Ε(Υ) της μεταβλητής Υ, όταν η ανεξάρτητη μεταβλητή Χj αυξηθεί κατά μία μονάδα, ενώ οι τιμές των υπόλοιπων ερμηνευτικών μεταβλητών παραμένουν σταθερές. Δειγματική εξίσωση παλινδρόμησης Οι συντελεστές b0,b1,…bκ είναι οι εκτιμήσεις των παραμέτρων β0, β1,… βκ και υπολογίζονται με την Μ.Ε.Τ από τα δεδομένα του δείγματος. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Υποθέσεις για το υπόδειγμα πολλαπλής παλινδρόμησης 1.- Σε κάθε σύνολο τιμών της μεταβλητής Χj αντιστοιχεί μία κατανομή πιθανότητας της μεταβλητής Υ. Θεωρούμε ότι οι κατανομές της μεταβλητής Υ έχουν κανονική κατανομή με σταθερή διακύμανση σ2. 2.-Οι όροι σφάλματος είναι στατιστικά ανεξάρτητες τυχαίες μεταβλητές, με κανονική κατανομή, μέση τιμή Ε(εi )=0 και σταθερή διακύμανση Δ(εi )= σ2. 3.- Οι μεταβλητές Χj, j=1.2…κ είναι γραμμικά ανεξάρτητες. (Υπόθεση για την μη ύπαρξη πολυσυγγραμμικότητας) Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Συντελεστής πολλαπλού προσδιορισμού Συντελεστής προσδιορισμού Εκφράζει την μείωση του ολικού αθροίσματος τετραγώνων SST, η οποία προκύπτει από την εισαγωγή στο υπόδειγμα κ ερμηνευτικών μεταβλητών Χ1, Χ2,… Χκ. Ο συντελεστής R2 εκφράζει το ποσοστό της συνολικής μεταβλητότητας της εξαρτημένης μεταβλητής Υ, η οποία ερμηνεύεται από την επίδραση των κ ανεξάρτητων μεταβλητών. Συνήθως υπολογίζεται ο διορθωμένος συντελεστής προσδιορισμού , που εκφράζεται συναρτήσει του αριθμού κ των ανεξάρτητων μεταβλητών και του μεγέθους n του δείγματος. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Έλεγχος σημαντικότητας του υποδείγματος πολλαπλής παλινδρόμησης Ελέγχουμε αν η σχέση μεταξύ των μεταβλητών Υ και X1, X2,…Χκ είναι στατιστικά σημαντική, δηλαδή αν το υπόδειγμα παλινδρόμησης ερμηνεύει την μεταβλητότητα της Υ. Η0 :β1=β2=…βκ=0 (υπόδειγμα στατιστικά μη σημαντικό) Η1: β1 ≠β2≠…. ≠βκ≠0 (υπόδειγμα στατιστικά σημαντικό) Κριτήριο ελέγχου Περιοχή απόρριψης R={F >Fκ,n-κ-1;α} όπου Fκ,n-κ-1;α η κριτική τιμή της κατανομής F με κ, n-κ-1 β.ε και επίπεδο σημαντικότητας α. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Έλεγχοι σημαντικότητας –Διαστήματα εμπιστοσύνης για τους συντελεστές παλινδρόμησης Για να εξετάσουμε την επίδραση της μεταβλητής Χj στην μεταβλητή Υ, εφαρμόζουμε τον έλεγχο Η0: βj=0 (μη σημαντική επίδραση της Χj στην Υ) Η1: βj≠0 (στατιστικά σημαντική επίδραση της Xj στην Υ) Κριτήριο ελέγχου Περιοχή απόρριψης R ={t>tn-κ-1; α/2 ή t<-tn- κ-1; α/2} (1-α) Δ.Ε για την παράμετρο βj bj± sbj* tn-κ-1;α/2 όπου sbj η τυπική απόκλιση της παραμέτρου βj και tn-κ-1;α/2 η κριτική τιμή της κατανομής t με n–κ-1 β.ε και επίπεδο σημαντικότητας α. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Πολυσυγγραμμικότητα Το πρόβλημα της πολυσυγγραμμικότητας εμφανίζεται όταν υπάρχει υψηλός συντελεστής συσχέτισης μεταξύ των ερμηνευτικών μεταβλητών. Οι συσχετισμένες μεταβλητές δεν προσφέρουν καινούργιες πληροφορίες, και είναι δύσκολο να μετρηθεί η επιμέρους επίδρασή τους στην μεταβλητή Υ, διότι η επίδραση κάθε μεταβλητής Χj, επικαλύπτεται από την επίδραση των υπόλοιπων συσχετισμένων μεταβλητών. Ενδείξεις για την ύπαρξη πολυσυγγραμμικότητας είναι οι εξής: Το υπόδειγμα είναι στατιστικά σημαντικό (κριτήριο F),ενώ οι επιμέρους συντελεστές παλινδρόμησης(κριτήριο t)να εμφανίζονται μη σημαντικοί. Οι συντελεστές bj μεταβάλλονται σημαντικά αν προστεθούν ή αφαιρεθούν μεταβλητές στο υπόδειγμα. Οι συντελεστές bj έχουν μεγάλες διακυμάνσεις, έτσι ώστε σε επαναλαμβανόμενη δειγματοληψία να προκύπτουν σημαντικές μεταβολές των εκτιμήσεων. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Παράδειγμα: Για ένα δείγμα n=14 ακινήτων, εκτιμήθηκε το γραμμικό υπόδειγμα παλινδρόμησης, που συνδέει τις μεταβλητές Υ: φόρος ακινήτου(χιλιάδες ευρώ) , Χ1: παλαιότητα ακινήτου (έτη) Χ2: εμβαδόν ακινήτου (τετρ. μέτρα) Εξίσωση παλινδρόμησης Πίνακας ανάλυσης διασποράς Πηγή μεταβολής Β.Ε Άθροισμα τετραγώνων Μέσο άθροισμα τετραγώνων Παλινδρόμηση 2 SSR=23.489 MSR=23.489/2=11.744 Υπόλοιπο 11 SSE= 0.201 MSE=0.201/11=0.01827 Ολικό 13 SST=23.689 Συντελεστής προσδιορισμού ή R2=99.2%. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Έλεγχος σημαντικότητας του υποδείγματος Κριτήριο ελέγχου Κριτική τιμή κατανομής F για α=0.05, F2,11;0.05=3.98 F>F2,11;0.05 H0 απορρίπτεται, υπόδειγμα στατιστικά σημαντικό. Έλεγχοι σημαντικότητας των συντελεστών β1, β2 α=0.01 Κριτική τιμή t11;0.005=3.1 Για τον συντελεστή της παλαιότητας, κριτήριο ελέγχου Η0 απορρίπτεται β1 στατιστικά σημαντική αντίστοιχα για τον συντελεστή του εμβαδού, κριτήριο ελέγχου Η0 απορρίπτεται β2 στατιστικά σημαντική Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»
Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική» Ανάλυση υπολοίπων Από τις γραφικές παραστάσεις των υπολοίπων, δεν παρατηρούμε κάποια απόκλιση από τις υποθέσεις του γραμμικού υποδείγματος. Αικατερίνη Μπακούρα «Εισαγωγή στην Στατιστική»