Applied Econometrics Second edition Dimitrios Asteriou and Stephen G. Hall
Αυτοσυσχέτιση 1. Τι είναι αυτοσυσχέτιση Applied Econometrics: A Modern Approach using Eviews and Microfit © Dr D Asteriou Αυτοσυσχέτιση 1. Τι είναι αυτοσυσχέτιση 2. Τι προκαλεί την αυτοσυσχέτιση 3. Πρώτη και υψηλότερες τάξεις 4. Συνέπειες της αυτοσυσχέτισης 5. Διάγνωση αυτοσυσχέτισης 6. Επίλυση αυτοσυσχέτισης
Στόχοι μαθήματος 1. Κατανόηση της έννοιας της αυτοσυσχέτισης στο CLRM. 2. Εύρεση των αιτιών της αυτοσυσχέτισης. 3. Διάκριση μεταξύ πρώτης και υψηλότερων τάξεων αυτοσυσχέτισης. 4. Κατανόηση των συνεπειών της αυτοσυσχέτισης στους εκτιμητές OLS. 5. Διάγνωση αυτοσυσχέτισης μέσω διευρεύνησης γραφημάτων. 6. Διάγνωση αυτοσυσχέτισης μέσω επίσημων οικονομετρικών tests. 7. Διάκριση μεταξύ του ευρέου φάσματος των διαθέσιμων tests διάγνωση αυτοσυσχέτισης. 8. Εκτέλεση ελέγχων αυτοσυσχέτισης με τη χρήση οικονομετρικού λογισμικού. 9. Επίλυση αυτοσυσχέτισης με τη χρήση οικονομετρικού λογισμικού.
What is Autocorrelation Τι είναι αυτοσυσχέτιση Η υπόθεση 6 του CLRM δηλώνει ότι οι συνδιακυμάνσεις και οι συσχετίσεις μεταξύ διαφορετικών διαταράξεων είναι όλες μηδέν: cov(ut, us)=0 για κάθε t≠s Αυτή η υπόθεση δηλώνει ότι οι διαταραχές ut και us κατανέμονται ανεξάρτητα, γεγονός που αποκαλείται σειριακή ανεξαρτησία.
Τι είναι αυτοσυσχέτιση Αν αυτή η υπόθεση δεν είναι πια έγκυρη, τότε οι διαταραχές δεν είναι ανεξάρτητες κατά ζεύγη, αλλά αυτοσυσχετιζόμενες κατά ζεύγη(ή σειριακά συσχετιζόμενες). Αυτό σημαίνει ότι ένα σφάλμα που συμβαίνει την περίοδο t μπορεί να μεταφερθεί στην επόμενη t+1. Η αυτοσυσχέτιση εμφανίζεται πιο συχνά σε δεδομένα χρονολογικών σειρών. Σε διαστρωματικά δεδομένα, μπορούμε να αλλάξουμε τη σύνδεση των δεδομένων χωρίς να διαφοροποιηθούν τα αποτελέσματα.
Τι προκαλεί την αυτοσυσχέτιση Ένας παράγοντας που προκαλεί αυτοσυσχέτιση είναι οι παραλειπόμενες μεταβλητές. Υποθέστε ότι η Yt σχετίζονται με τις X2t καιX3t, αλλά εμείς λανθασμένα δεν περιλαμβάνουμε την X3t στο μοντέλο μας. Η επίδραση της X3t θα συμπεριληφθεί στις διαραταχές ut. Εάν X3t όπως οι περισσότερες οικονομικές σειρές, παρουσιάζει μια διαχρονική τάση, τότε η X3t εξαρτάται από τις X3t-1, X3t -2 κ.ο.κ. Ομοίως το ut εξαρτάται από τα ut-1, ut-2 κ.ο.κ.
Τι προκαλεί την αυτοσυσχέτιση Μια άλλη πιθανή αιτία είναι η λανθασμένη εξειδίκευση. Υποθέστε ότι η Yt σχετίζεται με την X2t με μια τετραγωνική σχέση: Yt=β1+β2X22t+ut Αλλά εμείς λανθασμένα υποθέτουμε και εκτιμούμε μια ευθεί γραμμή: Yt=β1+β2X2t+ut Τότε ο όρος σφάλματος που λαμβάνουμε από την ευθεία γραμμή θα εξαρτάται από την X22t.
Τι προκαλεί την αυτοσυσχέτιση Ένας τρίτος λόγος είναι τα συστηματική σφάλματα στη μέτρηση. Υποθέστε ότι μια εταιρία αναβαθμίζει την απογραφή τη σε μια δεδομένη περίοδο. Εάν ένα συστηματικό σφάλμα συμβεί τότε η απογραφή του σωρευτικού αποθέματος θα παρουσιάζει συσσωρευμένα σφάλματα μέτρησης. Αυτά τα σφάλματα θα φαίνονται σα μια διαδικασία αυτοσυσχέτισης.
Αυτοσυσχέτιση πρώτης τάξης Η πιο απλή και περισσότερο παρατηρούμενη είναι η αυτοσυσχέτιση πρώτης τάξης. Θεωρείστε το μοντέλο πολλαπλής παλινδρόμησης: Yt=β1+β2X2t+β3X3t+β4X4t+…+βkXkt+ut Στο οποίο η τρέχουσα παρατήρηση των σφαλμάτων ut είναι μια συνάρτηση της προηγούμενης (με χρονική υστέρηση) παρατήρησης του σφάλματος: ut=ρut-1+et
Αυτοσυσχέτιση πρώτης τάξης Ο συντελεστής ρ ονομάζεται συντελεστής αυτοσυσχέτισης πρώτης τάξης και παίρνει τιμές από -1 έως +1. Είναι προφανές ότι το μέγεθος του ρ καθορίζει την ισχύ της σειριακής συσχέτισης. Μπορεί να έχουμε τρεις διαφορετικές πέριπτώσεις.
Αυτοσυσχέτιση πρώτης τάξης Αυτοσυσχέτιση πρώτης τάξης Εάν το ρ είναι μηδέν, τότε δεν έχουμε αυτοσυσχέτιση. Εάν το ρ πλησιάζει τη μονάδα, η τιμή της προηγούμενης παρατήρησης του σφάλματος γίνεται πιο σημαντική στον προσδιορισμό της τιμής του τρέχοντος σφάλματος και συνεπώς υπάρχει υψηλός βαθμός αυτοσυσχέτισης. Στην περίπτωση αυτή έχουμε θετική αυτοσυσχέτιση. Εάν το ρ πλησιάζει το -1, έχουμε υψηλό βαθμό αρνητικής αυτοσυσχέτισης.
Αυτοσυσχέτιση πρώτης τάξης
Αυτοσυσχέτιση πρώτης τάξης
Υψηλότερης τάξης αυτοσυσχέτιση Δεύτερης τάξης αυτοσυσχέτιση: ut=ρ1ut-1+ ρ2ut-2+et Τρίτης τάξης αυτοσυσχέτιση ut=ρ1ut-1+ ρ2ut-2+ρ3ut-3 +et Αυτοσυσχέτιση τάξης p: ut=ρ1ut-1+ ρ2ut-2+ρ3ut-3 +…+ ρput-p +et
Συνέπειες της αυτοσυσχέτισης Οι OLS εκτιμητές είναι ακόμα αμερόληπτοι και συνεπείς. Αυτό συμβαίνει γιατί η αμεροληψία και η συνέπεια δεν εξαρτώνται από την υπόθεση 6 που παραβιάζεται. Οι OLS εκτιμητές θα είναι αναποτελεσματικοί και συνεπώς δεν θα είναι πια BLUE. Οι εκτιμημένες διακυμάνσεις των συντελεστών της παλινδρόμησης θα είναι μεροληπτικές και ασυνεπείς, και συνεπώς ο έλεγχος υποθέσεων δεν είναι πια έγκυρος. Στις περισσότερες περιπτώσεις, το R2 θα είναι υπερεκτιμημένο και τα t-στατιστικά θα τείνουν να είναι υψηλότερα.
Διάγνωση αυτοσυσχέτισης Υπάρχουν δύο τρόποι. Ο πρώτος είναι ο ανεπίσημος τρόπος που γίνεται μέσω γραφημάτων και συνεπώς ονομάζεται γραφική μέθοδος. Ο δεύτερος είναι μέσω επίσημων tests για αυτοσυσχέτιση, όπως τα παρακάτω: Το Durbin Watson Test Το Breusch-Godfrey Test Tο Durbin’s h Test (για την παρουσία εξαρτημένες μεταβλητές με χρονική υστέρηση) Το Engle’s ARCH Test
Διάγνωση αυτοσυσχέτισης Έχουμε τις ακόλουθες σειρές (τριμηνιαία δεδομένα από 1985q1 έως 1994q2): lcons = η καταναλωτική δαπάνη στα τρόφιμα ldisp = το διαθέσιμο εισόδημα lprice = ο σχετικός δείκτης τιμών των τροφίμων Πληκτρολογούμε στο Eviews την παρακάτω εντολή: ls lcons c ldisp lprice Και παίρνουμε τα αποτελέσματα της παλινδρόμησης.
Διάγνωση αυτοσυσχέτισης Μπορούμε να αποθηκεύσουμε τα κατάλοιπα της παλινδρόμησης σε ένα διάνυσμα πληκτρολογώντας την παρακάτω εντολή: genr res01=resid Και μπορούμε να πάρουμε ένα γράφημα των καταλοίπων από την εντολή: plot res01 Ενώ ένα γράφημα των καταλοίπων ενάντια στους όρους με χρονική υστέρηση λαμβάνεται από την εντολή: scat res01(-1) res01
Διάγνωση αυτοσυσχέτισης
Διάγνωση αυτοσυσχέτισης
Το Durbin Watson Test Οι παρακάτω υποθέσεις πρέπει να ικανοποιούνται: Το μοντέλο παλινδρόμησης περιλαμβάνει μια σταθερά. Η αυτοσυσχέτιση πρέπει να είναι μόνο πρώτης τάξης Η εξίσωση δεν περιλαμβάνει μια εξαρτημένη μεταβλητή με χρονική υστέρηση σαν ερμηνευτική μεταβλητή.
Το Durbin Watson Test Βήμα 1: Εκτιμούμε το μοντέλο με OLS και παίρνουμε τα κατάλοιπα Βήμα 2: Υπολογίζουμε το στατιστικό DW Βήμα 3: Κατασκευάζουμε τον πίνακα με το υπολογισμένο DW στατιστικό και τις κριτικές τιμές των dU, dL, 4-dU και 4-dL. Βήμα 4: Συμπεράσματα
Το Durbin Watson Test -ve autoc +ve autoc 0 dL dU 2 4-dU 4-dL 4 Ζώνη μη απόφασης Ζώνη μη απόφασης Όχι αυτοσυσχέτιση -ve autoc +ve autoc 0 dL dU 2 4-dU 4-dL 4
The Durbin Watson Test Μειονεκτήματα του του DW test Μπορεί να δώσει ασαφή αποτελέσματα Δεν είναι εφαρμόσιμο όταν χρησιμοποιείται μια εξαρτημένη μεταβλητή με χρονική υστέρηση Δεν μπορεί να λάβει υπόψη υψηλότερης τάξης αυτοσυσχέτιση
Το Breusch-Godfrey Test Είναι ένας έλεγχος πολλαπλασιαστή Lagrange που επιλύει τα μειονεκτήματα του DW test. Έστω το μοντέλο: Yt=β1+β2X2t+β3X3t+β4X4t+…+βkXkt+ut όπου: ut=ρ1ut-1+ ρ2ut-2+ρ3ut-3 +…+ ρput-p +et
Το Breusch-Godfrey Test Συνδυάζοντας τα παραπάνω έχουμε ότι: Yt=β1+β2X2t+β3X3t+β4X4t+…+βkXkt+ +ρ1ut-1+ ρ2ut-2+ρ3ut-3 +…+ ρput-p +et Η μηδενική και η εναλλακτική υπόθεση είναι: H0: ρ1= ρ2=…= ρp=0 καμία αυτοσυσχέτιση Ha: τουλάχιστον ένα από τα ρ δεν είναι μηδέν, δηλαδή υπάρχει αυτοσυσχέτιση
Το Breusch-Godfrey Test Βήμα 1: Εκτιμούμε το μοντέλο και παίρνουμε τα κατάλοιπα Βήμα 2: «Τρέχουμε» το πλήρες μοντέλο LM με το πλήθος των υστερήσεων που χρησιμοποιούνται να καθορίζεται από την υποτιθέμενη τάξη της αυτοσυσχέτισης. Βήμα 3: Υπολογίζουμε το LM στατιστικό= (n-ρ)R2 από το LM μοντέλο και το συγκρίνουμε με την κριτική του τιμή του Χ-τετράγωνο. Βήμα 4: Συμπεράσματα
The Durbin’s h Test Το Durbin’s h Test Όταν υπάρχουν εξαρτημένες μεταβλητές με χρονική υστέρηση (δηλαδή Yt-1) τότε το DW test δεν είναι εφαρμόσιμο. Ο Durbin ανέπτυξε έναν εναλλακτικό στατιστικό έλεγχο, που ονομάζεται το h-στατιστικό, και υπολογίζεται ως εξής: Όπου 𝜎 𝛾 2 είναι η διακύμανση του εκτιμημένου συντελεστή της εξαρτημένης μεταβλητής με χρονική υστέρηση. Αυτό το στατιστικό ακολουθεί την κανονική κατανομή.
Το Durbin’s h Test Εξαρτημένη μεταβλητή: LOG(CONS) Συμπεριλαμβανόμενες παρατηρήσεις: 37 μετά από προσαρμογές Variable Coefficient Std. Error t-Statistic Prob. C 0.834242 0.626564 1.331456 0.1922 LOG(INC) 0.227634 0.188911 1.204981 0.2368 LOG(CPI) -0.259918 0.110072 -2.361344 0.0243 LOG(CONS(-1)) 0.854041 0.089494 9.542982 0.0000 R-squared 0.940878 Mean dependent var 4.582683 Adjusted R-squared 0.935503 S.D. dependent var 0.110256 S.E. of regression 0.028001 Akaike info criterion -4.211360 Sum squared resid 0.025874 Schwarz criterion -4.037207 Log likelihood 81.91016 F-statistic 175.0558 Durbin-Watson stat 1.658128 Prob(F-statistic) 0.000000
To Durbin’s h Test
Επίλυση αυτοσυσχέτισης Έχουμε δύο διαφορετικές περιπτώσεις: Όταν το ρ είναι γνωστό Όταν το ρ είναι άγνωστο
Επίλυση αυτοσυσχέτισης Έστω το μοντέλο Yt=β1+β2X2t+β3X3t+β4X4t+…+βkXkt+ut όπου ut=ρ1ut-1+et
Επίλυση αυτοσυσχέτισης (όταν ρ είναι γνωστό) Γράφουμε το μοντέλο την t-1: Yt-1=β1+β2X2t-1+β3X3t-1+β4X4t-1+…+βkXkt-1+ut-1 Πολλαπλασιάζουμε και τα δύο μέλη με ρ και έχουμε: ρYt-1= ρβ1+ ρβ2X2t-1+ ρβ3X3t-1+ ρβ4X4t-1 +…+ ρ βkXkt-1+ ρut-1
Επίλυση αυτοσυσχέτισης (όταν ρ είναι γνωστό) Αφαιρούμε τις δύο εξισώσεις: Yt-ρYt-1= (1-ρ)β1+ β2(X2t-ρX2t-1)+ β3(X3t-ρX3t-1)+ +…+ βk(Xkt-ρXkt-1)+(ut-ρut-1) ή Y*t= β*1+ β*2X*2t+ β*3X*3t+…+ β*kX*kt+et Όπου τώρα το πρόβλημα της αυτοσυσχέτισης έχει λυθεί γιατί το et δεν είναι πια αυτοσυσχετιζόμενο.
Επίλυση αυτοσυσχέτισης (όταν ρ είναι γνωστό) Σημειώστε ότι από τη μετατροπή, χάσαμε μία παρατήρηση και για να αποφύγουμε την απώλεια δημιουργούμε τα Y1 και Xi1 όπως παρακάτω: Y*1=Y1 sqrt(1- ρ2) X*i1=Xi1 sqrt(1-ρ2) Αυτή η μετατροπή είναι γνωστή ως οιονεί-διαφοροποίηση ή γενικευμένη διαφοροποίηση.
Επίλυση αυτοσυσχέτισης (όταν το ρ είναι άγνωστο)) Η επαναληπτική διαδικασία Cochrane-Orcutt. Βήμα 1: Εκτιμούμε την παλινδρόμηση και παίρνουμε τα κατάλοιπα Βήμα 2: Εκτιμούμε το ρ παλινδρομώντας τα κατάλοιπα στους όρους με χρονική υστέρηση. Βήμα 3: Μετατρέπουμε τις γνήσιες μεταβλητές σε μεταβλητές με αστερίσκο χρησιμοποιώντας τα αποτελέσματα του βήματος 2. Βήμα 4: «Τρέχουμε» την παλινδρόμηση ξανά με τις μετασχηματισμένες μεταβλητές και παίρνουμε τα κατάλοιπα. Βήμα 5 και έπειτα: Συνεχίζουμε επαναλαμβάνοντας τα βήματα 2 έως 4 για διάφορους γύρους μέχρι (κανόνας διακοπής) οι εκτιμήσεις από δύο διαδοχικές διαδικασίες να διαφέρουν όχι περισσότερο από μια προεπιλεγμένη μικρή τιμή, όπως το 0.001.