Applied Econometrics Second edition Dimitrios Asteriou and Stephen G. Hall
Πολυσυγγραμμικότητα 1. Τέλεια πολυσυγγραμμικότητα 2. Συνέπειες τέλειας πολυσυγγραμμικότητας 3. Ατελής πολυσυγγραμμικότητα. 4. Συνέπειες ατελούς πολυσυγγραμμικότητας 5. Διάγνωση πολυσυγγραμμικότητας 6. Επίλυση/αντιμετώπιση πολυσυγγραμμικότητας
Στόχοι μαθήματος 1. Αναγνώριση του προβλήματος της πολυσυγγραμμικότητας στο CLRM. 2. Διάκριση μεταξύ τέλειας και ατελούς πολυσυγγραμμικότητας. 3. Κατανόηση και εκτίμηση των συνεπειών της τέλειας και ατελούς πολυσυγγραμικότητας στις εκτιμήσεις OLS. 4. Διάγνωση προβληματικής πολυσυγγραμμικότητας με τη χρήση οικονομετρικού λογισμικού. 5. Εύρεση τρόπων επίλυσης της προβληματικής πολυσυγγραμμικότητας.
Πολυσυγγραμμικότητα Η υπόθεση νο.8 του CLRM απαιτεί ότι δεν υπάρχουν ακριβείς γραμμικές σχέσεις μεταξύ των τιμών των ερμηνευτικών μεταβλητών στο δείγμα (τα X). Άρα, όταν οι ερμηνευτικές μεταβλητές είναι υψηλά συσχετιζόμενες η μία με την άλλη (συντελεστής συσχέτισης πολύ κοντα στο 1 ή στο -1) τότε υπάρχει το πρόβλημα της πολυσυγγραμμικότητας.
Τέλεια πολυσυγγραμμικότητα Όταν υπάρχει τέλεια γραμμική σχέση. Υποθέστε ότι έχουμε το ακόλουθο μοντέλο: Y=β1+β2X2+ β3X3+e Όπου οι τιμές του δείγματος για τα X2 και X3 είναι: X2 1 2 3 4 5 6 X3 8 10 12
Τέλεια πολυσυγγραμμικότητα Παρατηρούμε ότι X3=2X2 Έτσι, παρότι φαίνεται να υπάρχουν δύο ερμηνευτικές μεταβλητές, στην πραγματικότητα υπάρχει μία. Κι αυτό γιατί η X2 είναι μια ακριβής γραμμική συνάρτηση της X3 ή γιατί οι X2 και X3 είναι τέλεια συγγραμμικές.
Τέλεια πολυσυγγραμμικότητα Όταν συμβαίνει αυτό, τότε η εξίσωση: δ1X1+δ2X2=0 μπορεί να ικανοποιηθεί για μη-μηδενικές τιμές των δ1 και δ2. Στο παράδειγμά μας έχουμε ότι: (-2)X1+(1)X2=0 Άρα δ1=-2 και δ2=1.
Τέλεια πολυσυγγραμμικότητα Προφανώς, εάν η μόνη λύση είναι: δ1=δ2=0 (συνήθως ονομάζεται τετριμμένη λύση) τότε οι δύο μεταβλητές είναι γραμμικά ανεξάρτητες και δεν υπάρχει προβληματική πολυσυγγραμμικότητα.
Τέλεια πολυσυγγραμμικότητα Στην περίπτωση περισσότερων από δυο ερμηνευτικών μεταβλητών, τότε τότε η μία μεταβλητή μπορεί να εκφραστεί ως μια ακριβής γραμμική συνάρτηση μιας άλλης ή περισσότερων ή ακόμα και όλων των άλλων μεταβλητών. Τότε, εάν έχουμε 5 ερμηνευτικές μεταβλητές, έχουμε: δ1X1+δ2X2 +δ3X3+δ4X4 +δ5X5=0 Για καλύτερη κατανόηση, μια εφαρμογή είναι η παγίδα των ψευδομεταβλητών (εξήγηση στον πίνακα).
Συνέπειες της τέλειας πολυσυγγραμμικότητας Με τέλεια πολυσυγγραμμικότητα, οι εκτιμητές OLS απλώς δεν υπάρχουν. (απόδειξη στον πίνακα) Εάν προσπαθήσετε να εκτιμήσετε μια εξίσωση στο Eviews και οι προδιαγραφές τις εξίσωσης χαρακτηρίζονται από τέλεια πολυσυγγραμμικότητα, το Eviews δεν θα δώσει αποτελέσματα, αλλά θα δώσει ένα μήνυμα σφάλματος, με το οποίο επισημαίνει την πολυσυγγραμμικότητα.
Ατελής πολυσυγγραμμικότητα Η ατελής πολυσυγγραμμικότητα (ή σχεδόν πολυσυγγραμμικότητα) υπάρχει όταν οι ερμηνευτικές μεταβλητές σε μια εξίσωση συσχετίζονται, αλλά αυτή η συσχέτιση είναι λιγότερο από τέλεια. Αυτό εκφράζεται ως εξής: X3=X2+v Όπου v μια τυχαία μεταβλητή, η οποία μπορεί να παρατηρηθεί ως ένα «λάθος» στην ακριβή γραμμική σχέση.
Συνέπειες της ατελούς πολυσυγγραμμικότητας Συνέπειες της ατελούς πολυσυγγραμμικότητας Στις περιπτώσεις της ατελούς πολυσυγγραμμικότητας, οι εκτιμητές OLS μπορούν να ληφθούν και να είναι επίσης BLUE. Όμως, παρότι οι γραμμικοί αμερόληπτοι εκτιμητές με την ιδιότητα της ελάχιστης διακύμανσης να ισχύει, οι διακυμάνσεις OLS είναι συχνά μεγαλύτερες από αυτές που λαμβάνονται υπό την απουσία πολυσυγγραμμικότητας.
Συνέπειες της ατελούς πολυσυγγραμμικότητας Συνέπειες της ατελούς πολυσυγγραμμικότητας Για την εξήγηση, θεωρείστε την εξίσωση που δίνει την διακύμανση της μερικής κλίσης της μεταβλητής Xj: Όπου r2 είναι το τετράγωνο του συντελεστή συσχέτισης του δείγματος μεταξύ X2 και X3.
Συνέπειες της ατελούς πολυσυγγραμμικότητας Επεκτείνοντας σε περισσότερες από δύο ερμηνευτικές μεταβλητές, έχουμε: Και συνεπώς, ονομάζεται συντελεστής πληθωρισμού διακύμανσης (VIF)
Πληθωρισμός Διακύμανσηςr R2j VIFj 1 0.5 2 0.8 5 0.9 10 0.95 20 0.075 40 0.99 100 0.995 200 0.999 1000
Ο Συντελεστής Πληθωρισμού Διακύμανσης Οι τιμές του VIF που ξεπερνούν το 10 θεωρούνται γενικά απόδειξη της ύπαρξης προβληματικής πολυσυγγραμμικότητας. Αυτό συμβαίνει για R2j >0.9 Τόσο μεγάλα τυπικά σφάλματα θα οδηγούν σε μεγάλε διαστήματα εμπιστοσύνης. Επίσης, μπορεί να έχουμε t-στατιστικά τα οποία να είναι εντελώς λανθασμένα.
Συνέπειες της ατελούς πολυσυγγραμμικότητας Συνοψίζοντας, όταν υπάρχει ατελής πολυσυγγραμμικότητα, έχουμε: Οι εκτιμήσεις της OLS μπορεί να είναι ανακριβής εξαιτίας των μεγάλων τυπικών σφαλμάτων. Οι επηρεασμένη συντελεστές μπορεί να αποτύχουν στην επίτευξη στατιστικής σημαντικότητας λόγω των χαμηλών t-στατιστικών. Μπορεί να υπάρχει εναλλαγή προσήμου. Πρόσθεση ή αφαίρεση λίγων παρατηρήσεων μπορεί να οδηγήσει σε ουσιαστικές αλλαγές στους εκτιμημένους συντελεστές.
Διάγνωση Πολυσυγγραμμικότητας Ο ευκολότερος τρόπος μέτρησης το μέγεθος της πολυσυγγραμμικότητας είναι απλώς να δούμε των πίνακα των συσχετίσεων μεταξύ των ανεξάρτητων μεταβλητών. Στην περίπτωση των περισσότερων από δύο ερμηνευτικών μεταβλητών, θα πρέπει να «τρέξουμε» βοηθητικές παλινδρομήσεις. Εάν υπάρχει σχεδόν γραμμική εξάρτηση, η βοηθητική παλινδρόμηση θα αναπαριστά μια μικρή εξίσωση τυπικού σφάλματος, ένα μεγάλο R2 και ένα στατιστικά σημαντικό F-value.
Επίλυση Πολυσυγγραμμικότητας Προσεγγίσεις, όπως η παλινδρόμηση κορυφογραμμής ή η μέθοδος των κύριων συνιστωσών. Αλλά δημιουργούν περισσότερο προβλήματα απ’ αυτά που επιλύουν. Μερικοί οικονομέτρες αμφισβητούν ότι εάν το μοντέλο είναι όπως πρέπει, απλά την αγνοούμε. Σημειώστε ότι πάντα θα έχετε ένα βαθμό πολυσυγγραμμικότητας, ειδικά σε δεδομένα χρονολογικών σειρών.
Επίλυση Πολυσυγγραμμικότητας Ο ευκολότερος τρόπος «θεραπείας» αυτών των προβλημάτων είναι: η παράλειψη μίας από τις συγγραμικές μεταβλητές η μετατροπή των υψηλά συσχετιζόμενων μεταβλητών σε ένα λόγο η συλλογή περισσότερων δεδομένων η συλλογή μακροπρόθεσμων η μεγαλύτερη συχνότητα στα δεδομένα
Παραδείγματα Έχουμε τριμηνιαία δεδομένα για: Εισαγωγές (IMP) Ακαθάριστο Εθνικό Προϊόν (GDP) Δείκτης τιμών καταναλωτή (CPI) και Δείκτης τιμών παραγωγού (PPI)
Παραδείγματα Πίνακας συσχετίσεων IMP 1 0.979 0.916 0.883 IMP GDP CPI PPI IMP 1 0.979 0.916 0.883 GDP 0.979 1 0.910 0.899 CPI 0.916 0.910 1 0.981 PPI 0.883 0.8998 0.981 1
Παραδείγματα – μόνο CPI Μεταβλητή Συντελεστής Τυπικό σφάλμα t-Statistic Πιθανότητα C 0.631870 0.344368 1.834867 0.0761 LOG(GDP) 1.926936 0.168856 11.41172 0.0000 LOG(CPI) 0.274276 0.137400 1.996179 0.0548 R-squared 0.966057 Mean dependent var 10.81363 Adjusted R-squared 0.963867 S.D. dependent var 0.138427 S.E. of regression 0.026313 Akaike info criterion -4.353390 Sum squared resid 0.021464 Schwarz criterion -4.218711 Log likelihood 77.00763 F-statistic 441.1430 Durbin-Watson stat 0.475694 Prob(F-statistic) 0.000000
Παραδείγματα –CPI με PPI Μεταβλητή Συντελεστής Τυπικό σφάλμα t-Statistic Πιθανότητα C 0.213906 0.358425 0.596795 0.5551 LOG(GDP) 1.969713 0.156800 12.56198 0.0000 LOG(CPI) 1.025473 0.323427 3.170645 0.0035 LOG(PPI) -0.770644 0.305218 -2.524894 0.0171 R-squared 0.972006 Mean dependent var 10.81363 Adjusted R-squared 0.969206 S.D. dependent var 0.138427 S.E. of regression 0.024291 Akaike info criterion -4.487253 Sum squared resid 0.017702 Schwarz criterion -4.307682 Log likelihood 80.28331 F-statistic 347.2135 Durbin-Watson stat 0.608648 Prob(F-statistic) 0.000000
Παραδείγματα – μόνο PPI Μεταβλητή Συντελεστής Τυπικό σφάλμα t-Statistic Πιθανότητα C 0.685704 0.370644 1.850031 0.0739 LOG(GDP) 2.093849 0.172585 12.13228 0.0000 LOG(PPI) 0.119566 0.136062 0.878764 0.3863 R-squared 0.962625 Mean dependent var 10.81363 Adjusted R-squared 0.960213 S.D. dependent var 0.138427 S.E. of regression 0.027612 Akaike info criterion -4.257071 Sum squared resid 0.023634 Schwarz criterion -4.122392 Log likelihood 75.37021 F-statistic 399.2113 Durbin-Watson stat 0.448237 Prob(F-statistic) 0.000000
Παραδείγματα – Η βοηθητική παλινδρόμηση Μεταβλητή Συντελεστής Τυπικό σφάλμα t-Statistic Πιθανότητα C -0.542357 0.187073 -2.899177 0.0068 LOG(CPI) 0.974766 0.074641 13.05946 0.0000 LOG(GDP) 0.055509 0.091728 0.605140 0.5495 R-squared 0.967843 Mean dependent var 4.552744 Adjusted R-squared 0.965768 S.D. dependent var 0.077259 S.E. of regression 0.014294 Akaike info criterion -5.573818 Sum squared resid 0.006334 Schwarz criterion -5.439139 Log likelihood 97.75490 F-statistic 466.5105 Durbin-Watson stat 0.332711 Prob(F-statistic) 0.000000