Ανάλυση Παλινδρόμησης με Δεδομένα Χρονολογικών Σειρών yt = b0 + b1xt,1 + . . .+ bkxt,k + ut 10. Βασική Ανάλυση
Χρονολογικές Σειρές έναντι Διαστρωματικά Δεδομένα Οι Χρονολογικές Σειρές έχουν μία χρονική διάταξη, σε αντίθεση με τα διαστρωματικά δεδομένα Θα χρειαστεί να μεταβάλουμε κάποιες από τις υποθέσεις μας και να λάβουμε υπόψη ότι δεν έχουμε ένα τυχαίο δείγμα ατόμων Στην θέση της υπόθεσης του τυχαίου δείγματος, έχουμε μία στοχαστική (τυχαία) διαδικασία
Παραδείγματα Μοντέλων Χρονολογικών Σειρών Ένα στατικό μοντέλο έχει μεταβλητές που ταυτόχρονα συσχετίζονται: yt = b0 + b1zt + ut Ένα Πεπερασμένο Μοντέλο Κατανεμημένης Χρονικής Υστέρησης (ΠΜΚΧΥ) επιτρέπει μία ή περισσότερες μεταβλητές να επηρεάζουν την y με μια χρονική υστέρηση: yt = a0 + d0zt + d1zt-1 + d2zt-2 + ut Πιο γενικά, ένα ΠΜΚΧΥ τάξης q περιλαμβάνει q χρονικές υστερήσεις (lags) της z.
Πεπερασμένα Μοντέλα Κατανεμημένης Χρονικής Υστέρησης Συνήθως καλούμε d0 ροπή επίδρασης ή πολλαπλασιαστής επίδρασης – το οποίο αντανακλά την άμεση αλλαγή στο y. Μία προσωρινή αλλαγή μιας περιόδου, επιστρέφει το y στο αρχικό της επίπεδο στην περίοδο q+1
Πεπερασμένα Μοντέλα Κατανεμημένης Χρονικής Υστέρησης (συνεχεία) Συνήθως καλούμε την ποσότητα d0 + d1 +…+ dq μακροχρόνια ροπή ή μακροχρόνιο πολλαπλασιαστή – ο οποίος αντανακλά την μακροχρόνια αλλαγή στο y μετά από μία μόνιμη αύξηση
Υποθέσεις για Αμεροληψία Ακόμη υποθέτουμε ένα μοντέλο που είναι γραμμικό ως προς τις παραμέτρους: yt = b0 + b1xt,1 + . . .+ bkxt,k + ut Ακόμη χρειάζεται να υποθέτουμε για την υπό προϋποθέσεις προσδοκώμενη τιμή ότι είναι 0: E(ut|X) = 0, t = 1, 2, …, n (X ← όλα τα x από όλες τις χρονικές στιγμές Σημειώστε ότι αυτό υποδηλώνει ότι ο όρος του σφάλματος σε οποιαδήποτε περίοδο είναι ασυσχέτιστη με τις επεξηγηματικές μεταβλητές σε όλες τις χρονικές περιόδους
Υποθέσεις (συνέχεια) Αυτή η υπόθεση ότι η υπό προϋποθέσεις προσδοκώμενη τιμή είναι 0, υποδηλώνει ότι οι x μεταβλητές είναι αυστηρά εξωγενείς Μία εναλλακτική υπόθεση, πιο συγκρίσιμη στην περίπτωση των διαστρωματικών δεδομένων, είναι E(ut|xt) = 0 Αυτή η υπόθεση υποδηλώνει ότι οι x μεταβλητές είναι ταυτόχρονα εξωγενείς Η υπόθεση για ταυτόχρονα εξωγενείς θα είναι επαρκή μόνο για μεγάλα δείγματα
Υποθέσεις (συνέχεια) Ακόμη χρειάζεται να υποθέτουμε ότι κανένα x δεν είναι σταθερό, και ότι δεν υπάρχει τέλεια συγγραμμικότητα Σημειώστε ότι παραλείψαμε την υπόθεση του τυχαίου δείγματος Η βασική επιρροή της υπόθεσης του τυχαίου δείγματος είναι ότι κάθε ui είναι ανεξάρτητο Η αυστηρή υπόθεση των εξωγενών μεταβλητών φροντίζει για την παραπάνω περίπτωση
Αμεροληψία για OLS Βασισμένοι σε 3 υποθέσεις, όταν χρησιμοποιούμε δεδομένα από χρονολογικές σειρές, οι OLS εκτιμητές είναι αμερόληπτοι Έτσι, ήταν και στην περίπτωση των διαστρωματικών δεδομένων, κάτω από κατάλληλες υποθέσεις οι OLS είναι αμερόληπτοι. Το μεροληπτικό σφάλμα της παράλειψης μιας μεταβλητής μπορεί να αναλυθεί με τον ίδιο τρόπο όπως στην περίπτωση των διαστρωματικών δεδομένων
Διακυμάνσεις των OLS Εκτιμητών Όπως και στην περίπτωση των διαστρωματικών δεδομένων, χρειάζεται να προσθέσουμε μία υπόθεση της ομοσκεδαστικότητας για να εξάγουμε διακυμάνσεις Τώρα υποθέτουμε Var(ut|X) = Var(ut) = s2 Έτσι, η διακύμανση του σφάλματος είναι ανεξάρτητη από όλα τα x, και είναι σταθερή διαμέσου του χρόνου Επίσης χρειαζόμαστε την υπόθεση για ανυπαρξία αυτοσυσχέτιση: Corr(ut,us| X)=0 for t s
Διακυμάνσεις για OLS (συνέχεια) OLS παραμένει BLUE Με την επιπρόσθετη υπόθεση των κανονικών σφαλμάτων, η στατιστική επαγωγή ή συμπερασματολογία είναι η ίδια όπως και στα διαστρωματικά δεδομένα
Τάσεις στις Χρονολογικές Σειρές Οι οικονομικές χρονολογικές σειρές συχνά έχουν μία τάση Επειδή δύο σειρές έχουν παράλληλες τάσεις, δεν μπορούμε να υποθέσουμε ότι αυτή η σχέση προέρχεται από αιτία Συχνά, και οι δύο σειρές έχουν παράλληλες τάσεις εξαιτίας άλλων παραγόντων που δεν παρατηρούνται Ακόμα και αν αυτοί οι παράγοντες δεν παρατηρούνται, μπορούμε να ελέγξουμε για αυτούς με την άμεση άρση της τάσης
Τάσεις (συνέχεια) Ένα ενδεχόμενο είναι η γραμμική χρονική τάση, η οποία μπορεί να μοντελοποιηθεί ως yt = a0 + a1t + et, t = 1, 2, … Άλλο ενδεχόμενο είναι η εκθετική τάση, η οποία μπορεί να μοντελοποιηθεί ως log(yt) = a0 + a1t + et, t = 1, 2, … Ένα άλλο ενδεχόμενο είναι η τετραγωνική τάση, η οποία μπορεί να μοντελοποιηθεί ως yt = a0 + a1t + a2t2 + et, t = 1, 2, …
Αφαίρεση της Τάσης Προσθέτοντας μία γραμμική χρονική τάση στην παλινδρόμηση είναι το ίδιο πράγμα σαν να κάνουμε «αφαίρεση της τάσης» με σειρές στην παλινδρόμηση Άρση της τάσης σε μία σειρά περικλείει παλινδρόμηση κάθε μεταβλητής στο μοντέλο με t Τα κατάλοιπα σχηματίζουν σειρές χωρίς τάση. Βασικά, η τάση έχει μερικώς αφαιρεθεί (partial out)
Αφαίρεση της Τάσης (συνέχεια) Αφαίρεση της Τάσης (συνέχεια) Ένα πλεονέκτημα όταν άρουμε την τάση από τα δεδομένα ( σε αντίθεση με το να προσθέσουμε μία τάση) περικλείει τον υπολογισμό της ποιότητας προσαρμογής (π.χ. ) Παλινδρομήσεις με χρονολογικές σειρές, που έχουν τάση, αναμένονται να έχουν πολύ υψηλό R2, αφού η τάση εξηγεί ένα μέρος της μεταβλητότητας του y Το R2 από μία παλινδρόμηση, με δεδομένα από τα οποία έχει αφαιρεθεί η τάση, αντανακλά καλύτερα κατά πόσο καλά οι xt εξηγούν την yt
Εποχικότητα Συχνά δεδομένα με χρονολογικές σειρές παρουσιάζουν κάποια περιοδικότητα, η οποία αναφέρεται ως εποχικότητα Παράδειγμα: Τριμηνιαία δεδομένα σε λιανικές πωλήσεις θα έχουν παρόμοια τάση κάθε 4ο τρίμηνο Η εποχικότητα μπορεί να αντιμετωπισθεί κατάλληλα με την προσθήκη εποχικών ψευδομεταβλητών Όπως και με τις τάσεις, από τις σειρές μπορούμε να αφαιρέσουμε την εποχικότητα προτού να τρέξουμε την παλινδρόμηση