ΧΡΟΝΟΣΕΙΡΕΣ
ΟΡΙΣΜΟΣ Με τον όρο χρονοσειρά καλείται συνήθως μια ακολουθία {xt}, t=0,1,2,…,n. Όπου για κάθε χρονική στιγμή t το xt εκφράζει την κατάσταση ενός συστήματος που εξελίσσεται στο χρόνο κατά τυχαίο τρόπο (στοχαστικό σύστημα) (stochastic system). Οι τιμές του εξεταζόμενου μεγέθους αλλάζουν με κάποια τυχαιότητα (μικρή ή μεγάλη), γνωστή στην στατιστική ανάλυση ως στοχαστικότητα (Stochasticity). Γι’ αυτό τον λόγο το εξεταζόμενο μέγεθος λαμβάνεται ως τ.μ.
Σε αντίθεση με αυτήν ενός προσδιοριστικού συστήματος (deterministic system), που περιγράφεται από ένα σύστημα διαφορικών εξισώσεων. Δηλαδή, παρά την ύπαρξη της στοχαστικότητας στην υπό εξέταση διαδικασία, η εξέλιξη της θεωρείται καθορισμένη και ο μηχανισμός που παράγει τη χρονοσειρά δίνεται κυρίως από ένα δυναμικό σύστημα (dynamical system), δηλαδή ο μηχανισμός περιγράφεται αιτιοκρατικά (deterministic) με διαφορικές εξισώσεις ή εξισώσεις διαφορών για συνεχή ή διακριτό χρόνο αντίστοιχα. Σε αυτήν την περίπτωση το εξεταζόμενο μέγεθος δεν θεωρείται τ.μ. αλλά μεταβλητή του άγνωστου συστήματος.
Στην εξέταση πραγματικών διαδικασιών που υπάρχει πάντα τυχαιότητα, στην εξέλιξη μιας διαδικασίας που παρατηρείται θόρυβος (system noise), καθώς και στη μέτρηση του μεγέθους, η στοχαστικότητα δεν μπορεί να αγνοηθεί. Οπότε για την εξέταση των μεγεθών μιας τέτοιας διαδικασίας απαιτούνται προσεγγίσεις βασισμένες στη θεωρία των στοχαστικών διαδικασιών (stochastic process).
Εδώ θα ακολουθηθεί η στοχαστική προσέγγιση Εδώ θα ακολουθηθεί η στοχαστική προσέγγιση. Δηλαδή, η χρονοσειρά θα θεωρηθεί ως μια στοχαστική διαδικασία. Οι χρονοσειρές δύναται να αφορούν: Διακριτά μεγέθη σε διακριτό χρόνο Διακριτά μεγέθη σε συνεχή χρόνο Συνεχή μεγέθη σε διακριτό χρόνο Συνεχή μεγέθη σε συνεχή χρόνο Εμείς θα μελετήσουμε χρονοσειρές σε διακριτό χρόνο.
Ανάλυση Χρονοσειρών Στόχος της Ανάλυσης Χρονοσειρών είναι: με τη βοήθεια των κατάλληλων μεθόδων να διερευνηθεί ο μηχανισμός της χρονοσειράς, να εκτιμηθούν τα χαρακτηριστικά του ώστε να προσδιοριστεί ένα κατάλληλο μοντέλο που να περιγράφει ικανοποιητικά τα δεδομένα και να χρησιμοποιηθεί για πρόβλεψη.
Τα μοντέλα χρονοσειρών υποθέτουν ότι υπάρχουν συσχετίσεις στη χρονοσειρά, που προσπαθούν να τις περιγράψουν μαθηματικά. Η διερεύνηση, η περιγραφή των συσχετίσεων και γενικά των σχετικών χαρακτηριστικών της χρονοσειράς αποτελούν βασικό βήμα στην ανάλυση των χρονοσειρών.
Βασικά Χαρακτηριστικά Μιας Χρονοσειράς Στασιμότητα Στην ανάλυση των χρονοσειρών η στασιμότητα αποτελεί μια βασική προϋπόθεση. Με τον όρο στασιμότητα πρακτικά εννοούμε κάθε σταθερή διαδικασία που έχει ως χαρακτηριστικό ότι ο μέσος, η διασπορά και η αυτοσυσχέτιση δεν αλλάζουν κατά τη διάρκεια του χρόνου.
Οπότε ένα βασικό πρόβλημα που πρέπει να αντιμετωπιστεί είναι η ύπαρξη μη στασιμότητας. Η τάση μιας χρονοσειράς εμφανίζεται με τη μορφή αλλαγών στο μέσο ή στην διασπορά. Ο μέσος ενδέχεται να αυξάνεται ή να μειώνεται ακολουθώντας κάποιο γραμμικό ή μη-γραμμικό πρότυπο. Η τάση διακρίνεται σε: Καθοριστική (Deterministic trend) Στοχαστική (Stochastic Trend)
Η μεν πρώτη μπορεί να περιγραφεί από μια συνάρτηση του χρόνου, που είναι γνωστή ή μπορεί να εκτιμηθεί. (έχουμε αναφερθεί αναλυτικά σε προηγούμενο μάθημα). Η μεν δεύτερη δύναται να περιγραφεί από μια γνωστή παραμετρική συνάρτηση του χρόνου, δηλαδή παρουσιάζει αργές μεταβολές κατά τη διάρκεια του χρόνου αλλά όχι με καθοριστικό τρόπο. Σε αυτήν την περίπτωση μπορεί να μην είναι στάσιμη ως προς τη μέση τιμή, ως προς τη διασπορά ή και ως προς τα δύο.
Η στασιμότητα μπορεί να επιτευχθεί με τη βοήθεια κάποιων μετασχηματισμών. Ως προς τη μέση τιμή Παίρνοντας διαφορές Xt=Yt-Yt-1 Ως προς τη διασπορά Λογαριθμίζοντας ή παίρνοντας τη τετραγωνική ρίζα
Στοχαστική Διαδικασία Στοχαστική διαδικασία είναι ένα φαινόμενο που εξελίσσεται μέσα στο χρόνο σύμφωνα με τους νόμους των πιθανοτήτων. Η ακολουθία των τ.μ. Xt ή Υt για κάθε χρονική στιγμή ορίζει τη στοχαστική διαδικασία {Xt}∞t=-∞ ή {Υt}∞t=-∞. Ως χρονοσειρά θα λαμβάνεται η άγνωστη ακολουθία των τ.μ. και όχι οι παρατηρήσεις.
Αυστηρώς Στάσιμη (Strict stationary) Μια χρονοσειρά χαρακτηρίζεται αυστηρώς στάσιμη, αν η από κοινού κατανομή πιθανότητας των είναι ίδια με την από κοινού κατανομή πιθανότητας των Δηλαδή, «μετατοπίζοντας» τη χρονοσειρά κατά r δεν επηρεάζεται η από κοινού κατανομή πιθανότητας, που εξαρτάται από τα διαστήματα μεταξύ των t1, t2, …., tn. Η παραπάνω διαπίστωση ισχύει για κάθε n.
Ασθενώς Στάσιμη (Weak Stationary) Μια χρονοσειρά καλείται ασθενώς στάσιμη όταν οι ροπές πρώτης και δεύτερης τάξης είναι σταθερές στο χρόνο. Με άλλα λόγια, μια χρονοσειρά καλείται ασθενώς στάσιμη ή στάσιμη δεύτερης τάξης αν ο μέσος και η διασπορά της δεν μεταβάλλονται διαχρονικά και η συνδιακύμανση των τιμών της σε δυο χρονικές υστερήσεις εξαρτάται μόνο από τις χρονικές υστερήσεις και όχι από το χρονικό σημείο για το οποίο υπολογίζεται.
Συνάρτηση Αυτοσυσχέτισης (Autocorrelation Function)(ACF) Για τη μελέτη συσχετίσεων σε στάσιμες χρονοσειρές χρησιμοποιείται η αυτοσυσχέτιση, που είναι η κανονικοποίηση της συνδιακύμανσης με τη διασπορά.
Το διάγραμμα των αυτοσυσχετίσεων λέγεται ACF. To ACF είναι βασικό εργαλείο για την αναγνώριση του μοντέλου. Επειδή ισχύει ρ(k)=ρ(-k), η γραφική παράσταση της συνάρτησης αυτοσυσχέτισης είναι συμμετρική ως προς την αρχή των αξόνων και έτσι παίρνουμε μόνο το θετικό μισό της συνάρτησης. Η γραφική παράσταση (k,ρ(k)) καλέιται διάγραμμα αυτοσυσχέτισης (correlogram).
Ένα δείγμα αυτοσυσχετίσεων που τείνει στο μηδέν, για k>0 είναι μια διαδικασία που καλείται λευκός θόρυβος (white noise). Στο μοντέλο του «Λευκού θορύβου» (που θα αναπτυχθεί παρακάτω), υποθέτουμε ότι οι τυχαίες μεταβλητές Χt είναι ανεξάρτητες και κατανέμονται κανονικά με μέσο μ και διασπορά σ2, δηλαδή ο λευκός θόρυβος έχει τις ακόλουθες ιδιότητες:
Πρακτικά για να είναι στάσιμη μια χρονοσειρά θα πρέπει το διάγραμμα των αυτοσυσχετίσεων να φθίνει αμέσως μετά τις πρώτες k υστερήσεις (lags), ενώ σε μια χρονοσειρά με έντονη τάση το διάγραμμα των αυτοσυσχετίσεων θα φθίνει με αργό ρυθμό καθώς θα αυξάνεται η τιμή του k. Στην περίπτωση ύπαρξης ισχυρής εποχικής συνιστώσας έχουμε ισχυρές αυτοσυσχετίσεις σε συγκεκριμένες υστερήσεις, ανάλογα φυσικά με τη φύση των δεδομένων (μηνιαία, τριμηνιαία, εξαμηνιαία…).
Ο συντελεστής μερικής αυτοσυσχέτισης (PACF) μετράει το βαθμό συσχέτισης μεταξύ των Χt και Χt-k, όταν η επίδραση των άλλων χρονικών υστερήσεων παραμένει σταθερή.
Εκτίμηση αυτοσυσχέτισης
Έστω η χρονοσειρά {Χt}t=-∞∞ Έστω η χρονοσειρά {Χt}t=-∞∞. Μπορεί να δειχθεί ότι η εκτίμηση της μέσης τιμής της χρονοσειράς από τις παρατηρήσεις {x1,…, xn} με την γνωστή εκτίμηση είναι αμερόληπτη. Δηλ., η υπόθεση της ανεξαρτησίας των παρατηρήσεων στο δείγμα δεν είναι απαραίτητη για την αμερόληπτη εκτίμηση της μέσης τιμής ( η χρονοσειρά μπορεί να έχει συσχετίσεις).
Με την παραπάνω προσέγγιση για τη διασπορά της δειγματικής αυτοσυσχέτισης δύναται να σχεδιαστούν όρια σημαντικότητας για την αυτοσυσχέτιση. Στον λευκό θόρυβο έχουμε: ρk=0, για κάθε υστέρηση διαφορετική από τη μηδενική. Για μεγάλο n και σύμφωνα με τη παραπάνω προσέγγιση έχουμε rk~N(0, 1/n).
Θεωρούμε τον έλεγχο: Ηο:ρk=0 vs Ηο:ρk≠0
Στην πράξη η αυτοσυσχέτιση θεωρείται στατιστικά σημαντική αν η δειγματική αυτοσυσχέτιση είναι εκτός των ορίων
Παράδειγμα Έστω για μια χρονοσειρά 100 παρατηρήσεων οι 10 πρώτες δειγματικές αυτοσυσχετίσεις: -0.38 -0.28 0.11 -008 0.02 0.00 0.01 0.07 -0.08 0.05 Λύση: Υπολογίζοντας το παρατηρούμε ότι οι δυο πρώτες είναι εκτός άρα η χρονοσειρά δεν είναι λευκός θόρυβος.
Τεστ ανεξαρτησίας Αντί να πραγματοποιείται στατιστικός έλεγχος για την κάθε υστέρηση είναι προτιμότερο να ελέγχεται ταυτόχρονα ένα εύρος υστερήσεων. Ο έλεγχος αυτός είναι γνωστός ως Portmanteau test.
Διαφορές
Αυτοπαλινδρούμενα μοντέλα τάξεως p (Autoregressive models of order p) AR(p)
Γενικά προσαρμόζεται ένα AR(p) μοντέλο όταν οι συντελεστές αυτοσυσχέτισης φθίνουν εκθετικά στο μηδέν και φυσικά υπάρχουν p στατιστικά σημαντικοί συντελεστές μερικής αυτοσυσχέτισης. Το μοντέλο αυτό παρέχει μια μέθοδο πρόβλεψης και εφαρμόζεται σε σχεδόν όλων των ειδών τα δεδομένα. Απλά πρέπει να προσαρμοστεί η τάξη του μοντέλου.
Μοντέλα Κινητού Μέσου (Moving Average Models) MA(q)
Γενικά ένα ΜΑ(q) μοντέλο προσαρμόζεται όταν οι συντελεστές μερικής αυτοσυσχέτισης φθίνουν εκθετικά στο μηδέν και ταυτόχρονα υπάρχουν q στατιστικά σημαντικοί συντελεστές αυτοσυσχέτισης.
Αυτοπαλινδρούμενα μοντέλου Κινητού Μέσου (Autoregressive Moving Average Models) ARMA(p,q)
Ολοκληρωμένα Αυτοπαλινδρούμενα Μοντέλα Κινητού Μέσου Autoregressive Integrated Moving Average Models ARIMA(p,d,q)
Εποχικά Μοντέλα
Προσέγγιση Box-Jenkins Ταυτοποίηση Μοντέλου Εκτίμηση Μοντέλου Διαγνωστικός έλεγχος Πρόβλεψη Χρονοσειράς
1. Η ταυτοποίηση του μοντέλου πραγματοποιείται με την εξέταση της γραφικής παράστασης της αρχικής χρονοσειράς και με την εξέταση των αυτοσυσχετίσεων και μερικών αυτοσυσχετίσεων της χρονοσειράς. Εάν η χρονοσειρά δεν είναι στάσιμη χρησιμοποιείται διαφόριση μέχρι να επιτευχτεί η στασιμότητα. 2. Η εκτίμηση του μοντέλου περιλαμβάνει την εκτίμηση των παραμέτρων που ορίζουν το μοντέλο που έχει προσδιοριστεί στο πρώτο βήμα. 3. Εξετάζουμε εάν τα υπόλοιπα του εκτιμηθέν μοντέλου είναι λευκός θόρυβος 4. Αφού έχει προσδιοριστεί το καλύτερο μοντέλο τότε το μοντέλο αυτό χρησιμοποιείται για πρόβλεψη μελλοντικών τιμών.