Καθ. Λευτέρης Θαλασσινός Ανάλυση Χρονοσειρών Καθ. Λευτέρης Θαλασσινός
Εισαγωγή (I) Θα εξετάσουμε τεχνικές που χρησιμοποιούνται για την αναγνώριση προτύπων σε χρονολογικές σειρές δεδομένων (όπως η εξομάλυνση, τεχνικές προσαρμογής καμπυλών, αυτοσυσχετίσεις κ.λπ.). Θα εισάγουμε μια γενική κατηγορία μοντέλων που μπορούν να χρησιμοποιηθούν σε δεδομένα χρονοσειρών για τη δημιουργία προβλέψεων (αυτοπαλίνδρομα σχήματα, σχήματα κινητού μέσου, μικτά σχήματα με ή χωρίς εποχικότητα. Όπως AR(p), MA(q), ARMA(p,q), ARI(p,d), IMA(d.q), ARIMA(p,d,q) και άλλα.). Τέλος, θα εξετάσουμε μερικές απλές, αλλά συχνά χρησιμοποιούμενες τεχνικές πρόβλεψης που βασίζονται στη γραμμική παλινδρόμηση.
Εισαγωγή (II) Υπάρχουν δύο κύριοι στόχοι στην ανάλυση χρονοσειρών: (α) Ο προσδιορισμός της φύσης του φαινομένου όπως παρουσιάζεται από τη σειρά των παρατηρήσεων (β) Η πρόβλεψη των μελλοντικών τιμών της μεταβλητής με βάση την προηγούμενη συμπεριφορά της. Και οι δύο στόχοι απαιτούν τα στοιχεία των χρονολογικών σειρών να είναι όσο περισσότερο ακριβή γίνεται. Έτσι μπορούμε να ερμηνεύσουμε και να ενσωματώσουμε και άλλα δεδομένα (π.χ., τη χρήση τους στη θεωρία που προσπαθούμε να ενσωματώσουμε για την διερεύνηση ενός φαινομένου, όπως για παράδειγμα, τις εποχιακές τιμές των βασικών εμπορευμάτων). Ανεξάρτητα από το βάθος της κατανόησής μας και το κύρος της ερμηνείας του φαινομένου, μπορούμε να προεκτείνουμε τα συμπεράσματά μας για την πρόβλεψη μελλοντικών γεγονότων.
Η αναγνώριση του είδους των χρονοσειρών Η αναγνώριση του είδους των χρονοσειρών Συστηματική (Pattern) και τυχαίος θόρυβος Όπως και στις περισσότερες άλλες αναλύσεις έτσι και στην ανάλυση χρονοσειρών γίνεται δεκτό ότι τα δεδομένα αποτελούνται από ένα συστηματικό σχήμα (συνήθως ένα σύνολο από αναγνωρίσιμα στοιχεία) και ένα τυχαίο θόρυβο (λάθος), το οποίο συνήθως κάνει το πρότυπο δύσκολο να εντοπιστεί. Οι περισσότερες τεχνικές ανάλυσης χρονοσειρών περιλαμβάνουν κάποια μορφή φιλτραρίσματος του θορύβου, ώστε ο θόρυβος να γίνει white noise (λευκός θόρυβος) ώστε το σχήμα να γίνει πιο εμφανές.
Δύο Γενικές Όψεις Χρονοσειρών Δύο Γενικές Όψεις Χρονοσειρών Οι περισσότερες χρονοσειρές μπορούν να περιγραφούν από δύο βασικές κατηγορίες στοιχείων. Την τάση και την εποχικότητα. Η τάση αντιπροσωπεύει μια γενική συστηματική γραμμική ή πιο συχνά μη γραμμικών στοιχείων διαδικασία που αλλάζει με την πάροδο του χρόνου και δεν επαναλαμβάνεται ή τουλάχιστον δεν επαναλαμβάνεται μέσα στα όρια του χρόνου που καλύπτουν τα στοιχεία μας. Η εποχικότητα μπορεί να έχει τυπικά παρόμοιας φύσης όμως, επαναλαμβάνεται σε συστηματικά διαστήματα με την πάροδο του χρόνου. Αυτές οι δύο γενικές κατηγορίες στοιχείων μπορούν να συνυπάρχουν στην εξέλιξη των χρονοσειρών. Για παράδειγμα, οι πωλήσεις μιας εταιρίας μπορεί να αυξάνονται ραγδαία με το πέρασμα των ετών, αλλά εξακολουθούν να ακολουθούν και εποχικές τάσεις (π.χ., το 25% των ετήσιων πωλήσεων κάθε χρόνο τον Δεκέμβριο, ενώ μόνο το 4% τον Αύγουστο).
Trend Analysis Εξομάλυνση (Ι) Εξομάλυνση περιλαμβάνει πάντα κάποια μορφής μέσο όρο έτσι ώστε τα μη συστηματικά στοιχεία (nonsystematic ) των επιμέρους παρατηρήσεων να αλληλοαναιρούνται. Η πιο συνηθισμένη τεχνική είναι ένας κινούμενος μέσος όρος που αντικαθιστά κάθε στοιχείο της σειράς είτε από τον απλό ή σταθμισμένο μέσο όρο των n στοιχείων που τον περιβάλλουν, όπου n είναι το πλάτος της εξομάλυνσης . Διάμεσοι μπορεί να χρησιμοποιηθούν αντί των μέσων. Το κύριο πλεονέκτημα της διαμέσου σε σύγκριση με τον κινούμενο μέσο όρο είναι ότι τα αποτελέσματα είναι λιγότερο προκατειλημμένα από τις ακραίες τιμές. Έτσι, εάν υπάρχουν ακραίες τιμές στα δεδομένα (π.χ., λόγω σφαλμάτων μέτρησης), η διάμεση εξομάλυνση παράγει συνήθως ομαλότερη ή τουλάχιστον πιο «αξιόπιστη» καμπύλη από τον κινητό μέσο όρο με βάση το ίδιο πλάτος εξομάλυνσης. Το κύριο μειονέκτημα της διάμεσης εξομάλυνσης είναι ότι: (α) ελλείψει σαφών ακραίων τιμών μπορεί να παράγει πιο "ακανόνιστες" καμπύλες από τον κινούμενο μέσο όρο και (β) δεν αφήνει περιθώρια για στάθμιση των δεδομένων.
Ανάλυση Εποχικότητας Εποχιακή εξάρτηση (εποχικότητα) είναι ένα άλλο γενικό στοιχείο ενός υποδείγματος χρονοσειράς. Ορίζεται ως correlational εξάρτηση βαθμού k μεταξύ κάθε i 'th στοιχείου της σειράς με το ik 'th στοιχείο της και μετριέται από τον συντελεστή αυτοσυσχέτισης (δηλαδή το βαθμό συσχέτισης μεταξύ των δύο στοιχείων). K είναι συνήθως ο βαθμός υστέρησης μεταξύ των δύο στοιχείων. Εάν το σφάλμα μέτρησης δεν είναι πολύ μεγάλο, η εποχικότητα μπορεί να είναι εμφανής στη σειρά ως ένα φαινόμενο που επαναλαμβάνεται κάθε K στοιχεία.
Trend Analysis Εξομάλυνση (ΙΙ) Σε σχετικά λιγότερο συχνές περιπτώσεις , όταν το σφάλμα μέτρησης είναι πολύ μεγάλο, τότε μπορούν να χρησιμοποιηθούν τόσο η μέθοδος εξομάλυνσης μέσω των σταθμισμένων ελαχίστων τετραγώνων ή η αρνητικά εκθετικά σταθμισμένη τεχνική εξομάλυνσης. Οι μέθοδοι, φιλτράρουν το θόρυβο και μετατρέπουν τα δεδομένα σε μια ομαλή καμπύλη που δεν επηρεάζεται από τις ακραίες τιμές. Προσαρμογή συνάρτησης. Πολλές μονότονες χρονοσειρές μπορούν να προσεγγισθούν ικανοποιητικά με γραμμική συνάρτηση. Εφόσον υπάρχει σαφής μονότονη μη γραμμική συνιστώσα, τα δεδομένα πρέπει πρώτα να μετατραπούν ώστε να εξαλειφθεί η μη γραμμικότητα. Συνήθως μια λογαριθμική, εκθετική, ή (λιγότερο συχνά) πολυωνυμική συνάρτηση μπορεί να χρησιμοποιηθεί.
Αυτοσυσχέτιση correlogram Οι Εποχιακές τάσεις των χρονοσειρών μπορούν να εξεταστούν μέσω correlograms. Το correlogram (autocorrelogram) εμφανίζει γραφικά και αριθμητικά τη συνάρτηση αυτοσυσχέτισης (ACF), που είναι το σύνολο των συντελεστών συσχέτισης (μαζί με τις τυπικές αποκλίσεις των συντελεστών) για διαδοχικές υστερήσεις σε ένα συγκεκριμένο φάσμα υστερήσεων (π.χ., από 1 έως 30).
Εξετάζοντας correlograms. Π.χ. εάν το πρώτο στοιχείο είναι στενά συνδεδεμένο με το δεύτερο, και το δεύτερο με το τρίτο, τότε το πρώτο στοιχείο είναι επίσης σχετικά συνδεδεμένο με το τρίτο, κ.λπ. Αυτό σημαίνει ότι το πρότυπο της σειράς εξαρτήσεων μπορεί να αλλάξει σημαντικά μετά την απομάκρυνση του πρώτου βαθμού αυτοσυσχέτισης δηλαδή, με την χρονική υστέρηση της σειράς κατά 1. Έτσι αντί του πρώτου στοιχείου t της σειράς θεωρούμε το στοιχείο t-1. (υστέρηση μιας περιόδου).
Μερική Αυτοσυσχέτιση Ένας άλλος τρόπος για την εξέταση των αυξανόμενων εξαρτήσεων είναι μέσα από τη συνάρτηση μερικής αυτοσυσχέτισης (PACF) - επέκταση της αυτοσυσχέτισης- όπου παρουσιάζεται η εξάρτηση από τα ενδιάμεσα στοιχεία όσο απομακρύνεται η υστέρηση. Με άλλα λόγια, η μερική αυτοσυσχέτιση είναι παρόμοια με την αυτοσυσχέτιση, εκτός από το ότι κατά τη διάρκεια του υπολογισμού της οι (auto) συσχετίσεις με όλα τα στοιχεία κατά την υστέρηση απομακρύνονται. Κατά μία έννοια, η συνάρτηση μερικής αυτοσυσχέτισης παρέχει μια "καθαρή" εικόνα της σειράς των εξαρτήσεων για τα μεμονωμένα στοιχεία των υστερήσεων (που δεν συγχέονται με άλλες σειριακές εξαρτήσεις).
Models (I) Αυτοπαλίνδρομα Σχήματα: Αυτοπαλίνδρομα Σχήματα: Πολλές χρονολογικές σειρές αποτελούνται από στοιχεία που προκύπτουν σειριακά και εξαρτώνται με την έννοια ότι μπορούν να υπολογισθούν από ένα συντελεστή ή ένα σύνολο συντελεστών που περιγράφουν διαδοχικά τα στοιχεία της σειράς σε συγκεκριμένες χρονικά υστερήσεις. Αυτό μπορεί να συνοψιστεί με την εξίσωση:
Models (II) where the term εt is the source of randomness and is called white noise. It is assumed to have the following characteristics: 1. 2. 3. With these assumptions, the process is specified up to second-order moments and, subject to conditions on the coefficients, may be second-order stationary.
Models (III) Στασιμότητα : Σημειώστε ότι ένα αυτοπαλινδρομικό σχήμα θα είναι στάσιμο εάν οι παράμετροι είναι εντός συγκεκριμένων ορίων. Για παράδειγμα, αν υπάρχει ένας μόνο αυτοπαλινδρομικός συντελεστής θα πρέπει μα εμπίπτει στο διάστημα από -1 έως 1. Διαφορετικά, το παρελθόν θα συσσωρεύεται και η τιμή της μεταβλητής θα κινηθεί προς το άπειρο, δηλαδή, η σειρά δεν θα είναι στάσιμη. Εάν υπάρχουν περισσότεροι από ένας αυτοπαλινδρομικός συντελεστής θα πρέπει όλοι να ακολουθούν τον παραπάνω περιορισμό.
Models (IV) Απλά Σχήματα Κινητού Μέσου: Ανεξάρτητα από τα αυτοπαλίνδρομα σχήματα, κάθε στοιχείο της σειράς μπορεί επίσης να επηρεαστεί από το προηγούμενο σφάλμα (ή τυχαίο σοκ) που δεν μπορεί να εξηγηθεί από την αυτοπαλίνδρομη συνιστώσα, δηλαδή:
Models (V) x t = μ + εt - θ1 *ε (t-1) - θ2*ε (t-2) - θ3 *ε(t-3) - ... θΚ *ε(Τ-Κ) – θΚ+1 *ε (Τ-Κ+1)-…...θΜ *ε (Τ-Μ) Όπου: μ είναι μια σταθερά, και θ1 ,θ2 ,θ3 ,…., θΚ ,…, θΜ είναι οι συντελεστές των κινητών μέσων του μοντέλου.