Ανάλυση χρονο-σειρών (Time-series analysis) H. Isliker, 2006
Περιεχόμενο Εισαγωγή: παραδείγματα ΧΣ, γενικός σκοπός και χρησιμότητα, βασικές έννοιες Απλές μέθοδοι περιγραφής χρονο-σειρών Μέθοδοι ανάλυσης χρονο-σειρών: αυτο-συσχέτιση (auto-correlation) φασματική ανάλυση (spectral analysis) Εφαρμογές και ασκήσεις με Mathematica
Βιβλιογραφία C. Chatfield, The Analysis of Time Series, An Introduction, 4th ed., Chapman & Hall, London, 1989 The Numerical Recipes (free downloadable from the net) Σημειώσεις: www.astro.auth.gr → people → H. Isliker → courses
Τί είναι οι χρονο-σείρες σήμα (signal) X(t) time t Χρονο-σειρά:= συλλογή από παρατηρήσεις που έγιναν διαδοχικά στο χρόνο Η ανάλυση χρονο-σειρών ανήκει στη στατιστική
Παραδείγματα: Οικονομία π.χ. η εξέλιξη τιμής του πετρελαίου, η αξία μιας μετοχής (εφημερίδες για την οικονομία !) Σοφοκλέους, μετοχή μιας εταιρίας Ευρώ Κύριο ενδιαφέρον: πρόβλεψη !!!
Παραδείγματα: Εμπόριο (marketing) π.χ. πωλήσεις ανά μήνα σκοπός 1: πρόβλεψη, αλλά και σχεδιασμός σκοπός 2: σύγκριση, π.χ. δαπάνες για διαφημίσεις και αυξήσεις στις πωλήσεις σύγκριση 2 χρονο-σειρών εξήγηση: Η μια ΧΣ εξηγεί την άλλη διαφημίσεις πωλήσεις ευρώ ευρώ t t
Παραδείγματα Δημογραφία: εξέλιξη πληθυσμού, ενδιαφέρον: πρόβλεψη Έλεγχος διαδικασιών παραγωγής, ποιότητα ενός προιόντος, π.χ. πάχος μιας βίδας Προδιαγραφή, επιδιωκόμενη τιμή Τιμή μεταβλητής ελέγχου t
Παραδείγματα: Ιατρική Ηλεκτρο-Εγκεφαλογράφημα (ΗΕΓ, EEG) Ηλεκτρο-Καρδιογράφημα (ΗΚΓ, ΕCG) Σκοποί: 1. κυρίως: αναγνώριση ανωμαλιών 2. κατανόηση και εξήγηση της δυναμικής της καρδιάς, του εγκεφάλου 3. πρόβλεψη διαταραχών …
Παραδείγματα: Φυσική Οπου γίνονται παρατηρήσεις ... Σεισμολογία (κατανόηση και πρόβλεψη) Μετεωρολογία (πρόβλεψη) Αστροφυσική …
Παραδείγματα: Ατμοσφαιρική φυσική ταχύτητα ανέμου (διάνυσμα !) θερμοκρασία σκοπός: πρόβλεψη (Παν/μιο Αθηνών, 2004)
Παραδείγματα: Αστροφυσική Ηλιακή έκλαμψη (solar flare) Παρατήρηση σε Ράδιο-συχνότητες (~300MHz) Σκοπός: περιγραφή για σύγκριση με θεωρητικά μοντέλα, αλλά και κατανόηση των διαδικασιών που παράγουν τις ΧΣ, καθοδήγηση στην δημιουργία μοντέλων Τα επιτυχή μοντέλα χρησιμοποιούνται μετά και για προβλέψεις
Σκοποί της ΑΧΣ Περιγραφή (description) μιας ΧΣ Εξήγηση (explanation) (μια ΧΣ μια άλλη) Πρόγνωση (prediction) Έλεγχος (control) Κατανόηση της διαδικασίας
Σκοπός 1: περιγραφή Πρώτα κάνουμε πάντα τη γραφική παράσταση μιας χρονο-σειράς Απλή περιγραφή περιοδικότητα (seasonal effects), τάση (trend), αλλαγή τάσης (με το μάτι, και αριθμητικά) Προχωρημένη περιγραφή με στοχαστικά μοντέλα (στοχαστικές διαδικασίες), π.χ. ‘η ΧΣ παριστάνει λευκό θόρυβο’
Έχουμε 2 ή περισσότερες χρονο-σειρές Μπορεί η μια να εξηγεί την άλλη? Σκοπός 2: Εξήγηση Έχουμε 2 ή περισσότερες χρονο-σειρές Μπορεί η μια να εξηγεί την άλλη? Χ(t) Y(t) = f(X(t)), X(t): input, Y(t): output, π.χ. γραμμικό σύστημα (linear system) X(t) διαφημίσεις Y(t) πωλήσεις ευρώ ευρώ X(t) Y(t) f
Σκοπός 3: Πρόγνωση Από μια ΧΣ μπορούμε να προβλέψουμε το μέλλον, και με πόση ακρίβεια ?
Σκοπός 5: Κατανόηση Η στατιστική δίνει φορμαλιστικές περιγραφές των ΧΣ καθεαυτών Στη φυσική μπορεί να έχουμε μια ΧΣ από ένα κατά τα άλλα άγνωστο σύστημα. Τί μπορούμε να καταλάβουμε από την ΧΣ για το ίδιο το σύστημα, το οποίο έχει παράγει την ΧΣ? Πχ. ‘το σύστημα είναι περιοδικό, με περίοδο ...’, ή ‘το σύστημα είναι εντελώς στοχαστικό’ ή ‘το σύστημα είναι χαοτικό, με fractal διάσταση ...’ (→ Μη-γραμμική ανάλυση χρονο-σειρών: fractal διαστάσεις, εκθέτες Lyapounov)
Βασικές Έννοιες Συνεχής (continuous) ΧΣ X(t) παρατηρείται συνεχώς (π.χ. kαταγράφηση σε ‘άπειρο’ χαρτί – βλ. σεισμολογία) διακριτή (discrete) ΧΣ (π.χ. αν είναι σε ηλεκτρονική μορφή) sampling time t, ti = i t X(t) t X(ti), i=1,2,3,… t1 t2 t ti
Στον Η/Υ βολεύουν οι διακριτές ΧΣ (πρόβλημα αποθήκευσης !) Sampling (read off, digitize): διαβάζουμε και κρατάμε από συνεχή ΧΣ τιμές μόνο σε σημεία με σταθερή χρονική απόσταση Δt (sampling time/interval) ή μετράμε εξ’αρχής μόνο σε διακριτές χρονικές στιγμές X(t) t X(ti) Αποφεύγουμε μη-σταθερό Δt, οι περισσότερες μέθοδοι γίνονται πιο δύσκολες ! t t t1 t2 t3
Σε άλλες περιπτώσεις, το X(ti) είναι άθροισμα ή ολοκλήρωμα για όλο το t π.χ. X(ti) βροχή ανά m2 ανά μέρα, άθροισμα όλων των βροχοπτώσεων για κάποιο διάστημα π.χ. X(ti) ράδιο-ακτινοβολία από τον ήλιο όπου f(t) η συνεχής ακτινοβολία, και ti-ti-1=t
Ειδικά στην στατιστική θεωρία για την ανάλυση χρονο-σειρών: συνήθως, οι διαδοχικές παρατηρήσεις δεν είναι ανεξάρτητες, άρα πρέπει να λάβουμε υπ’όψιν μας τη σειρά των παρατηρήσεων Ακριβώς αυτή η εξάρτηση επιτρέπει την πρόγνωση του μέλλοντος με βάση το παρελθόν Ορισμός: Ντετερμινιστική ΧΣ: επιτρέπει πρόγνωση με ακρίβεια Στοχαστική ΧΣ: επιτρέπει προβλέψεις μόνο εν μέρει, ‘με πιθανότητα p θα συμβεί Α, ...’
Δυο βασικές προσεγγίσεις για την ΑΧΣ Time-domain: οι μέθοδοι είναι συναρτήσεις του χρόνου, π.χ. αυτο-συσχέτιση (auto-correlation) Frequency domain: κάνουμε μετασχηματισμό Fourier και δουλεύουμε στο χώρο των συχνοτήτων, π.χ. φασματική πυκνότητα (spectral density)
Απλές περιγραφικές μέθοδοι γραφική παράσταση !!!!! μέσος όρος μ διασπορά 2 τρέχοντας μέσος όρος στασιμότητα (stationarity) ανάλυση: περιοδικότητα, τάσεις, θόρυβος φιλτράρισμα (filtering)
Παράδειγμα X(t) t Κάπως περιοδικό Έχει θόρυβο Ιδιότητες ?
Μέσος όρος μ Εστώ η ΧΣ Ορισμός του μέσου όρου δηλ. η μέση τιμή όλων των τιμών της ΧΣ, ο ορισμός είναι όπως συνήθως, και η σειρά των X(ti) δεν παίζει ρόλο ! Στο παράδειγμα: =-0.77
Τί σημαίνει =-0.77 ? Plot it ! Μέσος όρος Συμπίπτει με την εκτίμησή μας …
Διασπορά 2 Εστώ ΧΣ Ορισμός της διασποράς Μέσος όρος των αποκλίσεων από τη μέση τιμή στο τετράγωνο X(ti) X(ti)- t
Στάνταρτ απόκλιση Η διασπορά έχει μαθηματικά πλεονεκτήματα, δηλ. στην στατιστική θεωρία Πιο διαισθητική είναι η στάνταρτ απόκλιση (standard deviation) μέση απόκλιση από την μέση τιμή
+ - Στο παράδειγμα: 2 = 54.10, = 7.36, =-0.77 Μεταξύ - και + βρίσκονται τα περισσότερα σημεία της ΧΣ, Το διάστημα αυτό μας δίνει τη διακύμανση των τιμών της ΧΣ
Παράδειγμα 2 = 4.24, 2 = 59.50, = 7.71 + + X(t) + + t και § δεν δίνουν καλή περιγραφή της πραγματικής μέσης τιμής εδώ Λόγος: υπάρχει μια τάση (trend), δηλ. σαν να αλλάζει το πραγματικό στο χρόνο: = (t)
Με διαίσθηση: (t) = a + t¢b, συγκεκριμένα (t) = t¢10/512 δηλ. κατάσκευάσαμε ένα μοντέλο για την τάση (trend), αλλά κάπως αυθαίρετα. Πώς μπορούμε όμως να το κάνουμε πιο συστηματικά ?
Τρέχοντας μέσος όρος (running mean, moving average) ti-K ti+K ti Παράμετρος: K, μήκος του παραθύρου
Τρέχων μέσος όρος, Κ=40 ) Ο (τρέχοντας) μέσος όρος αλλάζει στο χρόνο
Τρέχοντας μέσος όρος, Κ=40 ) Ο (τρέχοντας) μέσος όρος αλλάζει στο χρόνο
Στασιμότητα (stationarity) διαισθητικός ορισμός: μια ΧΣ είναι στάσιμη αν δεν υπάρχει συστηματική αλλαγή του μέσου όρου και της διασποράς στο χρόνο π.χ. τάση ) μη-στασιμότητα η στασιμότητα είναι προυπόθεση για τα περισσότερα εργαλεία της ΑΧΣ (π.χ. αυτο-συσχέτιση, φασματική ανάλυση) ) χρειάζονται εργαλεία μετατροπής μη-στάσιμων σε στάσιμες ΧΣ !
Μέθοδος της ανάλυσης (decomposition) βασικός σκοπός: να διαχωρίσουμε και να απομονώσουμε τα διάφορα χαρακτηριστικά μιας χρονοσειράς: κυρίως τα μη-στάσιμα από τα στάσιμα χαρακτηριστικά Εργαλεία: εξομάλυνση (smoothing), προσαρμογή (fitting), αφαίρεση, παίρνουμε τη διαφορά …
+ + = συνυπάρχουν 3 χαρακτηριστικα: τάση, περιοδικότητα, θόρυβος Σκοπός: απομόνωση του καθένα + + = τάση περιοδικότητα θόρυβος έτσι μπορούμε να χαρακτηρίσουμε πιο καθαρά το κάθε χαρακτηριστικό
Ανάλυση Ι: τάση μέθοδοι για ταυτοποίηση της τάσης: γραμμικό φιλτράρισμα (smoothing, low-pass filtering) μέθοδος διαφορών (differencing) προσαρμογή (fitting) μιας συνάρτησης
Ανάλυση Ι.1: Γραμμικό φιλτράρισμα Από την ΧΖ X(ti) σχήματίζουμε μια καινούργια ΧΣ Υ(t), όπου (για να έχουμε weighted (ανισοβαρή) μέσο όρο) ενδιαφέρον έχουν 2 ΧΣ: 1. Υ(ti), περιέχει την τάση 2. περιέχει το ‘υπόλοιπο’ (residual)
γραμμικό φιλτράρισμα (i): π. χ γραμμικό φιλτράρισμα (i): π.χ. s=q=K, ar=1/(2K+1) ) τρέχοντας μέσος όρος πρόβλημα: περιθώρια (άκρες) (α) είτε με πρόσθεση μηδενικών ή της μέσης τιμής στις άκρες, (β) είτε
τρέχοντας μέσος όρος, Κ=40 με πρόσθεση μηδενικών στις άκρες (zero padding): χωρίς πρόσθεση μηδενικών στις άκρες, με προσαρμογή του συντελεστή Ai
X(ti) και Y(ti) Y(ti) τάση R(ti)=X(ti)-Y(ti) περιοδικότητα και θόρυβος
ΑΧΣ με Mathematica άσκηση 1α: α) δημιουργία της ΧΣ i = 1,2,3,…,512, ti = i t, t = 1 u(ti): θόρυβος με ομοιόμορφη κατανομή στο διάστημα [-2,2] β) γραφική παράσταση ui = Random[ Real, {-2.,2.} ]
Άσκηση 1β: α) υπολόγισε την μέση τιμή μ, τη διασπορά σ2 και τη στάνταρτ απόκλιση σ της Χ(ti) β) γραφική παράσταση της Χ(ti), μ, μ+σ, μ-σ στην ίδια εικόνα