Εξόρυξη Γνώσης Από Χρονικά Δεδομένα

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Προβλέψεις με τη χρήση προτύπων γραμμικής παλινδρόμησης και συσχέτισης
Advertisements

13ο ΔΗΜ. ΣΧΟΛΕΙΟ ΧΑΛΑΝΔΡΙΟΥ ΑΘΗΝΑ, ΕΛΛΑΔΑ ΠΡΟΓΡΑΜΜΑ COMENIUS “ΠΑΙΞΕ ΜΑΖΙ ΜΟΥ ΚΑΙ ΟΧΙ ΜΕ ΤΟΝ ΥΠΟΛΟΓΙΣΤΗ” Σχολικό έτος th PRIMARY SCHOOL CHALANDRI,
Matching.
Click here to start Important !: You have to enable macros for this game (Tools ->Macros -> Security -> «medium»).
Ειδική Θεωρία της Σχετικότητας Μέρος 1ο
Εξόρυξη Γνώσης Από Χωρικά Δεδομένα Φροντιστήριο Αγγελική Σκούρα
Ο ΒΑΣΙΛΙΑΣ THE KING Διαλέγουμε ένα παιδί το οποίο γίνεται ο βασιλιάς. A child becomes the king.
Εξόρυξη Γνώσης Από Χωρικά Δεδομένα
Entity-Relationship Παραδείγματα Πληροφοριακά Συστήματα και Βάσεις Δεδομένων Φροντιστήριο 1 Δαμιανός Χατζηαντωνίου.
1 Please include the following information on this slide: Παρακαλώ, συμπεριλάβετε τις παρακάτω πληροφoρίες στη διαφάνεια: Name Giannakodimou Aliki Kourkouta.
6 Η ΠΑΡΟΥΣΙΑΣΗ: ΠΑΝΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΟΙΝΩΝΙΚΩΝ ΚΑΙ ΠΟΛΙΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ: ΕΠΙΚΟΙΝΩΝΙΑΣ, ΜΕΣΩΝ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ ΜΑΘΗΜΑ: ΕΙΣΑΓΩΓΗ ΣΤΗ ΔΙΑΦΗΜΙΣΗ.
Distance Functions on Hierarchies Eftychia Baikousi.
Principles of programming languages 9: Answers for exercises Isao Sasano Department of Information Science and Engineering.
Καθ. Λευτέρης Θαλασσινός
Πρόβλεψη Θέσης Χρήστη σε Κινητά Δίκτυα - Ταξινομητής Βέλτιστης Παύσης Σπύρος Γεωργάκης Διπλωματική Εργασία.
ΗΥ Παπαευσταθίου Γιάννης1 Clock generation.
6/26/2015HY220: Ιάκωβος Μαυροειδής1 HY220 Asynchronous Circuits.
Week 11 Quiz Sentence #2. The sentence. λαλο ῦ μεν ε ἰ δότες ὅ τι ὁ ἐ γείρας τ ὸ ν κύριον Ἰ ησο ῦ ν κα ὶ ἡ μ ᾶ ς σ ὺ ν Ἰ ησο ῦ ἐ γερε ῖ κα ὶ παραστήσει.
Διοίκηση Απόδοσης Επιχειρηματικών Διαδικασιών Ενότητα #5: Key result indicators (KRIs), Performance Indicators (PIs), Key Performance Indicators (KPIs)
Προσομοίωση Δικτύων 4η Άσκηση Σύνθετες τοπολογίες, διακοπή συνδέσεων, δυναμική δρομολόγηση.
 Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.  Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας.
Προσομοίωση Δικτύων 3η Άσκηση Δημιουργία, διαμόρφωση μελέτη σύνθετων τοπολογιών.
Αριθμητική Επίλυση Διαφορικών Εξισώσεων 1. Συνήθης Δ.Ε. 1 ανεξάρτητη μεταβλητή x 1 εξαρτημένη μεταβλητή y Καθώς και παράγωγοι της y μέχρι n τάξης, στη.
ΕΥΡΩΠΑΪΚΑ ΣΧΟΛΕΙΑ. SCHOOLS OF EUROPEAN EDUCATION.
ΑΣΦΑΛΕΙΑ ΑΣΘΕΝΩΝ (PATIENT SAFETY) ωφελέειν ή μη βλάπτειν ωφελέειν = θεραπευτική παρέμβαση μη βλάπτειν = ασφάλεια ασθενών.
SCHOOL OF EUROPEAN EDUCATION - HERAKLION OPTIONS OF SUBJECTS FOR YEAR 3 (Γ’ ΤΑΞΗ)
Αντίληψη (2016) Όραση Μαρία Κουτρομάνου. Structure of the Eye: Iris The iris is similar to the diaphragm in a camera Your iris widens in dim light and.
Παρουσίαση πτυχιακής εργασίας Σαλιάρη Αικατερίνη Επιβλέπων καθηγητής: Αθανάσιος Νικολαΐδης.
1 Αποτελέσματα κλάδου – ‘Α τρίμηνο 2015 Το α’ τρίμηνο του 2015 ο κλάδος παρουσιάζει τάσεις σταθεροποίησης στα έσοδα του ενώ οι επενδύσεις αυξάνονται με.
Guide to Business Planning The Value Chain © Guide to Business Planning A principal use of value chain analysis is to identify a strategy mismatch between.
Αντισταθμιστική ανάλυση
Μέτρα Διασποράς Η μεταβλητότητα, ή αλλιώς η ποικιλομορφία, στις τιμές μιας μεταβλητής θα πρέπει πάντοτε να λαμβάνεται υπόψη σε οποιαδήποτε στατιστική ανάλυση!
Προγραμματισμός έργων
Πανεπιστήμιο Ιωαννίνων
Jane Austen Pride and Prejudice (περηφάνια και προκατάληψη)
Τμήμα Εφαρμοσμένης Πληροφορικής και Πολυμέσων Εργαστήριο Ρομποτικής
Independent Component Analysis (ICA)
Matrix Analytic Techniques
Η ανάπτυξη του κωφού παιδιού
ΕΡΕΥΝΗΤΙΚΗ ΕΡΓΑΣΙΑ Β4 Σχ. Έτος:
Μέτρηση αντικτύπου του έργου Αποτελέσματα Ερευνών
GO.
Time Value of Money 5/7/2018 ΧΡΟΝΙΚΗ ΑΞΙΑ ΧΡΗΜΑΤΟΣ Dr. Fred Barbee.
International Hospitality Management MC Employability Scheme
ΦΟΒΙΕΣ ΕΡΕΥΝΗΤΙΚΗ ΕΡΓΑΣΙΑ Α΄ ΛΥΚΕΙΟΥ
Example Rotary Motion Problems
Γεώργιος Σ. Γκουμάς MD,PhD, FESC
This show was edited by Mike:
Εκπαιδευτική ρομποτική
Find: φ σ3 = 400 [lb/ft2] CD test Δσ = 1,000 [lb/ft2] Sand 34˚ 36˚ 38˚
JSIS E 111: Elementary Modern Greek
JSIS E 111: Elementary Modern Greek
GLY 326 Structural Geology
Ορισμός Με τον όρο Χρονοσειρές εννοούμε μια σειρά από παρατηρήσεις που παίρνονται σε ορισμένες χρονικές στιγμές ή περιόδους που ισαπέχουν μεταξύ τους.
This show was edited by Mike:
Find: ρc [in] from load γT=110 [lb/ft3] γT=100 [lb/ft3]
Find: Force on culvert in [lb/ft]
We can manipulate simple equations:
3Ω 17 V A3 V3.
This show was edited by Mike:
This show was edited by Mike:
Deriving the equations of
Μεταβλητή Κοστολόγηση: Εργαλείο Διοίκησης
Δοκοί Διαγράμματα Τεμνουσών Δυνάμεων και Καμπτικών Ροπών
Εθνικό Μουσείο Σύγχρονης Τέχνης Faceforward … into my home!
CPSC-608 Database Systems
Α1(2,2), Α2(2,1), Α3(1,2), Α4(2,3), Α5(3,2) & Α6(1,5) Β1(6,2), Β2(5,3), Β3(6,4), Β4(4,4), Β5(5,5), Β6(7,5), Β7(8,4) & Β8(8,1) C1(2,2) & C2(6,4)
Erasmus + An experience with and for refugees Fay Pliagou.
Μανίκη Γαβριέλλα Μήτσης Σταύρος
Μεταγράφημα παρουσίασης:

Εξόρυξη Γνώσης Από Χρονικά Δεδομένα Εξόρυξη Γνώσης Από Χρονικά Δεδομένα Φροντιστήριο Αγγελική Σκούρα (skoura@ceid.upatras.gr)

Εξόρυξη Χρονικών Δεδομένων Ανάλυση χρονικών σειρών πρόβλεψη μελλοντικών τιμών καθορισμός παρόμοιων τάσεων στο χρόνο κατηγοριοποίηση συμπεριφοράς ποσοτικοποίηση (μετρική) ομοιότητας

Βάσεις Δεδομένων από Χρονοσειρές Ορισμός Μια χρονοσειρά είναι μια ακολουθία πραγματικών αριθμών, που αναπαριστούν τις μετρήσεις μιας πραγματικής μεταβλητής σε ισαπέχοντα χρονικά διαστήματα Παραδείγματα Μεταβολή των εργοστασιακών τιμών Όγκος πωλήσεων ως προς τον χρόνο Μετρήσεις θερμοκρασίας σε καθημερινή βάση ΒΔ Χρονοσειρών Μια βάση δεδομένων με ακολουθίες χρονοσειρών

Χρησιμότητα της Ανάλυσης Χρονοσειρών Εύρεση προτύπων Ανάλυση τάσης (Trend analysis) A company’s linear growth in sales over the years Εποχικότητα Winter sales are approximately twice summer sales Πρόβλεψη What is the expected sales for the next quarter?

Σύγκριση Χρονοσειρών Ευκλείδεια Απόσταση Dynamic Time Warping (DTW) Παράδειγμα σύγκρισης χρονοσειρών Τεχνικές υπολογισμού της απόστασης μεταξύ 2 χρονοσειρών Ευκλείδεια Απόσταση Dynamic Time Warping (DTW) Longest Common SubSequence Τεχνική (LCSS) Minimal Variance Matching (MVM) Symbolic Aggregate approXimation (SAX)

Ευκλείδεια Απόσταση Δίνονται οι χρονοσειρές Α = {1,5,4,3,2,4,5,4,3} Β = {1,5,2,2,4,2} Είναι η Ευκλείδεια απόσταση κατάλληλη για τη σύγκριση των δύο αυτών χρονοσειρών?

Τεχνική Dynamic Time Warping Η μέθοδος Dynamic Time Warping (DTW) είναι μια από τις πιο ικανοποιητικές συναρτήσεις απόστασης μεταξύ δύο χρονοσειρών The sequences are "warped" non-linearly in the time dimension Το βασικό χαρακτηριστικό της (το οποίο αποτελεί και το μεγαλύτερο προτέρημά της) είναι η στοίχιση (alignment) των χρονοσειρών πριν μετρηθεί η απόστασή τους Το βασικότερο μειονέκτημα της μεθόδου είναι το γεγονός ότι στον υπολογισμό της στοίχισης χρησιμοποιούνται όλα τα στοιχεία και των δύο χρονοσειρών Αν δηλαδή υπάρχουν ακραίες τιμές (outliers) στις χρονοσειρές, τότε συνυπολογίζονται στο αποτέλεσμα

Τεχνική Dynamic Time Warping Έστω δύο χρονοσειρές για τις οποίες επιθυμούμε να υπολογίσουμε την μεταξύ τους απόσταση χρησιμοποιώντας τη μέθοδο DTW Αρχικά δημιουργούμε έναν πίνακα αποστάσεων D με στοιχεία Η στοίχιση είναι ένα μονοπάτι (warping path) όπου Για το W υπάρχουν κάποιοι περιορισμοί: w1 = (1, 1) και wK = (m, n) Αν wk = (a, b) και wk-1 = (a’, b’), τότε πρέπει a-a’≤1 και b-b’≤1 Αν wk = (a, b) και wk-1 = (a’, b’), τότε πρέπει a-a’≥0 και b-b’≥0

Περιορισμοί που πρέπει να ισχύουν για το Warping Path A warping path is a path through the minimal distance matrix There are three conditions imposed on the dynamic time warping algorithm that ensures a polynomial time convergence: Monotony – the path never returns the path will not turn back on itself, both the i and j indexes either stay the same or increase, they never decrease Continuity – the path advances gradually step-by-step the path advances one step at a time. Both i and j can only increase by 1 on each step along the path Boundary – the path starts in lower left corner and ends in the upper right corner Αν δούμε ένα μονοπάτι που ξεκινά top right και τερματίζει bottom left είναι λανθασμένο? Επιπλέον προαιρετικός περιορισμός: Adjustment window condition a good path is unlikely to wander very far from the diagonal. The distance that the path is allowed to wander is the window length w, that is |i – j| <= w

Τεχνική Dynamic Time Warping Υπάρχουν πολλά μονοπάτια πάνω στον πίνακα D που ικανοποιούν τις παραπάνω συνθήκες. Στόχος είναι η εύρεση του βέλτιστου μονοπατιού, αυτού δηλαδή που ελαχιστοποιεί την απόσταση μεταξύ των X, Y: Το μονοπάτι αυτό μπορεί να βρεθεί χρησιμοποιώντας την τεχνική του δυναμικού προγραμματισμού πάνω στον πίνακα D, χρησιμοποιώντας την παρακάτω αναδρομική σχέση: γ(i, j) = Di, j + min {γ(i − 1, j − 1), γ(i − 1, j), γ(i, j − 1)} όπου γ(i, j) = cumulative distance Η απόσταση των δύο ακολουθιών είναι ίση με την ποσότητα W, δηλαδή την Ευκλείδεια Απόσταση μεταξύ των στοιχισμένων ακολουθιών The time and space complexity of DTW = O(n.m) όπου n, m τα μήκη των ακολουθιών

Παράδειγμα DTW Gif με το τρέξιμο του αλγορίθμου: http://de.wikipedia.org/wiki/Datei:Animation_Dynamic_Time_Warping.gif

Longest Common SubSequence (LCSS) Όπως αναφέραμε, το βασικό μειονέκτημα του DTW είναι η ευαισθησία του σε outliers Η τεχνική LCSS αναζητά τη μέγιστη κοινή υποακολουθία μεταξύ δύο χρονοσειρών Αυτό σημαίνει ότι μπορεί κατά τον υπολογισμό της διαφοράς να μην υπολογίζει στοιχεία και από τις δύο Με αυτόν τον τρόπο επιλύεται το πρόβλημα των outliers Η LCSS υπολογίζει τη διαφορά ως το πηλίκο του μήκους της μέγιστης κοινής υποακολουθίας προς το συνολικό μέγεθος

LCSS Subsequence comparison without scaling (σύγκριση διακριτών σημάτων) LCSS-like μετρικές για χρονοσειρές X = 3, 2, 5, 7, 4, 8, 10, 7 Y = 2, 5, 4, 7, 3, 10, 8, 6 LCSS = 2, 5, 7, 8 Similarity (X,Y) = |LCSS| Παρόμοια Τεχνική: Edit Distance Μειονέκτημα: Δεν εντοπίζει τους διαφορετικούς παράγοντες κλιμάκωσης Εφαρμογές: Speech Recognition Text Pattern Matching Subsequence comparison without scaling [Yazdani & Ozsoyoglu, 1996] Subsequence comparison with local scaling and baselines [Agrawal et. al., 1995 ] Subsequence comparision with global scaling and baselines [Das et. al., 1997] Global scaling and shifting [Chu and Wong,1999]

Minimal Variance Matching (MVM) Η τεχνική MVM κάνει αντιστοίχιση όπως και ο DTW με τη διαφορά ότι επιτρέπει να μην υπολογίζονται στοιχεία από την μία χρονοσειρά Η βασική διαφορά της MVM με την LCSS είναι πως η δεύτερη υπολογίζει τη διαφορά σε σχέση με την μέγιστη κοινή υποσυμβολοσειρά και συνεπώς χρειάζεται κάποιο κατώφλι Χ=( 1, 2, 8, 6, 8) Υ=( 1, 2, 9, 3, 3, 5, 9) The shortest path for the example matrix is marked with boxes Τhe optimal correspondence f is given by f(1) = 1, f(2) = 2, f(3) = 3, f(4) = 6, f(5) = 7 Finally, we obtain the distance Περισσότερες λεπτομέρειες στο paper: http://www.springerlink.com/content/f13252j85441774r/?CFID=105008431&CFTOKEN=57689851

Symbolic Aggregate approXimation (SAX) According to SAX technique… First, the time series is normalized to have a mean of zero and a standard deviation of one Afterwards, the time series is transformed further by applying Piecewise Aggregate Approximation Taking advantage of the fact that the transformed series follows the normal probability distribution, each element is mapped to a symbol using the properties of this distribution The user must assign a value in parameter α which defines the alphabet size (number of symbols to be used) Then, the area under the normal curve is divided into α areas of equal size (meaning that the corresponding probabilities will be equal for each symbol) and each one of them is assigned to a symbol Finally, an element of series which falls into an interval that corresponds to a specific are is mapped to the area’s symbol

Εξόρυξη Γνώσης Από Χρονικά Δεδομένα Εξόρυξη Γνώσης Από Χρονικά Δεδομένα ΑΠΟΡΙΕΣ?