Ανάλυση Πολλαπλής Παλινδρόμησης

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Applied Econometrics Second edition
Advertisements

Keller: Stats for Mgmt & Econ, 7th Ed
Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Προηγμένες Μέθοδοι Δεδομένων Πάνελ
Keller: Stats for Mgmt & Econ, 7th Ed
Άλλες Στατιστικές Παλινδρόμησης
Applied Econometrics Second edition
Εφαρμογές Χρονολογικών Σειρών και στις Προβλέψεις
Ανάλυση Πολλαπλής Παλινδρόμησης
Κεφάλαιο 1 Για Ποιο Λόγο; ΔΟΣΑ Δημοκρίτειο Πανεπιστήμιο Θράκης
Πιθανότητες & Τυχαία Σήματα Συσχέτιση
Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Το μοντέλο της απλής παλινδρόμησης
Page  1 Ο.Παλιάτσου Γαλλική Επανάσταση 1 ο Γυμνάσιο Φιλιππιάδας.
ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΩΝ.
1 4 Square Questions B A D C Κοιτάξτε προσεκτικά το διάγραμμα. Θα σας κάνω 4 ερωτήσεις γι’ αυτό το τετράγωνο. ΕΤΟΙΜΟΙ;
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
Ανάλυση Πολλαπλής Παλινδρόμησης
Μπουντζιούκα Βασιλική, MSc Βιοστατιστικός Εξωτ. Συνεργάτης ΕΣΔΥ
Γραφήματα & Επίπεδα Γραφήματα
Η Ύλη του Μαθήματος Επανάληψη της πολλαπλή παλινδρόμησης και Ασυμπτωτική κατανομή της εκτιμήτριας ελαχίστων τετραγώνων. Βοηθητικές μεταβλητές και παλινδρόμηση.
Κ. Μόδη: Γεωστατιστική και Εφαρμογές της (Κεφάλαιο 5) 1 Τυχαία συνάρτηση Μία τυχαία συνάρτηση (ΤΣ) είναι ένας κανόνας με τον οποίο σε κάθε αποτέλεσμα ζ.
ΚΕΦΑΛΑΙΟ 11 Στάσιμες και Στοχαστικές Διαδικασίες
Σχέση Απόδοσης- Κινδύνου στα Πλαίσια της Θεωρίας Χαρτοφυλακίου
Καλώς ήρθατε στις Οικονομικές Επιστήμες
Κοντινότεροι Κοινοί Πρόγονοι α βγ θ δεζ η π ν ι κλμ ρσ τ κκπ(λ,ι)=α, κκπ(τ,σ)=ν, κκπ(λ,π)=η κκπ(π,σ)=γ, κκπ(ξ,ο)=κ ξο κκπ(ι,ξ)=β, κκπ(τ,θ)=θ, κκπ(ο,μ)=α.
Keller: Stats for Mgmt & Econ, 7th Ed
Applied Econometrics Second edition
Αυτοσυσχέτιση και Ετεροσκεδαστικότητα στις Παλινδρομήσεις Χρονολογικών Σειρών yt = b0 + b1xt bkxtk + ut Κεφάλαιο12.
HY 120 ΨΗΦΙΑΚΗ ΣΧΕΔΙΑΣΗ Ασυγχρονα ακολουθιακα κυκλωματα.
Ανάλυση Πολλαπλής Παλινδρόμησης
Ανάλυση Παλινδρόμησης με Δεδομένα Χρονολογικών Σειρών
ΗΥ120 ΨΗΦΙΑΚΗ ΣΧΕΔΙΑΣΗ Συναρτησεις Boole.
Σέρρες,Ιούνιος 2009 Τίτλος: Αυτόματος έλεγχος στο Scilab: Ανάπτυξη πακέτου για εύρωστο έλεγχο. Ονοματεπώνυμο Σπουδάστριας: Ευαγγελία Δάπκα Επιβλέπων Καθηγητής.
Ανάλυση Πολλαπλής Παλινδρόμησης
Κ. Μόδη: Γεωστατιστική και Εφαρμογές της (Κεφάλαιο 1)
ΧΡΗΜΑΤΟΔΟΤΗΣΗ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΕΠΕΝΔΥΣΕΩΝ ΣΤΗ ΓΕΩΡΓΙΑ
Στατιστική IΙ (ΨΥΧ-122) Διάλεξη 3 Απλή γραμμική παλινδρόμηση
Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών – Τμήμα Πληροφορικής και Τηλεπικοινωνιών 1 Κεφάλαιο 3 Η Σημασιολογία των Γλωσσών Προγραμματισμού Προπτυχιακό.
ΚΕΦΑΛΑΙΟ 10 ΠΑΛΙΝΔΡΟΜΗΣΗ
ΑΣΚΗΣΗ 19η Έστω οι ακόλουθες παρατηρήσεις για τις μεταβλητές Υ, Χ1 και Χ
Ανάλυση με Πολλαπλή Παλινδρόμηση
Μετασχηματισμός Fourier
Αρχές επαγωγικής στατιστικής
ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ - ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Δρ. Κουνετάς Η Κωνσταντίνος.
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. –Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας.
Έλεγχος Υποθέσεων Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης, Κατά την εκτέλεση ενός στατιστικού ελέγχου,
Διάστημα εμπιστοσύνης για τη διακύμανση. Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως Όταν τα δεδομένα αφορούν πληθυσμό – μ είναι ο μέσος του πληθυσμού.
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Μέτρα μεταβλητότητας ή διασποράς
Επαγωγική Στατιστική Εκτίμηση και Έλεγχος μέσων τιμών Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Εισαγωγή στην Στατιστική
Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης
Έλεγχος για τη διαφορά μέσων τιμών μ1 και μ2 δύο πληθυσμών
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
Κανονικότητα Μια από τις υποθέσεις του υποδείγματος της γραμμικής παλινδρόμησης είναι ότι ο διαταρακτικός όρος κατανέμεται κανονικά με μέσο μηδέν και σταθερή.
Πολυσυγγραμμικότητα Εξειδίκευση
Έλεγχος υποθέσεων με την χ2 «χι -τετράγωνο» κατανομή
ΤΕΙ Δυτικής Μακεδονίας Τμήμα Λογιστικής & Χρηματοοικονομικής
Τμήμα Μηχανικών Πληροφορικής Τ.Ε.
Επαγωγική Στατιστική Συσχέτιση – Συντελεστής συσχέτισης Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Τμήμα Λογιστικής & Χρηματοοικονομικής
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Λογιστικής και Χρηματοοικονομικής
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής
Τ. Ε. Ι. Αθήνας Τμήμα Ιατρικών Εργαστηρίων ΒΙΟΣΤΑΤΙΣΤΙΚΗ
Επαγωγική Στατιστική Συσχέτιση – Συντελεστές συσχέτισης Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Επαγωγική Στατιστική Γραμμική παλινδρόμηση-Linear Regression Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Ανάλυση διακύμανσης Τι είναι η ανάλυση διακύμανσης
Μεταγράφημα παρουσίασης:

Ανάλυση Πολλαπλής Παλινδρόμησης y = b0 + b1x1 + b2x2 + . . . bkxk + u 6. Ετεροσκεδαστικότητα Κεφάλαιο 8

Τι Είναι Ετεροσκεδαστικότητα Ανακαλέστε την υπόθεση της ομοσκεδαστικότητας η οποία υποθέτει ότι η διακύμανση του μη-παρατηρουμένου σφάλματος, u, υπό-δέσμευση ως προς όλες τις επεξηγηματικές μεταβλητές, είναι σταθερή. Εάν αυτό δεν είναι αληθής, δηλαδή εάν η διακύμανση του u είναι διαφορετική για διαφορετικές τιμές των x, τότε τα σφάλματα δεν είναι ομοσκεδαστικά. Παράδειγμα: η εκτίμηση των απολαβών σε σχέση με την εκπαίδευση και την ικανότητα των εργαζομένων δεν παρατηρείται, και σκεφτείτε ότι η διακύμανση της ικανότητας διαφέρει κατά μορφωτικό επίπεδο.

. . . Παράδειγμα Ετεροσκεδαστικότητας f(y|x) y x1 x2 x3 x E(y|x) = b0 + b1x . x1 x2 x3 x

Γιατί Ανησυχούμε για την Ετεροσκεδαστικότητα; OLS είναι ακόμη αμερόληπτοι και συνεπείς, ακόμη και αν δεν υποθέτουμε ομοσκεδαστικότητα. Τα τυπικά σφάλματα των εκτιμητών είναι μεροληπτικά όταν έχουμε ετεροσκεδαστικότητα. Εάν τα τυπικά σφάλματα είναι μεροληπτικά, δεν μπορούμε να χρησιμοποιήσουμε τις σύνηθες t ή F ή LM στατιστικές για να εξάγουμε συμπεράσματα.

Διακύμανση με Ετεροσκεδαστικότητα

Διακύμανση με Ετεροσκεδαστικότητα

Ανθεκτικά Τυπικά Σφάλματα Τώρα που έχουμε έναν συνεπή εκτιμητή της διακύμανσης, η τετραγωνική ρίζα μπορεί να χρησιμοποιηθεί ως ένα τυπικό σφάλμα για συμπερασματολογία. Γενικώς καλούνται ανθεκτικά τυπικά σφάλματα. Ορισμένες φορές η εκτιμώμενη διακύμανση διορθώνεται για βαθμούς ελευθερίας πολλαπλασιάζοντας με n/(n – k – 1) Καθώς n → ∞ δεν υπάρχει διαφορά, αφού το όριο είναι 1.

Ανθεκτικά Τυπικά Σφάλματα και F Έλεγχος Είναι σημαντικό να θυμόμαστε ότι αυτά τα ανθεκτικά τυπικά σφάλματα έχουν μόνο ασυμπτωτική εγκυρότητα – για μικρά μεγέθη του δείγματος οι t στατιστικές υπολογισμένες με τα ανθεκτικά τυπικά σφάλματα δεν ακολουθούν t-κατανομή, και τα συμπεράσματα δεν είναι σωστά. Στο Stata, ανθεκτικά τυπικά σφάλματα είναι εύκολο να επιτευχθούν αν χρησιμοποιήσουμε την εντολή robust στην διαδικασία reg. Η στατιστική F είναι ανθεκτική ως προς την ετεροσκεδαστικότητα και καλείται και Wald στατιστική.

Μία Ανθεκτική LM Στατιστική Εκτελούμε OLS στο υπό δέσμευση μοντέλο και σώστε τα κατάλοιπα ŭ. Παλινδρομήστε κάθε μία από τις μεταβλητές που αποκλείονται επί όλων των ανεξαρτήτων μεταβλητών που χρησιμοποιούνται (q διαφορετικές παλινδρομήσεις) και σώστε τις ομάδες των καταλοίπων ř1, ř2, …, řq. Παλινδρομήστε την μεταβλητή 1 επί των ř1 ŭ, ř2 ŭ, …, řq ŭ, χωρίς τεταγμένη της αρχής. Η LM στατιστική είναι n – SSR1, όπου SSR1 είναι το άθροισμα των τετραγώνων των καταλοίπων από την τελευταία παλινδρόμηση και ακολουθεί χ2-κατανομή με q βαθμούς ελευθερίας.

Έλεγχος για Ετεροσκεδαστικότητα Ουσιαστικά θέλουμε να ελέγξουμε H0: Var(u|x1, x2,…, xk) = s2, το οποίο είναι ισοδύναμο με H0: E(u2|x1, x2,…, xk) = E(u2) = s2 Εάν υποθέσουμε ότι η σχέση μεταξύ του u2 και xj είναι γραμμική, μπορούμε να το ελέγξουμε σαν ένα γραμμικό περιορισμό. Έτσι, για u2 = d0 + d1x1 +…+ dk xk + v, σημαίνει έλεγχος του H0: d1 = d2 = … = dk = 0

Το τεστ των Breusch-Pagan για την Ετεροσκεδαστικότητα Το σφάλμα δεν παρατηρείται, αλλά μπορούμε να το εκτιμήσουμε από την παλινδρόμηση των OLS. Αφού παλινδρομήσουμε τα τετράγωνα των καταλοίπων επί όλων των x’s, μπορούμε να χρησιμοποιήσουμε το R2 για να υπολογίσουμε ένα F ή ένα LM τεστ. Η F στατιστική είναι η F στατιστική για την ολική σημαντικότητα της παλινδρόμησης, F = [R2/k]/[(1 – R2)/(n – k – 1)], το οποίο είναι κατανεμημένο Fk, n – k - 1 Η LM στατιστική είναι LM = nR2, με κατανομή c2k

Το τεστ του White Το τεστ του Breusch-Pagan ανιχνεύει κάθε είδους γραμμική σχέση για ετεροσκεδαστικοτητα. Το τεστ του White επιτρέπει και μη-γραμμικές σχέσεις χρησιμοποιώντας τετράγωνα και γινόμενα όλων των x. Ακόμα χρησιμοποιούμε ένα F ή LM για τον έλεγχο όλων των xj, xj2, και xjxh είναι από κοινού σημαντικά. Αλλά αυτό μπορεί να γίνει εύκολα πολύ άβολο.

Εναλλακτική Μορφή για το Τεστ του White Θεωρήστε ότι οι εκτιμώμενες τιμές των OLS, ŷ, είναι συνάρτηση όλων των x. Έτσι, ŷ2 θα είναι συνάρτηση των τετραγώνων και των γινομένων, και ŷ και ŷ2 αντιπροσωπεύουν για όλα τα xj, xj2, και xjxh, έτσι Παλινδρομούμε τα τετράγωνα των καταλοίπων επί των ŷ και ŷ2 και χρησιμοποιούμε το R2 για τον υπολογισμό των F ή LM στατιστικών. Σημειώστε ότι ελέγχουμε μόνο για δύο περιορισμούς τώρα.

Σταθμισμένα Ελάχιστα Τετράγωνα Αν και είναι πάντα δυνατό να εκτιμήσουμε ανθεκτικά τυπικά σφάλματα για OLS εκτιμητές, εάν γνωρίζουμε κάτι σχετικά με τη συγκεκριμένη μορφή της ετεροσκεδαστικότητας, μπορούμε να επιτύχουμε πιο αποτελεσματικούς εκτιμητές από τους OLS Η βασική ιδέα είναι να μετασχηματίσουμε το μοντέλο σε ένα νέο μοντέλο με ομοσκεδαστικά σφάλματα – η τεχνική καλείται σταθμισμένα ελάχιστα τετράγωνα

Η μορφή της ετεροσκεδαστικότητας συσχετιζόμενη με μία πολλαπλασιαζόμενη σταθερά Υποθέστε ότι η ετεροσκεδαστικότητα μπορεί να μοντελοποιηθεί ως Var(u|x) = s2h(x), όπου το τέχνασμα είναι να καθορίσουμε τη μορφή της h(x) ≡ hi E(ui/√hi|x) = 0, επειδή hi είναι μόνο συνάρτηση του x, και Var(ui/√hi|x) = s2, αφού γνωρίζουμε ότι Var(u|x) = s2hi Έτσι, εάν διαιρέσουμε και τα δύο μέλη της εξίσωσης με √hi θα έχουμε ένα μοντέλο με ομοσκεδαστικά σφάλματα.

Γενικευμένα Ελάχιστα Τετράγωνα Η εκτίμηση της μετασχηματισμένης εξίσωσης με OLS είναι ένα παράδειγμα γενικευμένων ελάχιστων τετράγωνων (GLS) GLS θα είναι ΑΓΑΕ (BLUE, Κεφ. 3 – Δ 28) σε αυτή την περίπτωση GLS είναι μία διαδικασία σταθμισμένων ελάχιστων τετράγωνων (WLS) όπου κάθε τετραγωνισμένο κατάλοιπο σταθμίζεται με την αντίστροφο της Var(ui|xi)

Σταθμισμένα Ελάχιστα Τετράγωνα Αν και μπορούμε να δούμε διαισθητικά γιατί η εκτέλεση των OLS σε μία μετασχηματιζόμενη εξίσωση είναι κατάλληλη, μπορεί να είναι δύσκολο να εκτελέσουμε τον μετασχηματισμό Με γενικευμένα ελάχιστα τετράγωνα επιτυγχάνουμε το ίδιο πράγμα, χωρίς να κάνουμε μετασχηματισμό Η ιδέα είναι να ελαχιστοποιήσουμε το σταθμισμένο άθροισμα τετράγωνων (σταθμίζοντας με 1/hi)

Σταθμισμένα Ελάχιστα Τετράγωνα WLS (συνεχεία) WLS είναι κατάλληλα αν γνωρίζουμε την μορφή της Var(ui|xi) Στις πιο πολλές περιπτώσεις δεν γνωρίζουμε την μορφή της ετεροσκεδαστικότητας Στην περίπτωση που τα δεδομένα είναι αθροιστικά και μοντελοποιούμε σε ατομικό επίπεδο, γνωρίζουμε την μορφή της ετεροσκεδαστικότητας Στην παραπάνω περίπτωση θέλουμε να σταθμίσουμε κάθε αθροιστική παρατήρηση με τον αντίστροφο αριθμό των ατόμων

Εφικτά Γενικευμένα Ελάχιστα Τετράγωνα Ξαναθυμίζουμε ότι πιο τυπική είναι η περίπτωση στην οποία δεν γνωρίζουμε την μορφή της ετεροσκεδαστικότητας Σε αυτή την περίπτωση, χρειάζεται να εκτιμήσουμε h(xi) Τυπικά, ξεκινάμε με την υπόθεση ενός αρκετά εύκαμπτου μοντέλου, Var(u|x) = s2exp(d0 + d1x1 + …+ dkxk) Αφού δεν γνωρίζουμε τα d, θα πρέπει να τα εκτιμήσουμε

Εφικτά Γενικευμένα Ελάχιστα Τετράγωνα (συνέχεια) Η υπόθεση μας υποδηλώνει ότι u2 = s2exp(d0 + d1x1 + …+ dkxk)v Όπου E(v|x) = 1, τότε εάν E(v) = 1 ln(u2) = a0 + d1x1 + …+ dkxk + e Όπου E(e) = 0 και e είναι ανεξάρτητο x Τώρα, γνωρίζουμε ότι û είναι ένας εκτιμητής του u, έτσι μπορούμε να εκτιμήσουμε αυτό με OLS Τις προσαρμοσμένες τιμές από την παραπάνω παλινδρόμηση τις συμβολίζουμε με

Εφικτά Γενικευμένα Ελάχιστα Τετράγωνα (συνέχεια) Τώρα, ένας εκτιμητής του h πετυχαίνεται ως ĥ = exp(ĝ), και ο αντίστροφος αυτού είναι η στάθμιση μας Έτσι, τι πετύχαμε; Τρέχουμε το αρχικό OLS μοντέλο, σώζουμε τα κατάλοιπα, û, τα τετραγωνίζουμε και παίρνουμε τους log Παλινδρομούμε ln(û2) σε όλες τις ανεξάρτητες μεταβλητές και παίρνουμε τις προσαρμοσμένες τιμές, ĝ Εκτελούμε WLS χρησιμοποιώντας 1/exp(ĝ) ως στάθμιση

WLS (συνέχεια) Όταν εκτελούμε F τεστ με WLS, μορφοποιούμε τις σταθμίσεις από το μοντέλο χωρίς περιορισμούς και χρησιμοποιούμε αυτές τις σταθμίσεις για να εκτελέσουμε WLS στο μοντέλο με περιορισμούς όπως επίσης και στο μοντέλο χωρίς περιορισμούς Θυμηθείτε ότι χρησιμοποιούμε WLS απλά για αποτελεσματικότητα - OLS είναι ακόμα αμερόληπτος και συνεπής Οι εκτιμητές ακόμα θα είναι διαφορετικοί λόγω του δειγματικού σφάλματος, αλλά εάν είναι πολύ διαφορετικοί τότε πιθανώς κάποια άλλη υπόθεση παραβιάζεται

Eview Commands Έλεγχοι για Heteroskedasticity -> Αφού κανετε παλινδρόμηση επιλεξτε στο νέο παράθυρο, Equation: …. View/Residual Tests/ Heteroskedasticity Tests… και επιλέξτε τον έλεγχο που θέλετε