Ανάλυση Πολλαπλής Παλινδρόμησης

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Applied Econometrics Second edition
Advertisements

Keller: Stats for Mgmt & Econ, 7th Ed
Ελαστικότητα 4η Διάλεξη.
Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Προηγμένες Μέθοδοι Δεδομένων Πάνελ
Σχέση ισοτιμίας και εισοδήματος
Keller: Stats for Mgmt & Econ, 7th Ed
Άλλες Στατιστικές Παλινδρόμησης
Applied Econometrics Second edition
Αυτο-συσχέτιση (auto-correlation)
Κεφάλαιο 1 Για Ποιο Λόγο; ΔΟΣΑ Δημοκρίτειο Πανεπιστήμιο Θράκης
EDUC 612 Ανωτερες μορφες στατιστικης αναλυσησ
Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Κεφ. 7: Χρήμα – πληθωρισμός
Το μοντέλο της απλής παλινδρόμησης
Page  1 Ο.Παλιάτσου Γαλλική Επανάσταση 1 ο Γυμνάσιο Φιλιππιάδας.
1 4 Square Questions B A D C Κοιτάξτε προσεκτικά το διάγραμμα. Θα σας κάνω 4 ερωτήσεις γι’ αυτό το τετράγωνο. ΕΤΟΙΜΟΙ;
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
Ανάλυση Πολλαπλής Παλινδρόμησης
Ανάλυση Πολλαπλής Παλινδρόμησης
Σχέση Απόδοσης- Κινδύνου στα Πλαίσια της Θεωρίας Χαρτοφυλακίου
Copyright © 2006 by The McGraw-Hill Companies, Inc. All rights reserved 7- 1 McGraw-Hill/Irwin ΚΙΝΔΥΝΟΣ ΚΑΙ ΑΠΟΔΟΣΗ  Η Ιστορία της Κεφαλαιαγοράς  Μετρώντας.
Το Μ/Μ/1 Σύστημα Ουράς Μ (η διαδικασία αφίξεων είναι Poisson) /
Applied Econometrics Second edition
Αυτοσυσχέτιση και Ετεροσκεδαστικότητα στις Παλινδρομήσεις Χρονολογικών Σειρών yt = b0 + b1xt bkxtk + ut Κεφάλαιο12.
ΚΕΦΑΛΑΙΟ 3 Περιγραφική Στατιστική
Εκτίμηση με Απλά Δείγματα
Ανάλυση Πολλαπλής Παλινδρόμησης
Ανάλυση Παλινδρόμησης με Δεδομένα Χρονολογικών Σειρών
Ε λληνικό Ι νστιτούτο Μ ετρολογίας Σύγκριση μεταξύ αναλυτικών και αριθμητικών μεθόδων υπολογισμού της αβεβαιότητας μέτρησης Χρήστος Μπαντής, Ph. D. Νοέμβριος,
Είδη δειγμάτων Τυχαίο/ μη τυχαίο
Ανάλυση Πολλαπλής Παλινδρόμησης
ΚΕΦΑΛΑΙΟ 5 ΧΩΡΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ
ΧΡΗΜΑΤΟΔΟΤΗΣΗ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΕΠΕΝΔΥΣΕΩΝ ΣΤΗ ΓΕΩΡΓΙΑ
Στατιστική Ι Παράδοση 9 Ο Δείκτης Συσχέτισης.
1 Νέα Θεωρία Μεγέθυνσης Ενδογενής μεγέθυνση. 2 Συνάρτηση παραγωγής προϊόντος Υ t = Y(K, L, A) Y t = [(1-α k )·K t ] α · [(1-α L )·A t ·L t ] 1-α 0
Στατιστική I Χειμερινό Γ. Παπαγεωργίου
Στατιστική IΙ (ΨΥΧ-122) Διάλεξη 3 Απλή γραμμική παλινδρόμηση
Στατιστική I Γ. Παπαγεωργίου XEIM Επιλογή μεθόδου Εξαρτάται από τον ερευνητή/τρια Ποιοτικά/ ποσοτικά όταν τα data αριθμοποιούνται. εδώ – Έμφαση.
Κ. Μόδη: Γεωστατιστική και Εφαρμογές της (Κεφάλαιο 4) 1 Από κοινού κατανομή πολλών ΤΜ Ορίζεται ως από κοινού συνάρτηση κατανομής F(x 1, …, x n ) n τυχαίων.
1 Μελέτη κανόνων συμμετοχής σε ομότιμα δίκτυα επικοινωνίας μέσω προσομοίωσης Φοιτητής : Χρήστος Ι. Καρατζάς Επιβλέποντες Καθηγητές : Γ. Πολύζος – Κ. Κουρκουμπέτης.
ΚΕΦΑΛΑΙΟ 6 ΓΕΩΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ: ΣΗΜΕΙΑ
ΚΕΦΑΛΑΙΟ 10 ΠΑΛΙΝΔΡΟΜΗΣΗ
Στατιστικά περιγραφικά μέτρα Παναγιώταρου Αλίκη Τμήμα Νοσηλευτικής 5η Διάλεξη.
Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή β) για ένα ποσοστό.
ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ - ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Δρ. Κουνετάς Η Κωνσταντίνος.
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. –Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας.
Έλεγχος Υποθέσεων Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης, Κατά την εκτέλεση ενός στατιστικού ελέγχου,
Γραμμική Συσχέτιση, Απλή και Πολλαπλή Γραμμική Παλινδρόμηση (Εργαστήριο Σχολής Κοινωνικών Επιστημών)
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Μέτρα μεταβλητότητας ή διασποράς
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ 1η Διάλεξη
Εισαγωγή στην Στατιστική
Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
Πολυσυγγραμμικότητα Εξειδίκευση
Εισαγωγή στο Γραμμικό Προγραμματισμό
Η ΔΙΩΝΥΜΙΚΗ ΚΑΤΑΝΟΜΗ ΠΙΘΑΝΟΤΗΤΑΣ.
Τμήμα Μηχανικών Πληροφορικής Τ.Ε.
Επαγωγική Στατιστική Συσχέτιση – Συντελεστής συσχέτισης Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Απλή γραμμική παλινδρόμηση
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Λογιστικής και Χρηματοοικονομικής
Η μέθοδος της συνεισφοράς
Παναγιώταρου Αλίκη Τμήμα Νοσηλευτικής
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Επαγωγική Στατιστική Συσχέτιση – Συντελεστές συσχέτισης Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Επαγωγική Στατιστική Γραμμική παλινδρόμηση-Linear Regression Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Μεταγράφημα παρουσίασης:

Ανάλυση Πολλαπλής Παλινδρόμησης y = b0 + b1x1 + b2x2 + . . . bkxk + u 4. Μερικά Ακόμα Θέματα Κεφάλαιο 6

Παραλλάσσοντας τις Μεταβλητές Αλλάζοντας την μονάδα μέτρησης της y μεταβλητής θα οδηγήσει στην αντίστοιχη αλλαγή της μονάδας μέτρησης των συντελεστών και των τυπικών σφαλμάτων, έτσι δεν υπάρχει καμία αλλαγή στην σημαντικότητα ή στην ερμηνεία αυτών. Αλλάζοντας την μονάδα μέτρησης της x μεταβλητής θα αλλάξει την μονάδα μέτρησης του συντελεστή και του τυπικού σφάλματος αυτής, έτσι δεν υπάρχει καμία αλλαγή στην σημαντικότητα ή στην ερμηνεία αυτού.

Συντελεστές Βήτα Περιστασιακά θα δείτε αναφορά σε «τυποποιημένους συντελεστές» ή «συντελεστές βήτα» οι οποίοι έχουνε μία συγκεκριμένη σημασία Η ιδέα είναι να αντικαταστήσουμε την y και κάθε x μεταβλητή με μία τυποποιημένη μορφή – π.χ. αφαιρώντας την μέση τιμή και διαιρώντας με την τυπική απόκλιση Οι συντελεστές ανακλούνε την αλλαγή της τυπική απόκλιση της y για μία τυπική απόκλιση x

Συναρτησιακή Μορφή Οι OLS μπορούνε να χρησιμοποιηθούνε για σχέσεις που δεν είναι αυστηρά γραμμικές ως προς x και y χρησιμοποιώντας μη-γραμμικές συναρτήσεις των x και y – το μοντέλο θα είναι ακόμα γραμμικό ως προς τις παραμέτρους Μπορούμε να πάρουμε τον φυσικό log του x, ή του y ή και των δύο Μπορούμε να χρησιμοποιήσουμε δευτεροβάθμιους όρους των x Μπορούμε να χρησιμοποιήσουμε αλληλεπιδρώντες όρους των x μεταβλητών

Ερμηνεία των Log Μοντέλων Εάν το μοντέλο είναι ln(y) = b0 + b1ln(x) + u, b1 είναι η ελαστικότητα του y ως προς το x Εάν το μοντέλο είναι ln(y) = b0 + b1x + u, b1 είναι προσεγγιστικά η ποσοστιαία μεταβολή του y όταν μεταβληθεί κατά μία μονάδα η x μεταβλητή Εάν το μοντέλο είναι y = b0 + b1ln(x) + u b1 είναι προσεγγιστικά η μεταβολή του y όταν μεταβληθεί 100% η x μεταβλητή

Γιατί χρησιμοποιούμε log μοντέλα Δίνουνε μία άμεση εκτίμηση για την ελαστικότητα Για μοντέλα με y > 0, η υπό-συνθήκη κατανομή είναι συχνά ετεροσκεδαστική ή λοξή, ενώ για την ln(y) είναι πολύ λιγότερο Η κατανομή του ln(y) είναι πιο συμπυκνωμένη, περιορίζοντας την επίδραση των ακραίων τιμών.

Κάποιοι Χοντρικοί Κανόνες Ποιο είδος μεταβλητών συχνά χρησιμοποιείται σε log μορφή? Ποσά σε $ ή € τα οποία είναι θετικά. Μεταβλητές με μεγάλες τιμές, όπως αριθμός μελών ενός πληθυσμού. Ποιο είδος μεταβλητών συχνά χρησιμοποιείται σε μορφή επιπέδων (levels)? Μεταβλητές που μετράνε έτη. Μεταβλητές που είναι αναλογίες ή ποσοστά.

Μοντέλα με Δευτοροβάθμιους όρους Για ένα μοντέλο της μορφής y = b0 + b1x + b2x2 + u δεν μπορούμε να ερμηνεύσουμε το b1 μόνο του, καθώς μετράει την αλλαγή του y ως προς x, χρειάζεται να συνυπολογίσουμε και το b2, αφού

Μοντέλα με Δευτοροβάθμιους όρους, (συνεχεία) Μοντέλα με Δευτοροβάθμιους όρους, (συνεχεία) Υποθέστε ότι ο συντελεστής της x είναι θετικός και ο συντελεστής της x2 είναι αρνητικός. Μετά, η y αυξάνει αρχικά ως προς x, αλλά τελικά θα αρχίσει να μειώνεται από ένα σημείο και μετά

Μοντέλα με Δευτοροβάθμιους όρους, (συνεχεία) Μοντέλα με Δευτοροβάθμιους όρους, (συνεχεία) Υποθέστε ότι ο συντελεστής της x is negative and the coefficient on x2 is positive Μετά, η y μειώνεται αρχικά ως προς x, αλλά τελικά θα αρχίσει να αυξάνεται από ένα σημείο και μετά

Μοντέλα με Αλληλεπιδρώντες Όρους Για ένα μοντέλο της μορφής y = b0 + b1x1 + b2x2 + b3x1x2 + u δεν μπορούμε να ερμηνεύσουμε το b1 μόνο του, καθώς μετράει την αλλαγή του y ως προς x1, χρειάζεται να συνυπολογίσουμε και το b3, αφού

Προσαρμοσμένο R-τετράγωνο

Προσαρμοσμένο R-τετράγωνο (συνέχεια) Είναι εύκολο να δούμε ότι το προσαρμοσμένο R2 (adj-R2, adjusted) είναι (1 – R2)(n – 1) / (n – k – 1), αλλά τα περισσότερα πακέτα δίνουνε και τα δύο R2 και adj-R2 Μπορούμε να συγκρίνουμε την εφαρμογή δύο μοντέλων (με το ίδιο y) συγκρίνοντας τα adj-R2 Δεν μπορούμε να χρησιμοποιήσουμε το adj-R2 για να συγκρίνουμε μοντέλα με διαφορετικά (π.χ., y με ln(y)).

Ποιότητα της Προσαρμογής Είναι σημαντικό να μην εστιαζόμαστε παρά πολύ στο adj-R2 και να εγκαταλείπουμε ουσιαστικά την θεωρία και την κοινή λογική. Εάν οικονομική θεωρία καθαρά προβλέπει ότι μία μεταβλητή ανήκει, γενικά την αφήνουμε μέσα στο μοντέλο. Δεν θέλουμε να συμπεριλάβουμε μία μεταβλητή η οποία δεν παρέχει μία διαισθητική ερμηνεία. Ανακαλέστε την ερμηνεία μερικής επίδρασης (ceteris paribus) στην πολλαπλή παλινδρόμηση.

Τυπικά Σφάλματα για Προβλέψεις Υποθέστε ότι θέλουμε να χρησιμοποιήσουμε τους εκτιμητές μας για να επιτύχουμε μία συγκεκριμένη πρόβλεψη. Πρώτα, υποθέστε ότι θέλουμε μία εκτιμώμενη τιμή για E(y|x1=c1,…xk=ck) = q0 = b0+b1c1+ …+ bkck Αυτό είναι εύκολο για να πετύχουμε με αντικατάσταση των x, στο εκτιμώμενο μας μοντέλο, με c, αλλά τι γίνετε σχετικά με ένα τυπικό σφάλμα. Απλά ανακαλέστε ένα τεστ ενός γραμμικού συνδυασμού.

Προβλέψεις Μπορούμε να ξαναγράψουμε σαν b0 = q0 – b1c1 – … – bkck Αντικαθιστώντας παίρνουμε ότι y = q0 + b1 (x1 - c1) + … + bk (xk - ck) + u Έτσι, εάν παλινδρομήσουμε yi στην (xij - cij) ο σταθερός όρος θα δώσει την προβλεπόμενη τιμή και το τυπικό της σφάλμα. Σημειώστε ότι το τυπικό σφάλμα θα είναι μικρότερο όταν τα c είναι ίσα με τις μέσες τιμές των x.

Προβλέψεις (συνέχεια) Αυτό το τυπικό σφάλμα για την αναμενόμενη τιμή δεν είναι το ίδιο όπως ένα τυπικό σφάλμα για μία ενδεχόμενη τιμή της y. Χρειαζόμαστε επίσης να λάβουμε υπόψη την διακύμανση του μη- παρατηρήσιμου σφάλματος. Αναθέτουμε το σφάλμα της πρόβλεψης να είναι

Διάστημα Εμπιστοσύνης για τις Προβλέψεις Συνήθως ο εκτιμητής του s2 είναι πολύ μεγαλύτερος από την διακύμανση της πρόβλεψης, έτσι Αυτό το διάστημα εμπιστοσύνης για τις προβλέψεις θα είναι πολύ πιο ευρύ από ότι το απλό διάστημα εμπιστοσύνης για την πρόβλεψη.

Ανάλυση Καταλοίπων Αυτό το γεγονός προκύπτει παρατηρώντας τα κατάλοιπα (π.χ. προβλεπόμενες με παρατηρήσιμες τιμές) Παράδειγμα: Παλινδρομώντας την τιμή των αυτοκίνητων σε χαρακτηριστικά - μεγάλα αρνητικά κατάλοιπα υποδεικνύουνε καλές προσφορές. Παράδειγμα: Παλινδρομώντας τα μέσα κέρδη φοιτητών από ένα σχολείο σε χαρακτηριστικά των φοιτητών – μεγάλα θετικά κατάλοιπα υποδεικνύουνε μέγιστα αντίτιμα επιτεύχθηκαν.

Προβλέποντας y σε ένα log Μοντέλο Απλά υπολογίζοντας την εκθετική τιμή της προβλεπόμενης ln(y) θα υπερεκτιμήσει την αναμενόμενη τιμή της y. Χρειάζεται να μεγεθύνουμε υπό κλίμακα αυτή την πρόβλεψη με την εκτιμώμενη τιμή της αναμενόμενης τιμής της exp(u).

Προβλέποντας y σε ένα log Μοντέλο Εάν το u δεν είναι κανονικό, E(exp(u)) πρέπει να εκτιμηθεί χρησιμοποιώντας μία βοηθητική παλινδρόμηση. Δημιουργήστε τον εκθέτη της προβλεπόμενης ln(y), και παλινδρόμησε y σε αυτό χωρίς σταθερό όρο. Ο συντελεστής σε αυτή την μεταβλητή είναι η εκτιμώμενη τιμή της E(exp(u)) η οποία μπορεί να χρησιμοποιηθεί για να μεγεθύνουμε υπό κλίμακα τον εκθέτη της προβλεπόμενης ln(y) για να επιτύχουμε την πρόβλεψη της y.

Συγκρίνοντας μοντέλα με log και με επίπεδες τιμές Ένα παραπροϊόν της προηγούμενης διαδικασίας είναι η μία μέθοδος για να συγκρίνουμε ένα μοντέλο με logs με ένα μοντέλο με επίπεδες τιμές (levels). Πάρτε τις μοντελοποιημένες τις από την βοηθητική παλινδρόμηση, και βρείτε τον συντελεστή συσχετίσεως μεταξύ αυτών και των τιμών της y. Συγκρίνετε το R2 από την παλινδρόμηση με τις επίπεδες τιμές με το τετράγωνο αυτού του συντελεστή συσχετίσεως.