Ανάλυση Πολλαπλής Παλινδρόμησης

Ανάλυση Πολλαπλής Παλινδρόμησης
y = b0 + b1x1 + b2x bkxk + u 4. Μερικά Ακόμα Θέματα Κεφάλαιο 6

Παραλλάσσοντας τις Μεταβλητές
Αλλάζοντας την μονάδα μέτρησης της y μεταβλητής θα οδηγήσει στην αντίστοιχη αλλαγή της μονάδας μέτρησης των συντελεστών και των τυπικών σφαλμάτων, έτσι δεν υπάρχει καμία αλλαγή στην σημαντικότητα ή στην ερμηνεία αυτών. Αλλάζοντας την μονάδα μέτρησης της x μεταβλητής θα αλλάξει την μονάδα μέτρησης του συντελεστή και του τυπικού σφάλματος αυτής, έτσι δεν υπάρχει καμία αλλαγή στην σημαντικότητα ή στην ερμηνεία αυτού.

Συντελεστές Βήτα Περιστασιακά θα δείτε αναφορά σε «τυποποιημένους συντελεστές» ή «συντελεστές βήτα» οι οποίοι έχουνε μία συγκεκριμένη σημασία Η ιδέα είναι να αντικαταστήσουμε την y και κάθε x μεταβλητή με μία τυποποιημένη μορφή – π.χ. αφαιρώντας την μέση τιμή και διαιρώντας με την τυπική απόκλιση Οι συντελεστές ανακλούνε την αλλαγή της τυπική απόκλιση της y για μία τυπική απόκλιση x

Συναρτησιακή Μορφή Οι OLS μπορούνε να χρησιμοποιηθούνε για σχέσεις που δεν είναι αυστηρά γραμμικές ως προς x και y χρησιμοποιώντας μη-γραμμικές συναρτήσεις των x και y – το μοντέλο θα είναι ακόμα γραμμικό ως προς τις παραμέτρους Μπορούμε να πάρουμε τον φυσικό log του x, ή του y ή και των δύο Μπορούμε να χρησιμοποιήσουμε δευτεροβάθμιους όρους των x Μπορούμε να χρησιμοποιήσουμε αλληλεπιδρώντες όρους των x μεταβλητών

Ερμηνεία των Log Μοντέλων
Εάν το μοντέλο είναι ln(y) = b0 + b1ln(x) + u, b1 είναι η ελαστικότητα του y ως προς το x Εάν το μοντέλο είναι ln(y) = b0 + b1x + u, b1 είναι προσεγγιστικά η ποσοστιαία μεταβολή του y όταν μεταβληθεί κατά μία μονάδα η x μεταβλητή Εάν το μοντέλο είναι y = b0 + b1ln(x) + u b1 είναι προσεγγιστικά η μεταβολή του y όταν μεταβληθεί 100% η x μεταβλητή

Γιατί χρησιμοποιούμε log μοντέλα
Δίνουνε μία άμεση εκτίμηση για την ελαστικότητα Για μοντέλα με y > 0, η υπό-συνθήκη κατανομή είναι συχνά ετεροσκεδαστική ή λοξή, ενώ για την ln(y) είναι πολύ λιγότερο Η κατανομή του ln(y) είναι πιο συμπυκνωμένη, περιορίζοντας την επίδραση των ακραίων τιμών.

Κάποιοι Χοντρικοί Κανόνες
Ποιο είδος μεταβλητών συχνά χρησιμοποιείται σε log μορφή? Ποσά σε $ ή € τα οποία είναι θετικά. Μεταβλητές με μεγάλες τιμές, όπως αριθμός μελών ενός πληθυσμού. Ποιο είδος μεταβλητών συχνά χρησιμοποιείται σε μορφή επιπέδων (levels)? Μεταβλητές που μετράνε έτη. Μεταβλητές που είναι αναλογίες ή ποσοστά.

Μοντέλα με Δευτοροβάθμιους όρους
Για ένα μοντέλο της μορφής y = b0 + b1x + b2x2 + u δεν μπορούμε να ερμηνεύσουμε το b1 μόνο του, καθώς μετράει την αλλαγή του y ως προς x, χρειάζεται να συνυπολογίσουμε και το b2, αφού

Μοντέλα με Δευτοροβάθμιους όρους, (συνεχεία)
Μοντέλα με Δευτοροβάθμιους όρους, (συνεχεία) Υποθέστε ότι ο συντελεστής της x είναι θετικός και ο συντελεστής της x2 είναι αρνητικός. Μετά, η y αυξάνει αρχικά ως προς x, αλλά τελικά θα αρχίσει να μειώνεται από ένα σημείο και μετά

Μοντέλα με Δευτοροβάθμιους όρους, (συνεχεία)
Μοντέλα με Δευτοροβάθμιους όρους, (συνεχεία) Υποθέστε ότι ο συντελεστής της x is negative and the coefficient on x2 is positive Μετά, η y μειώνεται αρχικά ως προς x, αλλά τελικά θα αρχίσει να αυξάνεται από ένα σημείο και μετά

Μοντέλα με Αλληλεπιδρώντες Όρους
Για ένα μοντέλο της μορφής y = b0 + b1x1 + b2x2 + b3x1x2 + u δεν μπορούμε να ερμηνεύσουμε το b1 μόνο του, καθώς μετράει την αλλαγή του y ως προς x1, χρειάζεται να συνυπολογίσουμε και το b3, αφού

Προσαρμοσμένο R-τετράγωνο

Προσαρμοσμένο R-τετράγωνο (συνέχεια)
Είναι εύκολο να δούμε ότι το προσαρμοσμένο R2 (adj-R2, adjusted) είναι (1 – R2)(n – 1) / (n – k – 1), αλλά τα περισσότερα πακέτα δίνουνε και τα δύο R2 και adj-R2 Μπορούμε να συγκρίνουμε την εφαρμογή δύο μοντέλων (με το ίδιο y) συγκρίνοντας τα adj-R2 Δεν μπορούμε να χρησιμοποιήσουμε το adj-R2 για να συγκρίνουμε μοντέλα με διαφορετικά (π.χ., y με ln(y)).

Ποιότητα της Προσαρμογής
Είναι σημαντικό να μην εστιαζόμαστε παρά πολύ στο adj-R2 και να εγκαταλείπουμε ουσιαστικά την θεωρία και την κοινή λογική. Εάν οικονομική θεωρία καθαρά προβλέπει ότι μία μεταβλητή ανήκει, γενικά την αφήνουμε μέσα στο μοντέλο. Δεν θέλουμε να συμπεριλάβουμε μία μεταβλητή η οποία δεν παρέχει μία διαισθητική ερμηνεία. Ανακαλέστε την ερμηνεία μερικής επίδρασης (ceteris paribus) στην πολλαπλή παλινδρόμηση.

Τυπικά Σφάλματα για Προβλέψεις
Υποθέστε ότι θέλουμε να χρησιμοποιήσουμε τους εκτιμητές μας για να επιτύχουμε μία συγκεκριμένη πρόβλεψη. Πρώτα, υποθέστε ότι θέλουμε μία εκτιμώμενη τιμή για E(y|x1=c1,…xk=ck) = q0 = b0+b1c1+ …+ bkck Αυτό είναι εύκολο για να πετύχουμε με αντικατάσταση των x, στο εκτιμώμενο μας μοντέλο, με c, αλλά τι γίνετε σχετικά με ένα τυπικό σφάλμα. Απλά ανακαλέστε ένα τεστ ενός γραμμικού συνδυασμού.

Προβλέψεις Μπορούμε να ξαναγράψουμε σαν b0 = q0 – b1c1 – … – bkck
Αντικαθιστώντας παίρνουμε ότι y = q0 + b1 (x1 - c1) + … + bk (xk - ck) + u Έτσι, εάν παλινδρομήσουμε yi στην (xij - cij) ο σταθερός όρος θα δώσει την προβλεπόμενη τιμή και το τυπικό της σφάλμα. Σημειώστε ότι το τυπικό σφάλμα θα είναι μικρότερο όταν τα c είναι ίσα με τις μέσες τιμές των x.

Προβλέψεις (συνέχεια)
Αυτό το τυπικό σφάλμα για την αναμενόμενη τιμή δεν είναι το ίδιο όπως ένα τυπικό σφάλμα για μία ενδεχόμενη τιμή της y. Χρειαζόμαστε επίσης να λάβουμε υπόψη την διακύμανση του μη- παρατηρήσιμου σφάλματος. Αναθέτουμε το σφάλμα της πρόβλεψης να είναι

Διάστημα Εμπιστοσύνης για τις Προβλέψεις
Συνήθως ο εκτιμητής του s2 είναι πολύ μεγαλύτερος από την διακύμανση της πρόβλεψης, έτσι Αυτό το διάστημα εμπιστοσύνης για τις προβλέψεις θα είναι πολύ πιο ευρύ από ότι το απλό διάστημα εμπιστοσύνης για την πρόβλεψη.

Ανάλυση Καταλοίπων Αυτό το γεγονός προκύπτει παρατηρώντας τα κατάλοιπα (π.χ. προβλεπόμενες με παρατηρήσιμες τιμές) Παράδειγμα: Παλινδρομώντας την τιμή των αυτοκίνητων σε χαρακτηριστικά - μεγάλα αρνητικά κατάλοιπα υποδεικνύουνε καλές προσφορές. Παράδειγμα: Παλινδρομώντας τα μέσα κέρδη φοιτητών από ένα σχολείο σε χαρακτηριστικά των φοιτητών – μεγάλα θετικά κατάλοιπα υποδεικνύουνε μέγιστα αντίτιμα επιτεύχθηκαν.

Προβλέποντας y σε ένα log Μοντέλο
Απλά υπολογίζοντας την εκθετική τιμή της προβλεπόμενης ln(y) θα υπερεκτιμήσει την αναμενόμενη τιμή της y. Χρειάζεται να μεγεθύνουμε υπό κλίμακα αυτή την πρόβλεψη με την εκτιμώμενη τιμή της αναμενόμενης τιμής της exp(u).

Προβλέποντας y σε ένα log Μοντέλο
Εάν το u δεν είναι κανονικό, E(exp(u)) πρέπει να εκτιμηθεί χρησιμοποιώντας μία βοηθητική παλινδρόμηση. Δημιουργήστε τον εκθέτη της προβλεπόμενης ln(y), και παλινδρόμησε y σε αυτό χωρίς σταθερό όρο. Ο συντελεστής σε αυτή την μεταβλητή είναι η εκτιμώμενη τιμή της E(exp(u)) η οποία μπορεί να χρησιμοποιηθεί για να μεγεθύνουμε υπό κλίμακα τον εκθέτη της προβλεπόμενης ln(y) για να επιτύχουμε την πρόβλεψη της y.

Συγκρίνοντας μοντέλα με log και με επίπεδες τιμές
Ένα παραπροϊόν της προηγούμενης διαδικασίας είναι η μία μέθοδος για να συγκρίνουμε ένα μοντέλο με logs με ένα μοντέλο με επίπεδες τιμές (levels). Πάρτε τις μοντελοποιημένες τις από την βοηθητική παλινδρόμηση, και βρείτε τον συντελεστή συσχετίσεως μεταξύ αυτών και των τιμών της y. Συγκρίνετε το R2 από την παλινδρόμηση με τις επίπεδες τιμές με το τετράγωνο αυτού του συντελεστή συσχετίσεως.

Ανάλυση Πολλαπλής Παλινδρόμησης

Παρόμοιες παρουσιάσεις

Παρουσίαση με θέμα: "Ανάλυση Πολλαπλής Παλινδρόμησης"— Μεταγράφημα παρουσίασης:

Παρόμοιες παρουσιάσεις

Σχετικά με το έργο

Σχόλια

Είσοδος

Σύνδεση μέσω των κοινωνικών δικτύων:

Ανάλυση Πολλαπλής Παλινδρόμησης

Παρόμοιες παρουσιάσεις

Παρουσίαση με θέμα: "Ανάλυση Πολλαπλής Παλινδρόμησης"— Μεταγράφημα παρουσίασης:

Παρόμοιες παρουσιάσεις

Σχετικά με το έργο

Σχόλια