Άλλες Στατιστικές Παλινδρόμησης

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Applied Econometrics Second edition
Advertisements

Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Προηγμένες Μέθοδοι Δεδομένων Πάνελ
ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ
Applied Econometrics Second edition
Εφαρμογές Χρονολογικών Σειρών και στις Προβλέψεις
Ανάλυση Πολλαπλής Παλινδρόμησης
διαστήματα εμπιστοσύνης
Κεφάλαιο 1 Για Ποιο Λόγο; ΔΟΣΑ Δημοκρίτειο Πανεπιστήμιο Θράκης
Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Το μοντέλο της απλής παλινδρόμησης
Στατιστική Ι Παράδοση 5 Οι Δείκτες Διασποράς Διασπορά ή σκεδασμός.
Ανάλυση Πολλαπλής Παλινδρόμησης
Ανάλυση Πολλαπλής Παλινδρόμησης
Η Ύλη του Μαθήματος Επανάληψη της πολλαπλή παλινδρόμησης και Ασυμπτωτική κατανομή της εκτιμήτριας ελαχίστων τετραγώνων. Βοηθητικές μεταβλητές και παλινδρόμηση.
Κ. Μόδη: Γεωστατιστική και Εφαρμογές της (Κεφάλαιο 5) 1 Τυχαία συνάρτηση Μία τυχαία συνάρτηση (ΤΣ) είναι ένας κανόνας με τον οποίο σε κάθε αποτέλεσμα ζ.
ΚΕΦΑΛΑΙΟ 11 Στάσιμες και Στοχαστικές Διαδικασίες
Κ. Μόδη: Γεωστατιστική και Εφαρμογές της (Κεφάλαιο 3) 1 Από κοινού κατανομή δύο ΤΜ Στην περίπτωση που υπάρχουν δύο ΤΜ ενδιαφέροντος, η συνάρτηση κατανομής.
Αυτοσυσχέτιση και Ετεροσκεδαστικότητα στις Παλινδρομήσεις Χρονολογικών Σειρών yt = b0 + b1xt bkxtk + ut Κεφάλαιο12.
1 Χαρακτηριστικά ενός Μ/Μ/1 συστήματος : Αφίξεις κατανεμημένες κατά Poisson Εκθετικά κατανεμημένοι χρόνοι εξυπηρέτησης Οι χρόνοι εξυπηρέτησης είναι αμοιβαία.
Ανάλυση Πολλαπλής Παλινδρόμησης
ΣΥΣΤΗΜΑΤΑ ΣΥΛΛΟΓΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ ΜΕΤΡΗΣΕΩΝ
Ανάλυση Παλινδρόμησης με Δεδομένα Χρονολογικών Σειρών
Ανάλυση Πολλαπλής Παλινδρόμησης
Κ. Μόδη: Γεωστατιστική και Εφαρμογές της (Κεφάλαιο 1)
ΧΡΗΜΑΤΟΔΟΤΗΣΗ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΕΠΕΝΔΥΣΕΩΝ ΣΤΗ ΓΕΩΡΓΙΑ
Στατιστική IΙ (ΨΥΧ-122) Διάλεξη 3 Απλή γραμμική παλινδρόμηση
ΚΕΦΑΛΑΙΟ 6 ΓΕΩΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ: ΣΗΜΕΙΑ
ΚΕΦΑΛΑΙΟ 10 ΠΑΛΙΝΔΡΟΜΗΣΗ
ΑΣΚΗΣΗ 19η Έστω οι ακόλουθες παρατηρήσεις για τις μεταβλητές Υ, Χ1 και Χ
Αρχές επαγωγικής στατιστικής
Τι είναι η Κατανομή (Distribution)
Στατιστική – Πειραματικός Σχεδιασμός Βασικά. Πληθυσμός – ένα μεγάλο σετ από Ν παρατηρήσεις (πιθανά δεδομένα) από το οποίο το δείγμα λαμβάνεται. Δείγμα.
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή β) για ένα ποσοστό.
ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ - ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Δρ. Κουνετάς Η Κωνσταντίνος.
Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας & Περιφερειακής Ανάπτυξης ΜΑΘΗΜΑ ΕΠΙΛΟΓΗΣ: ΟΙΚΟΝΟΜΕΤΡΙΑ ΔΙΑΛΕΞΗ 05 Μαρί-Νοέλ.
 Ο Νόμος των Μεγάλων Αριθμών είναι το θεώρημα που περιγράφει τον τρόπο με τον οποίο συμπεριφέρεται ένα συγκεκριμένο πείραμα, όταν ο αριθμός των επαναλήψεων.
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. –Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας.
Έλεγχος Υποθέσεων Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης, Κατά την εκτέλεση ενός στατιστικού ελέγχου,
Διαστήματα Εμπιστοσύνης για αναλογίες. Ποιοτικές μεταβλητές χαρακτηρίζονται εκείνες οι οποίες τα στοιχεία τους δεν έχουν μετρηθεί με κάποιον τρόπο – οι.
ΗΛΕΚΤΡΙΚΕΣ ΜΕΤΡΗΣΕΙΣ ΣΦΑΛΜΑΤΑ ΜΕΤΡΗΣΗΣ.
Οικονομετρία Οικονομετρία ποσοτικοποιεί τις σχέσεις μεταξύ μεταβλητών με βάση και αιτιολόγηση τη σχετική οικονομική θεωρία έχει στόχο – όχι μόνο την.
ΤΕΙ Αθήνας: Σχολή ΤΕΦ: Τμήμα Ναυπηγικής Εφαρμογές Η/Υ στην Ναυπηγική ΙΙ ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ NA0703C39 Εξάμηνο Ζ’ Διδάσκων Κωνσταντίνος Β. Κώστας Παρουσίαση.
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Στατιστική Επαγωγή Ένα τεράστιο μέρος της έρευνας διενεργείται μέσω της ανάλυσης δειγμάτων προκειμένου να εξάγουμε συμπεράσματα για τον πληθυσμό. Αυτό.
Μέτρα μεταβλητότητας ή διασποράς
Επαγωγική Στατιστική Εκτίμηση και Έλεγχος μέσων τιμών Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ 1η Διάλεξη
Εισαγωγή στην Στατιστική
Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής
Έλεγχος για τη διαφορά μέσων τιμών μ1 και μ2 δύο πληθυσμών
Μεθοδολογία έρευνας και στατιστική – Δείγμα – Πληθυσμός
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
Κανονικότητα Μια από τις υποθέσεις του υποδείγματος της γραμμικής παλινδρόμησης είναι ότι ο διαταρακτικός όρος κατανέμεται κανονικά με μέσο μηδέν και σταθερή.
Πολυσυγγραμμικότητα Εξειδίκευση
Σχεδιασμός των Μεταφορών
ΤΕΙ Δυτικής Μακεδονίας Τμήμα Λογιστικής & Χρηματοοικονομικής
ΚΑΤΑΝΟΜΕΣ Δ. Τσιπλακίδης
Επαγωγική Στατιστική Συσχέτιση – Συντελεστής συσχέτισης Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
Τμήμα Λογιστικής & Χρηματοοικονομικής
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Λογιστικής και Χρηματοοικονομικής
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής
Τι είναι «διάστημα» (1). Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή (ποσοτικά) β) για ένα ποσοστό (ποιοτικά)
Τ. Ε. Ι. Αθήνας Τμήμα Ιατρικών Εργαστηρίων ΒΙΟΣΤΑΤΙΣΤΙΚΗ
Μεθοδολογία Έρευνας Διάλεξη 9η: Ανάλυση Ποσοτικών Δεδομένων
Επαγωγική Στατιστική Συσχέτιση – Συντελεστές συσχέτισης Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Επαγωγική Στατιστική Γραμμική παλινδρόμηση-Linear Regression Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Μεταγράφημα παρουσίασης:

Άλλες Στατιστικές Παλινδρόμησης Εύλογο ερώτημα αποτελεί το πόσο καλά η (εκτιμημένη) γραμμή παλινδρόμησης εξηγεί (εφαρμόζει) τα στοιχεία του δείγματος. Υπάρχουν δύο στατιστικές παλινδρόμησης, που παρέχουν συμπληρωματικά μέτρα της ποιότητας εφαρμογής της γραμμής παλινδρόμησης. Ο Συντελεστής Προσδιορισμού, R2 (regression R2), μετρά το ποσοστό της διακύμανσης του Υ που εξηγείται από το Χ. Δεν έχει μονάδα μέτρησης και το εύρος τιμών του είναι μεταξύ 0 (καθόλου εφαρμογή) και 1 (τέλεια εφαρμογή). Το Τυπικό Σφάλμα της Παλινδρόμησης ( Standard Error of Regression) μετρά και αυτό την ποιότητα της εφαρμογής, αλλά σε μονάδες μέτρησης του Υ.

Ο Συντελεστής Προσδιορισμού, R2 : Οι παρατηρούμενες τιμές του Υ, Yi , μπορούν να γραφούν ως το άθροισμα των προβλεπόμενων τιμών από την εκτίμηση OLS και των καταλοίπων από την εκτίμηση ΟLS: To R2 είναι το ποσοστό της δειγματικής διακύμανσης του Yi που εξηγείται από την παλινδρόμηση, δηλαδή από το όπου και

όπου και Ο συντελεστής R2 : R2 = 0 σημαίνει ΕSS = 0, επομένως η ερμηνευτική μεταβλητή Χ εξηγεί μηδενικό ποσοστό της διακύμανσης του Υ. R2 = 1 σημαίνει ESS =TSS, επομένως και η Χ εξηγεί όλη τη διακύμανση της Υ. Στην περίπτωση της παλινδρόμησης με μία ερμηνευτική μεταβλητή (η περίπτωση εδώ), το R2 ισούται με το τετράγωνο του συντελεστή συσχέτισης μεταξύ Χ και Υ.

Το Τυπικό Σφάλμα της Παλινδρόμησης The Standard Error of the Regression (SER) H δεύτερη ισότητα ισχύει, λόγω του ότι:

To τυπικό σφάλμα της παλινδρόμησης (SER) : μετράται σε μονάδες του u που είναι ίδιες με τις μονάδες μέτρησης του Y μετρά το εύρος/διασπορά της κατανομής του u μετρά το μέσο «μέγεθος» των καταλοίπων από OLS (το μέσο «λάθος» της εκτιμημένης με OLS γραμμής παλινδρόμησης) Η Ρίζα του Μέσου Τετραγώνου του Σφάλματος (Root Mean Squared Error – RMSE) συνδέεται άμεσα με το τυπικό σφάλμα της παλινδρόμησης: Mετρά το ίδιο πράγμα με το “SER” . Η μόνη διαφορά των δύο είναι η διαίρεση με n αντί για (n-2).

Σημείωση τεχνικής φύσεως: Γιατί διαιρούμε με n-2 αντί για n-1; H διαίρεση με n-2 αποτελεί μια διόρθωση, ώστε να συμπεριληφθούν και οι «βαθμοί ελευθερίας», έχουν εκτιμηθεί δύο παράμετροι ( και ) , από τα ( και ) Όταν το n είναι μεγάλο, η διαφορά μεταξύ n και n-2 είναι αμελητέα. Πάντως, ο συνήθης τύπος χρησιμοποιεί το n-2, όταν υπάρχει μία ερμηνευτική μεταβλητή στο υπόδειγμα.

Παράδειγμα του R2 και του “SER” Βαθμός Εξετάσεων = 698.9 - 2.28 ΛΜΔ, (10.4) (0.52) O συντελεστής της κλίσης είναι στατιστικά σημαντικός και μεγάλος, από οικονομική σκοπιά, παρ’όλο που ο ΛΜΔ εξηγεί ένα μικρό ποσοστό της μεταβλητικότητας των βαθμών στις εξετάσεις

Σημείωση Πρακτικής Φύσεως: Ετεροσκεδαστικότητα, Ομοσκεδαστικότητα και ο Τύπος για το Τυπικό Σφάλμα των και Τί σημαίνουν οι δύο νέοι όροι; Συνέπειες της ομοσκεδαστικότητας Επίπτωση στον υπολογισμό των τυπικών σφαλμάτων Τί σημαίνουν οι δύο νέοι όροι; Aν Var(u|X=x) σταθερά (αν η διακύμανση της υπό συνθήκη στο Χ κατανομής του u δεν εξαρτάται από το x), τότε το u θεωρείται ομοσκεδαστικό. Αλλιώς, το u θεωρείται ετεροσκεδαστικό.

Γραφική Απεικόνιση της Ομοσκεδαστικότητας : Ε(u|X=x)=0, δηλ. τo u ικανοποιεί την 1η Υπόθεση Ελαχίστων Τετραγώ-νων). Η διακύμανση του u δεν εξαρτάται από/δε μεταβάλλεται με το x.

Γραφική Απεικόνιση της Ετεροσκεδαστικότητας : Ε(u|X=x)=0 (To u ικανοποιεί την 1η Υπόθεση Ελαχίστων Τετραγώ- νων) Η διακύμανση του u εξαρτάται από/μεταβάλλεται με το x, επομένως το u είναι ετεροσκεδαστικό.

Ένα παράδειγμα με πραγματικά στοιχεία των Οικονομικών της Εργασίας: μέσος όρος ωρομισθίων και έτη εκπαίδευσης (πηγή στοιχείων: 1999 Current Population Survey)

Υπάρχει ετεροσκεδαστικότητα στα στοιχεία βαθμών εξετάσεων-μεγέθους τάξης; Eίναι δύσκολο να εξαχθεί ένα ασφαλές συμπέρασμα. Στο διάγραμμα διασποράς φαίνεται να υπάρχει ομοσκεδαστικότητα. Παρ’ολ’αυτά, το εύρος των αποκλίσεων μπορεί να μειώνεται όσο αυξάνονται οι τιμές του ΛΜΔ

Mέχρι στιγμής, δεν έχουμε υποθέσει ότι το σφάλμα u είναι ομοσκεδαστικό: Θυμηθείτε τις Τρεις Υποθέσεις Ελαχίστων Τετραγώνων: H υπο συνθήκη στο X κατανομή του u, έχει μέσο μηδέν, δηλαδή Ε(u|X=x)=0. To ζεύγος είναι i.i.d. (κατανέμεται ανεξάρτητα και ιδανικά). Τα Χ και u έχουν πεπερασμένες τέταρτες ροπές Η παρουσία ή μη ετεροσκεδαστικότητας, αναφέρεται στην διακύμανση: var(u|X=x). Επειδή δεν έγινε, στην ανάλυση, ξεκάθαρη υπόθεση ομοσκεδαστικότητας, ουσιαστικά, επιτρέψαμε ετεροσκεδαστικά σφάλματα.

Τί συμβαίνει αν τα σφάλματα είναι στην πραγματικότητα ομοσκεδαστικά; Μπορούμε να αποδείξουμε κάποια θεωρήματα που αναφέρονται στους εκτιμητές OLS (συγκεκριμένα, το θεώρημα Gauss-Markov, όπου διατυπώνεται ότι ο εκτιμητής OLS έχει την μικρότερη διακύμανση από κάθε άλλον εκτιμητή που είναι γραμμική συνάρτηση του δείγματος, ) Ο τύπος για τη διακύμανση του , όπως επίσης ο τύπος για το τυπικό σφάλμα της OLS απλοποιούνται: Aν , Σημ.: H διακύμανση είναι αντιστρόφως ανάλογη της διακύμανσης του X, var(X). Περισσότερη μεταβλητικότητα στην Χ σημαίνει περισσότερη πληροφόρηση για τον εκτιμητή

Ο γενικός τύπος για το τυπικό σφάλμα του δίνεται από την τετραγωνική ρίζα της έκφρασης: Eιδικά, υπό ομοσκεδαστικότητα: Ο δεύτερος τύπος θεωρείται πιο απλός

Ο τύπος που δίνει το συνεπές τυπικό σφάλμα του υπό ομοσκεδαστικότητα διαφέρει από αυτόν υπό ετεροσκεδαστικότητα. Γενικά, η χρήση των δύο διαφορετικών τύπων οδηγεί σε διαφορετικά τυπικά σφάλματα. Σχεδόν όλα τα λογισμικά πακέτα παλινδρομήσεων έχουν ως προκαθορισμένη ρυθμιση (ή ως μόνη, π.χ. Εxcel) την ομοσκεδαστικότητα. Για να λάβει κανείς συνεπή στην ετεροσκεδαστικότητα τυπικά σφάλματα (“heteroskedasticity-robust” ), θα πρέπει να αλλάξει αυτή την προκαθορισμένη ρύθμιση (default). Αν αυτό δε ληφθεί υπ’όψη και υπάρχει ετεροσκεδαστικότητα, τότε λαμβάνουμε εσφαλμένα τυπικά σφάλματα (και κατά συνέπεια, εσφαλμένες στατιστικές t καθώς και διαστήματα εμπιστοσύνης).

Τα κρίσιμα σημεία: Όταν τα σφάλματα είναι ομοσκεδαστικά, αλλά εμείς χρησιμοποιήσουμε τον τύπο για τα τυπικά σφάλματα υπό ετεροσκεδαστικότητα, δεν υπάρχει κανένα πρόβλημα λάθους. Όταν τα σφάλματα είναι ετεροσκεδαστικά, αλλά εμείς χρησιμοποιήσουμε τον τύπο για τα τυπικά σφάλματα υπό ομοσκεδαστικότητα, τα αποτελέσματα (τυπικά σφάλματα) είναι εσφαλμένα. Οι δύο τύποι συμπίπτουν (για n μεγάλο) στην ειδική περίπτωση της ομοσκεδαστικότητας Τελικά: θα πρέπει πάντα να χρησιμοποιούμε για τις εκτιμήσεις τύπους που λαμβάνουν υπόψη τους την ύπαρξη ετεροσκεδαστικότητας (heteroskedasticity-based). Αναφορικά με τα τυπικά σφάλματα οι τύποι αυτοί εξάγουν –όπως συνηθίζεται να αποκαλούνται– “heteroskedasticity-robust standard errors”.

Τυπικά Σφάλματα “Heteroscedasticity Robust” στο STATA