Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Applied Econometrics Second edition
Advertisements

Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Άλλες Στατιστικές Παλινδρόμησης
ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ
Applied Econometrics Second edition
Ανάλυση Πολλαπλής Παλινδρόμησης
Πιθανότητες & Τυχαία Σήματα Συσχέτιση
Γεώργιος Σιδερίδης Πανεπιστήμιο Κρήτης
Μπουντζιούκα Βασιλική, MSc Βιοστατιστικός Εξωτ. Συνεργάτης ΕΣΔΥ
ΕΙΔΗ ΣΦΑΛΜΑΤΩΝ ΣΤΗ ΓΕΩΔΑΙΣΙΑ
Μάθημα 2 ο : Βασικές έννοιες 1 Ακαδημαϊκό Έτος
Ανάλυση Πολλαπλής Παλινδρόμησης
Ε λληνικό Ι νστιτούτο Μ ετρολογίας Σύγκριση μεταξύ αναλυτικών και αριθμητικών μεθόδων υπολογισμού της αβεβαιότητας μέτρησης Χρήστος Μπαντής, Ph. D. Νοέμβριος,
Επίλυση Προβλημάτων με Η/Υ
Τμήμα Πολιτικών Μηχανικών ΠΘ, Αξιολόγηση αποτελεσμάτων βελτίωσης.
ΚΕΦΑΛΑΙΟ 7 ΔΕΙΓΜΑΤΟΛΗΨΙΑ
ΚΕΦΑΛΑΙΟ 5 ΧΩΡΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ
ΚΕΦΑΛΑΙΟ 5 ΧΩΡΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ
ΧΡΗΜΑΤΟΔΟΤΗΣΗ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΕΠΕΝΔΥΣΕΩΝ ΣΤΗ ΓΕΩΡΓΙΑ
Ενεργή επιλογή αλγορίθμου, Active Algorithm Selection, Feilong Chen and Rong Jin Εύα Σιταρίδη.
ΥΔΑΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΚΑΙ ΑΝΑΠΤΥΞΗ
Κ. Μόδη: Γεωστατιστική και Εφαρμογές της (Κεφάλαιο 4) 1 Από κοινού κατανομή πολλών ΤΜ Ορίζεται ως από κοινού συνάρτηση κατανομής F(x 1, …, x n ) n τυχαίων.
ΚΕΦΑΛΑΙΟ 6 ΓΕΩΓΡΑΦΙΚΕΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ: ΣΗΜΕΙΑ
ΚΕΦΑΛΑΙΟ 10 ΠΑΛΙΝΔΡΟΜΗΣΗ
ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΩΝ ΔΙΑΚΡΙΤΩΝ ΚΑΙ ΣΥΝΕΧΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ
Πηγή: Βιοστατιστική [Β.Γ. Σταυρινός, Δ.Β. Παναγιωτάκος]
ΑΣΚΗΣΗ 19η Έστω οι ακόλουθες παρατηρήσεις για τις μεταβλητές Υ, Χ1 και Χ
ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ
Ποσοτική Ανάλυση Κειμένου
Τι είναι η Κατανομή (Distribution)
Στατιστική – Πειραματικός Σχεδιασμός Βασικά. Πληθυσμός – ένα μεγάλο σετ από Ν παρατηρήσεις (πιθανά δεδομένα) από το οποίο το δείγμα λαμβάνεται. Δείγμα.
Σχεδιασμός των Μεταφορών Ενότητα #5: Δειγματοληψία – Sampling. Δρ. Ναθαναήλ Ευτυχία Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών.
ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ - ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Δρ. Κουνετάς Η Κωνσταντίνος.
ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Η πιο συνηθισμένη στατιστική υπόθεση είναι η λεγόμενη Υπόθεση Μηδέν H 0. –Υποθέτουμε ότι η εμφανιζόμενη διαφορά μεταξύ μιας.
Έλεγχος Υποθέσεων Ο έλεγχος υποθέσεων αναφέρεται στη διαδικασία αποδοχής ή απόρριψης μιας στατιστικής υπόθεσης, Κατά την εκτέλεση ενός στατιστικού ελέγχου,
ΗΛΕΚΤΡΙΚΕΣ ΜΕΤΡΗΣΕΙΣ ΣΦΑΛΜΑΤΑ ΜΕΤΡΗΣΗΣ.
Γραμμική Συσχέτιση, Απλή και Πολλαπλή Γραμμική Παλινδρόμηση (Εργαστήριο Σχολής Κοινωνικών Επιστημών)
Σήματα και Συστήματα 11 10η διάλεξη. Σήματα και Συστήματα 12 Εισαγωγικά (1) Έστω γραμμικό σύστημα που περιγράφεται από τη σχέση: Αν η είσοδος είναι γραμμικός.
Οικονομετρία Οικονομετρία ποσοτικοποιεί τις σχέσεις μεταξύ μεταβλητών με βάση και αιτιολόγηση τη σχετική οικονομική θεωρία έχει στόχο – όχι μόνο την.
ΤΕΙ Αθήνας: Σχολή ΤΕΦ: Τμήμα Ναυπηγικής Εφαρμογές Η/Υ στην Ναυπηγική ΙΙ ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ NA0703C39 Εξάμηνο Ζ’ Διδάσκων Κωνσταντίνος Β. Κώστας Παρουσίαση.
Δραματική Τέχνη στην εκπαίδευση: Ερευνητικό Σχέδιο Ι Στις ανθρωπιστικές επιστήμες επικράτησαν δύο ερευνητικές κατευθύνσεις: Η στατιστική ανάλυση (συνυπολογίζει.
ΔΙΑΛΕΞΗ 11η Ποσοτική έρευνα υγείας
ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ - ΑΣΥΜΜΕΤΡΙΑΣ - ΚΥΡΤΩΣΕΩΣ
Στατιστική Επαγωγή Ένα τεράστιο μέρος της έρευνας διενεργείται μέσω της ανάλυσης δειγμάτων προκειμένου να εξάγουμε συμπεράσματα για τον πληθυσμό. Αυτό.
Μεθοδολογία έρευνας και στατιστική – Δείγμα –Κατανομές
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ 1η Διάλεξη
Εισαγωγή στην Στατιστική
Έλεγχος για τη διαφορά μέσων τιμών μ1 και μ2 δύο πληθυσμών
Μεθοδολογία έρευνας και στατιστική – Δείγμα – Πληθυσμός
Πού χρησιμοποιείται ο συντελεστής συσχέτισης (r) pearson
Κανονικότητα Μια από τις υποθέσεις του υποδείγματος της γραμμικής παλινδρόμησης είναι ότι ο διαταρακτικός όρος κατανέμεται κανονικά με μέσο μηδέν και σταθερή.
Πολυσυγγραμμικότητα Εξειδίκευση
Έλεγχος υποθέσεων με την χ2 «χι -τετράγωνο» κατανομή
Πολυπαραγοντική γραμμική εξάρτηση
Σχεδιασμός των Μεταφορών
Η ΔΙΩΝΥΜΙΚΗ ΚΑΤΑΝΟΜΗ ΠΙΘΑΝΟΤΗΤΑΣ.
ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΟΡΓΑΝΩΝ ΜΕΤΡΗΣΗΣ
ΤΕΙ Δυτικής Μακεδονίας Τμήμα Λογιστικής & Χρηματοοικονομικής
ΚΑΤΑΝΟΜΕΣ Δ. Τσιπλακίδης
ΕπεξεργασΙα και ΑξιολΟγηση ΠειραματικΩν ΔεδομΕνων
Σχέση μεταξύ δυο ποσοτικών μεταβλητών & Μονοπαραγοντική γραμμική εξάρτηση 2017.
Επαγωγική Στατιστική Συσχέτιση – Συντελεστής συσχέτισης Χαράλαμπος Γναρδέλλης Τμήμα Τεχνολογίας Αλιείας και Υδατοκαλλιεργειών.
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Λογιστικής και Χρηματοοικονομικής
ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής
Τ. Ε. Ι. Αθήνας Τμήμα Ιατρικών Εργαστηρίων ΒΙΟΣΤΑΤΙΣΤΙΚΗ
ΤΕΙ Αθήνας Βιοστατιστική (Θ)
Μεθοδολογία Έρευνας Διάλεξη 9η: Ανάλυση Ποσοτικών Δεδομένων
Επαγωγική Στατιστική Συσχέτιση – Συντελεστές συσχέτισης Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
ΕΛΕΓΧΟΣ ΑΝΕΞΑΡΤΗΣΙΑΣ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ
Επαγωγική Στατιστική Γραμμική παλινδρόμηση-Linear Regression Χαράλαμπος Γναρδέλλης Εφαρμογές Πληροφορικής στην Αλιεία και τις Υδατοκαλλιέργειες.
Μεταγράφημα παρουσίασης:

Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης Κοινός στόχος ανάλυσης δεδομένων: Προσαρμογή εξίσωσης σε δεδομένα ή παλινδρόμηση Εξίσωση: αποτέλεσμα θεωρητικού ή εμπειρικού μοντέλου Διαδικασία: Προσαρμογή καμπύλης (curve fitting) ή παλινδρόμηση (regression) ή εκτίμηση παραμέτρων Μοντέλο τύπου: y = f(x) y: εξαρτημένη μεταβλητή, x: ανεξάρτητη μεταβλητή

Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης Τύποι μοντέλων: Γραμμικό μοντέλο: y = β0 + β1 x1 + β2 x2 Μη γραμμικό μοντέλο: y = θ1 * exp (-θ2*x) Γραμμικότητα αφορά στις ανεξάρτητες μεταβλητές x. Κατά άλλους, η γραμμικότητα αφορά και στις παραμέτρους β. Στατιστικές εκτιμήσεις των (πραγματικών τιμών) των παραμέτρων είναι οι συντελεστές: b1, b2,..... και k1, k2, ......

Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης yi = ηi + ei, i=1,2,.....n (αριθμός των πειραμάτων) Έστω οτι ισχύει το μοντέλο: η = β0 + β1x yi = ηi + ei = β0 + β1xi + ei με σφάλματα τα: ei = yi – β0 – β1xi Αν μοντέλο σωστό, τότε: ei = yi – ηi αποτέλεσμα τυχαίων πειραματικών σφαλμάτων μόνο. Συνεπώς, τα σφάλματα του μοντέλου (ei) περιέχουν διαγνωστική πληροφορία και πρέπει να είναι τυχαία, ανεξάρτητα και να κατανέμονται κανονικά.

Μέθοδος ελαχίστων τετραγώνων – Μεθοδολογία παλινδρόμησης S: Άθροισμα τετραγώνων σφαλμάτων ή υπολειμματικό άθροισμα τετραγώνων Καλύτερος συνδυασμός παραμέτρων ενός μοντέλου όταν: Min S = Στόχος: Ελαχιστοποίηση S Min S(β) => Θέτω 1η παράγωγο ίση με 0 και λύνω ως προς β (εκτίμηση του b):

Μέθοδος ελαχίστων τετραγώνων – Γραμμικό μοντέλο Έστω το γραμμικό μοντέλο (y = β * x) Min S(β) => Θέτω 1η παράγωγο ίση με 0 και λύνω ως προς β (εκτίμηση του b):

Μέθοδος ελαχίστων τετραγώνων – Μη γραμμικό μοντέλο Έστω το μη γραμμικό μοντέλο (η = e-θx) Δεν υπάρχει αλγεβρική λύση. Βρίσκεται με «δοκιμή και σφάλμα».

Μέθοδος ελαχίστων τετραγώνων – Δοκιμή και λάθος

Μέθοδος ελαχίστων τετραγώνων – Παράδειγμα δεδομένων πίνακα Γραμμικό μοντέλο: Μη γραμμικό μοντέλο: Τελικά: Προτεινόμενο γραμμικό μοντέλο: Προτεινόμενο μη γραμμικό μοντέλο:

Μέθοδος ελαχίστων τετραγώνων – Υπολογισμός ακρίβειας παραμέτρων Το σ2 εκτιμάται από το s2: n: αριθμός παρατηρήσεων (6 με βάση το άνω παράδειγμα) p: αριθμός εκτιμώμενων παραμέτρων (1 με βάση το άνω παράδειγμα) Τελικά, η διασπορά της παραμέτρου b είναι: Και το προτεινόμενο τυπικό σφάλμα του b είναι: Tο διάστημα εμπιστοσύνης του b είναι: Για ν = 5 και α=0.05, τότε t5,0.025 = 2.571 Διάστημα εμπιστοσύνης b: 0.1 ± 0.0046

Μέθοδος ελαχίστων τετραγώνων – Υπολογισμός ακρίβειας παραμέτρων

Συντελεστής απόφασης R2 Μοντέλο μαθηματικό με Μηδενικό μοντέλο (null model) Το ӯ είναι το απλούστερο μοντέλο, η μέση τιμή των τιμών των παρατηρήσεων yi

Συντελεστής απόφασης R2 Τελικά: R2 είναι λοιπόν συγκριτικό μοντέλο. Μεγάλες τιμές R2 ουσιαστικά δείχνουν πόσο το μοντέλο μας βελτιώνει το μηδενικό μοντέλο. R2 δεν φανερώνει πόσο καλό είναι το μοντέλο.

Συντελεστής απόφασης R2

Συντελεστής απόφασης R2 Παράδειγμα «άχρηστης» συσχέτισης με υψηλό συντελεστή συσχέτισης. Χ: οι 6 πρώτοι αριθμοί του π Υ: οι αριθμοί Fibonacci

Παράδειγμα ανούσιας συσχέτισης (δεδομένα Anscombe)

Συντελεστής απόφασης R2 Άλλο στατιστικά σημαντικό R2 και άλλο υψηλό R2 Στατιστική σημαντικότητα 1% σημαίνει οτι έχω μία πιθανότητα στις 100 να θεωρήσω κατά λάθος οτι οι μεταβλητές x,y συσχετίζονται όταν στην πραγματικότητα δεν σχετίζονται. Για το απλό γραμμικό μοντέλο: οι ελάχιστες απαιτούμενες τιμές R2 που καθορίζουν την αναγραφόμενη στατιστική σημαντικότητα εξαρτώνται από το αριθμό των μετρήσεων και είναι:

Συντελεστής απόφασης R2 Το R2 μειώνεται με μείωση του εύρους διακύμανσης (διασποράς) της ανεξάρτητης μεταβλητής x. Άρα, η μείωση του R2 δεν οφείλεται στη μείωση του αριθμού των μετρήσεων Παράδειγμα για απλό γραμμικό μοντέλο