Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Η παρουσίαση φορτώνεται. Παρακαλείστε να περιμένετε

Κεφάλαιο 12 Απλή Γραμμική Παλινδρόμηση.

Παρόμοιες παρουσιάσεις


Παρουσίαση με θέμα: "Κεφάλαιο 12 Απλή Γραμμική Παλινδρόμηση."— Μεταγράφημα παρουσίασης:

1 Κεφάλαιο 12 Απλή Γραμμική Παλινδρόμηση

2 Στόχοι Σε αυτό το κεφάλαιο μαθαίνετε:
Πώς να χρησιμοποιείτε την ανάλυση παλινδρόμησης για να προβλέψετε την τιμή μιας εξαρτημένης μεταβλητής με βάση την τιμή μιας ανεξάρτητης μεταβλητής Να κατανοείτε την σημασία των συντελεστών παλινδρόμησης b0 και b1 Να αξιολογείτε τις υποθέσεις της ανάλυσης παλινδρόμησης και να γνωρίζετε τι να κάνετε όταν οι υποθέσεις παραβιάζονται Να βγάζετε συμπεράσματα σχετικά με την κλίση και το συντελεστή συσχέτισης Να εκτιμάτε τις μέσες τιμές και να προβλέπετε τις μεμονωμένες τιμές

3 Συσχέτιση έναντι Παλινδρόμησης
DCOVA Ένα διάγραμμα διασποράς μπορεί να χρησιμοποιηθεί για να δείξει τη σχέση μεταξύ δύο μεταβλητών Η ανάλυση συσχέτισης χρησιμοποιείται για να μετρήσει την δύναμη της σχέσης (γραμμική σχέση) μεταξύ δύο μεταβλητών Η συσχέτιση αφορά μόνο τη δύναμη της σχέσης Καμία αιτιώδης επίδραση δεν συνεπάγεται συσχέτιση Τα διαγράμματα διασποράς παρουσιάστηκαν για πρώτη φορά στο Κεφ. 2 Η συσχέτιση παρουσιάστηκε για πρώτη φορά στο Κεφ. 3

4 Τύποι Σχέσεων DCOVA Γραμμικές σχέσεις Καμπυλόγραμμες σχέσεις Y Y X X Y

5 Τύποι Σχέσεων DCOVA (συνέχεια) Δυνατές σχέσεις Αδύναμες σχέσεις Y Y X

6 Τύποι Σχέσεων DCOVA (συνέχεια) Καμία σχέση Y X Y X

7 Εισαγωγή στην Ανάλυση Παλινδρόμησης
DCOVA Η Ανάλυση Παλινδρόμησης χρησιμοποιείται για να: Προβλέψει την τιμή μιας εξαρτημένης μεταβλητής με βάση την τιμή τουλάχιστον μιας ανεξάρτητης μεταβλητής Εξηγήσει την επίδραση των μεταβολών σε μια ανεξάρτητη μεταβλητή πάνω σε μια εξαρτημένη μεταβλητή Εξαρτημένη μεταβλητή: η μεταβλητή που επιθυμούμε να προβλέψουμε ή να εξηγήσουμε Ανεξάρτητη μεταβλητή: η μεταβλητή που χρησιμοποιείται για την πρόβλεψη ή την εξήγηση της εξαρτημένης μεταβλητής

8 Μοντέλο Απλής Γραμμικής Παλινδρόμησης
DCOVA Μόνο μία ανεξάρτητη μεταβλητή, X Η σχέση μεταξύ X και Y περιγράφεται από μια γραμμική συνάρτηση Μεταβολές στο Y θεωρείται οτι σχετίζονται με μεταβολές στο X

9 Μοντέλο Απλής Γραμμικής Παλινδρόμησης
DCOVA Όρος Τυχαίου Σφάλματος Συντελεστής Κλίσης Πληθυσμού Τεταγμένη του Y για τον πληθυσμό Ανεξάρτητη Μεταβλητή Εξαρτημένη Μεταβλητή Γραμμική συνιστώσα Συνιστώσα Τυχαίου Σφάλματος

10 Μοντέλο Απλής Γραμμικής Παλινδρόμησης
DCOVA (συνέχεια) Y Παρατηρούμενη τιμή του Y για Xi εi Κλίση = β1 Προβλεπόμενη τιμή του Y για Xi Τυχαίο Σφάλμα για αυτή την Xi τιμή Τεταγμένη (σταθερός όρος,σημείο τομής με τον Υ) = β0 Xi X

11 Εξίσωση Απλής Γραμμικής Παλινδρόμησης (Γραμμή Πρόβλεψης)
Εξίσωση Απλής Γραμμικής Παλινδρόμησης (Γραμμή Πρόβλεψης) DCOVA Η εξίσωση απλής γραμμικής παλινδρόμησης παρέχει μια εκτίμηση της γραμμής παλινδρόμησης πληθυσμού Εκτίμηση της τεταγμένης παλινδρόμησης Εκτίμηση της κλίσης παλινδρόμησης Εκτιμώμενη (ή προβλεπόμενη) Y τιμή για την παρατήρηση i Τιμη του X για την παρατήρηση i

12 Μέθοδος των Ελαχίστων Τετραγώνων
DCOVA Τα b0 και b1 προκύπτουν βρίσκοντας τις τιμές που ελαχιστοποιούν το άθροισμα των τετραγωνικών διαφορών μεταξύ Y και :

13 Εξίσωση Εύρεσης των Ελαχίστων Τετραγώνων
DCOVA Οι συντελεστές b0 και b1 και άλλα αποτελέσματα παλινδρόμησης σε αυτό το κεφάλαιο, θα βρεθούν με τη χρήση του Excel ή Minitab Οι τύποι εμφανίζονται στο κείμενο για όσους ενδιαφέρονται

14 Ερμηνεία της Κλίσης και της Τεταγμένης (Σημείου Τομής)
DCOVA Το b0 είναι η εκτιμώμενη μέση τιμή του Y όταν η τιμή του X είναι μηδέν Το b1 είναι η εκτιμώμενη μεταβολή της μέσης τιμής του Y ως αποτέλεσμα της αύξησης μιας μονάδας στο X

15 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης
DCOVA Ένας κτηματομεσίτης επιθυμεί να εξετάσει τη σχέση μεταξύ της τιμής πώλησης ενός σπιτιού και του μεγέθους του (που μετράται σε τετρ. πόδια) Επιλέγεται ένα τυχαίο δείγμα 10 κατοικιών Εξαρτημένη μεταβλητή (Y) = τιμή κατοικίας σε $1000s Ανεξάρτητη μεταβλητή (X) = τετραγωνικά πόδια

16 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Δεδομένα
Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Δεδομένα DCOVA Τιμή Κατοικίας σε $1000s (Y) Τετρ.Πόδια (X) 245 1400 312 1600 279 1700 308 1875 199 1100 219 1550 405 2350 324 2450 319 1425 255

17 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Διάγραμμα Διασποράς
Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Διάγραμμα Διασποράς DCOVA Μοντέλο Τιμής Κατοικίας: Διάγραμμα Διασποράς

18 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Χρήση Συνάρτησης Ανάλυσης Δεδομένων στο Excel
DCOVA 1. Επιλέξτε Data 2. Επιλέξτε Data Analysis 3. Επιλέξτε Regression

19 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Χρήση Συνάρτησης Ανάλυσης Δεδομένων στο Excel
(συνέχεια) Εισάγετε Y range και X range και τις επιθυμητές επιλογές DCOVA

20 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Χρήση PHStat
Add-Ins: PHStat: Regression: Simple Linear Regression

21 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Αποτέλεσμα στο Excel
DCOVA Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations 10 ANOVA df SS MS F Significance F Regression 1 Residual 8 Total 9 Coefficients t Stat P-value Lower 95% Upper 95% Intercept Square Feet Η εξίσωση παλινδρόμησης είναι: τιμή κατοικίας (τετρ. πόδια)

22 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Αποτέλεσμα στο Minitab
DCOVA Η εξίσωση παλινδρόμησης είναι: The regression equation is Price = Square Feet Predictor       Coef  SE Coef     T      P Constant       98.25        0.129 Square Feet        0.010 S =    R-Sq = 58.1%   R-Sq(adj) = 52.8% Analysis of Variance Source          DF     SS     MS      F      P Regression       1    18935  11.08  0.010 Residual Error  8     1708 Total              Τιμή κατοικίας = 98, ,10977 (τετρ.πόδια)

23 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Γραφική Αναπαράσταση
Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Γραφική Αναπαράσταση DCOVA Μοντέλο Τιμής Κατοικίας: Διάγραμμα Διαποράς και Γραμμή Πρόβλεψης Κλίση = 0,10977 Τεταγμένη = 98,248 Τιμή κατοικίας = 98, ,10977 (τετρ.πόδια)

24 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Ερμηνεία του bo
DCOVA Τιμή κατοικίας = 98, ,10977 (τετρ.πόδια) b0 είναι η εκτιμώμενη μέση τιμή του Y όταν η τιμή του X είναι μηδέν (Αν X = 0 είναι μέσα στο εύρος των παρατηρούμενων X τιμών) Επειδή ένα σπίτι δεν μπορεί να έχει τετραγωνικά μέτρα 0, το b0 δεν έχει πρακτική εφαρμογή

25 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Ερμηνεία του b1
DCOVA Τιμή κατοικίας = 98, ,10977 (τετρ.πόδια) Το b1 εκτιμά την μεταβολή στην μέση τιμή του Y ως αποτέλεσμα μιας αύξησης μιας μονάδας στο X Εδώ, b1 = 0,10977 μας λέει οτι η μέση τιμή ενός σπιτιού αυξάνεται κατά 0,10977($1000) = $109,77, κατά μέσο όρο, για κάθε επιπλέον τετραγωνικό πόδι

26 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Κάνοντας Προβλέψεις
DCOVA Προβλέψτε την τιμή για μια κατοικία 2000 τετρ. ποδιών: (τετρ. πόδια) τιμή κατοικίας Η προβλεπόμενη τιμή για μια κατοικία 2000 τετρ. ποδιών είναι 317,85($1.000s) = $

27 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Κάνοντας Προβλέψεις
DCOVA Όταν χρησιμοποιείτε ένα μοντέλο παλινδρόμησης για πρόβλεψη, προβλέπετε μόνο μέσα στο σχετικό εύρος των δεδομένων Σχετικό εύρος για παρεμβολή Μην προσπαθήσετε να κάνετε προβολή πέρα από το εύρος των παρατηρούμενων X

28 Μέτρα Μεταβλητότητας DCOVA
Η συνολική μεταβλητότητα αποτελείται από δύο μέρη: Συνολικό Άθροισμα Τετραγώνων Άθροισμα Τετραγώνων Παλινδρόμησης Άθροισμα Τετραγώνων των Σφαλμάτων όπου: = Μέση τιμή της εξαρτημένης μεταβλητής Yi = Παρατηρούμενη τιμή της εξαρτημένης μεταβλητής = Προβλεπόμενη τιμή του Y για τη δεδομένη τιμή Xi

29 Μέτρα Μεταβλητότητας DCOVA
(συνέχεια) DCOVA SST = συνολ. άθροισμα τετραγώνων (Συνολική Μεταβλητότητα) Μετρά την μεταβλητότητα των τιμών Yi γύρω από τους μέσους Y SSR = άθροισμα τετραγώνων παλινδρόμησης (Μεταβλητότητα που εξηγείται από το μοντέλο) Μεταβλητότητα που μπορεί να αποδοθεί στην σχέση μεταξύ X και Y SSE = άθροισμα τετραγώνων των σφαλμάτων (Μεταβλητότητα που δεν εξηγείται από το μοντέλο) Μεταβλητότητα του Y που αποδίδεται σε παράγοντες άλλους από το X

30 Μέτρα Μεταβλητότητας _ Y Yi _ _ _ Y Y X DCOVA   Y SSE = (Yi - Yi )2
(συνέχεια) DCOVA Y Yi Y SSE = (Yi - Yi )2 _ SST = (Yi - Y)2 _ Y _ SSR = (Yi - Y)2 _ Y Y X Xi

31 Συντελεστής Προσδιορισμού, r2
DCOVA Ο συντελεστής προσδιορισμού είναι το τμήμα της συνολικής μεταβλητότητας στην εξαρτημένη μεταβλητή που εξηγείται από την μεταβλητότητα της ανεξάρτητης μεταβλητής Ο συντελεστής προσδιορισμού καλείται επίσης r-τετράγωνο και συμβολίζεται ως r2 άθροισμα τετραγώνων παλινδρόμησης συνολικό άθροισμα τετραγώνων Σημειώστε:

32 Παραδείγματα Προσεγγιστικών r2 Τιμών
DCOVA Y Ισχυρή γραμμική σχέση μεταξύ X και Y: 100% της μεταβλητότητας του Y εξηγείται από την μεταβλητότητα του X X r2 = 1 Y X r2 = 1

33 Παραδείγματα Προσεγγιστικών r2 Τιμών
DCOVA Y 0 < r2 < 1 Πιο αδύναμες γραμμικές σχέσεις μεταξύ X και Y: Ορισμένες αλλά όχι όλες οι μεταβλητότητες στο Y εξηγούνται από την μεταβλητότητα στο X X Y X

34 Παραδείγματα Προσεγγιστικών r2 Τιμών
DCOVA r2 = 0 Y Δεν υπάρχει γραμμική σχέση μεταξύ X και Y: Η τιμή του Y δεν εξαρτάται από το X. (Καμία από τις μεταβλητότητες του Y δεν εξηγείται από τη μεταβλητότητα στο X) X r2 = 0

35 Regression Statistics
Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Συντελεστής Προσδιορισμού, r2 στο Excel DCOVA Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations 10 ANOVA df SS MS F Significance F Regression 1 Residual 8 Total 9 Coefficients t Stat P-value Lower 95% Upper 95% Intercept Square Feet Το 58,08% της μεταβλητότητας στις τιμές των κατοικιών εξηγείται από τη μεταβλητότητα στα τετρ.πόδια

36 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Συντελεστής Προσδιορισμού, r2 στο Minitab
DCOVA The regression equation is Price = Square Feet Predictor       Coef  SE Coef     T      P Constant       98.25        0.129 Square Feet        0.010 S =    R-Sq = 58.1%   R-Sq(adj) = 52.8% Analysis of Variance Source          DF     SS     MS      F      P Regression       1    18935  11.08  0.010 Residual Error  8     1708 Total              Το 58,08% της μεταβλητότητας στις τιμές των κατοικιών εξηγείται από την μεταβλητότητα στα τετρ.πόδια

37 Τυπικό Σφάλμα της Εκτίμησης
DCOVA Η τυπική απόκλιση της μεταβλητότητας των παρατηρήσεων γύρω από τη γραμμή παλινδρόμησης υπολογίζεται από την Όπου SSE = άθροισμα τετραγώνων των σφαλμάτων n = μέγεθος δείγματος

38 Regression Statistics
Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Τυπικό Σφάλμα της Εκτίμησης στο Excel DCOVA Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations 10 ANOVA df SS MS F Significance F Regression 1 Residual 8 Total 9 Coefficients t Stat P-value Lower 95% Upper 95% Intercept Square Feet

39 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Τυπικό Σφάλμα Εκτίμησης στο Minitab
DCOVA The regression equation is Price = Square Feet Predictor       Coef  SE Coef     T      P Constant       98.25        0.129 Square Feet        0.010 S =    R-Sq = 58.1%   R-Sq(adj) = 52.8% Analysis of Variance Source          DF     SS     MS      F      P Regression       1    18935  11.08  0.010 Residual Error  8     1708 Total             

40 Σύγκριση Τυπικών Σφαλμάτων
DCOVA Το SYX είναι ένα μέτρο μεταβλητότητας των παρατηρούμενων τιμών Y από την γραμμή παλινδρόμησης Y Y X X Το μέγεθος του SYX θα πρέπει πάντα να κρίνεται σε σχέση με το μέγεθος των τιμών Y στα δεδομένα του δείγματος δηλ. το SYX = $41,33K είναι αρκετά μικρό σε σχέση με τις τιμές των κατοικιών στο εύρος $200K - $400K

41 Υποθέσεις Παλινδρόμησης L.I.N.E
DCOVA Γραμμικότητα Η σχέση μεταξύ X και Y είναι γραμμική Ανεξαρτησία των Σφαλμάτων Οι τιμές των σφαλμάτων είναι στατιστικά ανεξάρτητες Ιδιαίτερα σημαντική όταν τα δεδομένα συλλέγονται κατά τη διάρκεια μιας χρονικής περιόδου Κανονικότητα Σφάλματος Οι τιμές σφαλμάτων κατανέμονται κανονικά για κάθε δεδομένη τιμή του X Ίσων διασπορών (καλείται επίσης και ομοσκεδαστικότητα) Η κατανομή πιθανότητας των σφαλμάτων έχει σταθερή διασπορά

42 Ανάλυση Καταλοίπων DCOVA
Το κατάλοιπο για την παρατήρηση i, ei, είναι η διαφορά μεταξύ της παρατηρούμενης και της προβλεπόμενης τιμής του Ελέγχετε τις υποθέσεις παλινδρόμησης εξετάζοντας τα κατάλοιπα Εξετάζετε για την υπόθεση γραμμικότητας Αξιολογείτε την υπόθεση ανεξαρτησίας Αξιολογείτε την υπόθεση κανονικής κατανομής Εξετάζετε για σταθερή διασπορά για όλα τα επίπεδα του X (ομοσκεδαστικότητα) Γραφική Ανάλυση Καταλοίπων Μπορείτε να σχεδιάσετε τα κατάλοιπα σε σχέση με το X

43 Ανάλυση Καταλοίπων για Γραμμικότητα
DCOVA Y Y x x κατάλοιπα κατάλοιπα x x Μη γραμμική Γραμμική

44  Ανάλυση Καταλοίπων για Ανεξαρτησία DCOVA Κυκλικό Μοτίβο:
Όχι Ανεξάρτητα Μη Κυκλικό Μοτίβο Ανεξάρτητα κατάλοιπα X κατάλοιπα X κατάλοιπα X

45 Έλεγχος για Κανονικότητα
DCOVA Εξετάζετε το Φυλλογράφημα των Καταλοίπων Εξετάζετε το Θηκόγραμμα των Καταλοίπων Εξετάζετε το Ιστόγραμμα των Καταλοίπων Κατασκευάζετε ένα Διάγραμμα Πιθανοτήτων των Καταλοίπων

46 Ανάλυση Καταλοίπων για Κανονικότητα
DCOVA Όταν χρησιμοποιείτε ένα διάγραμμα πιθανοτήτων, τα κανονικά σφάλματα θα εμφανίζονται κατά προσέγγιση σε ευθεία γραμμή Ποσοστό 100 Κατάλοιπα

47 Ανάλυση Καταλοίπων για Ίση Διασπορά
DCOVA Y Y x x κατάλοιπα x κατάλοιπα x Σταθερή διασπορά Μη σταθερή διασπορά

48 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Αποτέλεσμα Καταλοίπων στο Excel
DCOVA ΑΠΟΤΕΛΕΣΜΑ ΚΑΤΑΛΟΙΠΩΝ ΠΡΟΒΛΕΠΟΜΕΝΗ ΤΙΜΗ ΚΑΤΟΙΚΙΑΣ ΚΑΤΑΛΟΙΠΑ 1 251,92316 -6,923162 2 273,87671 38,12329 3 284,85348 -5,853484 4 304,06284 3,937162 5 218,99284 -19,99284 6 268,38832 -49,38832 7 356,20251 48,79749 8 367,17929 -43,17929 9 254,6674 64,33264 10 -29,85348 Δεν φαίνεται να παραβιάζεται κάποια από τις υποθέσεις παλινδρόμησης

49 Παράδειγμα Απλής Γραμμικής Παλινδρόμησης: Αποτέλεσμα Καταλοίπων στο Minitab
DCOVA Δεν φαίνεται να παραβιάζεται κάποια από τις υποθέσεις παλινδρόμησης

50 Μέτρηση Αυτοσυσχέτισης: Το Στατιστικό Durbin-Watson
DCOVA Χρησιμοποιείται όταν τα δεδομένα συλλέγονται με την πάροδο του χρόνου για να ανιχνεύσουν αν υπάρχει αυτοσυσχέτιση Η αυτοσυσχέτιση υπάρχει αν τα κατάλοιπα σε μία χρονική περίοδο σχετίζονται με κατάλοιπα άλλης περιόδου

51 Αυτοσυσχέτιση DCOVA Η αυτοσυσχέτιση είναι συσχέτιση των σφαλμάτων (κατάλοιπα) με την πάροδο του χρόνου Εδώ, τα κατάλοιπα δείχνουν ένα κυκλικό μοτίβο, όχι τυχαίο. Τα κυκλικά μοτίβα αποτελούν ένδειξη θετικής αυτοσυσχέτισης Παραβιάζει την υπόθεση παλινδρόμησης οτι τα κατάλοιπα είναι τυχαία και ανεξάρτητα

52 Το Στατιστικό Durbin-Watson
DCOVA Το στατιστικό Durbin-Watson χρησιμοποιείται για τον έλεγχο της αυτοσυσχέτισης H0: δεν υπάρχει θετική αυτοσυσχέτιση H1: υπάρχει θετική αυτοσυσχέτιση Το πιθανό εύρος είναι 0 ≤ D ≤ 4 Το D θα πρέπει να είναι κοντά στο 2 αν η H0 είναι αληθής D μικρότερο του 2 μπορεί να σηματοδοτήσει θετική αυτοσυσχέτιση, D μεγαλύτερο του 2 μπορεί να σηματοδοτήσει αρνητική αυτοσυσχέτιση

53 Έλεγχος για Θετική Αυτοσυσχέτιση
DCOVA H0: δεν υπάρχει θετική αυτοσυσχέτιση H1: υπάρχει θετική αυτοσυσχέτιση Υπολογισμός της στατιστικής συνάρτησης ελέγχου Durbin-Watson = D (Το Στατιστικό Durbin-Watson μπορεί να βρεθεί με τη χρήση του Excel ή Minitab) Βρείτε τις τιμές dL και dU από τον πίνακα Durbin-Watson (για μέγεθος δείγματος n και αριθμό ανεξάρτητων μεταβλητών k) Κανόνας Απόφασης: Απόρριψη της H0 αν D < dL Απόρριψη της H0 Ασαφές Μη απόρριψη της H0 dL dU 2

54 Έλεγχος για Θετική Αυτοσυσχέτιση
(συνέχεια) DCOVA Ας υποθέσουμε οτι έχουμε τα ακόλουθα δεδομένα χρονολογικών σειρών: Υπάρχει αυτοσυσχέτιση;

55 Έλεγχος για Θετική Αυτοσυσχέτιση
(συνέχεια) DCOVA Παράδειγμα με n = 25: Αποτελέσματα στο Excel/PHStat: Durbin-Watson Calculations Sum of Squared Difference of Residuals 3296,18 Sum of Squared Residuals 3279,98 Durbin-Watson Statistic 1,00494

56 Έλεγχος για Θετική Αυτοσυσχέτιση
(συνέχεια) DCOVA Εδώ, n = 25 και υπάρχει k = 1 μία ανεξάρτητη μεταβλητή Χρησιμοποιώντας τον πίνακα Durbin-Watson, dL = 1,29 και dU = 1,45 D = 1,00494 < dL = 1,29, έτσι απορρίπτεται η H0 και συμπεραίνετε οτι υπάρχει σημαντική θετική αυτοσυσχέτιση Απόφαση: απορρίπτεται η H0 αφού D = 1,00494 < dL Απόρριψη της H0 Ασαφές Μη απόρριψη της H0 dL=1,29 dU=1,45 2

57 Συμπεράσματα Σχετικά με την Κλίση
DCOVA Το τυπικό σφάλμα του συντελεστή κλίσης παλινδρόμησης (b1) υπολογίζεται από: όπου: = Εκτίμηση του τυπικού σφάλματος της κλίσης = Τυπικό σφάλμα της εκτίμησης

58 Συμπεράσματα Σχετικά με την Κλίση: Έλεγχος t
DCOVA Έλεγχος t για την κλίση πληθυσμού Υπάρχει γραμμική σχέση μεταξύ X και Y; Μηδενική και εναλλακτική υπόθεση H0: β1 = 0 (δεν υπάρχει γραμμική σχέση) H1: β1 ≠ 0 (υπάρχει γραμμική σχέση) Στατιστική Συνάρτηση Ελέγχου όπου: b1 = συντελεστής κλίσης παλινδρόμησης β1 = υποθετική κλίση Sb1 = τυπικό σφάλμα της κλίσης

59 Συμπεράσματα Σχετικά με την Κλίση: Παράδειγμα Ελέγχου t
DCOVA Εξίσωση Εκτιμώμενης Παλινδρόμησης: Τιμή Κατοικίας σε $1000s (y) Τετρ.Πόδια (x) 245 1400 312 1600 279 1700 308 1875 199 1100 219 1550 405 2350 324 2450 319 1425 255 τιμή κατοικίας = 98,25 + 0,1098 (τετρ.πόδια) Η κλίση αυτού του μοντέλου είναι 0,1098 Υπάρχει σχέση μεταξύ των τετρ.ποδιών της κατοικίας και της τιμής πώλησης;

60 Συμπεράσματα Σχετικά με την Κλίση: Παράδειγμα Ελέγχου t
DCOVA H0: β1 = 0 H1: β1 ≠ 0 Από τα αποτελέσματα στο Excel : Coefficients Standard Error t Stat P-value Intercept 98,24833 58,03348 1,69296 0,12892 Square Feet 0,10977 0,03297 3,32938 0,01039 Από τα αποτελέσματα στο Minitab: b1 Predictor       Coef  SE Coef     T      P Constant       98,25    58,03  ,69  0,129 Square Feet  0,10977  0,03297  3,33  0,010 b1

61 Συμπεράσματα Σχετικά με την Κλίση: Παράδειγμα Ελέγχου t
DCOVA H0: β1 = 0 H1: β1 ≠ 0 Στατιστική Συνάρτηση Ελέγχου: tSTAT = 3,329 β.ε:d.f. = = 8 Απόφαση: Απόρριψη της H0 a/2=,025 a/2=,025 Υπάρχουν επαρκή στοιχεία οτι τα τετρ. πόδια επηρεάζουν την τιμή της κατοικίας Απόρριψη της H0 Μη απόρριψη της H0 Απόρριψη της H0 -tα/2 tα/2 -2,3060 2,3060 3,329

62 Συμπεράσματα Σχετικά με την Κλίση: Παράδειγμα Ελέγχου t
DCOVA H0: β1 = 0 H1: β1 ≠ 0 Από τα αποτελέσματα στο Excel : Coefficients Standard Error t Stat P-value Intercept Square Feet Από τα αποτελέσματα στο Minitab: Predictor       Coef  SE Coef     T      P Constant       98.25        0.129 Square Feet        0.010 p-τιμή Απόφαση: Απορρίπτεται η H0, αφού p-τιμή < α Υπάρχουν επαρκή στοιχεία οτι τα τετρ.πόδια επηρεάζουν την τιμή της κατοικίας.

63 Έλεγχος F για την Σημαντικότητα
DCOVA Στατιστική Συνάρτηση Ελέγχου F: όπου Όπου η FSTAT ακολουθεί μια κατανομή F με k στον αριθμητή και (n – k - 1) στον παρονομαστή βαθμούς ελευθερίας (k = ο αριθμός των ανεξάρτητων μεταβλητών στο μοντέλο παλινδρόμησης)

64 Έλεγχος F για τη Σημαντικότητα Αποτελέσματα στο Excel
DCOVA Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations 10 ANOVA df SS MS F Significance F Regression 1 Residual 8 Total 9 Με 1 και 8 βαθμούς ελευθερίας p-τιμή για τον F-Έλεγχο

65 Έλεγχος F για τη Σημαντικότητα Αποτελέσματα στο Minitab
DCOVA Analysis of Variance Source          DF     SS     MS      F      P Regression       1    18935  11.08  0.010 Residual Error  8     1708 Total            9  p-τιμή για τον F-Έλεγχο Με 1 και 8 βαθμούς ελευθερίας

66 Έλεγχος F για την Σημαντικότητα
(συνέχεια) DCOVA Στατιστική Συνάρτηση Ελέγχου: Απόφαση: Συμπέρασμα: H0: β1 = 0 H1: β1 ≠ 0  = .05 β.ε: df1= df2 = 8 Απόρριψη της H0 σε  = 0,05 Κρίσιμη Τιμή: F = 5,32  = ,05 Υπάρχουν επαρκή στοιχεία οτι το μέγεθος της κατοικίας επηρεάζει την τιμή πώλησης F Μη απόρριψη της H0 Απόρριψη της H0 F,05 = 5,32

67 Εκτίμηση Διαστήματος Εμπιστοσύνης για την Κλίση
Εκτίμηση Διαστήματος Εμπιστοσύνης για την Κλίση DCOVA Εκτίμηση Διαστήματος Εμπιστοσύνης της Κλίσης: β.ε: d.f. = n - 2 Εκτύπωση για τις Τιμές Κατοικιών στο Excel: Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept Square Feet Σε 95% επίπεδο σημαντικότητας, το διάστημα εμπιστοσύνης για την κλίση είναι (0,0337, 0,1858)

68 Εκτίμηση Διαστήματος Εμπιστοσύνης για την Κλίση
Εκτίμηση Διαστήματος Εμπιστοσύνης για την Κλίση (συνέχεια) DCOVA Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept Square Feet Εφόσον οι μονάδες της μεταβλητής για την τιμή κατοικίας είναι $1000s, είμαστε 95% σίγουροι οτι η μέση επίδραση στην τιμή πώλησης είναι μεταξύ $33,74 και $185,80 ανά τετρ.πόδι του μεγέθους του σπιτιού Αυτό το 95% διάστημα εμπιστοσύνης δεν περιλαμβάνει το 0. Συμπέρασμα: Υπάρχει σημαντική σχέση μεταξύ της τιμής κατοικίας και τετρ.ποδιών σε 0,05 επίπεδο σημαντικότητας

69 Εκτίμηση Διαστήματος Εμπιστοσύνης για την Κλίση από το Minitab
(συνέχεια) DCOVA Το Minitab δεν υπολογίζει αυτόματα ένα διάστημα εμπιστοσύνης για την κλίση αλλά παρέχει τα απαραίτητα ποσά για να χρησιμοποιήσετε τον τύπο του διαστήματος εμπιστοσύνης. Predictor       Coef  SE Coef     T      P Constant       98.25        0.129 Square Feet        0.010

70 Έλεγχος t για τον Συντελεστή Συσχέτισης
DCOVA Υποθέσεις H0: ρ = 0 (δεν υπάρχει συσχέτιση μεταξύ X και Y) H1: ρ ≠ 0 (υπάρχει συσχέτιση) Στατιστική Συνάρτηση Ελέγχου (με n – 2 βαθμούς ελευθερίας)

71 Έλεγχος t Για Έναν Συντελεστή Συσχέτισης
(συνέχεια) DCOVA Υπάρχει ένδειξη γραμμικής σχέσης μεταξύ των τετρ.ποδιών και της τιμής κατοικίας σε 0,05 επίπεδο σημαντικότητας; H0: ρ = 0 (Δεν υπάρχει συσχέτιση) H1: ρ ≠ 0 (Υπάρχει συσχέτιση)  =0,05 , β.ε: df = = 8

72 Έλεγχος t Για Έναν Συντελεστή Συσχέτισης
(συνέχεια) DCOVA Απόφαση: Απόρριψη της H0 Συμπέρασμα: Υπάρχει ένδειξη γραμμικής σχέσης στο 5% επίπεδο σημαντικότητας β.ε: d.f. = 10-2 = 8 a/2=0,025 a/2=0,025 Απόρριψη της H0 Μη απόρριψη της H0 Απόρριψη της H0 -tα/2 tα/2 -2,3060 2,3060 3,329

73 Εκτιμώντας Μέσες Τιμές και Προβλέποντας Μεμονωμένες Τιμές
DCOVA Στόχος: Διαμορφώστε διαστήματα γύρω από το Y για να εκφράσετε αβεβαιότητα σχετικά με την τιμή του Y για ένα δεδομένο Xi Διάστημα Εμπιστοσύνης για τον μέσο του Y, δεδομένου του Xi Y Y Y = b0+b1Xi Διάστημα Πρόβλεψης για ένα μεμονωμένο Y, δεδομένου Xi Xi X

74 Διάστημα Εμπιστοσύνης για το Μέσο Όρο Y, Δεδομένου του X
DCOVA Εκτίμηση διαστήματος εμπιστοσύνης για την μέση τιμή του Y δεδομένου ενός συγκεκριμένου Xi Διάστημα Εμπιστοσύνης για Το μέγεθος του διαστήματος διαφέρει ανάλογα με την απόσταση από τον μέσο , X

75 Διάστημα Πρόβλεψης για ένα Μεμονωμένο Y, Δεδομένου του X
DCOVA Εκτίμηση διαστήματος εμπιστοσύνης για μια Μεμονωμένη Τιμή του Y δεδομένου ενός συγκεκριμένου Xi Διάστημα Εμπιστοσύνης για Αυτός ο επιπλέον όρος προσθέτει εύρος στο διάστημα για να εκφράσει την επιπλέον αβεβαιότητα για μια μεμονωμένη περίπτωση

76 Εκτίμηση των Μέσων Τιμών: Παράδειγμα
DCOVA Εκτίμηση Διαστήματος Εμπιστοσύνης για μY|X=X i Βρείτε το 95% διάστημα εμπιστοσύνης για την μέση τιμή των κατοικιών τετρ.ποδιών Προβλεπόμενη Τιμή Yi = 317,85 ($1.000s) Τα άκρα του διαστήματος εμπιστοσύνης (από το Excel) είναι 280,66 και 354,90, ή από $ εως $

77 Εκτίμηση Μεμονωμένων Τιμών: Παράδειγμα
DCOVA Εκτίμηση διαστήματος πρόβλεψης για YX=X i Βρείτε το 95% διάστημα πρόβλεψης για ένα συγκεκριμένο σπίτι με τετρ.πόδια Προβλεπόμενη Τιμή Yi = 317,85 ($1.000s) Τα άκρα του διαστήματος πρόβλεψης από το Excel είναι 215,50 και 420,07, ή από $ εως $

78 Εύρεση Διαστημάτων Εμπιστοσύνης και Πρόβλεψης στο Excel
DCOVA Από το Excel, χρησιμοποιήστε PHStat | regression | simple linear regression … Τικάρετε το κουτί “confidence and prediction interval for X=” και εισάγετε την επιθυμητή τιμή Χ (X-value) και επίπεδο εμπιστοσύνης (confidence level)

79 Εύρεση Διαστημάτων Εμπιστοσύνης και Πρόβλεψης στο Excel
(συνέχεια) DCOVA Εισαγόμενες τιμές Y Εκτίμηση διαστήματος εμπιστοσύνης για μY|X=Xi Εκτίμηση διαστήματος πρόβλεψης για YX=Xi

80 Εύρεση Διαστημάτων Εμπιστοσύνης και Πρόβλεψης στο Minitab
DCOVA Εκτίμηση διαστήματος εμπιστοσύνης για μY|X=Xi Predicted Values for New Observations New Obs    Fit  SE Fit      95% CI          95% PI   1  317.8    16.1  (280.7, 354.9)  (215.5, 420.1)    Values of Predictors for New Observations New  Square Obs    Feet   1    Y Εκτίμηση διαστήματος πρόβλεψης για YX=Xi Εισαγόμενη τιμή(ες)

81 Παγίδες στην Ανάλυση Παλινδρόμησης
Έλλειψη γνώσεων των υποθέσεων των ελαχίστων τετραγώνων της παλινδρόμησης Οτι δεν γνωρίζετε πώς να αξιολογήσετε τις υποθέσεις των ελαχίστων τετραγώνων της παλινδρόμησης Οτι δεν γνωρίζετε εναλλακτικές των ελαχίστων τετραγώνων παλινδρόμησης αν παραβιάζεται μια συγκεκριμένη υπόθεση Η χρήση μοντέλου παλινδρόμησης δίχως γνώση του αντικειμένου που εφαρμόζεται Η προβολή έξω από το σχετικό εύρος Συμπεραίνοντας οτι η σημαντική σχέση που παρατηρείται σε μια μελέτη παρατήρησης οφείλεται σε μια σχέση αιτίου-αποτελέσματος

82 Στρατηγικές για την Αποφυγή των Παγίδων στην Παλινδρόμηση
Ξεκινήστε με ένα διάγραμμα διασποράς του X σε σχέση με το Y για να παρατηρήσετε πιθανή σχέση Εκτελέστε ανάλυση καταλοίπων για να ελέγξετε τις υποθέσεις Σχεδιάστε τα κατάλοιπα έναντι του X για να ελέγξετε παραβιάσεις των υποθέσεων όπως η ομοσκεδαστικότητα Χρησιμοποιήστε ένα ιστόγραμμα, φυλλογράφημα, θηκόγραμμα, ή διάγραμμα πιθανοτήτων των καταλοίπων για να αποκαλύψετε πιθανή μη-κανονικότητα

83 Στρατηγικές για την for Αποφυγή των Παγίδων στην Παλινδρόμηση
(συνέχεια) Αν υπάρχει παραβίαση κάποιας υπόθεσης, χρησιμοποιήστε εναλλακτικές μεθόδους ή μοντέλα Αν δεν υπάρχει ένδειξη παραβίασης των υποθέσεων, τότε πραγματοποιήστε ελέγχους για την σημασία των συντελεστών παλινδρόμησης και κατασκευάστε διαστήματα εμπιστοσύνης και διαστήματα πρόβλεψης Αποφύγετε να κάνετε προβλέψεις ή προγνώσεις έξω από το σχετικό εύρος Να θυμάστε οτι οι σχέσεις που υπάρχουν στις μελέτες παρατηρήσεων ενδέχεται να οφείλονται ή να μην οφείλονται σε σχέσεις αιτίου-αποτελέσματος.

84 Περίληψη Κεφαλαίου Σε αυτό το κεφάλαιο αναλύσαμε:
Πώς χρησιμοποιείται η ανάλυση παλινδρόμησης για την πρόβλεψη της τιμής μιας εξαρτημένης μεταβλητής με βάση την τιμή μιας ανεξάρτητης μεταβλητής Την κατανόηση της σημασίας των συντελεστών παλινδρόμησης b0 και b1 Την αξιολόγηση των υποθέσεων της ανάλυσης παλινδρόμησης καθώς και τι πρέπει να γίνεται όταν οι υποθέσεις παραβιάζονται Την εξαγωγή συμπερασμάτων σχετικά με την κλίση και το συντελεστή συσχέτισης Την εκτίμηση των μέσων τιμών και την πρόβλεψη των μεμονωμένων τιμών


Κατέβασμα ppt "Κεφάλαιο 12 Απλή Γραμμική Παλινδρόμηση."

Παρόμοιες παρουσιάσεις


Διαφημίσεις Google