CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH CHƯƠNG 9 CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH
CHỌN MÔ HÌNH Biết cách tiếp cận để lựa chọn mô hình Biết cách kiểm định việc chọn mô hình MỤC TIÊU
NỘI DUNG 1 Chọn mô hình- Các sai lầm khi chọn mô hình 2 Cách tiếp cận để lựa chọn mô hình 3 Kiểm định việc chọn mô hình 4
Chọn mô hình và kiểm định chọn mô hình - Tiết kiệm: Mô hình đơn giản nhưng phải chứa các biến chủ yếu ảnh hưởng đến biến phụ thuộc nhằm giải thích bản chất của vấn đề nghiên cứu. - Tính đồng nhất: Với một tập dữ liệu đã cho, các tham số ước lượng phải duy nhất. Tính thích hợp (R2): Mô hình có R2 ( hoặc càng gần 1 được coi càng thích hợp. - Tính bền vững về mặt lý thuyết: mô hình phải phù hợp với lý thuyết nền tảng. - Khả năng dự báo cao
Bỏ sót biến thích hợp: dẫn đến một số hậu quả như 2. Các sai lầm khi chọn mô hình- Hậu quả Bỏ sót biến thích hợp: dẫn đến một số hậu quả như Các tham số ước lượng sẽ bị chệch và không vững. Khoảng tin cậy và các kiểm định không chính xác. Dự báo dựa trên mô hình sai sẽ không đáng tin cậy.
Đưa vào mô hình những biến không phù hợp: 2. Các sai lầm khi chọn mô hình- Hậu quả Đưa vào mô hình những biến không phù hợp: các ước lượng thu được từ mô hình thừa biến không hiệu quả, khoảng tin cậy rộng.
Lựa chọn mô hình không chính xác: 2. Các sai lầm khi chọn mô hình- Hậu quả Lựa chọn mô hình không chính xác: Ước lượng chệch các hệ số hồi quy, thậm chí dấu của hệ số hồi quy có thể sai. Có ít hệ số hồi quy ước lượng được có ý nghĩa thống kê R2 không cao Phần dư các quan sát lớn và biểu thị sự biến thiên có tính hệ thống.
Về hàm chi phí của doanh nghiệp, dạng hàm đúng Ví dụ Về hàm chi phí của doanh nghiệp, dạng hàm đúng Yi = b1 + b2Xi + b3Xi2 + b4Xi3 + u1i Bỏ sót biến quan trọng (Xi3): Yi = a1 + a2Xi + a3Xi2 + u2i Đưa biến không liên quan vào mô hình (Xi4): Yi = l1 + l2Xi + l3Xi2 + l4Xi3 + l5Xi4 + u3i Dạng hàm sai. lnY = g1 + g2Xi + g3Xi2 + g4Xi3 + u4i
Cách tiếp cận để lưa chọn mô hình Xác định số biến độc lập: có hai hướng tiếp cận: Từ đơn giản đến tổng quát: bổ sung biến độc lập từ từ vào mô hình Từ tổng quát đến đơn giản: Xét mô hình hồi quy có đầy đủ các biến độc lập đã được xác định, sau đó loại trừ những biến không quan trọng ra khỏi mô hình 2. Kiểm định mô hình có vi phạm giả thiết như đa cộng tuyến, phương sai thay đổi, tự tương quan. Nếu mô hình vi phạm thì cần có biện pháp khắc phục. 3. Chọn dạng hàm; dựa vào Các lý thuyết kinh tế Các kết quả nghiên cứu thực nghiệm 4. Sử dụng các tiêu chuẩn thông dụng để chọn mô hình
Kiểm định việc chọn mô hình a. Kiểm định thừa biến (kiểm định Wald) Xét hai mô hình: (U): mô hình không bị ràng buộc (Unrestricted model) (R): mô hình bị ràng buộc (Restricted model). Điều kiện ràng buộc là các hệ số hồi quy của các biến Xm , Xm+1 , Xk đồng thời bằng 0
Xây dựng giả thiết để kiểm định đk ràng buộc a. Kiểm định Wald Xây dựng giả thiết để kiểm định đk ràng buộc H1: có ít nhất một khác 0 B1: Hồi quy mô hình (U) có k tham số, tính RSSU có n-k bậc tự do B2: Hồi quy mô hình (R) có m tham số, tính RSSR có n-m bậc tự do B3: Tính F
B4: Tra bảng F với mức ý nghĩa α có giá trị Fα (k-m, n-k) a. Kiểm định Wald B4: Tra bảng F với mức ý nghĩa α có giá trị Fα (k-m, n-k) Quy tắc quyết định: Nếu F> Fα (k-m, n-k): bác bỏ Ho, tức mô hình (U) không thừa biến. Nếu dùng kết quả p-value thì quy tắc quyết định như sau: Nếu p ≤ : Bác bỏ H0 Nếu p > : Chấp nhận H0
b. Kiểm định bỏ sót biến giải thích Để kiểm định các biến giải thích bỏ sót, ta dùng kiểm định Reset của Ramsey, gồm các bước: Bước 1: Dùng OLS để ước lượng mô hình Yi = 1 + 2X2i + ui Từ đó ta tính và R2old Bước 2: dùng OLS để ước lượng mô hình Tính R2new Kiểm định giả thiết H0: 3 = 4 =… = k = 0
b. Kiểm định bỏ sót biến giải thích Bước 3: Tính n: số quan sát, k: số tham số trong mô hình mới; m: số biến đưa thêm vào. Bước 4: Nếu F > F(m,n-k): Bác bỏ H0, tức các hệ số 3,4,…k không đồng thời bằng 0, mô hình cũ đã bỏ sót biến. Nếu dùng kết quả p-value thì quy tắc quyết định như sau: Nếu p ≤ : Bác bỏ H0 Nếu p > : Chấp nhận H0
Kiểm định giả thiết H0: ui có phân phối chuẩn c. Kiểm định giả thiết phân phối chuẩn của ui Để kiểm định phân phối chuẩn của Ui, ta dùng kiểm định χ2, hay kiểm định Jarque-Bera: Kiểm định giả thiết H0: ui có phân phối chuẩn Nếu JB > χ2, Bác bỏ H0, ngược lại, chấp nhận H0
Tiêu chuẩn lựa chọn mô hình R2, R2 điều chỉnh, Giá trị của hàm hợp lý log-likelihood (L), Tiêu chuẩn thông tin Akaike (AIC), Tiêu chuẩn thông tin Schwarz (SIC)
Tiêu chuẩn R2 R2 đo lường % biến động của Y được giải thích bởi các Xi trong mô hình. R2 càng gần 1, mô hình càng phù hợp. Lưu ý: Nó chỉ đo lường sự phù hợp “trong mẫu” Khi so sánh R2 giữa các mô hình khác nhau, các biến phụ thuộc phải giống nhau. R2 không giảm khi tăng thêm biến độc lập.
Tiêu chuẩn R2 điều chỉnh (R2) Ta thấyR2 R2.R2 chỉ tăng khi giá trị tuyệt đối của giá trị t của biến được thêm vào mô hình lớn hơn 1. Do vậy,R2 là tiêu chuẩn tốt hơn R2. Lưu ý, các biến phụ thuộc cũng phải giống nhau.
Giá trị của hàm hợp lý log-likelihood (L) Giá trị L càng lớn chứng tỏ mô hình càng phù hợp
Tiêu chuẩn thông tin Akaike (AIC) hay Trong đó k là số biến được ước lượng (gồm cả hệ số tự do) và n là cỡ mẫu. Giá trị AIC càng nhỏ chứng tỏ mô hình càng phù hợp.
Tiêu chuẩn thông tin Schwarz (SC) hay SC còn khắt khe hơn AIC. SC càng nhỏ, mô hình càng tốt.
6. Các chỉ tiêu đánh giá mô hình dự báo Sai số dự báo Mẫu chia thành hai phần Mẫu khởi động: gồm các quan sát t=1,2,3...S-1 Mẫu kiểm tra: gồm các quan sát t=S, S+1,…S+h
6.1 Trung bình sai số bình phương Mean Squared Error
6.2 Căn bậc hai của trung bình sai số bình phương Root Mean Squared Error
6.3 Trung bình sai số tuyệt đối Mean Absolute Error Các chỉ tiêu MSE, RMSE, MAE phụ thuộc đơn vị đo của biến dự báo.
6.4 Trung bình của phần trăm sai số tuyệt đối Mean Absolute Percentage Error
6.5 Hệ số bất đẳng thức Theil Mean Absolute Error TIC thuộc [0;1] TIC =0: hàm hồi quy dự báo chính xác
6.6 Tỷ lệ độ chệch Bias Proportion: trung bình của giá trị dự báo khác so với trung bình giá trị thực tế
6.7 Tỷ lệ phương sai Variance Proportion: cho biết mức độ biến thiên của giá trị dự báo khác mức độ biến thiên của giá trị thiực tế
Mô hình dự báo tốt: BP và VP nhỏ 6.8 Tỷ lệ hiệp phương sai Covariance Proportion: cho biết tỷ lệ phần sai số của dự báo không mang tính hệ thống BP+VP+CP=1 Mô hình dự báo tốt: BP và VP nhỏ
Ví dụ 1 Cho Y: lượng hàng bán được của mặt hàng A (kg/tháng) X2: giá bán mặt hàng A (ngàn đồng/kg) X3: giá bán của mặt hàng B (ngàn đồng/kg) Z= 0 nếu khu vực khảo sát ở nông thôn, Z=1 nếu kv khảo sát ở thành phố Sử dụng Eviews, hãy kiểm định Wald để phát hiện thừa biến
X2 X3 Z Y 2 14 1 20 3 13 19 15 18 4 16 11 17 10 5 12 6 7 8
B1. Chạy mô hình U
B2 Chạy mô hình R
B3 Tính F B4 Tra bảng F (α, k-m, n-k) và quyết định bác bỏ hoặc chấp nhận Ho. Ho: Thừa biến H1: Không thừa biến
Ví dụ 1 Giả sử mô hình hồi quy B1: Chạy mô hình hồi quy mẫu B2: Xác định hệ số hồi quy không có ý nghĩa thống kê (có p>α). Lập giả thuyết Ho B3: Chạy kiểm định Wald, xem giá trị F và p của F để quyết định bác bỏ hay chấp nhận Ho
B1: Chạy hồi quy
Giả sử α=5%, ta thấy hệ số hồi quy của biến X3 và Z có p > α nên biến X3 và Z khác 0 không có ý nghĩa. B2: Chạy kiểm định Wald cho giả thiết H0: β3=β4 =0 , ta có kết quả
Ta có F= 0.082219, p=0.9215> α nên ta chấp nhận giả thuyết H0: β3=β4 =0. Tức biến X3, Z không cần thiết đưa vào mô hình. Kết luận: Lượng hàng trung bình bán được của mặt hàng A chỉ phụ thuộc vào giá bán của mặt hàng A, không phụ thuộc vào giá bán mặt hàng B và khu vực bán.