TỔNG QUAN MÔN HỌC KINH TẾ LƯỢNG
TỔNG QUAN Cung cấp các phương pháp phân tích định lượng Ứng dụng các phương pháp định lượng trong phân tích, kiểm định và dự báo kinh tế MỤC TIÊU MÔN HỌC
TỔNG QUAN Các mô hình hồi quy Kiểm định giả thiết Các khuyết tật của mô hình hồi quy và cách khắc phục NỘI DUNG
TỔNG QUAN NỘI DUNG Chương 1: Nhập môn Chương 2: Hồi quy đơn biến Chương 3: Hồi quy đa biến Chương 4 :Dạng hàm Chương 5: Hồi qui với biến giả Chương 6: Đa cộng tuyến Chương 7: Phương sai sai số thay đổi Chương 8: Tự tương quan Chương 9: Chọn mô hình và kiểm định chọn mô hình NỘI DUNG
TỔNG QUAN Phần mềm hỗ trợ EXCEL: nhập liệu EVIEWS : chạy mô hình
TỔNG QUAN Tài liệu tham khảo 1 2 Phạm Trí Cao, Vũ Minh Châu, Kinh tế lượng ứng dụng (tái bản lần 1), Nhà xuất bản Thống kê TPHCM, 2009 Hoàng Ngọc Nhậm (cb), Giáo trình Kinh tế lượng + Bài tập Kinh tế lượng với sự hỗ trợ của phần mềm Eviews, Stata, Đại học Kinh tế Tp. HCM, Nhà xuất bản Lao động- Xã hội, 2007 2 Nguyễn Quang Dong, Bài giảng Kinh tế lượng + Bài tập Kinh tế lượng với sự trợ giúp của phần mềm Eviews, NXB Thống kê, 2006 3 Ramu Ramanathan, Nhập môn kinh tế lượng với các ứng dụng (ấn bản thứ năm), Nhà xuất bản Harcourt College, 2002. (Bản dịch của chương trình Giảng dạy Kinh tế Fulbright, Việt Nam) 4 5 Damodar N. Gujarati, Essentials of Econometrics, 3rd ed, Mc Graw – Hill International Edition, 2006
NHẬP MÔN KINH TẾ LƯỢNG (ECONOMETRICS) CHƯƠNG 1 NHẬP MÔN KINH TẾ LƯỢNG (ECONOMETRICS)
NHẬP MÔN KINH TẾ LƯỢNG Biết được phương pháp luận của kinh tế lượng Nắm được bản chất của phân tích hồi quy Hiểu các loại số liệu và các quan hệ MỤC TIÊU
NHẬP MÔN KINH TẾ LƯỢNG NỘI DUNG CHƯƠNG 1 Khái niệm 2 Phương pháp luận nghiên cứu của kinh tế lượng 3 Phân tích hồi quy 4 Các loại quan hệ 5 Số liệu
Ước lượng các mối quan hệ kinh tế NHẬP MÔN KINH TẾ LƯỢNG Kinh tế lượng là sự kết hợp giữa số liệu thưc tế, lý thuyết kinh tế và thống kê toán nhằm Ước lượng các mối quan hệ kinh tế Đối chiếu lý thuyết kinh tế với thực tế Kiểm định các giả thiết liên quan đến hành vi kinh tế Dự báo các hành vi của các biến số kinh tế Nguồn: Ramu Ramanathan, Nhập môn kinh tế lượng với các ứng dụng (ấn bản thứ năm), Nhà xuất bản Harcourt College, 2002. (Bản dịch của chương trình Giảng dạy Kinh tế Fulbright, Việt Nam)
NHẬP MÔN KINH TẾ LƯỢNG Lý thuyết kinh tế, kinh nghiệm, các nghiên cứu khác Thiết lập mô hình KTL Kiểm định giả thiết Ước lượng các tham số Thu thập, xử lý số liệu Sử dụng mô hình: dự báo, đề ra chính sách Mô hình ước lượng có tốt không? Không Có Nguồn: Ramu Ramanathan, Nhập môn kinh tế lượng với các ứng dụng (ấn bản thứ năm), Nhà xuất bản Harcourt College, 2002. (Bản dịch của chương trình Giảng dạy Kinh tế Fulbright, Việt Nam) Hình 1.1: Phương pháp luận nghiên cứu của kinh tế lượng
NHẬP MÔN KINH TẾ LƯỢNG Phân tích hồi quy Nghiên cứu mối liên hệ phụ thuộc của một biến (biến phụ thuộc, biến giải thích) với một hay nhiều biến khác (biến độc lập, biến giải thích) VD:
NHẬP MÔN KINH TẾ LƯỢNG Phân tích hồi quy Ước lượng giá trị trung bình của biến phụ thuộc với giá trị đã biết của biến độc lập Phân tích hồi quy Kiểm định giả thiết về bản chất quan hệ phụ thuộc Dự đoán giá trị trung bình của biến phụ thuộc
NHẬP MÔN KINH TẾ LƯỢNG Hàm hồi quy tổng thể PRF (Population Regression Function) Là hàm hồi quy được xây dựng dựa trên kết quả khảo sát tổng thể. Hàm hồi qui tổng thể có dạng: E(Y/Xi) = f(Xi)
NHẬP MÔN KINH TẾ LƯỢNG Hàm hồi qui tổng thể cho biết giá trị trung bình của biến Y sẽ thay đổi như thế nào khi biến X nhận các giá trị khác nhau. Hồi quy đơn (hồi quy hai biến): nếu PRF có một biến độc lập Hàm hồi quy tổng thể PRF Hồi quy bội (hồi quy nhiều biến): nếu PRF có hai biến độc lập trở lên
NHẬP MÔN KINH TẾ LƯỢNG Dạng xác định E(Y/Xi) = f(Xi)= β1 + β2Xi Mô hìnhPRF Dạng ngẫu nhiên Yi = E(Y/Xi) + Ui = β1 + β2Xi + Ui E(Y/Xi): trung bình của Y với điều kiện X nhận giá trị Xi Yi : giá trị quan sát thứ i của biến phụ thuộc Y Ui : nhiễu β1, β2: tham số, hệ số hồi quy
hệ số chặn, hệ số tự do, tung độ góc NHẬP MÔN KINH TẾ LƯỢNG cho biết giá trị trung bình của biến phụ thuộc Y là bao nhiêu khi biến độc lập X nhận giá trị 0 β1 hệ số chặn, hệ số tự do, tung độ góc cho biết giá trị trung bình của Y sẽ thay đổi (tăng, giảm) bao nhiêu đơn vị khi giá trị của X tăng lên 1 đơn vị với điều kiện các yếu tố khác không đổi. β2 hệ số góc, độ dốc
NHẬP MÔN KINH TẾ LƯỢNG Sự tồn tại của nhiễu do: biểu thị cho ảnh hưởng của các yếu tố đối với biến phụ thuộc mà không được đưa vào mô hình. Ui Sự tồn tại của nhiễu do: Nhà nghiên cứu không biết hết các yếu tố ảnh hưởng đến biến phụ thuộc Y. Hoặc nếu biết cũng không thể có số liệu cho mọi yếu tố Không thể đưa tất cả yếu tố vào mô hình vì làm mô hình phức tạp Sai số đo lường trong khi thu thập số liệu Bỏ sót biến giải thích Dạng mô hình hồi quy không phù hợp
NHẬP MÔN KINH TẾ LƯỢNG 2. Hàm hồi quy mẫu SRF (Sample Regression Function) Thực tế, không có điều kiện khảo sát tổng thể -> lấy mẫu -> xây dựng hàm hồi quy mẫu -> ước lượng giá trị trung bình của biến phụ thuộc từ số liệu mẫu
Ŷi : ước lượng điểm của E(Y/Xi) : ước lượng điểm của β1 , β2 NHẬP MÔN KINH TẾ LƯỢNG Dạng xác định Mô hìnhSRF Dạng ngẫu nhiên Ŷi : ước lượng điểm của E(Y/Xi) : ước lượng điểm của β1 , β2 ei : ước lượng điểm của Ui và được gọi là phần dư (residuals)
NHẬP MÔN KINH TẾ LƯỢNG Hàm hồi quy tuyến tính được hiểu là hồi quy tuyến tính đối với tham số Ví dụ các hàm hồi quy tuyến tính Ví dụ các hàm không phải hồi quy tuyến tính
Quan hệ thống kê và quan hệ hàm số NHẬP MÔN KINH TẾ LƯỢNG Quan hệ thống kê: ứng với mỗi giá trị của biến độc lập có thể có nhiều giá trị khác nhau của biến phụ thuộc Quan hệ thống kê và quan hệ hàm số Quan hệ hàm số: các biến không phải là ngẫu nhiên, ứng với mỗi giá trị của biến độc lập chỉ duy nhất một giá trị của biến phụ thuộc
Hàm hồi quy và quan hệ nhân quả NHẬP MÔN KINH TẾ LƯỢNG Hàm hồi quy và quan hệ nhân quả Quan hệ nhân quả: Biến X (biến độc lập) -> biến Y (biến phụ thuộc) (nhân) (quả) Phân tích hồi quy không nhất thiết bao hàm quan hệ nhân quả
NHẬP MÔN KINH TẾ LƯỢNG Hồi quy và tương quan Phân tích tương quan: đo lường liên kết tuyến tính giữa hai biến và hai biến có vai trò đối xứng Hồi quy và tương quan Phân tích hồi quy: ước lượng hoặc dự báo giá trị trung bình của biến phụ thuộc dựa trên giá trị xác định của biến độc lập.
NHẬP MÔN KINH TẾ LƯỢNG Nguồn thu thập số liệu Số liệu thử nghiệm: tiến hành thử nghiệm theo những điều kiện nhất định Nguồn thu thập số liệu Số liệu thực tế
Chất lượng số liệu phụ thuộc NHẬP MÔN KINH TẾ LƯỢNG Số liệu hỗn hợp Phân loại số liệu Số liệu chuỗi thời gian Số liệu chéo Chất lượng số liệu phụ thuộc Sai số trong quá trình thu thập số liệu Phương pháp điều tra chọn mẫu Mức độ tổng hợp và bảo mật của số liệu
CHƯƠNG 2 HỒI QUY ĐƠN BIẾN
HỒI QUY ĐƠN BIẾN Biết được phương pháp ước lượng bình phương nhỏ nhất để ước lượng hàm hồi quy tổng thể dựa trên số liệu mẫu Hiểu các cách kiểm định những giả thiết Sử dụng mô hình hồi quy để dự báo MỤC TIÊU
NỘI DUNG 1 Mô hình 2 Phương pháp bình phương nhỏ nhất (OLS) 3 Khoảng tin cậy 4 Kiểm định giả thiết 5 Dự báo
2.1 MÔ HÌNH Mô hình hồi quy tuyến tính hai biến PRF dạng xác định E(Y/Xi) = f(Xi)= β1 + β2Xi dạng ngẫu nhiên Yi = E(Y/Xi) + Ui = β1 + β2Xi + Ui SRF dạng xác định
2.1 MÔ HÌNH Trong đó : Ước lượng cho b1 : Ước lượng cho b2 : Ước lượng cho E(Y/Xi) Sử dụng phương pháp bình phương nhỏ nhất thông thường (OLS) để tìm ,
Hình 2.1: Hệ số hồi quy trong hàm hồi quy PRF và SRF 2.1 MÔ HÌNH Hình 2.1: Hệ số hồi quy trong hàm hồi quy PRF và SRF
2.2 PHƯƠNG PHÁP OLS Giả sử có n cặp quan sát (Xi, Yi). Tìm giá trị Ŷi sao cho Ŷi gần giá trị Yi nhất, tức ei= |Yi - Ŷi| càng nhỏ càng tốt. Hay, với n cặp quan sát, muốn
( ) ( ) å å 2.2 PHƯƠNG PHÁP OLS X ˆ Y 2 e = b - ¶ ÷ ø ö ç è æ Bài toán thành tìm , sao cho f min Điều kiện để đạt cực trị là: ( ) X ˆ Y 2 e n 1 i = b - ¶ ÷ ø ö ç è æ å ( ) X ˆ Y 2 e i n 1 = b - ¶ ÷ ø ö ç è æ å
2.2 PHƯƠNG PHÁP OLS Hay
2.2 PHƯƠNG PHÁP OLS Giải hệ, được
2.2 PHƯƠNG PHÁP OLS Với là trung bình mẫu (theo biến) gọi là độ lệch giá trị của biến so với giá trị trung bình mẫu
CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH TSS (Total Sum of Squares - Tổng bình phương sai số tổng cộng) ESS: (Explained Sum of Squares - Bình phương sai số được giải thích) RSS: (Residual Sum of Squares - Tổng bình phương sai số)
CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH Y SRF ESS TSS RSS Yi Xi X Hình 2.3: Ý nghĩa hình học của TSS, RSS và ESS
Ta chứng minh được: TSS = ESS + RSS HỆ SỐ XÁC ĐỊNH R2 Ta chứng minh được: TSS = ESS + RSS hay Hàm SRF phù hợp tốt với các số liệu quan sát (mẫu) khi gần Yi . Khi đó ESS lớn hơn RSS. Hệ số xác định R2: đo mức độ phù hợp của hàm hồi quy mẫu.
HỆ SỐ XÁC ĐỊNH R2 Trong mô hình 2 biến
TÍNH CHẤT CỦA HỆ SỐ XÁC ĐỊNH R2 Cho biết % sự biến động của Y được giải thích bởi các biến số X trong mô hình. R2 =1: đường hồi quy phù hợp hoàn hảo R2 =0: X và Y không có quan hệ Nhược điểm: R2 tăng khi số biến X đưa vào mô hình tăng, dù biến đưa vào không có ý nghĩa. =>Sử dụng R2 điều chỉnh (adjusted R2 -R2) để quyết định đưa thêm biến vào mô hình.
HỆ SỐ XÁC ĐỊNH ĐIỀU CHỈNHR2 Khi đưa thêm biến vào mô hình màR2 tăng thì nên đưa biến vào và ngược lại.
HỆ SỐTƯƠNG QUAN r Hệ số tương quan r: đo mức độ chặt chẽ của quan hệ tuyến tính giữa 2 đại lượng X và Y.
TÍNH CHẤT HỆ SỐTƯƠNG QUAN r Có tính chất đối xứng: r XY = r YX Nếu X, Y độc lập theo quan điểm thống kê thì hệ số tương quan giữa chúng bằng 0. r đo sự kết hợp tuyến tính hay phụ thuộc tuyến tính, không có ý nghĩa để mô tả quan hệ phi tuyến.
Có thể chứng minh được và r cùng dấu với VD: HỆ SỐTƯƠNG QUAN r Có thể chứng minh được và r cùng dấu với VD: Với R2 = 0,81 => r = 0,9
2.3 Các giả thiết của phương pháp OLS Giả thiết 1: Các giá trị Xi được xác định trước và không phải là đại lượng ngẫu nhiên Giả thiết 2: Kỳ vọng hoặc trung bình số học của các sai số là bằng 0 (zero conditional mean), nghĩa là E(U/Xi) = 0
2.3 Các giả thiết của phương pháp OLS Giả thiết 3: Các sai số U có phương sai bằng nhau (homoscedasticity) Var(U/Xi) = σ2 Giả thiết 4: Các sai số U không có sự tương quan, nghĩa là Cov(Ui, Ui’) = E(UiUi’) = 0, nếu i i’
2.3 Các giả thiết của phương pháp OLS Giả thiết 5: Các sai số U độc lập với biến giải thích Cov(Ui, Xi) = 0 Giả thiết 6: Đại lượng sai số ngẫu nhiên có phân phối chuẩn Ui ~ N(0, δ2 )
Định lý Gauss-Markov Định lý: Với những giả thiết (từ 1 đến 5) của mô hình hồi quy tuyến tính cổ điển, mô hình hồi quy tuyến tính theo phương pháp bình phương nhỏ nhất là ước lượng tuyến tính không chệch tốt nhất.
2.4 TÍNH CHẤT CÁC ƯỚC LƯỢNG OLS , được xác định một cách duy nhất với n cặp giá trị quan sát (Xi , Yi) , là các đại lượng ngẫu nhiên, với các mẫu khác nhau, giá trị của chúng sẽ khác nhau Đo lường độ chính xác các ước lượng bằng sai số chuẩn (standard error – se).
Sai số chuẩn của các ước lượng OLS var: phương sai se: sai số chuẩn 2: phương sai nhiễu của tổng thể 2 = Var (Ui ) -> thực tế khó biết được giá trị 2 -> dùng ước lượng không chệch
Sai số chuẩn của các ước lượng OLS
Sai số chuẩn của các ước lượng OLS Sai số chuẩn của hồi quy: là độ lệch tiêu chuẩn các giá trị Y quanh đường hồi quy mẫu
Tính chất đường hồi quy mẫu SRF SRF đi qua trung bình mẫu 2. 3. 4. 5.
2.4 KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY Xác suất của khoảng (i - i, i + i) chứa giá trị thực của i là 1 - hay: P(i - i i i + i) = 1 - . với
2.4 KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY (i - i, i + i) : khoảng tin cậy, i : độ chính xác của ước lượng, 1 - : hệ số tin cậy, (0 < < 1): mức ý nghĩa, t (/2, n-2): giá trị tới hạn (tìm bằng cách tra bảng số t-student) n: số quan sát
2.4 KHOẢNG TIN CẬY CỦA 2 hay , : giá trị của đại lượng ngẫu nhiên phân phối theo quy luật với bậc tự do n-2 thỏa điều kiện
2.5 KIỂM ĐỊNH GIẢ THIẾT Hai phía: Phía phải: Phía trái: 1. Kiểm định giả thiết về hệ số hồi quy Hai phía: Phía phải: Phía trái:
1. Kiểm định giả thiết về hệ số hồi quy Cách 1: Phương pháp giá trị tới hạn Bước 1: Tính t Bước 2: Tra bảng t-student để có giá trị tới hạn Bước 3: Quy tắc quyết định Nếu bác bỏ H0. Nếu chấp nhận H0. 1. Kiểm định giả thiết về hệ số hồi quy
-4 -3 -2 -1 1 2 3 4 t f(t) a/2 -t 1-a Miền chấp nhận Ho Miền bác bỏ Ho Miền bác bỏ Ho
1. Kiểm định giả thiết về hệ số hồi quy Cách 2: Phương pháp khoảng tin cậy Khoảng tin cậy của i: với mức ý nghĩa trùng với mức ý nghĩa của H0 Quy tắc quyết định - Nếu chấp nhận H0 - Nếu bác bỏ H0
1. Kiểm định giả thiết về hệ số hồi quy Cách 3: Phương pháp p-value Bước 1: Tính Bước 2: Tính Bước 3: Quy tắc quyết định - Nếu p ≤ : Bác bỏ H0 - Nếu p > : Chấp nhận H0
1. Kiểm định giả thiết về hệ số hồi quy Loại GT H0 H1 Miền bác bỏ Hai phía βi = βi* βi ≠ βi* |t|>t/2 (n-2) Phía phải βi ≤ βi* βi > βi* t>t (n-2) Phía trái βi ≥ βi* βi < βi* t<t (n-2)
Kiểm định phía phải H0 : βi ≤ βi* H1 : βi > βi* f(t) 1-a a Miền bác bỏ Ho t a t
Kiểm định phía trái H0 : βi ≥ βi* H1 : βi < βi* f(t) 1-a a Miền bác bỏ Ho -t a t
2. Kiểm định sự phù hợp của mô hình Kiểm định giả thiết H0: R2 = 0 (tương đương H0: β2= 0) với mức ý nghĩa hay độ tin cậy 1 - Bước 1: Tính a. Phương pháp giá trị tới hạn Bước 2: Tra bảng F với mức ý nghĩa và hai bậc tư do (1, n-2) Bước 3: Quy tắc quyết định - Nếu F > F(1,n-2): Bác bỏ H0 - Nếu F ≤ F(1,n-2): Chấp nhận H0
2. Kiểm định sự phù hợp của mô hình b. Phương pháp p-value Bước 2: Tính p-value= p (F(1,n-2)>F) Bước 3: Quy tắc quyết định - Nếu p ≤ : Bác bỏ H0 - Nếu p > : Chấp nhận H0
Thống kê F F =0,05 Miền bác bỏ Ho Miền chấp nhận Ho F(1,n-2)
2.6 DỰ BÁO Mô hình hồi quy Cho trước giá trị X = X0, dự báo giá trị trung bình và giá trị cá biệt của Y với mức ý nghĩa hay độ tin cậy 1 - . * Ước lượng điểm
2.6 DỰ BÁO * Dự báo giá trị trung bình của Y Với:
2.6 DỰ BÁO * Dự báo giá trị cá biệt của Y Với:
2.7 HỒI QUY VÀ ĐƠN VỊ ĐO CỦA BIẾN Nếu đơn vị đo của biến X, Y thay đổi thì mô hình hồi quy mới là Với
CHƯƠNG 3 HỒI QUY ĐA BIẾN
HỒI QUY ĐA BIẾN Biết được phương pháp ước lượng bình phương nhỏ nhất để ước lượng hàm hồi quy đa biến tổng thể dựa trên số liệu mẫu Hiểu các cách kiểm định những giả thiết MỤC TIÊU
NỘI DUNG 1 Mô hình hồi quy 3 biến 2 Mô hình hồi quy k biến 3 Dự báo 5
3.1 Mô hình hồi quy 3 biến Mô hình hồi quy tổng thể PRF Ý nghĩa: PRF cho biết trung bình có điều kiện của Y với điều kiện đã biết các giá trị cố định của biến X2 và X3. Y: biến phụ thuộc X2 và X3: biến độc lập β1 : hệ số tự do β2 , β3 : hệ số hồi quy riêng
3.1 Mô hình hồi quy 3 biến Ý nghĩa hệ số hồi quy riêng: cho biết ảnh hưởng của từng biến độc lập lên giá trị trung bình của biến phụ thuộc khi các biến còn lại được giữ không đổi. Mô hình hồi quy tổng thể ngẫu nhiên: ui: sai số ngẫu nhiên của tổng thể
Các giả thiết của mô hình Giá trị trung bình của Ui bằng 0 E(Ui /X2i, X3i)=0 2. Phương sai của các Ui là không đổi Var(Ui)=σ2 3. Không có hiện tượng tự tương quan giữa các Ui Cov(Ui ,Uj )=0; i≠j 4. Không có hiện tượng cộng tuyến giữa X2 và X3 5.Ui có phân phối chuẩn: Ui ̴ N(0, σ2 )
sai số của mẫu ứng với quan sát thứ i 3.1.1 Ước lượng các tham số Hàm hồi quy mẫu: sai số của mẫu ứng với quan sát thứ i Sử dụng phương pháp bình phương nhỏ nhất để ước lượng các tham số
3.1.1 Ước lượng các tham số
3.1.1 Ước lượng các tham số
σ2 là phương sai của ui chưa biết nên dùng ước lượng không chệch: 3.1.2 Phương sai của các ước lượng σ2 là phương sai của ui chưa biết nên dùng ước lượng không chệch:
Hệ số xác định Hệ số xác định R2 Mô hình hồi quy 3 biến Hệ số xác định hiệu chỉnh Với k là tham số của mô hình, kể cả hệ số tự do
- Hệ số hồi quy biến mới thêm vào mô hình khác 0 có ý nghĩa Hệ số xác định hiệu chỉnh Dùng để xét việc đưa thêm 1 biến vào mô hình. Biến mới đưa vào mô hình phải thỏa 2 điều kiện: - Làm tăng - Hệ số hồi quy biến mới thêm vào mô hình khác 0 có ý nghĩa
Với mức ý nghĩa hay độ tin cậy 1- 3.1.4 Khoảng tin cậy Với mức ý nghĩa hay độ tin cậy 1- Với
Nếu |ti | > t(n-3,/2): bác bỏ H0 3.1.5 Kiểm định giả thiết 1. Kiểm định giả thiết H0: B1. Tính B2. Nguyên tắc quyết định Nếu |ti | > t(n-3,/2): bác bỏ H0 Nếu |ti | ≤ t(n-3,/2) : chấp nhận H0
2. Kiểm định giả thiết đồng thời bằng không: H0: 2 = 3 = 0; (H1: ít nhất 1 tham số khác 0) B1. Tính B2. Nguyên tắc quyết định F > F(2, n-3): Bác bỏ H0: Mô hình phù hợp F ≤ F(2, n-3): Chấp nhận H0: Mô hình không phù hợp
3.2 Mô hình hồi quy k biến Mô hình hồi quy tổng thể Mô hình hồi quy mẫu ngẫu nhiên: sai số của mẫu ứng với quan sát thứ i
3.2.1 Ước lượng các tham số ( ) ˆ ... 2 1 3 , = - ¶ å ki n i k X Y e b
3.2.2 Khoảng tin cậy Với mức ý nghĩa hay độ tin cậy 1- Với
Với k là tham số của mô hình, kể cả hệ số tự do Hệ số xác định Hệ số xác định hiệu chỉnh Với k là tham số của mô hình, kể cả hệ số tự do
Hệ số xác định hiệu chỉnh Dùng để xem xét việc đưa thêm biến vào mô hình. Biến mới đưa vào mô hình phải thỏa 2 điều kiện: - Làm tăng - Biến mới có ý nghĩa thống kê trong mô hình mới
3.2.3 Kiểm định các giả thiết hồi quy 1. Kiểm định giả thiết về hệ số hồi quy Kiểm định giả thiết H0: B1.Tính B2. Nguyên tắc quyết định Nếu |ti | > t(n-k,/2) : bác bỏ H0 Nếu |ti | ≤ t(n-k,/2) : chấp nhận H0
3.2.4 Kiểm định các giả thiết hồi quy 2. Kiểm định sự phù hợp của mô hình: kiểm định giả thiết đồng thời bằng không: H0: 2 = 3 =…= k = 0; (H1: ít nhất 1 trong k tham số khác 0) B1. Tính B2. Nguyên tắc quyết định: Nếu F > F(k-1, n-k): Bác bỏ H0: Mô hình phù hợp Nếu F ≤ F(k-1, n-k): Chấp nhận H0: Mô hình không phù hợp
3.3 DỰ BÁO Mô hình hồi quy Cho trước giá trị Dự báo giá trị trung bình và giá trị cá biệt của Y với mức ý nghĩa hay độ tin cậy 1 - .
3.3 DỰ BÁO * Ước lượng điểm * Dự báo giá trị trung bình của Y Với:
3.3 DỰ BÁO * Dự báo giá trị cá biệt của Y Với:
CHƯƠNG 4 DẠNG HÀM
DẠNG HÀM 1. Mở rộng các dạng hàm 2. Hiểu ý nghĩa các hệ số hồi quy MỤC TIÊU
NỘI DUNG 1 Khái niệm biên tế, hệ số co giãn 2 Giới thiệu các mô hình
4.1 BIÊN TẾ Giả sử có hàm Y=f(X) Giá trị biên tế MXY =∆Y/∆X ∆Y= MXY * ∆X Ý nghĩa của biên tế: Cho biết lượng thay đổi tuyệt đối của biến phụ thuộc Y khi biến độc lập X thay đổi 1 đơn vị Khi ∆X->0, MXY ≈ f’(X)
4.1 HỆ SỐ CO GIÃN Hệ số co giãn của Y theo X là Lượng thay đổi tương đối của Y
4.1 HỆ SỐ CO GIÃN Ý nghĩa của hệ số co giãn: cho biết sự thay đổi tương đối (%) của Y khi X thay đổi 1% Khi ∆X->0 Hệ số co giãn không phụ thuộc đơn vị đo
4.2 Mô hình hồi quy qua gốc tọa độ Mô hình hồi quy tổng thể Mô hình hồi quy mẫu ngẫu nhiên:
4.3 Mô hình tuyến tính logarit (log-log) Mô hình hồi quy mũ Hay
4.3 Mô hình tuyến tính logarit (log-log) Ví dụ: Khi giá tăng 1% thì lượng cầu của loại hàng hoá này sẽ giảm 0,25%.
Với r: tốc độ tăng trưởng gộp theo thời gian của Y 4.4 . Mô hình bán logarit 4.4.1. Mô hình log-lin Công thức tính lãi gộp Với r: tốc độ tăng trưởng gộp theo thời gian của Y t: thời gian (tháng, quý, năm)
Mô hình bán logarit có yếu tố ngẫu nhiên lnYt = 1 + 2.t + Ut 4.4.1. Mô hình log-lin Lấy logarit hai vế lnYt = lnY0 + t*ln(1+r) Hay lnYt = 1 + 2.t với lnY0= 1 và ln(1+r) = 2 Mô hình bán logarit có yếu tố ngẫu nhiên lnYt = 1 + 2.t + Ut
Thay đổi tương đối của biến phụ thuộc (Y) 4.4.1. Mô hình log-lin Thay đổi tương đối của biến phụ thuộc (Y) Thay đổi tuyệt đối của biến độc lập (t) 2 = Nhân thay đổi tương đối của Y lên 100. Nếu 2>0: tốc độ tăng trưởng (%) của Y đối với thay đổi tuyệt đối của t Nếu 2 < 0: tốc độ giảm sút
4.4.1. Mô hình log-lin Ứng dụng: Nghiên cứu khảo sát tốc độ tăng trưởng (giảm sút) của các biến kinh tế vĩ mô như GDP, dân số, lao động, năng suất. Mô hình tuyến tính Yt = β1 + β2.t +Ut thích hợp với ước lượng thay đổi tuyệt đối của Y theo thời gian Mô hình log-lin thích hợp với ước lượng thay đổi tương đối của Y theo thời gian
GDP thực tăng với tốc độ 2,47%/năm từ 1972-1991. 4.4.1. Mô hình log-lin Ví dụ: Cho kết quả hồi quy tổng SP nội địa (RGDP) tính theo giá năm 1987 của Mỹ trong khoảng thời gian 1972-1991 Nếu Y = ln(RGDP) GDP thực tăng với tốc độ 2,47%/năm từ 1972-1991. Nếu Y = RGDP GDP thực tăng với tốc độ tuyệt đối 97,68 tỷ USD/năm từ 1972-1991.
Nếu X thay đổi 0,01 (hay 1%) thay đổi tuyệt đối của Y là 0,012. 4.4.2. Mô hình lin-log hay Nếu X thay đổi 0,01 (hay 1%) thay đổi tuyệt đối của Y là 0,012.
X: lượng cung tiền (tỷ USD) Với số liệu trong khoảng thời gian 1970-83 4.4.2. Mô hình lin-log Ví dụ Y: GNP (tỷ USD) X: lượng cung tiền (tỷ USD) Với số liệu trong khoảng thời gian 1970-83 Ý nghĩa 2=2584,785: trong khoảng thời gian 1970-83, lượng cung tiền tăng lên 1%, kéo theo sự gia tăng bình quân của GNP 25,84 tỷ USD.
4.5 Mô hình nghịch đảo Đặc điểm: Khi X tiến tới ∞, số hạn β2(1/X) tiến dần tới 0 và Y tiến tới giá trị tới hạn β1. Ứng dụng: đường chi phí đơn vị, đường tiêu dùng theo thu nhập Engel hoặc đường cong Philip.
Đường chi phí đơn vị 1 >0 2 >0 1 X (sản lượng) Y (AFC) Chi phí sản xuất cố định trung bình (AFC) giảm liên tục khi sản lượng tăng và cuối cùng tiệm cận với trục sản lượng ở β1
Đường cong Phillips 1 <0 2 >0 1 X (Tỷ lệ thất nghiệp) Y (Tỷ lệ thay đổi tiền lương) Khi tỷ lệ thất nghiệp tăng vô hạn, tỷ lệ giảm sút của tiền lương sẽ không vượt quá β1
Đường cong Engel 1 1 > 0 2 < 0 -2 / 1 1 > 0 2 < 0 1 X (Tổng thu nhập/ Tổng chi tiêu) Y (Chi tiêu của một loại hàng) -2 / 1
Đường cong Engel Chi tiêu hàng hóa tăng khi tổng thu nhập (hoặc tổng chi tiêu) tăng nhưng đối với một số loại hàng hóa thì thu nhập của người tiêu dùng phải đạt ở mức tối thiểu -2 / 1 (hay còn gọi là ngưỡng thu nhập) thì người tiêu dùng mới sử dụng loại hàng này. Mặt khác, nhu cầu của loại hàng này là hữu hạn, nghĩa là dù thu nhập có tăng vô hạn thì người tiêu dùng cũng không tiêu thụ thêm mặt hàng này nữa. Mức tiêu dùng bão hòa của loại hàng này là β1
Với: Y Tổng chi phí X Số lượng sản phẩm 4.6 Mô hình đa thức Với: Y Tổng chi phí X Số lượng sản phẩm Ứng dụng: từ hàm này, suy ra được chi phí trung bình (AC) và chi phí biên (MC)
4.7 Mô hình có độ trễ phân phối Với: Yt Tiêu dùng năm t Xt Thu nhập năm t Xt-1 Thu nhập năm t-1 Xt-k Thu nhập năm t-k k Chiều dài độ trễ
So sánh R2 giữa các mô hình Cùng cỡ mẫu n Cùng số biến độc lập. Nếu các hàm hồi quy không cùng số biến độc lập thì dùng hệ số xác định hiệu chỉnh Biến phụ thuộc xuất hiện trong hàm hồi quy có cùng dạng. Biến độc lập có thể ở các dạng khác nhau. VD: Các hàm hồi quy có thể so sánh R2 với nhau Y=β1 + β.X +U Y= β1 + β.lnX +U Các hàm hồi quy không thể so sánh R2 với nhau lnY= β1 + β.X +U
BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY CHƯƠNG 5 BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY
BIẾN GIẢ 1. Biết cách đặt biến giả 2. Nắm phương pháp sử dụng biến giả trong phân tích hồi quy MỤC TIÊU
NỘI DUNG 1 Khái niệm biến giả 2 Sử dụng biến giả trong mô hình hồi quy 3 Ứng dụng sử dụng biến giả
5.1 KHÁI NIỆM Biến định lượng: các giá trị quan sát được thể hệ bằng con số Biến định tính: thể hiện một số tính chất nào đó Để đưa những thuộc tính của biến định tính vào mô hình hồi quy, cần lượng hóa chúng => sử dụng biến giả (dummy variables)
5.2 Sử dụng biến giả trong mô hình hồi quy Ví dụ 5.1: Xét mô hình Yi = 1 + 2Xi + 3Di + Ui với Y Tiền lương (triệu đồng/tháng) X Bậc thợ D=1 nếu công nhân làm trong khu vực tư nhân D=0 nếu công nhân làm trong khu vực nhà nước D được gọi là biến giả trong mô hình
5.2 Sử dụng biến giả trong mô hình hồi quy E(Y/X,D) = 1 + 2Xi + 3Di (5.1) E(Y/X,D=0) = 1 + 2Xi (5.2) E(Y/X,D=1) = 1 + 2Xi + 3 (5.3) (5.2): tiền lương trung bình của công nhân làm việc trong khu vực quốc doanh với bậc thợ là X (5.3): tiền lương trung bình của công nhân làm việc trong khu vực tư nhân với bậc thợ là X
5.2 Sử dụng biến giả trong mô hình hồi quy 2 tốc độ tăng lương theo bậc thợ 3 chênh lệch tiền lương trung bình của công nhân làm việc ở hai khu vực và cùng bậc thợ (Giả thiết của mô hình: tốc độ tăng lương theo bậc thợ ở hai khu vực giống nhau)
E(Y/X,Z) = 1 + 2Xi + 3Di Y Hình 5.1 mức thu nhập bình quân tháng của người lao động tại KVQD và KVTN khi có bậc thợ là X X
5.2 Sử dụng biến giả trong mô hình hồi quy Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y) (triệu đồng/tháng) vào thời gian công tác (X) (năm) và nơi làm việc của người lao động (DNNN, DNTN và DNLD) Dùng 2 biến giả Z1 và Z2 với Z1i =1 nơi làm việc tại DNNN Z1i =0 nơi làm việc tại nơi khác Z2i =1 nơi làm việc tại DNTN Z2i =0 nơi làm việc tại nơi khác Z1i = 0 và Z2i = 0 phạm trù cơ sở
5.2 Sử dụng biến giả trong mô hình hồi quy E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i E(Y/X,Z1=0,Z2=0) = 1 + 2Xi E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3 E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4 3 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNNN và DNLD khi có cùng thời gian làm việc X năm 4 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNTN và DNLD khi có cùng thời gian làm việc X năm
5.2 Sử dụng biến giả trong mô hình hồi quy Ví dụ 5.3. thu nhập còn phụ thuộc vào trình độ người lao động (từ đại học trở lên, cao đẳng và khác) D1i = 1: nếu trình độ từ đại học trở lên 0: trường hợp khác D2i 1: nếu trình độ cao đẳng Một chỉ tiêu chất lượng có n phạm trù (thuộc tính) khác nhau thì dùng n-1 biến giả
5.2 Sử dụng biến giả trong mô hình hồi quy VD 5.4: Khảo sát lương của giáo viên theo số năm giảng dạy Mô hình: Yi = 1 + 3Xi Trong đó Y lương giáo viên X số năm giảng dạy và xem xét yếu tố giới tính có tác động đến thu nhập không Z giới tính với Z=1: nam; Z=0: nữ
5.2 Sử dụng biến giả trong mô hình hồi quy TH1: Lương khởi điểm của gv nam và nữ khác nhau nhưng tốc độ tăng lương theo số năm giảng dạy như nhau TH2: Lương khởi điểm như nhau nhưng tốc độ tăng lương khác nhau TH3: Lương khởi điểm và tốc độ tăng lương khác nhau
5.2 Sử dụng biến giả trong mô hình hồi quy TH1: Dịch chuyển số hạng tung độ gốc Hàm PRF: Y= 1 + 2Z + 3X + U Hàm SRF ứng với nữ (Z=0) : Hàm SRF ứng với nam (Z=1) :
5.2 Sử dụng biến giả trong mô hình hồi quy Hình 5.2 Lương khởi điểm của gv nam và nữ khác nhau
5.2 Sử dụng biến giả trong mô hình hồi quy TH2: Dịch chuyển số hạng độ dốc Hàm PRF: Y= 1 + 2X + 3(ZX) + U Với ZX gọi là biến tương tác Hàm SRF ứng với nữ (Z=0) : Hàm SRF ứng với nam (Z=1) :
5.2 Sử dụng biến giả trong mô hình hồi quy Hình 5.3 Mức tăng lương theo số năm giảng dạy của gv nam và nữ khác nhau
5.2 Sử dụng biến giả trong mô hình hồi quy TH3: Dịch chuyển số hạng tung độ gốc và số hạng độ dốc Hàm PRF: Y= 1 + 2Z + 3X + 4(ZX)+ U Hàm SRF ứng với nữ (Z=0) : Hàm SRF ứng với nam (Z=1) :
5.2 Sử dụng biến giả trong mô hình hồi quy Hình 5.4 Lương khởi điểm và mức tăng lương của gv nam và nữ khác nhau
5.3 Ứng dụng sử dụng biến giả 5.3.1 Sử dụng biến giả trong phân tích mùa Y chi tiêu cho tiêu dùng X thu nhập Z = 1 nếu quan sát trong mùa (tháng 1-6) Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12) TH1: Nếu yếu tố mùa chỉ ảnh hưởng đến hệ số chặn TH2: Nếu yếu tố mùa có ảnh hưởng đến hệ số góc Mô hình * có tính tổng quát hơn. Qua việc kiểm định giả thiết để biết được hệ số góc nào có ý nghĩa.
5.3 Ứng dụng sử dụng biến giả 5.3.2 Kiểm định tính ổn định cấu trúc của các mô hình hồi quy Ví dụ 5.5. Số liệu tiết kiệm và thu nhập cá nhân ở nước Anh từ 1946-63 (triệu pounds)
5.3 Ứng dụng sử dụng biến giả Mục tiêu: Kiểm tra hàm tiết kiệm có thay đổi cấu trúc giữa 2 thời kỳ hay không. Cách 1 Lập hai mô hình tiết kiệm ở 2 thời kỳ Thời kỳ tái thiết: 1946-54 Thời kỳ hậu tái thiết: 1955-63 Và kiểm định các trường hợp sau
5.3 Ứng dụng sử dụng biến giả Cách 2 Sử dụng biến giả B1. Lập hàm tiết kiệm tổng quát của cả 2 thời kỳ Với n = n1 + n2 Z = 1 quan sát thuộc thời kỳ tái thiết Z = 0 quan sát thuộc thời kỳ hậu tái thiết B2. Kiểm định giả thiết H0: 3=0 Nếu chấp nhận H0: loại bỏ Z ra khỏi mô hình B3. Kiểm định giả thiết H0: 4=0 Nếu chấp nhận H0: loại bỏ ZiXi ra khỏi mô hình
5.3 Ứng dụng sử dụng biến giả Kết quả hồi quy theo mô hình như sau t = (-5,27) (9,238) (3,155) (-3,109) p = (0,000) (0,000) (0,007) (0,008) Nhận xét Tung độ gốc chênh lệch và hệ số góc chênh lệch có ý nghĩa thống kê Các hồi quy trong hai thời kỳ là khác nhau
5.3 Ứng dụng sử dụng biến giả Thời kỳ tái thiết: Z = 1 Thời kỳ hậu tái thiết: Z = 0
5.3 Ứng dụng sử dụng biến giả Thu nhập Tiết kiệm Thời kỳ hậu tái thiết Thời kỳ tái thiết -0.27 -1.75 Hình 5.6 Mô hình hồi quy cho 2 thời kỳ
5.3 Ứng dụng sử dụng biến giả 5.3.3. Hàm tuyến tính từng khúc Ví dụ 5.6: Doanh thu dưới X* thì tiền hoa hồng sẽ khác với khi doanh thu trên X*. Hàm hồi quy có dạng Y Tiền hoa hồng X Doanh thu X* Giá trị ngưỡng sản lượng Zi =1 nếu Xi > X* Zi =0 nếu Xi ≤ X*
5.3 Ứng dụng sử dụng biến giả Y X Hình 5.7 Hàm tuyến tính từng khúc Kiểm định giả thiết H0: 3=0 Nếu bác bỏ H0: hàm hồi quy thay đổi cấu trúc
HIỆN TƯỢNG ĐA CỘNG TUYẾN (MULTICOLLINEARITY) CHƯƠNG 6 HIỆN TƯỢNG ĐA CỘNG TUYẾN (MULTICOLLINEARITY)
BIẾN GIẢ Hiểu bản chất và hậu quả của đa cộng tuyến Biết cách phát hiện đa cộng tuyến và biện pháp khắc phục MỤC TIÊU
NỘI DUNG 1 Bản chất, nguyên nhân của đa cộng tuyến 2 Ước lượng các tham số 3 Hậu quả 4 Phát hiện đa cộng tuyến 5 Khắc phục đa cộng tuyến
6.1 Bản chất của đa cộng tuyến Trong mô hình hồi quy bội Có sự phụ thuộc tuyến tính cao giữa các biến giải thích
6.1 Bản chất của đa cộng tuyến a. Đa cộng tuyến hoàn hảo Tồn tại 2, 3,… k không đồng thời bằng 0 sao cho 2X2 + 3X3 + …+ kXk = 0 b. Đa cộng tuyến không hoàn hảo 2X2 + 3X3 + …+ kXk + vi= 0 với vi là sai số ngẫu nhiên.
6.1 Bản chất của đa cộng tuyến VD X2 10 15 18 24 30 X3 50 75 90 120 150 X4 V 52 2 97 7 129 9 152 X3i = 5X2i, có cộng tuyến hoàn hảo giữa X2 và X3 ; r23 = 1 X2 và X4 có cộng tuyến không hoàn hảo
6.1 Bản chất của đa cộng tuyến X2 X3 Không có đa cộng tuyến Đa cộng tuyến thấp Y X2 X3 Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
6.1 Bản chất của đa cộng tuyến X2 X3 Đa cộng tuyến cao Y X2 X3 Đa cộng tuyến hoàn hảo Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
6.1 Nguyên nhân của đa cộng tuyến - Chọn các biến độc lập có mối quan có quan hệ nhân quả hay có tương quan cao vì đồng phụ thuộc vào một điều kiện khác. - Số quan sát nhỏ hơn số biến độc lập. - Cách thu thập mẫu: mẫu không đặc trưng cho tổng thể - Chọn biến Xi có độ biến thiên nhỏ.
6.2 Ước lượng khi có đa cộng tuyến Trường hợp có đa cộng tuyến hoàn hảo Xét mô hình hồi qui 3 biến dưới dạng sau: Yi = 2 X2i + 3 X3i + ei giả sử X3i = X2i, mô hình được biến đổi thành: Yi = (2+ 3)X2i + ei = 0 X2i + ei Phương pháp OLS Không thể tìm được lời giải duy nhất cho
6.2 Ước lượng khi có đa cộng tuyến Các hệ số ước lượng không xác định Phương sai và sai số chuẩn của 2 và 3 là vô hạn
6.2 Ước lượng khi có đa cộng tuyến 2. Trường hợp có đa cộng tuyến không hoàn hảo Đa cộng tuyến hoàn hảo thường không xảy ra trong thực tế. Xét mô hình hồi qui 3 biến dưới dạng sau: yi = 2 x2i + 3 x3i + ei Giả sử x3i = x2i + vi Với 0 và vi là sai số ngẫu nhiên
6.2 Ước lượng khi có đa cộng tuyến Có thể ước lượng được các hệ số hồi quy nhưng sai số chuẩn rất lớn.
6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo Phương sai và hiệp phương sai của các ước lượng OLS lớn. Khoảng tin cậy rộng hơn. Tỉ số t "không có ý nghĩa" R2 cao nhưng tỉ số t ít có ý nghĩa
6.3 Hậu quả của đa cộng tuyến 5. Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy với những thay đổi nhỏ trong dữ liệu. 6. Dấu của các ước lượng của các hệ số hồi qui có thể sai 7. Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về dấu hoặc thay đổi về độ lớn của các ước lượng.
6.3 Hậu quả của đa cộng tuyến Đa cộng tuyến là một hiện tượng theo mẫu, nghĩa là cho dù các biến độc lập Xi không tương quan tuyến tính trong tổng thể nhưng chúng có thể tương quan tuyến tính trong một mẫu cụ thể nào đó. Do đó cỡ mẫu lớn thì hiện tượng đa cộng tuyến ít nghiêm trọng hơn cỡ mẫu nhỏ
1. Hệ số R2 lớn nhưng tỷ số t nhỏ 6.4 Cách phát hiện đa cộng tuyến 1. Hệ số R2 lớn nhưng tỷ số t nhỏ 2. Tương quan cặp giữa các biến giải thích cao 3. Sử dụng mô hình hồi qui phụ 4. Sử dụng yếu tố phóng đại phương sai (VIF)
2. Tương quan cặp giữa các biến giải thích cao 6.4 Cách phát hiện đa cộng tuyến R2 lớn nhưng tỷ số t nhỏ 2. Tương quan cặp giữa các biến giải thích cao Trong đó X, Z là 2 biến giải thích trong mô hình
6.4 Cách phát hiện đa cộng tuyến 3. Sử dụng mô hình hồi quy phụ Hồi qui một biến giải thích X theo các biến còn lại Tính R2 và F cho mỗi mô hình Lập giả thiết H0: R2 = 0 ~ H0: không có đa cộng tuyến Nếu F > F(m-1,n-k): bác bỏ H0 hay có đa cộng tuyến Nếu F < F(m-1,n-k): chấp nhận H0 hay không có đa cộng tuyến
6.4 Cách phát hiện đa cộng tuyến 4. Sử dụng nhân tử phóng đại phương sai (VIF) Đối với hàm hồi quy 2 biến giải thích Đối với trường hợp tổng quát, có (k-1) biến giải thích R2j: là giá trị R2 trong hàm hồi quy của Xj theo (k-2) biến giải thích còn lại. Thông thường khi VIF > 10, thì biến này được coi là có cộng tuyến cao
1. Dùng thông tin tiên nghiệm Ví dụ mô hình sản xuất Cobb-Douglas 6.5 Cách khắc phục 1. Dùng thông tin tiên nghiệm Ví dụ mô hình sản xuất Cobb-Douglas Ln(Yi)=b1 + b2ln(Ki)+ b3ln(Li) + ui Có thể xảy ra đa cộng tuyến do K và L cùng tăng theo quy mô sản xuất. Nếu biết hiệu suất không đổi theo quy mô tức là b2+b3=1 thì Ln(Yi)=b1 + b2ln(Ki)+ (1-b2)ln(Li) + ui Ln(Yi) – Ln(Li) = b1 + b2[ln(Ki) - ln(Li)] + ui Ln(Yi /Li ) = b1 + b2ln(Ki /Li) + ui => mất đa cộng tuyến (vì đây là mô hình hồi quy đơn)
2. Loại trừ một biến giải thích ra khỏi mô hình 6.5 Cách khắc phục 2. Loại trừ một biến giải thích ra khỏi mô hình B1: Xem cặp biến giải thích nào có quan hệ chặt chẽ. Giả sử X2, X3…Xk là các biến độc lập, Y là biến phụ thuộc và X2, X3 có tương quan chặt chẽ với nhau. B2: Tính R2 đối với các hàm hồi quy: có mặt cả 2 biến; không có mặt một trong 2 biến B3: Loại biến mà giá trị R2 tính được khi không có mặt biến đó là lớn hơn.
6.5 Cách khắc phục 3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới
Có hàm hồi qui: yt = 1 + 1x1t + 2x2t + ut suy ra 6.5 Cách khắc phục 4. Dùng sai phân cấp 1 Có hàm hồi qui: yt = 1 + 1x1t + 2x2t + ut suy ra yt-1 = 1 + 1x1,t-1 + 2x2,t-1 + ut-1 Trừ hai vế cho nhau, được: yt – yt – 1 = 1(x1,t – x1,t – 1) + 2(x2,t – x2,t – 1) + (ut – ut – 1) Hay: yt = 1 x1,t + 2 x2,t + et,
HIỆN TƯỢNG PHƯƠNG SAI THAY ĐỔI (HETEROSCEDASTICITY) CHƯƠNG 7 HIỆN TƯỢNG PHƯƠNG SAI THAY ĐỔI (HETEROSCEDASTICITY)
BIẾN GIẢ Hiểu bản chất và hậu quả của phương sai sai số thay đổi Biết cách phát hiện phương sai sai số thay đổi và biện pháp khắc phục MỤC TIÊU
NỘI DUNG 1 Bản chất hiện tượng phương sai sai số thay đổi 2 Hậu quả 3 Cách phát hiện phương sai sai số thay đổi 4 Cách khắc phục phương sai sai số thay đổi
7.1 Bản chất Xét ví dụ mô hình hồi qui 2 biến trong đó biến phụ thuộc Y là tiết kiệm của hộ gia đình và biến giải thích X là thu nhập khả dụng của hộ gia đình
7.1 Bản chất X1 X2 Xn X Y (a) (b) Hình 7.1: (a) Phương sai của sai số không đổi và (b) Phương sai của sai số thay đổi
7.1 Bản chất Hình 7.1a cho thấy tiết kiệm trung bình có khuynh hướng tăng theo thu nhập. Tuy nhiên mức độ dao động giữa tiết kiệm của từng hộ gia đình so với mức tiết kiệm trung bình không thay đổi tại mọi mức thu nhập. Đây là trường hợp của phương sai sai số (nhiễu) không đổi, hay phương sai bằng nhau. E(ui2) = 2
7.1 Bản chất Trong hình 7.1b, mức độ dao động giữa tiết kiệm của từng hộ gia đình so với mức tiết kiệm trung bình thay đổi theo thu nhập. Đây là trường hợp phương sai của sai số thay đổi. E(ui2) = i2
Do tích lũy kinh nghiệm mà sai số theo thời gian ngày càng giảm 7.1 Nguyên nhân của phương sai thay đổi Do tích lũy kinh nghiệm mà sai số theo thời gian ngày càng giảm Do bản chất của hiện tượng kinh tế Công cụ về thu thập xử lý số liệu cải thiện dẫn đến sai số đo lường và tính toán giảm
Mô hình hồi quy không đúng (dạng hàm sai, thiếu biến quan trọng) 7.1 Nguyên nhân của phương sai thay đổi Trong mẫu có các outlier (giá trị rất nhỏ hoặc rất lớn so với các giá trị quan sát khác) Mô hình hồi quy không đúng (dạng hàm sai, thiếu biến quan trọng) Hiện tượng phương sai thay đổi thường gặp khi thu thập số liệu chéo (theo không gian)
Ước lượng phương sai của ước lượng OLS, nhìn chung, sẽ bị chệch. 7.1 Hậu quả của phương sai thay đổi Ước lượng OLS vẫn tuyến tính, không chệch nhưng không phải là ước lượng hiệu quả (vì phương sai không nhỏ nhất) Ước lượng phương sai của ước lượng OLS, nhìn chung, sẽ bị chệch.
7.1 Hậu quả của phương sai thay đổi 3. Các khoảng tin cậy và kiểm định giả thuyết thông thường dựa trên phân phối t và F sẽ không còn đáng tin cậy nữa. Chẳng hạn thống kê t
7.1 Hậu quả của phương sai thay đổi Do sử dụng ước lượng của là nên không đảm bảo t tuân theo quy luật phân phối t-student =>kết quả kiểm định không còn tin cậy 4. Kết quả dự báo không còn hiệu quả nữa khi sử dụng các ước lượng OLS có phương sai không nhỏ nhất.
Dựa vào bản chất vấn đề nghiên cứu Xem xét đồ thị của phần dư 7.2 Phương pháp phát hiện phương sai thay đổi Phương pháp định tính Dựa vào bản chất vấn đề nghiên cứu Xem xét đồ thị của phần dư Phương pháp định lượng Kiểm định Park Kiểm định Glejser Kiểm định Goldfeld – Quandt Kiểm định White
1. Dựa vào bản chất vấn đề nghiên cứu VD: nghiên cứu quan hệ giữa chi tiêu tiêu dùng so với thu nhập, phương sai phần dư của chi tiêu tiêu dùng có xu hướng tăng theo thu nhập. Do đó đối với các mẫu điều tra tương tự, người ta có khuynh hướng giả định phương sai của nhiễu thay đổi
2. Xem xét đồ thị của phần dư Biến phụ thuộc Biến độc lập Đường hồi qui ước lượng
2. Xem xét đồ thị của phần dư u Y (a) u Y (b) Hình a cho thấy biến đổi của các ei2 không có tính hệ thống Hình b,c,d cho thấy các ei2 thay đổi khi Y tăng u Y (c) u Y (d)
3. Kiểm định Park Park cho rằng i2 là một hàm số nào đó của biến giải thích X i2 = B1 + B2ln|Xi |+ vi trong đó vi là phần sai số ngẫu nhiên. Vì i2 chưa biết, Park đề nghị sử dụng lnei2 thay cho i2 và chạy mô hình hồi qui sau lnei2 = B1 + B2 ln|Xi|+ vi (*) ei2 được thu thập từ mô hình hồi qui gốc
3. Kiểm định Park Các bước của kiểm định Park: Chạy hàm hồi qui gốc Yi = b1 + b2Xi + Ui 2) Từ hàm hồi qui, tính , phần dư ei và lnei2 3. Chạy hàm hồi qui (*), sử dụng biến giải thích của hàm hồi qui ban đầu. Nếu có nhiều biến giải thích, chạy hồi qui cho từng biến giải thích đó. Hay, chạy hồi qui mô hình với biến giải thích là
3. Kiểm định Park 4) Kiểm định giả thuyết H0: β2 = 0,tức, không có phương sai của sai số thay đổi. Nếu giả thuyết H0 bị bác bỏ, mô hình gốc có phương sai của sai số thay đổi. 5) Nếu giả thuyết H0 được chấp nhận, B1 trong mô hình (*) có thể được xem là giá trị chung của phương sai của sai số không đổi, 2.
4. Kiểm định Glejser Tương tự như kiểm định Park: Sau khi thu thập được phần dư từ mô hình hồi qui gốc, Glejser đề nghị chạy hồi qui | ei | theo biến X nào mà có quan hệ chặt chẽ với i2. Glejser đề xuất một số dạng hàm hồi qui sau: |ei| = B1 + B2Xi + vi
4. Kiểm định Glejser Nếu giả thuyết H0: β2 = 0 bị bác bỏ thì có thể có hiện tượng phương sai sai số thay đổi.
4 mô hình đầu cho kết quả tốt khi sử dụng OLS 4. Kiểm định Glejser Kiểm định Glejser có một số vấn đề như kiểm định Park như sai số vi trong các mô hình hồi qui có giá trị kỳ vọng khác không, nó có tương quan chuỗi. 4 mô hình đầu cho kết quả tốt khi sử dụng OLS 2 mô hình sau (phi tuyến tính tham số) không sử dụng OLS được Do vậy, kiểm định Glejser được dùng để chẩn đoán đối với những mẫu lớn.
5. Kiểm định Goldfeld - Quandt Xét mô hình hồi qui sau: Yi = 1 + 2Xi + ui Giả sử i2 có quan hệ dương với biến X theo cách sau: i2 = 2Xi2 trong đó 2 là hằng số. Các bước thực hiện kiểm định Goldfeld - Quandt như sau: Sắp xếp các quan sát theo thứ tự tăng dần về giá trị của biến X.
5. Kiểm định Goldfeld - Quandt Bỏ qua quan sát ở giữa theo cách sau: Đối với mô hình 2 biến: c = 4 nếu cỡ mẫu khoảng n = 30; c = 10 nếu cỡ mẫu khoảng n = 60. và chia số quan sát còn lại thành 2 nhóm, trong đó mỗi nhóm có (n – c)/2 quan sát.
5. Kiểm định Goldfeld - Quandt Sử dụng phương pháp OLS để ước lượng tham số của các hàm hồi qui đối với (n – c)/2 quan sát đầu và cuối; tính RSS1 và RSS2 tương ứng. Bậc tự do tương ứng là (k là các tham số được ước lượng kể cả hệ số chặn).
5. Kiểm định Goldfeld - Quandt Tính tỷ số tuân theo phân phối F với bậc tự do ở tử số và mẫu số là Nếu > F ở mức ý nghĩa α thì bác bỏ giả thuyết H0, nghĩa là phương sai của sai số thay đổi.
6. Kiểm định White White đã đề nghị một phương pháp không cần đòi hỏi u có phân phối chuẩn. Xét mô hình hồi qui sau: Yi = 1 + 2X2i + 3X3i + ui Bước 1: Ước lượng mô hình trên bằng OLS, thu được các phần dư ei. Bước 2: Ước lượng một trong các mô hình sau ei2 = 1 + 2X2i + 3X3i + 4X2i2 + 5X3i2 + v2i (1)
6. Kiểm định White hay ei2 = 1 + 2X2i + 3X3i + 4X2i2 + 5X3i2 + 6X2iX3i + V2i (2) (1) và (2) có thể có số mũ cao hơn và nhất thiết phải có hệ số chặn bất kể mô hình gốc có hay không. R2 là hệ số xác định bội, thu được từ (1) với mô hình không có số hạng chéo hay (2) với mô hình có số hạng chéo.
2 = 3 = 4 = 5 = 6 = 0 (2) 6. Kiểm định White Bước 3 Đặt GT Ho: 2 = 3 = 4 = 5 = 0 (1) 2 = 3 = 4 = 5 = 6 = 0 (2) Tương đương H0: phương sai của sai số không đổi. nR2 có phân phối xấp xỉ 2(df), với df bằng số hệ số của mô hình (1) và (2) không kể hệ số chặn.
6. Kiểm định White Bước 4 Quy tắc quyết định nR2 < 2(df): chấp nhận Ho nR2 > 2(df): bác bỏ Ho, hay có hiện tượng phương sai sai số thay đổi.
7.4 Biện pháp khắc phục 1. Trường hợp đã biết i2 Có mô hình hồi qui tổng thể 2 biến: Yi = 1 + 2Xi + ui giả sử rằng phương sai sai số i2 đã biết; nghĩa là phương sai sai số của mỗi quan sát đã biết, chia hai vế của mô hình cho i đã biết.
1. Trường hợp đã biết i2 Khi đó Trong thực tế, chia mỗi quan sát Yi và Xi cho i đã biết và chạy hồi qui OLS cho dữ liệu đã được chuyển đổi này. Ước lượng OLS của 1 và 2 được tính theo cách này được gọi là ước lượng bình phương bé nhất có trọng số (WLS); mỗi quan sát Y và X được chia cho trọng số (độ lệch chuẩn) của riêng nó, i.
2. Trường hợp chưa biết i2 Trường hợp 1: Phương sai sai số tỷ lệ với biến giải thích. Var(ui ) = E(ui2) = 2Xi Chia hai vế của mô hình cho căn bậc hai của Xi , với
2. Trường hợp chưa biết i2 Khi đó Lưu ý là để ước lượng mô hình trên, phải sử dụng mô hình hồi qui qua gốc.
Khi đó: 2. Trường hợp chưa biết i2 Trường hợp 2: Phương sai sai số tỷ lệ với bình phương của biến giải thích Var(ui ) =E(ui2) = 2Xi2 Chia hai vế của mô hình cho Xi với Xi ≠0 Khi đó:
2. Trường hợp chưa biết i2 Trường hợp 3: Phương sai sai số tỷ lệ với bình phương của giá trị kỳ vọng của Y Var(ui ) = E(ui2) = 2[E(Yi)]2. Chia hai vế của mô hình cho E(Yi) với
2. Trường hợp chưa biết i2 Bước 1: Ước lượng mô hình hồi qui bằng phương pháp OLS: Yi = 1 + 2Xi + ui và tính Biến đổi mô hình gốc về dạng như sau:
2. Trường hợp chưa biết i2 Bước 2: Ước lượng hồi qui trên dù không chính xác là E(Yi\Xi), nhưng chúng là ước lượng vững, nghĩa là khi cỡ mẫu tăng lên vô hạn thì chúng hội tụ về E(Yi|Xi). Do vậy, phép biến đổi trên có thể dùng được khi cỡ mẫu tương đối lớn. Khi đó
Trường hợp 4: Định dạng lại mô hình. 2. Trường hợp chưa biết i2 Trường hợp 4: Định dạng lại mô hình. Thay vì ước lượng mô hình hồi qui gốc, ước lượng mô hình hồi qui: lnYi = 1 + 2lnXi + ui Tình trạng phương sai sai số không đồng nhất sẽ bớt nghiêm trọng hơn so với mô hình gốc bởi vì khi được logarit hóa, độ lớn các biến bị ‘nén lại’.
Lưu ý Khi nghiên cứu mô hình có nhiều biến giải thích thì việc chọn biến nào để biến đổi cần phải được xem xét cẩn thận. Phép biến đổi logarit không dùng được khi các giá trị của các biến âm. Khi i2 chưa biết, nó sẽ được ước lượng từ một trong các cách biến đổi trên. Các kiểm định t, F mà chúng ta sử dụng chỉ đáng tin cậy khi cỡ mẫu lớn, do đó chúng ta phải cẩn thận khi giải thích các kết quả dựa trên các phép biến đổi khác nhau trong các mẫu nhỏ.
HIỆN TƯỢNG TỰ TƯƠNG QUAN (Autocorrelation) CHƯƠNG 8 HIỆN TƯỢNG TỰ TƯƠNG QUAN (Autocorrelation)
TỰ TƯƠNG QUAN Hiểu bản chất và hậu quả của tự tương quan Biết cách phát hiện tự tương quan và biện pháp khắc phục MỤC TIÊU
NỘI DUNG 1 Bản chất hiện tượng hiện tượng tự tương quan 2 Hậu quả 3 Cách phát hiện tự tương quan 4 Cách khắc phục tự tương quan
8.1 Bản chất Tự tương quan là gì ? Trong mô hình hồi qui tuyến tính cổ điển, giả định rằng không có tương quan giữa các sai số ngẫu nhiên ui, nghĩa là: cov(ui, uj) = 0 (i j) Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà sai số của các quan sát lại phụ thuộc nhau, nghĩa là: cov(ui, uj) 0 (i j) Khi đó xảy ra hiện tượng tự tương quan.
8.1 Bản chất Sự tương quan xảy ra đối với những quan sát theo không gian gọi là “tự tương quan không gian”. Sự tương quan xảy ra đối với những quan sát theo chuỗi thời gian gọi là “tự tương quan thời gian”.
Hình 8.1 Một số dạng biến thiên của nhiễu theo thời gian ui, ei ui, ei t (b) t ui, ei (a) ui, ei t (c) t (d) ui, ei t (e) Hình 8.1 Một số dạng biến thiên của nhiễu theo thời gian
Nguyên nhân Nguyên nhân khách quan: Quán tính: các chuỗi thời gian mang tính chu kỳ, VD: các chuỗi số liệu thời gian về GDP, chỉ số giá, sản lượng, tỷ lệ thất nghiệp… Hiện tượng mạng nhện: phản ứng của cung của nông sản đối với giá thường có một khoảng trễ về thời gian: QSt = 1 + 2Pt-1 + ut Độ trễ: tiêu dùng ở thời kỳ hiện tại phụ thuộc vào thu nhập và chi tiêu tiêu dùng ở thời kỳ trước đó: Ct = 1 + 2It + 3Ct-1 + ut
Nguyên nhân Nguyên nhân chủ quan Hiệu chỉnh số liệu: do việc “làm trơn” số liệu loại bỏ những quan sát “gai góc”. Sai lệch do lập mô hình: bỏ sót biến, dạng hàm sai. Phép nội suy và ngoại suy số liệu
8.2 Hậu quả của tự tương quan Áp dụng OLS thì sẽ có các hậu quả: Các ước lượng không chệch nhưng không hiệu quả (vì phương sai không nhỏ nhất) Phương sai của các ước lượng là các ước lượng chệch, vì vậy các kiểm định t và F không còn hiệu quả.
8.2 Hậu quả của tự tương quan là ước lượng chệch của σ2 R2 của mẫu là ước lượng chệch (dưới) của R2 tổng thể Các dự báo về Y không chính xác
8.3 Cách phát hiện tự tương quan Chạy OLS cho mô hình gốc và thu thập et. Vẽ đường et theo thời gian. Hình ảnh của et có thể cung cấp những gợi ý về sự tự tương quan.
(e) Không có tự tương quan a. Đồ thị et t (a) et t (b) et et t (c) t (d) et t (e) Không có tự tương quan
Thống kê d của Durbin – Watson b. Dùng kiểm định d của Durbin – Watson Thống kê d của Durbin – Watson Khi n đủ lớn thì d 2(1-) với do -1 ≤ ≤ 1, nên 0<= d <=4: = -1 => d = 4: tự tương quan hoàn hảo âm = 0 => d = 2: không có tự tương quan = 1 => d = 0: tự tương quan hoàn hảo dương
Bảng thống kê Durbin cho giá trị tới hạn dU và dL dựa vào 3 tham số: b. Dùng kiểm định d của Durbin – Watson Bảng thống kê Durbin cho giá trị tới hạn dU và dL dựa vào 3 tham số: α: mức ý nghĩa k’: số biến độc lập của mô hình n: số quan sát dL 2 4 Có tự tương quan dương Không có tự tương quan bậc nhất Có tự tương quan âm Không quyết định được 4-dL dU 4-dU
Các bước thực hiện kiểm định d của Durbin – Watson: b. Dùng kiểm định d của Durbin – Watson Các bước thực hiện kiểm định d của Durbin – Watson: Chạy mô hình OLS và thu thập phần sai số et. Tính d theo công thức trên. Với cỡ mẫu n và số biến giải thích k, tìm giá trị tra bảng dL và dU. Dựa vào các quy tắc kiểm định trên để ra kết luận.
Nếu d thuộc vùng chưa quyết định, sử dụng quy tắc kiểm định cải biên: b. Dùng kiểm định d của Durbin – Watson Nếu d thuộc vùng chưa quyết định, sử dụng quy tắc kiểm định cải biên: H0: = 0; H1: > 0 Nếu d < dU : bác bỏ H0 và chấp nhận H1 (với mức ý nghĩa ), nghĩa là có tự tương quan dương. Có tự tương quan dương dU Không có tự tương quan dương
b. Dùng kiểm định d của Durbin – Watson 2. H0: = 0; H1: < 0 Nếu d > 4 - dU : bác bỏ H0 và chấp nhận H1 (với mức ý nghĩa ), nghĩa là có tự tương quan âm. Không có tự tương quan âm 4-dU Có tự tương quan âm
b. Dùng kiểm định d của Durbin – Watson 3. H0: = 0; H1: ≠ 0 Nếu d <dU hoặc d > 4 - dU : bác bỏ H0 và chấp nhận H1 (với mức ý nghĩa 2), nghĩa là có tự tương quan (âm hoặc dương). Có tự tương quan dương Không có tự tương quan Có tự tương quan âm dU 4-dU
Lưu ý khi áp dụng kiểm định d: Mô hình hồi quy phải có hệ số chặn. b. Dùng kiểm định d của Durbin – Watson Lưu ý khi áp dụng kiểm định d: Mô hình hồi quy phải có hệ số chặn. Các sai số ngẫu nhiên có tương quan bậc nhất: ut = ut-1 + et Mô hình hồi quy không có chứa biến trễ Yt-1. Không có quan sát bị thiếu (missing).
ut = 1ut-1 + 2ut-2 + … + put-p + vt Kiểm định giả thiết c. Dùng kiểm định Breusch – Godfrey (BG) Xét mô hình: Yt = 1 + 2Xt + ut (8.1) ut = 1ut-1 + 2ut-2 + … + put-p + vt Kiểm định giả thiết H0: 1 = 2 = … = = 0, có nghĩa là không tồn tại tự tương quan ở bất kỳ bậc nào trong số từ bậc 1 đến bậc p.
Bước 1: Ước lượng (8.1) bằng OLS, tìm phần dư et c. Dùng kiểm định Breusch – Godfrey (BG) Bước 1: Ước lượng (8.1) bằng OLS, tìm phần dư et Bước 2: Dùng OLS để ước lượng mô hình et = 1 + 2Xt + 1et-1 + 2et-2 + … + pet-p + εt từ đây thu được R2. Bước 3: với n đủ lớn, (n-p)R2 có phân phối xấp xỉ χ2(p) với p là bậc tương quan. - Nếu (n-p)R2 > χ2(p): Bác bỏ H0, nghĩa là có tự tương quan ít nhất ở một bậc nào đó. - Nếu (n-p)R2 ≤ χ2(p): Chấp nhận H0, nghĩa là không có tự tương quan.
Kiểm định BG có đặc điểm: Áp dụng cho mẫu có kích thước lớn c. Dùng kiểm định Breusch – Godfrey (BG) Kiểm định BG có đặc điểm: Áp dụng cho mẫu có kích thước lớn Áp dụng cho mô hình có biến độc lập có dạng Yt-1 , Yt-2 .. Kiểm định được bậc tương quan bất kỳ
Dùng giá trị vừa được ước lượng để chuyển đổi mô hình hồi quy 8.4 Khắc phục Các bước tiến hành Ước lượng giá trị Dùng giá trị vừa được ước lượng để chuyển đổi mô hình hồi quy
Trường hợp đã biết cấu trúc của tự tương quan: Phương pháp GLS: 8.4 Khắc phục Trường hợp đã biết cấu trúc của tự tương quan: Phương pháp GLS: ut tự hồi quy bậc p, AR(p) ut = 1ut-1 + 2ut-2 + … + put-p + vt với : hệ số tự tương quan; < 1 Giả sử ut tự hồi qui bậc nhất AR(1) ut = ut-1 + et (*) et: sai số ngẫu nhiên (nhiễu trắng), thỏa mãn những giả định của OLS: E(et) = 0; Var(et) = 2; Cov(et, et+s) = 0
Nếu (8.2) đúng với t thì cũng đúng với t – 1 8.4 Khắc phục Xét mô hình hai biến: yt = 1 + 1xt + ut (8.2) Nếu (8.2) đúng với t thì cũng đúng với t – 1 yt-1 = 1 + 1xt - 1 + ut - 1 (8.3) Nhân hai vế của (8.3) với yt-1 = 1 + 1xt - 1 + ut - 1 (8.4) Trừ (8.2) cho (8.4) yt - yt-1 = 1(1 - ) + 1 (xt - xt – 1) + (ut - ut – 1) = 1(1 - ) + 1 (xt - xt – 1) + et (8.5)
(8.5) gọi là phương trình sai phân tổng quát Đặt: 1* = 1 (1 - ) 1* = 1 yt* = yt - yt – 1 xt* = xt - xt – 1 Khi đó (8.5) thành yt* = 1* + 1*xt* + et (8.5*) 8.4 Khắc phục
8.4 Khắc phục Vì et thoả mãn các giả định của phương pháp OLS nên các ước lượng tìm được là BLUE Phương trình hồi qui 8.5* được gọi là phương trình sai phân tổng quát (Generalized Least Square – GLS). Để tránh mất mát một quan sát, quan sát đầu của y và x được biến đổi như sau:
2.Trường hợp chưa biết 2. 1 Phương pháp sai phân cấp 1 Nếu = 1, thay vào phương trình sai phân tổng quát (8.5) yt – yt – 1 = 1(xt – xt – 1) + (ut – ut – 1) = 1(xt – xt – 1) + et Hay: yt = 1 xt + et (8.6) (8.6) phương trình sai phân cấp 1 toán tử sai phân cấp 1 Sử dụng mô hình hồi qui qua gốc toạ độ để ước lượng hồi qui (8.6)
ut theo mô hình tự hồi qui bậc nhất 2.1 Phương pháp sai phân cấp 1 Giả sử mô hình ban đầu yt = 1 + 1xt + 2t + ut (8.7) Trong đó t biến xu thế ut theo mô hình tự hồi qui bậc nhất Thực hiện phép biến đổi sai phân cấp 1 đối với (8.7) yt = 1xt + 2 + et trong đó: yt = yt – yt – 1 xt = xt – xt – 1
Nếu = -1, thay vào phương trình sai phân tổng quát (8.5) 2.1 Phương pháp sai phân cấp 1 Nếu = -1, thay vào phương trình sai phân tổng quát (8.5) yt + yt – 1 = 21 + 1(xt + xt – 1) + et Hay: (*) Mô hình * gọi là mô hình hồi qui trung bình trượt.
2.2 Ước lượng dựa trên thống kê d-Durbin-Watson hay Đối với các mẫu nhỏ có thể sử dụng thống kê d cải biên của Theil – Nagar. Dùng giá trị vừa được ước lượng để chuyển đổi số liệu như mô hình 8.5
Giả sử có mô hình hai biến yt = 1 + 1xt + ut (8.8) 2.3 Thủ tục lặp Cochrance – Orcutt để ước lượng Giả sử có mô hình hai biến yt = 1 + 1xt + ut (8.8) Mô hình ut tự tương quan bậc nhất AR(1) ut = ut – 1 + et (8.9) Các bước ước lượng Bước 1: Ước lượng mô hình (8.8) bằng phương pháp OLS và thu được các phần dư et.
Bước 2: Sử dụng các phần dư để ước lượng hồi qui: (8.10) 2.3 Thủ tục lặp Cochrance – Orcutt để ước lượng Bước 2: Sử dụng các phần dư để ước lượng hồi qui: (8.10) Do et là ước lượng vững của ut thực nên ước lượng có thể thay cho thực. Bước 3: Sử dụng thu được từ (8.10) để ước lượng phương trình sai phân tổng quát (8.5) Hay yt* = 1* + 1* xt* + vt (8.11)
Ước lượng phương trình hồi qui tương tự với (8.10) (8.13) 2.3 Thủ tục lặp Cochrance – Orcutt để ước lượng Bước 4: Vì chưa biết thu được từ (8.10) có phải là ước lượng tốt nhất của hay không nên thế giá trị ước lượng của 1* và 1* từ (8.11) vào hồi qui gốc (8.8) và được các phần dư mới et*: et* = yt – (1* + 1* xt) (8.12) Ước lượng phương trình hồi qui tương tự với (8.10) (8.13) (8.13) là ước lượng vòng 2 của . Thủ tục này tiế tục cho đến khi các ước lượng kế tiếp nhau của khác nhau một lượng rất nhỏ, chẳng hạn nhỏ hơn 0,05 hoặc 0,005.
Viết lại phương trình sai phân tổng quát 2.4 Phương pháp Durbin – Watson 2 bước để ước lượng Viết lại phương trình sai phân tổng quát yt = 1(1 - ) + 1 xt – 1xt – 1 + yt – 1 + et (8.14) Thủ tục Durbin – Watson 2 bước để ước lượng : Bước 1: Hồi qui (8.14) yt theo xt, xt – 1 và yt – 1 Xem giá trị ước lượng hệ số hồi qui của yt – 1 (= ) là ước lượng của
Bước 2: Sau khi thu được , thay 2.4 Phương pháp Durbin – Watson 2 bước để ước lượng Bước 2: Sau khi thu được , thay và ước lượng hồi qui (8.5*) với các biến đã được biến đổi như trên.
CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH CHƯƠNG 9 CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH
CHỌN MÔ HÌNH Biết cách tiếp cận để lựa chọn mô hình Biết cách kiểm định việc chọn mô hình MỤC TIÊU
NỘI DUNG 1 Chọn mô hình- Các sai lầm khi chọn mô hình 2 Cách tiếp cận để lựa chọn mô hình 3 Kiểm định việc chọn mô hình 4
Tính thích hợp: Mô hình có R2 càng cao càng thích hợp 1. Chọn mô hình Tiết kiệm Tính đồng nhất Tính thích hợp: Mô hình có R2 càng cao càng thích hợp Tính bền vững về mặt lý thuyết: mô hình phải phù hợp với lý thuyết nền tảng Khả năng dự báo cao
Các tham số ước lượng sẽ bị chệch và không vững. 2. Các sai lầm khi chọn mô hình- Hậu quả 1. Bỏ sót biến thích hợp Các tham số ước lượng sẽ bị chệch và không vững. Khoảng tin cậy và các kiểm định không chính xác. Dự báo dựa trên mô hình sai sẽ không đáng tin cậy.
2. Đưa vào mô hình những biến không phù hợp 2. Các sai lầm khi chọn mô hình- Hậu quả 2. Đưa vào mô hình những biến không phù hợp Các ước lượng không hiệu quả, khoảng tin cậy rộng.
3. Lựa chọn mô hình không chính xác 2. Các sai lầm khi chọn mô hình- Hậu quả 3. Lựa chọn mô hình không chính xác Ước lượng chệch các hệ số hồi quy, dấu của hệ số hồi quy có thể sai. Có ít hệ số hồi quy ước lượng được có ý nghĩa thống kê R2 không cao Phần dư các quan sát lớn và biểu thị sự biến thiên có tính hệ thống.
Về hàm chi phí của doanh nghiệp, dạng hàm đúng Ví dụ Về hàm chi phí của doanh nghiệp, dạng hàm đúng Yi = b1 + b2Xi + b3Xi2 + b4Xi3 + u1i Bỏ sót biến quan trọng (Xi3) Yi = a1 + a2Xi + a3Xi2 + u2i Đưa biến không liên quan vào mô hình (Xi4) Yi = l1 + l2Xi + l3Xi2 + l4Xi3 + l5Xi4 + u3i Dạng hàm sai lnY = g1 + g2Xi + g3Xi2 + g4Xi3 + u4i
3. Cách tiếp cận để lưa chọn mô hình Xác định số biến độc lập Từ đơn giản đến tổng quát Từ tổng quát đến đơn giản 2. Kiểm định mô hình có vi phạm giả thiết Nếu mô hình vi phạm thì cần có biện pháp khắc phục. 3. Chọn dạng hàm, dựa vào Các lý thuyết kinh tế Các kết quả nghiên cứu thực nghiệm 4. Sử dụng các tiêu chuẩn thông dụng để chọn mô hình
4. Kiểm định việc chọn mô hình a. Kiểm định thừa biến (kiểm định Wald) Xét hai mô hình: (U): mô hình không bị ràng buộc (R): mô hình bị ràng buộc Điều kiện ràng buộc: các hệ số hồi quy của các biến Xm , Xm+1 , Xk đồng thời bằng 0
Xây dựng giả thiết để kiểm định đk ràng buộc a. Kiểm định Wald Xây dựng giả thiết để kiểm định đk ràng buộc H0: βm =… βk = 0 H1: có ít nhất một βj khác 0 B1: Hồi quy mô hình (U) có k tham số, tính RSSU có n-k bậc tự do B2: Hồi quy mô hình (R) có m tham số, tính RSSR có n-m bậc tự do B3: Tính F
B4: Tra bảng F với mức ý nghĩa α có giá trị Fα (k-m, n-k) a. Kiểm định Wald B4: Tra bảng F với mức ý nghĩa α có giá trị Fα (k-m, n-k) Quy tắc quyết định Nếu F≥ Fα (k-m, n-k): bác bỏ H0, tức mô hình (U) không thừa biến Nếu F< Fα (k-m, n-k): chấp nhận H0 Nếu dùng kết quả p-value thì quy tắc quyết định như sau: Nếu p ≤ : Bác bỏ H0 Nếu p > : Chấp nhận H0
b. Kiểm định bỏ sót biến giải thích Dùng kiểm định Reset của Ramsey: Bước 1: Dùng OLS để ước lượng mô hình Yi = 1 + 2X2i + ui Từ đó tính và R2old Bước 2: dùng OLS để ước lượng mô hình Tính R2new Kiểm định giả thiết H0: 3 = 4 =… = k = 0
k: số tham số trong mô hình mới m: số biến đưa thêm vào b. Kiểm định bỏ sót biến giải thích Bước 3: Tính n: số quan sát k: số tham số trong mô hình mới m: số biến đưa thêm vào
Bước 4: Quy tắc quyết định b. Kiểm định bỏ sót biến giải thích Bước 4: Quy tắc quyết định Nếu F > F(m,n-k): Bác bỏ H0, tức các hệ số 3,4,…k không đồng thời bằng 0, mô hình cũ đã bỏ sót biến Nếu F < F(m,n-k): Chấp nhận H0 Nếu dùng kết quả p-value thì quy tắc quyết định như sau: Nếu p ≤ : Bác bỏ H0 Nếu p > : Chấp nhận H0
Dùng kiểm định χ2, hay kiểm định Jarque-Bera c. Kiểm định giả thiết phân phối chuẩn của ui Dùng kiểm định χ2, hay kiểm định Jarque-Bera Kiểm định giả thiết H0: ui có phân phối chuẩn Nếu JB > χ2, Bác bỏ H0, ngược lại, chấp nhận H0
5.Tiêu chuẩn lựa chọn mô hình R2, R2 điều chỉnh, Giá trị của hàm hợp lý log-likelihood (L), Tiêu chuẩn thông tin Akaike (AIC), Tiêu chuẩn thông tin Schwarz (SIC)
Tiêu chuẩn R2 R2 đo lường % biến động của Y được giải thích bởi các Xi trong mô hình. R2 càng gần 1, mô hình càng phù hợp. Lưu ý: R2 chỉ đo lường sự phù hợp trong mẫu Khi so sánh R2 giữa các mô hình khác nhau, các biến phụ thuộc phải giống nhau. R2 không giảm khi tăng thêm biến độc lập.
Tiêu chuẩn R2 điều chỉnh (R2) R2 R2.R2 chỉ tăng khi giá trị tuyệt đối của giá trị t của biến được thêm vào mô hình lớn hơn 1. R2 là tiêu chuẩn tốt hơn R2. Các biến phụ thuộc cũng phải giống nhau.
Giá trị của hàm hợp lý log-likelihood (L) Giá trị L càng lớn chứng tỏ mô hình càng phù hợp
Tiêu chuẩn thông tin Akaike (AIC) hay Trong đó k là số biến được ước lượng (gồm cả hệ số tự do) và n là cỡ mẫu. Giá trị AIC càng nhỏ chứng tỏ mô hình càng phù hợp.
Tiêu chuẩn thông tin Schwarz (SC) hay SC khắt khe hơn AIC. SC càng nhỏ, mô hình càng tốt.