BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
c¸c thÇy c« gi¸o vÒ dù héi gi¶ng côm
Advertisements

Kiểm thử và đảm bảo chất lượng phần mềm
GV: BÙI VĂN TUYẾN.
TRÌNH BỆNH ÁN KHOA NGOẠI TỔNG HỢP.
TỔNG QUAN MÔN HỌC KINH TẾ LƯỢNG
Cơ cấu thương mại hàng hóa việt nam – nhật bản giai đoạn
KẾ TOÁN TÀI CHÍNH 1 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Học phần: LẬP TRÌNH CƠ BẢN
BÀI GIẨNG NGUYÊN LÝ THỐNG KÊ
Phần thứ hai Vai trò của các yếu tố nguồn lực trong tăng trưởng.
Nguyễn Văn Vũ An Bộ môn Tài chính – Ngân hàng (TVU)
ĐẠI SỐ BOOLEAN VÀ MẠCH LOGIC
LASER DIODE CẤU TRÚC CẢI TIẾN DỰA VÀO HỐC CỘNG HƯỞNG
1 BÁO CÁO THỰC TẬP CO-OP 3,4 PHÒNG TRỊ BỆNH TRÊN CHÓ MÈO Sinh viên: Nguyễn Quang Trực Lớp: DA15TYB.
Trường THPT Quang Trung
Trường Đại Học Điện Lực Khoa Đại Cương Hóa Đại Cương.
II Cường độ dòng điện trong chân không
BÀI TIỂU LUẬN KẾT THÚC MÔN LÍ LUẬN DẠY HỌC HIỆN ĐẠI
CHƯƠNG 2 HỒI QUY ĐƠN BIẾN.
Sự nóng lên và lạnh đi của không khí Biến thiên nhiệt độ không khí
TIÊT 3 BÀI 4 CÔNG NGHỆ 9 THỰC HÀNH SỬ DỤNG ĐỒNG HỒ VẠN NĂNG.
Bài giảng tin ứng dụng Gv: Trần Trung Hiếu
ĐỘ PHẨM CHẤT BUỒNG CỘNG HƯỞNG
MA TRẬN VÀ HỆ PHƯƠNG TRÌNH ĐẠI SỐ TUYẾN TÍNH
TÁC ĐỘNG CỦA THU HỒI ĐẤT KHU VỰC NÔNG THÔN ĐẾN THU NHẬP VÀ CHI TIÊU CỦA CÁC HỘ GIA ĐÌNH TẠI THÀNH PHỐ CẦN THƠ NCS Lê Thanh Sơn.
BÀI 5: PHÂN TÍCH PHƯƠNG SAI (ANOVA)
NGHIÊN CỨU HÌNH THÁI , CẤU TRÚC GAN , ĐƯỜNG KÍNH VÀ PHỔ DOPPLER TĨNH MẠCH CỬA QUA SIÊU ÂM Ở BỆNH NHÂN XƠ GAN (ĐỀ CƯƠNG CKII NỘI TIÊU HÓA)
Chương 6 TỰ TƯƠNG QUAN.
Chương 2 HỒI QUY 2 BIẾN.
Tối tiểu hoá hàm bool.
CHƯƠNG 7 Thiết kế các bộ lọc số
Bài tập Xử lý số liệu.
HIỆN TƯỢNG TỰ TƯƠNG QUAN (Autocorrelation)
CHƯƠNG 2 DỰ BÁO NHU CẦU SẢN PHẨM
ĐẠI HỌC HÀNG HẢI VIỆT NAM
CHƯƠNG 1: KHÁI QUÁT VỀ HỆ THỐNG VIỄN THÔNG
GV giảng dạy: Huỳnh Thái Hoàng Nhóm 4: Bùi Trung Hiếu
(Cải tiến tính chất nhiệt điện bằng cách thêm Sb vào ZnO)
LỌC NHIỄU TÍN HIỆU ĐIỆN TIM THỜI GIAN THỰC BẰNG VI ĐiỀU KHIỂN dsPIC
QUY TRÌNH CHUYỂN VỀ TUYẾN DƯỚI CÁC BỆNH NHÂN THỞ MÁY NẰM LÂU
NỘI DUNG Chương 1: Giới thiệu môn học
ROBOT CÔNG NGHIỆP Bộ môn Máy & Tự động hóa.
ĐỊA CHẤT CẤU TẠO VÀ ĐO VẼ BẢN ĐỒ ĐỊA CHẤT
cho Ngân hàng Nhà nước Việt Nam
PHÁT XẠ NHIỆT ĐIỆN TỬ PHẠM THANH TÂM.
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI
ĐỊNH GIÁ CỔ PHẦN.
CHƯƠNG 11. HỒI QUY ĐƠN BIẾN - TƯƠNG QUAN
SỰ PHÁT TẦN SỐ HIỆU HIỆU SUẤT CAO TRONG TINH THỂ BBO
Kinh tế vĩ mô của nền kinh tế mở: Những khái niệm cơ bản
Võ Ngọc Điều Đại học Bách Khoa TP Hồ Chí Minh Lê Đức Thiện Vương
Corynebacterium diphtheriae
CHUYÊN ĐỀ 5: KỸ THUẬT TỔ CHỨC HOẠT ĐỘNG HỌC CỦA HỌC SINH
QUẢN TRỊ HÀNG TỒN KHO VÀ TIỀN MẶT
PHAY MẶT PHẲNG SONG SONG VÀ VUÔNG GÓC
GV: ThS. TRƯƠNG QUANG TRƯỜNG TRƯỜNG ĐẠI HỌC NÔNG LÂM TP.HCM
CHƯƠNG II: LÝ THUYẾT HIỆN ĐẠI VỀ THƯƠNG MẠI QUỐC TẾ.
KIỂM TRA BÀI CŨ CÂU 1: * Nêu định nghĩa đường thẳng vuông góc với mặt phẳng? * Nêu cách chứng minh đường thẳng d vuông góc với mp(α)? d  CÂU 2: * Định.
NHIỆT LIỆT CHÀO MỪNG QUÝ THẦY CÔ VỀ DỰ GIỜ LỚP 7A Tiết 21 - HÌNH HỌC
Tiết 20: §1.SỰ XÁC ĐỊNH ĐƯỜNG TRÒN. TÍNH CHẤT ĐỐI XỨNG CỦA ĐƯỜNG TRÒN
Chương I: BÀI TOÁN QHTT Bài 5. Phương pháp đơn hình cho bài toán QHTT chính tắc có sẵn ma trận đơn vị xét bt: Với I nằm trong A, b không âm.
XLSL VÀ QHTN TRONG HÓA (30)
Líp 10 a2 m«n to¸n.
ĐÀI TIẾNG NÓI VIỆT NAM TRƯỜNG CAO ĐẲNG PTTH 1.
PHƯƠNG PHÁP CHỌN MẪU TRONG NGHIÊN CỨU MARKETING
CƠ HỌC LÝ THUYẾT 1 TRƯỜNG ĐẠI HỌC KĨ THUẬT CÔNG NGHIỆP THÁI NGUYÊN
Quản trị kinh doanh nông nghiệp
KHUẾCH ĐẠI VÀ DAO ĐỘNG THÔNG SỐ QUANG HỌC
LỢI NHUẬN VÀ RỦI RO.
CƠ CHẾ PHẢN ỨNG 1. Gốc tự do, carbocation, carbanion, carben, arin
Μεταγράφημα παρουσίασης:

BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY CHƯƠNG 5 BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY

BIẾN GIẢ 1. Biết cách đặt biến giả 2. Nắm phương pháp sử dụng biến giả trong phân tích hồi quy MỤC TIÊU

NỘI DUNG 1 Khái niệm biến giả 2 Sử dụng biến giả trong mô hình hồi quy 3 Kỹ thuật sử dụng biến giả

5.1 KHÁI NIỆM Biến định lượng: các giá trị quan sát được thể hệ bằng con số Biến định tính: thể hiện một số tính chất nào đó Để đưa những thuộc tính của biến định tính vào mô hình hồi quy, cần lượng hóa chúng => sử dụng biến giả (dummy variables)

Trình độ văn hóa của chủ hộ Chi tiêu của hộ = α + β1* quy mô hộ + β2*trình độ văn hóa của chủ hộ+ β3* tuổi của chủ hộ + β4* giới tính của chủ hộ β5* nơi sinh sống của hộ Mã hộ Quy mô hộ Chi tiêu của hộ Trình độ văn hóa của chủ hộ Tuổi của chủ hộ Giới tính chủ hộ Nơi sinh sống 38820 4 10097.37 3 48 Nam Nông thôn 38818 6 14695.2 8 42 Nữ 38817 11733.34 37 38816 7087.489 21 38815 9 22809.3 38813 9554.563 2 76 11212 7 69258.09 Thành thị 11211 13680.91 77 11209 27651.65 13 32 11208 32102.67 47 11207 11464.6 38 11206 17199.63 5 93

Ví dụ Có hai biến độc lập định tính là giới tính của chủ hộ và nơi sinh sống của hộ. Để phân tích hồi quy cần phải lượng hóa hai biến định tính này. Thực hiện: Giới tính gồm hai biểu hiện là nam và nữ và mã hóa như sau: Nam=1, Nữ=0. Nơi sinh sống của hộ gồm thành thị và nông thôn nên mã hóa như sau: Thành thị=1, Nông thôn=0. (Việc chọn số mã hóa tùy nhà phân tích).

Dữ liệu đã mã hóa Mã hộ Quy mô hộ Chi tiêu của hộ Trình độ văn hóa của chủ hộ Tuổi của chủ hộ Giới tính chủ hộ Nơi sinh sống 38820 4 10097.37 3 48 1 38818 6 14695.2 8 42 38817 11733.34 37 38816 7087.489 21 38815 9 22809.3 38813 9554.563 2 76 11212 7 69258.09 11211 13680.91 77 11209 27651.65 13 32 11208 32102.67 47 11207 11464.6 38 11206 17199.63 5 93

Ví dụ Mã hộ Quy mô hộ Chi tiêu của hộ Trình độ văn hóa của chủ hộ Tuổi của chủ hộ Nghề nghiệp chủ hộ 38820 4 10097.37 3 48 Bác sĩ 38818 6 14695.2 8 42 Giáo viên 38817 11733.34 37 Nông dân 38816 7087.489 21 38815 9 22809.3 38813 9554.563 2 76 11212 7 69258.09 11211 13680.91 77 11209 27651.65 13 32 11208 32102.67 47 11207 11464.6 38 11206 17199.63 5 93

Ví dụ Nghề nghiệp có 3 nghề (3 phạm trù) Chọn 1 nghề làm phạm trù cơ sở Ví dụ: chọn bác sĩ 3. Hai nghề còn lại là hai biến mới Vậy số biến mới = số phạm trù -1 4. Biến Giáo viên nhận 2 giá trị: 1 nếu là giáo viên; 0 nếu không phải là giáo viên 5. Biến Nông dân nhận 2 giá trị: 1 nếu là nông dân; 0 nếu không phải là nông dân

Trình độ văn hóa của chủ hộ Mã hộ Quy mô hộ Chi tiêu của hộ Trình độ văn hóa của chủ hộ Tuổi của chủ hộ Nghề nghiệp chủ hộ Giáo viên Nông dân ### 4 3 48 Bác sĩ  0 6 8 42  1 37 21 9 2 76   7 77 13 32 47 38 5 93

Câu hỏi Nếu có thêm nghề kế toán thì sao?

HỒI QUY VỚI BiẾN ĐỊNH TÍNH Quy tắc: Nếu biến định tính có m biểu hiện thì sử dụng m-1 biến. Ví dụ: Tổng chi tiêu của hộ phụ thuộc vào Giới tính của chủ hộ Số thành viên trong hộ Vùng nơi hộ sinh sống (có 8 vùng) Biến định tính là biến nào?

5.2 Sử dụng biến giả trong mô hình hồi quy Ví dụ 5.1: Xét mô hình Yi = 1 + 2Xi + 3Di + Ui với Y Tiền lương (triệu đồng/tháng) X Bậc thợ D=1 nếu công nhân làm trong khu vực tư nhân D=0 nếu công nhân làm trong khu vực nhà nước D được gọi là biến giả trong mô hình

5.2 Sử dụng biến giả trong mô hình hồi quy Y (thu nhập) X (số năm) D (nơi làm việc) 4 3 1 5 6 7

5.2 Sử dụng biến giả trong mô hình hồi quy E(Y/X,D) = 1 + 2Xi + 3Di (5.1) E(Y/X,D=0) = 1 + 2Xi (5.2) E(Y/X,D=1) = 1 + 2Xi + 3 (5.3) (5.2): tiền lương trung bình của công nhân làm việc trong khu vực quốc doanh với bậc thợ là X (5.3): tiền lương trung bình của công nhân làm việc trong khu vực tư nhân với bậc thợ là X

5.2 Sử dụng biến giả trong mô hình hồi quy 2 tốc độ tăng lương theo bậc thợ 3 chênh lệch tiền lương trung bình của công nhân làm việc ở hai khu vực và cùng bậc thợ (Giả thiết của mô hình: tốc độ tăng lương theo bậc thợ ở hai khu vực giống nhau)

E(Y/X,Z) = 1 + 2Xi + 3Di Y Hình 5.1 mức thu nhập bình quân tháng của người lao động tại KVQD và KVTN khi có bậc thợ là X X

5.2 Sử dụng biến giả trong mô hình hồi quy Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y) (triệu đồng/tháng) vào thời gian công tác (X) (năm) và nơi làm việc của người lao động (DNNN, DNTN và DNLD) Dùng 2 biến giả Z1 và Z2 với Z1i =1 nơi làm việc tại DNNN Z1i =0 nơi làm việc tại nơi khác Z2i =1 nơi làm việc tại DNTN Z2i =0 nơi làm việc tại nơi khác Z1i = 0 và Z2i = 0 phạm trù cơ sở

5.2 Sử dụng biến giả trong mô hình hồi quy Y (thu nhập) X (số năm) Nơi làm việc Z1 Z2 4 3 DNNN 1 5 DNTN DNLD 6 7

5.2 Sử dụng biến giả trong mô hình hồi quy E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i E(Y/X,Z1=0,Z2=0) = 1 + 2Xi E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3 E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4 3 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNNN và DNLD khi có cùng thời gian làm việc X năm 4 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNTN và DNLD khi có cùng thời gian làm việc X năm

5.2 Sử dụng biến giả trong mô hình hồi quy Ví dụ 5.3. thu nhập còn phụ thuộc vào trình độ người lao động (từ đại học trở lên, cao đẳng và khác) D1i = 1: nếu trình độ từ đại học trở lên 0: trường hợp khác D2i 1: nếu trình độ cao đẳng Một chỉ tiêu chất lượng có n phạm trù (thuộc tính) khác nhau thì dùng n-1 biến giả

5.2 Sử dụng biến giả trong mô hình hồi quy Giả sử Y, X là biến định lượng, Z là biến giả (định tính) TH1: Y= 1 + 2Z + 3X + U TH2: Y= 1 + 2X + 3(ZX) + U TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U

5.2 Sử dụng biến giả trong mô hình hồi quy VD 5.4: Khảo sát lương của nhân viên theo số năm kinh nghiệm và giới tính TH1: Y= 1 + 2Z + 3X + U TH2: Y= 1 + 2X + 3(ZX) + U TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U Trong đó Y lương X số năm kinh nghiệm Z giới tính với Z=1: nam; Z=0: nữ

5.2 Sử dụng biến giả trong mô hình hồi quy TH1: Lương khởi điểm của nv nam và nữ khác nhau nhưng tốc độ tăng lương theo số năm kinh nghiệm như nhau TH2: Lương khởi điểm như nhau nhưng tốc độ tăng lương khác nhau TH3: Lương khởi điểm và tốc độ tăng lương khác nhau

5.2 Sử dụng biến giả trong mô hình hồi quy TH1: Lương khởi điểm của nv nam và nữ khác nhau nhưng tốc độ tăng lương theo số năm kinh nghiệm như nhau Hàm PRF: Y= 1 + 2Z + 3X + U Hàm SRF ứng với nữ (Z=0) : Hàm SRF ứng với nam (Z=1) :

5.2 Sử dụng biến giả trong mô hình hồi quy Hình 5.2 Lương khởi điểm của nv nam và nữ khác nhau

5.2 Sử dụng biến giả trong mô hình hồi quy TH2: Lương khởi điểm như nhau nhưng tốc độ tăng lương khác nhau Hàm PRF: Y= 1 + 2X + 3(ZX) + U Với ZX gọi là biến tương tác Hàm SRF ứng với nữ (Z=0) : Hàm SRF ứng với nam (Z=1) :

5.2 Sử dụng biến giả trong mô hình hồi quy Hình 5.3 Mức tăng lương theo số năm kinh nghiệm của nv nam và nữ khác nhau

5.2 Sử dụng biến giả trong mô hình hồi quy TH3: Lương khởi điểm và tốc độ tăng lương khác nhau Hàm PRF: Y= 1 + 2Z + 3X + 4(ZX)+ U Hàm SRF ứng với nữ (Z=0) : Hàm SRF ứng với nam (Z=1) :

5.2 Sử dụng biến giả trong mô hình hồi quy Hình 5.4 Lương khởi điểm và mức tăng lương của nv nam và nữ khác nhau

5.3 Ứng dụng sử dụng biến giả 5.3.1 Sử dụng biến giả trong phân tích mùa Y chi tiêu cho tiêu dùng X thu nhập Z = 1 nếu quan sát trong mùa (tháng 1-6) Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12) TH1: Nếu yếu tố mùa chỉ ảnh hưởng đến hệ số chặn TH2: Nếu yếu tố mùa có ảnh hưởng đến hệ số góc Mô hình * có tính tổng quát hơn. Qua việc kiểm định giả thiết để biết được hệ số góc nào có ý nghĩa.

Ví dụ Có bảng số liệu sau về doanh số bán từng quý (triệu đồng). Hãy sắp xếp lại số liệu, sử dụng biến giả và viết mô hình hồi quy. Năm Quý Doanh số 1970 1 992.7 1971 4 1918.3 2 1077.6 1972 2163.9 3 1185.9 2417.8 1326.4 2631.7 1434.2 2957.8 1549.2 1973 3069.3 1718 3304.8

Ví dụ Năm Quý Doanh số D2 D3 D4 1970 1 992.7 2 1077.6 3 1185.9 4 2 1077.6 3 1185.9 4 1326.4 1971 1434.2 1549.2 1718 1918.3 1972 2163.9 2417.8 2631.7 2957.8 1973 3069.3 3304.8

Viết mô hình hồi quy mẫu và ý nghĩa các hệ số

5.3 Ứng dụng sử dụng biến giả 5.3.2 Kiểm định tính ổn định cấu trúc của các mô hình hồi quy Ví dụ 5.5. Số liệu tiết kiệm (Y) và thu nhập cá nhân (X) ở nước Anh từ 1946-63 (triệu pounds)

5.3 Ứng dụng sử dụng biến giả Mục tiêu: Kiểm tra hàm tiết kiệm có thay đổi cấu trúc giữa 2 thời kỳ hay không. Cách 1 Lập hai mô hình tiết kiệm ở 2 thời kỳ Thời kỳ tái thiết: 1946-54 (5.3.1) Thời kỳ hậu tái thiết: 1955-63 (5.3.2) Và kiểm định các trường hợp sau

Kiểm định Chow Giả thiết: H0: Hai hàm (5.3.1) và (5.3.2) giống nhau B1: Gộp hai nhóm quan sát n=n1+n2 và tính RSS có bậc tự do df= n1+n2-k từ mô hình hồi quy B2: Ước lượng (5.3.1) và (5.3.2) và thu được RSS1 có df = n1-k, RSS2 có df = n2-k. Đặt RSS*=RSS1+RSS2 B3: Tính B4: Nếu F > Fα(k, n1+n2-2k): bác bỏ H0

5.3 Ứng dụng sử dụng biến giả Cách 2 Sử dụng biến giả B1. Lập hàm tiết kiệm tổng quát của cả 2 thời kỳ Với n = n1 + n2 Z = 1 quan sát thuộc thời kỳ tái thiết Z = 0 quan sát thuộc thời kỳ hậu tái thiết B2. Kiểm định giả thiết H0: 3=0 Nếu chấp nhận H0: loại bỏ Z ra khỏi mô hình B3. Kiểm định giả thiết H0: 4=0 Nếu chấp nhận H0: loại bỏ ZiXi ra khỏi mô hình

5.3 Ứng dụng sử dụng biến giả Kết quả hồi quy theo mô hình như sau t = (-5,27) (9,238) (3,155) (-3,109) p = (0,000) (0,000) (0,007) (0,008) Nhận xét Tung độ gốc chênh lệch và hệ số góc chênh lệch có ý nghĩa thống kê Các hồi quy trong hai thời kỳ là khác nhau

5.3 Ứng dụng sử dụng biến giả Thời kỳ tái thiết: Z = 1 Thời kỳ hậu tái thiết: Z = 0

5.3 Ứng dụng sử dụng biến giả Thu nhập Tiết kiệm Thời kỳ hậu tái thiết Thời kỳ tái thiết -0.27 -1.75 Hình 5.6 Mô hình hồi quy cho 2 thời kỳ

5.3 Ứng dụng sử dụng biến giả 5.3.3. Hàm tuyến tính từng khúc Ví dụ 5.6: Doanh thu dưới X* thì tiền hoa hồng sẽ khác với khi doanh thu trên X*. Hàm hồi quy có dạng Y Tiền hoa hồng X Doanh thu X* Giá trị ngưỡng sản lượng Zi =1 nếu Xi > X* Zi =0 nếu Xi ≤ X*

5.3 Ứng dụng sử dụng biến giả Y X Hình 5.7 Hàm tuyến tính từng khúc Kiểm định giả thiết H0: 3=0 Nếu bác bỏ H0: hàm hồi quy thay đổi cấu trúc

5.3 Ứng dụng sử dụng biến giả Ví dụ: Sản lượng dưới X*, thì chi phí hoa hồng sẽ khác với khi sản lượng trên X*. Hàm hồi quy sẽ có dạng: Y: Chi phí; X: sản lượng; X*=5.500 tấn: giá trị ngưỡng sản lượng

5.3 Ứng dụng sử dụng biến giả Ta có kết quả hồi quy như sau: t = (-0,824) (6,607) (1,145) R2 = 0,9737 X* = 5500