Bài giảng tin ứng dụng Gv: Trần Trung Hiếu Bộ môn CNPM – Khoa CNTT

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
CHI PHÍ ĐIỀU TRỊ NỘI TRÚ BỆNH HEN PHẾ QUẢN TẠI TRUNG TÂM DỊ ỨNG - MIỄN DỊCH LÂM SÀNG BỆNH VIỆN BẠCH MAI NĂM 2015 Học viên: NGUYỄN THỊ VIỆT HÀ NHD: ThS.BS.
Advertisements

Nghiên cứu chế tạo thiết bị thử nghiệm đánh giá tình trạng
Điện tử cho CNTT Electronic for IT Trần Tuấn Vinh
Tiết 41: SỰ PHÁT SINH LOÀI NGƯỜI
BÀI GIẢNG ĐIỆN TỬ Bài 9: SÓNG DỪNG (Vật Lý 12 cơ bản) Tiết 16
Chương 5: Vận chuyển xuyên hầm
DLC Việt Nam có trên 30 sản phẩm
LÝ THUYẾT XÁC SUẤT 45 tiết=15 buổi=6 chương
Sự nóng lên và lạnh đi của không khí Biến thiên nhiệt độ không khí
Chiến lược toàn cầu xử trí hen phế quản GINA 2015
NHẬP MÔN KINH TẾ LƯỢNG (ECONOMETRICS)
Trao đổi trực tuyến tại:
CHƯƠNG 4: CÁC LOẠI BẢO VỆ 4.1 Bảo vệ quá dòng Nguyên tắc hoạt động 4.2 Bảo vệ dòng điện cực đại (51) Nguyên tắc hoạt động Thời gian làm.
VIÊM HỆ THỐNG XOANG TRƯỚC: GIẢI PHẪU LÂM SÀNG, CẬN LÂM SÀNG, CHẨN ĐOÁN VÀ HƯỚNG XỬ TRÍ CHUYÊN ĐỀ MŨI XOANG BS.LÊ THANH TÙNG.
Lý thuyết ĐKTĐ chuyện thi cử
1. Lý thuyết cơ bản về ánh sáng
Two Theories of Bonding
CHƯƠNG VII PHƯƠNG SAI THAY ĐỔI
virut vµ bÖnh truyÒn nhiÔm
Chương1.PHỔ HỒNG NGOẠI Infrared (IR) spectroscopy
HỆ THỐNG THU THẬP DỮ LIỆU ĐO LƯỜNG

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN BỘ MÔN VẬT LÝ ỨNG DỤNG
Chương IV. Tuần hoàn nước trong tự nhiên
Chương 4 Biến ngẫu nhiên hai chiều rời rạc
CHƯƠNG 3 HỒI QUY ĐA BIẾN.
CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH
2.1. Phân tích tương quan 2.2. Phân tích hồi qui
Chương 2 MÔ HÌNH HỒI QUY HAI BIẾN.
TS. Nguyễn Xuân Hiệp PHÂN TÍCH Hoạt Động Kinh Doanh Xuất Nhập Khẩu TS. Nguyễn Xuân Hiệp
ĐỊNH THỨC VÀ HỆ PHƯƠNG TRÌNH ĐẠI SỐ TUYẾN TÍNH
UNG THƯ GV hướng dẫn: BS. Nguyễn Phúc Học Nhóm 10 - Lớp PTH 350 H:
PHÂN TÍCH DỰ ÁN Biên soạn: Nguyễn Quốc Ấn
CÁC YẾU TỐ MÔI TRƯỜNG TỰ NHIÊN ẢNH HƯỞNG ĐẾN SẢN XUẤT CÂY TRỒNG
(Vietnam Astrophysics Training Laboratory −VATLY)
ĐIỀU TRA CHỌN MẪU TRONG THỐNG KÊ
Trường THPT QUANG TRUNG
ROBOT CÔNG NGHIỆP Bộ môn Máy & Tự động hóa.
Trường THPT Quang Trung Tổ Lý
CHƯƠNG 4 DẠNG HÀM.
ĐỊA CHẤT CẤU TẠO VÀ ĐO VẼ BẢN ĐỒ ĐỊA CHẤT
chúc mừng quý thầy cô về dự giờ với lớp
TRƯỜNG THPT QUANG TRUNG - ĐÀ NẴNG
XPS GVHD: TS Lê Vũ Tuấn Hùng Học viên thực hiện: - Lý Ngọc Thủy Tiên
ĐỀ TÀI : MÁY ÉP CỌC BÊ TÔNG CỐT THÉP
Tiết 3-Bài 3: Dụng cụ dùng trong lắp đặt mạng điện
BÀI 2 PHAY MẶT PHẲNG BẬC.
Xác suất Thống kê Lý thuyết Xác suất: xác suất, biến ngẫu nhiên (1 chiều, 2 chiều); luật phân phối xác suất thường gặp Thống kê Cơ bản: lý thuyết mẫu,
Thực hiện: Bùi Thị Lan Hướng dẫn: Ths. Ngô Thị Thanh Hải
Giáo viên: Lâm Thị Ngọc Châu
BÀI TẬP ĐỊA LÍ TỰ NHIÊN (CÁC DẠNG BÀI TẬP VỀ VẬN ĐỘNG CỦA TRÁI ĐẤT)
CHUYÊN ĐỀ: THUYÊN TẮC PHỔI TRONG PHẪU THUẬT CTCH
CƯỜNG GIÁP TRƯỜNG ĐẠI HỌC DUY TÂN KHOA DƯỢC
MÔN VẬT LÝ 10 Bài 13 : LỰC MA SÁT Giáo viên: Phạm Thị Hoa
ĐẠI HỌC HÀNG HẢI VIỆT NAM
Những vấn đề kinh tế cơ bản trong sản xuất nông nghiệp
HIỆN TRẠNG CHẤT LƯỢNG KHÔNG KHÍ TẠI THÀNH PHỐ HỒ CHÍ MINH
THIẾT KẾ VÀ ĐÁNH GIÁ THUẬT TOÁN
Bài giảng tin ứng dụng Gv: Trần Trung Hiếu Bộ môn CNPM – Khoa CNTT
LINH KIỆN ĐIỆN TỬ NANO SEMINAR GVHD: PGS.TS.TRƯƠNG KIM HIẾU
1 BỆNH HỌC TUYẾN GIÁP Ths.BS Hoàng Đức Trình.
CHƯƠNG 4: CÁC KHÍ CỤ ĐIỆN ĐO LƯỜNG
Công nghệ sản xuất Nitrobenzen và Anilin
CƠ HỌC LÝ THUYẾT 1 TRƯỜNG ĐẠI HỌC KĨ THUẬT CÔNG NGHIỆP THÁI NGUYÊN
Chương 2: SÓNG CƠ VÀ SÓNG ÂM SÓNG CƠ VÀ SỰ TRUYỀN SÓNG CƠ
ĐƯỜNG THẲNG VÀ MẶT PHẲNG TRONG KHÔNG GIAN
BỆNH LÝ VỎ THƯỢNG THẬN GVHD : ThS. BS. Nguyễn Phúc Học
TRÖÔØNG HÔÏP ÑOÀNG DAÏNG THÖÙ III
Μεταγράφημα παρουσίασης:

Bài giảng tin ứng dụng Gv: Trần Trung Hiếu Bộ môn CNPM – Khoa CNTT Email: tthieu@hua.edu.vn Website: http://fita.hua.edu.vn/tthieu

Chương III: Các thống kê cơ bản, tương quan & hồi quy I. Thống kê mô tả (Desriptive Statistics) a. Các bước thực hiện b. Phân tích kết quả II. Tổ chức đồ (Histogram) III. Tương quan và hồi qui a. Tính hệ số tương quan b. Hồi quy tuyến tính c. Hồi quy phi tuyến

Giới thiệu về phân phối chuẩn Phân phối chuẩn, còn gọi là phân phối Gauss, là một phân phối xác suất cực kì quan trọng trong nhiều lĩnh vực. Nó là họ phân phối có dạng tổng quát giống nhau, chỉ khác tham số vị trí (giá trị trung bình μ) và tỉ lệ (phương sai σ2). Định nghĩa: Biến ngẫu nhiên X có phân phối chuẩn với các tham số m (kỳ vọng), σ2 (phương sai) nếu nó có hàm mật độ:

Đồ thị hàm mật độ phân phối chuẩn

Đồ thị hàm phân bố trong phân phối chuẩn

I. Thống kê mô tả (Descriptive Statistics) Ví dụ 1 – trang 23 Liên hệ xác suất thống kê và các thuật ngữ Excel sử dụng trong thống kê mô tả Thống kê mô tả cho phép tính các số đặc trưng mẫu, các giá trị thống kê mẫu như trung bình, độ lệch chuẩn, sai số chuẩn, trung vị, mode…Số liệu tính toán được bố trí theo cột hoặc theo dòng Mean (trung bình hay kỳ vọng): đặc trưng cho giá trị trung bình của DLNN Standard Deviation (độ lệch chuẩn), Sample Variance (phương sai mẫu): đặc trưng cho độ phân tán các giá trị của DLNN xung quanh giá trị trung bình Standard Error (sai số chuẩn): Sai số của trung bình Median (trung vị): cho giá trị điểm giữa của dãy số, trong xác suất là giá trị Me của đại lượng ngẫu nhiên X sao cho P(X<Me)=P(X>Me) Mode: là giá trị của biến ngẫu nhiên ứng với xác suất cực đại hay giá trị có tần suất xuất hiện trong mẫu lớn nhất

I. Thống kê mô tả (Descriptive Statistics) 2. Liên hệ xác suất thống kê và các thuật ngữ Excel sử dụng trong thống kê mô tả (tiếp) Kurtosis (độ nhọn): trong xác suất, người ta chứng minh được nếu DLNN X có phân phối chuẩn thì độ nhọn bằng 0. Ở đây, độ nhọn đánh giá đường mật độ phân phối của dãy số liệu có nhọn hơn hay tù hơn đường mật độ chuẩn tắc (dương là nhọn hơn, âm là tù hơn). Nếu trong khoảng [-2,2] thì có thể coi số liệu xấp xỉ chuẩn Skewness (Độ lệch): Trong xác suất gọi là hệ số bất đối xứng đánh giá sự phân phối các giá trị có cân đối đối với giá trị trung bình hay không, nếu các giá trị của X đối xứng qua kỳ vọng thì Skewness=0  biểu hiện ở đường phân phối lệch trái hay lệch phải (âm là lệch trái, dương là lệch phải). Nếu trong khoảng [-2,2] thì có thể coi như số liệu cân đối như trong phân phối chuẩn. Confidence Level (Nửa độ dài khoảng tin cậy): Ví dụ: Confidence level = 95% Trong xác suất tương đương bài toán tìm giá trị α sao cho P(m- α<=X<=m+ α) = 95% Tìm giá trị α sao cho xác suất X rơi vào khoảng [m- α,m+ α] là 95%

Kurtosis > 0 đường màu đỏ, Kurtosis <0 đường màu xanh phía dưới, =0 đường màu xanh ở giữa (chuẩn)

Nếu Kurtosis > 0, kurtosis càng lớn đồ thị càng nhọn Nếu Kurtosis > 0, kurtosis càng lớn đồ thị càng nhọn. Nếu kurtosis <0, kurtosis càng bé đồ thị càng tù

Skewness > 0 là lệch phải, <0 là lệch trái

II. Tổ chức đồ Ví dụ 2 – trang 25 Tần số xuất hiện của số liệu trong các khoảng cách đều nhau cho phép phác họa biểu đồ tần số. Để vẽ biểu đồ cần thực hiện qua 2 bước: bước chuẩn bị và bước vẽ tổ chức đồ Chuẩn bị: Dể số liệu ở một cột, một hàng hay một bảng chữ nhật Tìm giá trị lớn nhất (hàm Max), nhỏ nhất (hàm Min) Tính khoảng biến thiên R=Max-Min Chọn số khoảng k của miền phân tổ (thực tế chọn k từ 20-30, ví dụ minh họa chọn k từ 6-10), có thể lấy bằng công thức 6*log(n) trong đó n là số giá trị của DLNN X (lấy giá trị nguyên xấp xỉ) Tìm giá trị bước tăng trong miền phân tổ h = R/k (Sử dụng hàm Round(R/k,số chữ số lẻ) Tạo cột bin (Edit->Fill->Series, xem trang 25, 20)

II. Tổ chức đồ Chuẩn bị: Vẽ tổ chức đồ Phân tích kết quả từ biểu đồ Chọn Tool -> Data Analysis-> Histogram để khai báo các mục: Input range: Miền dữ liệu Input Bin: Miền phân tổ Labels: Nhãn ở dòng đầu nếu có Output range: Miền kết quả Pareto: Tần số sắp xếp trong tổ chức đồ là giảm dần Cumulative Percentage: Hiển thị đường tần suất cộng dồn % Chart output: Hiển thị biểu đồ Phân tích kết quả từ biểu đồ Trong khoảng nào số liệu xuất hiện nhiều nhất Hình dạng tổ chức đồ có giống hình dạng đường mật độ trong phân phối chuẩn không (có tính đối xứng, nhô cao ở giữa-> dạng đường cong chuông). Nếu có thì kết luận dữ liệu có thể tuân theo luật chuẩn

Hình ảnh về tổ chức đồ

Xem xét các đỉnh của các HCN xấp xỉ đường cong hàm mật độ trong phân phối chuẩn hay không ?

Xem xét trường hợp sau

III. Tương quan và hồi quy Tính hệ số tương quan Ý nghĩa của hệ số tương quan: (xem lại) Excel cho phép tính hệ số tương quan đơn giữa các biến Cách thực hiện: Vào Tools-> Data Analysis-> Correlation và khai báo các mục Input range: miền dữ liệu kể cả nhãn (nên có) Grouped by: số liệu nhóm theo cột hay hàng Labels in first row: tích vào nếu có nhãn ở dòng đầu hay cột đầu Output range: miền output Nhấn OK để kết thúc, cho kết quả là bảng n hàng n cột Ví dụ 3: (Giáo trình)

III. Tương quan và hồi quy b. Hồi quy tuyến tính Cho phép tìm phương trình hồi quy tuyến tính đơn y=a*x +b và hồi quy tuyến tính bội y=a1*x1 + a2*x2 + … + an*xn + b Dữ liệu input: Các biến độc lập chứa trong n cột, biến phụ thuộc y để trong một cột, các giá trị tương ứng giữa biến độc lập và biến phụ thuộc được xếp trên cùng một hàng Ví dụ (giáo trình): Tìm đường hồi quy cuả năng xuất lúa y phụ thuộc vào độ dài bông, trọng lượng 1000 hạt, và số bông

Cách thực hiện: Data-> Analysis-> Regression 18

Xuất hiện hộp thoại Miền dữ liệu của biến phụ thuộc Y Miền dữ liệu của các biến X Có để nhãn đầu dòng không? Độ tin cậy (bằng 1-α, với α là mức xác suất) Hiện đồ thị phần dư Hệ số tự do b = 0 khi tích vào Hiện phần dư hay sai lệch giữa y thực nghiêm và y theo hồi quy Hiện đồ thị đường dự báo 19

Kết quả 20

Phân tích kết quả Nếu hệ số tương quan bội (Multiple R) xấp xỉ >= 0.75 thì mô hình qui hoạch tuyến tính là thích hợp. Ví dụ: Multiple R = 0.8589 -> mô hình tuyến tính coi là thích hợp. Hệ số tương quan (R Square) cho biết sự biến động y do x1, x2, x3 … gây nên. Hệ số Adjusted R Square không sát R Square → không phải tất cả các biến đưa vào là cần thiết. R Square =0.7377 cho biết 73.77% sự biến động của y do x1, x2, x3 gây nên. Adjusted R Square = 66.62% không sát R Square 21

Phân tích kết quả F thực nghiệm = 10.31281 với xác xuất 0.00158 nhỏ hơn xác xuất ý nghĩa 0.05 nên phương trình hồi quy tuyến tính được chấp nhận Dựa vào các hệ số ta viết được đường hồi quy dự báo y = -4.06364 + 0.1116x1 + 0.075684x2 + 0.02011x3 Hệ số x1 không đáng tin cậy vì P-value = 0.093621 > 0.05 (mức ý nghĩa đã chọn) -> cần tiến hành lọc bớt biến x1 để đường hồi quy với các hệ số đều có ý nghĩa. 22

6. Hồi quy phi tuyến Các dạng hồi quy phi tuyến như hàm mũ, hàm logarit, hàm đa thức, hàm căn bậc hai … Có hai cách: Thông qua cách biến đổi đưa về dạng hồi quy tuyến tính bội. Vẽ đồ thị và tìm đường ngoại suy. 23

6.1 Cách 1 Thông qua biến đổi ta đưa về dạng hồi quy tuyến tính bội như hàm mũ, hàm logarit, hàm đa thức, hàm căn bậc hai … Ví dụ Nghiên cứu về dân số, x là năm, y là dân số. Tìm đường hồi quy phi tuyến dạng đa thức bậc hai: Y = ax2 + bx + c. Khi đó ta thêm cột X2 = X2 sau đó thực hiện tìm đường hồi quy bội tuyến tính với các biến độc lập X, X2 và hàm là Y. 24

Làm tương tự như mục 5 25

Phân tích kết quả Phân tích kết quả được phương trình: Y = 0.397435 X2 + 8.228951 X + 12.96242 26

6.2 Cách 2 Vẽ đồ thị XY (Scatter) biểu diễn tương quan giữa y và x, đồ thị dạng điểm, sau đó tìm đường ngoại suy và hiện ra phương trình hồi quy. Sinh viên xem lại về phần đồ thị Sau khi vẽ xong đồ thị dạng XY bạn vào Menu Chart>Add Trendline… 27

Ví dụ 28

Hộp thoại Add Trendline Tuyến tính Đa thức Ln(x) Hàm mũ ax Hàm ex Trung bình động 29

Hộp thoại Option Đặt tên cho đường ngoại suy Dự báo Tăng x Hiện phương trình trên đồ thị Giảm x Hiện giá trị hệ số tương quan trên đồ thị Cắt trục y tại 30

Kết quả 31